怎麼看 AMD 公司新發布的 zen 處理器?

Ryzen處理器是AMD「Summit Ridge」家族的一員,主攻的是高端桌面晶元市場,AMD 表示其IPC(每時鐘周期執行的指令數)性能相對於「推土機」架構上漲幅達到了40%以上。因此,這枚3.4GHz的展示晶元,相比英特爾Broadwell-E架構的Core i7-6900K八核處理器性能更快一些,而且TDP在100W之內。


簡單看了下視頻AMD公開展示會RY ZEN PK 6900K 核心內容版生肉無字幕,記下流水賬

Zen 從 2012 年 開始研發,現在正式名稱叫 Ryzen

技術參數:

  • 8核16線程

  • 20M L2 + L3
  • 95W TDP
  • 3.4 Ghz 起跳

推出5項新技術

  • Neural Net Prediction 用神經網路做分支預測(Prediction指啥不清楚,我猜的),貢獻了25%的性能提升
  • Smart Prefetch 更智能的緩存預取
  • PurePower,Pecision Boost 這兩項技術能夠動態(毫秒級)的獨立的控制片上各個部分(each part of chip)的功耗和頻率
  • Extend Frequency Range 利用片上的眾多感測器,動態的控制超頻的幅度。比如如果你用水冷或者液氮,CPU有能力根據識別到的環境信息,自動決定超頻幅度。

接下來Ryzen @3.4 Ghz without Boost 和 Intel i7 6900K (8C16T @3.2Ghz 3.7Ghz Boost $1100 140W TDP)對標測試

  • Blender 3D 和 Intel 打平,但是AMD的功耗明顯更低(95W vs 140W),還強調了下這是沒有做完性能優化的結果

  • 轉碼測試 54s vs 59s AMD 小勝

然後有一個演示,Dota2直播,Ryzen 和 i7-6900K 都能做到玩遊戲加直播不卡頓,但是i7-6700K 玩遊戲不卡,直播因為CPU滿載,會掉幀。

最後One more thing,演示了 Ryzen + Vega(織女星)架構在4k下遊戲的表現,星球大戰:前線,全程穩定60fps(顯示器刷新率60hz)(這個性能應該打平GTX 1080)

個人看法:Zen 的性能還是可以期待的,AMD 演示肯定挑選有利於自己的測試,看起來部分性能可以打平 6900K,就算整體趕不上 6900K,超過 6700K 問題是不大的。單核性能估計還是有差距但是應該已經很小了。

反正 i3 默秒全的時代應該是過去了

其餘的可以看下這篇報道 幹掉英特爾i7-6900K AMD最強Ryzen處理器首次登場


結合今年8月AMD發布的Zen架構細節來看,Ryzen至少具備下列特性:

·4發射指令解碼器,與Haswell、Skylake持平;

·雙路SMT,與Intel的HT技術同級;

·引入了微指令緩存(uopcache)設計,算是追上了Intel在SandyBridge時代的步伐;

·亂序執行引擎中重排序緩存(reorder cache)隊列深度為192項,與Haswell持平,但低於Skylake的224項;

·引入了類似Intel的指令融合技術,可以合併符合特定條件的相似指令;

·寄存器保留站依然是分離式的,不如Intel的統一式保留站;

·流水線方面,保留了推土機架構的分離式分支預測。指令旁路轉換緩存(TLB)則破天荒的採用了三級結構,相比之下Haswell是單級的,但具體效果不明。

·一級指令緩存為64k、4路集聯;一級數據緩存64k、8路集聯。容量上優於intel的haswell、skylake,但指令緩存的組關聯度不及後者(8路集聯);

……


之前看到有人說zen的標定主頻有3g直播吃6700k


沒看上直播,看了一下B站的錄播,簡單談談吧:

首先是蘇媽開始講新的處理器:新的zen架構被命名為「RYZEN」,這是一個諧音詞,意思大概是旭日東升,朝氣蓬勃

這也充分表示了AMD對zen的信心。

接下來是技術規格:桌面級別頂級的 8c16t Zen 處理器,8 核心 16 線程,主頻 3.4Ghz(據說可以 Turbo 到 3.6-3.7)20MB緩存(每個核心512KB L2,每四個核心共享一組8MB L3),TDP雖然發布會沒說,不過根據爆料就是 95W

哦對了,還會有專門的超頻版本,體質優選,TDP仍然95W

PPT 裡面的 AMD SenseMI Technology暫時還不知道是幹什麼的,不過我估計估計就是根據負載提頻

接下來就是喜聞樂見的測試環節

哦對了,有人在techpowerup上面放出了AMD演示上的 blender demo:https://www.techpowerup.com/forums/threads/post-your-amd-ryzen-blend-benchmarks.228686/

大家可以測試一下

未完待續


CHH的蛋疼人士們已經跑了blender了

AMD公布「RYZEN」 發布會上ZEN和6900K對比的軟體和渲染文件下載 - 第4頁 - CPU

AMD公布「RYZEN」 發布會上ZEN和6900K對比的軟體和渲染文件下載 - 第4頁 - CPU

oc 4.5的5820k成績39s,這個水平的5820k已經和6900k比較接近了

基本上可以確認i7 6900k的成績沒有作弊,性能可期。另外G家的主板的圖也全都出來了,估計技嘉要各種搶首發。


微機革命靠農企不是吹的~


要性能符合ppt,價格在6000以內,無疑是一顆很爽到的處理器,至於上面那些發夢皇者2000/3000的都洗洗睡了,不適合自稱高端玩家。至於四核的感覺能在2000以內的可能性就挺大了,如果一千五以下怕不是整個b呼都要開始瘋狂尬舞了。


該給信仰充值了 跟vega一起

今天的horizon倒是沒什麼意思

細節全無


這說明amd的顯卡方向上會受到影響 總資源是有限的 不太可能在兩個戰線上抗敵人


以下為轉載,原出處這裡,只為學習目的。

AMD Zen處理器:英特爾的架構依舊更勝一籌,但勢均力敵的對手終於降臨

在AMD發布新一代Zen處理器之前,說它打造的桌面處理器不算特別成功也並不為過。

2011年發布的推土機(Bulldozer)的設計最多也只能說 很有特點 。AMD在推土機身上下了三個賭註:通用計算會繼續向多線程發展;浮點計算會越發傾向GPU驅動;巨幅提升時鐘速度是可行的。

據此,AMD製造的處理器具有大量的同時多線程,較長的管線,較窄的管線和較少的浮點資源。這裡的原理在於時鐘速度和GPU會彌補管線較窄和浮點計算力較低的缺陷。那麼AMD就得祈禱所有的線程都能不停地工作才行。

每個推土機模塊能夠同時運行兩個線程,每個模塊內有兩個獨立的整數線程和一個共享的浮點線程。已發布的桌面處理器版本有搭載兩個、三個或四個模塊的,分別共有四個、六個或八個線程。與上一代K10相比,推土機每個整數管線都很窄:兩個算術邏輯單元(ALU)和兩個地址生成單元(AGU),而K10各有三個。浮點管線也是一樣,兩個128位的乘法累加單元(FMA)配對執行單個256位的AVX FMA指令集。AMD設計的處理器的基礎時鐘速度為4.4GHz.

推土機?都是扯淡吧

AMD的賭注最終仍是失敗。搭載四個模塊八個線程的高級桌面處理器有大量的整數線程富餘。但大多數用戶的工作量仍然沒法被平均分配到八個線程上去。單線程的運行依舊是重頭戲。另一方面,浮點單元的共享意味著充滿浮點算術的應用程序就沒有足夠的運行資源。雖然基於GPU的計算在一些特定工作中非常重要——比如科學超級計算——但主流應用程序還是更依賴CPU來做浮點運算。

若是時鐘速度能夠達標的話,這些問題也算可以勉強忍受。每時鐘周期指令完成數(IPC)低的處理器如果能以足夠高的時鐘速度運行那也還湊合,但是AMD連它的基礎目標4.4GHz都沒有做到。搭載四個模塊的最高配置處理器的基礎速度僅為3.6GHz. 在工作量減少的情況下也只能衝上4.2GHz。這與設計目標還差得十萬八千里。

結果,第一代推土機處理器在很多工作上都比它的前輩K10處理器運行得更緩慢,而且價格更高。這和同時期的英特爾處理器完全沒法比。

AMD的確做了產品迭代。推土機的第二代打樁機(Piledriver)最高配置版本把基礎時鐘速度提至4.7GHz,最高速5.0GHz. 再結合一些內部改良,打樁機比最高配的推土機要快上40%。然而這也帶來了更高的能耗成本:為了時鐘速度的達標,打樁機處理器的功率為220W,而推土機只要125W。

第三代處理器壓路機(Streamroller)在IPC上有了進步,比打樁機高出9%。第四代處理器挖掘機(Excavator)又在壓路機的IPC基礎上提高了15%。然而,不管是壓路機還是挖掘機,誰也沒有被用在高級桌面處理器上。桌面市場依然是英特爾的地盤。

AMD的確在一些加速處理單元(APU)上使用了壓路機和挖掘機,也就是說,CPU與GPU的集成。但就算是在這塊領域,推土機家族還是能力有限。面向移動端的APU在10-25W區間只有一個挖掘機模塊(兩個線程)。它的性能比同功率的英特爾晶元要差很多,而且英特爾成功在它的低功率處理器上擠進了四個線程(儘管只有雙核)。

至於在超低功率3-7W區間,AMD的推土機家族更是沒有任何對應的產品。他們曾經的確有過超低功率晶元,但那些用的都是山貓(Bobcat)處理器的衍生品。這是一種完全不一樣的處理器設計,是專門為了移動操作和低功率操作而開發的。山貓的衍生版本還被用在PlayStation 4, PlayStation 4 Pro, Xbox One 和 Xbox One S上。

相比之下,英特爾的處理器實現了全領域覆蓋(儘管發布日程很磨蹭);它的Broadwell產品線包含從雙核四線程3.5W超低功率的移動處理器,一直到22核44線程145W的伺服器晶元(或時鐘速度更高的12核24線程160W處理器)。

是時候新起爐灶了

2013年,AMD終於放棄了對推土機處理器的希望。他們必須開發出一種新的架構。AMD的目標是:新的處理器架構必須在高端桌面市場有足夠的競爭力,而且至少要比挖掘機的IPC高40%。

就像之前的英特爾一樣,AMD也希望打造全領域覆蓋的產品線,從無風扇的移動端到伺服器和高端桌面。所以改良後的IPC需要與同樣經過改良的功率效率結合。但AMD還不打算徹底拋棄推土機:公司依然堅信未來是屬於大量同時多線程的,而且AMD的一些設計決策也暗示了它仍把GPU當做浮點運算的核心。

經過四年的閉門造車,Zen處理器作為該理念指導下的成果終於浮出水面。關於推土機沒有達成的IPC目標,AMD說Zen已經遠遠超出了提高40%的預設指標。在單線程運行速度3.4GHz的Cinebench R15測試中,Zen跑分比挖掘機高出58%,比打樁機高出76%。就IPC提高而言,與挖掘機相比Zen進步了52%。而且這一切是在大幅降低的功率下做到的:在多線程Cinebench R15測試中,Zen的效能功耗比是打樁機的兩倍還多。

與推土機家族相比,Zen有了全方位地提升,如果說不完全算是公平競爭的話,至少英特爾現在有了一個有趣的對手。跟完全不在一個量級上的英特爾比性能是AMD以前想都不敢想的事情,這麼多年過去了,AMD憑藉Zen終於可以與之媲美。

引爆點

Zen的基本構件是核心複合體(CCX):四核為一個單元,同時跑八個線程。恰好印證了AMD在桌面處理器的設計上對多核多線程的信仰的是,第一代銳龍Ryzen 7系列處理器搭載兩個CCX,共八核十六線程。有三個版本即將發布:1800X,速度3.6-4.0GHz, 售價 $499/£490; 1700X,速度3.4-3.8GHz ,售價 $399/£390,以及1700, 速度3.0-3.7GHz,售價 $329/£320 .

Zen的核心複合體

第二季度中,銳龍Ryzen 5也將面世。R5 1600X是六核十二線程的晶元,以3.6-4.0GHz運行(兩個CCX各關閉一核),1500X是四核八線程的晶元,以3.5-3.7GHz運行(只有單個CCX)。

Zen也會擴大規模。今年某些時候,AMD將會發布伺服器處理器,代號「那不勒斯(Naples)」,搭載八個CCX,32核,64線程。

不同的設計決策已經讓AMD和英特爾分道揚鑣了。英特爾的處理器性能分布被岔開得很奇怪,它最新的處理器是Kaby Lake,但Kaby Lake只有雙核和四核,有些有同時多線程(SMT)而有些沒有。四核以上你又不得不回到前一代處理器架構了:Broadwell。

2014年9月首次面世的Broadwell是英特爾14納米工藝的晶元,上一代Haswell架構的微縮版。目前,任何大於四核八線程的主流桌面或移動處理器都是基於Broadwell。這不僅包括面向發燒友的Broadwell-E處理器,搭載了六核、八核或十核以及12、16或20線程;還包括Broadwell-EP伺服器處理器,直到兩周前剛發布的Xeon E7-8894V4。這是8個插口24核48線程的晶元,定價在9000美元且不會有過多浮動。

第一代銳龍處理器剛好橫跨英特爾產品線的斷裂點。R7 1700多多少少會和Kaby Lake i7-7700K正面競爭。後者利用了英特爾14納米工藝以及最佳單線程性能的最新架構,運行速度為4.2-4.5GHz. 但1800和1800X將迎擊Broadwell架構,分別是六核12線程3.6-3.8GHz的i7-6850K處理器(約$620/£580 ),以及八核16線程3.2-3.7GHz的i7-6900K處理器(約$1,049/£1,000)。到了更高核數,英特爾就會迫使你放棄最新的核和最高的電源效力,從而不得不換回更老的、更新頻率比較低的晶元集(目前的X99早在2014年底就發布了)。

更大更強悍的內核

這些新的核都比推土機搭載了更多的運行資源。在整數管線上,Zen有4個算術邏輯單元(ALU)和兩個地址產生單元(AGU)。浮點管線上,共享浮點單元的概念被廢棄了:現在每個核都有一對獨立的128位乘法疊加運算單元(FMA)。浮點單元內有分開的加法和乘法管線,用於在不進行乘法累積運算時應對更多樣的混合指令。但256位AVX指令集還是得分開在兩個FMA單元上執行,並動用所有的浮點單元。

這是推土機之後的巨大飛躍,從本質上講,每個核可動用的整數和浮點運算資源都翻了個倍。然而與Broadwell和Skylake相比就不好說了。AMD的四個ALU雖然相似但不完全一樣,所以有些指令必須在特定單元內處理(只有一個會算乘法,另一個會算除法),就算有其他的閑置單元也不能跨界運行。英特爾的就更加多樣化,所以對於一些混合指令來說,英特爾的四個ALU實際上可能比AMD的要少。

更加複雜的是,AMD說總共六個指令可以在每周期中被發送到核的十個管線中(4個ALU,2個AGU,4個FP)。而Broadwell和Skylake都可以每周期發送八個指令。其中4個發送到AGU——Skylake有兩個通用AGU和兩個專用的。另外四個運算一些算數,要麼整數要麼浮點。

英特爾把所有功能單元分組分到四個發送埠下,編號0,1,5,6. 所有四個埠都包含一個普通的整數ALU,但埠0還含有一個AVX FMA單元、一個除法單元和一個分支單元。埠1有另一個AVX FMA單元但沒有除法單元。埠5和6既沒有FMA也沒有除法單元。這意味著在一個周期內,處理器可以同時安排兩個AVX FMA操作或是一個除法和一個AVX FMA操作,但沒法同時做一個除法和兩個FMA。

大體上,這說明在一個周期內,Zen可以發送四個整數運算和兩個浮點運算。Skylake可以發送四個整數運算,但這需要動用所有四個埠,導致沒法進行任何浮點運算。另一方面,Skylake和Broadwell都能在一個周期內同時發送四個整數運算和四個地址操作。Zen只能容納兩個地址操作。

推土機的弱點依舊如影隨形

撇開區別不談,我們就沒法直接衡量這些設計的好壞。儘管如此,還是有些設計在個別方面的優勢極其顯著。英特爾的兩種晶元都具備兩個能同時啟用的全256位AVX FMA單元。對於可以利用這一優勢的代碼來說,Skylake和Broadwell的性能都應該可以做到Zen的兩倍。多年以來,AMD一直在儘力讓GPU成為運行這種高強度浮點並行運算的最優選。所以某種意義上說這種差距也可以理解——但重度依賴AVX指令集的程序就會毫不猶豫地選擇英特爾晶元了。

比如這在Geekbench的浮點測試SGEMM中就非常明顯。這是一個矩陣乘法測試,為了最佳性能會調用AVX和FMA指令集。在單線程上,6900K管理著大約每秒900億單精度浮點指令(90 gigaflops)。相比之下,1800X的處理速度只有53 gigaflops。雖然1800X相對更高的時鐘速度有點用,但英特爾晶元在每個周期內能完成其兩倍的工作量。高出來的幾百兆赫不足以抵消架構區別帶來的劣勢。

當然,這種工作量從某種角度證明了AMD的觀點:由GPU加速的相同矩陣乘法運算可以達到800以上gigaflop。如果你的計算需求包含大量的矩陣乘法,你是決不會想用慢吞吞的CPU來完成這項工作的。

AMD長期以來的難題,也是通用GPU計算的難題,就是當只有部分運算工作適合用GPU完成時該怎麼辦。把數據在CPU和GPU上搬來搬去會消耗額外的資源,而且這要求開發者在開發工具和編程語言間進行切換。雖然解決方法是有的,比如AMD的異構系統架構和OpenCL,但目前還沒有被行業廣泛採納。

有一個Geekbench子測驗從另一個角度顯示了突出的優勢。Geekbench有關於目前主流處理器用到的所有密碼指令集的測試。在一個單線程性能測試中,銳龍碾壓Broadwell-E,解碼速度為4.5GB/s比2.7GB/s。銳龍有兩個AES單元,都位於處理器的浮點部分。Broadwell只有一個,讓AMD大大領先了。

但從單線程轉到十六線程時情況就突然逆轉:英特爾系統能跑到24.4GB/s而AMD只有10.2GB/s。這說明該測試在高線程數時會帶寬受限,使得6900K的四存儲渠道領先於1800X的雙存儲渠道。儘管銳龍具備更多的計算資源來進行這種運算,但當處理器干坐著等待數據傳輸時再多計算資源也無濟於事。

至於單線程性能上,他們都輸給了Kaby Lake i7-7700K。鑒於它更高的IPC和更快的時鐘速度,Broadwell-E和Zen都是遠遠追不上的。

更高速的前端

支撐那些指令單元的是指令解碼器和故障處理器。AMD在這些方面同樣較推土機做出了長足的改進。就像x86處理器常做的那樣,Zen先把x86指令拆解至微指令(μop)然後再安排與執行。在推土機里,重複指令(比如循環)必須被重複地讀取和解碼。Zen添加了一個能存儲2000 μop的微指令緩存,如此,循環中的重複指令就可以跳過解碼部分。英特爾在2011年初發布的Sandy Bridge架構中首次提出了同等的數據結構。

這個架構還結合了高效的分支預測器。在處理器確切知道某個分支完成後應該執行哪個指令集之前,分支預測器會進行預先猜測。如果分支預測器預測正確,處理器的管線就可以滿負荷工作;如果錯誤,那麼就得清空管線,浪費一小部分工作量。

然而Zen的分支預測器更加機智——它大部分時候都能猜對——而且成本更低——猜錯時浪費的工作量被降低了三個時鐘周期。AMD現在把分支預測器稱作神經網路,因為它的運作基於感知機。感知機的原理就是將一組不同權重的輸入值相加,如果和大於零,感知機輸出值為1,否則輸出值為0.

感知機在分支預測器上起到的作用很有意思,因為它會追蹤大量的輸入狀態然後判斷某一分支是否已被佔用,所以就算是長循環也很適用。推土機可能也用到了感知機,但一直到Zen的出現AMD才恍然大悟這其實是個神經網路——所以他們開始設想人工智慧和施瓦辛格的願景——讓這事兒聽起來無比先進。

支撐這一切的是一個更大更強的緩存系統。一級緩存是回寫式緩存(而不是推土機的透寫式),所以速度更快,存儲的傳輸負載更小。一級和二級緩存都可以帶來兩倍於推土機的帶寬,而三級緩存可以帶來五倍,但也更加複雜。CCX內的每個核都有2MB的三級緩存 ,所以每CCX共有8MB,整個處理器共16MB。緩存是共享的,但讀取速度不盡相同。離緩存最近的核自然讀取速度最快,另外三個會稍慢一些。

AMD把CCX之間互相溝通用到的技術叫做Infinity Fabric。AMD對此做出的描述不甚清晰,但基本原理就是它是CCX之間一個原本可用在CCX內的高速緩存一致性的介面和匯流排——電源管理微控制器、安全微控制器、擴展插口標準控制器和存儲控制器都與它相接。它甚至可以被用在母板插口之間。

至少在多插口的情況中,AMD把Infinity Fabric稱為「改良版的相關性超傳輸(Coherent HyperTransport),」但有時候AMD又說這不是基於超傳輸。

比上面這些都更加重要的是,Zen支持同時多線程(SMT)。幾乎核內所有資源都可被「競爭性共享」,也就是說在沒有第二個線程的時候,第一個線程通常可以佔用全部的運行資源。指令發送遵循循環制,所有周期輪流在輪流的線程上運行。

SMT帶來的收益因情況而異。Cinebench顯示啟用SMT帶來了良好的提升,跑分高出40%多。然而這大大取決於工作量,多線程Geekbench啟用SMT後只提高了不到10%。雖然一般來說SMT是絕對贏家——拉高了多線程程序的速度又不損失單線程的性能——但我們也注意到,遊戲殺手47(Hitman)因為啟用SMT流失了10%的幀速率。

除了運行資源分配大不相同外,總體規律就是Zen上運行的所有工作都還是要比基於單個周期的英特爾設計慢一些。(我們估計落後於Broadwell 5%,落後於Skylake 15%。)但Zen的更高時鐘速度加上可靠的同時多線程設計意味著它可以比肩Broadwell-E。比如在Cinebench R15中,1800X和6900X在單線程測試中持平,在多線程測試中比英特爾晶元高出6%。在單線程Geekbench 4中,AMD處理器依然與英特爾持平,雖然多線程上落後英特爾20%。這是在不同測試中由不同混合指令集和不同帶寬依賴度帶來的反饋。

據此,AMD達成了它的IPC指標,水平與英特爾耗時兩年半的晶元設計已經相當靠近。多虧了時鐘速度與核數,這意味著Zen在各種不同運行量量級上都能夠與英特爾勢均力敵。

高效的引擎

相比於挖掘機,Zen的能耗也有大幅降低。

如果說把IPC拉高了52%已經非常驚艷的話,那麼降低能耗這方面更是有過之而無不及:在多線程Cinebench上,AMD聲稱效能功耗比提高了269%。同功耗下,Zen的跑分是挖掘機的3.7倍。

能源效率的提高來自於很多方面。一項重大的突破出自AMD自己之手:效能功耗比自切換到GlobalFoundries的14納米鰭式場效應晶體管工藝(FinFET)後上升了70%(就算GlobalFoundries跟不上的話,AMD也已經證實了三星14納米工藝的可用性);甚至面向移動端的挖掘機處理器目前也是基於古董級的28納米工藝。此外其他方面的提高要歸功於AMD的工程師。

129%的提高來自更優的新架構設計。不僅運行速度更快,而且更加節能。微指令緩存不僅減輕了讀取和解碼指令的壓力,而且降低了能耗。從微指令緩存直接讀取比從一級指令緩存讀取再運行解碼器所消耗的資源要少得多。類似地,改良版的分支預測器意味著處理器在預測錯誤後在錯誤分支上浪費的時間更少,浪費的能源也就更少。

整數核還帶有提高性能與效率的特性。最常見的x86指令就是移動指令,把數據從存儲器搬到寄存器上,從這個寄存器搬到那個寄存器上,從寄存器搬到存儲器上。那些寄存器之間的數據移動已經被整數核取消了,取而代之的是寄存器重命名,這個技巧曾被首次用在推土機上。

x86還包括操縱堆棧的指令;這些指令會一邊從存儲器讀寫數據一邊在特定寄存器上加減數據(堆棧指針)。推土機採用了一些堆棧的特殊處理,用以降低堆棧相關指令之間的依賴度(從而擴大並行運算的規模),而Zen配有一個更加複雜的堆棧引擎,它可以取消某些堆棧操作指令。這同時改良了性能(同樣是通過更大的並行運算規模)且降低了能耗。

核心設計的大大優化也為降低能耗做出了貢獻。集成電路由多種不同的標準單元構成,比如NAND和NOT邏輯門,觸發器,甚至是更複雜的元素,比如半加器和全加器。這其中的每個組成部分(叫做標準單元)都可以接受多種不同的設計,從而在性能、尺寸和耗能上權衡利弊。

大多數的Zen所用的都是圖中右邊所示的速度慢但更高效的觸發器

AMD建立了一個很大的標準單元庫,不同的標準單元特性各異。比如他們有五種不同的觸發器設計。最快的速度是最慢的兩倍,但最快的版本的資源佔用率要高出80%,耗能也是後者的兩倍。憑藉這麼大一個庫,優化後的Zen在必要之處裝配了較快較大較高性能的部件,在可妥協之處用上了稍小稍慢但更高效的部件。在Zen的架構中,只有不到10%的觸發器用了高性能設計,而60%的時候都在用效率更高的那種。

最終的成果就是在關鍵路徑部分的性能和其他部分的效率之間達到了完美的平衡。

電源管理

Zen的電源管理方式很複雜也很強大。像現今其他的處理器一樣,它採用了大量門控時鐘,會把晶元上沒有用到的部分暫時關閉。但在這之上,它還有一個集成電源管理控制器,用於監測每個核的電壓並根據溫度和負載進行調整。AMD把這個系統叫做SenseMI(MI為機器智能machine intelligence)。

就像英特爾在Skylake上的手法一樣,Zen把電源管理任務從軟體和操作系統上剝離,將其融合到硅晶元中。操作系統對處理器電源管理事件做出反應需要幾十或幾百微秒;而晶元上的硬體只需要幾微秒。這能夠形成對電壓和時鐘速度更緊密的控制。又跟Skylake類似的是,操作系統負責設置晶元的粗粒度功率——它可以壓低幾百甚至幾千兆赫——但滿負荷運轉時(電源狀態P0),控制權又會交回到處理器手上。

每個CCX上布滿了各種感測器:20個熱敏二極體,48個電源監控器,9個電壓下降檢測器,還有1300多個關鍵路徑監控器。這些感測器都與Infinity Fabric控制面板相連,向電源管理單元傳輸數據,每秒彙報讀數1000次,精度分別達到1mA, 1mV, 1mW, 1°C。

另一方面,這個系統使得Zen只需要能維持正常運作的最小值電壓。每個核都配有自己的調壓器,所以它們都會保持在時鐘速度達標時的最低電壓。不是所有核都生來平等,有些天生就比別人跑得快。那些速度快的核就會被分配到較少的功率,留出能量凈空給其他速度慢的核提速。以相同速度運行時,速度快的核能夠比速度慢的核功耗低5%。

我們可以拿這種單核調整技術與AMD之前的自適應電壓與頻率調節(AVFS)作比較,後者整個晶元上的電壓都是統一設置的。在以前,電壓必須高到足以支持所有的核。類似地,英特爾的核都共享同一個電源層並在同一電壓下工作。因核而異的電壓調節會更節能。

Zen的穩壓用的是基於晶元的低壓差線性穩壓器(LDO)。英特爾的Haswell和Broadwell用的也是基於晶元的穩壓器,但那是更複雜而低效的一種(全集成式電壓調節模塊,FIVR)。理論上來說,英特爾的系統比AMD可以應對更廣的核電壓範圍,但在實際操作中,AMD說這種功能其實用處不大。所有的核都差不多在同一電壓下工作,所以LDO是更好的選擇。Skylake應該會放棄FIVR,把穩壓器移回母板;這使他們沒法打造那種AMD吹捧的Zen的高速微調:比如要是電壓跌至過低,Zen就會放慢該核的時鐘速度直到它恢復為止。

伴隨25MHz增量,Zen時鐘速度可以在其標準時鐘和提升的最大值之間平滑變化

將電壓拚命壓低到維持預設頻率的最小電壓值的另一對應版本是,推高頻率直至剛好達到預設功耗。壓低功耗的控制系統也可以同樣被用來推高每個核的時鐘速度,從而最大化利用處理器的功率開支。這種渦輪增壓(英特爾的睿頻)也並不是什麼新鮮玩意了,但AMD系統的精細頻率提速(Precision Boost)倒是有些令人眼前一亮的特點。首先這種提速是細粒度的,能夠精確控制時鐘速度到每25MHz的頻率。

其次,如果感測器發現還有富餘的能量凈空,時鐘速度就可以被推到標準提速極限以上,AMD把這叫做自動超頻技術(Extended Frequency Range,XFR)。如果散熱片和冷卻器遠超最小規格使得晶元工作得很悠閑,XFR就會繼續上推時鐘速度,1800X和1700X的增加上限是100兆赫,1700的上限是50兆赫,基本上算是「免費」加了一個小小的超頻。

另外70%的性能功耗比的提升便是來源於這些在供能分布、時間和電壓上的完善和優化。

然而到了「真的」超頻的時候,R7處理器就好壞參半了。一方面,這些處理器都解鎖了cpu倍頻,至少在與合適的晶元集搭配使用時是這樣,那麼你就可以用它做任何嘗試。AMD估計只要抬高到1.45V,大多數1800X用全八核都能夠跑到4.2GHz。但是AMD也說了1.45V可能會縮短晶元壽命。

啟用超頻模式也會損失一些節能特性。比方說,你不可能在能量限制下讓XFR額外提速200MHz,你也不能讓一個1800X以3.8GHz的基礎速度運行外加一個4.2GHz的睿頻提速(兩者同時提升200兆赫)。一旦超頻被啟用,處理器就只能以固定速度運行了(電源狀態P0情況下)。

這和英特爾不一樣,睿頻加速技術可以讓你具體設置1、2、3或4核提速,Kaby Lake甚至能讓你在AVX密集的工作中用個小體量的加速器。這在超頻模式下運作得十分簡潔乾脆,像正常運行下的Zen一樣巧妙。

無晶元集的晶元集平台

銳龍R7絕不僅僅是個處理器,它是基於晶元的系統。但它到底有沒有被這麼用就取決於它匹配了哪種母板和晶元集。

處理器本身有20個PCIe 3.0通道,4個第一代USB 3.1(5GB/s)控制器,外加4個PCIe和輸入輸出的混合通道;這些可以被分到單個x4 NVMe設備中,或分開到2個SATA 外加一個x2 NVMe中,或是2個SATA外加x2 PCIe。此外還有2個DDR4存儲渠道。

在這20個PCIe 3.0通道中,四個一般用於與晶元集溝通。AMD有三個常用晶元集;高端的X370, 中端的B350,以及低端的A320. 它們都帶有第二代USB 3.1(10Gb/s)控制器(X370和B350含兩個,A320含一個),一些額外的SATA控制器(X370含4個,B350含2個,A320含2個),2個SATA Express埠(也可以被用作4個SATA 3.0埠),以及一些PCIe 2.0通道(三個版本分別含8個,6個,4個)。X370和B350都可啟用超頻,X370還允許處理器上剩餘的16個PCIe 3.0通道分成兩組8通道用於雙GPU支持。

但對於小型系統而言,額外的輸入輸出通道和加大版的晶元集並不符合需求。於是就有了另外兩種晶元集,X300和A/B300,它們作為晶元集的意義大大下降:唯一的輸入輸出功能是處理器本身自帶的,沒有第二代USB 3.1,沒有SATA Express,沒加任何PCIe 2.0通道。這種晶元集只提供了為數不多的幾個功能,主要是圍繞安全和可信任平台模塊(Trusted Platform Module)的配置。正因如此它們長得非常迷你,AMD說它們能被安裝在指甲那麼大的晶元上。

由於這些晶元集只能做這麼點事情,它們不需要處理器上的四個PCIe通道,而是配有專供的SPI鏈接。這意味著處理器上的20個PCIe通道都可用,連X300也可以做到超頻和雙GPU支持。

撇開晶元集不管,AMD打算在2020年前始終採用同一個插口Socket 1331和同一個平台AM4,除非有什麼新科技的誕生(比如PCIe 4.0或DDR5)迫使它更換組件接腳分布。銳龍AM4母板能夠適配現在的AM4 APU,也能適配今年即將面世的Raven Ridge 基於Zen處理器的APU。這就是為什麼就算是現在的銳龍處理器沒法用,幾乎所有Zen母板還是搭載了集成顯示輸出。

AMD的賭注開始回本

很顯然Zen架構比推土機不知道高到哪裡去了。推土機和AMD現有的產品根本沒法比,而且它早已被一騎絕塵的英特爾甩出十萬八千里。但Zen不一樣。AMD的新架構不僅在性能上可以媲美英特爾的Broadwell,而且十分高效。

但到底要不要買Zen是個複雜的問題,這個複雜跟推土機為什麼會那麼弱的很多原因是一樣的。對於多線程密集的工作,Zen比Broadwell的性價比高很多,且性能不相上下。有時候Broadwell-E會更快一點而有時候Zen會更快一點,但在那些尤其依賴AVX或存儲帶寬的工作上,Zen具有壓倒性優勢。這使得AMD 499美元的晶元成為英特爾 1049美元的晶元的完美替代品。

我猜開發者會非常渴望能儘快用上Zen。軟體編譯(尤其是C++的程序)很容易多線程化,而且幾乎無一例外地依靠CPU,所以核數和線程數的翻倍造就了巨大的性能優勢。AMD用同一套邏輯去吸引的另外一群受眾是做電視遊戲視頻流的人:多核的晶元才有能力一邊玩遊戲一邊進行高質量的視頻壓縮,而這正是英特爾四核晶元的弱點。

但在其他工作中,英特爾更優的單線程性能更被看重。包括Grand Theft Auto V, Battlefield 4, 以及 Ashes of the Singularity在內的遊戲中,Kaby Lake i7-7700K能領先於1800X,就算它只有後者一半的核數和線程數。

就跟當初賣推土機的時候一樣,AMD希望開發者們打造的軟體能在多核晶元上擴展升級,多給Zen機會去表現出它優於英特爾的長處。但Steam Hardware問卷調查清楚地說明了為什麼至少在短期內開發者還不會這麼做,畢竟雙核和四核處理器佔據了絕大多數遊戲系統。

但很大一個區別在於,Zen就算不在最佳狀態下依舊錶現優異。i7-7700K能在個別工作中帶來稍高的幀率和稍強的性能,但推土機對於單線程任務來說簡直就太尷尬了,可Zen還是做得挺好——好到你也許會願意犧牲一部分程序的最頂級效果來換取其他程序中的巨大性能提升。

AMD已經很久很久沒這麼風光了。多年以來認準英特爾的PC發燒友們從不用糾結該買誰家的處理器,但AMD終於帶來了絕對值得一看的產品。也許它還不是所有人理想中的晶元,但至少這次,它終於能為一部分人理想中的晶元了。


嚴格來說,AMD的四代推土機家族並非失敗設計,但是過於特立獨行的架構對於軟體優化的依賴性過高,以至於對於大部分用戶的日常使用來說,它的表現距離預期差距甚大。所以,我們很高興地看到AMD「迷途知返」,在全新的ZEN架構中「從善如流」地回到了傳統的多核心超線程設計,追求提升單核心效率,同時功耗得以大幅(相比推土機架構)下降……這些迎合「一般消費者常規需求」的技術特點,再加上AMD一貫的高性價比定價策略,Ryzen還是很值得我們為之期待一下的。

面對AMD新架構的進攻,Intel一方面在17年度提高了Kabylake的升級幅度,一方面也在默默謀劃自家的新變革。有消息稱,Intel準備在下一代(第8代)酷睿處理器時為移動低壓引入四核(四核U系列),而高端的標壓處理器則可能迎來6核或者8核的普及——幸運的話,今年年底我們或許就會看到相關的消息或者產品了。同時,Intel也在秘密開發自家的全新架構,新架構將拋棄已經用了許多代的Core基礎設計,帶來有如當年初代酷睿發布時的巨大性能提升。應該說,PC領域的「核戰」戰火即將久違地重燃,對於消費者和市場來說都是一件大好事。


無論是6900k還是,這次的旗艦ryzen過3k的售價跟普通人沒什麼關係了,大家都是看神仙打架,至於那些用著一塊i3卻關心intel一桶漿糊的人,你們操心太多啦。

作為中立用戶,很清楚AMD干不過Intel的,不過看這AM4很可能能續命到DDR5上市的,CPU不夠升CPU,主板老了換主板,按需升級真是美妙。不是逼不得已我才不會買一年就過時的CPU呢。

肯定有人會說intel照顧小弟們一起吃肉,維持行業良性發展。對於此等說法:其一,作為用戶只需要為喜歡的產品買單,沒有義務維護行業發展;其二,大家仔細看看,這幾年主板爬的比CPU快,誰知道他是為了多賣CPU,還是幫助廠商多賣主板。


能到6900k的水準的話 對於硬體發燒友是個很好的選擇 可以把多餘的錢投入到平台上 600刀以下買買買 同時非常期待織女星的性能表現


價格如果真有預期那樣還是很不錯的……


AMD全稱angry man"s designs,喜歡"紅色。

其實這次演示會可以看出,農企只要明白在CPU領域跟Intel走,別再去搞個什麼夯穴機之類的就能繼續在這個領域分碗羹,雖然我喜歡那個勇於挑戰創新的農企,畢竟蘇女士本質是個商人,zen就是殊死一搏的,跟著市場走才有肉吃。8核16線程跟6900K在遊戲中不分伯仲,而且跑handbrake比張寶華還快,這可比壓路機強太多了,如果ryzen的默頻出售就是3.4,20緩,真就可以了,如果能boost到4.0豈不美哉(估計不可能),剩下就看能肏到多少。而且從Vega演示中可以看出,4K60fps,應該是1080級別的,估計上Hbm2了,感覺比昨天阿三拿出的那張卡強。起碼以上是有演示的,至於有沒有什麼貓膩,暫且信農企,畢竟直播。

至於前面的PPT,你嘲笑也好,當個梗也好,起碼這次我信蘇女士60%,如果價格良心,明年的市場一定很有意思。還有我想說現在直播連6700K都搞不定了←_←:還有Jim Keller才是續命師。

還有你永遠叫不醒某些人


先幫某些人總結一下,ppt真漂亮,農企要360度翻身了,難怪intel擠牙膏。


翻身我倒不覺得 有高性價比產品還是可能的。

這幾年AMD雖然有性價比,但是32納米製程,發熱和功耗跟Intel差距太大。前期便宜的錢最終會交給電費。。也不好組itx。

主板方面,現在AMD主板也不支持ddr4,有點跟不上時代了。。

現在也不求什麼平i7。一千塊錢左右有個高性能的u和帶集顯的u,然後往下高性價比產品就行了。。畢竟Intel一家強勢太長時間了,i3都能賣1000多的年代。。是要AMD來競爭一下了。。


AMD日常任務:360度翻身?

—————————————————————————

說說,要是ZEN的單核能提升40%,那麼應該能接近英特爾第四代酷睿了,不過還是有差距。

不過,論隔代的性能在使用上的感受

我大i5 2500k還能再戰10年


覺得ppt打個七折吧,後續或許或有驚喜。u和卡這兩大件只有在玩家手裡不斷考驗後完善才有最終的競爭力。


如果傳統X86 CPU在架構製程上出現瓶頸 領先者大意分心 而追趕者不出錯的話 還是有機會的 對消費者來說只會是好事 且看明年吧 大家還是希望這個寡頭市場出現一個攪局者

況且接下來在7nm上 Intel相比其它晶圓廠不再有明顯製程優勢 Intel在其它新領域上的大力開拓並沒有取得很顯著的成績帶來更多利潤 A家還是有機會的


推薦閱讀:

CPU為什麼沒有3核、5核、7核……?
晶元上的晶體管如果壞一個對性能有影響嗎?功能呢?
x86和arm 性能究竟差多少?
硬碟會導致cpu性能無法發揮嗎?
如何看待國產龍芯處理器?

TAG:中央處理器CPU | 計算機 | AMD | 處理器 | 銳龍AMDRyzen |