如何評價Intel Skylake新架構的「逆超線程」/「模塊化」功能?

如圖

Intel最終實現的效果如何?相較AMD的相似技術,Intel是否做得更好?


Intel IDF 2015都開完十來天了,官方資料也放出來了,壓根沒提超逆線程這事兒嘛,所以這又是國內無良媒體為了吸引眼球搞的大新聞。。樓上幾位答案也說了,外媒報道的時候基本都是猜測的態度,傳到國內這就言之鑿鑿了,小編我英文不好你憋騙我啊!

放官方鏈接鎮樓:

Sessions - IDF Event Registration

詳情在SPCS001 那個Session,摘錄其中幾頁PPT:

重要的改進在這兩頁里都說了,沒提逆超線程嘛。。反倒是超線程的性能有所提升。。

單核性能提升估計是主要來自架構方面的改進比如Branch Predictor,更快的prefetch,更深的out-of-order buffer,以及更快的內存訪問等這些「硬指標」。(其實這些改進又不只是針對單核性能,而是整體性能都會有提升)

另外,應該也不是樓上說的指令集立的功,如果指令集有改進的話編譯器不會這麼快就跟上而且連benchmark優化的這麼快,所以基本可以肯定是架構方面的改進。

所以你們吶,不要聽風就是雨,尤其是面對國內某些媒體的時候,一定要提高自己姿勢水平才行~


首先,我只能說,驅家這腦洞……不匿了!我對這個萬年黑微軟的網站只有仇恨。

首先讓我們找到原文,來源於一個德國網站:Skylake mit inversem Hyper-Threading?

再貼上驅家的鏈接:Intel Skylake新架構的秘密:逆超線程、單核猛增-Intel,CPU,處理器,Skylake-驅動之家(驅家的文章是Intel"s Skylake Processors Allegedly Rocking "Inverse Hyper Threading"的全篇翻譯+該網站自己的內容)

可以看出,德國網站的標題是一個不確切的標題,而驅家的標題則非常肯定。

然後我再假設,如果逆超線程成立,那麼,這就相當於在操作系統下讓多線程的CPU識別出較少的線程,然後CPU去完成多線程調度了。而這無論在家用環境還是伺服器環境都不實用。

那麼是什麼造成Skylake的ST(Single-Thread,單線程)性能如此之高呢?

很明顯,肯定有指令集的功勞。

先看SPEC CPU 2006_百度百科,可以看到470.lbm對應的是流體動力學測試項目,很明顯它的運算與多媒體有關。

再看4790K對應的折線,可以看到性能的提升也不是線性的,這更肯定了這項計算受到了指令集影響,因為即便是睿頻,也不會產生這麼大的影響。

去年年末時有人爆料Skylake會支持AVX-512,AVX是高級矢量擴展(Advanced Vector Extensions),而AVX-512是AVX指令集發展過程中的一個巨大進步。

雖然最終版Skylake沒有AVX-512,最高支持的AVX指令集仍為AVX 2.0,但誰能說這個AVX2.0與Haswell的AVX 2.0一樣呢?(即便都是AVX 2.0,也是有revision的。)

最後說下SoftMachines:它是一個由兩個Intel前僱員創辦的公司,它受到了三星投資公司,AMD公司和穆巴達拉發展公司(也就是投資GF的中東公司)投資,它搞了VISC,可它和Intel並沒有什麼關係。


感覺visc這個不靠譜啊,就算真有加強單線程技術也應該是intel在isca2009上發的anaphase那玩意吧。

Boosting single-thread performance in multi-core systems through fine-grain multi-threading_百度文庫。

另skylake消費級應該無avx512,只有xeon才有,cannonlake啥的才全面普及。不過沒有實物不知道xcr0返回值,所以不確定是否有avx512之類。

據傳skylake把環形匯流排變成網狀匯流排啥的?等18號IDF應該有更多信息吧。


果然我大農企一直走在技術前列

製程干不過你,我們有意識,我們會走位,我們八條腿【喂喂這都什麼鬼】


先貼德文報告原帖:Skylake mit inversem Hyper-Threading?

驅動之家言之鑿鑿地把猜測變成了事實,果然貴國主觀能動性指導一切:Intel Skylake新架構的秘密:逆超線程、單核猛增-Intel,CPU,處理器,Skylake-驅動之家

在SPEC CPU2006的單項470.lbm benchmark下,i7-6700k的單線程性能是i7-4790k的2.4倍(十分反常,因為從整體來講近幾代處理器的速度提升在向1.1x靠攏),那麼我們看一下這裡面提到的470.lbm:470.lbm: CPU2006 Benchmark Description 它的目的是計算流體的自由表面、聚合和移動,那麼我猜測這部分benchmark是和3D渲染有關係。

話說回來,從物理層面達到2.4x速度的可能性微乎其微,並且隨著線程數增加兩個處理器的差距在逐漸縮小,那麼最大的speedup應該就歸功於架構。VISC(我們暫時假設Skylake確實採用了VISC或者類VISC的架構設計)通過軟體層將多個物理核心模擬為單核心,使得單線程任務能夠同時被分配給多個核心,最終提高IPC(Instructions per clock)。那麼哪種運算在這種架構下得益最多呢?Media-related,多媒體處理。作這種處理的初衷只能是在和ARM架構的處理器直接競爭,如果這些假設都為真的話Intel確實在下一盤大棋,分分鐘後胖壓斷炕的節奏。

AVX-512在skylake上應該是沒有的。

所以問題不成立,Intel「疑」採用類「逆超線程」技術還差不多。

AMD只不過是在給Soft machines這個初創砸錢(同時還有前Intel微處理器頭頭Albert Yu,三星,以及Mubadala),但是推土機這一昏招確實是因為AMD對單線程運算潛力估計不足。


大家都在拚命做並行化優化你說intel給我來個逆超線程?誰說的出來我保證不打死你


按摩店負責設計,intel負責研發製造


SKL沒有所謂的逆超線程


那個VISC官網首頁掛了篇報道, 看了下. 還是有全美達的那種軟體ISA-IISA指令轉換 (而不是硬體完成). 硬體上我覺得還是屬於某種亂序. 只是傳統的亂序是先統一renaming, 再調度發射到功能單元; 而這個不同之處在於, 先統一將執行流劃分為基本沒有依賴性的 "threadlets" (之前在翻譯時應該也用了軟體調度, 披露的資料不多), 將這些 "threadlets" 調度到比較簡單的亂序執行 "核", 不同 "核" 之間的renaming, 執行, 訪存甚至D$是獨立的. 前端和最後的ROB和傳統CPU一樣是統一的, 所以我個人覺得還是只能算作一個核. 花了幾分鐘看了下報告, 輕拍...


推薦閱讀:

Ryzen處理器評測已於3月2日解禁,如何就現有的媒體評測評價R7系列處理器?
如何評價AMD發布的Ryzen性能戰勝i7 -6900K,三大幻覺之一的「AMD翻身」成真?
怎樣才能學習到較為先進的cpu架構設計呢?
農企要憑藉Ryzen翻身了嗎?
高通的 adenro核顯和AMD顯卡有什麼關係?

TAG:英特爾Intel | 中央處理器CPU | AMD | 處理器技術 |