如何評價Intel Skylake新架構的「逆超線程」/「模塊化」功能？

01-21

如圖

Intel最終實現的效果如何？相較AMD的相似技術，Intel是否做得更好？

Intel IDF 2015都開完十來天了，官方資料也放出來了，壓根沒提超逆線程這事兒嘛，所以這又是國內無良媒體為了吸引眼球搞的大新聞。。樓上幾位答案也說了，外媒報道的時候基本都是猜測的態度，傳到國內這就言之鑿鑿了，小編我英文不好你憋騙我啊！

放官方鏈接鎮樓：

Sessions - IDF Event Registration

詳情在SPCS001 那個Session，摘錄其中幾頁PPT：

重要的改進在這兩頁里都說了，沒提逆超線程嘛。。反倒是超線程的性能有所提升。。

單核性能提升估計是主要來自架構方面的改進比如Branch Predictor，更快的prefetch，更深的out-of-order buffer，以及更快的內存訪問等這些「硬指標」。（其實這些改進又不只是針對單核性能，而是整體性能都會有提升）

另外，應該也不是樓上說的指令集立的功，如果指令集有改進的話編譯器不會這麼快就跟上而且連benchmark優化的這麼快，所以基本可以肯定是架構方面的改進。

所以你們吶，不要聽風就是雨，尤其是面對國內某些媒體的時候，一定要提高自己姿勢水平才行～

首先，我只能說，驅家這腦洞……不匿了！我對這個萬年黑微軟的網站只有仇恨。

首先讓我們找到原文，來源於一個德國網站：Skylake mit inversem Hyper-Threading?

再貼上驅家的鏈接：Intel Skylake新架構的秘密：逆超線程、單核猛增-Intel,CPU,處理器,Skylake-驅動之家（驅家的文章是Intel"s Skylake Processors Allegedly Rocking "Inverse Hyper Threading"的全篇翻譯+該網站自己的內容）

可以看出，德國網站的標題是一個不確切的標題，而驅家的標題則非常肯定。

然後我再假設，如果逆超線程成立，那麼，這就相當於在操作系統下讓多線程的CPU識別出較少的線程，然後CPU去完成多線程調度了。而這無論在家用環境還是伺服器環境都不實用。

那麼是什麼造成Skylake的ST（Single-Thread，單線程）性能如此之高呢？

很明顯，肯定有指令集的功勞。

先看SPEC CPU 2006_百度百科，可以看到470.lbm對應的是流體動力學測試項目，很明顯它的運算與多媒體有關。

再看4790K對應的折線，可以看到性能的提升也不是線性的，這更肯定了這項計算受到了指令集影響，因為即便是睿頻，也不會產生這麼大的影響。

去年年末時有人爆料Skylake會支持AVX-512，AVX是高級矢量擴展（Advanced Vector Extensions），而AVX-512是AVX指令集發展過程中的一個巨大進步。

雖然最終版Skylake沒有AVX-512，最高支持的AVX指令集仍為AVX 2.0，但誰能說這個AVX2.0與Haswell的AVX 2.0一樣呢？（即便都是AVX 2.0，也是有revision的。）

最後說下SoftMachines：它是一個由兩個Intel前僱員創辦的公司，它受到了三星投資公司，AMD公司和穆巴達拉發展公司（也就是投資GF的中東公司）投資，它搞了VISC，可它和Intel並沒有什麼關係。

感覺visc這個不靠譜啊，就算真有加強單線程技術也應該是intel在isca2009上發的anaphase那玩意吧。

Boosting single-thread performance in multi-core systems through fine-grain multi-threading_百度文庫。

另skylake消費級應該無avx512，只有xeon才有，cannonlake啥的才全面普及。不過沒有實物不知道xcr0返回值，所以不確定是否有avx512之類。

據傳skylake把環形匯流排變成網狀匯流排啥的？等18號IDF應該有更多信息吧。

果然我大農企一直走在技術前列

製程干不過你，我們有意識，我們會走位，我們八條腿【喂喂這都什麼鬼】

先貼德文報告原帖：Skylake mit inversem Hyper-Threading?

驅動之家言之鑿鑿地把猜測變成了事實，果然貴國主觀能動性指導一切：Intel Skylake新架構的秘密：逆超線程、單核猛增-Intel,CPU,處理器,Skylake-驅動之家

在SPEC CPU2006的單項470.lbm benchmark下，i7-6700k的單線程性能是i7-4790k的2.4倍（十分反常，因為從整體來講近幾代處理器的速度提升在向1.1x靠攏），那麼我們看一下這裡面提到的470.lbm：470.lbm: CPU2006 Benchmark Description 它的目的是計算流體的自由表面、聚合和移動，那麼我猜測這部分benchmark是和3D渲染有關係。

話說回來，從物理層面達到2.4x速度的可能性微乎其微，並且隨著線程數增加兩個處理器的差距在逐漸縮小，那麼最大的speedup應該就歸功於架構。VISC（我們暫時假設Skylake確實採用了VISC或者類VISC的架構設計）通過軟體層將多個物理核心模擬為單核心，使得單線程任務能夠同時被分配給多個核心，最終提高IPC(Instructions per clock)。那麼哪種運算在這種架構下得益最多呢？Media-related，多媒體處理。作這種處理的初衷只能是在和ARM架構的處理器直接競爭，如果這些假設都為真的話Intel確實在下一盤大棋，分分鐘後胖壓斷炕的節奏。

AVX-512在skylake上應該是沒有的。

所以問題不成立，Intel「疑」採用類「逆超線程」技術還差不多。

AMD只不過是在給Soft machines這個初創砸錢（同時還有前Intel微處理器頭頭Albert Yu，三星，以及Mubadala），但是推土機這一昏招確實是因為AMD對單線程運算潛力估計不足。

大家都在拚命做並行化優化你說intel給我來個逆超線程？誰說的出來我保證不打死你

按摩店負責設計，intel負責研發製造

SKL沒有所謂的逆超線程

那個VISC官網首頁掛了篇報道, 看了下. 還是有全美達的那種軟體ISA-IISA指令轉換 (而不是硬體完成). 硬體上我覺得還是屬於某種亂序. 只是傳統的亂序是先統一renaming, 再調度發射到功能單元; 而這個不同之處在於, 先統一將執行流劃分為基本沒有依賴性的 "threadlets" (之前在翻譯時應該也用了軟體調度, 披露的資料不多), 將這些 "threadlets" 調度到比較簡單的亂序執行 "核", 不同 "核" 之間的renaming, 執行, 訪存甚至D$是獨立的. 前端和最後的ROB和傳統CPU一樣是統一的, 所以我個人覺得還是只能算作一個核. 花了幾分鐘看了下報告, 輕拍...