昂貴的至強E5比同代i7貴在哪裡?

有個有趣的問題經常被提起:至強E5和E7 CPU比同代高端i7貴數倍乃至幾十倍,但單核主頻卻相對持平甚至落後,難道多餘的錢都用來增加內核了嗎?E5憑什麼這麼貴?更進一步的問題是如果有錢任性,像Apple的Mac Pro一樣搭一個E5單路workstation划得來嗎(Refurbished Mac Pro 3.7GHz Quad-Core Intel Xeon E5)?

i7和E5型號眾多,為了檢驗該命題的真偽,我們選取型號較老的Broadwell架構三款同代至強cpu和酷睿CPU來進行比較。它們是

  1. i7 5775R Intel? Core? i7-5775R Processor (6M Cache, up to 3.80 GHz) Product Specifications
  2. Xeon E5-2667 Intel? Xeon? Processor E5-2667 v4 (25M Cache, 3.20 GHz) Product Specifications
  3. Xeon E5-4669 Intel? Xeon? Processor E5-4669 v4 (55M Cache, 2.20 GHz) Product Specifications

先來個全家福:

這裡推薦Intel的官網:Intel? Product Specifications,在它上面可以很方便的選出各種CPU型號進行比較。我們先來看一下他們的基本情況和價格:

它們都是14nm工藝。但i7的價格只有E5-2667價格的1/6,只有E5-4669價格的1/20。我們再看一下他們的基本配置情況:

這頁有很多需要重點關注的內容:核心數從4,一路上升到22。主頻i7-5775和E5-2667很接近,在3.2GHz左右,但E5-4669就降低到了2.2GHz。這是為了在TDP相對E5-2667不變的情況下塞入更多的核心和cache而做的犧牲。Cache數目相差巨大,從i7的6MB上升到55MB,幾乎上升10倍。

同樣的,這一頁亮點也很多。內存i7只支持雙通道,最大32GB,且不支持ECC內存。而E5則支持高達1.54TB內存,支持4通道和ECC內存。

其他方面E5沒有內置GPU,i7不支持TXT等功能。感興趣的同學可以詳見我做好的比較表:Intel? Product Specification Comparison

性能比較

我用Cinebench簡單地對i7-5775和E5-2667做了Benchmark,單核性能比較:

多核性能:

CineBench是很有說服力的一套CPU和顯卡測試系統。這裡用的是最新的是R15版。相比R11.5版本的最多16個核心來說,R15版本最多能夠支持256個邏輯核心,此外新版本還加強了著色器、抗鋸齒、陰影、燈光以及反射模糊等的考察,對CPU性能的檢測更加準確,也比較符合我們日常的遊戲和工作行為。

GeekBeach的數據如下是,單核:

多核:

性能分析

從Cinebench結果來看E5-2667的單核性能因為頻率的略微差距而落後與i7,而多出了1倍的內核也帶來了不到1倍多核性能的提高,多出的Cache完全沒有發揮作用。而E5-4669的單核性能更是遠遠落在了後面。Geekbench的結果略有不同但也沒有根本區別。這些數據和6倍到20倍的價格形成鮮明反差,那麼買E5的人是不是人傻錢多呢?

E5的優點

i7系列對於一般用戶使用場景進行了優化。因為多數應用對應多線程沒有優化,太多線程往往沒有什麼意義,還不如睿頻高一些。

而至強系列,尤其是E5和E7系列,一般用於伺服器和高級工作站,內核數最多的HCC版的架構如下:

內核數次之的MCC和最少的LCC架構:

它們除了內核數不同外,都對伺服器場景做了特殊優化:

  1. 在TDP極限下,盡量加入更多核而不是提高單核性能。因為伺服器往往運行伺服器操作系統,任務也多為多任務而優化,甚至大部分都安裝虛擬機,IaaS可以讓每個核都各盡其用。對於Big data等系統,24個2.2G的核比4個3.3G的核更加重要。
  2. 對ECC內存和RDIMM的支持。伺服器對於關鍵性數據錯誤極其敏感,尤其是金融領域。ECC和RDIMM對運算速度沒有幫助,但對數據安全提高很大。
  3. 對超大內存的支持。32G的內存也許對於一般用戶足夠用了,但對於伺服器卻遠遠不夠。現在內存資料庫發展很快,至強1.5TB的內存變得十分必要。
  4. 極大的LLC(Last Level Cache)。進一步減少了對內存帶寬的壓力,提高了效能。
  5. 多達40個Lane的PCIe。伺服器往往需要外插GPU擴展浮點計算能力,尤其是機器學習大行其道的今天,每個CPU後面往往要插兩個N卡或者Xeon Phi的PCIe卡。16 lane * 2 = 32個lane是必備需求,再加上高速的網口也需要連接在CPU後面,40個lane有時都捉襟見肘。
  6. 更多內存通道。Xeon支持4通道,雙路支持8通道。極大的擴展了內存帶寬,對高吞吐的伺服器十分重要。
  7. 更多了RAS特性。現在很多關鍵性領域,如銀行等,要求可靠性達到n個9,RAS中的熱插拔內存和CPU使之成為可能。內存花樣繁多的可靠性擴展功能,更有Mirror特性,可以組成類似RAID的內存庸余陣列,極大地提高了內存的可靠性。
  8. 極大的擴展性。E5的兩條QPI/UPI匯流排,可以搭建雙路甚至四路伺服器(2跳);E7的三條QPI/UPI可以搭建只要1跳的4路伺服器和最大2跳的八路伺服器,極大的擴展了伺服器的最大內核數和內存容量:

那麼為什麼Mac Pro選擇E5呢?我們來看一下它的組成框架圖:

Apple正是看中了E5的四路ECC DIMM的支持,以及對40 Lane的PCIe的支持,可以讓它同時插入兩個16 lane的AMD GPU和8 lane的PEX,佔滿了所有PCIe的通道。同時Apple聰明的選擇了核心少而主頻高的E5 SKU,就像例子中的E5-2667,而沒有選擇E5-4669,既保證了單線程應用的需要,又讓工作站的整體性能十分彪悍。

結論

E5/E7貴有貴的理由,它對於伺服器和高級工作站來說十分合適。對於普通用戶來講,就顯得不那麼必要了,要知道,別看E5 CPU貴,支持它的主板和ECC內存也很貴,比較新的一般便宜的5萬RMB,不是一般消費者可以企及的。實在是看著至強眼饞,也可以選擇E3過過癮。

接下來計劃增加以下文章,敬請期待:

  1. 為什麼沒有16路乃至32路的伺服器?
  2. 為什麼Intel的CPU核心數絕大多數都是偶數?
  3. 從Ring Bus到mesh,為什麼需要更新片內匯流排?
  4. 為什麼Apple的筆記本和MAC上沒有Intel inside?

歡迎大家關注本專欄和用微信掃描下方二維碼加入微信公眾號"UEFIBlog",在那裡有最新的文章。同時歡迎大家給本專欄和公眾號投稿!

用微信掃描二維碼加入UEFIBlog公眾號

參考資料:

[1]: promotions.newegg.com/b

[2]: Intel? Product Specification Comparison

推薦閱讀:

讓你用編程代碼表白,要怎麼寫呢?
coursera的機器學習基石及技法停課後,還有什麼類似的網課?
為什麼很多好的創意最初都出現在國外?
UEFI架構
數據結構上的堆棧、操作系統上的堆棧,彙編語言的堆棧、還有C語言本身的堆棧,有什麼不同?

TAG:中央处理器CPU | 计算机科学 | 服务器 |