10年前的P4EE 3.73Ghz和現在的i7隻開一個核性能差距有多大?原因是?

在頻率相去不大(i7 6700 單核運行時是4Ghz),都是單核心的情況下,性能的巨大差距是怎麼產生的?


差距主要是這些:

  • 單指令所需周期的縮短,直接提升效能;

  • 分支重排的進步,可以減少流水線清空造成的損失;

  • SIMD的進步,可以成倍地增加數據運算的效能;

  • 內存控制器的進步、高速緩存尺寸的加大、緩存演算法的進步,減少低速主內存訪問的代價。


P4 EE 3.73應該是Prescott架構和SNB i7 2600比好了。

http://users.atw.hu/instlatx64/GenuineIntel0000F43_P4EE_Prescott_InstLatX86.txt

http://users.atw.hu/instlatx64/GenuineIntel00206A7_SandyBridge3_InstLatX86.txt

這是除法指令延遲比較上i7 下P4EE。可以看到指令延遲優化程度很大。

緩存和內存控制器也在改進,還加入了大量SIMD,比如SSE4 AVX AVX2 FMA3 F16C BMI等等 未來還有AVX512……P4還是三發射,進入Core2已經是4發射,加入宏融合和微融合,Skylake Core i7甚至靠宏融合做到最多發射6個指令,Core2時代FPU加減和乘除分離,硬體除法器完善。匯流排從FSB到DMI,更大的ROB,集中式保留,更多調度口,加入解碼微操作高速緩存L0等等。

量化數據P4EE 3.6 SuperPI 1M大概36秒 i7 6700是9秒左右。P4 570(3.8) Fritz是1300左右 i7 6700大概16000合單核4000……這些bench和上面指令latency三到四倍的提升差不多,如果上x264之類對simd優化很好的應用說不定差距還要大


差遠了,早在snb的時候奔騰出過一個1.6g單核的,然後被中關村饒有興緻地拿去做了個對比,結果同核心數同頻還是吊打,架構是一部分,更主要的是多出了許多支持的指令集,很多關鍵應用下速度能翻幾倍,比如avx和aes指令集,當然這些說下來還是微架構改進就是了。

另外一個不能忽略的其實是工藝和後端設計,在當時要達到那個頻率,以當時的工藝是不容易的事情,所以架構上也會做出一些妥協,因為當時的想法就是用很高的頻率去彌補ipc的問題。而現在的工藝已經能輕鬆做到這個頻率下工作了,所以對設計者來說會寬鬆很多,其實從晶體管數也可以發現這個問題,snb一個核心就幾億晶體管下去了,是原來netburst架構時候好幾倍了,更不要提現在的skylake,雖然其實相較於snb提升也一般就是了


首先差距是全方位的,有些地方差得非常離譜。

我舉個簡單的例子,SNB裡面有3個256bit的整數SIMD單元,P4我記得只有1個128bit的。 同頻也是6倍的理論性能差距。


一顆CPU小一萬元:英特爾P4EE就是這麼貴

2005年一顆U 1W,11年過去了,現在同價位的U不知比P4EE高到哪裡去了


具體的性能就得有人測試了,不過緩存,內存上天然的差距………

就好比從一群侏儒里拔個大個去和巨人症患者鋸掉小腿比個子……

還真沒法比


micro-architecture;

process。


@winnie Shao 關於原因,這位師姐是唯一答到點子上的,怎麼沒人贊呢?

譬如,高票提到單指令周期縮短,而為什麼縮短?只能是來自兩個方面:工藝和電路結構。

構架的進步自不必說,工藝是什麼意思?線寬減小的同時,集成度增加(晶元單位面積內電路更多)、電容減小(速度更快),而即使不考慮線寬的變化,器件性能本身就在進步。

有了工藝和電路設計的進步,才有最終產品的進步。


主要是工藝,晶體管數量的差距。


桑塔納1.6升排量發動機和F1賽車的1.6升排量發動機的差別


推薦閱讀:

除了智能手錶和智能手環,還有哪些有趣的可穿戴設備?
由於現在晶元廠商都直接給設計方案,感覺現在消費性電子行業的射頻工程師門檻越來越低了,待遇也不如從前?
在核心數、線程數、主頻、緩存大小相同的情況下,cpu的性能差距從何而來?
最近幾年 Intel 處理器的架構進步不大,是遇到了技術困難,還是 Intel 在有意控制節奏?
在『固態硬碟』(SSD) 之後,下一個可以大幅提升PC性能的硬體技術是什麼呢?

TAG:英特爾Intel | 中央處理器CPU | 硬體 |