10年前的P4EE 3.73Ghz和現在的i7隻開一個核性能差距有多大？原因是？

01-05

在頻率相去不大（i7 6700 單核運行時是4Ghz），都是單核心的情況下，性能的巨大差距是怎麼產生的？

差距主要是這些：

單指令所需周期的縮短，直接提升效能；
分支重排的進步，可以減少流水線清空造成的損失；
SIMD的進步，可以成倍地增加數據運算的效能；
內存控制器的進步、高速緩存尺寸的加大、緩存演算法的進步，減少低速主內存訪問的代價。

P4 EE 3.73應該是Prescott架構和SNB i7 2600比好了。

http://users.atw.hu/instlatx64/GenuineIntel0000F43_P4EE_Prescott_InstLatX86.txt

http://users.atw.hu/instlatx64/GenuineIntel00206A7_SandyBridge3_InstLatX86.txt

這是除法指令延遲比較上i7 下P4EE。可以看到指令延遲優化程度很大。

緩存和內存控制器也在改進，還加入了大量SIMD，比如SSE4 AVX AVX2 FMA3 F16C BMI等等未來還有AVX512……P4還是三發射，進入Core2已經是4發射，加入宏融合和微融合，Skylake Core i7甚至靠宏融合做到最多發射6個指令，Core2時代FPU加減和乘除分離，硬體除法器完善。匯流排從FSB到DMI，更大的ROB，集中式保留，更多調度口，加入解碼微操作高速緩存L0等等。

量化數據P4EE 3.6 SuperPI 1M大概36秒 i7 6700是9秒左右。P4 570(3.8) Fritz是1300左右 i7 6700大概16000合單核4000……這些bench和上面指令latency三到四倍的提升差不多，如果上x264之類對simd優化很好的應用說不定差距還要大

差遠了，早在snb的時候奔騰出過一個1.6g單核的，然後被中關村饒有興緻地拿去做了個對比，結果同核心數同頻還是吊打，架構是一部分，更主要的是多出了許多支持的指令集，很多關鍵應用下速度能翻幾倍，比如avx和aes指令集，當然這些說下來還是微架構改進就是了。

另外一個不能忽略的其實是工藝和後端設計，在當時要達到那個頻率，以當時的工藝是不容易的事情，所以架構上也會做出一些妥協，因為當時的想法就是用很高的頻率去彌補ipc的問題。而現在的工藝已經能輕鬆做到這個頻率下工作了，所以對設計者來說會寬鬆很多，其實從晶體管數也可以發現這個問題，snb一個核心就幾億晶體管下去了，是原來netburst架構時候好幾倍了，更不要提現在的skylake，雖然其實相較於snb提升也一般就是了

首先差距是全方位的，有些地方差得非常離譜。

我舉個簡單的例子，SNB裡面有3個256bit的整數SIMD單元，P4我記得只有1個128bit的。同頻也是6倍的理論性能差距。

一顆CPU小一萬元：英特爾P4EE就是這麼貴

2005年一顆U 1W，11年過去了，現在同價位的U不知比P4EE高到哪裡去了

具體的性能就得有人測試了，不過緩存，內存上天然的差距………

就好比從一群侏儒里拔個大個去和巨人症患者鋸掉小腿比個子……

還真沒法比

micro-architecture；

process。

@winnie Shao 關於原因，這位師姐是唯一答到點子上的，怎麼沒人贊呢？

譬如，高票提到單指令周期縮短，而為什麼縮短？只能是來自兩個方面：工藝和電路結構。

構架的進步自不必說，工藝是什麼意思？線寬減小的同時，集成度增加（晶元單位面積內電路更多）、電容減小（速度更快），而即使不考慮線寬的變化，器件性能本身就在進步。

有了工藝和電路設計的進步，才有最終產品的進步。

主要是工藝，晶體管數量的差距。

桑塔納1.6升排量發動機和F1賽車的1.6升排量發動機的差別