CPU 真的會老化?具體表現是什麼?

老化是否會影響計算速度之類的參數?
如果真的會影響超頻效果,或者超頻會加速這一過程,那酷睿系列處理器的睿頻技術不就會加速CPU的老化么?


真奇怪了,怎麼一個個都在談論electron migration?好歹也做過相關領域研究的答一個吧。

一般來說IC老化是四種現象之一:NBTI (negative-bias temperature instability), HCI (hot carrier injection), EM (electron migration) 和TDDB (time-dependent dielectric breakdown)。其中NBTI和HCI主要導致速度的緩慢降低,EM和TDDB主要導致隨機的崩潰性失效。
其中EM很好解釋,金屬導線中的原子被電流帶著不知跑到什麼地方去。這個效應一會導致導線在缺損處逐漸變細最終斷裂,二會導致跑掉的原子在別處堆積生成dendrite,然後dentrite長著長著就長到別的導線上面去了,結果就是線間短路。可以看出兩個效應基本一發生就沒得挽救了,要對付EM主要靠預防,比如說想法不要造出缺陷來,做線的時候寬一點。但是在設計條件下,正常設計數十億門,導線如恆河沙數,要保證這個人力有時不及。
其它三個效應都是跟MOSFET原理有關。貼個我以前做的報告圖示意一下:

本科學過電子學的可以知道,MOSFET原理是一個門極靠靜電勢控制底下的導電溝道深度,電勢高形成深溝道電流就大,電勢低溝道消失就不導電了。稍微想深一層就知道這個門極導電底下的溝道也導電,那就必須中間有個絕緣介質把他們分開,否則就變成聯通線不是晶體管了。
再想深一層就知道這個絕緣介質最簡單的做法是把硅氧化做二氧化硅。
而行外人一般想不到的是光二氧化硅還不夠,工程上二氧化硅和基板硅之間附著很差,必須加入Si-H鍵把二氧化硅層拴住。所以實際上介質層和硅之間有一層不是純SiO2是SiOH。問題由此產生。
VLSI等級的微觀尺度使得量子效應不能忽略。溝道中流動的電子會因為量子能量漲落隨機得到臨時能量變成熱電子然後跳到不知什麼地方去,這叫隧穿效應。隨手搜到一個詳細解釋(隧穿電流_百度百科),對物理學感興趣的同學可以看看。不感興趣的同學,想想MOSFET關斷狀態的漏電流哪來的,為啥是個冪指數函數就知道了。
這事沒完。前面提到有Si-H鍵。這個鍵的特點是容易破,也容易重新恢復。電子一隧穿,有幾率把這個鍵打斷,這時候就產生斷鍵和遊離氫原子。斷鍵會使得threshold voltage提高,就是說原先0.3V就打開的門,現在需要0.35V才能打開了。這意思是說,同樣加1伏電壓,原先導通電流相當於0.7V時的情形,現在相當於0.65V時的情形。這就是為什麼斷鍵會使晶元變慢,因為導通電流低了,升壓就慢。升壓一慢,門開關就慢了,最後你的邏輯就慢了。
為什麼會隨時間變慢呢?因為斷鍵是隨機發生,需要時間積累。另外,記住我們前面提到Si-H鍵可以恢復,所以基於斷鍵的老化效應都有恢復模式。對於NBTI來說,你給他加反向電壓就會進恢復模式;對於HCI來說,你不要動他就進入恢復模式。但是這兩者都不可能長時間發生,所以總的來說,晶元是會逐漸老化的。
為什麼溫度有影響呢?溫度表示宏觀物體微觀粒子平均動能。熱了,熱電子就多,斷鍵機會就大。一般民用電子產品用上十來年問題不大。汽車電子晶元,十年就差不多了。哪位有朋友開美國車的,可以觀察一下。新車一般很潮,上十年以後基本上就像聖誕樹一樣了,一開車到處都亮。
為什麼加壓有影響呢?同樣的晶體管,供電電壓越高偏移電壓越高,偏移電壓越高氫原子遊離越快,等於壓制了自發的恢復效應,自然老化就快了。
為什麼超頻有影響呢?因為超頻本質上是利用晶元廠商對這個過程無法充分把握而預留的裕量。晶元製造出來會有一個速度測試,然後晶元廠商考慮到典型使用情況,預留一個裕量,話不說太滿,免得老化以後晶元達不到。打個比方,300ps晶元標3GHz,即便老化10%也還能達到;但是如果你改時鐘當3.3GHz用,那稍微老化一點就達不到了。從用戶的角度來看,就是亮不起來。
這是為啥會老化。最後再說一下前面提到的TDDB。上文只說Si-H鍵會斷,但是Si-O鍵其實也會斷的,斷了以後會形成一個可導電的點。隨著使用隨機斷裂,到一定時間以後斷了的Si-O鍵會形成一個從溝道聯通門極的導電旁路,管子就擊穿了。這就是TDDB。過去為了速度二氧化硅層越削越薄,這個問題很突出。但是有了High-kappa金屬門(HKMG)技術以後可以不再削薄電介質層,這個問題可能就不如想像的那麼嚴重了。
延伸閱讀:
Negative-bias temperature instability
Hot-carrier injection
普度大學M. Alam教授的網上課件EE695A: Reliability Physics of Nanoelectronic Transistors。 特別推薦這個,Alam教授不辭勞苦不怕被盜把幻燈片都放上來了還帶配音,尤其難得的是把NBTI研究歷史都帶入教學裡面了很有故事感,數理背景hold得住的不妨看一看。
上面圖中右上角黑白圖取自Alam教授課件,此致感謝。


老化也叫wear out,它並不會影響計算速度,但在一定時間後會造成出錯。超頻伴隨的高溫和高電壓會加速這一老化過程。因為睿頻技術超過TDP不會太久,一般來說影響不大。我們先來看看CPU的壽命是如何決定的。

浴缸曲線模型(Bathtub Curve Model)

和大多數半導體設備一樣,CPU的可靠性我們可以通過失效率來衡量。如果我們以時間為x軸,y軸為失效率。CPU的失效率曲線如下:

失效率曲線

藍色的曲線叫做早期失效期(Infant Mortality),表明CPU在開始使用時,失效率很高,但隨著產品工作時間的增加,失效率迅速降低。它的原因是由於製造和原材料帶來的缺陷。

紅色的直線叫做隨機失效期(Random Failures),它是質量缺陷、材料弱點、環境和使用不當等因素引起的。它是個常數,它在CPU整個生命周期是個常數。

綠色曲線是耗損失效期(Wear-out),它在前期極低,後期開始錯誤後極具提高。是老化失效的原因。

綜合上面三種曲線,綜合失效率是紫色曲線,它呈現兩頭高,中間低的特徵,形狀像個浴缸,我們把它叫做浴缸曲線(Bathtub)模型。CPU在生命周期中的這種特點,表現在開始時故障率很高,如果沒有問題,則可以穩定工作很久,到最後開始老化失效,故障率急劇升高。

Burn-in

許多人看到這裡都會大吃一驚:「什麼,CPU早期失效率這麼高?是不是我剛買的CPU馬上就要壞了?」CPU製造廠商並不希望大規模的退貨發生,畢竟所有CPU至少都有3年的質保期。CPU廠商會封測期間,把CPU放入高溫的環境下洗個澡(heat soaking),並加上高壓。這樣幾個小時就相當於過了好幾周。在把CPU拿出來測試,不好的淘汰掉,好的就可以進入浴缸曲線的底部穩定期,才能出貨。這個工序叫做老化(Burn-in)。如圖:

這樣挑選後CPU直接跳過早期失效期,進入了穩定期。大家的CPU才會有3年質保。

3年之後呢,CPU會降速嗎?

就像超市裡的牛奶寫的保質期3天,實際上5天之後大多數牛奶還是可以喝的一樣。3年質保只是最小值,實際上大部分CPU用上7年以上都是沒有問題的。那麼多年後進入耗損失效期(Wear-out)後CPU會怎麼樣呢?首先,CPU的速度是恆定的,都是一個基頻乘以一個比例(Ratio)出來的。基頻現在Intel CPU一般是100MHz,我們用的3G CPU,Ratio就是30,下來剛好3GHz。而基頻和Ratio在整個生命期是不變的,從而CPU運算速度是不變的。Wear out的後果是出錯而不是降頻,而很多種出錯都會被CPU的錯誤檢測發現並報告或者糾正,詳情請參閱本專欄的另一篇文章計算機硬體出錯了會發生什麼?,如果發現出錯,就是CPU開始進入失效期,以後錯誤會越來越多。

CPU為什麼會失效?

實際上CPU失效的原因有好幾個,我們今後會專門撰文介紹。它們的統一特點就是高溫高電壓會加速失效。如圖:

失效與電壓的關係(來源anandtech)

粉色的曲線是高溫曲線,黃色是正常溫度,而藍色則是配備了好的散熱系統。可以看出高溫和高電壓嚴重影響了CPU的失效率。這也是為什麼超頻後不再享受質保的原因。

結論

CPU使用長了並不會降頻,如果我們把電腦和手機變慢的罪魁禍首歸咎於CPU,那真是錯怪它了。那麼為什麼電腦手機會越用越慢呢?原因很多,軟體原因是安裝軟體越來越多等等;硬體原因也許就是風扇髒了,轉速慢了,造成溫度過高而降頻(CPU風扇停轉後會發生什麼?CPU憑什麼燒不壞);或者SSD的空間滿了/沒有啟動Trim(雜說快閃記憶體番外:手機為什麼越用越卡和快閃記憶體寫放大)造成速度極大降低等等。

最後強調一下CPU的Wear-out是隨著使用時間進行的。如果你把電腦放上幾年不動,CPU並不會老化,反倒是SSD的內容丟失了(雜說快閃記憶體番外:我們的數據存在固態硬碟上安全嗎?)

其他CPU相關文章:

CPU製造的那些事之一:i7和i5其實是孿生兄弟!?

CPU製造的那些事之二:Die的大小和良品率

為什麼CPU的頻率止步於4G?我們觸到頻率天花板了嗎?

為什麼晶圓都是圓的不是方的?

為什麼"電路"要鋪滿整個晶圓?

歡迎大家關注我的專欄(UEFI和BIOS探秘)和用微信掃描下方二維碼加入微信公眾號"UEFIBlog",在那裡有最新的文章。同時歡迎大家給本專欄和公眾號投稿!

用微信掃描二維碼加入UEFIBlog公眾號

瀉藥,粘一個答案充數:
溫度高會造成晶元的電子遷移現象,加速晶元設備的老化。
「電子遷移」是50年代在微電子科學領域發現的一種從屬現象,指因電子的流動所導致的金屬原子移動的現象。因為此時流動的「物體」已經包括了金屬原子,所以也有人稱之為「金屬遷移」。在電流密度很高的導體上,電子的流動會產生不小的動量,這種動量作用在金屬原子上時,就可能使一些金屬原子脫離金屬表面到處流竄,結果就會導致原本光滑的金屬導線的表面變得凹凸不平,造成永久性的損害。這種損害是個逐漸積累的過程,當這種「凹凸不平」多到一定程度的時候,就會造成CPU內部導線的斷路與短路,而最終使得CPU報廢。溫度越高,電子流動所產生的作用就越大,其徹底破壞CPU內一條通路的時間就越少,即CPU的壽命也就越短,這也就是高溫會縮短CPU壽命的本質原因。

——————
沒做過測試,不過自己有個賽揚II的CPU 2.4G,用了好些年了,現在這台電腦開機就顯示CPU100%,永遠90%以上,沒超頻,XP+金山,後台很乾凈,純粹是那它跑DOS模擬器的。
不知道是不是CPU老化了


CPU/GPU跟人都一樣,也是會老化,物理上稱為「電子遷移」,關於其解釋可以看 @Kaiser Li。
造成這種「電子遷移」有4個原因,
1.長期高負載狀態下使用(例如超頻)
2.長期高溫環境下使用 (散熱不良)
3.長期電場不穩定環境下使用
4.常規使用了很久、很久、很久...
這種老化不會影響到標準的計算規格與速度,但是會影響到超頻的性能。
至於@Kaiser Li所描述的那個賽揚II的CPU 2.4G開機100%的,請檢查系統、內存、硬碟、溫度這些環節。

至於「Intel 那酷睿系列處理器的睿頻技術不就會加速CPU的老化么?」
不會的。
請先看看它的工作原理
「睿頻加速技術使得cpu的主頻可以在某一範圍內根據處理數據需要自動調整主頻。它是基於Nehalem架構的電源管理技術,通過分析當前CPU的負載情況,智能地完全關閉一些用不上的核心,把能源留給正在使用的核心,並使它們運行在更高的頻率,進一步提升性能;相反,需要多個核心時,動態開啟相應的核心,智能調整頻率。這樣,在不影響CPU的TDP情況下,能把核心工作頻率調得更高。比如,某i5處理主頻為2.53GHz,最高可達2.93GHz,在此範圍內可以自動調整其數據處理頻率,而此cpu的承受能力遠遠大於2.93GHz,不必擔心cpu的承受能力。」

以某I5為例,標稱的主頻是2.53GHz,通過加速技術後,最高可達2.93Ghz。
再反向推敲,如果它默認頻率、TDP設定就是2.93GHz,然後把它的主頻調節到2.53Ghz 呢?


會老化,但是以目前的工藝條件看,一般你等不到那一天= =b


CPU無法達到原來頻率或者達到同樣的頻率需要更高的電壓,俗稱「縮缸」,超頻或調節電壓會加速這一過程。
相關說明:【轉帖】有關「電子遷移」和超頻的關係_amd吧


看了各位的回答,都是比較專業的,說的都很對,我從我日常維修的角度,膚淺的回答一下這個問題,看看都有什麼問題會導致CPU老化。
1.你的CPU散熱系統會老化,風扇軸承常年旋轉缺油,軸承脫口,導致的你風扇轉速變慢,甚至不轉,散熱片集滿滿是油污的灰塵,風扇死命的吹,也不會讓CPU得到一絲涼風。
2.你的主板會老化,主板的老化會極大地影響CPU的供電,主板老化後自身元器件的過熱也會影響整機及cpu的溫度。
3.電源會老化,它會先讓主板加速老化,再迅速的影響cpu。

計算機是仿生學的產物,當你的cpu不行的時候,實際上是你的很多配件老化的綜合結果。尤其在這個階段,個人電腦升級換代的需求小了,很多人都還可以用自己的老電腦湊合著上網,7,8年都不換了,打開你的機箱看看裡面的環境,它們能不老化嗎?擱誰誰受得了呀。
還有,北方風沙大霧霾重,塵土積累非常迅速;還有有的使用者靠窗戶,靠廚房,這些灰塵油煙顆粒都會加速你機器的老化,讓你的CPU老化速度加快。

一般的使用者是沒有能力來保證自己的使用環境和定期維護清理的,在購買之前,在主板和電源這2樣東西上捨得花錢,可以極大的延長整機壽命,也是各位不多的能做的事情了。


老化不影響計算速度,但是會影響超頻性能。具體表現是提升頻率需要的電壓越來越高。


會的。先上一張老CPU圖

奔騰MMX 233,第一台自用電腦的cpu,還在使用中。估計比這裡不少小朋友還要老一點(瞬間暴露年齡-- 手動捂臉)

具體表現?所有的針角已經被歲月磨平,邊角也已經圓潤,沒有了當年的稜角,把玩起來完全不會有扎手的感覺。唯一的遺憾是正面的字跡早已消失,看不到當年Pentium MMX 那燒包的商標了

當年的風彩應該是這樣的(圖片來自網路):

總的來說,作為鑰匙扣,還是越來越好用了。


這個我碰到過,已前公司有一台老電腦只要不開大的程序過幾秒鐘必死機,不停的用讓cpu保持二三十的使用率就一直正常,硬體系統折騰換個變沒用,後面只好寫個死循環的程序開機啟動就行了。


推薦閱讀:

如何優雅地配一台台式機?
現在的「遊戲本」起名為何這麼中二?
神舟筆記本到底靠譜不?
百萬級銷量的硬體,通用件組裝和全套重新設計哪個成本更低?
「部分神舟筆記本電腦使用藍天模具提升了做工」的說法是否有依據?

TAG:中央處理器CPU | 知識 | 硬體 | 電腦硬體 | CPU佔用率 |