為什麼CPU/GPU的溫度會在一瞬間波動十度以上?

最近在拿自己的筆記本烤機,i7 4710HQ + GTX860M都有自己的獨立風扇,烤機溫度最高會升到85度,但是只要烤機一停,一瞬間就會跌到70度以下,然後再慢慢降回40~50度的空載水平,為什麼這一瞬間溫度波動會這麼劇烈呢?


CPU的功率高,但是比熱容小,再加上熱傳導是與溫度差有著線性關係的,所以一開始溫度下降會比較快,然後會慢慢的過渡到正常溫度。


不認為這個溫度不合理。

如果一個部件在產熱,10w,溫度不變表明熱傳遞出去的功率也是10w。

如果一瞬間停止產熱,熱傳遞出去的功率仍舊是不變的(應該主要和溫差有關)

而如果比熱容比較低的話,溫度驟降也是完全可能的。


作為曾經在N公司從事GPU power研究的來說上兩句。

1.首先現代晶元的功率遠比你想像的高,隨隨便便上100W。這裡面絕大部分都會變成熱能擴散出去。功耗已經成為制約處理器性能的重要瓶頸之一,曾經intel有個趨勢圖,說按之前晶元的集成發展速度,晶元的能量密度將超過太陽,是不是很誇張!

2.晶元體積小,比熱值低。導致功率很快就能反應在溫度上,滯後時間非常短。跑計算密集型的應用,如果去除散熱裝置,幾秒鐘晶元就能從常溫升到八九十度。

既然晶元的溫度跟功率息息相關,那有哪些因素會影響功率呢?晶元的功率由晶元上的晶體管組成,而晶體管的功率包括靜態功率和動態功率。靜態功率是主要受電壓,溫度,製成的影響;動態功率主要受頻率,IPC(instruction per cycle)和電壓影響。其中電壓與靜態和動態功率呈平方關係。

在題主所謂的烤機過程中,頻率會在PMU控制下很快上升,同時為保證晶元的穩定運行,電壓也必須伴隨頻率提升。再加上烤機的程序都是計算密集型,IPC非常高。這一切的一切都會導致溫度上升飛快。在這過程中,有一瞬間會出現峰值性能,但是這個時間維持不了太久。因為受溫度或power budget的限制,PMU要開始降頻啦!最後會比較穩定的運行在某個頻率上。

那為什麼停止烤機,溫度或者說功耗會下降的如此之快呢?很多同學可能會誤以為是頻率和電壓下降導致的。但實際上IPC在這裡才起了決定性作用。IPC隨著程序停止,瞬間降到幾乎為0。所以功耗和溫度自然就下來了。電壓和頻率恰恰發生在這隻後,PMU在一段時間內晶元idle才開始下調頻率和電壓。


散熱器的導熱硅膠、銅管、鋁片這些散熱材料,散熱鰭片表面積大(2*片數*單片面積),大概有1/3平方米,加上風扇高轉速,這些對溫度快速下降貢獻巨大,當cpu和環境溫差越大,散熱器散熱越快(基本的物理原理:溫差大,風扇高轉速)。自己攢機,或者測試過不同導熱硅膠對晶元溫度的影響。如果你有台式機,那麼可以自己做以下的烤機測試,並觀察晶元溫度(cpu-z,gpu-z,或者直接上手感覺散熱器的溫度變化):1,關閉散熱風扇;2,去掉散熱硅膠;3,完全去掉散熱器。另外,可以舉一個生活例子:當筆記本電腦使用久後,由於導熱硅膠老化失效,風扇積累灰塵,CPU或GPU過熱導致死機或重啟,這說明這種情況下溫度不能快速降低,產生熱量&>&>散熱量,不能達到熱平衡,最終導致晶元溫度超過了閾值(重啟),或者正常工作極限溫度(宕機)。


對於這個問題我說幾個原因

第一:cpu在進行基本操作是出於基本的負荷,你的那塊cpu在烤機時會計算量大於供應量,晶體管並用導致電阻越來越大,在負荷到滿時,電阻固定,但虛擬技術進一步抬升供應量,導致發熱進一步提高。

第二:從電腦軟體看的溫度都是有誤差的,不會一下從40跳50,50跳60,都是持續上升的,所以你可能會看到突然的上升,但也只是上升的比較快而已。


測量誤差挺大的


直接用溫度計測cpu才是準的,其它都有誤差。


推薦閱讀:

看手機CPU性能時,到底是單核跑分重要,還是多核跑分重要?
分散式計算下的一個共享經濟構思是否可行?
如何評價AMD在CES2018公布的桌面版Ryzen APU?
為什麼常聽說CPU屏蔽核心,而很少聽到GPU屏蔽核心?
預算13000左右搭配一個遊戲主機,求大神推薦?

TAG:中央處理器CPU | 圖形處理器GPU | 電腦硬體 |