CPU會被GPU替代嗎？SIMD和SIMT誰更好？

01-29

近日朋友問我SIMD（單指令多數據流，Single Instruction Multiple Data）的問題，進而引申出一個有趣的問題，CPU會被GPU替代嗎？或者GPU會被CPU替代嗎？我相信本專欄的大部分讀者都會得出這樣的結論：近期內不會。兩者的差距是巨大的：

CPU為了通用和低延遲做了更多優化，從而運行核心比較少。GPU為了高並發、高流水犧牲了通用性和延遲，它的內核數目動輒數百：

兩者似乎生活在不同的維度，也在相當長的時間內井水不犯河水，過著相安無事的日子。平靜的表面下暗流涌動，在兩者交叉的地方明爭暗鬥從來都沒有停止。CPU加入更多的SIMD的指令，而NVIDIA在提出SIMT的CUDA模型後，也試圖不斷矮化和侵蝕CPU的固有領土。兩者的交鋒隨著大熱的人工智慧而愈演愈烈。顯然CPU並不適合人工智慧的大規模矢量運算，Intel從而轉向在Xoen Phi的MIC（眾核）， FPGA和專用ASIC三個方向發動進攻，而目前N卡似乎毫無懼色，股票價格持續創出新高。

我不打算討論雙方甚至三分（加上Google）的口水仗。僅僅從技術角度開啟一個新的系列，我們希望通過討論如下幾點，來深入了解二者的不同，從而對晶元是如何設計的有更深的體察。

什麼是SIMD，什麼是SIMT，什麼是SMT？SIMD和SIMT是替代關係還是包容關係？
SMIT的編程模型和SIMD有哪些不同？
多發射越多越好嗎？
CPU的core和GPU的core設計有什麼不同？
GPU有Cache和DRAM嗎？為什麼顯存是GDDRx，而是不一般的DDRx？

作為本系列的第一篇，我們通過數據來比較一下二者的歷史演化，以形成感性認識，也是我們將來討論問題的基礎。為了公平起見，不但比較N卡，也會加入A卡和Intel的至強Phi的內容。聲明：本文後面數據和圖片來自Karl Rupp的開源數據，見參考資料1。所加入水印為了防止盜文，並不代表擁有圖片版權，版權歸原作者。