HBM 和 GDDR5X 有什麼用？現在顯卡帶寬遭遇瓶頸了嗎？

01-26

= =

GDDR5X是GDDR5的改進型，把介面從32bit提升到64bit，這樣傳輸速率可以高一倍。第一塊用GDDR5X的顯卡是Geforce GTX 1080，內存位寬256bit，帶寬320GB/s。

HBM是把內存晶元疊起來，已達到更大的位寬和傳輸速率。第一塊用HBM的顯卡是AMD Radeon R9 Fury X，內存位寬4096bit，帶寬512GB/s。

另外還有HBM2，用在Tesla P100上，位寬也是4096bit，但帶寬達到了720GB/s。一般來說，當一個程序足夠優化的時候，IO就成了瓶頸。所以帶寬越大越好。否則塞不滿GPU的計算量，最終會拖慢整體速度。

顯存現在被分成GDDR系和HBM系，區別在於前者是舊東西，後者是新東西罷了。

不過這箇舊東西，看來短期內不會被新東西取代。因為HBM相對GDDR最大的優勢，在於超高的帶寬容量，和較小的封裝面積，然而第一個優勢必須頂級顯卡才有體現，後者對於桌面獨顯來說根本就是偽需求。而HBM天生的成本高的劣勢，導致了GDDR短期內很難淘汰。

要到多高的帶寬才叫高呢？Titan Xp GDDR5X 505G帶寬，Tesla P100 HBM2 720G帶寬，至少在NVIDIA看來，600G算是一個GDDR HBM的分界線。明年的GDDR6帶寬容量要翻倍，600G這條分界線可能還要往後移。

我們常見的中高端顯卡，GTX1080 320G, 1070 256G, 1060 192G, RX580 256G. 距離600G這條線都很遠，所以對於消費級顯卡瓶頸這一說還早。

真是心疼想要強行普及HBM的A卡。。。VEGA64帶寬480G安安分分用GDDR降成本多好，現在難產成本高售價高銷量低這是何苦。。。

是的，核心性能越強需要的顯存帶寬就越大。提高顯存帶寬可以通過增加位寬、提高顯存運行頻率、改進顯存類型來實現。

增加位寬需要更多的顯存控制器，不僅佔用晶體管而且會提高核心的功耗。提高顯存運行頻率會增大顯存的功耗，也不是所有顯存都能在高頻下穩定運行。

從成本考慮，不同型號的卡用合適的技術就行。目前只有高端卡里的少數幾款才需要用HBM或者GDR5X。

我來講個故事：

當年還是機械硬碟年代，SATA2的介面速率高達300MB/s，已經遠超機械硬碟的傳輸速率。

但硬碟介面依然從SATA2進化到了SATA3，介面速率達到了驚人的600MB/s。

要知道，機械硬碟的傳輸速率可是只有100MB/s左右的，SATA3的介面速率可是它的6倍。那麼請問，要這麼多富餘幹什麼？

現在，在這個固態硬碟走向普及的時代，這個問題可以解答了：這是為了給將來的升級鋪平道路。

在現在看來，600MB還夠么？已經不夠了。現在主流的PCIE SSD，已經到了PCIE 4x，達到了驚人的2GB/s。

所謂兵馬未動，糧草先行。哦不對，是核心未動，帶寬先行。有了充足的帶寬，各大廠商才有信心去研究下一代的技術，這是必備的基石。

至於1080為什麼用的是GDDR5x，那就是老黃認為1080的介面不會稱為瓶頸，也就是說，現在的核心還不夠強，GDDR5x的帶寬已經足夠。

至於HBM2，說實話，個人認為，還沒必要這麼早普及。畢竟顯卡是一個整體，又不能換核心，在帶寬未到瓶頸之前，GDDR5x還是可以一用的。

HBM和GDDR5X都是用來解決顯存帶寬不足的問題的。GDDR5頻率基本已經提升到了瓶頸(7GHz)，再提升就要boom了。如果不提升頻率，怎麼辦呢？像農企290X一樣增加帶寬(比如512bit)，那這樣內存控制器功耗成本都上去了。

GDDR5X使用16n prefetch，帶寬寬度根據廠商定，而不是像排名最高答案所說的64bit。GDDR5X降低了電壓提升了有效頻率，而且和已有的GDDR5介面是兼容的。相比於HBM來說，GDDR5X實在是便宜太多了，同時OEM可以自由添加更多的顯存。

HBM的優勢在於巨大的帶寬和能耗優勢。HBM1代大約14.6W就可以提供512G的帶寬，HBM2代的能耗比還會更高。但是HBM最大的問題是它所有的顯存棧都需要用一個專門的連接器(interposer)來連接GPU和顯存。這個Interposer算是一個晶元半成品吧，比起PCB來說成本簡直不知道高到哪裡去了，而且比如設計好了放四個stack那麼就只能放4個stack，你想再加顯存就只有重新設計一個hhh。這就是為什麼農企Fury X系列萬年4GB顯存。當然對於Tesla用戶來說，錢都不是問題，HBM當然是墜吼滴，對於普通用戶來說的話還是用GDDR5X吧。。。

遇到瓶頸了吧，看看晶元上顯存PHY的面積，佔了多大了，顯存功耗佔了多大部分了，AN兩家這幾代桌面GPU都開始利用DCC和部分TBR特性來節約顯存帶寬，這些信號都在說明這一點。

看應用，比如ETH挖礦吧，NVIDIA TITAN Xp是30MH/s，核心稍弱卻配備了HBM2的Tesla P100可以達到60MH/s。

這就是顯存的瓶頸。

顯卡帶寬早就到了瓶頸，現在不過是選擇哪條道路而已

HBM系列顯存能耗比較高，節約pcb面積，但成本較高，產能不足，而且難以和之前的設計兼容，移植性差（說白了就是不能低成本同時兼容HBM和GDDR系列）；GDDR5X（甚至包括明年的GDDR6）能耗比差，並不節約pcb面積，但產能相對較為充足，而且相對於之前的GDDR5兼容性好，易於無縫兼容升級（比如Pascal系列中的1080和1070,1070ti，一樣的核心系列（都是GP104系列），通過調整核心規模差別和顯存差別就可以輕鬆劃分產品線~

綜合來說，GDDR5X（6）易於用於主流級別顯卡，而HBM系列往往用於高端顯卡~

搬運一下：

JEDEC技術協會最新通過的HBM2與GDDR5X標準，分別是高階顯示卡與主流顯示卡市場的兩大生力軍。然而根據實際在NVIDIA GeForce 980Ti上針對GDDR5X頻寬進行測試的結果，GDDR5X的效能比起目前使用HBM的Radeon R9 Fury X還要來得優異。
　　由此預估，面對即將崛起的虛擬實境(VR)市場，GDDR5X也有機會發揮不錯的影響力。
　　據VR World報導，HBM2的容量與記憶體頻寬，可望從HBM的4GB/512Gbps提升到16GB/1Tbps。然而HBM2記憶體的低產量高價位，短期內勢必只能停留在Polaris、Pascal等高階市場。在價格低於500美元的顯示卡市場，GDDR5X可望在GDDR6出現前大放異彩。

　　GDDR5X是由美光(Micron)位於德國的Graphic DRAM設計中心所研發。除了作為顯示卡記憶體標準外，GDDR5X也可能出現在思科(Cisco)等廠商的高階網路交換器上。首代GDDR5X晶片擁有8Gbit/1GByte的容量，隨著產量增加，8/16 Gbit的晶片也有可能問世。
　　據JEDEC釋出標準，GDDR5X共可支援4GB、6GB、8GB、12GB、16GB等5種形式的記憶體配置。NVIDIA與超微(AMD)有可能在Maxwell與GCN的基礎上，利用新的記憶體配置繼續生產顯示晶片。
　　GDDR5X可達到每腳位10~14Gbps的傳輸速率，表理論上GDDR5X每32位元的記憶體介面，將可達到237.5Gbps的最大傳輸速率。如果拿配備GDDR5與GDDR5X的GeForce 980Ti顯示卡兩相比較，可以發現原始的頻寬為336.5Gbps，而GDDR5X的原型與製品則分別達到624Gbps與672Gbps的頻寬。
　　從測試結果也可發現，不論是原型或製品，GeForce 980 Ti GDDR5X的頻寬效能顯然已超越了目前市場上的頻寬霸主Radeon R9 Fury X。Radeon R9 Fury X使用了HBM記憶體及4096位元記憶體控制器，但其512Gbps的頻寬已不及GDDR5X顯示卡。
　　測試人員也透過超頻使Radeon R9 Fury X記憶體時脈提升到607MHz，並達到621.57Gbps的傳輸速度，但仍較GDDR5X顯示卡遜色。未來不論是虛擬實境、擴增實境(AR)以至於4K遊戲，都可藉由GDDR5X使GPU發揮出驚人效果。
　　來源：DIGITIMES