HBM顯存是什麼?有什麼特點?


第一次寫回答,先說明,我從事內存控制器設計的,從業時間2年,不長。不能說我回答的是對的。只是之前對3DS內存還算有些了解,最近因為好奇,也在研究HBM,說一些從3DS內存角度出發的個人看法。從披露的HBM細節上看,HBM是3DS的一種弱化版,希望我的答案能給你幫助。

HBM和3DS一樣,都是一種立體空間內存,這個是他們和傳統內存的最大區別,傳統內存都是平面的,是把內存顆粒平鋪開來。而且由於工藝等等的限制,平面DDR5想再提高頻率已經比較難了。平面內存想獲得更大的存儲空間,就需要更大的面積,這對有限的空間也是一種挑戰。

首先說下3DS吧,3DS內存它是把各個存儲層堆疊起來,就像蓋樓一樣,層和層之間會有金屬層等間隔,同時通過TSV聯通各個存儲單元。TSV(硅通孔)是內存能夠堆疊的關鍵,它能夠在各個存儲層之間以及層內構建出硅通孔的通路,存儲單元的訪問就通過這些通孔完成。在堆疊上,現在一般只有2,4,8三種數量的堆疊,立體上最多堆疊4層,8堆疊是有兩列4堆疊構成。每列堆疊都是由master rank和slave rank構成,master rank會和內存控制器相連接,而slave rank只和master rank 互聯。所有的放大器和一些外部電路也只存在於master rank 中,這樣就省下了很多開銷以及功耗。由於TSV是空間立體的,數據通路更短,各個數據到達各個存儲單元的latency也會降低。總的來說,3DS內存帶來的是高帶寬、低開銷(空間)、低latency(結合DIMM)、大容量、低功耗(相對同容量的平面內存)。但是現在3DS內存技術上還有難題,難以量產,成本也偏高。但現在主流的內存控制器一般都支持3DS內存,3DS內存是以後內存的發展趨向。

在顯卡上,內部把內存堆疊,用TSV通孔,但是不是3DS那種空間交錯式的。堆疊好的內存布局在一個底層DIE上,圖形處理晶元和這個die相連,最後把這些封裝到一塊整體晶元內。所以使用HBM內存作為顯存的顯卡比使用傳統平面內存作為顯存的顯卡要小很多。HBM是一種2.5封裝的內存,它採取了折中的方案,帶來的好處不如3DS多,也有瓶頸,但重要的是能量產。


HBM顯存技術到底影響幾何

HBM這個名詞對於很多人來說依舊並不熟悉,但如果在前面加一個定語「AMD全新旗艦顯卡搭載」,相信很多人就會有所了解了。

HBM現在的優勢在哪裡?

相對於傳統的GDDR5顯存來說,HBM無疑是更加先進的,甚至可以說是未來高速存儲的發展風向標!原因也很簡單GDDR5經過這麼多年的發展已然來到了一個瓶頸的位置,光靠頻率提升來提供更大的顯存位寬已經沒有太大的空間,而這勢必會反過來影響到GPU的性能發揮。

  這張圖除了規格對比之外,還能很清楚的看到HBM的實際結構,尤其是四層DRAM疊在最底的底層die之上,雖然AMD一直也沒有給出HBM本體的具體製作過程(絕對的商業機密),但是不難想像4層絕不是HBM未來發展的極限,而隨著層數的增加位寬勢必還會迎來進一步的增加。

  相反的,HBM通過打造高位寬低頻率的顯存,使得在提供比較大的顯存位寬的基礎上不需要那麼高的頻率,同樣的4GB容量下HBM能提供的顯存位寬為4096bit,比GDDR5的512bit高出8倍,這也是為什麼HBM即便只有1GHz的等效頻率也能最終實現大於GDDR5的顯存帶寬!而且這一個優勢還會隨著HBM顯存後期頻率方面的進一步提升而進一步加大。

  除了性能潛力之外,實際工作頻率還關係到另外一個非常重要的問題——較高頻率帶來的更大幅度的功耗提升,這也是GDDR5目前的最大瓶頸。而低工作頻率使得HBM的每瓦下了率足足高出3倍,相信在HBM顯存的位寬隨著疊層數量的進一步增加還會有所增加,那時低頻率的優勢還會進一步加大!

2D到3D——半導體行業發展的必然趨勢?

  如果硬要說HBM顯存技術中最重要的是什麼,那絕對要算最基礎的堆疊設計了,簡單點說就是將傳統的2D電路設計轉變為立體的3D電路設計,充分利用所有的內部空間之餘還能大幅減小基板的面積,從而也推進了SOC以及小型化的發展,可以說這絕對半導體行業發展的必然趨勢。

  其實在手機等小型移動端,半導體堆疊早就已經開始,不過形式上只是顯存和處理器在封裝之後再進行立體的堆疊,但是對於小型移動端寸土寸金的內部空間來說,兩篇晶元的堆疊已經節約了大量的PCB面積,在PCB面積變小之後也能騰出更多空間來容納電池等其他設備,從而獲得更長的續航時間等其他能力。

  反觀DIY領域,其實Intel在CPU中也已經開始推行「3D晶體管」,也就是在微架構下的半導體3D化技術,雖然與晶元直接堆疊的效果相比沒有那麼明顯,但是在製程不變的基礎下可以在一定幅度內縮減晶元的面積,但是由於在頻率和製程上沒有太大的改變,所以在功耗上也沒有太大的改變,也證明這種「偽3D化」不是終極的解決方案。

AMD翻身就看這招?

  其實在Fury首測發布之後,網友們看過之後最普遍的感受是失望,畢竟性能與原先曝光的反殺對手的成績相差了太多。那麼為什麼會造成這種現象呢?看過Fiji核心的架構之後我們不難發現,對性能影響最大的核心採用的還是GCN架構,而且少量的改動也只是讓GCN能用上HBM而已,所以結論也很明顯:老舊的GCN架構已經拖了HBM後腿。

  但即便如此,HBM的實力依然不容小覷,外媒http://Hardware.info最近就發現他們手頭上的Fury在15.15催化劑和別家的不同,因為本來Fury的超頻功能在官方的CCC中只能調節核心和功率範圍,而HBM顯存的超頻其實是默認封禁的,但是他們的版本居然可以進行調節!

  然後經過多次嘗試之後,他們將HBM顯存的頻率從默認的500MHz增加到了600MHz,也就是超頻了20%了,同時核心頻率也有小幅度的超頻從1050MHz超到1145MHz(幅度大概9%)。隨後在新3DMark的測試中成績從14098分提升到了16963分,性能提升了20%,明顯超過了核心的提升幅度,所以可以看出成績的提升主要還是要歸功於HBM的頻率提升。

  其實從AMD官方給出的稿件中我們也可以看出FURY其實還是一款過渡性的產品,因為Fiji核心最重要的運算核心依舊採用的是上兩代也採用了的GCN架構,所以與HBM的結合可以說是非常牽強的,而AMD下一步的計劃也正是為HBM顯存開發一款專門優化之後的架構,這樣才能充分發揮兩者的實力。

堆疊趨勢即將橫掃硬體領域?

  在AMD發布FURY的當天,我們在技術交流會上也有就這個問題詢問了HBM的開發人員,得到的回復也很明確,HBM的相關技術是完全可以應用到其他的領域的,如CPU等其他領域,但是就從目前Fiji核心的實際形態來看,硅基中介層的存在相對於HBM來說是必須的,因為HBM高速倍增之後的位寬同樣需要線路方面的支持,而普通的PCB完全無法承受這種密度的線路設計,所以說硅基中介層可以說是這次HBM能獲得成功的原因。

  可以目前硅基中介層的形態來看,想要應用到硬碟以及內存等存儲設備上並不現實,反倒是CPU的話HBM想對來說更加現實,但是無疑堆疊會成為硬體領域的新趨勢,以後我們可能會發現SSD的容量幾何倍數增長;亦或是單條1T的內存等等。

總結:HBM顯存作為AMD這些年弱勢以來的大反擊,雖然在實際的產品上並未展現出與預期相符的性能表現,但是絕對算得上是硬體發展上的一個里程碑事件,而且已經埋下了下一代產品大躍進的伏筆,絕對值得期待!

看了這麼多,點個贊,順便關注我們?


HBM在顯卡上的直觀體現就是,沒有內存晶元啦。dram和gpu封裝在同一顆晶元里。單比特功耗回更小,因為帶寬更大了,傳輸距離小多了。但散熱要求更苛刻,因為gpu很熱烤的dram吃不消。


來自AMD官方http://www.amd.com/zh-cn/innovations/software-technologies/hbm 4096bit位寬 這是未來的趨勢。


看樣子,應該有2個明顯的特點。

1、快

2、貴

其他專業的就交給硬體大神來回答吧


High Bandwidth Memory

高帶寬, 面積小, 功耗低, 發熱高


推薦閱讀:

可以把【顯存】劃分給【內存】用嗎?
NVIDIA 的 CEO 黃仁勛在 IT 業到底是怎樣的形象?
AMD 公司持續虧損、市值不斷蒸發、產品競爭力不強,那為什麼公司還沒倒閉?
玩守望先鋒顯卡是gtx960好還是1060好?

TAG:硬體 | AMD | 顯卡 | 內存RAM | 電腦硬體 |