HBM 和 GDDR5X 有什麼用?現在顯卡帶寬遭遇瓶頸了嗎?
= =
GDDR5X是GDDR5的改進型,把介面從32bit提升到64bit,這樣傳輸速率可以高一倍。第一塊用GDDR5X的顯卡是Geforce GTX 1080,內存位寬256bit,帶寬320GB/s。
HBM是把內存晶元疊起來,已達到更大的位寬和傳輸速率。第一塊用HBM的顯卡是AMD Radeon R9 Fury X,內存位寬4096bit,帶寬512GB/s。
另外還有HBM2,用在Tesla P100上,位寬也是4096bit,但帶寬達到了720GB/s。一般來說,當一個程序足夠優化的時候,IO就成了瓶頸。所以帶寬越大越好。否則塞不滿GPU的計算量,最終會拖慢整體速度。
顯存現在被分成GDDR系和HBM系,區別在於前者是舊東西,後者是新東西罷了。
不過這箇舊東西,看來短期內不會被新東西取代。因為HBM相對GDDR最大的優勢,在於超高的帶寬容量,和較小的封裝面積,然而第一個優勢必須頂級顯卡才有體現,後者對於桌面獨顯來說根本就是偽需求。而HBM天生的成本高的劣勢,導致了GDDR短期內很難淘汰。
要到多高的帶寬才叫高呢?Titan Xp GDDR5X 505G帶寬,Tesla P100 HBM2 720G帶寬,至少在NVIDIA看來,600G算是一個GDDR HBM的分界線。明年的GDDR6帶寬容量要翻倍,600G這條分界線可能還要往後移。
我們常見的中高端顯卡,GTX1080 320G, 1070 256G, 1060 192G, RX580 256G. 距離600G這條線都很遠,所以對於消費級顯卡瓶頸這一說還早。
真是心疼想要強行普及HBM的A卡。。。VEGA64帶寬480G安安分分用GDDR降成本多好,現在難產成本高售價高銷量低這是何苦。。。
是的,核心性能越強需要的顯存帶寬就越大。提高顯存帶寬可以通過增加位寬、提高顯存運行頻率、改進顯存類型來實現。增加位寬需要更多的顯存控制器,不僅佔用晶體管而且會提高核心的功耗。提高顯存運行頻率會增大顯存的功耗,也不是所有顯存都能在高頻下穩定運行。從成本考慮,不同型號的卡用合適的技術就行。目前只有高端卡里的少數幾款才需要用HBM或者GDR5X。
我來講個故事:
當年還是機械硬碟年代,SATA2的介面速率高達300MB/s,已經遠超機械硬碟的傳輸速率。
但硬碟介面依然從SATA2進化到了SATA3,介面速率達到了驚人的600MB/s。要知道,機械硬碟的傳輸速率可是只有100MB/s左右的,SATA3的介面速率可是它的6倍。那麼請問,要這麼多富餘幹什麼?現在,在這個固態硬碟走向普及的時代,這個問題可以解答了:這是為了給將來的升級鋪平道路。在現在看來,600MB還夠么?已經不夠了。現在主流的PCIE SSD,已經到了PCIE 4x,達到了驚人的2GB/s。所謂兵馬未動,糧草先行。哦不對,是核心未動,帶寬先行。有了充足的帶寬,各大廠商才有信心去研究下一代的技術,這是必備的基石。至於1080為什麼用的是GDDR5x,那就是老黃認為1080的介面不會稱為瓶頸,也就是說,現在的核心還不夠強,GDDR5x的帶寬已經足夠。
至於HBM2,說實話,個人認為,還沒必要這麼早普及。畢竟顯卡是一個整體,又不能換核心,在帶寬未到瓶頸之前,GDDR5x還是可以一用的。HBM和GDDR5X都是用來解決顯存帶寬不足的問題的。GDDR5頻率基本已經提升到了瓶頸(7GHz),再提升就要boom了。如果不提升頻率,怎麼辦呢?像農企290X一樣增加帶寬(比如512bit),那這樣內存控制器功耗成本都上去了。
GDDR5X使用16n prefetch,帶寬寬度根據廠商定,而不是像排名最高答案所說的64bit。GDDR5X降低了電壓提升了有效頻率,而且和已有的GDDR5介面是兼容的。相比於HBM來說,GDDR5X實在是便宜太多了,同時OEM可以自由添加更多的顯存。
HBM的優勢在於巨大的帶寬和能耗優勢。HBM1代大約14.6W就可以提供512G的帶寬,HBM2代的能耗比還會更高。但是HBM最大的問題是它所有的顯存棧都需要用一個專門的連接器(interposer)來連接GPU和顯存。這個Interposer算是一個晶元半成品吧,比起PCB來說成本簡直不知道高到哪裡去了,而且比如設計好了放四個stack那麼就只能放4個stack,你想再加顯存就只有重新設計一個hhh。這就是為什麼農企Fury X系列萬年4GB顯存。當然對於Tesla用戶來說,錢都不是問題,HBM當然是墜吼滴,對於普通用戶來說的話還是用GDDR5X吧。。。
遇到瓶頸了吧,看看晶元上顯存PHY的面積,佔了多大了,顯存功耗佔了多大部分了,AN兩家這幾代桌面GPU都開始利用DCC和部分TBR特性來節約顯存帶寬,這些信號都在說明這一點。
看應用,比如ETH挖礦吧,NVIDIA TITAN Xp是30MH/s,核心稍弱卻配備了HBM2的Tesla P100可以達到60MH/s。這就是顯存的瓶頸。
顯卡帶寬早就到了瓶頸,現在不過是選擇哪條道路而已
HBM系列顯存能耗比較高,節約pcb面積,但成本較高,產能不足,而且難以和之前的設計兼容,移植性差(說白了就是不能低成本同時兼容HBM和GDDR系列);GDDR5X(甚至包括明年的GDDR6)能耗比差,並不節約pcb面積,但產能相對較為充足,而且相對於之前的GDDR5兼容性好,易於無縫兼容升級(比如Pascal系列中的1080和1070,1070ti,一樣的核心系列(都是GP104系列),通過調整核心規模差別和顯存差別就可以輕鬆劃分產品線~
綜合來說,GDDR5X(6)易於用於主流級別顯卡,而HBM系列往往用於高端顯卡~
搬運一下:
JEDEC技術協會最新通過的HBM2與GDDR5X標準,分別是高階顯示卡與主流顯示卡市場的兩大生力軍。然而根據實際在NVIDIA GeForce 980Ti上針對GDDR5X頻寬進行測試的結果,GDDR5X的效能比起目前使用HBM的Radeon R9 Fury X還要來得優異。
由此預估,面對即將崛起的虛擬實境(VR)市場,GDDR5X也有機會發揮不錯的影響力。
據VR World報導,HBM2的容量與記憶體頻寬,可望從HBM的4GB/512Gbps提升到16GB/1Tbps。然而HBM2記憶體的低產量高價位,短期內勢必只能停留在Polaris、Pascal等高階市場。在價格低於500美元的顯示卡市場,GDDR5X可望在GDDR6出現前大放異彩。
GDDR5X是由美光(Micron)位於德國的Graphic DRAM設計中心所研發。除了作為顯示卡記憶體標準外,GDDR5X也可能出現在思科(Cisco)等廠商的高階網路交換器上。首代GDDR5X晶片擁有8Gbit/1GByte的容量,隨著產量增加,8/16 Gbit的晶片也有可能問世。
據JEDEC釋出標準,GDDR5X共可支援4GB、6GB、8GB、12GB、16GB等5種形式的記憶體配置。NVIDIA與超微(AMD)有可能在Maxwell與GCN的基礎上,利用新的記憶體配置繼續生產顯示晶片。
GDDR5X可達到每腳位10~14Gbps的傳輸速率,表理論上GDDR5X每32位元的記憶體介面,將可達到237.5Gbps的最大傳輸速率。如果拿配備GDDR5與GDDR5X的GeForce 980Ti顯示卡兩相比較,可以發現原始的頻寬為336.5Gbps,而GDDR5X的原型與製品則分別達到624Gbps與672Gbps的頻寬。
從測試結果也可發現,不論是原型或製品,GeForce 980 Ti GDDR5X的頻寬效能顯然已超越了目前市場上的頻寬霸主Radeon R9 Fury X。Radeon R9 Fury X使用了HBM記憶體及4096位元記憶體控制器,但其512Gbps的頻寬已不及GDDR5X顯示卡。
測試人員也透過超頻使Radeon R9 Fury X記憶體時脈提升到607MHz,並達到621.57Gbps的傳輸速度,但仍較GDDR5X顯示卡遜色。未來不論是虛擬實境、擴增實境(AR)以至於4K遊戲,都可藉由GDDR5X使GPU發揮出驚人效果。
來源:DIGITIMES
推薦閱讀:
※《G4560+GTX1050……GTA5》
※台式機顯卡安裝方式那麼爛為什麼沒有得到改良?
※絕地求生正式版硬體詳細測試 優化後顯卡CPU內存都該怎麼選