如何評價AMD新一代顯卡架構Vega（織女星）是否能幹翻老黃下一代Volta？

01-31

PPT看上去還行，4k畫質70fps了

再過幾年應該可以，畢竟A卡戰未來，農企驅動的優化空間還是很大的。

作者：AMD程序媛

鏈接：如何評價AMD織女星（Vega）新顯卡？ - AMD程序媛的回答 - 知乎

來源：知乎

著作權歸作者所有，轉載請聯繫作者獲得授權。

【關於Vega你不得不知道的五件事】

「期待一下Vega。」相信最近半年以來向AMD相關工作人員打探新顯卡情況的朋友聽到的都是這句話。儘管基於Vega這一全新架構的顯卡要在2017年上半年稍微晚些時候才會面世，但在剛剛結束的CES上，Vega還是揭開了些許面紗。今天就來耐心了解一下，關於Vega，你應該知道的五件事。

講真，Vega超快！
AMD上個月面向媒體朋友稍微展示了一下Vega性能，當時的展示遊戲是《DOOM》，4K解析度和Ultra畫質，而且還是Vulkan版本。遊戲運行十分流暢，幀率在60至70FPS之間浮動，最高達到了75FPS，大部分時間都在70+FPS，驚艷四座。
在AMD隨後的「New Horizon」活動中，展示了新CPU Ryzen搭載新顯卡Vega運行《Star Wars: Battlefront》的畫面，竟能以在4K解析度下超過60FPS的幀數流暢運行。
同時，在《Ashes of the Singularity 》的官方測試網站上一款設備ID為687F:C1的新卡曝光，性能測試結果幾乎碾壓GTX 1080。該設備ID被發現出現在了AMD的Vega顯卡展示內容《Doom》中，從而證實了687F:C1就是Vega 10。

在Vega 10最終面世前我們無法確定其性能，但目前從各種數據看來，Vega確實走在了顯卡技術的前沿，充滿競爭性。
恐怖的顯存
Vega的板載內存是變革性的。AMD當前的高端顯卡Radeon Fury系列已經為用戶帶來了前沿的高帶寬內存。Vega傳承了該特性並升級至下一代HBM2顯存，由全新高帶寬緩存控制器支持。由於初代HBM技術限制，Fury系列的板載內存只有4GB，如今HBM2的加持終於可以讓顯卡放飛自我，《Doom》演示過程中蛛絲馬跡表示新顯卡高速緩存將達8GB。
HBM只是個開始。AMD精心打造的Vega高帶寬緩存架構在維持性能穩定的前提下，推動內存設計向前邁出了一大步。HB緩存替換了傳統GPU中的幀緩存, 而HB緩存提供了對數據流的更細粒度的控制，並且支持多達 512 兆兆位元組——不是千兆位元組，兆兆位元組——的虛擬地址空間。Vega的HBM設計可以擴展顯卡內存，將板載內存升級為更多樣化的內存系統，能夠同時處理多個內存資源。為超高速HBM設計的全新顯存控制器架構有助於顯卡性能發揮到極致。
為了進一步展示性能，AMD演示了一間起居室的照片級渲染畫面。600GB的場景通常需要花費數小時去渲染，但在Vega和全新HBM2架構的結合下，幾分鐘內便渲染完成。甚至還可實時移動鏡頭去查看房間的角落，儘管有一絲緩慢，效果依然令人感到驚艷。

高帶寬緩存控制器的高效動態數據管理更可帶給玩家無與倫比的遊戲體驗。在優化後的《Witcher 3》和《Fallout 4》等大作中，當遊戲以4k解析度運行時，內存消耗會減少一半。越是精良的大作，內存和解析度需求越高，下一代遊戲將可以利用高帶寬顯存設計直接將大數據上傳至顯卡處理器，而不再需要手動處理。
高效的渲染管線
渲染場景是一個多步處理過程，顯卡在將信息傳遞給幾何引擎前會處理頂點著色器。如PC 遊戲《Deus Ex: Mankind Divided》中某些場景內包含2.2 億個多邊形，但是最終輸出的畫面其實只有 0.02 億個多邊形需要著色處理，明確哪些多邊形需要被渲染將能夠顯著降低渲染負荷。通過全新的可編程幾何渲染管線，Vega可加速識別玩家不可見的多邊形以節約幾何引擎的處理時間，使顯卡對遊戲的渲染更加高效。
Vega對信息的處理能力達到現有產品的兩倍，全新的「Intelligent Workgroup Distributor（智能工作組分發器）」從渲染管線的初始階段就開始提升任務負載平衡，該靈感來自於比PC開發者更為敏感的主機開發者。
下一代像素引擎
AMD多年來致力於減少顯存帶寬消耗，Vega延續了這一理念。Vega的下一代像素引擎所包含的繪製流分檔光柵器(draw-streaming binning rasterizer,簡稱 DSBR)協同高帶寬緩存控制器可提升顯卡性能並且達到節能目的，從而更高效的處理場景。在幾何引擎開始工作前，Vega可識別出無需被用戶看到的、不必要渲染的重疊像素，然後GPU會直接剔除這些像素，而非浪費時間去渲染。
全新Vega架構可使後端渲染單元直接訪問二級高速緩存，減少了清空緩存然後在需要的時候又從顯存中讀回的處理，同樣有助於延後式渲染技術的性能提升。
下一代計算單元
Vega架構引入了下一代計算引擎單元（NCU），可以支持每個周期 512 個 8 位計算，或者 256 個 16 位計算，又或者是 128 個 32 位計算。可以在單個FP32 ALU內處理一對FP16浮點操作，如果兼容性足夠的話，可以打包在一起作為FP32進行處理。儘管AMD對Vega的時鐘核心速度三緘其口，下一代NCU無疑為更高的GPU時鐘速度和時鐘周期內可處理的指令進行了優化。
繼續等待
我們已然可以從各方面曝光的信息窺探到Vega的強悍性能，但縱然是Radeon的骨灰級粉絲也需要繼續等待， AMD的Ryzen處理器已經蓄勢待發，Vega也不會遠了。
【銳VR原創文章，轉載須註明來源及連接】

1080的性能，300W+的功耗，1080ti的價格，Ttxp的核心規模。

volta大核心GV100已發布，把自家pascal都秒得渣都不剩，更別提還在努力戰1080系的vega了，心疼農企……。

農企終究還是實力不濟，噁心一下英特爾這種惡意懶政的對手可以，碰到老黃這樣強橫又努力的還是要撲街。

目前織女星的單個流處理器的性能縮了一倍，雖然核心頻率上來了，但由於核心處理能力的縮水，個人預計，這一代產品能打過GTX10系列都很難說，當然，他可以再通過大量堆積著色器數目，加壓，強大的功耗下，勉強打個平手，但N卡目前的GTX1050、1050TI工作頻率都在1.7-1.8G，而1060之上都是1.9G以上，看來無論是單核效率，還是頻率提升，還是功耗控制，A卡都完敗，A卡這一步攆上來，能與N卡的技術差半代，如果這一步走錯了，差的就更遠了……希望我的分析是錯的

nvidia 比你有天分的人還比你努力的真實寫照。

老黃還沒吃透DX12

猴年快過了，AMD以鴿的方式致敬雷軍