DRAM會怎樣發展? | 半導體行業觀察

來源:本文由公眾號 半導體行業觀察(ID:icbank)翻譯自semiengineering,作者Kevin Fogarty,謝謝。

如果人類創造了一個真正有自我意識的人工智慧,那麼等待數據到達可能會讓它倍感沮喪。

過去二十年來,基於 DRAM 的計算機內存的存取帶寬已經提升了 20 倍,容量增長了 128 倍。但延遲表現僅有 1.3 倍的提升,卡內基梅隆大學的研究者 Kevin Chang 如是說,他提出了一種用於解決該問題的新型數據通路。

現代計算機需要大量高速度、高容量的內存才能保證持續運轉,尤其是工作重心是內存資料庫、數據密集型分析以及越來越多的機器學習和深度神經網路訓練功能的數據中心伺服器。儘管研究人員已經在尋找更好、更快的替代技術上努力了很多年,但在性能優先的任務上,DRAM 仍舊是人們普遍採用的選擇。

這有助於解釋今年的 DRAM 銷量激增,儘管據 IC Insights 報告稱供應有限讓其平均售價增長了 74%。售價激增讓 DRAM 市場收入達到了創紀錄的 720 億美元,幫助將 IC 市場的總收入推升了 22%。據這份 IC Insights 報告說,如果沒有來自 DRAM 價格的額外增長(過去 12 個月增長了 111%),那麼 2017 年整個 IC 市場的增長將只能達到 9%,相比而言 2016 年僅有 4%。

對於 DRAM 這樣一個很多人都想替代的成熟技術而言(因為它的速度達不到處理器一樣快),這個數字確認驚人。當前或未來有望替代 DRAM 的技術有很多,但專家們似乎認為這些技術還無法替代 DRAM 的性價比優勢。就算用上 DRAM 技術上規劃的改進方案以及 HBM2 和 Hybrid Memory Cube 等新型 DRAM 架構,DRAM 和 CPU 之間的速度差距依然還是存在。

Rambus 的系統與解決方案副總裁和傑出發明家 Steven Woo 在 CTO 辦公室中說,來自 JEDEC 的下一代 DRAM 規格 DDR5 的密度和帶寬都是 DDR4 的 2 倍,可能能夠帶來一些提速。

對於需要密集計算而且對時間敏感的金融技術應用以及其它高端分析、HPC 和超級計算應用而言,這將會非常重要——尤其是當與專用加速器結合起來時。

Woo 說:「對更高內存帶寬和更大內存容量的需求是顯然存在的,但 DDR5 本身並不足以滿足這些需求,我們也不清楚其它哪些技術可能會取得成功。我們已經看到很多處理過程(比如加密貨幣挖礦和神經網路訓練)正從傳統的 x86 處理器向 GPU 和專用晶元遷移,或者對架構進行一些修改,讓數據中心中的處理更靠近數據的存儲位置,就像邊緣計算或霧計算。」

圖 1:新標準的引入;來自 Cadence

據 Babblabs 公司 CEO 兼斯坦福大學 System X 的戰略顧問 Chris Rowen 說,對於在神經網路上訓練機器學習應用而言,GPU 顯然最受歡迎的,但晶元製造商和系統製造商也在實驗一些稍微成熟的技術,比如 GDDR5,這是一種為遊戲機、顯卡和 HPC 開發的同步圖形 RAM,英偉達也正是這麼使用它的。

圖 2:內存在晶元層次結構中的位置;來自 Rambus

由 SK 海力士和三星製造的 HBM2 將一些高速 DRAM 晶元放在了增加了一些邏輯處理的層級以及提供了到處理器的高速數據鏈路的 interposer 之上,從而讓內存與處理器之間的距離比 GDDR5 的設計更近。HBM2 是高速度至關重要的 2.5D 封裝中的一項關鍵元素。HBM2 是一項與 Hybrid Memory Cube 相競爭的 JEDEC 標準。Hybrid Memory Cube 是由 IBM 和美光開發的,使用了過硅通孔(TSV)來將不同的內存層連接到基礎邏輯層。

應用硅光子學的光學連接(optical connection)也能實現加速。到目前維持,大多數硅光子學應用都在數據中心中的伺服器機架和存儲之間以及高速網路連接設備內部。業內專家預計這種技術將會在未來幾年裡向離處理器更近的位置遷移,尤其是當其封裝技術得到完全驗證並且設計流程將這項技術包含進來之後。光學方法的優勢是發熱很慢而且速度非常快,但光波還是要在轉換成電信號之後才能存儲和處理數據。

另外還有 Gen-Z、CCIX、OpenCAPI 等新型互連標準,也有 ReRAM、英特爾的相變 3D Xpoint、 3D NAND 和磁相變 MRAM 等新型內存類型。

NVDIMM 速度更慢但容量更大,增加電池或超級電容可以實現非易失性,從而讓它們可以使用更低的功耗緩存比普通 DRAM 更多的數據,並且還能保證它們在斷電時不會丟失交易數據。據八月份來自 Transparency Market Research 的一份報告稱,支持 NVDIMM 的晶元製造商包括美光和 Rambus,預計其銷售額將會從 2017 年的 7260 萬美元增長到 2025 年的 1.84 億美元。

選擇這麼多,可能會讓人困惑,但針對機器學習或大規模內存資料庫或視頻流來調整內存性能會讓選擇更輕鬆一些,因為其中每種任務都有不同的瓶頸。Rowen 說:「實現帶寬增長有一些主流的選擇——DDR3、DDR4、DDR5,但你也可以嘗試其它選擇,從而讓內存帶寬滿足你想做的事情。」

Rowen 說,對於有意願編寫直接控制 NAND 內存的代碼的人來說,整個問題可能還會更簡單;而如果是鼓搗協議和介面層,讓 NAND 看起來就像是硬碟並且掩蓋在上面寫入數據的難度,那就可能會更加困難。「有了低成本、容量和可用性,我認為在讓快閃記憶體存儲包含越來越多存儲層次上存在很多機會。」

冷卻 DRAM

Rambus 的內存與介面部門的首席科學家 Craig Hampel 說,每一種內存架構都有自己的優勢,但它們都至少有一個其它每一種集成電路都有的缺點:發熱。如果你能可靠地排出熱量,你就可以將內存、處理器、圖形協處理器和內存遠遠更加緊密地堆積到一起,然後可以在節省出的空間中放入更多伺服器,並且還能通過減少內存與系統其它組件之間的延遲來提升性能。

液體冷卻是讓絕緣礦物油流經組件的冷卻方法。據 IEEE Spectrum 2014 年的一篇文章稱,液體冷卻讓香港的比特幣挖礦公司 Asicminer 的 HPC 集群的冷卻成本降低了 97%,並且還減少了 90% 的空間需求。

自 2015 年以來,Rambus 就一直在與微軟合作開發用於量子計算的內存,這是微軟開發拓撲量子計算機工作的一部分。因為量子處理器只能在超低溫環境下運行(低於 -292℉/-180℃/93.15K),所以 Rambus 正為該項目測試的 DRAM 也需要在這樣的環境下工作。Rambus 在 4 月份時擴展了該項目,那時候 Hampel 說該公司已經確信寒冷能帶來重大的性能增益。

圖 3:低溫計算和存儲;來自 Rambus

比如,當 CMOS 足夠冷時,CMOS 晶元的數據泄露(data leak)就會完全停止。幾乎就會變成非易失的。它的性能會增長,能讓內存的速度趕上處理器的速度,從而消除 IC 行業內一大最頑固的瓶頸。在 4K 到 7K 這樣極端低溫的環境下,線材將變成超導體,讓晶元僅需非常少的能量就能實現長距離通信。

低溫系統還有額外的優勢。比起空調製冷,低溫系統能從堆疊的內存晶元中抽取出更多熱量,從而可實現更大的堆疊(或其它組裝方式)密度,實現更高效的協作。Hampel 說:「抽取熱量讓你能將伺服器機架的大小減小多達 70%,這意味著數據中心每立方英尺的密度增大了。這讓它們更容易維護,也可以更容易地將它們放在之前無法到達的地方。」

更重要的是,如果在處理器層面上實現的效率提升與數據中心其它地方的提升基本一致,那麼低溫系統可以讓現有的數據中心更有成本效益和實現更高效的計算,從而可以減少對更多數據中心的需求。

而且不需要非常冷就可以收穫其中大多數效益;將內存冷卻到 77K(-321℉/-196℃)就能得到大多數效益了。

Hampel 說:「液氮很便宜——每加侖幾十美分,而且在達到大約 4 K 的超級冷之前,成本上漲其實也並不快。降到50K 左右其實並不貴。」

接近處理器

據 Marvell 存儲部門總監 Jeroen Dorgelo 說,超低溫冷卻可以延長數據中心中 DRAM 的壽命,但隨著行業從 hyperscale 規模向 zettascale 規模演進,已有的任何晶元或標準都無法應付這樣的數據流。他說,DRAM 雖快但功率需求大。NAND 不夠快,不適合擴展,而大多數前沿的內存(3D XPoint、MRAM、ReRAM)也還無法充分地擴展。

但是大多數數據中心還沒有處理好變得比現在遠遠更加分散式的需求。據 Marvell 的連接、存儲和基礎設施業務部網路連接 CTO Yaniv Kopelman 說,分散式有助於減少遠距離發送給處理器的數據的量,同時可將大多數繁重的計算工作留在數據中心。

IDC 的數據中心硬體分析師 Shane Rau 說,社交網路、物聯網和幾乎其它每個地方的數據所帶來的壓力正迫使數據中心蔓延擴展——在全國各地建立兩三個大規模數據中心,而不是在單一一個地方建一個超大規模數據中心。

Rau 說:「規模確實不一樣,但問題的關鍵仍然是延遲。比如說,如果我旁邊就有一個數據中心,我就不需要將我的數據移動太遠距離,而且我可以在我的筆記本電腦上完成一些處理,更多的處理則在本地數據中心中進行,所以在數據到達它要到達的位置時已經經過一些處理了。很多人在談將處理工作放到存儲的位置是為了平衡不同設備基礎上的瓶頸。現在,規模問題更多是關於讓數據中心在邊緣完成一些工作,即數據的產生位置和數據的最終去處之間。」

原文鏈接:semiengineering.com/pus

今天是《半導體行業觀察》為您分享的第1490期內容,歡迎關注。

Reading

推薦閱讀(點擊文章標題,直接閱讀)

蒸發上千億 解讀大立光股價溜滑梯之謎

功率半導體,大漲價下的國產替代之路

Fan-out 或TSV?先進封裝選哪個!


推薦閱讀:

Kudu:一個融合低延遲寫入和高性能分析的存儲系統
為什麼以色列的網路安全,存儲方面這麼有競爭力?
家庭裝修超六類、七類網線一般買哪些品牌?
國政通是一家什麼樣的公司?
把理論上存在的硬碟加起來能容納包含所有圍棋可能的棋局嗎?

TAG:数据存储技术 | 半导体 | 半导体产业 |