光子晶元橫空出世,28 歲 MIT 中國青年科學家直取 AI 算力霸業!AI 晶元賽局勝負未定 | 獨家
英國牛津大學在 2017 年發表了用於計算的光子晶元的研發成果,其研究人員使用了特殊的相變材料與集成光路,模擬人腦的神經突觸作用,設計「光子突觸」,其理論運行速度是人腦的千倍。
實際上,麻省理工學院的研究團隊與合作研究者也有類似的發現,他們在更早的 2016 年提出了使用光子代替電子為理論基礎的計算晶元架構,由於光和透鏡的交互作用過程本身就是一種複雜的計算:傅立葉變換——利用這個原理,並使用多光束干涉技術,就可讓相關係尋反應所需要的計算結果。而這種晶元架構就被該研究團隊稱為可程序設計納米光子處理器。
2017 年 6 月,麻省理工學院研究團隊針對可程序設計納米光子處理器提出了一份論文,並且發表在《自然-光子》雜誌上。該論文的第一作者及通訊作者,出生在杭州的沈亦晨目前為 Lightelligence 的聯合創始人兼 CEO,並且是《麻省理工科技評論》所評選出來的 2017年 35 名 35 歲以下中國科技創新青年之一。
光子計算在處理一些 AI 演算法時有獨特的優勢
圖丨2017 年《麻省理工科技評論》中國區「35 歲以下科技創新 35 人」入選者、Lightelligence 的聯合創始人兼 CEO沈亦晨
Lightelligence 目前在沈亦晨的帶領之下,全力研發光學晶元的相關技術,包含晶元設計、核心演算法、傳輸、周邊等,欲打造一個完整的光學計算生態。由於 Lightelligence 研發的技術將可能徹底改變計算的生態,因此獲得高度關注,其中包括將雲端計算視為核心發展項目的百度,以及多位美國半導體行業高管,都因為看好光子晶元的未來性,而成為Lightelligence的早期投資人。
沈亦晨對 DT 君表示,由於其在麻省理工學院博士班的科研項目就是以納米光子為主,剛好在 2015 年時,AI 應用快速起飛。眾所周知,除了數據以外,硬體對 AI 的應用也是非常重要,所以開始有了把光子應用在計算環境中的構想。
但為何 2015 年之前沒有人想過要把光子效應用來進行神經網路的計算呢?沈亦晨表示,這是因為過去神經網路計算並不流行,而傳統的邏輯計算並不是光子計算最擅長之處。
事實上,光子晶元或許將會是未來最適合用來作為 AI 計算的硬體架構,這是因為光的特性先天適合線性計算(AI 計算里最重要的部分),這包含了高維度的並行計算。相對的,雖然量子計算近來也因為 AI 而受到關注,但量子計算還是比較偏向擅長解碼或搜索的領域,另外在量產的生態上也還不太成熟,但潛力卻不容小覷。
從傳輸走向計算,光子晶元將成終極計算解決方案?
從 2006 年開始,英特爾推出首款標準 CMOS 工藝的電子混合硅激光器之後,電和光這兩個截然不同的物理現象終於成功被湊在一起。往後數年,基於此技術的超高帶寬光學傳輸架構更成為高性能數據中心的最愛,藉此有效降低了大量數據傳輸造成的系統瓶頸。
2015 年,IBM 研究人員,發表了針對光子計算的新實驗性技術,通過把硅光子數組集成到與 CPU 相同的封裝尺寸中。硅光子技術的問題一直在於晶元的光學介面,不過 IBM 的光子解決方案能被應用於系統單晶元 (SoC),以廉價的標準連接器 (edge connector) 在晶元之間傳輸光,或是只要將 CMOS 晶元邊緣接在一起就能進行晶元對晶元的通訊。
這些光子晶元的發展主要是作為解決傳統晶元與晶元之間,或晶元與存儲系統之間的互連問題。而憑藉集成度高的光子晶元的發明,取代了過去龐大複雜的光傳輸架構,且速度能更快,延遲更低。
然而,真正把「光子」帶往計算領域,甚至架構成「光子晶元」的概念,卻是近兩年才逐漸被發掘出來。
由於半導體晶元技術雖依靠新應用與演算法的整合,能做到的事情也越來越多,但實際上晶元架構本身還是基於同樣的邏輯之下,且受限於半導體工藝,計算能力、規模以及功耗、成本形成難以均衡的四角關係。
這時,業界也開始積極尋找能突破現況的新計算技術。GPGPU、神經網路晶元、DSP、FPGA 都在不同的時期被提出來,擅長解決特定應用計算領域,但這些晶元並沒有解決根本的問題,也就是其基於半導體結構所面臨的物理特性限制。
圖丨光子突觸作用原理
由 AI 所帶起的計算需求不斷膨脹,促進了處理架構持續推陳出新,譬如英特爾未來將結合 CPU 與 FPGA 計算能力,藉以應對更複雜的應用情境;英偉達則是在其最新一代的 GPU 方案上大幅強化推理性能。除此之外,亦有不少希望能夠針對特定計算推出更適合的新架構,比如說類神經網路晶元 (NPU)、量子計算機 (Quantum computing),以及最新的計算概念:基於光子迴路 (Photonic Circuits) 的計算架構。
實際上,「光」被使用在計算環境中已經有超過數十年的歷史,過去主要用以在不同晶元或存儲設備間傳輸數據之用,而因為相關的傳輸技術成本太高,且必須搭配昂貴的周邊才能顯現出其效益,也因此,「光」的傳輸從沒有被普及到消費市場,導致我們對這個事實沒有太明確的認知。
然而,計算則是另一層次的問題。
圖丨SMART Photonics的光子晶元
用很簡單的概念解釋光子計算晶元,就是在晶元上使用了無數個光學開關器,作用就類似半導體晶元中的邏輯柵,利用不同波長,相位和強度的光線組合,在複雜的反射鏡、濾波器以及稜鏡結構所組成的數組中進行信息處理。
硅光子和微電子一樣,都是基於硅材料的半導體架構。而硅作為光學通信傳輸方面的應用已經相當普及,由於光的快速反應和並行特性,能瞬間傳輸大量數據,因此被普遍應用在數據中心的伺服器上。也因為光子傳輸過程穩定,並行能力強,且糾錯設計相對簡單,傳輸和轉換所需要的能量極小,所以採用光子計算的架構理論上可以做到相對低的功耗表現。其次,光子晶元理論上也能做到規模極小的應用上,比如說移動設備中。
光子晶元可沿用目前成熟的半導體工藝技術,而目前仍處於實驗階段的光子晶元僅需要老舊的微米級工藝就可達到大幅超越既有半導體晶元的計算能力,也因此未來工藝微縮空間極大。而憑藉晶元密度的增加,性能還能大幅成長,甚至有機會徹底改寫摩爾定律的限制。
沿用 CMOS 工藝是光子計算最大優勢,但目標非取代傳統半導體計算
圖丨CMOS
沈亦晨表示,由於光子晶元基本上還是以目前的 CMOS 製造工藝為基礎,相對於量子計算使用的特殊工藝,在成本或量產技術方面都要更有優勢,雖然目前實驗室中的光子晶元在密度上還比不過傳統半導體晶元,但已經比量子晶元好很多了。
而光子晶元的效能取決於架構和演算法,比如說同時使用多少路不同波長的光來進行組合,或者是在晶元中使用的光學信號的帶寬,以及光電轉換時的瓶頸,但是單從光的物理特性上來看,在合適的演算法上要做到傳統半導體晶元的百倍速度是不會有太大的問題的。
當然,理論上光子晶元可以做到規模很大,也可以做到很小,但因為光不適合做非線性運算,另外光晶元的集成度和尺寸還是會有一定的規範,要完全取代半導體晶元還是有很大的難度。
從晶元、演算法到周邊的生態正在發展中
沈亦晨強調,目前 Lightelligence 的光子晶元發展已經完成實驗室階段的展示,在演算法、匯流排以及存儲方面都有相對應的設計正在進行,當然,計算晶元最重要的還是生態,這點也需要更多科研機構和公司加入到擴展光學計算這一領域來共同建立。
因為主力產品是晶元,所以核心部分在於演算法和硬體的結合,以及相對應的晶元指令以及編譯程序,而 Lightelligence 的工作就是要讓開發出來的晶元可以應用到目前市場上流行的框架中,比如說 TensorFlow、Caffe 等。
另外,由於光子計算在傳輸或者是存儲有其特殊性, Lightelligence 也在開發相對應的周邊設計。當然,沿用目前的存儲系統雖可加快落地商用速度,但可能就會限制光子計算的性能表現,因此這部分未來還是會以搭配針對光子計算優化的設計為目標,才更能凸顯光子計算的整體優勢。
如今 Lightelligence 團隊正努力改善光子計算的相關生態,目前當然還不成熟,不過業界對於高性能計算,甚至更好的神經網路計算架構有著非常高的期待,相信其光子計算架構落地之後,可以大大加速整體 AI 計算生態的變革。
沈亦晨表示,不論是特定用途,或者是針對通用計算能力,這個都會是晶元架構發展的不同過程的選擇。Lightelligence首先還是會以技術或應用場景比較成熟的光子晶元應用著手,然後再逐步去擴大可應用的範圍。同時也在努力開發光子晶元前後端的技術,為未來不同的計算場景進行更好的適配。
沈亦晨強調,總體來講,在實現光子計算的路上還有很多重大的工程改進需要完成,但和過去的種種光子計算的嘗試相比,現在可能是最好的時機,也是最接近實現的一次。
推薦閱讀: