日立的「CMOS 退火」技術是怎樣的一種技術?利用該技術的半導體計算機是否能夠替代量子計算機?

日立製作所表示開發出了堪與「量子計算機媲美」的非馮·諾依曼型計算機用處理器。技術詳情已在於美國舊金山舉辦的國際半導體電路技術學會「2015 IEEE International Solid-State Circuits Conference(ISSCC)」(2月22日~26日)上發布(演講序號:24.3)。

其工作原理與加拿大D-Wave Systems公司推出的商用量子計算機相似。不過,D-Wave的系統使用只能在極低溫下工作、而且非常容易受雜訊干擾的超導元件,而日立的系統可以利用能在室溫下工作的成熟的半導體技術,因此容易實現系統的大規模化。日立已經試製出規模為D-Wave公司預定2015年投產的量子計算機約10倍的系統,並進行了工作演示。


謝邀。
終於有時間寫這個答案了。和我導師合作的京都大學科學家出席了這個會議,所以我聯繫他專門討論了一下CMOS退火。

先給結論,CMOS退火是一項非常了不起的研究。但CMOS退火不是量子過程,也不能替代量子計算機(沒有量子過程就不可能有量子計算功能)。但CMOS退火對解決部分組合優化問題很管用,這原本是Dwave擅長的領域。

最初看到這個新聞還是在知乎上被邀請。知乎用戶群對這些技術進步反應的確相當快。
我初讀新聞的時候也嚇了一大跳,還以為一夜之間就量子計算革命就到來了。我以為我馬上就能投入業界成為第一代量子演算法兼機器學習工程師了。後來發現我還是想多了。。

簡單對比一下CMOS退火和Dwave計算機的優劣。

CMOS退火有2萬個比特;最新的Dwave只有1024個比特。
CMOS退火室溫都能運行,穩定性極好;Dwave要屏蔽外界電磁場干擾,在20mK(零下273.13攝氏度)溫度下才能工作。
CMOS退火用成熟穩定的半導體技術,第一代就做到60nm工業級水平;Dwave還是只能用昂貴的超導環,需要冷卻到20mk才能正常工作,整個系統一千萬美金1台,還老出毛病。
CMOS退火隨機性來自SRAM和晶元外部環境;Dwave隨機性來自quantum fluctuation。

CMOS退火這種非馮·諾依曼型計算機用處理器在解決組合優化問題時,能耗比經典計算機低很多,但計算時間和經典計算機是一個量級的。Dwave在時間和能耗上表現都好很多。


伊辛模型的哈密頓量長這樣。


這是Dwave128比特晶元的示意圖。每一個黑點就是一個超導環,電流流向決定自旋取值+1/-1,連接i比特和j比特的黑線表示一個Jij。

這是Dwave128比特晶元的示意圖。每一個黑點就是一個超導環,電流流向決定自旋取值+1/-1,連接i比特和j比特的黑線表示一個Jij。
CMOS退火的晶元和Dwave一樣都用了伊辛模型(Ising Model),但是CMOS退火里比特間的耦合作用J只能取值+1/0/-1三個值,而且非常稀疏,幾乎是只有相鄰比特有穩定的耦合作用。所以,CMOS退火只能解決部分簡單的組合優化問題,對於機器學習和人工智慧而言,CMOS退火計算沒有太多實用價值的。
Dwave晶元的耦合要好的多,而且每一代性能都在提升,能應用的機器學習場景也越來越多。日本已經決定在東京建造世界上最強大的Dwave系統量子計算機。靠比Dwave公司更強大的人力財力和精密加工能力建造三維構造的Dwave晶元,比特耦合能力和量子比特數都會遠超Dwave公司的產品。

現在的量子演算法研究情況有點像很多年以前,寫好了程序要到去機房預約計算機才能運行。以後的環境應該會越來越好了,越來越多的科研人員有機會親自使用量子計算機。

前面解釋了CMOS退火的優劣,以及為什麼不能替代量子計算。

日立的「CMOS退火」技術是怎樣的一種技術?

這個問題上面的答案解釋的很詳細了。我在下文只做一下簡單的補充。

1)

量子退火(QA,Quantum Annealing):不同於經典模擬退火演算法利用熱波動來搜尋問題的最優解,量子退火演算法利用量子波動產生的量子隧穿效應來使演算法擺脫局部最優,而實現全局優化。量子退火就逆天了,清醒的銷售員在C城市時學會了量子隧穿,瞬移到了B城市去看看那邊可不可能是最優解,是的話就回去走B路線,不是的話繼續從C出發。

@薛矽 這個比喻有兩個問題,有點太勉強了。
i)我們搜索的是路徑,不是城市。
ii)量子退火是:一開始我們的銷售員處於n(~2^N)個態的疊加,是同時選擇了所有路徑疊加態。你可以設想這個銷售員有2^N個分身。每一個分身都處在一個路徑上,對應一個量子態。然後,系統開始幸運,高能量的分身一點點轉移到低能量態(每個分身的權重係數的演化是連續的)。到最後,所有的分身都匯聚到基態上,找到了最優化的解。
我們只有波函數,沒有具體的點,所以不是一個銷售員在一個路上。是無數個銷售員分布在每一條路上。


所謂的量子隧穿效應實際上說的是,銷售員的某個態可以躍過相鄰的高能量態到基態。
計算時間是:t~h/ΔE,h是普朗克常數。


2)為什麼量子計算和機器學習關聯緊密?
量子理論(Quantum Theory)是概率理論。是一中與自然界量子現象契合的概率模型。
這個概率模型和統計學習理論也是契合的。
量子理論這個重要的物理學理論為統計學習理論和自然界的量子物理現象打起了橋樑。
在這個框架下,兩個看起來毫不相干的領域有著深刻的聯繫,可以被統一描述。
現在我們能製造一台名叫Dwave的量子系統,這就完成了機器學習理論到物理世界的映射。
這是沒有量子過程的CMOS退火不可能辦到的。

基於量子邏輯門的量子計算機與大家熟知的計算機更為接近。
無非是經典計算機有與非門這種不可逆的邏輯門,而量子邏輯門全部都是可逆的(所以不能完成與非操作)。可逆計算帶來的一大優勢是接近0的能耗。量子計算機可以輕鬆突破散熱和能耗給經典計算機帶來的限制。
常見的量子邏輯門有:Toffoli Gate/Fredkin Gate/CNOT/...
由於量子態都是疊加態(邏輯0和邏輯1的任意疊加)。當我們有N個量子比特時,就能以經典計算機2^N倍的速度作邏輯門運算。Quantum Parallelism就是量子計算強大能力的主要來源。
這更是CMOS退火辦不到的。

最後,Dwave絕熱量子計算和量子邏輯門的標準量子計算是等價的。這個結論是我們最近幾年才知道的。
【Aharonov D, Van Dam W, Kempe J, et al. Adiabatic quantum computation is equivalent to standard quantum computation[J]. SIAM review, 2008, 50(4): 755-787.】

附送一個量子退火理論的講座:https://www.youtube.com/watch?v=OQ91L96YWCkfeature=youtu.be
演講者是西森教授,量子退火演算法的提出者。


3-27更:看到日報上的不少評論,我想有必要先介紹一下CMOS是什麼。半導體行業外的朋友們對CMOS的認知可能是買相機時所了解的相對於CCD的CMOS。同樣在知乎,CMOS這個tag下,也大多是關於相機的提問:CMOS - 話題精華。
此(相機)CMOS(感光元件)包涵於彼(半導體)CMOS(工藝製程)。CMOS全稱互補金屬氧化物半導體(Complementary Metal Oxide Semiconductor),通俗點說可以指一種製做集成電路(晶元)的製造工藝。我們現在這個時代所用的晶元大多就都是用CMOS工藝(製程)來設計生產製造的。
其實這件事有點像如何向我母親那一輩的人解釋「半導體」這個詞。我剛進大學的時候向母上大人彙報小的從此踏入了高(ban)大(zhuan)上(gong)的半導體行業。老媽的第一反應就是:「收音機行業?你報的不是微電子么?原來是修收音機啊。。。」 好吧,以上是我腦補的對話,不過他們那個時代的確是把半導體作為收音機的代稱。這就是一個很好的以一種材料/工藝代稱其某一單一產品的例子。
————————————————————原文如下————————————————————
【多圖預警】
坐等量子計算領域的專家 @Summer Clover大神回答的同時小弟拋磚引玉一下,供大家參考。

首先要說明的一點是:對是否已經有真正意義上的量子計算機這個問題目前依然是存在很大爭議的,也就是說連D-Wave是不是量子計算機都仍然不是定論。所以所謂「替代量子計算機」這樣的問法或多或少會受到質疑。

另外一方面,從量子計算機理論構想這一角度看,日立這次的工作是否能替代未來的量子計算機甚至僅僅只是競爭得過D-Wave也有討論的空間。
請看日本媒體對相關報道的吐槽:「標題黨的勝利「堪與量子計算機媲美」」。(目前大陸關於這項工作的網文應該是翻譯自日經技術在線的同一篇報道)


那日立的「CMOS退火」技術到底怎麼樣?
ISSCC2015 上的這篇文章絕對是有價值有水平的研究。
最主要的貢獻就在於,不僅硬體實現了退火演算法的功能,而且是應用已相當成熟,易於量產的CMOS製程。通俗的說就是在低成本、又不需嚴苛的外部條件下就有能力完成一件難度很高的事。

日立的「CMOS退火」技術具體是怎麼一回事呢?
以下借用24.3 20k-spin Ising Chip for Combinational Optim ization Problem with CMOS Annealing
這篇paper的圖表和Slides來做個基本介紹。

一、為什麼會有這種計算機
假設今天我們要解決這樣的一個問題:有一位銷售員要出差,需要去到下圖中小方框表示的那些城市,請問他如何安排自己的行程可以使總路程最短。

在您現在正在使用的經典馮諾依曼架構計算機中,這類問題的演算法一般是一步一步的用{if...else}之類進行分析,需要不斷的循環往複。那有沒有一種方法可以做並行計算來顯著得提高效率?

在您現在正在使用的經典馮諾依曼架構計算機中,這類問題的演算法一般是一步一步的用{if...else}之類進行分析,需要不斷的循環往複。那有沒有一種方法可以做並行計算來顯著得提高效率?
我們身處的大自然中,包括我們人類本身,相對於計算機來說都具有很多「自然而然」的現象。比如,一個被加熱的物體會「自然而然」地冷卻,達到一個平衡態而內能減為最小。又比如人類可以對著照片,「自然而然」地分辯小黑貓大黃狗。這些能力要經典計算機來實現的話都是極為複雜艱難的,於是科學家們想到了向自然界進行借鑒模仿

日立的科學家把它們形象的稱作「natural computing」。

日立的科學家把它們形象的稱作「natural computing」。
Reference[1]是IBM 2014年發表在Science上的神經網路晶元(具體可見IBM 發布新型 SyNAPSE 神經晶元,會對整個計算機乃至科技領域產生什麼影響? - 知乎用戶的回答)。IBM模擬建構了類似大腦中神經系統的架構來實現模式識別等方面的功能。
Reference[2]就是D-Wave System,和日立的這篇文章一樣,他們借鑒了電子自旋的易辛模型(Ising model)和退火演算法來實現最優化方面的功能。
下圖右邊表示傳統的計算架構,左邊是「natural computing」的架構思想。

下面這張圖即為這一含有spin(自旋模組)的Ising模型晶元在解決Combinational Optim ization Problem時應用CMOS Annealing(退火)演算法的基本架構與傳統計算機的比較。

下面這張圖即為這一含有spin(自旋模組)的Ising模型晶元在解決Combinational Optim ization Problem時應用CMOS Annealing(退火)演算法的基本架構與傳統計算機的比較。
(文題「20k-spin Ising Chip for Combinational Optim ization Problem with CMOS Annealing」)

二、那這一架構是怎麼運行的呢?
首先介紹幾種演算法:爬山演算法 ( Hill Climbing )、模擬退火(SA,Simulated Annealing)、量子退火(QA,Quantum Annealing)。
仍以銷售員的路線安排問題為例,稍作簡化:

爬山演算法 ( Hill Climbing ):一種簡單的貪心搜索演算法,該演算法每次從當前解的臨近解空間中選擇一個最優解作為當前解,直到達到一個局部最優解。就是說銷售員每在一個城市的時候都選擇去最近的相鄰城市,這個演算法的缺陷就在於很可能只能得到一個局部最優解。如在A點起始,最近的是C,然後去F,這樣的路線在局部(C路線)中是最短路線,但與先去B的路線相比就長多了,並沒有選到整體最優解。

模擬退火(SA,Simulated Annealing):爬山法是完完全全的貪心法,每次都鼠目寸光的選擇一個當前最優解,因此只能搜索到局部的最優值。模擬退火其實也是一種貪心演算法,但是它的搜索過程引入了隨機因素。模擬退火演算法以一定的概率來接受一個比當前解要差的解,因此有可能會跳出這個局部的最優解,達到全局的最優解。這就好比銷售員失戀了,在A城市的酒吧灌酒到天亮,在做第一個選擇時稀里糊塗得隨機選了B或C,這樣在這個選擇下就有一半的機會選到整體最優解。

量子退火(QA,Quantum Annealing):不同於經典模擬退火演算法利用熱波動來搜尋問題的最優解,量子退火演算法利用量子波動產生的量子隧穿效應來使演算法擺脫局部最優,而實現全局優化。
【極不準確比喻預警,勿信】量子退火就逆天了,清醒的銷售員在C城市時學會了量子隧穿,瞬移到了B城市去看看那邊可不可能是最優解,是的話就回去走B路線,不是的話繼續從C出發。(我的這個例子好奇怪,哈哈。詳情請移步如何用圈外人士能理解的文字解釋「量子退火」? - 物理學)
3-27更新:如之前所述,這部分的比喻真的太奇怪了,下面引用 @Summer Clover 在上面的回答中的描述以正視聽:

@薛矽 這個比喻有兩個問題,有點太勉強了。
i)我們搜索的是路徑,不是城市。
ii)量子退火是:一開始我們的銷售員處於n(~2^N)個態的疊加,是同時選擇了所有路徑疊加態。你可以設想這個銷售員有2^N個分身。每一個分身都處在一個路徑上,對應一個量子態。然後,系統開始幸運,高能量的分身一點點轉移到低能量態(每個分身的權重係數的演化是連續的)。到最後,所有的分身都匯聚到基態上,找到了最優化的解。
我們只有波函數,沒有具體的點,所以不是一個銷售員在一個路上。是無數個銷售員分布在每一條路上。

CMOS退火可以說是介於模擬退火與量子退火之間的一種方法:一方面和模擬退火一樣利用隨機數避開局部最優解,一方面和量子退火一樣不是一條路走到黑(雖然沒有瞬間移動的技能)。
這又是怎麼回事呢?

三、架構實現

研究表明,伊辛模型可以在要素數量增加的情況下高效解決組合優化問題。伊辛模型的每個自旋可實現「向上」、「向下」兩種狀態。各個自旋的狀態取決於伊辛模型的總能量。如果僅考慮最簡單的、只有兩個自旋的伊辛模型,則自旋方向相反時能量低,自旋方向相同時能量高。
對於更複雜的模型,各個自旋會受到上下及前後左右的周圍的自旋的影響,改變1個自旋的方向後,其他自旋的方向也會隨之改變,使整個模型的能量發生變化。研究表明,在多個條件下計算模型總能量最低時各個自旋的方向等價於大多數的組合優化問題。
在理想的伊辛模型下,即使不用人工計算最優的自旋方向,大自然——物理法則也會給出答案。這是因為大自然總是趨向於系統能量最低的狀態。因此,只要構建出將組合優化問題翻譯成伊辛模型問題,然後通過物理實驗求出伊辛模型的最優解,再將結果翻譯回去的系統,就能得到用來解決組合優化問題的新型計算機。

如上圖所示的許多個藍點σ就是每一個spin(自旋點),它們有「上」「下」兩種狀態方向,每一個點相鄰的四個spin的狀態如果改變都會影響中間這一點的自旋狀態。對整個系統來說當系統能量最低時穩定,也就是全局最優解的產生。
如下圖中σ5與σ2、σ4、σ6、σ8通過係數因子J25、J45、J58、J56相互影響變化狀態。
這樣每一次都會有總數的1/8的spin同時更新,大大減少運行時間。


拓撲結構如下圖所示:3D的晶格結構被平面化成二位的記憶體陣列。


演算法介紹部分中提到的隨機因素的引入如下圖所示:應用多數決(粉色模塊)和條件反置(黃色模塊)引入隨機參數。
如果+1(相對於memory中的值0)的個數多於-1(相對於memory中的值1),spin的下一個值變為+1,反之亦然。


具體電路:

另外值得一提的是,日立應用SRAM在供電電壓改變的情況下會出現錯誤數值的特性,降低VDD至0.7V產生誤差數從而不時地隨機的改變系統的能量狀態,避免陷入局部最優的死胡同。


四、量測結果
在解決最大割的應用中,右圖顯示在5ms(50,0,000次收斂)後測試字母初露倪端,在10ms(1,000,000次收斂)後測試字母清晰可見。
左圖顯示在不斷變化供電電壓(從a、c的1V降到b、d的0.7V後重新迭代收斂),測試字母越來越清晰,越來越接近全局最優解。

與傳統計算機的比較(這裡作者是在解同樣應用問題的情況下與由1.87 GHz 10 W/core的Core i5組成的系統上run相似的「SG3」演算法作比較得到的結果):

與傳統計算機的比較(這裡作者是在解同樣應用問題的情況下與由1.87 GHz 10 W/core的Core i5組成的系統上run相似的「SG3」演算法作比較得到的結果):
極大地提高了能耗效率。

與D-Wave的比較:CMOS製程在應用溫度、能耗、可款擴展性方面的優勢盡顯。但是與基於量子退火的D-Wave相比速度的差距確令人懷疑。另外存疑的一點是,SRAM在供電電壓改變的情況下出現錯誤數值這一特性在多大程度能被很好的控制。

與D-Wave的比較:CMOS製程在應用溫度、能耗、可款擴展性方面的優勢盡顯。但是與基於量子退火的D-Wave相比速度的差距確令人懷疑。另外存疑的一點是,SRAM在供電電壓改變的情況下出現錯誤數值這一特性在多大程度能被很好的控制。

最後po一張含20K個spin的晶元的玉照:

最後po一張含20K個spin的晶元的玉照:


如果問利用該技術的半導體計算機是否能夠替代傳統計算機?
答案是不會,各司其職。這和量子計算機、類神經計算機一樣都是在大量數據的並行處理方面(這點可能不太準確)有優勢,但在一些日常的一般應用中甚至會比傳統計算機慢很多,術業有專攻
比如日立的這款晶元可應用的場景舉例:

這裡主要提到的都是物聯網方面的應用,因為這篇paper被分到了Session 24: Secure, Efficient Circuits for IoT(Internet of Things),這也是很有意思的一件事。

這裡主要提到的都是物聯網方面的應用,因為這篇paper被分到了Session 24: Secure, Efficient Circuits for IoT(Internet of Things),這也是很有意思的一件事。

感謝閱讀,如有錯誤之處,懇請指正:)

ps:
國內在量子信息領域有很高的研究水平,中科大的郭光燦院士、潘建偉院士都是世界級的領域內的大牛。
知乎上量子計算相關的討論很多,趁機說一點感想。量子計算機不僅是聽起來看起來相當高大上,而且是真的高大上,以至於一直沒有實體機器的實現。如果有對這個研究方向感興趣的知友建議先找機會多接觸,真正地了解一下現狀。如果真的感興趣做研究那真的是好事。這個方向適合搞科研,好發文章,但並不太適合就業。因為大學的時候做過一年多量子電線方面的大學生創新實驗感受很深,有一位學長通過老師和科大的合作去了院士組裡跟著做,本科就有了Science還是Nature的發表(好像不是一作),後來也順利進了那邊的重點實驗室。但是同期一起做這個方面的同學後來都沒有選擇繼續深入發展。


推薦閱讀:

TAG:計算機 | 半導體 | 量子計算理論 | CMOS | 量子計算機 |