變形金剛前傳:打造硅基大腦

這團光怪陸離的漩渦反映的是恆河猴的神經結構,莫德哈從中汲取設計晶元的靈感。漩渦邊緣的縮寫標示的是恆河猴的獨立腦區。圖片來源:《發現》雜誌

得知那條將改變自己一生命運的消息的那天,17歲的德爾門德拉·莫德哈(Dharmendra Modha)正在孟買的一家醫院裡,帶領一幫工人刮除鐵椅子上的油漆。他很高興能擁有這份工作,因為它能保證穩定的收入,也能保證安全——在1986年的孟買,一位貧窮少年切合實際的最大追求不過如此。

莫德哈的母親在午飯後不久,把話傳到了他工作的地方:全國統一大學入學考試的成績下來了。似乎出了一些問題,因為家裡收到了一封令人費解的電報。

莫德哈的分數不僅令他在印度人口最密集的城市榮登榜首,他的數學、物理和化學成績在擁有一億人口的馬哈拉施特拉邦也都勇拔頭籌。他能否前往學校去協調一下?

當時的莫德哈想像不到,那封電報對他的未來有何意義。他雙親的學業都止於11年級,親戚中上過大學的人數,一隻手便數得過來。

然而這些年來,當他沿著考試成績鋪就的道路,先是求學於印度最具聲望的理工學府之一,繼而進入加利福尼亞州聖何塞市的IBM阿爾瑪登研究中心,在計算機科學領域取得事業上的成功,胸中的抱負也經歷了一番風起雲湧,莫德哈早已遠非昔日可比。

近日,這位長著黑色濃眉、留著短髮、帶著眼鏡的小個子工程師,坐在美國矽谷的辦公室里,講述了他改變計算領域未來的願景。「我們的任務很明確,」已經44歲的莫德哈拿著一枚有一塊金色方框的矩形電路板說道。

「我們要讓這種晶元無處不在——每一個角落,每一樣物體中。我們要讓它們成為世界不可或缺的一部分。」

傳統的晶元是將成套小型電子模塊放在一塊小板片上,被計算機用來執行操作。它們往往含有幾百萬條既能夠編碼並存儲信息,也能夠執行程序指令的微型電路。

莫德哈的晶元功能與此相同,卻相當節能,而且根據設計,由這種晶元構成的計算機能夠處理的數據量將遠超傳統計算機。莫德哈展望出一種以這種新型晶元為關鍵核心的全新計算模式,其計算能力將令現存的任何機器望塵莫及。這種計算模式的模仿對象,正是令當年孟買那位窮苦勞工走向技術革新的重大要塞之一的神奇造物:人腦。

求問神經學

人腦消耗的能量大概相當於一枚20瓦的燈泡——這比一台執行人腦級別運算的計算機節省了十億倍。它又是那麼地緊湊,能夠裝進一隻兩升的汽水瓶里。然而,這一團糊狀的有機物能夠完成的事情,是任何一台現代計算機都無法做到的。

當然,在執行預先編程的計算時,計算機優勢明顯,比如生成工資單,或者為登月艙計算抵達月球上某個特定地點所要採用的路線。可是若論及從不熟悉的景象、聲音、氣味和事件中領悟到意義,以及迅速理解它們之間的關聯,即便最先進的計算機也無法與大腦相提並論。

也沒有機器能夠匹敵人腦從經驗中學習以及根據記憶預測未來的能力。

5年前,莫德哈意識到,如果世界上最優秀的工程師採用舊的方法上下求索數十載,仍舊無法造出能效及智力可與人腦相比的機器,他們也許就永遠都做不到了。

於是他拋棄了過去60年來指導晶元設計和軟體開發的許多原則,轉而求助於神經學文獻。說不定理解腦的不同組件及其互相配合的方式,能夠幫助他建造更加聰明、更加節能的硅基機器。

莫德哈的努力正在換來回報。他設計的新型晶元包含的硅基原件,粗略地模仿了碳基腦細胞的物理分布以及之間的連接。莫德哈相信,他的晶元可以用來建造人腦規模的認知計算系統,而能耗只比人腦高100倍。這樣的系統將比如今的計算機節能一千萬倍。

莫德哈的團隊已經演示了一些基礎的功能。他們開發的晶元能夠學會玩電子遊戲《彈跳小球》,而無需程序員明確告知該如何做。在這個遊戲里,玩家需要移動屏幕底端的一根長條,準確預測出小球彈起的角度。它們還能夠辨識實驗室助理用電子筆在平板上潦草寫下的阿拉伯數字0至9。

當然,已經有很多工程師實現了這樣的壯舉——而且令人印象更加深刻。開發演算法使計算機根據經驗發展出新行為的努力,形成了一門名為機器學習的分支專業。這樣的機器已經在國際象棋和智力競賽節目《危險邊緣》中擊敗了世界上最聰明的頭腦!

雖然在教會計算機執行有著明確參數的特定任務,比如側向泊車或者在百科全書里尋找冷門問題的答案等方面,機器學習理論學家已經取得了進展,但他們的程序還不能讓計算機在完全沒有預設的情況下形成概念。

莫德哈希望,他的節能晶元能夠帶來變化。他說:「現代計算機最初被設計用來解決3類基礎問題:商業應用,比如記賬;科學,比如核物理模擬;還有政府項目,比如社會保險。」

另一方面,大腦則經歷了演化的嚴酷歷練,能夠迅速理解周圍的世界,並依據其結論採取行動。「它能夠在大草原上的一片嘈雜之中分辨出徘徊的獵食者,並不需要被告知該尋找什麼。它並沒有被編程,而是學會了逃跑和避開獅子。」

具備類似能力的機器,或許將幫助人類解決最緊迫的問題之一:信息過載。從2005年至2012年,全世界創造、複製及消費的數字信息增長了2,000%以上——在2012年超過了2.8萬億G。

一些人估計,信息的比特數幾乎與可觀測宇宙中的恆星數量相當。編寫代碼以指導如今的計算機處理海量信息——如何排序、分析、連接信息,以及如何做出應對——的艱巨任務,已經遠遠超出了人類程序員的能力。

莫德哈相信,認知計算機能夠填補海量信息與現有計算機能力之間的鴻溝。它們將彙集來自多個感測數據流的輸入,並形成關聯及記憶編碼,從中識別出模式,作出預測,繼而解讀,甚至可能做出應對之舉——而做到所有這些,消耗的電力遠低於當今的機器。

比如說,從監測全世界水源的大量感測器獲取數據流之後,計算機或許能夠學會識別壓力、溫度、波浪大小和潮汐的變化,然後發出海嘯預警——儘管目前的科學還無法將如此大批的變數與海嘯之類的巨浪關聯起來。

以腦結構為基礎的計算機,可以幫助急診醫生做出困難的診斷,哪怕體溫、血液成分或者其他潛在疾病相關體征的共同變化還沒有被學界所了解。

「你還是會想把你的薪水、性別和社會保險碼存儲到當今的計算機裡面。」莫德哈說,「但是認知計算帶來的是一種與此互補的範式,應運而生的將是一種截然不同的機器。」

德爾門德拉·莫德哈站在腦牆旁邊。在IBM,他的認知計算團隊使用這堵牆模擬腦的活動並設計神經晶元。他手裡托著的是神經突觸晶元,基於腦結構的新一代計算機的核心構件。圖片來源:《發現》雜誌

點亮網路

莫德哈並不是第一個從大腦中汲取靈感的工程師。人們對腦的最小單元——被稱為神經元的細胞——執行運算的方式的深刻理解,已經催生出了整個計算科學領域。

是神經元的激發,令我們能夠思考、感覺和移動。而這些能力並非源於任何單一神經元的活動,而是來自互聯成網的神經元相互傳遞簡單信號的協同工作。

早在1943年,模擬人腦的機器便有了理論上的可能。當時,神經生理學家沃倫·麥卡洛克(Warren McCulloch)和數學家沃爾特·匹茲(Walter Pitts)提出了神經網路通過互動相互激發在腦中傳遞消息的理想化數學方程。

在生物的腦中,神經元通過被稱為突觸的連結點傳遞電化學信號,以此進行通訊。這樣的過程往往始於光線或聲音之類的外部刺激。如果刺激足夠強烈,接收神經元細胞膜兩側的電壓就會超過一個給定閾值,讓充當信令的電化學物質跨過突觸,激發更多神經元,以此類推。

當同時被激發的神經元數量達到一個臨界值,外界的輸入就會被腦的認知區域所感知。足夠多的神經元被共同激發時,孩童可以學習騎自行車,老鼠能夠走迷宮。

麥卡洛克和匹茲指出,無論他們的理想化神經元接收到多少輸入,它只會處於僅有的兩種狀態之一 ——激發或者休眠,具體要看興奮閾值有沒有被超越。

由於神經元遵從這種「非此即彼法則」,腦執行的任何計算都可以簡化為一系列真假表達式,這裡的真和假,還可以分別由1和0代替。現代計算機的基礎也是使用1和0的邏輯系統,只不過信息來自電路開關,而非外部環境。

麥卡洛克和匹茲找到了腦和計算機之間的基本相似點。只要有能力問出足夠多的「真/假」問題,不管腦還是計算機,最終都應該能夠解決哪怕最複雜的問題。

比如說,要想在一組紅點和一組藍點之間劃一條界線,問題的應對者可能會詢問每一個點是紅色(真/假)還是藍色(真/假),然後詢問兩個相鄰的點是否顏色不同(真/假)。只要問題與答案的層面足夠多,應對者便可以解決幾乎任何複雜問題。

然而,由神經網路構成的大腦能夠編碼記憶及學習,與此相比,前述的邏輯能力似乎差得還遠。加拿大心理學家唐納德·赫伯(Donald Hebb)1949年解釋了大腦的這些能力。他假設兩個以極短的間隔相繼激發的神經元之間的聯繫會加強。「共同激發的神經元會彼此糾纏」,這是他的重要作品中一句朗朗上口的名言。

神經元之間的連接解釋了敘事性記憶的形成。文學史上有一個很有名的例子,當馬塞爾·普魯斯特(Marcel Proust)把一塊馬德琳蛋糕在茶杯里泡了泡又咬了一口的時候,童年的記憶湧上了心頭。這是他小時候經常做的事情,多年之後重複這套動作時,存儲這些味道和運動記憶的腦區中,神經元被激發了。

正如赫伯所指出的,這些神經元和那些與其他童年記憶有關的神經元之間,存在緊密的物理連接。於是,當普魯斯特品嘗馬德琳蛋糕時,編碼那些記憶的神經元也被激發了——普魯斯特沉浸在那麼多聯想記憶中,成就了他的宏篇巨著《追憶似水年華》。

到20世紀60年代,計算機研究者就開始嘗試,將赫伯關於學習和記憶的想法建立成模型。他們取得的成就之一,就是一個粗糙的大腦模型,被稱為感知機。感知機包含一個由人工神經元組成的網路。這種網路由兩層電路組成,既可以在計算機上模擬,也可以製造成實物。

兩層之間的空間據稱代表了突觸。電路層在突觸上傳遞信號實現互相交流,便(粗略地)模擬了一個活的神經網路。人們可以調整兩層之間傳送的信號強度——從而調整第一層激活第二層的可能性(大體上相當於一個處於激髮狀態的神經元激活另一個神經元,從而把信號傳遞下去)。

如果引導第二層對一些輸入做出的回應比其他輸入更加強烈,感知機便實現了學習功能。程序員訓練一種神經網路學會了「閱讀」,方法就是讓它在接收到描繪出特定字母的光學圖案時激發得更加強烈。

能夠訓練計算機根據經驗將數據分門別類,這是一個革命性的想法。然而感知機具有局限性:它只包含兩層電路,只能識別「線性可分」的圖案,比如能夠用一根直線分開的一群黑點和白點(或者用更加形象的話說,一隻貓坐在一把椅子的旁邊)。但如果向它展示組成更加複雜圖形的一群黑點和白點,就好像貓坐在了椅子上面,感知機就會徹底糊塗了。

直到20世紀80年代,工程師才開發出一種演算法,能夠把神經網路帶入下一個層次。現在,程序員不再僅僅能夠調整兩層人工神經元之間的權重,而且能夠調整3層、4層,甚至9層之間的權重,從而描繪一個能夠容納更多細節的宇宙。

這種網路能夠回答更加複雜的問題。忽然之間,神經網路能夠在黑點和白點之間划出蜿蜒曲線,也能夠同時分辨出貓以及它蹲坐於其上的那把椅子了。

聚在腦牆前面的,是認知計算實驗室的團隊成員(由左至右):約翰·阿瑟(John Arthur)、保羅·梅洛拉(Paul Merolla)、比爾·瑞斯科(Bill Risk)、德爾門德拉·莫德哈、布萊恩·傑克遜(Bryan Jackson)、麥隆·弗里克納(Myron Flickner)和斯蒂夫·艾瑟(Steve Esser)。圖片來源:《發現》雜誌

走出孟買

就在神經網路的復興開始提速之時,莫德哈進入了印度首屈一指的工程學府:孟買的印度理工學院。他1990年畢業,獲得了計算機科學及工程專業的學位。

莫德哈尋求繼續自己的學業,而在那個時候,沒有幾個專業能像重新興起的神經網路那樣熱門。從理論上來講,神經網路的大小僅僅受到計算機規模和程序員創造力的制約。

當時有一件事,有力地佐證了神經網路前所未有的能力:美國卡內基梅隆大學的研究生狄恩·鮑默勞(Dean Pomerleau),用模擬的路況圖片,教神經網路理解與車載計算機相連的攝像機獲取的實時路況圖像。傳統的程序員在這個問題上步履維艱,因為哪怕角度、光照或其他因素極其細微的變化,都會令只能識別準確視覺參數的預編程軟體應接不暇。

鮑默勞沒有嘗試把每一幅可能的圖片或者路況都準確地寫入代碼,而僅僅是向神經網路展示不同的路況。一旦它學會了在某種特定情況下駕駛,它就能融會貫通,在類似但不完全一樣的情況下駕駛。

使用這種方法,計算機能夠根據相似之處,通過沒有隔離板的道路識別出有隔離板的道路,或者通過晴朗天氣中的道路識別出雨天的道路——這是使用傳統編碼技術無法完成的事情。讀取過一些左轉彎和右轉彎的道路圖片之後,它能夠識別以任何角度轉彎的道路。

其他程序員通過輸入優質信用卡賬戶和欺詐信用卡賬戶的購物記錄,設計出了能夠偵測信用卡詐騙的神經網路。根據在已知欺詐賬戶中發現的常見花費模式,神經網路能夠識別出欺詐行為,並定位出新的詐騙案例。

聖地亞哥是神經網路的聖城——1987年,大約1,500人在那裡召開了20年來神經網路領域第一次意義重大的會議。1991年,莫德哈來到加利福尼亞大學聖迭戈分校攻讀博士學位。他以應用數學為研究方向,構造出等式來檢驗給定系統能夠處理多少個維度的參數,並設計配置使其能夠處理更多。

1997年,莫德哈在聖何塞市入職IBM時,計算科學的另一股趨勢——萬維網的崛起,成為了焦點。甚至在那個時候,新數據的滔天巨浪淹沒程序員的情形就已經顯而易見了。互聯網提供了大量關於人類行為、消費者喜好和社會趨勢的信息。

但是,信息太多了:人們該如何組織這些信息?你怎麼能夠從以數萬種特徵為分類依據的文件中,識別出模式?

為了處理將各種偶然情況考慮在內所需的數據或者大段程序,現在的計算機耗費了太多能量。隨著家庭、橋樑、醫院急診室以及其他各處安裝上更多採集視覺、聽覺信號以及其他信息的感應器,信息的泛濫只會愈演愈烈。

德爾門德拉·莫德哈和團隊成員比爾·瑞斯科站在IBM公司阿爾瑪登研究中心一台超級計算機旁邊。團隊利用阿爾瑪登和勞倫斯利物莫國家實驗室的超級計算機模擬了大體上接近小鼠、大鼠、貓和人類大腦的網路。圖片來源:《發現》雜誌

模擬大腦

莫德哈思考得越多,越發相信,也許轉而研究人腦這一現存最有效率、最節能的模式識別機器,才會找到解決之道。在神經學文獻中尋找靈感的過程中,他發現了美國麻省理工學院神經學家米甘卡·蘇爾(Mriganka Sur)的著作。

蘇爾曾經把與新生雪貂眼睛相連的神經與腦的視覺皮層分離開來,然後連接到聽覺皮層上。儘管眼睛連接到了腦中處理聲音的部分,經過改造的小動物仍舊可以像成年雪貂那樣視物。

對莫德哈來說,這個實驗結果的含義令人激動:雪貂的神經迴路是靈活的——就如同一些汽車的前後保險杠一樣能夠互換。蘇爾的研究表明,要想在計算機上建造一個人工皮層,你只需要一種製作神經「迴路」的設計,就能夠生成它所有的構建模塊。

如果你能夠破解那個迴路的編碼——然後在計算中實現它——你所要做的無非重複實現它。當程序員想要給計算機增加新功能,使用模式識別演算法理解新的數據流時,他們不必再從頭開始,只要增加新的迴路就可以了。

在尋找主要神經模式時,莫德哈發現,歐洲的研究者已經能夠用數學語言描述貓腦中的迴路,看上去與蘇爾在雪貂體內的研究對象類似。

如果你展開貓的皮層,撫平上面的褶皺,你會發現有6個同樣的層次在一遍又一遍地重複。若是繪製一下不同層次上不同神經群體之間的聯繫,得到的圖解與電路圖非常相似。

莫德哈和他的團隊從這些典型迴路中汲取靈感,開始編製一種能夠多次複製的人工神經網路。第一步是,確定他們在IBM傳統的超級計算機上,一次性能夠連接並運行多少條這樣的虛擬迴路。

有沒有可能達到人腦皮層的規模?

起初,莫德哈和他的團隊早早就遇到了障礙,他們的能夠運行的虛擬迴路還達不到小鼠皮層神經數量的40%,也就是大約800萬個神經元,每個神經元又帶有6300個突觸。迴路數量的短缺,限制了他們模擬實現學習、記憶和創造性智力的能力。

於是,他們再次向神經科學求助。他們意識到,腦中真正的神經元,只在激活時,才會成為腦整體計算過程的一分子。未被激活的時候,神經元僅僅待在支線上無所事事,耗費極少的能量。因此,沒有必要把800萬神經元的狀態每秒就更新1000次,那樣只會拖慢系統。

相反,他們可以指導計算機只關注剛剛被激發、因此最有可能再次被激發的神經元,以此實現對腦的模擬。這樣調整過之後,超級計算機模擬腦基系統的速度提高了上千倍。到2007年11月,莫德哈已經能夠模擬規模相當於大鼠皮層的神經網路,也就是5500萬個神經元和4420億個突觸。

兩年後,他的團隊把模擬的規模提升到了16億個神經元和接近9萬億個突觸,這已經相當於貓的大腦了。最終,他們將系統擴充到了5300億個神經元和100萬億個突觸,大致相當於一個人腦了。

建造硅腦

研究者已經模擬了數以億計一模一樣的這種規範電路,也許有一天,這些電路會將一種新型的認知計算機帶入現實。但它只是一個模型,運行在慢得令人惱火的古董機器上,永遠不會像大腦那樣工作,永遠無法步入認知的層面。

2008年,美國國防部先進研究項目局(DARPA)宣布了一個旨在為真正的認知計算機製造硬體的計劃。第一筆撥款將被用於設計節能晶元,它將成為新型機器心臟與靈魂——莫德哈美夢成真了。

莫德哈研製的硅基大腦的基本構成單元——節能神經晶元。圖片來源:《發現》雜誌

在DARPA的資助下,莫德哈於2011年夏天公布了他的新型節能神經晶元。這種晶元成功的關鍵在於它的處理器,也就是接收並執行指令的部分。傳統計算機包含少量運算速度非常快的處理器(現代筆記本電腦通常在一塊晶元上擁有二至四個處理器),而且它們幾乎一直都在工作。每一毫秒,這些處理器便掃描數以百萬計的電路開關,監控幾千條電路的狀態,並在兩種可能的狀態——1和0之間切換。

為了存儲1和0構成的模式,當今的計算機使用獨立的存儲單元。電子信號在處理器和存儲器之間,通過被稱為存儲匯流排的通路傳送。工程師曾經通過縮短匯流排的長度來提高運算速率。

現在一些伺服器能夠讓信號在存儲器和處理器之間每秒來回傳遞數億次,然而最短的匯流排也要耗費能量併產生熱量,需要大量的電能來冷卻。

大腦的構架從根本上有所不同,這種不同將反映在基於大腦結構的計算機中。大腦並非由少數幾個連續工作的強大處理器構成,而是包含幾十億相對較慢、較小的處理器——神經元,而且這些處理器只在被激活時才消耗能量。由於大腦以神經元之間連接強度的方式存儲記憶,也就是說,存儲在神經網路自身內部,因此並不需要耗能巨大的匯流排。

莫德哈新型晶元的處理器,是工作方式猶如大腦的計算機的最小單元:每一塊晶元上包含256個非常慢的處理器,每一個處理器代表一個人工神經元(作為對照,蛔蟲的腦包含大約300個神經元)。任何時候都只有被激活的處理器才會顯著耗費能量,因此總體能耗較低。

即便處於被激活狀態,處理器需要的能量也遠遠不及傳統計算機中的處理器,因為它們被設計執行的任務簡單得多:傳統計算機處理器要執行計算機運行所必需的所有計算和操作,而莫德哈的微小單元只需要計算從其他虛擬神經元接收到的信號數量,評估它們的權重,並決定接收到的信號是否足夠令處理器發出一條自己的信號。

莫德哈還沒有將他的新型晶元及其處理器連接到模擬大腦物理結構的大型網路上。但是他確信,這麼做的收益將是巨大的。演化將腦中最有可能溝通的部分放在一起,從而賦予了腦相當節能的解剖結構,因為神經元離得越近,傳遞信號需要的能量便越少。莫德哈希望通過複製腦的宏觀布局,在他以腦結構為靈感的機器中,實現這種以及其他未曾想到的節能特性。

他耗時多年、花費大量精力研究恆河猴腦中的長距離連接,最終得到了383個不同腦區的分布圖,而這些腦區由6602個獨立鏈接彼此相連。這副圖展示了任何人工大腦中的不同區域分別應該被分配多少個認知計算晶元,以及它們應該和哪些其他晶元連接起來。

比如說,有336條鏈接始於腦的主要視覺中樞。前額皮質所在的額葉則令人驚嘆地生髮出1648條鏈接。額葉位於大腦中部,是決策和認識思維之所在。就像在真正的腦中一樣,神經元計算機中也會有一個中心點匯聚最多的鏈接。

當然,就算莫德哈能夠建造這種「腦機」,一些人仍在懷疑它是否有實際用途。頂尖的神經網路理論家吉奧夫·辛頓(Geoff Hinton)認為,這種新型計算機毫無用處,除非有合適的「學習演算法」能夠清楚說明哪些因素應當改變突觸連接的強度,並且改變多少。如果在沒有這種演算法的情況下製造新型晶元,他說,「就如同還沒有搞清楚如何產生爆炸並且控制能量驅動車輪前進,便要製造汽車發動機。」

但是,莫德哈和他的團隊沒有被批評意見嚇住。他們爭辯稱,他們是在以認知計算大幅節能以及大跨度提升處理能力之長,彌補傳統計算機之短。需求日益急迫:到2020年,全世界產生的數字信息量將是2012年的14倍。莫德哈說,只有當計算機能夠發現模式並且自行得出關聯,問題才能夠得到解決。

建造未來的計算機是一項令人生畏的挑戰。然而多年之前,還在世界另一側從椅子上刮除油漆的少年莫德哈便已經懂得,利用人腦的力量,你能夠取得的成就將難以估量。

 

編譯自:《發現》,The Quest to Build a Silicon Brain

相關的果殼網小組

  • 從神經元到腦
  • 創意科技
  • 電子那點事

推薦閱讀:

魔術是怎樣欺騙我們的眼睛和大腦的?
最強大腦第一季和第二季有哪些選手?
冥想對人的大腦有什麼改變?
增強記憶力的方法
冥想對人類的大腦有何好處?

TAG:大腦 | 變形金剛 | 金剛 |