中科院徐波：中國腦計劃的現狀和發展方向

06-09

編者按：本文來自微信公眾號「機器之心」（ID：almosthuman2014），編輯：虞喵喵、李澤南，36氪經授權發布。

去年 11 月底，中國科學院神經科學研究所、中國科學院腦科學與智能技術卓越創新中心、香港科技大學生命科學部和分子神經科學國家重點實驗室、中國科學院自動化研究所在《Neuron》上聯合發表了一篇概述論文《China Brain Project: Basic Neuroscience, Brain Diseases, and Brain-Inspired Computing》，介紹了「中國腦計劃」在基礎神經科學、腦疾病和腦啟發計算上的研究進展。中國腦計劃引起了人們的廣泛關注。

最近，該論文聯合作者之一，中國科學院自動化研究所所長，中國科學院腦科學與智能技術卓越創新中心（CEBSIT）副主任徐波在中國中文信息學會第八次全國會員代表大會上做了「類腦智能研究及發展方向」的主題演講，以下是機器之心現場整理的內容。

非常高興有機會能和大家一起分享，類腦研究出現的時間不長，這個領域裡有很多不成熟的地方，希望我們的研究能為大家帶來新思考。

眾所周知，人工智慧是目前科學界的研究熱點。在人工智慧領域裡，除了深度學習以外，類腦計算這個詞出現的也越來越多了。類腦計算通常是指研發新類型的晶元，電子器件和體系結構等等，在軟體上與信息處理研究，構建模型和演算法等等相關。類腦計算還有一種提法，在 863 的課題裡面叫做類人智能。類人智能主要是行為級別的考量，目標是在功能上產生與人可以相比較的智能，但不關注達到目標需要使用什麼樣的方法，所以這裡面有一些細微的差別。

在英文里，類腦在學界存在著不同的說法。有人喜歡用 brain like，顧名思義，通過研究複製或者部分複製人類大腦，這種說法忽略了如何複製大腦；另外一種是 brain inspire，受腦啟發的智能，或者受腦啟發的計算，簡稱類腦。這是基本名詞和概念的解釋。

在內容的第一部分中，我選擇了和計算學習相關的一些方向進行介紹。

腦科學對人工智慧的啟發

今年 1 月初 AlphaGo 打敗眾多圍棋冠軍是人工智慧快速發展的標誌。但其實人工智慧最大的前景在於它會在未來 5 到 10 年中與各個行業深度融合。這是一個艱難的過程，因為每個行業都有它的門檻，但是不管怎麼樣，人工智慧已經成為一個國家層面的戰略方向。我們現有的大多數的智能可稱為大數據智能，或監督數據學習，它的最大特點是：這個系統呈現出多大的智能，它的背後就存在著多少人力的投入。包括圍棋的應用、語音識別、圖像識別，都需要大量的人工標註性的工作。但是，我們看到的大數據的智能，有兩種問題無法解決：

一類問題被稱作超大規模空間，這意味著狀態空間非常大，數據再多，對這樣的問題而言都是稀疏的。此類問題用現有的方法很難解決。

另一個問題在於現有人工智慧都是專用的智能。下圍棋的系統不能下象棋，掃地的不會擦桌子，它基本上沒有自我學習，舉一反三，觸類旁通的能力。

反過來看看人類的大腦，歐盟 2012 年的腦計劃報告中寫道：在自然界里，除人腦以外，還沒有一個自然或者人工系統，能夠具有對新環境新挑戰的自適應能力。新信息與技能自動獲取能力在複雜信息進行有效的決策，並穩定工作，直至幾十年的能力。也沒有任何系統能夠在多處損傷的情況下，保持像人腦一樣的魯棒性。而且與其他人工智慧相比，人腦的功耗非常低。

受腦啟發的智能，據我們的理解，實際上是橫跨腦科學、認知科學到智能科學，並持續發展的一個方向。在腦科學中，有很多個尺度的大腦的觀察機理可供借鑒。其實在很多的腦計劃裡面，比如美國的腦計劃（2013 年啟動），它的重點是在突破大腦的觀察的技術，測量的技術，希望能看到每個神經元的放電活動。而日本的腦計劃（2014 年啟動）主要關注於腦疾病。歐盟的腦計劃（2012 年啟動）主要是做大腦模擬，為新一代的信息處理的研究提供依據。從其他國家的類似計劃中我們可以獲得很多信息。

另外，在認知科學中，我們也可以獲得很多的信息。比如近年來，我們在大腦中的視覺、聽覺、語言中對於認知通路的研究正在變得越來越清晰。在這其中視覺通路的研究是最多的，這些研究為我們理解腦認知功能奠定了基礎。

智能科學大家都比較熟悉了，本來就存在一套計算方法在這個領域發展。

類腦智能的核心問題在於：我們能不能把腦科學、認知科學和智能科學裡面的一些研究成果整合起來，來產生比我們現有的人工智慧、神經網路、深度學習，更好的演算法和模型。

如圖所示，類腦研究有兩個源頭，一個是神經科學。這是一個統計，過去三十年產生的神經科學的知識，大概是 80 年代以前的 46 倍。現在的神經科學發展速度更快，因為神經科學的發展，主要依賴於新技術的出現。現在每年神經科學新發現的數字，是 80 年代以前的 100 倍，這個速度還在不斷加快，越來越很多的知識可供我們使用。

從類腦智能角度，人們可以借用什麼東西呢？從大的角度來說，或者多尺度的大腦信息處理，這些機制能不能被我們所用呢？我們現在知道神經元的類型非常多，人腦中有上百種神經元，粗略分類至少有有抑制性的跟興奮性的兩類的神經元。然而，現在的人工神經元都是單點式的簡化的模型，還有人在做有樹突的人工神經元模型。第二，神經突觸的形成跟消亡，是我們最基本的學習的機制。現有的人工神經網路輸出都是一類函數，而生物的神經網路，是一種神經興奮發放模式，一個被稱為尖峰神經網路的機制，它和現有的計算機神經網路不一樣。

現有認知模型

關於可塑性機制，最基本的可塑性機制比較簡單，但在整個大腦中又會產生非常複雜的現象。關於連接，就是神經元的前項連接、後項連接跟撤銷的意志，這在生物體內都可以觀察到，這就是所謂的神經元。從腦區級別來看，像神經迴路、功能環路、基底神經節、丘腦型這樣的感知決策模型，和像前額葉腦區、運動腦區等形成的模仿學習功能，像多感知的突兀，它是視覺、聽覺、觸覺向外腦區上顳葉，與整合區形成了一個多通道學習和記憶方式。它是不同的認知和不同的腦區相互協作的結果，從通用智能角度來看，生物體中還有很多機制可以借鑒。

從認知來看，我們對人腦處理外界信息的方式已經有了大致的了解。人類擁有視覺、聽覺、觸覺、嗅覺、味覺，結合短時記憶經過工作記憶的處理，可以慢慢地把信息進行理解抽象，變成長時記憶，人類會在成長過程中慢慢形成自我的概念，形成過去的經驗。長時記憶會對後來的視覺、聽覺、觸覺產生反饋與影響。所以從認知的角度來說，記憶模型各不相同，不同類型的記憶實際上利用了不同的通路。像程序性的記憶，我們一旦掌握了某些技能，比如學會了騎自行車，學會了游泳，你就可能永遠會都不會忘記，所以這些程序性的記憶，還有像無意識的條件反射，大多被稱為內涵式記憶，當然還有外顯式的記憶等等。我們在認知科學裡面可以做很多認知實驗，這些問題將來我們都會去驗證、去發現。

從認知科學中我們將獲得什麼？其實最典型的就是很多人都在用的 random、推理、tension memory 這樣的模型。此類模型有三個部分，其中一個就是短時記憶。比如我們進行小組對話，用這個模型做關於對話的理解，那整個對話的意思就是一個短時記憶，系統進行編碼以後再進行工作記憶處理，隨後你對這個對話可以提出任何問題，系統會產生響應。但在這個對話裡面，在理解一個問題的時候，可能需要很多背景的支持，這些內容可能存儲在長時記憶模塊里。

這是一種典型的模型，我個人認為它是受到認知科學啟發的。深度學習研究者們正在進行這方面的研究，這也是我們做的，我們把 tension 機制細化到詞級別的顆粒度上，通過多輪的迭代，最後獲得需要的答案。由此觀之，類腦就是人工智慧的發展動力，至少是一個可以參考的路徑。除了歐盟、日本，在美國腦計劃中專門有一個項目叫做 mapping，通俗來講，它是要研究一立方毫米體積的一個腦區，把它整個從外面到突出極的所有連接結構繪製出來，美國在這個項目上投入了 1 億美元作為啟動資金。他們下一步計劃把探究出來的結構用到人工智慧裡面。

中國在 2016 年的人大上通過了十三五的發展規劃，其中腦科學與類腦研究成為了 100 個重大項目裡面的第四位，這些部分都是和腦科學相關的，不僅是疾病研究，還有類腦研究。

換個角度，從人工智慧的角度求解這個問題。面對常規的一個問題，系統的求解需要把一個問題形式化，不論是律師、媒體還是下象棋，一定首先需要人的介入，把這個問題分解成幾塊，其中每一塊都可以轉化為一個圖靈機的問題。然後再用現有的計算機結構來實現人工智慧問題的求解。

從類腦智能的角度來看，我們希望計算機能夠通過像人一樣用序列化的學習方式來減少對人工形式化的依賴。如果我們實現了這一設想，我們就非常接近通用的人工智慧了。

這就是第一部分內容：類腦研究主要將不斷從神經科學、認知科學，尤其是神經科學中受到啟發。

類腦研究的主要方向

類腦研究具體是哪幾個方向？我們正在探究各種可能性，我們認為大腦具有高度可塑性機制。未來的人工神經網路或許可以受此啟發。這是一個 STDP，它描述了人類局部神經元之間突觸的連接強度，隨著相鄰兩個神經元先後放電的時間差異——增強或減弱而產生不同表達的神經的機制。這是生物學習機制中最基本的元素，它實現的功能是通過有持續地激活神經元集群，產生神經連接發生有序的強化，可用於儲存信息。

這樣一個簡單的、生物化的學習機制。它是無監督的，非數學化的。例如在空間維度信息的學習和記憶、手寫數字識別、圖像存儲與提取、以及機器人的動作序列學習，還有短周期節律的學習都可以借鑒這種機制。實際上研究人員已經在進行此類探索了。這樣的學習機制將會與目前不同的人工神經網路，包括現有的監督學習去比較。它目前的性能比生物體中的效率要差一點，但是仍然達到了 95% 的準確率。目前的探索證明了生物學機制的潛力。純生物 STDP 可適應機制可以讓機器人學會繞著某一條線走路。

這是一種輕監督的任務，機器自己理解路的概念，理解需要沿著路前進。我們在加油站外廣場的 24 小時監控圖像里，通過人工智慧分析，可以識別圖像內容，而且對內容進行分類。此外，我們開發了序列記憶系統，它可以識別音樂節拍，然後重現出來。所有這些都應用了這樣的機制。

從微觀角度來看可熟悉機制，無監督的學習方法已經在上述的一些任務里取得了一定的進展。但是它引出了認知範圍的能力的問題。目前的無監督學習只能適用於有限範圍內的任務處理，因為它基本沒有在結構上面做特別多的處理。

這一領域的研究還有很多方向可以進一步深化。比如秒量級的節律信息處理，就是說研究節拍之間，比如節拍超過幾百毫秒的時候，STDP 怎麼如何記錄這種節拍。如果希望使用生物的學習方式，一定要有結構的配合，包括信息的無監督編碼的提取和複雜特徵的編碼。在這一方面，比如 spike，這個神經網路功耗非常低，同時是弱監督的。生物機制中的 bottom-up 與數學上的 top-down（目標函數驅動）的方法如何整合，來形成新一代的人工神經網路，是未來我們研究的方向。

現在有很多其他領域的學者跨界在進行這方面的研究。本次討論的關鍵詞，可塑性機制，脈衝神經網路（脈衝神經網路和人工神經網路的輸出不同，它不可微分，所以數學上的原有的理論不能適用）還有強化數據深度學習。這些概念，如何整合在一起？如果可以提出一個新的模型，它的學習效率更高，對數據的依賴性、監督性、標記的依賴更弱，會是非常有意思的工作。

第二個方向，實際上認知功能都是由若干個環路或者是一個通路組成的，是若干腦區構成的一個通路。這個體系作為整體呈現出人類的認知功能，從計算的角度來看，最核心的問題在於，不同腦區之間是什麼樣的協同關係？剛才的討論中已經提到了一部分，很多的功能，包括模仿、決策、整合，都需要十幾個腦區協同合作（假如細分的話，這個數字會更大），但整合起來才能產生複雜強大的認知功能。腦區有幾種組織方式？我的看法傾向於層次化的方式，尤其在感知方面，在視覺方面這種方式非常明顯，從感官到第一要區，再到高級的認知功能和記憶、判斷推理、眼動、控制四肢手、運動規劃都有這種方式的痕迹。

另一種組織方式體現在高級認知系統中，我認為是模塊化的。不同的腦區之間有相互反饋和信息的交互。比如記憶系統的溝通，強化學習性，它的連接關係相對來說是層次性的，比視覺系統複雜。在研究協同方面，我們也做了很多工作，比如視覺和層次的研究，我們根據現有的神經科學數據，構建了視覺的各種模型，它和以前的此類模型，包括 20 年前的聽覺模型等方式大不相同。在新的視覺模型中，我們通過多層次構建了一個符合生物進化機制的目標函數，來求解區域之間的連接強度。

當然模型每層之間也有新的特性，例如側向連接。模型中神經元的數量來自於一些生理數據。受到這些結構啟發的模型，它在感受、空間分布，還有相應的神經元細胞的響應，實際觀察來看同步性是非常相似的。

當然，模型還包含有類結蹄組織結構，神經元的傾向分位，差異分布等等特性。我們看到的協同，就是層次化的腦區的協同，我們希望能夠構造符合生物進化機制的目標函數，使得它能量消耗最低。具體表現為突出的、連接的低能耗，還有表徵的低能耗。另外我們從多腦區、高級定製、協同等方面也進行了研究，開發出了進階模型。模擬了十幾個腦區，完成從視覺編碼開始，到最後做出決策的所有任務。這種模型被稱為運動感知和決策模型。其中包含興奮性通路和抑制性通路，還有內部的連接關係及擴散結構，不同的腦區相互作用等等。

應該說，這個模型基本上是用仿生的思路開發的。另外，我們對單個神經元的類型也做了很多的嘗試。我們用不同類型的神經元構造出整個網路，模擬了腦區之間的競爭的機制，學習行為選擇和權重更新等機制。

這個模型最終展現出來的學習機制總體而言比較簡單，就是通過多巴胺的釋放來調節學習的速度，這有點類似於獎懲信度分配——強化學習裡面的邏輯機制。它呈現出了類似強化學習的功能，但它的複雜度、學習的速度都比後者要快。我們把剛才提到的視覺層次化與運動決策模塊化整合在一起，研究無人機躲避障礙和處理突發事件的新方法，這些實驗也是我們研究的一部分。這類研究最大的特點就是它具有可解釋性，它完成每個決策時，每個腦區，每個神經網路發揮的作用都可以解釋的，研究者可以清楚地觀察到。這是我們新一代人工神經網路的重要特徵。它不像現有的監督學習方式，在訓練後處於黑箱狀態，人們無法獲知神經網路每一層的功能。我們的模型從仿生角度設計，可以較清晰地觀察特定腦區在發揮什麼樣的作用。

第三部分更加複雜，但對於類腦智能的價值也非常大。就是探究如何構造一個可以發育演化的模型。現有的神經網路學習與人類最大的區別在於時間尺度。人類的學習也許會經歷幾年或幾天，它的時間序列非常長。我們目前的感知系統無法這樣學習。我們的機器學習始終把目標函數作為優化的唯一的機制。而且在優化過程中，我們能看到其中有很多表示，其中印證了神經科學的一些發現，包括剛剛講到的腦區細胞類型、分子狀態、計算和存儲的機制。

在最早神經科學把神經元的概念引入到機器學習中，啟發了深度學習等方式之後，最新的成功研究和神經科學的關係越來越少了。但是，我們現在看到神經科學與機器學習融合的新機會正在出現。我們首先意識到機器學習的目標函數正在變得越來越複雜。現有的大多數神經網路都是單一目標函數，但有很多的神經網路可以隨著不同的神經層、深度、時間產生變化。比如學習次數不同導致目標函數的不同, 它可能會有持續的捆綁性，我們在底層機器學習的設計中也許需要把它考慮在內。還有大家最熟悉的對抗式學習，它是由兩個神經網路組成的，用一個網路修正另一個網路的輸出的目標函數。這些方向為我們未來的機器學習模型打開了思路。

為了使優化更加高效。機器學習已經發展出了不同的網路結構。

神經科學與人工智慧之間的關係存在三大假設：

1、大腦具有優化目標函數的能力。大腦特定的腦區，特定的結構具有在數學層面上優化目標函數的能力。

2、目標函數在不同腦區和發育階段是不同的，現代機器學習的發展，實際上也是從這裡受到啟發的。

3、大腦中存在大量的專用機制，這是天生的、在進化中得來的，可以有效地解決一些關鍵的計劃問題。

從大腦優化目標函數的方式中，我們可以觀察到人類在運動過程中其實有很多的策略，從進化角度考慮，人類必須減少能量的消耗，減少運動的風險，降低受到傷害的幾率。我們目前認為目標優化策略機制在大腦中廣泛存在，它們形成了不同的特定處理方式。

那麼大腦目標函數優化的確切含義是什麼？有很多的網路結構，比如饋增網路，有些存在反向通道，STDP 機制和一些相關結構。在經過學習後可以產生和數學上的 BP（錯誤反穿）一樣的效果的學習機制。但目前有關大腦中存在 BP 學習機制還是一種假設。在神經科學中，哪一種運行機制假說是對的還沒有定論。但這些假設可以給人帶來很多啟發。

第二個假設是目標函數在不同腦區和不同發育階段是不同的。這很容易讓人理解，在構造神經網路應用的時候，可能一個網路被用於進行分類、決策，另一個網路會不斷地隨時間、環境，或者被其他動機驅動，產生變動的目標函數，因此，這個神經網路就會更加適應環境，具有更好的表現。

目前的深度學習正在向無監督方向發展，人腦是否存在真正的無監督學習？我們現在仍然只能進行假設，因為大腦實在太複雜了，目前的神經科學還難以支撐這樣的結論。順著假說的思路，利用無監督學習來解決特定的問題是目前研究者面臨的挑戰，如果按照剛才的優化目標來看，大腦目標函數是隨著時間和不同的發育階段而變化的。因此，我們需要探討的問題是，真正的演化是不是根據當前的狀態？我們能不能通過一系列目標函數來建立迴路和行為？

我們總是希望用較少的數據來訓練完美的模型，人類的大腦在進行學習時不需要一個具有數百萬已標記數據的數據集來訓練。人類只需要一些簡單的邏輯和少量事例，就可以觸類旁通，僅需要非常少的數據即可完成訓練。

現在，我們希望計算機可以把複雜的問題分解成若干的不同的階段，每階段只需少量數據進行訓練，輸出相應的目標函數，如果這個方向出現了成果，那麼人工智慧就向前邁進了一步。

第二，在增強學習上，我們目前認為大腦中普遍存在此類機制。增強學習和深度學習正在不斷地被整合，此類研究也已經出現了很大的進展。它的基本思想就是用強化學習來產生定義的目標，也就是說所謂的有效錯誤反彈，它也可以理解為通過學習需要達到的目標，加上強化的過程。我們可以把這種學習方式理解為不斷變化的 cost function，加上半監督學習。

第三，專業系統如何進行有效計算的問題，這與實現機制結構相關。不同模式的信息在不同領域中被用來解決各種類型的問題。有些區域是 highly recurrent，有些區域是在不同的激活狀態，有些區域好像在做信息的路由，基底區在做增強學習跟離散的決策。在大腦中可能存在一些較為固化的結構在做無監督學習，這意味著深層次的模型可能是大腦中的固定結構，因為深層次模型是不需要監督的。

還有一些有關物理世界固有特性的目標函數，比如說一個物體，我們推動它會產生慣性。在特定結構下做出優化，即使有一組強大的基因來決定，我們的 cost-function 要在一個空白的網路上演化出複雜的認知也是非常困難的。

從大腦中尋找靈感

預設一個結構對解決複雜問題而言是必要條件，優化公式的學習是在複雜的動態的協同過程中完成的。我們知道大腦中存在很多特殊結構，用於完成各種類型的任務，這種機制並不需要經過大量學習。目前，智能研究社區非常關心大腦到底有沒有反向傳播（backpropagation）機制，我們可以設計一種模型，實現類似大腦的反向傳播，但從生物學中更複雜的技術層面上看，類腦的角度是非常有益的。無論如何，一旦生物運算機制被我們破解，我們就可以把它複製到計算機領域中，使得人工智慧程序的學習變得更加簡單、更加有效。

在演化部分里有這樣一個結論：假如我們目前的技術向內容的認知能力方向發展，最後出現的演算法將會遠遠超出目前硬體技術所能容納的範圍。從大腦的角度來看，目前人造的數據驅動方式都無法達到人腦的運行效率。所以，我們需要轉變思路，吸收很多的模塊化機制，反應偶然性的推理方式，原始物理和心理機制，來構建能夠理解感知現實世界的模型。

DARPA（美國國防高級研究計劃局）的局長在 2014 年的一份報告中講到：生物是自然界的終極創新者，任何直觀創新的機構如果不從作為複雜系統的大腦中尋求靈感，都將是愚蠢的。

大腦擁有上千億個神經元細胞，百萬億的突觸形成的網路，其複雜程度也許讓我們一時難以複製。我可以先用一個簡單的模型來說明這個問題：亞馬遜螞蟻，上千隻螞蟻組成的群體，當它形成一個環形的運動狀態，它會一直爬行，直到所有螞蟻都累死為止。但是當遇到阻礙的時候，它們又能搭橋；碰到蛇的時候，它們可以互相配合進行抵抗。螞蟻的行為非常簡單，但它們可以通過協同合作來完成個體無法做到的任務。對於大腦來說，原理也是類似的。當我們最終了解了大腦的複雜系統信息共享，自主性和實際性信號處理等等機制的秘密，人類的科技水平將會出現新的突破。

有人說現代科學已經進入了複雜性微積分時代，我們正在從多種研究角度，從心理、計算、動力學、混沌、進化等不同的角度在研究複雜性。但是整個生物學領域裡面，越來越多信息處理的思想來正在形成我們理解動物行為的理論框架。雖然在生命系統中，信息的處理和計算的完整概念還非常的模糊，科學家們對於它定義的形式化都還沒有形成共識。但是，可以預見的是，計算機科學及更廣泛的計算領域終將從類腦智能的研究中獲益。

以上是我個人對於類腦智能的一些見解。這是我們目前正在進行的研究，把一個鼠腦的幾百個腦區，七千多萬個神經元用一些現有的信息處理方法進行完整的模擬。現在，我們的研究還處於初始階段。在全腦的尺度中，即使是一些非常初級的功能也需要進行大量的探索，但我們的征途已經開始。

謝謝大家。