中國人工智慧研究與發展 | NSR專欄
?2017年5月,谷歌DeepMind開發的人工智慧圍棋程序AlphaGo在浙江烏鎮戰勝中國圍棋高手柯潔。
編者按:
2017年5月,AlphaGo再次發出挑戰,這次對戰的是中國圍棋高手柯潔。雖然AlphaGo最終戰勝了柯潔,但是人工智慧的探索仍然只是處於起步階段。
中國科學院副院長譚鐵牛認為,機器在棋盤類遊戲里打敗人類並非難事。「人類進化的方向並不是玩棋盤類遊戲,或者完成很複雜的算術任務。」北京大學機器感知與智能教育部重點實驗室主任査紅彬進一步解釋說。這一討論發生在2016年由《國家科學評論》執行主編、中國科學院腦科學與智能技術卓越創新中心的領導者蒲慕明主持的關於人工智慧的一個論壇上。
撰文 | Jane Qiu
翻譯 | 梅 寶
校譯 | 楊 苗
責編 | 陳曉雪
● ● ●
導讀:
2016年,人工智慧(Artificial Intelligence)領域發生了幾個里程碑式的事件。2016年3月,總部位於英國倫敦的谷歌人工智慧研究實驗室DeepMind開發的人工智慧系統AlphaGo,在圍棋比賽中打敗了世界冠軍李世石。2016年10月,同樣還是這家公司,在世界頂級期刊《自然》(Nature)展示了它最新的科技:讓機器去解決需要邏輯和推理的任務,比如利用一張從未見過的地圖在倫敦地鐵里找路。
最近幾年,像這樣的進步,推動了包括中國在內的許多國家研發前沿的學習機器。2015年,中國科學院建立了腦科學與智能技術卓越創新中心(簡稱CEBSIT),這個創新中心聯合了超過20個中科院的研究所及大學。2016年年初,中國正式推出了中國腦計劃(China Brain Project),這是一個為期15年的項目,研究重點在於腦圖譜、神經系統疾病和類腦人工智慧。
《國家科學評論》(National Science Review)執行主編蒲慕明,也是中科院CEBSIT的領導者,在他主持的一個論壇中,幾位研究者討論了在人工智慧方面,中國最新的舉措和進展以及未來的方向和挑戰。
人腦與學習的機器
蒲慕明:對於人工智慧來講,2016是激動人心的一年。我有一個基本的問題:當理解人腦還有很長一段路要走的時候,我們怎樣做才能推進人工智慧的研究?
曾 毅:我認為「類腦"(Brain Inspiration)是人工智慧研究未來應該發展的最具有前景的方向之一。不過人類大腦是進化的產物,還沒有處於最優化的狀態。這也是我為什麼強調我們真的不需要去模仿來自腦的所有東西。我們應該借鑒腦里看起來很獨特,能提高人工智慧模型表現和發展它們認知能力的運行原理。
當然,我們現在只是剛剛開始理解大腦。可能還需要花數百年才能完全理解腦是如何工作的。儘管如此,我們並非一無所知,比如腦的多尺度可塑性原則(Plasticity Principles)。而像這樣優越的特點,目前還沒有很好地運用到人工智慧模型和系統中。
?曾毅,中國科學院自動化研究所研究員,類腦智能研究中心副主任
陳雲霽:我有一個不同的觀點,因為我的研究重點在硬體。但是我同意,人工智慧的發展是需要長期努力的,我們應該整合現有的知識,而不是等我們完全理解人類大腦之後再行動。這應該是應用驅動的,目標在於解決特定的實際問題。
蒲慕明:如果我們談論類腦人工智慧,那麼人們應該從20世紀40年代起就開始研究機器認知的領域了,但是整合可塑性是相對近期才有的現象。
譚鐵牛:的確,人工智慧不是一個新話題。現在人工智慧受關注度很高,部分是因為在神經科學領域的新進展。雖然類腦很有前景,但這或許不是讓機器會學習的唯一方法。
蒲慕明:媒體在捕捉公眾視線上也起了很重要的作用,以2016年3月AlphaGo的勝利為例。但是這個事件也展現了這個領域一個很急切的需求:目前的機器並不是很有效率,需要大量的運算能力(很少能有像AlphaGo一樣的運算能力)。當運算能力短缺時,這就變得更加明顯。所以很多研究者轉向了人類大腦,因為大腦效率高。
譚鐵牛:公眾對於機器,比如AlphaGo的反應有些錯位。在棋盤類遊戲里打敗人類,對於機器來講,並非難事。
查紅彬:我同意。人類進化的方向並不是玩棋盤類遊戲,或者完成很複雜的算術任務。這些都不是人類智力最根本的方面。讓機器在明確的特定規則下能有良好的表現,這應該是人工智慧研究的關鍵問題。但是目前,對在較少規則下機器的行為能力,比如在家做飯或者在田野工作等任務能力,關注卻相對較少。
曾 毅:目前人工智慧討論的話題絕大多數仍然在1950年阿蘭?·圖靈(Alan Turing)一篇標題為「計算機器與智能」(Computing Machinery and Intelligence)的文章的範圍之內。他定義了人工智慧的三個方面:第一個是圖靈測試(Turing Test),通過一個人對對方發送問題以及來回問答,這個人通過對方的回答,判斷對方是人還是機器;第二個是人和機器在棋盤類遊戲上的比賽,圖靈當時就提出了;第三個是機器能夠像孩子一樣去學習,這是最根本、目前差距很大的、也是人工智慧最具有挑戰性的方面。
蒲慕明:通常認為,大量的數據對於訓練人工神經網路是有必要的,比如相互連接的節點,就像大腦里的神經元網路一樣,然而大腦在做決定時並不需要那麼多的信息。我認為這種認識是錯誤的。實際上,人類大腦也是來源於大量信息的訓練,其中大腦網路結構在持續變化。
新生兒有神經細胞,但是並沒有完整功能的神經網路。隨著多年的學習,神經網路進行修改和細調,並伴隨著重要的結構變化。這是人類神經網路如此有效率的原因。我認為發展人工智慧的關鍵在於能發展人工神經網路,使它們的構架可以隨著學習而改變。
可塑性:人工智慧的本質
譚鐵牛:為了更好地了解神經細胞是如何聯結的,腦圖譜備受關注。但或許理解在發展的過程中網路聯接的形成機制更為重要。像大腦一樣的結構或許並不能代表像大腦一樣的功能,因為結構是靜態的,然而學習是動態的過程。
查紅彬:我的研究重點是模式識別和計算機視覺。在我看來,人工智慧的一個重要特點是它的柔性。畢竟,它們需要在真實的場景下進行操作,因此它們適應動態環境的能力很重要。這種自主學習的能力與類腦計算密切相關,包含兩個重要的方面:第一,這個系統必須是可塑的,像人類大腦一樣;第二,這個機器必須能夠和它周圍的社會和自然環境進行互動。目前類腦計算的發展更多的是研究大腦結構以及模仿大腦小部分功能。我認為我們應該更加關注整合可塑性。
蒲慕明:我贊同。可塑性的關鍵在於連接功能的可塑性,在學習的過程中能反饋並改正錯誤,最終產生結構上的改變。到目前為止,大家關注的是計算能力和速度,這不是人類智力的本質。
查紅彬:如果機器被設計成只需要在固定的環境和規則下行使功能,那麼,他們不需要自身的變化。但是,為了讓一個學習機器能夠真正地對環境變化進行回應,你需要在整個網路中加入反饋機制。
蒲慕明:環境的反饋是與學習相關的。從監督性學習(Supervised Learning)轉變為非監督性學習(Unsupervised Learning)的過程中,有哪些挑戰?
陳雲霽:在研發AlphaGo之前,DeepMind公司曾經在《自然》(Nature)發表過一篇文章。在這篇文章裡面,演算法程序利用大型資料庫,通過「看」視頻和學習能提高分數的動作,教會自己怎麼去玩數十種經典的電子遊戲。這對於強化學習(Reinforcement Learning)來講,是一種很有效的手段。不過這只是局限於有簡單規則和直接目標的電子遊戲和棋盤類遊戲,或許不能應用於包含複雜的環境性輸入的情況。另外一個我的觀察是,有很多人在研究感知類人工智慧(Sensory AI),這個領域發展得很快,但是認知這一方面卻很滯後。
?陳雲霽,中國科學院計算技術研究所研究員
蒲慕明:這或許和神經科學領域的進展是相呼應的。在感知能力這一塊有很多的進展,但是我們對於高等認知過程,比如語言和決策,知之甚少。
曾 毅:我們看到DeepMind演算法在深度強化學習上的進步。但是我們也能看到它的問題。儘管機器能夠通過和環境的互動,得到反饋,但是程序不能把從一個遊戲中的學習收穫轉移到另一個遊戲。當它遇到一個新遊戲的時候,它得從頭再來。但是人類不是這樣,人類能夠把從一個任務中學會的技能轉移到另外一個新的、毫不相干的任務上。這是人腦的優越性。除此之外,這個模型在規劃等方面還存在巨大的提升空間。
查紅彬:當我們討論非監督學習的時候,應該有一些概念上的改變。現在機器學習很多強調培訓效率和所用的時間。實際上,學習不是只關於效率,而更多的是關於與環境的互動能力。效率和可塑性是完全不同的挑戰,需要完全不同的解決方法。
?查紅彬,北京大學機器感知與智能教育部重點實驗室主任
曾 毅:我認為人工智慧的聖杯(Holy Grail)是開發通用智能系統,這種系統機制上受腦啟發,行為上也和人類類似。具有人類水平人工智慧的系統能夠去處理環境信息,定義問題,然後自己找到解決方法。但是真正的困難不僅僅是挑戰更高的認知功能,莫拉維克悖論(Moravec』s Paradox)對此有很好的闡釋。就像漢斯·?莫拉維克(Hans Moravec)所說:「讓計算機在智力測試或者下棋中展現出成人的水平是相對容易的,讓計算機掌握一歲小孩般的感知和運動技能,卻很難或者是不可能的」。
中國人工智慧的黃金時期
蒲慕明:中國在人工智慧領域做了什麼?需要什麼樣的政策來支持人工智慧的發展?
譚鐵牛:對於中國的人工智慧和神經科學來講,這是一個黃金時代。中國政府對此很重視,中國腦計劃被中央領導多次提及,這是在未來十多年中國主要的重大科學項目之一。這是前所未有的。
曾 毅:的確,政府在多個層面給予了很多支持。除了廣為人知的國家層面舉措,地方性的項目也逐個啟動,促進人工智慧的研究和發展。比如北京有一個類腦計算項目,中科院幾個研究所、北京大學、清華大學等都參與其中。和我們的商業夥伴一起,我們研究所(中科院自動化研究所)也設立了一個10億人民幣的風險資本基金,致力於人工智慧和機器人的發展。
蒲慕明:看起來很多大學和研究所在人工智慧上都有項目。他們的研究重點有哪些區別?
查紅彬:高校和科研院所在策略計划上,並沒有什麼不同,儘管科研院所更多是在國家項目合作的基礎上運行的。當然,不同的研究組會專註在模式識別、硬體或者機器人等不同領域。中國的研究者更願意關注西方的前沿進展。當有一個很有前景的方向出現時,大家馬上都想參與其中。
蒲慕明:中科院計算技術研究所有一些令人鼓舞的進展。能簡要介紹一下嗎?
陳雲霽:我們研究所主要是做硬體的。一個重要的進展是發展前沿晶元來處理人工神經網路。在20世紀80年代的時候,人們發展這樣的硬體的程度是很小的,只是模仿神經細胞以及突觸(指兩個神經細胞連接之處,峰電位通過特定的化學物質擴散進行傳遞)。現在我們開發的處理器雖然很小,但是通過「虛擬化」運算技術,能模擬在神經網路中的無數神經細胞和突觸。
蒲慕明:中科院自動研究所?最近有什麼進展?
曾 毅:腦啟發的智能的確是我們研究所的研究重點。我們長期的目標是解碼人類智能的機制和原理,以及開發具有通用智能的類腦智能系統。最近代表性的工作是並行腦模擬器(Parallel Brain Simulator),它能夠在腦的多個尺度初步模擬認知腦,從離子、神經細胞、腦的不同區域以及不同複雜程度的神經環路到認知行為。
我們已經證明,當一些神經科學原理融入進去的時候,例如神經細胞的動態分配、突觸的形成和消除、興奮性和抑制性神經細胞的合適比例,我們的脈衝神經網路(Spiking Neural Networks)的準確性能得到顯著的提高。
蒲慕明:這很有趣,這一突破能讓我們做什麼?
曾 毅:這使我們能夠初步模擬小鼠的大腦,包括7100萬個興奮性和抑制性脈衝神經元、1900億個突觸和213個腦區。我們也正在研發更接近人腦工作原理的類腦脈衝神經網路模型,這些模型能夠擁有認知功能,比如模式識別、演繹、強化學習和工作記憶。並行腦模擬器也是一系列認知機器人的「大腦」,這個人工大腦的許多不同腦區能夠相互協調,共同完成多個認知任務。
在和中科院CEBSIT的其他成員合作中,我們也發布了一個名為「鏈接腦數據中心」(Linked Brain Data)的知識引擎,專門用於腦科學、神經科學、人工智慧的研究。這個研究整合了來自神經科學、心理學、認知科學等不同學科對腦的認識,針對不同物種自動建立了腦關聯圖,展示不同尺度的腦組成(基因、離子通道、蛋白質、神經元、腦區)與百餘種認知功能和400餘種腦疾病之間的關聯關係。
中國面臨的挑戰
蒲慕明:目前的主要挑戰是什麼?中國應該做些什麼去提高自己的研究產出?
譚鐵牛:人工智慧與計算機科學、神經科學、認知科學、心理學等相關。應該有一些平台,能讓來自不同學科領域的科學家們進行溝通交流,分享科研進展,探討未來研究方向。大家應該意識到不同學科領域的科學家能互相得到啟發,只有那樣大家才有動力走到一起交流互動。
蒲慕明:我目前觀察到的現象是,我們有一個很大的神經科學團體以及一個很大的人工智慧團體,但這兩個團體之間在會議上很少有互動。
查紅彬:在中國這的確是一個大問題。這可能部分與教育相關,比較狹隘。結果,我們的科學家的視角相對比較局限,對於他們領域之外的事情不太感興趣。
蒲慕明:這是一個好的觀點,我們正在努力地修正。中科院現在正在嘗試雙導師體系,在這裡面每個研究生有兩個來自不同研究領域的導師,學生必須在每一個實驗室花大量的時間。從人工智慧這方面來看,學生真的很有必要在神經科學和計算領域都得到訓練。這樣的訓練越早開始越好。
?蒲慕明,中國科學院上海生命科學研究院神經科學研究所所長
陳雲霽:這是個好主意。但是我覺得這應該從本科生教育階段就開始,設立比現在更加廣泛和靈活的教育體系,讓學生有更多的自由去追求他們的興趣。
蒲慕明:我認同。現在的本科生教育太專業化了。他們有很多的課程是局限在某個專業的點上。當他們畢業之後,通常不願意換到另外一個不同的領域。在我看來,研究者應該經常轉換領域。這應該是一個常態,而不是例外,因為有創意的想法就是這樣產生的。
蒲慕明:我們的人工智慧研究與發達國家相比怎麼樣?
陳雲霽:與西方國家相比,中國的優勢在於我們有巨大的市場,而且發展很迅猛。這在某種方式上也能推動基礎研究。中國的一個問題是人們傾向於去跟隨西方現行的觀點。我認為,我們應該在那些我們認為有前景,但目前又不是很潮或者在短期內還沒有實用價值的領域中耕耘數十年。例如,或許我們應該更加關注認知人工智慧的研究,這個領域的任何突破都有可能引發革命性影響。
曾 毅:正像我們探討的一樣,類腦人工智慧這個概念並不是全新的。一些研究者已經利用計算模型去研究認知心理學幾十年,現在這些被用於人工智慧。我同意陳雲霽的觀點:需要花費幾十年時間去研發有效的人工智慧體系。目前,中國非常缺乏這樣長期的努力,但是中科院CEBSIT正在朝著這個方向發展。
譚鐵牛:中國在包括模式識別等領域研究了幾十年,直到最近有些工作才被稱為類腦人工智慧。中國在此領域的研發投入是相當大的,也有著一支龐大的研究力量和大量的論著。但是我們傾向於跟隨西方潮流,關注在對現有技術的漸進提升。我們還缺乏重大突破,目前總體上也滯後於西方發達國家。
?譚鐵牛,中國科學院自動化研究所研究員,中國科學院副院長
蒲慕明:為什麼會這樣?
譚鐵牛:這與整個社會環境和科技評價體系有關。這也與學術界的一些文化,特別是一些急功近利的現象有關。
查紅彬:我認為這也與發展階段有關。中國從較低的水平開始,現在一直在追趕。一旦整體的水平上升,這個情況應該會朝著更好的方向發展。到時候,中國的研究者就能夠獲得更多的自由去追逐自己的興趣,無論西方怎麼樣,自己可以做一些有風險的項目。
譚鐵牛:關鍵在於建立平台,把研究者聚集在一起,激發創意,分享最新研究結果。也有必要改革評估體系,鼓勵科學家去嘗試長期的、有風險的項目。
曾 毅:我認同。我們不缺支持或錢。我對發達國家的研究越了解,越覺得我們缺的是差異化思考的能力。我們習慣於跟隨潮流,很少人願意冒險花費數十年證明一個想法。我們似乎只顧著發表很多以晉陞為目的的論文。但是差異化思考以及有勇氣嘗試大多數人都不敢觸碰的領域,比如通用智能,甚至是機器意識,絕對是很重要的。
蒲慕明:國際合作和國際競爭的關係是怎樣的?我懷疑有的研究可能對軍事應用有影響。在和國外的研究者合作時,存在這樣的問題嗎?
譚鐵牛:這肯定需要平衡。在我看來,如果我們和世界上最好的研究團隊合作,能夠提升的更快一點。
蒲慕明:在神經科學研究所,許多人是害怕與西方國家的研究者工作的。他們擔心自己好的想法會被西方國家的研究者所竊取,西方國家的研究者行動更快且有語言優勢可以更快發表結果。
譚鐵牛:在人工智慧方面,我們也存在類似的問題。我認為在開展國際合作的時候,哪些該說,哪些不該說,是有技巧的。在開展國際合作的過程中,我們應該學會去保護自己在知識產權等方面的利益。
英文原文2016年12月發表於《國家科學評論》(National Science Review,NSR),原標題為「Research and development of artificial intelligence in China」。NSR是科學出版社旗下期刊,與牛津大學出版社聯合出版。《知識分子》獲NSR和牛津大學出版社授權刊發該文中文翻譯。
推薦閱讀:
※學術研究丨元代論印詩初探
※英研究稱1型糖尿病恐將增加患癌風險·每日商報
※包裹性腹膜硬化的研究進展
※腸道微生物組最新研究進展盤點
※【洛佩茲研究①】橫跨古典與現代的藝術大師洛佩茲經典作品大覽(油版雕和素描珍藏版)