中國腦計劃顛覆性創新之路（下）

02-12

七、用互聯網與腦科學構建新AI系統模型

在中國腦計劃顛覆性創新之路系列文章中，提到通過互聯網與腦科學的交叉研究，為預測互聯網未來建立了互聯網大腦架構體系。這個體系一方面可以表現未來互聯網的成熟架構，同時如果將這個結構縮小在計算機軟體系統中或晶元中，可以作為一種新的人工智慧應用系統模型。

1.用神經元晶元堆積複製人腦的方法和問題

在2009年以色列魏茨曼科學研究所馬克拉姆教授第一次向大眾描述了他的美好願景——用超級計算機模擬大腦中860億個神經元以及100萬億個突觸的活動。他向聽眾許諾，「我們可以在10年內實現這個目標」，還暗示說，這樣的數學模型甚至可能擁有意識。馬克拉姆還在很多演講、採訪和文章中提到，這樣的大腦數學模型將給腦科學研究帶來很多突破性進展——如數值模擬可以啟發藥物研製，取代一些動物實驗，或是幫助人們對阿爾茨海默病等神經疾病有更清晰的理解。不僅如此，大腦模型還可以衍生出新的技術，使電腦的計算速度得到提升，或是製造出可以執行複雜任務甚至具備智能的機器人。

儘管很多科學家對馬克拉姆的夢想充滿懷疑，2013年1月，歐盟還是決定撥給馬克拉姆13億美元，讓他用10年時間，模擬出人腦——他的夢想似乎就要成真了。在歐洲，神經科學家對「人類大腦計劃」的態度也有著巨大的分歧。2014年7月，一封指責HBP的科學研究和管理方式的公開信很快獲得了八百多位科學家的簽名。這些科學家還威脅要抵制大腦計劃。

除了歐洲腦計劃，2014年IBM研發出了名為「TrueNorth」的神經元晶元，它希望從從底層開始模仿人腦的結構，從X光透視圖上看，TrueNorth和普通的處理器沒有太多區別，TrueNorth的4096個核心之間就使用了類似於人腦的結構，每個核心包含了約120萬個晶體管，其中負責數據處理和調度的部分只佔掉少量晶體管，而大多數晶體管都被用作了數據存儲、以及與其它核心溝通方面。

在這4096個核心中，每個核心都有自己的本地內存，它們還能通過一種特殊的通訊模式與其它核心快速溝通，其工作方式非常類似於人腦神經元與突觸之間的協同，只不過，化學信號在這裡變成了電流脈衝。IBM把這種結構稱為「神經突觸內核架構」（neurosynaptic cores）。

從原理上看IBM的神經突觸內核架構模擬人工的方式與歐洲腦計劃提出的思路原理基本一致。主流科學家認為，即使如馬克拉姆夢想的那樣，歐洲腦計劃通過模擬重現了大腦的細節，這些結果也無法幫助人們理解知覺、記憶、情緒等問題，打個比方，即使我們把一個個原子堆積成了一台電腦，我們對軟體的運行原理依然是毫無頭緒。

2.類大腦互聯網架構為建立新人工智慧系統提供新啟示

上世紀誕生的互聯網對人類社會的影響越來越大，種種跡象表明互聯網與腦科學具有緊密的關係。從2005年開始，相關研究提出「互聯網將向著與人類大腦高度相似的方向進化，互聯網將具備自己的視覺、聽覺、觸覺、運動神經系統，也會擁有自己的記憶神經系統、中樞神經系統、自主神經系統。另一方面，人腦至少在數萬年以前就已經進化出所有的互聯網功能，不斷發展的互聯網將幫助神經學科學家揭開大腦的秘密。「

上述研究啟發我們以互聯網功能和架構作為參考，能否在超級計算機中構建仿互聯網大腦的人工智慧系統模型。在構建的過程中，也可以根據互聯網的最新發展增加和減少相關功能和架構。這種模型的軟體系統也可以集成在晶元中使用。

3.類互聯網大腦的人工智慧系統模型的實施方法和路徑

類互聯網大腦的人工智慧系統模型的理論基礎就是將上述互聯網整體類腦模型在超級計算機中實現出來，將目前互聯網穩定下來的典型應用和架構有機的結合，用程序和資料庫進行模擬，並通過可視化的方法呈現出來。

作為一個龐大的系統，互聯網經過近45年的發展，已經包含了成千上萬的應用和子系統，而且由於發展迅速，互聯網每天也都在出現新的應用，在進行仿互聯網大腦模型時，如果把所有的互聯網應用和子系統都囊括進去，在實踐中很難實現。

因此我們提出選取普及率高，相對成熟的互聯網應用建立類互聯網大腦的人工智慧系統模型應用庫（IBML)進行測試，類互聯網大腦的人工智慧系統模型應用庫根據互聯網的發展定期進行增加或刪減。這樣可以規避互聯網應用過於繁多，同時消失和出現過於頻繁的問題。譬如我們可以建立如下類似的類互聯網大腦的人工智慧系統模型應用庫，示例如下：

IBML={Google，Facebook，Blogger，Amazon，Yahoo，Youtube，Quora，Wikipedia，Twitter，IPv4/IPv6.......}

通過類互聯網大腦的人工智慧系統模型應用庫的建立，在超級計算機中仿造互聯網功能和架構就成建立新的人工智慧系統模型就成為可能。類互聯網大腦的人工智慧系統模型的具體建立有一下三個步驟。

步驟一，類互聯網大腦的人工智慧系統模型的硬體基礎 1）大型計算機 2）實驗室級別的感測器網路感測器網路將在仿互聯網大腦模型中的」神經元「社交網路賬號與大腦模型中的其他部分進行進行交互。

步驟二，類互聯網大腦的人工智慧系統模型的功能實現

1.在該類互聯網大腦的人工智慧系統模型中建立微型社交網路，維基百科，搜索引擎等功能

2.將微型物聯網構建虛擬視覺，聽覺，感覺和運動系統關聯到該類互聯網大腦的人工智慧系統模型中

3.運轉該類互聯網大腦的人工智慧系統模型中建立微型社交網路，維基百科，搜索引擎以及微信物聯網系統產生大數據

4.將機器學習，深度學習等人工智慧演算法應用到類互聯網大腦的人工智慧系統模型中。

步驟三，用數據可視化技術作為交互界面，將伺服器中的類互聯網大腦的人工智慧系統模型運轉情況用可視化方式呈現出來，實驗人員通過仿社交網路神經元賬號進行操控。

研究方法：

對類互聯網大腦的人工智慧系統模型進行持續改進更新和研究，將互聯網和腦科學中的新功能加入到模型中進行檢驗，對類互聯網大腦的人工智慧系統模型中的信息和知識庫系統進行持續增加，對每個仿社交網路神經元進行人工智慧處理和實驗人員主動操控處理，觀察類互聯網大腦的人工智慧系統模型的智能特徵。

八、建立互聯網，AI和大腦的聯合智商

一，圖靈測試的局限性

測試人工智慧系統是否具有智能最著名的方法是「圖靈測試」。1950年，圖靈發表論文《Computing Machinery and Intelligence》提出了「機器思維」的概念[27,28]，提出一位測試者在與被測試者相互隔離不能進行直接交流的情況下，通過信息傳輸，和被測試者進行一系列的問答，在經過一段時間後，測試者如果無法根據獲取的信息判斷對方是人還是計算機系統，那麼就可以認為這個系統具有同人類相當的智力能力，也就是說這台計算機是有思維能力的，這就是著名的「圖靈測試」（Turing Testing）。

圖靈測試並沒有定義智能的範疇，而只能作為一個人工智慧的充分條件，關於這一點，圖靈在論文中寫道：

「機器能否擁有智能，為了回答這個問題我們應該首先定義『機器』和『智能』。一種可能性是根據大多數普通人的日常理解去定義這兩個概念，但這樣做是危險的。在這裡我並不打算定義這兩個概念，可能有人會說這項測試對機器而言過於嚴格，畢竟人類也無法反過來成功偽裝成機器，這隻需檢查算術的速度和正確度即可辨別。難道被認為擁有智能的機器就不能表現出和人類不同的行為么？這是一個很有力的反對意見，但至少不管怎樣，假如我們有能力製造出一個可以成功通過測試的機器的話，也就無需為這個反對意見煩惱了。」

作為被廣泛應用的人工智慧測試方法，圖靈測試經常用來檢驗機器是否具備人的智能，但總體看，圖靈測試的方法受人為因素干擾太多，嚴重依賴於裁判者和被測試者的主觀判斷，因此往往有人在沒有得到嚴格驗證的情況下宣稱其程序通過圖靈測試，例如2014年6月英國雷丁大學客座教授凱文?沃維克宣稱一款名為「尤金?古特曼（Eugene Goostman）」的計算機軟體通過了測試，但是測試結果充滿爭議，例如機器人只要能夠通過30%的評判標準即可被判定通過圖靈測試，另外這個計算機軟體通過扮演一名年僅13歲，且第二外語為英語的男孩讓參與測試的裁判大幅度降低了測試難度。

中國科學院自動化所研究員王飛躍在「關於人工智慧九個問題」中也對圖靈測試存在的問題進行了討論，他的意見主要有以下兩點：

（1）第一點是人類的智能並不是一個單一的對象，而是有多個類別組成，同樣人工智慧對應也是多類別組成。圖靈測試究竟測試的那些類別並不明確，從實踐上看，目前圖靈測試僅僅局限在語言智能等特定小領域裡，不具備代表性。

（2）圖靈測試並不是考官對一台計算機測試後就可以宣布其是否擁有智能，圖靈測試的本意是指一個廣義的人類做個為整體的考官，其測試的時間段也不是具體的一段時間而是廣義的時間段，即所有的人類在所有時間都分辨不出人與機器之後，才算其人類智能與人工智慧等價。

從上述討論可以看出，圖靈測試只對人工智慧系統是否具有人類智能回答「是」或「否」，並不對人工智慧系統的發展水平進行定量分析，而且測試的智能或智力種類還過於單一；在測試方法上存在漏洞，容易被測試者找到漏洞從而產生作弊行為，從上述存在的問題看，圖靈測試目前還無法承擔定量分析智能系統智力發展水平的需求。

二.圖靈測試的局限性導致的爭論和誤導

因為圖靈測試的局限性，導致後來關於人工智慧是否超越人類的問題產生了巨大的爭議。谷歌技術總監《奇點臨近》作者雷·庫茲韋爾（Ray Kurzweil）預言人工智慧將超過人類智慧。他在書中寫道」由於技術發展呈現指數式的增長，機器能模擬大腦的新皮質，到2029年機器將達到人類的智能水平；到2045年人與機器將深度融合，那將標誌著奇點時刻的到來[4]」。

物理學家霍金患有肌萎縮側索硬化症（ALS），使用英特爾公司開發的一套通信系統和外界交流。這套系統涉及基本的人工智慧技術，可以接收霍金的想法，從而提出詞語供他選用。當被問到如何改進這套系統的時候，霍金提出了人工智慧可以毀滅人類的想法。

霍金表示，截至目前，基礎性的人工智慧技術已經取得一定成果，很有實用價值。不過，霍金擔心，人工智慧也許會在將來的某一天趕上甚至超過人類。霍金說：「它自己就動起來了，還能以前所未有的超快速度重新設計自己。人類呢，就要受到緩慢的生物進化的限制，根本沒有競爭力，會被超越的。」

特斯拉CEO馬斯克對待人工智慧的態度比較極端，2014年8月，他在Twitter推薦尼克-伯斯特羅姆的著作《超級智能：方法、危險和策略》時寫到：「我們需要超級關注人工智慧，它的潛在危險性超過核武器」。

微軟創始人比爾·蓋茨2015年1月29日在Reddit的「Ask Me Anything」論壇上表示人類應該敬畏人工智慧的崛起，它可能將最終構成一個現實性的威脅，但它在此之前會使我們的生活更輕鬆，他的原話是「我正在關注超級智能。首先在開始的時候機器會為我們做很多工作，這些機器並不是超級智能。如果我們處理得很好的話，這應該是具有積極意義的。那之後的幾十年，人工智慧會強大到足以引起人們的關注。我同意伊隆·馬斯克和其他一些人的說法，不明白為什麼有些人並不關心。」

在人工智慧威脅論熱度日益高漲的情況下，人工智慧領域科學家對人工智慧威脅論也提出了反駁意見。Facebook人工智慧實驗室主任，NYU計算機科學教授Yann LeCun 2014年4月在接受IEEE 《Spectrum》採訪時發表了對人工智慧威脅論的看法，他認為人工智慧研究者在之前很長的一段時間都低估了製造智能機器的難度。人工智慧的每一個新浪潮，都會帶來這麼一段從盲目樂觀到不理智最後到沮喪的階段。

Yann LeCun 提出了與威脅論支持者不同的人工智慧未來發展路徑，他提到大部分人覺得人工智慧的進展是個指數曲線，其實它是個S型曲線，S型曲線剛開始的時候跟指數曲線很像，而且奇點理論比指數曲線還誇張，它假設的是漸進曲線，線性、多項式、指數和漸進以及S曲線的動態演變，都跟阻尼和摩擦因子有關係，而未來學家卻假設這些因子是不存在的。未來學家生來就願意做出盲目的預測，尤其是他們特別渴望這個預測成真的時候，可能是為了實現個人抱負。

除了Facebook人工智慧實驗室主任Yann LeCun，百度首席科學家，斯坦福大學計算機科學系和電子工程系副教授吳恩達，中國科學院自動化所教授，人工智慧領域專家王飛躍等也在不同場合對人工智慧威脅論提出了反對意見。應該說人工智慧威脅論引發爭論背後，本質上是人工智慧的智力發展水平能不能定量評測的問題。

三.互聯網，人工智慧和人類大腦的聯合智商的提出背景

我們在中國腦計劃顛覆性創新之路系列文章中已經闡述，「互聯網正在向著與人類大腦高度相似的方向進化，它將具備自己的視覺、聽覺、觸覺、運動神經系統，也會擁有自己的記憶神經系統、中樞神經系統、自主神經系統。"

於此同時隨著博客、社交網路、以及雲計算、物聯網等技術的興起，互聯網上數據信息正以前所未有的速度增長。互聯網用戶的互動、企業和政府的信息發布、物聯網感測器感應的實時信息每時每刻都在產生大量結構化和非結構化數據，這些數據分散在整個互聯網網路體系內，體量極其巨大。這些數據中蘊含了對經濟、科技、教育等等領域非常寶貴的信息。這就是互聯網大數據興起的根源和背景。

與此同時，深度學習為代表的機器學習演算法在互聯網領域的廣泛使用，使得互聯網大數據開始與人工智慧進行更為深入的結合，這其中就包括在大數據和人工智慧領域領先的世界級公司，如百度、谷歌、微軟等。2011年谷歌開始將「深度學習」運用在自己的大數據處理上，提出了「谷歌大腦」計劃[53]。此後百度推出了百度大腦計劃，科大訊飛提出訊飛超腦計劃。2015年百度創始人李彥宏提出了「中國大腦」計劃。

從上述研究和技術趨勢看，互聯網將形成一個與人類大腦高度相似的互聯網大腦結構。既然大腦最顯著的特徵是具有智力，那麼我們有可能借鑒對人類智力的研究方法對互聯網大腦和因為互聯網而崛起的人工智慧的智力問題進行研究，從而形成互聯網，人工智慧和人類大腦的聯合智商 Giq　General intelligence　quotient 。

進行互聯網，人工智慧和大腦的聯合智商問題研究，也將有非常重要的現實意義，這些意義包括幫助基於互聯網大數據的人工智慧系統提高智能發展水平，發現進一步優化和改良的方法；定量分析人工智慧系統與人類測試對照組的智力發展差異等。

四.關於互聯網大腦智商的定義

在互聯網誕生早期，人們只能通過互聯網進行簡單的Email通訊，或利用ftp工具上傳和下載文件。到2013年，以谷歌為代表的搜索引擎能夠高效率的識別自然語言文字，並將搜索結果反饋給用戶；蘋果公司的Sari系統可以以較高的識別率理解用戶的語音指令，並執行相應的操作如撥打電話，報告天氣等。

這些現象說明互聯網已經開始具備初步的智能並不斷增長。由於互聯網是由互聯網諸多系統或應用組成，譬如電子公告牌、搜索引擎、社交網路、電子郵箱、即時通訊軟體（IM）等，這些互聯網應用具備或高或低的智力水平，它們的智力水平共同決定了互聯網智力水平的高低。

衡量互聯網智力水平高低的方式主要有兩種，第一種是智力水平最高的那個應用決定互聯網智力水平；第二種是各互聯網應用聯合起來，相互彌補對方不足，共同決定互聯網智力水平，從實踐看，第二種方式更能客觀的反應互聯網的智力水平，因此本文將根據第二種方法對互聯網的智力水平衡量進行研究。

作為一個龐大的系統，互聯網經過近45年的發展，已經包含了成千上萬的應用和子系統，由於發展迅速，互聯網每天也都在出現新的應用。在進行互聯網的智商測試時，如果把所有的互聯網應用和子系統都囊括進去，在實踐中很難實現。

學習股票指數選取樣本企業的方法，我們可以選取普及率高、相對成熟的互聯網應用建立互聯網智商標準評測庫進行測試，互聯網智商標準評測庫根據互聯網的發展定期進行增加或刪減。這樣可以規避互聯網應用過於繁多，同時消失和出現過於頻繁的問題。譬如我們可以建立如下類似的互聯網智商標準評測庫（IA），示例如下：

IA={Google，Facebook，Blogger，Amazon，Yahoo，Youtube，sina，Quora，Wikipedia，Twitter，Baidu}

通過互聯網智商標準評測庫（IA）的建立，測試整個互聯網在某一時間點的智商也就成為可能。進行測試時，一個測試題如果評測庫中有一個應用能夠通過。則認為整個互聯網能夠通過該題測試；如果所有應用都無法通過該題測試，則認為整個互聯網目前無法通過該測試題。根據以上研究思路，參考前人關於智商的研究成果，本文提出互聯網和互聯網應用系統的智商定義：

定義一：互聯網應用智商IQ，是通過一系列標準測試，測量某一個互聯網應用（如電子公告牌、搜索引擎、社交網路、電子郵箱、即時通訊軟體等）在測試時間點的智力發展水平，也就是該實時間點該應用的互聯網應用智商。

定義二：互聯網智商IQ，是通過一系列標準測試對互聯網智商標準評測庫（IA）進行測量，將測試結果加權平均後，得出互聯網在被測試時間點的智力發展水平，也就是該時間點的互聯網智商。

五.互聯網，AI和大腦的聯合智商的模型建立和測試方法

人工智慧定量評測目前面臨兩個重要挑戰：第一，人工智慧系統目前沒有形成統一的模型；第二，人工智慧系統與以人類為代表的生命體之間目前沒有形成統一的模型。

這兩個挑戰都指向了同一個問題，即對於所有的人工智慧系統和所有生命體（特別是以人類為代表的生命體）需要有一個統一的模型進行描述，只有這樣才能在這個模型上建立智力測量方法並進行測試，從而形成統一的、可進行相互比較的智力發展水平評價結果。

從2014年開始，中國科學院虛擬經濟與數據科學研究中心，北京交通大學研究團隊針對如何定量分析互聯網，AI和大腦的聯合智商進行了研究，研究參考了馮·諾伊曼結構、戴維·韋克斯勒人類智力模型、知識管理領域DIKW（Data, Information, Knowledge, Wisdom，數據、信息、知識、智慧）模型體系等。我們分別在2014年和2015年發表論文提出建立「標準智能模型」，統一描述人工智慧系統和人類的特徵和屬性。

其中，馮·諾伊曼結構的啟發是：標準智能系統模型應包含輸入/輸出系統，能夠從外界獲取信息，能夠將內部產生的結果反饋給外部世界。只有這樣，標準智能系統才能成為「活」的系統。

戴維·韋克斯勒關於人類智能的定義給我們的啟發是：智力能力由多個要素組成，而非圖靈測試或視覺圖靈測試那樣只關注智力能力的一個方面。

DIKW模型體系的啟發是：智慧是一種解決問題、積累知識的能力；而知識是人類不斷與外界交互後沉澱下來結構化的數據和信息。一個智能系統不僅僅要掌握知識，更重要的是還要有解決問題的創新能力。這種對知識的掌握能力、解決問題的創新能力與戴維·韋克斯勒理論、馮·諾伊曼架構相結合，就可以形成智能系統智力能力的多層次結構「標準智能模型」，這個模型對於建立互聯網，AI和大腦的聯合智商奠定了理論基礎。如下圖所示。

根據上述研究，可提出標準智能系統的判定標準：任何系統（包括互聯網大腦，人工智慧系統、人類等生命系統），如果符合如下特徵，就可以認為這個系統屬於標準智能系統。

● 特徵1：能通過聲音、圖像、文字等方式（包括但不限於這三種方式）從外界獲取數據、信息和知識的能力。

● 特徵2：能夠將從外界獲取的數據、信息和知識轉化為系統掌握的知識。

● 特徵3：能根據外界數據、信息和知識所產生的需求，通過運用所掌握的知識進行創新的能力。這些能力包括但不限於聯想、創作、猜測、發現規律等，這種能力運用的結果可以形成自身掌握的新知識。

● 特徵4：能夠通過聲音、圖像、文字等方式（包括但不僅限於這三種方式）將系統產生的數據、信息和知識反饋給外界或對外界進行改造。

2014年，中國科學院虛擬經濟與數據科學研究中心，北京交通大學研究團隊在標準智能模型的基礎上構建了互聯網，AI和大腦智商評測量表。從信息或知識的輸入、輸出、掌握和創新等四大方面建立人工智慧智商評價體系，並在此基礎上建立圖像、文字、聲音識別、常識、計算、翻譯、創作、挑選、猜測、發現等十五個小類，形成互聯網，AI和大腦評測量表。用這個對世界50個搜索引擎和3類不同年齡段人群進行了「互聯網，AI和大腦聯合智商測試」，測試結果發現目前人工智慧系統的智商遠遠低於人類智商，評測最高的谷歌系統尚不及6歲兒童智商的一半，見表1。

2016年2月，中國科學院大學劉穎團隊開展「2016年互聯網，AI和大腦智商測試」，目前已對谷歌、百度、搜狗等人工智慧系統以及蘋果Siri、微軟小冰等進行了測試，工作還在進行中。不過從已完成的工作看，谷歌、百度等人工智慧系統的性能比兩年前已有大幅提高，但仍與6歲兒童有較大差距。

九、從AI、互聯網到大腦的7個智能分級

中國腦計劃顛覆性創新之路八，擴展馮諾依曼架構，從AI，互聯網到大腦的7個智能分級

我們在中國腦計劃顛覆性創新之路七中，提出建立人工智慧，互聯網和人類大腦的聯合智商問題，並建立描述人工智慧，互聯網和人類大腦共同特徵的標準智能模型，根據這個模型，我們在本文將對馮諾依曼架構進行擴充，以此為基礎，對人工智慧，互聯網和人類大腦等諸多智能系統進行分級處理，這個研究對於探討智能系統的未來發展方向起到引導作用，並為中國腦計劃顛覆性創新之路第九章關於生命進化方向問題研究奠定基礎。

2015年以來，「人工智慧」成為科技界和產業界最熱門的詞語。智能冰箱、智能空調、智能手錶和智能機器人，還有谷歌、百度各自的人工智慧大腦等新產品不斷湧現。但與此同時，人工智慧威脅論也甚囂塵上。我們能否通過研究人工智慧產品和系統的智商發展水平並與人類智商進行對比，從而為解決人工智慧威脅論問題尋找定量的分析方法呢？

標準智能模型和人工智慧智商測試

從2014年開始，中國科學院虛擬經濟與數據科學研究中心和北京交通大學團隊針對如何定量分析人工智慧與人類智慧的關係進行了研究，研究參考了馮·諾伊曼結構、戴維·韋克斯勒人類智力模型、知識管理領域DIKW（Data, Information, Knowledge, Wisdom，數據、信息、知識、智慧）模型體系等。分別在2014年和2015年發表論文提出建立「標準智能模型」，統一描述人工智慧系統和人類的特徵和屬性。

其中，馮·諾伊曼結構給我們的啟發是：標準智能系統模型應包含輸入/輸出系統，能夠從外界獲取信息，能夠將內部產生的結果反饋給外部世界。只有這樣，標準智能系統才能成為「活」的系統。

戴維·韋克斯勒關於人類智能的定義給我們的啟發是：智力能力由多個要素組成，而非圖靈測試或視覺圖靈測試那樣只關注智力能力的一個方面。

DIKW模型體系給我們的啟發是：智慧是一種解決問題、積累知識的能力；而知識是人類不斷與外界交互後沉澱下來結構化的數據和信息。一個智能系統不僅僅要掌握知識，更重要的是還要有解決問題的創新能力。這種對知識的掌握能力、解決問題的創新能力與戴維·韋克斯勒理論、馮·諾伊曼架構相結合，就可以形成智能系統智力能力的多層次結構「標準智能模型」，如圖1所示。

根據上述研究，可提出標準智能系統的判定標準：任何系統（包括人工智慧系統、人類等生命系統），如果符合如下特徵，就可以認為這個系統屬於標準智能系統。

● 特徵1：能通過聲音、圖像、文字等方式（包括但不限於這三種方式）從外界獲取數據、信息和知識的能力。

● 特徵2：能夠將從外界獲取的數據、信息和知識轉化為系統掌握的知識。

● 特徵4：能夠通過聲音、圖像、文字等方式（包括但不僅限於這三種方式）將系統產生的數據、信息和知識反饋給外界或對外界進行改造。

2014年，我們在標準智能模型的基礎上構建了人工智慧智商評測量表。從信息或知識的輸入、輸出、掌握和創新等四大方面建立人工智慧智商評價體系，並在此基礎上建立圖像、文字、聲音識別、常識、計算、翻譯、創作、挑選、猜測、發現等十五個小類，形成人工智慧智商評測量表。我們對世界50個搜索引擎和3類不同年齡段人群進行了「人工智慧智商測試」，測試結果發現目前人工智慧系統的智商遠遠低於人類智商，評測最高的谷歌系統尚不及6歲兒童智商的一半，見表1。

2016年2月，我們和中國科學院大學劉穎團隊開展「2016年人工智慧智商測試」，目前已對谷歌、百度、搜狗等人工智慧系統以及蘋果Siri、微軟小冰等進行了測試，工作還在進行中。不過從已完成的工作看，谷歌、百度等人工智慧系統的性能比兩年前已有大幅提高，但仍與6歲兒童有較大差距。

擴展的馮·諾伊曼架構

標準智能模型的建立參考了馮·諾伊曼架構。馮·諾伊曼架構由計算器、邏輯控制裝置、存儲器、輸入系統和輸出系統五個部分構成。通過對比圖1和圖2的差別能夠發現，馮·諾伊曼架構可以補充兩個部分。通過這種補充，我們得以將人、機器以及人工智慧系統用一個更為明晰的方式表示出來。

第一個補充是創新創造功能，即能夠根據已有的知識，發現新的知識元素和新的規律，使之進入到存儲器，供計算機和控制器使用，並通過輸入/輸出系統與外部進行知識交互。第二個補充是能夠進行知識共享的外部知識庫或雲存儲器，而馮·諾伊曼架構的外部存儲只為單一系統服務。因此，對馮·諾伊曼架構進行擴展，可形成新的架構（見圖3）。

人工智慧系統智能等級分級標準

在研究的過程中還發現，無論在自然界還是人類社會，即使是智商相同的人工智慧系統，因其所在關鍵領域仍然存在巨大差異，也都存在智能和知識的分級現象。譬如，螞蟻、魚、猴子和人類，雖然都屬於生命系統，但其種群個體都存在智能的差異。人類的教育體系也存在分級，例如本科、碩士、博士的分級。等級內部進行考核區分優劣，但在不同等級間，需要在知識、能力、資歷上有明顯提升和考核才能升級。

回到人工智慧系統的智商測試上，應如何區分智能系統因在關鍵領域功能不同而產生的巨大差異呢？上述研究中提到的「標準智能模型」（擴展的馮·諾伊曼架構）給了我們啟發，判斷標準如下：

● 能不能和測試者（人類）進行信息交互，也就是有沒有輸入/輸出系統；

● 系統內部有沒有能夠存儲信息和知識的知識庫；

● 這個系統的知識庫能不能不斷更新和增長；

● 這個系統的知識庫能不能與其他人工智慧系統進行知識共享；

● 這個系統除了從外部學習並更新自己的知識庫之外，能不能主動產生出新的知識並分享給其他人工智慧系統。

人工智慧系統的7個智能等級分級

對於人工智慧系統的第0級系統，其基本特徵在理論上存在，但現實中並不存在這樣的人工智慧系統。在擴展的馮·諾伊曼架構延伸出來的分級規則中，可以做一些組合，例如可以信息輸入，但不能信息輸出；或者可以信息輸出，但不能信息輸入；或者可以創新創造，但知識庫不能增長。對於這些在現實中不能或無法找到對應系統範例的案例，我們將其統一划歸到「人工智慧系統的第0級系統」，也可以叫「人工智慧系統的特異類系統」。

對於人工智慧系統的第1級系統，其基本特徵是無法與人類測試者進行信息交互。例如有一種被稱為泛靈論的思想認為天下萬物皆有靈魂或自然精神，一棵樹和一塊石頭都和人類一樣，具有同樣的價值與權利。當然，這種觀點從科學的角度看，只能算作猜想或哲學思考。從「能不能和測試者（人類）進行信息交互」的分級規則看，因為石頭等物體不能與人類進行信息交互，也許它內部有知識庫，能夠創新知識，或者能夠與其他石頭進行信息交互，但對人類測試者來說則是黑箱，不能讓人了解。因此不能與測試者（人類）進行信息交互的物體和系統可以定義為「人工智慧系統的第1級系統」，符合第1級分類的範例有石頭、木棍、鐵塊以及水滴等等不能與人類進行信息交互的物體或系統。

對於人工智慧系統的第2級系統，其基本特徵是能夠與人類測試者進行交互，存在控制器和存儲器，即馮·諾伊曼架構描述的系統，因此很多家用電器被稱作智能家電，如智能冰箱、智能電視、智能微波爐和智能掃地機。這些系統大多有一個特點，即雖然它們內部或多或少有控制程序信息，但一旦出廠，就無法再更新它們的控制程序，不能進行升級，更不會自動地學習或產生新的知識。譬如智能洗衣機，人們按什麼鍵，洗衣機就啟動什麼功能。從購買到損壞，其功能都不會發生變化（故障除外）。這種系統能夠與人類測試者和使用者進行信息交互，符合馮·諾伊曼架構描述的特徵，而且它的控制程序或知識庫從誕生時起就不再發生變化，這種系統可以定義為「人工智慧系統的第2級系統」，範例包括日常見到的掃地機器人、老式的家用電冰箱、空調、洗衣機等等。

對於人工智慧系統的第3級系統，其基本特徵是除具備2級系統的特徵外，其控制器、存儲器中包含的程序或數據可不聯網進行升級或增加。例如家用電腦和手機是我們常用的智能設備，它們的操作系統往往可以定期升級。例如，電腦的操作系統可從Windows1.0升級到Windows10.0，手機的操作系統可從Android1.0升級到Android5.0，這些設備的內部應用程序也可以根據不同的需要不斷更新升級。這樣，家用電腦、手機等設備的功能會變得越來越強大，可以應對的場景也越來越多。除了家用電腦，很多家用電器、機器人也都開始留有介面，可以通過外接設備進行系統升級。這一類系統明顯比第2級智能系統適應性更強。這種系統能夠與人類測試者、使用者進行信息交互，但不能與其他系統通過「雲端」進行信息交互，其控制程序或知識庫只能接受USB、光碟等外接設備進行程序或信息升級的系統，可以定義為「人工智慧系統的第3級系統」，範例包括智能手機、家用電腦、單機版的辦公軟體等。

對於人工智慧系統的第4級系統，其基本特徵除了包含3級系統的特徵外，最重要的是可以通過網路與其他智能系統共享信息和知識。2011年歐盟資助了一個叫作RoboEarth的項目，該項目旨在讓機器人可以通過互聯網分享知識。幫助機器人相互學習、共享知識，不僅能夠降低成本，還會幫助機器人提高自學能力、適應能力，推動其更快、更大規模地普及。雲機器人的這些能力提高了其對複雜環境的適應性。這類系統除了具備3級系統的功能，還多了一個重要的功能，即信息可以通過雲端進行共享，因此這種系統能夠與人類測試者、使用者進行信息交互，可以通過「雲端」進行信息交互，進行程序或信息升級。但這類系統所有的信息都是直接從外部獲得，其內部無法自主地、創新創造性地產生新的知識。這種系統可以定義為「人工智慧系統的第4級系統」，範例包括谷歌大腦、百度大腦、RoboEarth雲機器人、B/S（Browser/Server，瀏覽器/伺服器）架構的網站等。

對於人工智慧系統的第5級系統，最基本的特徵就是能夠創新創造，識別和鑒定創新創造對人類的價值，以及將創新創造產生的成果應用在人類的發展過程中。我們在擴展的馮·諾伊曼架構時，對原來的馮·諾伊曼架構增加了創新知識模塊，就是試圖把人納入到擴展的人工智慧系統概念中，人類可以看作是大自然構建的特殊「人工智慧系統」。與前四個等級不同，人類等生命體最大的特徵就是可以不斷地創新創造，如發現萬有引力、元素周期表，撰寫出新小說，創造新的音樂、畫作等等，然後通過文章、信件、電報，甚至互聯網進行傳播和分享。不斷地進行創新創造，並能夠識別創新創造對自身的用處，這讓人類佔據了地球生態環境下的智力制高點。因此，這種系統能夠與人類測試者使用者進行信息交互，可以創新創造出新的知識，並可以通過文章、信件、電報甚至互聯網這樣的「雲端」進行信息交互，這種系統可以定義為「人工智慧系統的第5級系統」。人類是第5級人工智慧系統最突出的範例。

對於人工智慧系統的第6級系統，最基本的特徵就是隨著時間的向前推進，並趨向於無窮點時，不斷創新創造產生新知識的智能系統其輸入輸出能力，知識的掌握和運用能力也將趨近於無窮大，按照基督教對於上帝的定義「全知和全能」，可以看出智能系統在不斷創新創造和不斷積累知識的情況下，在足夠的時間裡以人類為代表的智能系統將最終實現「全知全能」的狀態，從這個角度看，無論是東方文化的」神「，或西方文化中的「上帝」概念，從智能系統發展的角度看，可以看作是智能系統（包括人類）在未來時間點的進化狀態。

谷歌AlphaGo屬於智能的第幾等級

2016年3月，谷歌AlphaGo（阿爾法狗）與韓國圍棋世界冠軍李世石進行了舉世矚目的圍棋比賽，並以大比分獲得勝利。那麼AlphaGo屬於人工智慧系統的第幾級？我們可以根據上述規則進行評定。

因為AlphaGo可以與棋手進行比賽，具有龐大的運算系統和數據存儲系統，因此具備第2級系統的條件。在谷歌的研發過程中，AlphaGo的策略訓練模型版本通過不斷進行大量數據訓練而不斷升級，從2016年1月與歐洲冠軍對戰，到2016年3月與韓國圍棋世界冠軍李世石比賽，AlphaGo的軟硬體系統也獲得很大提升，因此AlphaGo具備了第3級系統的條件。

從公開的資料看，AlphaGo雖然可以通過網路實現大量CPU和GPU協同工作，但由於保密性或階段性問題，谷歌目前還沒有在互聯網上開放AlphaGo程序接受用戶的在線挑戰，因此AlphaGo不具備第4級智能系統條件。

關於AlphaGo是否具備創新創造性問題，我們認為它依然是依託人工支持的大數據訓練形成的策略模型，同時在比賽中結合比賽對手的落點數據，根據其內部的運算規則，來不斷形成自己的落點數據，這些落點數據最終形成比賽數據集合。AlphaGo根據圍棋規則與對手的比賽數據集合進行計算和比較，判斷輸贏，整個過程完全在人類設定的規則下運行，無法體現其自身的創造性，如圖4所示。

即使AlphaGo形成的落點數據集合很可能是人類歷史上沒有出現過的，也不能說明AlphaGo具備了獨立的創新創造功能。例如，我們用計算機程序實現下述過程：從1萬到100萬的自然數中隨機選取兩個數進行相乘，記錄相乘結果，重複此過程361次，即使得出的自然數集合很大，並且可能是人類歷史上沒有出現過的，我們也不能認定該計算機程序具有創新創造性。

如果AlphaGo在沒有人類提供數據的情況下，能夠主動獲取棋譜，自動設計程序進行模擬對戰，學習經驗，並用於改變自己的訓練模型，用於實戰比賽，戰勝對手，那麼在這種情況下，我們才可能認為AlphaGo具備創新性。但從人工智慧的發展過程看，AlphaGo還完全無法實現這一點。因此，綜合來看，AlphaGo的智能等級被評定為3級，與人類相差兩個級別。

工作意義和後續工作

對人工智慧系統進行智商測試和智能等級分級，有助於我們更好地對這些智能系統進行分類和評判，同時為低等級智能系統的發展方向提供支持。

根據上述研究我們可以每年利用人工智慧智商測試方法對相關智能系統進行測試，以此為基礎分析不同測試對象的人工智慧智商的發展狀況，從而發現這些同類產品在人工智慧領域的發展差異，測試數據對於這些產品研究競爭對手發展趨勢將具有實用價值。另一方面，每年根據測試結果，選取智商最高的人工智慧系統和人類測試者智商作為代表，標註在圖6.1上。以此作為判斷人工智慧與人類智慧未來發展關係的基礎，從而作為判斷前文提到的兩條人工智慧發展曲線究竟那一條更符合客觀事實。

進化的方向，突破達爾文進化論局限

前言：本文是中國腦計劃顛覆性創新之路的第九篇文章，本文從腦科學，互聯網和人工智慧三個角度探討了生命進化的方向和目標問題。本文是中國腦計劃顛覆性創新之路最後一篇文章，但不是結束。相反，這篇文章提出生命進化的方向性問題是一個新的重要課題。它將可以延伸出更為廣闊的空間。某種意義上，這篇文章也可以算作新研究的開篇

一.達爾文進化論關於生物進化沒有方向的觀點

19世紀中葉，達爾文創立了科學的生物進化學說，以自然選擇為核心的達爾文進化論作為人類科學史最偉大的理論之一。統一了生物學的各個學科。達爾文進化論的影響不僅僅局限在生物學領域，也提供了一種全新的世界觀、生命觀、宇宙觀和方法論，對幾乎所有的科學和人文領域產生影響。

達爾文的進化論排斥了目的論（這被邁爾讚譽為其偉大的貢獻之一），達爾文主張變異是隨機的，用比上帝一點也不遜色的「自然」一詞來解釋其所精心構建的進化理論的核心。但是，達爾文也有其困惑和無奈，他感嘆道「這廣闊無垠、奇妙無比的宇宙……竟然是盲目的機遇或必然的產物感到非常難於甚至無法理解」(2-謝平. 2014. 生命的起源—進化理論之揚棄與革新.北京：科學出版社)

達爾文進化論認為生物進化並不是從低級到高級的進化，人類並不比其他生物高級，達爾文把生物進化過程設想成一棵不斷地生長、分支的大樹，現存的所有生物都位於這棵樹的某個小分支的頂端，很難說哪一種更高級，在同時存在的生物種類之間作高低級的比較是沒有意義的。進化沒有預定的方向，進化樹不存在一個以人類為頂端的主幹，人類只是進化樹上一個普普通通的分支。從達爾文進化論的角度看，人並不比老鼠，螞蟻更為高級，人類並不能代表生物的發展方向。

二.從腦科學，互聯網和人工智慧分別闡述生命的進化方向問題

達爾文進化論關於生命沒有方向的觀點在新的科技進展下會不會有新的進展和突破。我們下面分別從腦科學，互聯網和人工智慧的研究進展探討這個問題。提出腦科學，互聯網和人工智慧的進展將聯合從不同角度展示出生命進化的方向和目標。

1.從腦的結構進化看生命的進化方向問題

諾貝爾獎獲得者澳大利亞科學家John.C.Eccles在其著作《腦的進化》中就提到「生物的大腦是從魚的大腦進化到爬行動物的大腦，再進化到哺乳動物的大腦，最後進化到人類的大腦。如果解剖人腦，我們可以清晰的看到類魚、類爬行動物、類哺乳動物的結構在人腦中涇渭分明。「。

雖然生物的表現形式千差萬別，但生物的核心-大腦確表現出明顯的方向性，從單細胞到人類，大腦越來越複雜，智慧程度越來越高。到達人類這個最高點之後，生物的的進化出現新的形式，人通過互聯網聯合在一起共同進化。

2.從互聯網的結構進化看生命的進化方向問題

在前面的系列文章中，提到關於互聯網進化研究有這樣的結論「互聯網將向著與人類大腦高度相似的方向進化，它將具備自己的視覺、聽覺、觸覺、運動神經系統，也會擁有自己的記憶神經系統、中樞神經系統、自主神經系統。

另一方面，人腦至少在數萬年以前就已經進化出所有的互聯網功能，不斷發展的互聯網將幫助神經學科學家揭開大腦的秘密。科學實驗將證明大腦中也經擁有Google一樣的搜索引擎，Facebook一樣的SNS系統，IPv4一樣的地址編碼系統，思科一樣的路由系統。。。」

當生物進化到人這個程度之後，人類通過互聯網聯合在一起共同進化。而這種共同進化的結果是。連接了人類的互聯網，在結構上與大腦一步步走向高度相似，在空間上隨著人類的擴張不斷向外太空蔓延，如果有足夠的時間，可以預見到在無窮時間點，宇宙，大腦，和互聯網三者將合為一體，進化成為宇宙大腦或智慧宇宙。

達爾文進化論的結論是向前推導的，即生物有共同的祖先，通過自然選擇，人這種物種出現了。互聯網進化論的結論是向後推導的，認為人通過自己創造的技術和工具互聯網向著宇宙大腦或智慧宇宙的方向進化。「人「這個要素將互聯網的進化和生物的進化連接起來。

3.從人工智慧發展的智力等級看生命的進化方向問題

在中國腦計劃顛覆性創新之路第八章中提到，基於對馮諾依曼架構的擴展，人工智慧發展的智力等級可以分為7個等級，分別是：

1.人工智慧系統的第0級系統，其基本特徵在理論上存在，但現實中並不存在這樣的人工智慧系統。

2.人工智慧系統的第1級系統，其基本特徵是無法與人類測試者進行信息交互。

3.人工智慧系統的第2級系統，其基本特徵是能夠與人類測試者進行交互，存在控制器和存儲器，即標準的馮·諾伊曼架構描述的系統

4.人工智慧系統的第3級系統，其基本特徵是除具備2級系統的特徵外，其控制器、存儲器中包含的程序或數據可不聯網進行升級或增加。

5.人工智慧系統的第4級系統，其基本特徵除了包含3級系統的特徵外，最重要的是可以通過網路與其他智能系統共享信息和知識。

6.人工智慧系統的第5級系統，最基本的特徵就是能夠創新創造，識別和鑒定創新創造對人類的價值，以及將創新創造產生的成果應用在人類的發展過程中。

7.人工智慧系統的第6級系統，最基本的特徵就是隨著時間的向前推進，並趨向於無窮點時，不斷創新創造產生新知識的智能系統其輸入輸出能力，知識的掌握和運用能力也將趨近於無窮大。

對於第六級智能系統，按照西方對於上帝的定義「全知和全能」，可以看出智能系統在不斷創新創造和不斷積累知識的情況下，在足夠的時間裡以人類為代表的智能系統將最終實現「全知全能」的狀態，從這個角度看，無論是東方文化的」神「，或西方文化中的「上帝」概念，從智能系統發展的角度看，可以看作是智能系統（包括人類）在未來時間點的進化狀態。

三.知識和智慧的提升是生物進化的方向，全知全能是生物進化的目標

從上面的闡述看，無論是腦的架構進化，互聯網的架構進化，人工智慧系統的智力等級進化都表現出明顯的方向性。對於這三個領域，他們的共同點都是承載著生命的知識和智慧，並不斷進化和提升，達爾文進化論認為生物進化並不是從低級到高級的進化，人類並不比其他生物高級，正是因為沒有注意到知識和智慧的提升和進化才是生物進化的本質，只有從知識和智慧的角度才能發現生物進化的方向和生物等級的高低之分。

生物種群知識庫的膨脹速度是生物進化的焦點，其它生物的知識庫停滯，走向死胡同，因此在千萬年里沒有進一步的變化，在地球的生命圈中也處在越來越低的地位。而人類在進1萬年里，恰恰在知識和智慧的領域不斷擴展和加速，並因為互聯網和人工智慧的發明而得到進一步巨大飛躍，從而獲得了地球自然競爭的統治地位。

生物進化的方向就是用不斷擴大種群的知識庫和改造自然的能力，目標是實現對整個自然（生命圈，宇宙）的全知全能。本文研究並不是認為生物進化的這個方向和目的是神有意識的推動，而是另有原因。包括如何定量分析生物進化的方向和目標，突破達爾文進化論這一局限會對其他科學和社會領域產生什麼樣的影響。我們將在後續的文章不斷提出和闡述。