DeepMind研製阿爾法狗的使命當然不是要下贏圍棋
這幾天我一直在圍觀人們的反應,最想不明白的一點,其實是人們究竟怎麼開始把機器與人類放到對立的兩面?
圍棋是藝術,阿爾法狗是技術,它如何就會毀了圍棋呢?棋手們自己不是也說「(現在下棋)或多或少都會受到阿老師的影響吧,下棋會讓人感到更自由一些,沒有什麼招法是完全不能下的」(周睿羊,DeepMind博客視頻),「阿爾法狗帶給我們很多的新東西。現在呢,大家更多地去嘗試以前都沒有下過的各種下法」(時越,DeepMind博客視頻)
棋手們的意思難道不是說,AI促使人類棋手更加強大,更樂於創新嗎?
DeepMind創始人哈薩比斯
而對於人工智慧科學家而言,阿爾法狗的使命,更不是要在圍棋賽中打敗人類。他們之所以讓機器與頂尖的人類棋手互動,意在為「狗」提供一個不能用其他方式替代的學習環境。DeepMind創始人哈薩比斯自己在很多公開場合就不止一次地說過,是為了發現潛藏的通用知識(general knowledge)。「狗」,其實是一個通用智能體。
把DM的使命說得更冠冕堂皇些,何嘗不是人類對自身的進一步探索?
正如物理學家費曼教授那句留在黑板上的著名遺言,「我所不能創造的,都是我沒有真正懂得的」(What I cannot create, I do not understand),如果世界在人們眼裡是由外部世界和內心世界兩部分組成的話,也許「內心」世界更加根本,因為外部世界的存在狀態,根本還是取決於我們大腦對它的解釋。這便是人工智慧最引人入勝的地方:藉助於建造它來更好地了解我們自己,理解這個世界。
DeepMind所致力建造的這一類AI,有個名字,叫「受神經學啟發的AI」(neuralscience-inspired AI)。別忘了哈薩比斯本人就是倫敦大學學院的認知神經學博士,DM對人類身上最感興趣的部位叫做海馬體(Hippocampus)。按維基的說法:海馬體是人類及脊椎動物腦中的重要部分,位於大腦皮質下方,擔當著關於短期記憶、長期記憶,以及空間定位的作用。在阿茲海默病中,海馬體是首先受到損傷的區域:表現癥狀為記憶力衰退以及方向知覺的喪失。大腦缺氧(缺氧症)以及腦炎等也可導致海馬損傷。平常我們開玩笑時愛說的「老痴」或「腦殘」都跟這個海馬體相關。
我們需要記住,DM的AI有兩個關鍵詞,一是通用,一是學習。他們所有的演算法都從元數據開始進行自主學習,從而掌握某項任務,這與預編程的人工智慧有本質的不一樣。此外,DM還強調,他們希望所有的系統能夠通用,也就是說,希望同一個系統,或同一套演算法可以有跨領域的廣泛應用。公眾所熟知的贏了國際象棋的IBM傳奇深藍,以及近年來的沃森系統,它們都仍然屬於窄AI範疇,也就是說,它們是為了解決某個特定問題量身打造的AI,因而只能解決那一類問題。
而阿爾法狗這一類DM的AI,事實上則可以被叫做「通用人工智慧」AGI(Artificial General Intelligence),目標既不針對特定任務,也無涉預編程。這就引出了眼下被熱議的「強化學習」技術(reinforcement learning)。
描述強化學習其實非常簡單,它有個一目了然的框架,框架內有兩個內容:系統和環境。這裡的「系統」就是我們說的AI,而它會發現自己處於某個「環境」當中,要達成某項目標。
「系統」與「環境」之間進行雙向交流:首先,它通過其感知儀器來對「環境」進行觀察,在DM的學習過程中,通常使用的是視覺,也就是說,「系統」觀察到的就是像素。這些觀察結果往往有很多「噪音」,並且信息不完整,因為現實世界本身就十分混亂,充滿干擾,而且永遠不可能對一件事獲得真正完整的信息。「系統」的任務,便是要在這樣的混亂條件下,創建一個可能的、最好的統計模型;這個最好的模型一旦建立,第二項任務,便是在當前的時間點上可供選擇的一系列行為中,選出最好的一個,向目標靠近。而一旦「系統」確定了某一個行為是最佳之後,「系統」隨即將這個行為作為輸出,並得以執行。其結果,有可能會,也有可能不會,對當前的「環境」帶來任何改變。但無論如何,它都成為新一輪觀察的驅動。所以這個「系統」儘管表面上看,可以通過這樣一個簡單的框架圖形來描述,但它事實上隱藏了很多的複雜性。
解決了隱藏其後的複雜性,其實就擁有了足夠的智能來進行幾乎一切學習。我們認同這個觀點,因為我們知道,包括人在內的所有脊椎動物,都是這樣來學習的。人類大腦中,完成這一「強化學習」過程的是多巴胺系統。
了解了創造出阿爾法狗的DM公司的通用智能使命,以及這一通用智能的學習原理之後,不難看出,各類遊戲其實都是其演算法的絕佳測試平台。一兩年前連線雜誌 「Wired」 就有過長文報道,DM最初使用經典的80年代雅達利遊戲(Atari )來測試他們的演算法。當AI在玩雅達利時,它所獲得的輸入沒有別的,就是純粹的像素,完全就像人在看著屏幕學,屏幕尺寸大概是200*150,所以它所得到的就是每幀3萬個點,目的也很簡單,一切從頭琢磨自學,為了拿高分。
在基本的學習能力具備後,再通過模擬海馬體的工作原理,來為智能體增加能力,例如學習抽象概念,以及增進長期記憶。
如果說AI是在利用包括棋類在內的遊戲來作為測試平台,達到提升功力的目的的話,它真正的目標可能更多地在於幫助人類完成更加關鍵的工作,例如與預測相關的醫療、氣候、能源、宏觀經濟等應用。這樣一來,人工智慧技術可以毫無疑問地被認為是眼下最重要的技術之一,更可能正是潛在的「元解決方案」(meta-solution),可以協助人類解決所有的其它問題。
提到「元解決方案」,不可避免的是與之相伴的倫理討論。在科幻作品、斷章取義的名人演說、雞毛令箭的媒體報道的共同作用下,AI所獲得的倫理關注尤其熱鬧。但是它與任何強大的新技術無異,技術本身是中立的,決定它是否符合倫理的,永遠是掌握技術的人。在此過程中,公眾、媒體、研究機構(企業)以及政府幾方的透明,對每一步的監管都因此變得至關重要。
阿爾法狗的創造者的使命是要將世界的信息組織起來,讓它更好地為全世界共享,換句話說,就是利用 AI或者AGI 來自動將無序的信息轉化為知識,從而利用這些知識使人類更加強大。因此,與世界最優秀的人工智慧專家一起,挖掘出暗藏在圍棋這一古老遊戲後面的智慧,促成技術的進步,這應當是烏鎮比武會上所有人的勝利吧。
原標題:DeepMind的使命不是要下贏圍棋
推薦閱讀:
※一群知名編劇惡評擺渡人 噴阿里影業糟蹋電影是他們的神聖使命
※我的使命
※我的使命: 幫助世界把恐懼轉換成開放和快樂
※憲政轉軌中法政學人的使命
※十幾歲孩子這些行為不是叛逆,是在完成自己成長的一個使命