李世石真正的對手——AlphaGo背後的「超級英雄」
第一財經資訊
綜合造就(xingshu100)、新浪、DT財經
3月9日可能會成為寫入人類史冊的一天——世界上最會下圍棋的人與人工智慧展開超級對弈。很遺憾,人類棋手李世石在前期優勢的情況下,首盤不敵「阿爾法狗」。而在賽前,李世石曾自信表示自己能夠贏滿5盤。
(比賽開始前,李世石手牽著女兒進入酒店,舉止看上去十分輕鬆淡定)
(韓國首爾,2016圍棋人機大戰現場)
(韓國首爾,2016圍棋人機大戰現場,李世石執黑子)
全世界都在圍觀這場超級博弈。據說王小川和王思聰他們開了個局,王小川支持谷歌圍棋程序,國民老公支持李世石……
(這是今天谷歌北京辦公室的食堂,真是應景啊……)
這場人機博弈可謂此起彼伏,終局前一個小時,所有人認為李世石已經佔據優勢,如果後面不犯錯誤的話,應該會贏。
但隨後不到一個小時的時間裡,局勢已經變成」如果電腦不犯特別低級的失誤,李世石基本輸了「。
最終谷歌AlphaGo擊敗李世石,贏得第一場比賽的勝利,直播間里,支持李世石的觀眾紛紛下線……
人工智慧技術真強大!
但在AlphaGo的背後
卻是一群人類的超級英雄!
下面,我們認識一下
「AlphaGo之父」德米斯·哈薩比斯(DemisHassabis)。
本文翻譯自《衛報》「Thesuperheroofartificialintelligence:canthisgeniuskeepitincheck?」一文。
德米斯·哈薩比斯
德米斯·哈薩比斯(DemisHassabis)這人很謙遜,沒什麼架子,但他一本正經地跟我說,他的志向是「先破解智能的奧秘,再用它破解其他的一切」。要是別人這樣說,我們聽過也就罷了。但哈薩比斯何許人也?他少年時期就拿到國際象棋大師頭銜,自己動手設計過遊戲,後來創辦了一家研究人工智慧的初創企業,名叫DeepMind,2014年作價6.25億美元賣給谷歌。他還拿到劍橋和倫敦大學學院的計算機科學和認知科學文憑。和他共事過的人都說,他這個人「高瞻遠矚」。他自己也說,有辦法讓科研變得很有效率,還說他領導著一個21世紀的阿波羅計劃。這個人其實貌不驚人,走在街上你都不會多瞧他一眼,但互聯網發明者蒂姆·伯納斯·李(TimBerners-Lee)說過,地球上最聰明的人中就包括哈薩比斯。其實人工智慧技術在當下已經無處不在。你每次「審問」Siri的時候,安卓每次給你推薦東西的時候,其實都是人工智慧在工作。眼下谷歌旗下產品都多多少少地得益於哈薩比斯的研究——雖說個人定製、搜索、YouTube、語音和面部識別都不是以「AI」之名示人。從更遠的角度來看,他在開發的這種技術可不只是情感機器人和更智能的手機這麼簡單。它大過谷歌,大過Facebook、微軟、蘋果等一眾科技巨頭。它囊括了我們所能想像到的一切,還有很多我們想像不到的東西。這野心是不是忒大了點兒?確實。當前的大多數AI系統都還很「狹隘」,最典型的就是訓練一套預編程的軟硬體,讓它掌握某項特定的任務,其它的則什麼都不會。
所以,IBM的「深藍」能打敗國際象棋大師加里·卡斯帕羅夫(GaryKasparov),但你讓它跟三歲小孩兒下五子棋,它就又傻眼了。哈薩比斯的做法不一樣,他想用從人腦中得到的啟發,首開先河地打造一種「通用學習機器」,也就是一套靈活的自適應演算法,可以像生物系統一樣,從零開始學習任務,其間只用到原始數據這一種東西。這就是通用人工智慧(AGI),重點在「通用」。他認為,在未來,超智能機器會跟人類專家協同工作,攻克一切難題。「癌症、氣候變化、能源、基因組學、宏觀經濟學、金融體系、物理學,」他說,「我們想要精通的很多知識領域都變得越來越複雜,信息量爆棚,哪怕是最最聰明的人,窮其一生也難以融會貫通。」怎麼樣才能在這股數據的洪流里淘金,得出真正的見地呢?哈薩比斯給出的答案,就是一種能把非結構化的信息自動轉化成可操作的知識,一種也許能解決所有問題的「元解決方案」。雖然全完實現這個目標可能還要等上幾十年,但現在,它已經有種勢不可擋的感覺。
2015年2月,《自然》雜誌在封面上宣布人工智慧在電子遊戲競技中趕上人類,配圖古老的街機遊戲《太空侵略者》。DeepMind在這期雜誌上刊登了一篇論文,描述了第一款成功的「端對端」通用學習系統,其中的AI名叫Deep-QNetwork,它學會了如何處理遊戲畫面中的信息,進行解讀並進行操控。這個成果讓整個科技界為之一振。今年1月,DeepMind在《自然》雜誌發表了第二篇文章——這麼短的時間裡兩次登上《自然》雜誌封面,這本身就是一項了不起的成就。這一次,它挑戰的對象是比古董街機遊戲還要古老,那就是圍棋。它的「分支因子」無窮無盡,走法可能比全宇宙的原子數量還要多;而且和國際象棋不同的是,它無法通過暴力計算來求解。甚至連編製函數來蘋果當前棋局的勝率都很難。它需要棋手擁有某種「直覺」——如果問一個專業圍棋手為什麼這樣落子,他常常會回答說:「憑感覺。」可是計算機歷來不善於做這種模糊的判斷,原因不言而喻。所以,圍棋一直被認為是人工智慧沒翻過去的一座大山,之前大多數研究人員預計,AI想要攻克這個難題,還要再等十年。但現在,證據擺在我們面前,DeepMind的最新AI演算法AlphaGo,在一場閉門比賽中挑戰三屆歐洲圍棋冠軍樊麾,並以五比零完勝後者,就在今天它還將與韓國圍棋國手李世石展開五輪大戰。倫敦帝國學院機器認知學教授穆雷·沙納漢(MurrayShanahan)稱之為「驚人成就」,超人主義哲學家尼克·博斯特羅姆(NickBostrom)也說這是機器學習領域裡的一個重大里程碑。
「是挺酷的。」哈薩比斯說得無比淡定。日前他接受了記者採訪,探討了這項技術的最新成果。據說谷歌收購DeepMind,讓他個人進賬8000萬英鎊,但他還是和往常一樣,一身不起眼的黑色上衣、褲子和鞋子。如果你把他錯認成實習生,那也不是你的錯。「圍棋是終極挑戰,它是遊戲金字塔的最頂端,需要無與倫比的智慧。它充滿了魅力,而且振奮人心的是,我們不僅掌握了它,而且用了一種極為有趣的演算法。」他認為,圍棋在更大程度上是一種藝術,而不是科學,「而且AlphaGo的棋風跟人類很像,因為它會像人一樣去學,而且在下棋的過程中變得越來越強大,你我都是這麼學的。」「它的數量級超過任何人的想像,」他激動地說道,「我們最看重的一點是,它不是用手動指定的規則形成的專家系統,而是使用通用機器學習技巧,自學掌握了圍棋。最終,我們希望把這些技巧應用到重要的現實問題中去,比如對氣候進行建模或複雜疾病的分析。所以,它下一步會攻克什麼呢?想想就讓人興奮。」對氣候進行建模或複雜疾病的分析——它下一步會攻克什麼呢?想想就讓人興奮。— 德米斯·哈薩比斯從DeepMind被收購以來,他從當初的「谷歌AI天才」,一步步蛻變成如今這位話語中充滿自信的溝通者。他可以把他那極其複雜的工作,以及它的重要性,以一種極富感染力的熱情,有效地解釋給我這個門外漢聽。比如說,他們是怎麼把新舊AI技巧結合起來的。在DeepQ當中,他們結合了深神經網路和類似訓練小白鼠的「強化學習」技術。對於AlphaGo,他們更進一步,加入了一個更深層次的強化學習系統,負責長期計劃。下一步就是集成記憶等功能,直到從理論上把所有的智能研究重要課題一一攻克。「至於這樣的智能究竟有多少,路線圖怎麼規劃,我們有一個大致的概念,」哈薩比斯說。「關鍵是怎麼把所有不同領域結合起來,因為我們希望,演算法能把它從一個領域學到的知識應用到別的領域。」這有點像是哈薩比斯本人。乍一看他的履歷,這人好像對什麼都有一點淺嘗輒止的好奇心,從棋盤遊戲到電子遊戲,再到計算機編程,再到認知神經科學,最終走到人工智慧。看似東一榔頭西一錘,但他能走到今天這一步,是因為它們背後有一個核心的焦點,而本錢正是他那幾十年一遇的天才大腦,再搭配以學科方向上的不斷校準。讓我們回顧一下他的人生亮點:8歲編寫出自己的第一個計算機遊戲;13歲達到國際象棋大師級水平;17歲創造最先集成AI的電子遊戲《主題公園》;20歲以雙優成績從劍橋大學計算機科學畢業;隨即創辦突破性的電子遊戲公司Elixir;開始海馬體和情景記憶方面的開拓性學術探究,以此作為「拼圖」的最後一塊,繼而於2011年創辦DeepMind。順帶說一句,他還在腦力奧運會精英項目「全能腦力王」中五次奪冠。
「我很容對一件事感到厭倦,世界這麼豐富多彩,那麼多有趣的事情可以去做,」他坦言。「如果我是一名體育運動員,那我就想成為一名十項全能選手。」
但體育界始終沒有向他發出召喚。雖然他也喜歡觀看各種體育賽事,但很小的時候其實就明確了要走腦力路線——4歲就開始學下國際象棋,不出一年就進入英國的全國比賽,之後沒過多久,又晉級國際比賽。哈薩比斯1976年出生於倫敦,父親是希臘的塞普勒斯裔,母親是新加坡華裔,父母都是老師,開過玩具店。家裡兄弟姐妹三人,哈薩比斯是長兄,妹妹是作曲家和鋼琴家;弟弟研究創意寫作。在科技這一脈,在他家們並不是很突出。「我絕對是家裡的異類。」他笑說。他說,「我父母都有技術恐懼症。他們不喜歡計算機,有點偏文藝。妹妹和弟弟也都走了文藝路線,都沒有真正去搞數學或科學。」他聳了聳肩,似乎帶著些歉意。「所以挺怪的,我也不知道我怎麼過來的。」每天晚上,哈薩比斯都會回家和家人吃飯。他的妻子是義大利分子生物學家,研究老年痴呆症。他們有兩個兒子,一個7歲,一個9歲。哈薩比斯會和他們玩遊戲、閱讀書籍,或幫他們做作業。他會像其他普通老爸一樣,哄他們上床睡覺。但到晚上11點左右,大多數人都洗洗睡的時候,他就開始了自己的「第二天」。和美國之間的Skype通話常常進行到凌晨1點。之後,就是「純粹的思考時間。「直到凌晨三四點,那都是的我的思考時間;思考研究,思考我們的下一個挑戰,或者,我也會寫一篇關於演算法設計的隨筆。」
這類隨筆不算是編程,他坦言:「因為我的數學已經太生疏了。它更多的是一種直覺思維。或有關公司的戰略思考:如何擴大,如何管理。或者只是我在文章中讀到、在新聞里看到的什麼東西,想著怎麼把我們的研究跟它聯繫起來。」這讓我想起了AlphaGo,它每天的工作就是不停地下棋、下棋、還是下棋,每一天、每一秒都在自我提升,因為對它來說,學習的唯一途徑就是繼續下去……「它有機會休息嗎?」我問。「沒有。沒有休息!連聖誕節都不休。」我有點遲疑。「它就不需要休息一下么?」「它想得美。」他逗趣地說道。好吧。那哈薩比斯自己呢?「他絕對是個超人類,」他的一個同事漫不經心地說。他有沒有把注意力移開的時候?「很難,」哈薩比斯坦言,「生活和工作之間的矛盾,我從沒有遇到過。對我來說,它倆不過是同一種事物的兩面。我也喜歡看書、看電影、聽音樂,但最後都要歸結到我所做的事情。我的大腦已經完全被AI佔據了。」那孩子、朋友還有正常生活呢?「當然,我會盡量接接地氣,不讓自己太顯得不食人間煙火。說到孩子們,能像AI一樣讓我全神貫注的,也就只有他們了。」他又若有所思地說:「但我沒有過過太多正常人的生活,這倒是真的。每個清醒的時刻,我都在想著AI,也許夢裡也在想著。因為它太振奮人心、太重要了,它是最讓我熱血沸騰的事情。」如果有一種數字智能在各個方面都遠超人類智能,這時候你再用『助理』來描述它,就有些不太貼切了。— 伊隆·馬斯克他的眼裡煥發出明確而堅定的神采,有一種孩童般的天真。「我覺得自己很幸運。對於我現在研究的問題,我想像不到什麼東西會比它更有趣,而我每天都可以去思索這些問題。每時每刻,我所做的都是我真正信奉的事情。不然又何苦去做呢?生命是如此短暫。」如果斯蒂芬·霍金、比爾·蓋茨、伊隆·馬斯克、揚·塔里安(JaanTallinn)、尼克·博斯特羅姆還有其他無數科學巨人的擔心變成現實,那我們的生命怕是不會長久。一旦他們所擔心的超級智能災難真的降臨,那麼放眼歷史,我們不太可能有足夠的先見之明,去及早地退出AI軍備競賽,到我們反應過來的時候,可能為時已晚。美國物理學家羅伯特·奧本海默說過這樣一句名言:「看到好的技術就儘管去做,務必先取得成功,再回頭討論該對它做些什麼。」幾十年後的今天,博斯特羅姆也指出:「無論有沒有辦法確保超級AI永不傷害人類,它都會被創造出來。而霍金最近也總結說:「AI的成功創造會是人類歷史上最大的事件。但不幸的是,它也可能是人類歷史上的最後一場事件。」「好吧,希望不會如此吧。」哈薩比斯說。在他看來,對通用人工智慧的危言聳聽搞得大家人心惶惶,掩蓋了短期內AI可能帶來的巨大助益。這種擔憂是不恰當,不合時宜的。「能夠和人類平起平坐的通用智能要幾十年後才會出現,」他提醒說。「我們還在梯子的第一級上,還處於學會玩遊戲的階段。」雖然他承認有一些風險確實應該考慮起來,但絕對不會像科幻小說中的反烏托邦場景那樣——超級智能無情地剷除創造它們的人類。對於超級智能這個問題,他說:「我們要確保目標指定正確,不留曖昧的餘地,不隨時間的推移而轉變。但在我們所有的系統裡面,最頂層的目標還是由設計師指定的。AI也許能自己找出實現這一目標的途徑,但不會自己創建目標。」
他的語氣讓人很釋然。「你看,這些都是有趣又困難的挑戰。就和所有強大的新技術一樣,它的使用必須是合乎倫理、負責任的。我們之所以積極呼籲大家辯論和研究這個問題,就是出於這個原因。這樣,在時機成熟的時候,我們就已經做好準備了。」什麼時機?機器變得超級智能,還是超越人類?他笑了。「不不不,我的意思是,遠遠在那之前!」我以為他在開玩笑,但哈薩比斯澄清說:「我的意思是,當這些系統變得更加強大,而不只是會玩遊戲的時候,我們也開始放手,讓它們接管更現實、更重要的東西。這時候,我們就要對應該賦予它們何種程度的能力形成認識,」他笑了笑說,「這就是掐掉『機器統治世界』的可能性。」
發現最有創造力的思想
推薦閱讀:
※打雞血背後的故事竟如此狗血
※鄭若麟: 香港「佔中」背後的輿論戰
※慕多生:平墳背後的利益計算
※《西遊記》背後的秘密
※有料== 一天入百萬!揭秘明星天價綜藝片酬背後