4歲下象棋15歲設計遊戲……AlphaGo之父的開掛人生|封面
封 面
這家由目前全球人工智慧領域的領軍人物之一的哈薩比斯創辦的科技公司,在攻克了Afari遊戲與圍棋之後,下一步它的目標又是什麼?
文|許智博
5月23日晚上的烏鎮西柵景區,白天的大雨已經止住,如織的遊人在雨後的涼爽潮濕里踏在青石板路上,抓緊時間欣賞眼底燈火點點的江南水鄉,或許他們絕大多數人並不曉得,就在這天的下午雨還沒有停的時候,中國的頂尖圍棋選手、世界排名第一的柯潔,在這裡剛剛以1/4子輸給了他的對手、人工智慧AlphaGo,丟掉了第一盤棋的比賽,成為了當天重要的全球科技新聞。
柯潔與AlphaGo比賽現場
在入口通往散佈於景區里的酒店和民宿的電動擺渡車上,一個穿著西裝、有些微醺的體育官員,正在與同行的一位長者絮叨地感慨著:「我晚飯時問他們的二把手,可不可以把你們的技術做成平板電腦,給我們隊的棋手訓練使用,他說這要問他們的CEO……對,就是那個哈薩比斯,但他可能覺得圍棋實在是太『小』了,他明天會在論壇上說AlphaGo的用途,肯定還是他關心的醫療啊能源啊這些大事——唉,這個哈薩比斯,簡直就像是又一個霍金!」
神童愛上電游
那個體育官員口中讓他難以理解的哈薩比斯(Demis Hassabis),正是目前全球人工智慧(Artificial Intelligence,縮寫為AI)領域的領軍人物之一。
這個戴著黑框眼鏡的小個子英國人雖然其貌不揚,但卻是一個絕對的天才,尚不到41歲的人生充滿傳奇:他生於倫敦,是一個普通移民家庭的孩子,父親是希臘的塞普勒斯人,母親則是新加坡的華人。家庭成員的構成很難解釋他的數理天賦遺傳於誰,父母都是教師,也會做一些兼職,他的弟弟和妹妹擅長的則是寫作和作曲。
Demis Hassabis
哈薩比斯的早慧從小就顯露出來,4歲時他看父親和舅舅下國際象棋,兩周後便在棋盤上打敗了成年人。從5歲開始,他開始參加正式的國際象棋比賽,6歲時便獲得了倫敦8歲以下組的冠軍,9歲時已經是英國11歲組少年隊的隊長,13歲時在世界14歲以下的國際象棋棋手中以2300積分排名第二,而領先他35個積分、排在他前面的那個選手,則是國際象棋界傳奇「波爾加三姐妹」中的小妹朱迪特·波爾加(Judit Polgár),那是後來被稱為「有史以來最厲害的國際象棋女棋手」的神級角色,連續26年女子國際象棋排名第一。
或許讓哈薩比斯後來沒有選擇做一名職業棋手的原因,是他在8歲那年用下棋贏得的200英鎊購買的一台電腦。這台1982年由Sinclair公司生產的8位個人電腦ZX Spectrum在現在看起來更像是一個黑色鍵盤,但這台頻譜計算機卻讓哈薩比斯找到了某種人生終極樂趣。
迷戀上電腦遊戲的他很快就發現別人設計的遊戲簡直太LOW了,乾脆拆解了電腦,開始自學編程做遊戲。「我爸會帶我去Foyles(倫敦最大的書店),坐在計算機編程類書籍的區域,學習如何在遊戲中無限續命,我從直覺上感到這是一個神奇的設備,你可以釋放你的創造力。」回憶童年時哈薩比斯如此說。他曾花一個夏天的時間,在北倫敦的布倫特十字(Brent Cross)站的一個報刊鋪瀏覽那些他買不起的計算機雜誌。
在這樣的「探索」過程里,小哈薩比斯已經在思考兩個問題:一,大腦是怎麼思考的?二,計算機可以模擬人類嗎?
正是這樣的痴迷,讓15歲的他後來在一場為遊戲《太空侵略者》(Space Invaders)設計續集的比賽中獲得第二名,被視頻遊戲公司牛蛙工作室(Bullfrog)的老闆彼得·莫利紐克斯(Peter Molyneux)相中。被中國資深遊戲玩家昵稱為「魔力牛」的莫利紐克斯是英國的傳奇級遊戲設計師,通過設計遊戲拿到過大英帝國勳章的遊戲界「老炮」,他開創了「上帝視角」的遊戲《上帝也瘋狂》,也創造了可以讓玩家轉換遊戲扮演角色的《地下城守護者》,後來他的工作室基本都被美國遊戲巨頭EA(藝電)收購。
雖然哈薩比斯和莫利紐克斯年紀差了十多歲,但用哈薩比斯的話說,兩個人「相互影響」。與「魔力牛」偏愛讓玩家在虛擬世界裡扮演擁有絕對權力的上帝不同,在牛蛙,哈薩比斯主持並協助設計的是沉浸式模擬現實遊戲《主題公園》(Theme Park)。在遊戲中,玩家可以設計和管理遊樂園,為了在非常現實的條件下做到盈利,甚至要使用在汽水裡加鹽、好讓遊人多喝幾杯的小伎倆。這個需要耐心的遊戲吸引了很多玩家,遊戲軟體賣了幾百萬份,還贏得了當年英國的「金手柄」獎(Golden Joystick Award)。
《主題公園》遊戲截圖
1997年,哈薩比斯大學畢業後,「魔力牛」再一次把他招至自己獅頭工作室(Lionhead)。在獅頭工作室不到一年的工作中,哈薩比斯創造出了電子遊戲領域第一個具有自我學習能力的人工智慧——遊戲《黑與白》(Black & White)中的「神獸」,在「上帝視角」的遊戲里打造了一個擁有鮮明個性和自我意識的角色,讓玩家根據它的習性實施間接的影響力。
在這個遊戲里,「神獸」擁有可怕的力量,但心智僅相當於兩歲左右的孩童,作為神獸的主人,玩家在遊戲中最重要的任務,就是通過胡蘿蔔加大棒,把神獸訓練成自己想要的樣子:當神獸幹了壞事,比如隨地大小便,乃至是吃人的時候,就要用一頓抽打來讓它長些記性。而當神獸偶爾幫助村民幹活的時候,適時愛撫可以強化它們的記憶,從而培養做好事的習慣……當然,如果玩家願意,也可以反過來做。
與升級和解鎖新技能的老套路遊戲比,《黑與白》中神獸的培養過程其實非常接近人工智慧領域裡「機器學習」(machine learning)的「強化學習」(Reinforcement Learning)概念:導入訓練數據,讓AI在不斷試錯中積累正面反饋,最終找到獲得利益最大化的途徑——只不過在遊戲中,判定權重的工作(即玩家對神獸行為的反饋)由人類來完成的,而非像後來的AlphaGo那樣去自己判斷。
1998年,哈薩比斯決定單飛,成立了自己的公司Elixir Studios。在這次不算成功的創業期里,他在《黑與白》的思維邏輯基礎上,做了兩款將模擬現實與上帝視角結合起來的遊戲,其中策略遊戲《共和:革命》(Republic: The Revolution)更像是一個更加複雜的《主題公園》,虛擬了一個20世紀90年代發生制度變革的東歐小國,玩家要在遊戲里不斷依靠資源分配、合縱連橫才能最後達到自己執掌政權的目標,而《邪惡天才》(Evil Genius)則是後來被很多專業人士評價為水準不低於《半條命2》(Half-Life)的作品,遊戲以007系列電影為靈感,打造了一個席捲全球的「黑暗勢力」,被很多「硬核玩家」評價為「設定平衡度很高的遊戲」。
可惜那時隨著電腦硬體性能的飛速進化和互聯網的普及,電子遊戲界的整體風潮從單機遊戲的趣味性、平衡度轉向了強調遊戲的視覺呈現和玩家之間的交互,所以最後這兩款遊戲都不算成功。哈薩比斯面對變化的遊戲市場,意識到了自己痴迷遊戲的本源其實是人工智慧:「20世紀90年代,遊戲很有趣,也有創新性。但到了新世紀,遊戲注重圖像和內容,想通過遊戲這扇『後門』去展開人工智慧研究已經非常困難,這違背了我做遊戲的初衷。」
天才改變世界
2005年,哈薩比斯「戒」了遊戲,直到現在,作為曾經的資深遊戲迷,他對一些爆款的大型多人遊戲依然感覺失望,「我從來都無法真正融入遊戲,因為虛擬人物看起來傻傻的。他們沒有記憶,不會改變,也與環境無關。如果有學習型人工智慧,遊戲質量就能提升到新水平。」
實際上,哈薩比斯能果斷地結束自己的「遊戲開發者」的職業生涯,也是為了重新集中自己的精力去做人工智慧——20年前在劍橋大學學習計算機的時候,當講台上的教授講解著「狹義人工智慧」(當時IBM的「深藍」,Deep Blue)戰勝了國際象棋大師卡斯帕羅夫(Gary Kasporov)是轟動的新聞,「深藍」是狹義人工智慧的代表,下面聽課的哈薩比斯就在心裡想著,自己是否可以做一個「通用人工智慧」。作為一個曾經的國際象棋大師,哈薩比斯認為「深藍」不過是「僅在某一領域發揮特長的狹義人工智慧」的極致,但戰勝卡斯帕羅夫的「其實並不是機器或者演算法本身,而是一群聰明的編程者智慧的結晶」。
Deep Blue和Gary Kasporov比賽現場
「他們與每一位國際象棋大師對話,汲取他們的經驗,把其轉化成代碼和規則,組建了人類最強的象棋大師團隊。但是這樣的系統僅限於象棋,不能用於其他遊戲。對於新的遊戲,你需要重新開始編程。在某種程度上,這些技術仍然不夠完美,並不是傳統意義上的完全人工智慧,其中所缺失的就是普適性和學習性。」在今年初回到劍橋大學演講時,哈薩比斯說。
1994年,《主題公園》上市發行後,劍橋大學同意17歲的哈薩比斯入學(16歲時他就已經通過考試並提交申請,只是劍橋認為他年齡太小沒有接受)。那時的他依舊沉迷於各種與頭腦和智力相關的事情,除了遊戲,他也是智力奧運會(Mind Sports Olympiad)的熱衷參與者。這於1997年在倫敦開始的智力大賽包括多種棋牌遊戲,前7屆比賽里,哈薩比斯攬下了5屆冠軍。大賽組織者戴維·利維(David Levy)還清楚地記得20年前,在皇家節日音樂廳舉辦的第一屆比賽中,他看見哈薩比斯為了同時參加兩場比賽,在樓梯上跑上跑下。利維說:「非常聰明的人有一些不尋常的行為,是意料之中的事情。」
在劍橋,哈薩比斯還遇到了自己後來的好友、合作夥伴之一大衛·西維爾(David Silver),兩人為了研究人工智慧彼此監督,19歲的哈薩比斯第一次接觸到圍棋之後,就教會了西維爾怎麼去下。在他創立Elixir Studios之後,第一件事情就是拉西維爾入伙,讓他成為了《共和:革命》的主程序員,直到2004年,西維爾決定不再與電腦遊戲里的「假人工智慧」浪費時間,而是要去觸碰人工智慧的核心領域,選擇了師從人工智慧「強化學習之父」理查德·薩爾騰(Richard Sarten)去讀博士。
為了尋找靈感,哈薩比斯也在2005年將遊戲版權賣掉後解散工作室重回高校。與好友直接選擇與人工智慧相關的研究方向不同,他選擇的是在倫敦大學學院(UCL)進修神經系統科學博士學位——因為他覺得通過研究真實人腦也許能找到研究人工智慧的線索。在UCL期間,哈薩比斯主要研究的是海馬體。海馬體是人腦的一個區域,對方向感、記憶調取和未來事件的想像至關重要,但目前人類對它所知甚少。
作為一個沒有學習高中生物的計算機科學家與遊戲企業家,哈薩比斯在一群醫學博士和心理學家間顯得尤為另類。「我經常開玩笑說,我對大腦唯一了解的事情就是,它在頭蓋骨里。」
但哈薩比斯與埃莉諾·馬圭爾(Eleanor Maguire,其做出的一項發現是,倫敦計程車司機的海馬體比常人更大)教授密切合作,很快便做出了成績:2007年,他在一項被《科學》雜誌評選為「年度突破」的研究中發現,五名因腦損傷而遭受失憶症折磨的病人,他們的海馬體會努力地設想未來的事情,這顯示大腦中被認為只與過去有關的部分也對計劃未來至關重要。
哈薩比斯後來得到了一筆博士後獎學金,可以使他在哈佛和麻省繼續研究腦神經科學,但這並不是他想要的,他想要的是「人工智慧科學」。
2010年,哈薩比斯與童年時代的好友穆斯塔法·蘇萊曼(Mustafa Suleyman,此君履歷同樣光彩奪目,曾在牛津大學學習哲學和神學,後來放棄學業開辦「穆斯林青年求助熱線」,成為了倫敦市長的政策官員之一,還創辦了「變革實驗室」這個「複雜問題諮詢機構」)、人工智慧專家謝恩·萊格(Shane Legg,UCL蓋茨比計算神經科學院博士後,哈薩比斯也曾在此處與其共事)一起創辦了DeepMind——當然,哈薩比斯同樣沒忘記拉著已經擔任英國皇家學會研究員的西維爾給DeepMind做顧問。DeepMind儘管被外界認為是一家公司,但是在哈薩比斯的定義里,這是一種新的研究機構和企業組織結合的組織。
哈薩比斯對外宣布,DeepMind將研究領域放在通用人工智慧這個大方向,是「21世紀的阿波羅計劃」,「勇於了解並研究人工智慧,然後駕馭它、利用它來幫我們解決一切難題。」
雖然這個團隊到底在幹什麼,外界並不清楚,但很快就有了兩個投資者——其中一家是李嘉誠的維港投資(Horizons Ventures)。有Skype的一個聯合創始人做指導顧問,DeepMind也很快引起了許多矽谷大佬的注意,包括伊隆·馬斯克(Elon Musk,SpaceX創辦人,特斯拉和PayPal的聯合創辦人)。這位對人工智慧又愛又防備的「鋼鐵俠」在2012年為Deepmind投資了650萬美元,意圖是「讓我可以監視人工智慧到達什麼程度了」。據說有一次哈薩比斯去馬斯克的SpaceX火箭工廠參觀,兩人坐在食堂里聊天,馬斯克正在解釋他創建SpaceX的終極目標是完成世界上最重要的項目:星際殖民。哈薩比斯回答說,事實上,他也在研究世界上最重要的項目:開發超級人工智慧。馬斯克回答說,這正是他決定殖民火星的原因之一:假如人工智慧反叛,倒戈攻擊人類,我們至少有一個落腳的地方。哈薩比斯笑眯眯地說,人工智慧會跟著我們一起去火星。
事實上,也正是馬斯克在自己的私人飛機上將DeepMind推薦給了正在尋找人工智慧人才的拉里·佩奇(Larry Page,谷歌聯合創始人)。
2013年,西維爾正式加入DeepMind,用他擅長的「強化學習」開發出一套演算法,「能玩50種Atari遊戲,通過自我學習、玩遊戲、看視頻,來找到玩遊戲的方法」。巧合的是,西維爾所說的「Atari」是一家曾經美國的遊戲公司,在這套演算法所「攻克」的50款遊戲里,「打磚塊」(Pong)的開發者正是當年蘋果的創始人之一沃茲尼亞克(Stephe Wozniak),而喬布斯則是Atari和沃茲尼亞克之間的掮客,沃茲尼亞克靠開發這個遊戲賺到了350美元,但喬布斯則從Atari那裡多領了5000美元的報酬。
不知道是有意還是無意,DeepMind的初試牛刀,多少有了點向前輩致敬的意思。
這一年年底,這套演算法在美國加州和內華達州交界的太浩湖畔的第一次公開亮相震驚了眾人。它並沒有被編入「如何玩遊戲」的指令,但通過控制鍵盤,觀察顯示器分數,經過反覆試錯之後,成為了一個專業級遊戲高手。「軟體」可以通過神經模擬網路處理數據,像人腦一樣「本能地」學習——這正是哈薩比斯想要的那種可以「深度學習」(deep learning)的「通用人工智慧」。他說:「這是我們知道大腦會做的事,當你睡覺的時候,你的海馬體就會重演你當天的記憶,然後再返回大腦皮層。」
觀看演示的拉里·佩奇也不吝讚美,稱讚說這是「我多年以來見過的最驚人技術之一」, 演示之後,Facebook也開始加入與DeepMind的商業談判,向「人工智慧先行」(AI First)轉型的谷歌當機立斷,答應之前談判中哈薩比斯的要求,設立了人工智慧道德監察委員會,以4億英鎊的價格完成了谷歌在歐洲最大的一筆收購,在2014年初結束了之前與DeepMind拖拖拉拉長達兩年的試探性接觸。
對於「道德委員會」的事情,哈薩比斯在烏鎮接受採訪時解釋說:「正確地使用人工智慧,包含有兩個層面的意思。第一個層面,它必須是造福於全人類、不能用於幹壞事,比如說不能用於研發武器,而是應該用於例如科學、製藥等領域。第二個層面的意思,人工智慧不能僅為少數幾家公司或者是個人去使用,應該是全人類共享的。」
新的哈勃望遠鏡
除了利物浦隊的忠實球迷的身份之外,哈薩比斯對於生於斯長於斯的倫敦有著很深的眷戀。在他的堅持下,DeepMind依舊留在了倫敦,而不是搬到加州山景城的谷歌總部。每天,他都要工作到夜裡11點多;當午夜時分到來時,他開始了所謂的「第二天」,與美國的同事進行電話會議,一直到1點多;這之後才是他自己的思考時間,通常會持續到凌晨三四點。
DeepMind現在已經搬遷到谷歌位於倫敦的豪華新總部,國王十字車站的潘克拉斯廣場6號(6 Pancras Square),這裡也是谷歌英國Android和YouTube業務軟體工程師的辦公之地。新總部擁有午休休息室、90米跑道的小型體育場以及一個按摩房等。樓頂還有露台,可以觀賞倫敦風景。每周五晚的樓頂聚會已成慣例,公司還有跑步協會、足球隊、棋類協會。DeepMind每間辦公室都以天才來命名:特斯拉、拉馬努詹、柏拉圖、費曼、亞里士多德、居里夫人。雖然互聯網行業人員流動很頻繁,對手公司也試圖來挖牆腳,但DeepMind從創建起離職率一直為零,人數從被谷歌收購時的75人增加到了200多人。
DeepMind的倫敦辦公室
不過要成為這裡的一員並不容易,一位已經入職DeepMind的工程師在Quora(「知乎」就是中國版的Quora)上回答「怎樣才能在DeepMind里工作」時這樣寫道:你看過的大部分谷歌招聘的過程都不適用於DeepMind,這裡的應聘面試總共有8個小時之久,「你必須要有一個博士學位,最好還有幾年機器學習研究經歷。」
攻克了Atari遊戲之後,哈薩比斯和西維爾又將他們的下個課題指向了他們19歲時熱衷的遊戲——圍棋。這個有著3000年歷史的雙人棋盤遊戲在1997年卡斯帕羅夫輸給「深藍」之後,一直被視為人類智力最後的自留地,因為按照狹義人工智慧的思路,圍棋的計算量是國際象棋的1億倍,是計算機難以用窮舉法解決的問題。
DeepMind的這套演算法就是後來震驚世界的AlphaGo,雖然被中國網友們戲稱為「阿爾法狗」,但實際上,哈薩比斯為這套演算法起的名字里,有不少涵義。用西維爾的話說,「其中一個意思是Alphabeta——谷歌的母公司,因為這名字和谷歌神經網路幾乎是在同一時間發布的;同時,Alpha有『較高的意識狀態』的意思,當你把某件事思考得很透徹的時候,你有了更高的意識狀態,這是另一層意思。」而「Go」正是英語里對圍棋的稱謂。
起初,他們希望像玩Atari遊戲那樣,讓AlphaGo的人工神經網路(artificial neural network,一種模仿動物大腦和中樞神經系統的結構和功能設計的數學模型或計算模型)「自己理解」圍棋的規則,但發現效率不高,直到後來引入了「價值網路」(value network,原來是商業管理的概念,判斷公司客戶的重要程度,這裡指是用一個「價值」數來評估當前的棋局),局面才豁然開朗。
根據DeepMind發表的論文,專業人士可以窺探到AlphaGo的基本設計思路——任何完全信息博弈(棋類遊戲是典型的例子)都無非是一種搜索。搜索的複雜度取決於搜索空間的寬度(每步的選擇多寡)和深度(博弈的步數)。對於圍棋,寬度約為250,深度約為150。AlphaGo用「價值網路」消減深度,用策略網路(policy network,在棋局裡評估每一種應對可能的勝率,從而根據當前盤面狀態來選擇走棋策略)消減寬度,結合在棋類電腦遊戲里成熟的蒙特卡洛樹搜索(Monte Carlo tree search)演算法,從而極大地縮小了搜索範圍。「這樣,你只需看那5到10種可能性,而不用分析所有的200種可能性了。」哈薩比斯說。
在2016年3月AlphaGo在韓國首爾4:1擊敗韓國天才棋手李世石九段,一時間讓人工智慧成為了全世界刷屏的新聞,一天之內,韓國出現了3300多篇介紹哈薩比斯和DeepMind的報道,而圍棋在西方世界成為了一種時髦。
而早在之前一年,中國旅歐棋手樊麾二段就先被它折服了。「當時我是法國歐洲圍棋冠軍,我在倫敦跟AlphaGo進行了第一次的比賽,被AlphaGo打了5:0,一盤棋都沒有贏。」樊麾在今年烏鎮AlphaGo跟柯潔的比賽間隙接受採訪時說,「那次對我來說,震撼是非常強大的,於是我加入團隊,幫助測試和提升AlphaGo。」
李世石在去年敗給AlphaGo之後曾說:「AlphaGo讓我找到了繼續下棋的樂趣和動力。」隨後一年,這位曾經世界第一的棋手一直在研究AlphaGo的下棋思路。李世石的做法也是中國年輕一代棋手們的做法, 在今年5月烏鎮的柯潔與AlphaGo對弈的第一局,執黑先行的柯潔就使出了AlphaGo最愛使用的「三·3」開局,他按照之前揣摩AlphaGo的棋風想針鋒相對,但卻最終找不到破綻,以1/4子告負。
在5月25日的第二盤對弈上,柯潔下出了迄今為止人類與AlphaGo比賽過程里最完美的前100手棋,讓在後台觀棋的哈薩比斯在第一時間發推大讚。在現場的九段棋手們評價說,一般高水平棋手會在棋盤上「挑起六條龍」,但柯潔「今天挑起了十條」。然而在處處充滿希望的「大亂戰」中,人類的計算能力穩定性上再次輸給人工智慧一籌,柯潔因為計算失誤再次告負。但這場博弈讓哈薩比斯對柯潔更加欣賞,賽後發布會上言語和目光都充滿了天才之間的惺惺相惜——當柯潔要求第三局要像第二局一樣執白後行時,哈薩比斯爽快地說:「好,沒問題,就這樣!」
5月27日,柯潔在比賽過程里因為失誤離席痛哭,見證了人力在智力上將最後一塊陣地拱手相讓。但在一周時間裡,DeepMind團隊不斷披露的信息,也足以證明了這個19歲少年的優秀——與戰勝李世石的那版AlphaGo相比,一年後與柯潔對弈的AlphaGo在演算法上已經更加優化,要勝過老版「三子」左右,而運算量則降低到1/10——如果說在首爾的AlphaGo還是網路版,那麼在烏鎮的AlphaGo則更像是「單機版」。
柯潔與AlphaGo比賽結果
正如那個體育官員在首戰之後所說,在結束了與柯潔的對弈之後, DeepMind也同時宣布AlphaGo的「使命結束」。就像之前哈薩比斯在劍橋對他的學弟學妹們說的那樣:「我們發明AlphaGo,並不是為了贏取圍棋比賽。」
「從現在開始,AlphaGo 的研發團隊將把精力投入到其他重大挑戰中,研發出高級通用演算法,為科學家們解決最複雜的問題提供幫助,包括找到新的疾病治療方法、顯著降低能源消耗、發明革命性的新材料等。」哈薩比斯對媒體宣布說。
這早已經是啟動的項目,目前DeepMind正在與英國NHS(國家醫療服務體系)進行合作成立了「DeepMind健康」項目,希望用技術手段幫助有意向參與的醫護人員提高服務質量;而在去年7月, DeepMind在谷歌的全球機房用機器學習搭建了三個人工神經網路(收集相關溫度和功率信息、預測溫度、預測下一小時負荷),組成了一個PUE(Power Usage Effectiveness,能源使用效率)評估網路,然後由人工智慧自動調節機房的溫度,結果比人管理的時候節電40%——在今年,這個技術將向更多的火電廠和計算中心推廣。
當然,作為離別禮物,DeepMind為全球的圍棋棋手和愛好者留下來50盤AlphaGo在戰勝李世石之後「自我對弈」的棋譜(從那時起AlphaGo已經不再參考人類棋手的棋譜了)。在烏鎮對弈結束的當晚,有棋手在網上看過了5張棋譜之後,評價說,這根本就不是人類下棋的思維。
或許正應了哈薩比斯的那句話,人類3000年以來,或許連圍棋的表皮都沒有揭開,而AlphaGo這樣的人工智慧則像天文學裡的哈勃望遠鏡,人類藉助它,可以更深刻地理解很多我們認為已經十分了解的東西。
編輯|林欣煮
來源|南都周刊
END
推薦閱讀:
※《全戰:不列顛王座》評測 新時代來臨前的大膽嘗試
※大家覺得大司馬能超過五五開和PDD嗎?
※青蛙不是兒子而是丈夫?給他買的帳篷,不知道和多少野女人睡過
※生死狙擊都有什麼模式?
※賭場里什麼遊戲最難?