大師與大師相遇的11個小時零2分里,他好像被勝負之神拋棄了
當發現自己曾經的意識、認知、抉擇都是錯誤的時候,一如既往錯下去,還是給自己重新開始的機會。
文|姚胤米
採訪|姚胤米 姚璐
編輯|王晶晶
圖|Google
步步緊逼
他的右手握成一個空拳,緊緊堵住自己的嘴巴,兩根眉毛皺得馬上就要連在一起,他揉揉眉頭,一綹一綹地把頭髮揪起來,左手邊的藍色計時器上就這樣走掉了兩分鐘。
柯潔一向下棋很快,小時候,父親柯國凡希望他深思熟慮後再落子,曾經嚇唬他:「再下這麼快,我就用牙籤戳你的手。」但AlphaGo比他更快,對局中,這位當今世界排名第一的棋手多次陷入長時間思考。終於,他把頭從臂彎里抬起,抓起棋罐里的一顆白子。
AlphaGo緊追一子,僅用了三十幾秒。
5月底的浙江烏鎮,早晨常常飄著小雨,細密的雨絲中,19歲的圍棋世界冠軍柯潔出現在世界互聯網大會的會展中心——這是他與AlphaGo對弈的「戰場」。200多家媒體記者守候在此,每個比賽日,柯潔通過安檢的照片都會成為「圍棋峰會媒體群」里議論的焦點。
距離上一次圍棋獲得如此的舉國關注,已經過去了近30年,那還是1980年代中日圍棋擂台賽的時候。因為這次比賽,新中國成立以來的棋聖、天元、名人、新人王,從聶衛平時代到現代最年輕的世界冠軍,大多到場,相聚於此。長達四五個小時的對弈橫跨午飯時間,在餐廳里,記者們一邊用餐,一邊開著VPN,觀看比賽直播,棋手們則在餐桌旁聊著上午的棋局。
5月27日,柯潔與AlphaGo的最後一場對局,此前他已經連輸兩場。「希望柯潔今天能夠堅持到午飯後。」一位棋手說。柯潔做到了,但那天下午1點08分,他情緒失控了,突然起身離席,一個人走到攝像機拍不到的布景板後,小聲啜泣起來,聲音越來越大。
十幾分鐘過後,柯潔重新回到棋盤旁邊,他抹了抹眼角,緊緊抿住嘴, 繼續下了20分鐘,最終拿起兩枚棋子放到了棋盤的一角——投子認輸了。
賽後發布會上,柯潔起身鞠躬,聲音哽咽,不住嘆氣,神態間已經不是一年前那個「管你是阿法狗還是阿法貓」的狷狂少年了。「雖然很不甘心,但坐在對面的我最終只剩下絕望。」比賽結束後的第三天,柯潔在某問答平台上感慨:「科技真的太偉大了。」
面對面與一個無論如何也打不過的對手強行較量的痛苦,世界上恐怕只有李世石最能理解。
2016年3月,AlphaGo第一次在世界面前公開亮相,於韓國首爾挑戰韓國知名棋士、世界冠軍李世石九段。那是一場五番棋比賽,贊助方開出的獎金是100萬美元,很多中國棋手聽說後都覺得「李世石發財了」,因為在當時,圍棋界普遍認為,人工智慧想要攻克圍棋,至少還需要10到20年。
「當時的人工智慧沒有突破圍棋最大的一個瓶頸,圍棋沒有一個直觀的目標。像國際象棋你就是對著那個老將過去了,圍棋它是一個很虛的,最講究的一個詞叫中庸。如果就是說我拿到了50.01%,你拿49.99%,沒關係,我只要贏你那麼一點點就可以。它本身的變化之多,是別的項目沒法比擬的。」國家圍棋隊領隊華學明告訴《人物》記者。
早在2015年10月,AlphaGo就曾與歐洲圍棋冠軍樊麾對弈,那場比賽樊麾以0︰5輸了,棋手們普遍認為樊麾沒下好,甚至可能故意稍微下得比較松,沒有引起足夠的警惕。這樣的錯誤李世石不可能犯。
可出乎所有人的意外,李世石以1︰4輸了比賽。第一局比賽結果剛剛出來,中國棋院辦公室的電話就被打爆了,「就好像是要百米賽跑一樣,一會兒來接這個座機,一會兒就跑到訓練室去看訓練室的那個棋。」華學明回憶說,「我想全世界都會記住這麼一天,對圍棋是個顛覆性的。」
震驚之餘,棋手們期待與AlphaGo的正面較量,或許李世石的發揮並非完美,機器本身也存在計算漏洞。
「來吧!管你是阿法狗還是阿法貓!我柯潔在棋上什麼大風大浪沒見過?」彼時,年僅18歲的世界冠軍柯潔在微博上喊話,「AlphaGo贏得了李世石,但贏不了我。」
2016年12月30日,第二代AlphaGo以「Master」為名出現在中國的兩大在線圍棋對弈網站野狐網、弈城圍棋上,以60盤30秒一步的快棋,連續擊敗了包括聶衛平、柯潔、朴延桓、井山裕太等在內的世界頂尖棋手。1月3日,對陣落敗後柯潔突發急性腸胃炎,人生第一次住院了。在接受《人物》記者採訪時,柯潔的父親柯國凡說,當時感覺到兒子壓力的確有點大,「開始很想有機會贏,後來發現覺得這個機會那麼渺茫,很難找到弱點。」
棋手周睿羊第59場出戰。那時他們已經意識到對手不可能是人類——每步棋都在5秒之內落子,人不可能做到這一點。周睿羊向《人物》記者描述與AlphaGo對弈時的感受:「它沒有絕對的風格,它其實就是均衡嘛,它的每一步棋可能是下在全局效率最高的地方,它的每一個子都會發揮它的作用,這就是它厲害的地方……就是有一些你認為是壞棋的地方,它偏偏就這麼下了,而且就是這種招法就隨隨便便地好像就把你贏了。」周睿羊說,越高水平的棋手越能體會到它有多強。
棋手古力在微博上用了一個類比形容Master帶來的震撼:「多年後的某一天,當你發現自己曾經的意識、認知、抉擇都是錯誤的時候,你會一如既往地錯下去,還是否定自己,給自己重新開始的機會呢?致最好的時代or最壞的時代!」
自從AlphaGo戰勝李世石後,柯潔就閉門研究了大半年的圍棋軟體,這次,他準備了一個星期的「最後一招」,因為生病沒有機會用上,他做好了之後與AlphaGo單挑的準備,「我將盡我所有的智慧終極一戰。」他在微博上這樣說。華學明有些擔憂。1月11日,和柯潔父母一塊吃飯時,她囑咐了一句,「你可別讓柯潔走火入魔了。」但那時,這位曾經戰勝過日本老牌超一流的女棋手,也對人類的勝利抱有一絲希望,AlphaGo雖然贏了60盤快棋,但「我們慢棋不見得下不過」。
柯潔對著棋盤深思
堅守
5月23日,柯潔與AlphaGo三番棋比賽的第一天。
正式比賽前半個小時,剛剛出席完開幕式的柯潔一個人待在二層的專屬休息室里。華學明有點擔心他,特地去探望。門打開時,她看到柯潔靠在椅子上閉目養神,看起來精神不太好。作為領隊,華學明知道過去一段時間裡,柯潔經常一個人研究棋譜,「再怎麼的在大眾面前,他是一個謎或者他是一個巨星一樣的,但是實際上來說他還是一個小孩。」
她寬慰柯潔,有人希望你輸,有人希望你贏,任何的關注,其實跟你本身都沒有關係,順其自然,自己做好就行。柯潔聽了沒有說什麼。
自從4月10日中國棋院與谷歌聯合宣布這次圍棋峰會議程後,網路輿論對柯潔充滿質疑:明知道這場比賽會輸,為什麼還要參加。這也成為備賽期間,最讓柯潔心緒不寧的壓力。5月22日,柯潔接受新浪體育的賽前最後一次視頻專訪,他這樣解釋自己的赴戰理由:「大部分人覺得我下這個棋沒有意義,但是我是一名棋手,我就應該有奮鬥拼搏的精神,所以我覺得我不能慫。」
這位曾經因直爽敢言而出名的年輕棋手也早就對比賽的結果有了一定的預期,「我自己也知道我這次會非常艱難,但我不希望我承認自己會輸,我覺得能讓我服它的方法就是在棋盤上狠狠地摁倒我,我覺得只要這樣,我希望我自己就算拋開勝負,也要下出精彩的棋局,給它一點壓力吧。」
柯潔是有備而來的。
第一局,開局第七手(即第七次落子),柯潔採用了AlphaGo的特色著法——在棋盤左上角點了一個「三三」。這是AlphaGo非常喜歡用的招數。在19×19的圍棋棋盤上,「三三」處於整個棋盤相對角落的位置,在傳統觀念里,點「三三」以後,容易讓對方形成厚勢,對自己造成威脅。這一步被視為不適合在棋局初期使用的著法,卻是AlphaGo開局的標誌性下法。如今,柯潔「以彼之道,還之彼身」進行反攻。
即便使用了這樣具備「針對性」的打法,整場比賽還是有些不溫不火,用華學明的話說,「根本就沒見血」。最終,柯潔以1/4子負於AlphaGo——這是在中國圍棋規則下雙方之間最小的差距,但在聶衛平看來,「這是AlphaGo一再退讓的結果」,這位被譽為「棋聖」的中國圍棋界老前輩覺得,「這非常恐怖。柯潔也盡了努力,但實在下不過人家。」
畢竟,與人類緩慢進步的速率相比,過去一年,AlphaGo的進步堪稱飛速。據DeepMind團隊介紹,新版本的AlphaGo除了與歐洲圍棋總冠軍樊麾二段對弈之外,還進行了大量的自我對弈訓練,訓練數目達到千萬級。
千萬級,這是任何一個人類棋手窮盡一生都難以企及的數字。獲得過3次世界冠軍的常昊九段說:「吳清源大師一生也只下了8萬盤棋,我大概正式比賽有1000盤。」柯潔更少,正式比賽只有大概300多盤。
DeepMind首席技術官大衛·席爾瓦在比賽第二天的公開演講中提及,新版的AlphaGo和去年與李世石對弈的版本相比,可以讓其3個子。這意味著,「假如用一個數字來比喻的話,如果100是滿分的話,3個子,就等於是我跟你考試之後,我讓了你差不多快70分了。」曾與古力同屬「國少三劍客」的棋手胡耀宇八段向《人物》記者解釋。但他也和許多棋手一樣,認為新版AlphaGo還做不到讓人類棋手3個子。
中國烏鎮·圍棋峰會開幕式上,柯潔與Alphabet公司(谷歌母公司)董事長施密特、DeepMind創始人兼CEO戴密斯·哈薩比斯合影
巨大差距讓柯潔的認知更加清醒:「我覺得人類的姿態肯定是要放低的,它真的是太厲害了。它很多棋的思想是,它對目的敏感度遠超於人。以前那個版本還很像人類下的棋,現在的版本就很仙。」5月22日,他在賽前最後一次視頻採訪中這樣說。
或許正是因為這份確切的差距,正式比賽前的最後一個深夜,柯潔在微博上宣布,不出意外的話,這將是他與AlphaGo的最後三盤棋。
「人工智慧發展速度太快了,它每一個版本的進步都是巨大的。我相信以後它會更加完美,越來越強,而人和它的差距僅靠自身努力是不能夠彌補的。」第一場賽後新聞發布會上,柯潔向媒體解釋為什麼要做出這樣的決定。在他看來,如果此時不能打贏AlphaGo的話,「未來和AI對弈贏的概率無限接近於零,這個太痛苦了。」巧合的是,另一位曾經的「人機大戰」主角也在3月份的一次採訪中說:「以後再也不會和人工智慧下棋。」
李世石和柯潔,這兩個被AlphaGo公開挑戰的職業棋手都被外界視為守護人類在圍棋上「最後的希望」,這讓兩次人機大戰都不可避免地帶有一定的「末日英雄」色彩。
可DeepMind創始人兼CEO戴密斯·哈薩比斯卻從來就沒有把人工智慧放在人類的對立面,在他看來,AlphaGo的開發者們是和棋手一起探索圍棋的未知世界,「就像是從前人們用哈勃望遠鏡探索宇宙」,這位被譽為「世界上最聰明的人」之一的科技神童說。
第一局比賽結束後,儘管輸了棋,但是柯潔看上去心情不差。賽後,他和朋友連笑一起去釣魚、射箭、摘枇杷,還特地帶了一些枇杷回酒店,「給爸爸吃,老爸喜歡吃。」他的狀態看上去很輕鬆。
比賽結束後,柯潔沒有馬上離場而是對著棋譜研究
「阿老師」
與一年前AlphaGo給圍棋界帶來的衝擊相比,職業棋手已經接受了人工智慧的到來。曾經被戲稱的「阿爾法狗」有了屬於他的尊稱,「阿老師」。研究「阿老師」的棋譜成為棋手們日常訓練的重要一環,「他們現在每天比較感興趣的就是,一會兒就說研究一下,這招,這是AlphaGo,就哄堂大笑。」華學明說。
使用人工智慧的招數已經成為當下棋手間普遍流行的打法。回溯圍棋發展歷史,棋界一直處於一種「緩慢進化」的節奏中。即便是圍棋大師吳清源、「石佛」李昌鎬這些曾經引領過時代的棋手對於棋界的影響也遠不如AlphaGo來得廣泛、徹底和猛烈。
周睿羊算是率先把「阿老師」的招數應用到實際比賽中的人。在「阿老師」的啟示下,這個25歲的年輕棋手覺得自己的思路更開闊了,「很多棋不能光是盯在一個小的地方,要往更大的地方看,從全局考慮。」這讓他在之後的數次比賽中屢屢得手,被棋界調侃為「Alpha羊」。「除了柯潔,就他最難對付了,實在是太強了。」曾經的中國圍棋領軍人物古力這樣評價。
28歲的棋手陳耀燁九段在本次烏鎮圍棋峰會上,參加了對陣AlphaGo的團體賽。他告訴《人物》記者,棋手們研究AlphaGo的棋譜,更多是研究它前半盤的著法,「主要是它的棋譜到後半盤的時候,基本上都勝負已分了,不像前半盤,確實它的很多著法給我們帶來了一些新的、應該是革命性的想像力吧。」
這種「革命性的想像力」指的是AlphaGo下棋的自由度。諸如開局點三三、高拆拆四、局部的大飛守角直接撞上去……類似下法在人類之前的比賽中比較少見,但在AlphaGo的操作下,這些罕見的招數在全局中發揮出了極大效率,從這一層面而言,AlphaGo告訴棋手,「沒有什麼棋是不能下的。」
不同於AlphaGo基於全局的勝負概率判斷而落子,人類棋手在嘗試使用「阿老師」的招數時,必須在自己的理解和風格上進行判斷。這就是反覆被棋手提及的「下圍棋的直覺」,也是在他們看來,人類棋手對弈時體現的「人性溫度」。
柯潔在5月22日的長微博《最後的對決》中評價自己的機器對手:「可它始終都是冷冰冰的機器,與人類相比,我感覺不到它對圍棋的熱情和熱愛。對它而言……它的熱情——也只不過是運轉速度過快導致CPU發熱罷了。」
正式比賽時,幫助AlphaGo落子的「人肉機械臂」——DeepMind工程師黃士傑博士也將這種「機器的冰冷感」發揮到極致,6個多小時的對弈中,坐在柯潔對面的黃博士幾乎全程面無表情,甚至可以不喝水、不上廁所。曾經坐在黃博士對面的李世石甚至在第一次人機大戰後的一個月,還夢到黃博士面無表情地坐在自己對面,因而驚醒。
5月25日,柯潔對AlphaGo的第二局,前100手,DeepMind的後台數據一度顯示兩人之間的勝負差率相差無幾。
一旁的研究室里,其他棋手和聶衛平、王汝南、華以剛等老前輩同步擺棋研究,下到最緊張的時候,在開著冷氣的房間里,周睿羊把外套都脫了。午飯時間,聶衛平等老棋手沒有一個捨得下樓吃飯,都緊緊地盯著棋盤。
儘管第二局比賽柯潔還是輸了,但這是人類第一次如此接近AlphaGo的水平。雖然AlphaGo本身只是一個由數萬行代碼構成的程序,可開發出它的工程師卻是與柯潔、李世石等棋手一樣的血肉人類。持續關注著後台的工程師們面對這一數據內心振奮,AlphaGo之父戴密斯·哈薩比斯迫不及待地發了條推特:「太難以置信了!」某種程度上可以理解為,這是寄托在AlphaGo身上的「人性」。
柯潔與AlphaGo對弈。他對面的是一直以來擔任AlphaGo「機械臂」的工程師黃士傑博士。
一別兩寬
柯潔曾經的教練、從事在線圍棋創業的王煜輝七段認為,AlphaGo的出現讓更多的人關注到圍棋,過去一年,報名學習圍棋的小學員里,至少有70%-80%是因為家長看了AlphaGo的新聞。
與老一輩不同,如今年輕一代的棋手在訓練時,更加註重技術性和計算力。一方面,大量的網上訓練增加了訓練強度,強化了棋手的勝負觀。同時,賽制的變化也需要他們依靠快速計算獲取時間上的優勢。「年輕的一代,更多的,我跟你講,有點AlphaGo的意思。」年逾70的中國圍棋協會主席王汝南對《人物》記者說。
縮短比賽用時已是棋界的普遍趨勢。過去,一場比賽可以下四五天,有一次電視台想要轉播,結果不能確定比賽時間。為了適應現代節奏,讓比賽更激烈、具有可觀性,現在一局棋每人一般在3小時左右結束,而且每局比賽之間的間隔也縮短了。「他就不能像以前日本那樣,寬鬆的時間,又有休息的時間,那他可以慢慢地去琢磨這個棋應該怎麼下。」胡耀宇說。「大家到後面呢就偏向計算,然後看誰算的快,時間上就占(優勢)。因為到後來沒有時間,你計算不過來啊,所以那一定要加強速度,強調計算的速度,強調你的這個速度要快,這樣你的體力也能節省下來。」
這看上去的確與追求勝利為結果的「阿老師」頗為相似,只不過AlphaGo下棋追求取勝概率的最大化,不拘一格,人類則受限於計算力,不敢輕敵,必須全力拚殺。
在胡耀宇看來,現在的棋手不僅需要學習AlphaGo的著法,還要將這些著法與人類歷史對局中的著法融會貫通地學。「更多的不是拼計算力了,那有可能是理解力了,那這個時候,大家對文化的需求就更大了。不然的話,你沒有一定的文化,沒有一定的積累的話,你這個著法相對來說,吸收就會比別人慢。」
「其實還得感謝人工智慧的出現。因為原來的年輕棋手的話,他唯一追求的也是一種取勝,有很多的條條框框,他最後的一級就是說我的勝負只要在那個,死活題啊在什麼地方,一招致勝就可以了。」華學明說,「就像那時候大家有的人會說,哎呀,聶老說大局觀怎麼怎麼樣,其實大局觀對於圍棋是很重要的,但是大家不會在意這些東西,只要覺得我最後算過你就可以了。但是AlphaGo圍棋給大家帶來了另外一個思路,大家就覺得應該去開闊眼界,而不是像現在這麼局限性,這是有好處的。」
5月27日,柯潔與AlphaGo最後一場比賽結束後,DeepMind官方宣布AlphaGo從此不再與人類進行公開對弈。「年僅3歲」的AlphaGo,被中國棋院授予九段棋手認證的「人工智慧棋手」正式「退隱江湖」,在它身後,留下50張自我對弈的慢棋棋譜作為禮物,供人類研究。
劇情的發展讓人聯想起1996年,計算機「深藍」戰勝當時世界棋王卡斯帕羅夫後的「隱退」,科技的進步攪動了古老遊戲後遠去,留下了一個神秘的背影。
在緊隨烏鎮圍棋峰會到來的第22屆LG杯世界棋王戰32強戰上,柯潔首局中盤戰勝韓國名將元晟溱九段。比賽結束後,他發了條微博:「現在才發覺……原來和人類下棋,是可以這麼的輕鬆、自在、快樂……下圍棋真好。」
那個人類的圍棋「大魔王」回來了。
比賽結果宣布後的柯潔
推薦閱讀:
※永明延壽大師《禪凈四料簡》解析
※蕅益大師《論語點睛》——學而第一
※網弈大師談命論相之十從周迅的命相預測和李大齊的婚期
※印光大師:初心專禮[]