AlphaGo與人類的恩怨情仇(三):巔峰之戰

  2016年1月27日,AlphaGo登上《自然》封面。同日,DeepMind宣布,將在同年3月挑戰韓國棋手李世乭九段。

  李世乭,一代棋王,世界大賽十四冠(注1:DeepMind採用十八冠的說法,計入了亞洲杯電視快棋賽的冠軍)。AlphaGo,第一個分先擊敗職業棋手的圍棋AI。命運的齒輪就此開始轉動。

  人機大戰,一個能抓住所有人眼球的話題。棋手和軟體工程師,利益相關的兩個群體針對人機大戰爭論不休,觀點涇渭分明。IT從業者普遍對AlphaGo獲勝前景樂觀,因為AlphaGo採用的深度學習技術近年來攻無不克。而棋手們在看過AlphaGo對戰樊麾的棋譜之後,認為她只不過是准職業水平。儘管從戰勝樊麾到挑戰李世乭,AlphaGo尚有五個月時間,但多數棋手不認為五個月的訓練足以讓AlphaGo跨越從弱職業到頂級棋手的天塹。兩派觀點都非常堅定,認為自己這邊贏定了,卻不知幕後的暗流涌動。

  挑戰賽的發布會上,李世乭九段表現出謹慎的樂觀,認為自己將以5比0或4比1的比分勝出,重點是儘可能不要輸掉一局。而DeepMind首席執行官哈薩比斯則表示,勝負將會是五五之數。紀錄片《AlphaGo》揭示了哈薩比斯所說「五五開」的真實含義。

  樊麾在與AlphaGo鏖戰之後,回到DeepMind負責測試。3月份之前,AlphaGo飛速進步,表面實力已超過頂尖棋手。然而,樊麾在反覆測試之後,發現了大問題。在少數局面下,AlphaGo不能正確評估當前形勢,導致低級錯誤。

  賽前的一盤測試棋,AlphaGo再次犯下低級錯誤。項目負責人大衛·席爾瓦(David Silver)在例會上說,如果正式比賽中出現這個錯誤,我們在公眾面前就尷尬了。席爾瓦詢問黃士傑博士有無辦法解決,黃博士略帶尷尬地笑稱:「我正在努力解決。」

  這確實不是一個簡單的bug。直到出發前三天,整個團隊仍在加班加點尋找解決方案,卻無結果。哈薩比斯帶領的團隊,只能以有缺陷的AlphaGo出征了。

  人們常說,李世乭面對的是一個冷冰冰的對手,無法與之交流心靈。不過,李世乭可以與哈薩比斯交心。賽前數日,哈薩比斯與李世乭通過翻譯和視頻交流。哈薩比斯曾是西洋棋神童,兩人有共同話題。但李世乭最關心的事,當然是AlphaGo的實力到了何等地步。哈薩比斯稱不能透露具體情況,不過AlphaGo確實已有長足進步,相信會是精彩的對決。

  李世乭在與DeepMind簽約之時,並未效仿「深藍」故事,要求測試對局。大概當時李世乭並未意識到AlphaGo的巨大潛力。等到賽前,李世乭發現自己的對手深不可測,卻再沒有偵查的機會。李世乭為自己的輕率付出了代價,他只能在迷霧中作戰了。

第一局

  韓國首爾時間3月9日下午1時,巔峰對決啟動。坐在李世乭對面的,不是機械手,而也是一位棋手。黃士傑,AlphaGo項目的最初開發者、主要貢獻者,台灣業餘6段棋手。黃博士安靜、沉穩,符合大眾對軟體工程師的一貫印象,也符合一名棋手的形象。若不是黃博士面前有一台電腦,沒人會懷疑這只是一場普通的圍棋賽。

李世乭猜得黑棋先行。開局階段,李世乭看上去比較輕鬆,落子不假思索。而AlphaGo則顯得相當謹慎,每一步棋都思考了接近一分鐘。棋局很快進入了不同尋常的方向。

  全局的第7手,李世乭在棋盤右邊斜拆四。黑棋1、3、5、7前四手的組合,在棋譜中不曾出現。李世乭或許是認為AlphaGo針對人類布局存有應對策略,便另闢蹊徑,想考驗對手。試探對手的代價是,這步棋本身不合棋理。按照一般布局理論,黑棋此時當在棋盤上邊行棋,如A、B等處,避免左上一子孤軍奮戰。AlphaGo也持相同觀點。

  右上角簡單處理之後,AlphaGo將黑棋上邊二子隔開,取得了局部戰鬥的主動權。下到這裡,李世乭慢了下來,棋局似乎不如預想的順利。24、26又是令人驚艷的組合拳,各方解說無不讚歎AlphaGo的力量。落下第27手後,李世乭輕輕搖了搖頭。李世乭有意要和AlphaGo掰掰手腕,但這不是最好的時機。被白棋28手切斷以後,局部黑棋陷入被動。之後,黑棋勉強處理好被分割的兩塊棋,卻免不了被對手占點便宜。棋至中盤,白棋已建立了一定優勢。

  由於棋局不利,李世乭表現得愈加緊張。第67手時,李世乭捻起一枚棋子,猶猶豫豫想落在A位,終究沒有落下,訕訕地收回右手,搖了搖頭。手持棋子在棋盤上晃來晃去,俗稱「小貓釣魚」。若是棋童這麼下棋,要被老師打手心的。不過,若是李世乭確實落子在A位,事情會更糟糕,這盤棋李世乭就已經輸了。在場的韓國解說稱:「最令人擔心的事發生了,李九段在懷疑自己,好像還有一點震恐。」

  AlphaGo似乎已接近勝利,局面卻又發生了變化。白棋把左下角廣闊的空間讓給黑棋,隨後又弈出88虎的失著。黑91割下一子之後,將下方大空盡數收入囊中。

  棋局至此,多數解說判斷李世乭已逆轉局面,取得優勢。AlphaGo自評的即時勝率也略微下降,但仍在70%以上。就在各家媒體的演播廳的氣氛一片樂觀之時,AlphaGo祭出了決定性的一著。

  白102,打入。光芒萬丈的一手棋。白棋精確地撬開了右邊黑棋防線上的唯一空隙。長考7分鐘之後,李世乭並未找到殲滅入侵者的手段,無奈妥協。白棋金蟬脫殼,吃掉右上三枚黑子後揚長而去,確立勝勢。

  臨近終局,解說們一遍又一遍地點目,只發現黑棋要輸。在樂視演播廳,陳盈初段甚至不敢相信柯潔的判斷,以為聽錯了。棋手們不願意相信,李世乭也不願意相信,但不得不接受事實。第186手之後,李世乭將一枚白子置於棋盤上,示意認輸。歡呼雀躍的是AlphaGo團隊,其他人則反覆念叨一個詞,「難以置信」。

  首局比賽在全球有不少於八千萬人收看直播,其中六千萬來自中國。賽後,柯潔發微博說,「就算阿法狗戰勝了李世石,但它贏不了我」。一石激起千層浪,數百萬人由此認識了一位最年輕的世界第一。當年的柯潔還不是網紅,也許他自己都沒有預料到這條微博將產生的深遠影響力。柯潔只是覺得,這一局AlphaGo表現出的水平不如自己。孟泰齡六段更為激進,認為他能讓AlphaGo一先。由於AlphaGo的發揮看上去並不完美,棋手們在此時仍然低估了她。

第二局

  3月10日,第二局。AlphaGo執黑棋,李世乭執白棋。

  執黑先行的一方掌握著布局走向,AlphaGo很快將棋局引向了不同尋常的方向。第13手,按照定式,黑棋應在左邊□處拆邊。實戰黑棋竟然在右邊拆邊,完成中國流布局。

  此時,棋手們的第一感覺是,既然黑棋拒絕完成定式,那麼白棋應當在左邊B位拆邊,懲罰黑棋的脫先。實際上,AlphaGo的預想圖也是白棋走在B點,然後黑棋走在下方A位,將右下半塊棋盤連成一片。出乎意料,李世乭選擇走在A位,有意破壞黑棋的意圖。觀眾尚未從黑13的震撼中緩過來,又看到黑棋第15手更令人吃驚的表演。

  黑15刺,行內人稱之為「俗手」。所謂俗手,即在不恰當時機履行的先手權利。此處黑15刺與白16接的交換,曾被認為是黑棋的先手權利,白棋無法反抗。只是黑棋不應過早定型,失去很多潛在變化。AlphaGo顯然不這麼看。它認為,黑15與白16交換,黑棋實實在在地獲得了便宜,白棋應當考慮反擊。賽後復盤,柯潔指出,白棋應當在△處反擊。近期問世的AlphaGo教學工具與柯潔達成共識,並認為若白棋反擊,黑15的效果不好,不如直接在左下角動手。

  本局之後,職業棋手在比賽中紛紛效仿黑15的俗手,且研究出幾種新的應對。在此局的棋盤上,李世乭只是笨重地接上。AlphaGo認為自己得利,且在左上角無後顧之憂,轉向左下角。棋局平穩地推進至36手,李世乭出門吸煙小憩。黑37手,五路肩沖。AlphaGo弈出本局中最漂亮的一手棋。

  在三千年圍棋史上,除了武宮正樹以外,沒有人會下五路肩沖。其原因不難理解:比如此局面,白棋只需在B位貼住,即可確保整條上邊全部姓白。五路肩沖等於送對手在四路圍空,效率甚高。AlphaGo的預想圖也是白棋走B位,然後黑棋左一路跳。這樣一來,黑棋在中腹與左邊△數子建立聯繫,全盤一體。五路肩沖體現了AlphaGo的創造力,給人以極大視覺衝擊。但這並不是制勝的一著,甚至不見得比其它選擇更好。在白棋走36之前,黑棋在考慮走下方□處的吊,直至36手之後才臨時想到實戰的五路肩沖。如果李世乭按照AlphaGo的預想圖施工,棋局仍然均衡,勝負漫長。

  紀錄片《AlphaGo》用重點描繪了這一步棋的前前後後。樊麾說,他非常期待李世乭吸煙歸來之後,看到黑棋五路肩沖時的表情。李世乭坐下後,先是驚愕地皺眉,然後微微一笑,接著陷入了沉思。筆者參加了《AlphaGo》的首映式,記得鏡頭切換到李世乭的臉上的時候,全場爆笑。在場的大部分觀眾不懂圍棋,卻也和棋手產生了共鳴。

  李世乭思考了十二分鐘,最終選擇不走尋常路,從另一邊(A位)貼出,破壞黑棋的全局聯繫。從局後分析來看,這不是一步好棋。李世乭在本局中始終選擇破壞對手的意圖,不管這個選擇對自己是否有利。這可能是與人類對局時的思維慣性:打破對手的意圖,就能干擾對手的心情。但AlphaGo沒有心情。李世乭沒有按預想圖走,AlphaGo只會更「高興」,因為黑棋的勝率又漲了。

  棋局才進行了短短三十多手,AlphaGo就下出了三手人類看來不可思議的棋。李世乭與對手的圍棋價值觀,看來有很大分歧。面對價值觀上的分歧,自信者的做法應該是堅持自己的判斷,避免行棋前後矛盾。可是,李世乭的對手太特殊、太神秘,以致於李世乭不可避免地懷疑,是不是對手的判斷就是比我的判斷正確。於是,李世乭在本局中的選擇,可以說完全放棄了自己的判斷,相信對手的判斷,因而刻意去干擾對手的意圖。重壓之下,李世乭做不到那個棋盤前那個自信、沉穩的自己。

  此後,AlphaGo在左下強硬地出動殘子。這步棋在AlphaGo的復盤中被自評為本局唯一失誤,給了李世乭反擊的機會。可惜,李世乭在局部沒有下出最強手段,左下定型雙方平分秋色。

  李九段大概是覺得左下的結果滿意,產生優勢意識。之後的幾手棋,白棋下得相當保守,價值不大。等到李世乭發覺形勢不利之時,白80選擇打入黑陣拼搏,為時已晚。黑81以下輕鬆化解白棋攻擊,確立勝勢。白棋堅持到211手,隨後投子認輸。

  賽後,李世乭說,「昨天我驚訝於AlphaGo的出色表現,但今天,我完全說不出話來。」 整個新聞發布會的現場瀰漫著憂愁、鬱悶,彷彿是整個人類輸掉了這一盤棋。即使AlphaGo團隊成員也不似昨天獲勝後的興奮。零比二,李世乭被逼到了懸崖邊上。面對深不可測的敵手,李世乭還有機會嗎?

(未完待續)

本系列傳送門:

不會功夫的潘達:AlphaGo與人類的恩怨情仇(一):世紀難題

不會功夫的潘達:AlphaGo與人類的恩怨情仇(二):初試啼聲

不會功夫的潘達:AlphaGo與人類的恩怨情仇(三)—巔峰之戰

不會功夫的潘達:AlphaGo與人類的恩怨情仇(四)—絕地反擊


推薦閱讀:

圍棋史上的今天:8月4日 常青樹 間隔11年的兩位48歲世界冠軍
圍棋史上的今天:12月16日 本世紀第一名局 智商164 人生一場RPG
圍棋史上的今天:8月17日 少在我這兒秀個性! 五指山下的頑石
圍棋史上的今天:10月3日 溫故2008 被忘卻的盛會

TAG:围棋 | AlphaGo | 人工智能 |