人類與AlphaGo的恩怨情仇(五):最後一戰

  AlphaGo與李世乭的挑戰賽,乃是圍棋界空前絕後的大事件。世界各國主流媒體爭相報導,將其列入各種「年度十大」的榜單。歐、美等地圍棋用具脫銷,圍棋俱樂部門庭若市,數百萬人認識了圍棋。不過,AlphaGo受到的大部分關注還是來自圍棋的母國——中國。聶衛平席捲中日擂台賽已過去近三十年,圍棋再次回到大眾視野。有的人問,中國人發明的圍棋,為什麼谷歌選擇了一個韓國人做對手?略懂一點的人也疑惑,世界第一不是柯潔嗎,為何被選中的是李世乭?

  谷歌籌備與李世乭的巔峰之戰是在2015年末。其時,柯潔的崛起尚在進行時,棋界群龍無首。李世乭作為上一個世代的王者,在所有高手中仍位列三甲,雀屏中選合乎情理。然而,幾個月的時間,棋界風雲變幻,柯潔戰勝李世乭加冕三冠王,成為公認的霸主。谷李五番棋前後,Goratings等級分因哈薩比斯等人的頻繁引用而聲名鵲起。AlphaGo因四比一勝李世乭登上排行榜第二位,竟仍排在柯潔後面。某谷歌員工轉發排行榜,並喊話柯潔「你準備好了嗎」,被認為是谷歌向柯潔宣戰,在社交網路上瘋轉。儘管最後被證明是該員工的個人行為,吃瓜群眾對柯潔與AlphaGo終極對弈的期待可見一斑。柯潔本人求戰慾望強烈,棋院不吝支持,似乎萬事俱備,只欠東風。

  可惜,時間不在柯潔這邊。谷李大戰之後,谷歌團隊全情投入了AlphaGo的升級工作。當時流行的觀點是,AlphaGo具有強大的自我學習能力,進步飛快,一兩個月就可以把柯潔遠遠甩在身後。這算是說對了一半。背後的另一半,則是谷歌團隊的不懈努力。數月之後,AlphaGo的知識漏洞得以修復。在第四局78手同樣的局面下,更新後的AlphaGo能夠做出正確選擇。時間飛逝,AlphaGo的進步,相比於一步一個腳印的人類,「是用飛的」(黃博士語)。11月7日,樊麾宣布AlphaGo將復出。

  12月29日,一名為「Magister」(後改為「Master」)的賬號悄然登陸弈城。最初願與Master對弈的多為排名靠後的職業棋手,而連戰連捷的Master迅速引得注視。一日十局,連戰三日,柯潔、朴廷桓等人輪番挑戰,未能撼動Master分毫。隨後,Master轉戰野狐,各路豪強繼續挑戰,竟連一個勝機都找不到。最後一天,年屆65歲的聶衛平出戰。因聶老年事已高,對局用時特意延長了一倍。與古力的最後一局之後,Master達成60連勝。野狐的聊天框內彈出一條繁體中文消息「謝謝聶老師」,隨後證實Master真身是AlphaGo的最新版本,由黃士傑博士控制。六天,六十局。AlphaGo在人間已無抗手。

  與Master惡鬥兩局後,柯潔因身體不適住院。期間,柯潔不忘發微博讚歎對手的表現,也展示了自己的鬥志。「若不是住院,我將用上那準備了一個星期的一招。」 未幾,柯潔又曬出一張對戰國產AI絕藝的棋譜,稱用「非常手段」戰勝了對手。只見棋盤上黑白棋子熙熙攘攘,圍繞天元對稱分布。棋近終局,執黑的絕藝貼不出目而認輸。柯潔從頭模仿到尾,而單純的絕藝不知柯潔的險惡用心,稀里糊塗就輸掉一盤棋。看來,柯潔的秘密武器就是模仿棋,而且對AlphaGo之外的AI頗有奇效。

  2017年3月18日,柯潔登上央視當紅訪談節目《朗讀者》,直言「如果輸會被嘲笑,但如果怕會輸一輩子」。在朗誦環節,柯潔選擇了《哈利波特與死亡聖器》的大結局。

......

  一道紅光劃破了他們頭頂上被施了魔法的天空,就好像耀眼的陽光掠過窗檯從離他們最近的窗戶里射進來,同時照亮了他們兩人的臉,伏地魔的臉看起來就像燃燒了一般,與此同時,哈利用德拉科的魔杖指著空中,他聽到兩聲最高分貝的、注入了全部的期望的叫聲同時響起:

  「阿瓦達索命!」

  「除你武器!」

  隨著猶如大炮一般的巨響,金色的火焰從他們兩人的魔杖中噴發出來,就在兩人剛才踩過的生死圈的中心,咒語衝撞在了一起。哈利看到了伏地魔的綠色魔咒碰到了他自己的魔咒,看到了長老魔杖高高地飛起,在日出的映襯下,划過施了魔法的天花板,就像納吉尼的頭。它從那個夢寐以求想要擁有它的人的方位划過。而後哈利,做為一個出色的找球手,在伏地魔倒地的同時用他空著的一隻手抓住了那根魔杖——而伏地魔雙臂張開,猩紅的眼睛裡的瞳孔張開翻了起來。湯姆·里德爾死了,以最平凡的樣子死掉了,他的身體綿軟地收縮在一起,雙手空空,蛇一般的臉慘白空洞。伏地魔死了,被他自己的咒語彈回去殺死了,哈利握著兩根魔杖站在那裡,低頭看著地上那敵人的空殼。

  董卿在《朗讀者》節目獲大獎的頒獎儀式上,不忘讚美柯潔「在他身上體現出來的敢於勝利的決心,面對挫敗的勇氣,這一點人永遠比機器更加高貴」。

  5月23日,中國烏鎮圍棋峰會,千呼萬喚始出來。柯潔挑戰AlphaGo Master,三番棋,每局保留用時增加到三小時。代替AlphaGo落子的還是黃士傑博士。首局,柯潔猜得黑棋先行。

  雙方各自佔領空角之後,柯潔立即在右下點三三。點三三是常用侵消手段,但在棋局初期罕見。吳清源發起新布局革命之後,星位成為流行的占角手法。最初,職業棋手按照傳統觀念,以直接點三三應對,並逐漸演化出下圖的標準定式。

  棋手們很快發現,這個變化黑棋外勢雄壯,白棋雖得角地卻失於大局。於是,在之後的數十年中,布局初期點三三幾乎絕跡。

  誰也不曾想到,AlphaGo竟能顛覆這個最基本的定式。Master的網路六十局中,不僅常常甫開局就點三三,而且省略了標準定式中最後的扳粘(上圖10-13手),改為在另一側多爬一手,然後脫先。棋手最初不理解,還以為佔到便宜。可等到後半盤,發現黑棋的「厚勢」不知不覺變成了孤棋,被對手欺侮。其中關鍵就是AlphaGo省略的扳粘。不走扳粘,使得黑棋的外勢不復往日厚實,而白棋角部並無死活之憂。

  柯潔在此處點三三,是模仿對手,也是向對手致敬。右下角至22手,據范廷鈺九段的解說,是國家隊的最新研究成果。

  白24豪放。此處,人類棋手通常會在A位乾淨地吃掉黑19一子,同時補上B處的弱點。AlphaGo選擇飄逸地補棋,是判斷外圍虛走一手的價值比補斷更大。這是人類棋手難以把握的判斷。

  柯潔期待先撈足實地,再入侵白棋大本營,以治孤決勝。人算不如狗算。左上角,AlphaGo略施小計便轉進到了最實惠的角上,將四個兄弟拋給黑棋。仔細一算賬,又是AlphaGo便宜了。這還不算完,白50更是令黑棋如鯁在喉,粘覺得不甘心,不粘又不安全。棋下到這裡,白棋已完全掌握了主動權。

  其實柯潔下得也不壞。黑棋隨後深入虎穴,在下方白陣中活出一塊。白棋一路領先,但差距始終沒有拉開。奈何AlphaGo掌控局面的能力已爐火純青。至114手,白棋在上邊活出,扼死黑棋最後的翻盤希望。

  官子階段,AlphaGo就像往常一樣,溫柔地退讓,令結果定格在白勝1/4子,中國規則下的最小差距。從過程來看,AlphaGo從第二個局部開始就不斷獲利,聚沙成塔,積累下足夠的優勢。柯潔發揮尚可,但AlphaGo下得太好。這是AlphaGo完勝的一局。

  隔日,第二局,柯潔執白。AlphaGo喜歡白棋,柯潔也喜歡白棋,這都不是秘密。手執白棋,想必柯潔多了一分底氣。

  AlphaGo使用了和柯潔首局一樣的小目·三三布局。AlphaGo不僅愛點三三,也會以三三占空角。三十年前曾流行的三三占角,因AlphaGo而復活。前八手,雙方在左上和右下走出對稱的棋形;但右上和左下一個星位、一個三三,意味著柯潔放棄了模仿棋,欲與對手正面對抗。

  本局精彩的部分,比以往時候來得更早一些。黑11托,是AlphaGo偏愛的定型。在人類棋手的下法中,此定式通常用於白棋在A位附近有子,即黑棋掛角一子陷入夾擊時採用。至黑19正常。白20點,柯潔挑起戰端。由於該局部的配置與人類習慣的不同,白20點並無友軍接應,直觀看略顯激進。

  黑21反擊,然後23斷試應手、25跳。一套組合拳下來,白棋點入的二子已被封鎖。柯潔小心翼翼的一衝,換來AlphaGo同樣小心翼翼的一退。右上角的棋形十分微妙。白棋在A處斷,即可快一氣吃掉黑角上四子。但黑棋在C位簡單一虎,讓白棋只能收氣吃,而黑棋外圍不僅厚實,還有諸多借用和劫材。如此看來,A位斷只是個美麗的陷阱。就在解說們替白棋想辦法的時候,柯潔選擇脫先,搶佔下邊大場。AlphaGo接下來也沒有在右上走棋。誰先動手就能吃掉對手,卻如食雞肋,不如都不吃,也許將來這塊雞肋就變好吃了呢。

  柯潔與AlphaGo在此局部的想法完全一致。局後的分析,從第11手開始到第30手為止,AlphaGo自己和柯潔的選擇一模一樣。其中,白20、26、30三手均為選擇的難點,柯潔在此局部成功cosplay對手,實屬不易。此局之後,該變化在職業對局中多次出現,有人稱之為柯潔-AlphaGo定式。

  之後,雙方不緊不慢地佔領左邊和下邊大場,直至55手。柯潔在第56手變招,碰黑棋的三三。

  這步棋同時出乎人類棋手和AlphaGo的預料。正常白棋應走在A位,可以救回一子。AlphaGo對此給出的變化四平八穩,雙方各自連接、定型。柯潔在復盤時說,他覺得自己在左邊已經小虧了一點,繼續平穩下去沒有自信,不如拼一把。樊麾則透露,AlphaGo認為此時白棋勝率是51%,相比於空枰的55%(大貼目優勢)略有下降,仍是平衡的局面。56這一手讓白棋勝率直降八個百分點,棋局頓時失去控制。

  儘管白棋勝率大降,棋局卻進入了柯潔希望看到的亂戰局面。AlphaGo戰勝李世乭之後,各路AI群雄並起,其中佼佼者如絕藝、DeepZenGo達到甚至超過了頂尖職業的水平。棋手在與AI長期的對抗中發現,與AI拼內功,即較量細微處的選擇、判斷力,完全比不過。倒是在混戰之中,AI偶爾犯一些低級錯誤,讓人類抓住機會。AlphaGo輸給李世乭的一局也是如此。全面升級之後的AlphaGo Master,會再給人類一個機會嗎?

  亂戰局面,黑白雙方如在鋼絲上跳舞,稍有不慎就會落下萬丈深淵。二十餘回合的戰鬥後,至一百手,仍是不分勝負。白棋挑起了左下的劫爭,讓形勢愈加混沌不清。在谷李五番棋第二局後,曾有「AlphaGo不會打劫」的謠言。謠言和現實的確相去甚遠,AlphaGo打起劫來毫不含糊。不過,由於劫爭反覆循環,會佔用AI的部分搜索深度,使得有劫爭的局面對AI更困難。當前局面,黑白雙方七塊棋糾纏在一起,還有左下角一個巨大的劫爭。如果AlphaGo會犯錯,當下就是那個使她最有可能犯錯的局面。

  AlphaGo自評此局面黑棋勝率60%,小有優勢,也可能反覆。柯潔也嗅到了一絲勝機,小心臟撲通撲通地狂跳,以至於要用右手按在胸口平復心情。令人窒息的數分鐘過去,柯潔落下114切斷,留給鏡頭一個堅定的眼神。

  此時,棋局的混亂達到了頂點。黑棋下面和右上兩條大龍被切斷,似乎難以兩全。這可能是AlphaGo Master與人類對戰中遇到過的最困難局面。接下來的幾回合,是AlphaGo的表演時間。

  黑119呆並,乍看是緩手。仔細揣摩後發現,黑A、B兩點必得其一,要麼可以吃掉下面白棋大塊,要麼可以和右上黑棋勝利會師,已立於不敗之地。黑棋這一手,補全自身棋形的弱點,為接下來的發力創造了條件。這一著並,恰似拳擊手縮回拳頭蓄積力量,觀察對手破綻再出拳,隨即一擊制勝。

  柯潔不願坐以待斃,放任右下大龍被圍也要引爆左下的炸彈。可是,黑133落下之後,一切都結束了。柯潔少算了此處黑棋的一枚劫材,現在白棋沒有機會打贏左下的劫爭了。無奈之下,白棋選擇救回左下數子,不足以挽回之前損失。堅持十餘手後,柯潔投子。

  認輸之後,心情鬱悶的柯潔喃喃自語。好在唐韋星、連笑、時越等好友馬上圍了過來,一起探討棋局得失,沖淡了輸棋的陰霾。

  縱觀全局,白棋並無明顯勝機,但不失為一盤名局。棋壇曾有不止一位豪強號稱「前五十手天下第一」,只有柯潔這盤棋是經過史上最強棋手AlphaGo認證的——五十手之後,人類的勝率仍領先,這是Master對局中的唯一。柯潔成功將局面導入預想的軌道,可惜全面升級後的AlphaGo,即使在極度複雜的局面下也不會犯錯,能做出最好選擇。正如哈薩比斯賽後所說,柯潔將AlphaGo逼到了極限,讓AlphaGo不得不使出十成功力來應對。本局柯潔的表現,當得起「雖敗猶榮」這四個字。

(未完待續)

(題圖來自紐約時報cn.nytimes.com/china/20

本系列傳送門:

不會功夫的潘達:AlphaGo與人類的恩怨情仇(一):世紀難題

不會功夫的潘達:AlphaGo與人類的恩怨情仇(二):初試啼聲

不會功夫的潘達:AlphaGo與人類的恩怨情仇(三):巔峰之戰

不會功夫的潘達:AlphaGo與人類的恩怨情仇(四):絕地反擊


推薦閱讀:

吳清源有柯潔厲害嗎?下得過AIphago嗎?
為何圍棋高手下完棋可以復盤?
為什麼圍棋界有「二十歲不成國手,終生無望」的說法?
如何看待2017年三星杯預選賽中國一冠群棋手集體被淘汰?
「深藍」大敗卡斯帕羅夫與Alpha Go和李世石的對決中表現的「人機大戰」意義一樣嗎?差距在哪?

TAG:围棋 | AlphaGo | 柯洁 |