人類與AlphaGo的恩怨情仇(六):煮酒論史

  2017年5月26日,上午,配對賽。古力+AlphaGo執黑對戰連笑+AlphaGo。所謂配對賽,就是雙人聯棋。和乒乓球雙打規則類似,行棋順序是古力→連笑→AlphaGo1(古力隊友)→AlphaGo2(連笑隊友)→古力,以此循環。正規的聯棋比賽中,隊友之間不可以交流。當然,這回古力和連笑也無法和他們的人工智慧搭檔交流。

  開局不久,AlphaGo又秀了一把她對定式的獨特理解。

  白12跳,罕見。普通的著法是在左一路爬。輪到古力九段,以大力著稱的他當然要懲罰白棋的「無理手」。

  到黑21征死白一子為止,黑棋把白棋完全限制在角上,按照以前的定論是黑棋不錯。白棋的唯一收穫是可以在右上角引征。AlphaGo非常看重此處引征的價值,認為如果在A位碰,會使黑棋的勝率下降到44%,反而是白棋稍優。實戰連笑溫柔地在B位引征,AlphaGo認為逸機,雙方基本回到同一起跑線。AlphaGo以其遠超人類的模糊判斷能力重新詮釋了圍棋的布局,白12跳是又一個鮮活的範例。

  在右下的戰鬥中,黑棋巧妙棄子,獲得優勢。至後半盤,連笑一度認為白棋已經落後很多,欲拚死一搏。但連笑發現AlphaGo著法不亂,仍然穩健地行棋,可見局勢並不十分悲觀,心情稍定。於是連笑決定和隊友一起耐心等待機會。圍棋又名「手談」,意指對弈雙方不用語言交流,僅看棋盤上的內容就知道他人心中所想。儘管AlphaGo非我族類,當我們熟悉了她的脾性,總能通過棋盤聊聊天。

機會來得不算太晚。白棋通過棄子安定中央之後,在左邊黑陣中暴動,做出打劫活,一舉逆轉。連笑的耐心、與隊友的默契得到了回報。執黑的AlphaGo勝率在數回合後跌穿閾值,示意認輸。古力按照賽前與連笑的約定,任性地拒絕認輸。AlphaGo不開心,索性進入「瘋狗」模式,在白空中連連送死,終於令古力舉牌認輸。連笑為人類贏得了對抗AlphaGo Master的「首勝」。

  同日下午,五位年輕的世界冠軍陳耀燁、周睿羊、羋昱廷、時越、唐韋星聯手對戰AlphaGo。相談棋的形式是隊友之間討論以後落子。職業圍棋賽中,珠鋼杯(金龍城杯)的半決賽和決賽採取此賽制。此前的相談棋多為中韓頂級棋手間的對抗。由於時間充足,討論可以避免低級失誤,相談棋的質量頗高。此次比賽之前,棋界曾對相談棋寄予厚望,認為相談棋能大幅縮小人類與AlphaGo的差距。事與願違,最後定下的賽制,人類團隊僅有兩個半小時的保留時間,甚至少於柯潔一人戰的三小時。時間緊張,不能充分討論,甚至可能還不如不討論。雪上加霜的是,周睿羊讓黃博士猜到了白棋,本局不可避免地變成一出情景喜劇。 

  實戰,黑棋起手雙飛燕,即用兩手棋夾擊對手星位。清代國手范西屏雲,「起手雙飛,不無太緊」。而最近幾年職業棋手普遍認為雙飛燕總能佔到便宜,應避免被對手雙飛燕。AlphaGo Master在這個問題上贊同古人,認為黑棋的雙飛燕並不好。不過,相比於接下來黑棋的處理,雙飛燕顯得是個小問題。五人團在左邊的騰挪手法上糾結許久,意見不一。而瞻前顧後的結果不能更糟:黑棋封鎖左下白棋失敗,左邊的孤棋成為單方被告。左下多花一手棋,什麼都沒走到,還額外贈送左邊實地給白棋。AlphaGo認為此時白方勝率達到74%。

  棋局早早失衡,黑棋苦苦支撐。好不容易找到殺棋的機會,AlphaGo卻滑如泥鰍,輕鬆突圍。大轉換之後,黑棋已失去希望。棋局最後,黑棋還落後幾目。有人提議,不如左下角點進去,看看AlphaGo會不會退讓,只贏半目。

  黑253點入後,這個局部即使對業餘愛好者也不算難題。白棋只需在A位檔,即可把黑棋照單全收。不料,AlphaGo竟走了五人團「期待」的254退讓,給黑棋留下B位的便宜。如果白棋是人類,254這樣的棋不知該解讀成仁慈還是羞辱。而對手是AlphaGo,254就只剩喜感了。照相機記錄下了五位棋士的反應,著名的「歡聲笑語,打出gg」。

  5月27日,柯潔與AlphaGo,最後一局。第二局後的新聞發布會上,柯潔請求第三局執白,得到同意。

  AlphaGo採用變形中國流(黑7比普通中國流左一路)布局。此布局在AlphaGo自戰對局中罕見。AlphaGo在棋局的前三十手會在幾個備選項中隨機選擇一個,而不是直接選擇勝率最高(註:嚴格地說,AlphaGo的決策標準不是勝率最高,而是模擬中重複最多的一個分支。所以在AlphaGo Teach中有時會看到,其它備選項比AlphaGo的選擇勝率更高的情況)的一手棋。一方面,引入隨機因素可以避免AlphaGo陷入局部最優,被對手摸清棋路。另一方面,布局階段的很多情況下,兩個不同選項的差別確實很小,選哪個都差不多。

  實戰柯潔掛入中國流內側之後,AlphaGo的黑13又是新手。柯潔摸不清AlphaGo的意圖,謹慎選擇了脫先。右邊打入之後,白20是柯潔苦心的一手。白棋左右逢源,黑棋很難捉住白棋。不料,AlphaGo回敬柯潔一個脫先,轉而攻擊白右下角。

  處理完右下角,柯潔搶到先手。然而白28、30失誤。白棋想掏空黑棋的右上角,但多花一手棋之後反而背上了包袱。白棋右邊和上邊三塊棋被完全割開,各自均未安定。右上角多補一手又太緩,柯潔給自己製造了一道難題。

  白32碰,好手!星位碰小目也是AlphaGo的首創。在黑棋小目加拆邊的棋形下,星位碰小目意外地有力。柯潔再次向對手致敬,時機恰到好處。至38,白棋打穿黑棋上邊,形成轉換,柯潔重新打開了局面。

  惜乎好景不長。黑39立問應手,白40飛操之過急。柯潔期待黑棋簡單補斷,這樣白棋右邊一塊孤棋容易處理。誰知黑41直接點三三,將白棋原本固若金湯的右下角掏空。棋局對柯潔愈加困難。

  之後,白棋踉踉蹌蹌地跑出右邊一塊,但犧牲了下邊七個兄弟。至上圖的第99手,黑棋優勢不可動搖。

  鏡頭拍到柯潔不在座位的畫面。事後我們才知道,柯潔是在幕後擦眼淚。難受、委屈,筆者觀看本局直播時就是這樣的感受。從第20手開始,AlphaGo就完美地掌控著棋局。柯潔的反擊除了第32手以外,統統像打在棉花上一樣無力。人類與AlphaGo的最後一盤棋,全球棋迷都看著。棋下成這樣,柯潔心中的不甘可想而知。

  拭去眼淚,棋局還要繼續。柯潔在左邊強行作戰,無奈黑棋太厚,白棋收穫有限。之後的官子,AlphaGo一如既往地安全運轉。眼看又是一局半目負,柯潔不願再受對手施捨,憤而玉碎。白棋送死右邊大龍,以此為台階認輸。

  賽後,哈薩比斯宣布AlphaGo退役。中國棋院為AlphaGo頒發九段證書。

  柯潔在人機大戰之後一度無人能擋,取得22連勝,並拿下全運會金牌。此後柯潔狀態起起伏伏,既有大賽三度被淘汰的痛苦,也有拿下利民杯、新奧杯的喜悅。在與人類的對弈中,柯潔化身「點三三狂魔」,嘗試將AlphaGo的知識化為己用。另一方面,柯潔食「不再與人工智慧對弈」之言,在網路平台與各路AI廢寢忘食地黑砍,敗多勝少,屢敗屢戰。新版本絕藝復出後與人類戰近百局,僅輸給柯潔一局。

  三年多以前,大衛·席爾瓦在和黃士傑博士討論將價值網路加入AlphaGo。他們不知道AlphaGo能走到哪一步,只是想嘗試一種新思路。今天,AlphaGo取得了他們當年不敢想像的成績。過去的兩年,AlphaGo與人類的恩怨情仇,對所有圍棋人是一生只有一次的經歷。李世乭弈出流芳千古的一挖;柯潔知其不可而為之,逼出強敵的極限。現在,AlphaGo正在深刻地改變圍棋。從棋盤上的技術細節,到棋盤外的輿論喧囂,圍棋正處於千年未有之變局。站在歷史的十字路口,無人可知五十年後的圍棋會是何種模樣。

   滾滾長江東逝水,浪花淘盡英雄。是非成敗轉頭空,青山依舊在,幾度夕陽紅。 白髮漁樵江渚上,慣看秋月春風。一壺濁酒喜相逢,古今多少事, 都付笑談中。


推薦閱讀:

如何看待2016年3月柯潔表示 AlphaGo「贏不了我」?
智運規則·改:圍棋貼目問題的解決方案
是不是只要投入足夠時間,每個人都能達到圍棋業餘5段的水平?
棋類和數學所涉的智商相同嗎?

TAG:围棋 | AlphaGo | 柯洁 |