古力 & AlphaGo vs. 連笑 & AlphaGo 的配對賽有哪些值得注意之處？

12-30

誰能解釋一下，一直到中盤都感覺黑棋春風得意馬蹄急啊，結果白棋到處農民起義，居然瞬間就革命成功了？
進入圓桌 ? 人機對弈終章，參與更多相關討論。

古力那邊的狗想投降時候

古力:穩住，我們能贏！

比賽結束，古力的狗默默點擊了舉報...

謝邀，個人認為配對賽這盤的精彩程度完全不亞於柯潔對AI的第二盤棋。

柯潔對AI那盤，最精彩的亮點是布局階段雙方圍繞局部和全局利益的均衡展開鬥智斗勇，甚至中盤階段出現7塊將死未死之棋，且對雙方而言每塊都屬於可棄可取的局面。這裡比的是棋手對大局的掌控、形勢判斷的精確以及勝負感的敏銳。以至於AI的演算法判斷二者前100手接近勢均力敵，因此這局棋堪稱前半盤的名局，可惜是人類在算路上始終無法與AI的MCTS搜索抗衡，柯潔在中盤絞殺階段繃緊的弦略有鬆懈，即被AI抓住一舉擊潰。

而連古搭配Alphago的這局，則精彩於局部計算，大型對殺的算路，劣勢下的勝負手，這局棋才真正讓大家看到AI在形勢不利的情況下爆發的恐怖戰力，也讓大家看到在局部接觸戰的過程中人類的算路和AI的差距實際上很大，就連連笑古力這樣的頂尖棋手也很難讀懂AI的招法。

棋局行至黑119手跳，繼續威脅白棋中央整塊大龍的眼位時，白棋全盤目數已佔劣勢，倘若此時自補一手確保活棋，那黑棋只需在左下補一手，白本局基本就是安樂死了。此時AI放出勝負手120引征，試圖把局面攪亂，當黑棋121壓住時，連笑走出122拐頭的正確應對，黑只能扳住，白繼續扳，黑不得已連扳，棋至此時，白棋已在黑棋左方大空里製造出了餘味。然後雙方圍繞120引征一子展開激烈的攻防，最終的結果是黑棋全殲了打入的白棋，但白棋借黑棋氣緊成功先手封鎖中腹，確保中腹活棋。

當此時所有人都認為黑棋勝利在望時，連笑154手深深打入黑空，這正是利用120，122手後一系列手段製造出的黑棋左面空中的餘味。黑棋不得已155靠住，（此處我不確定黑棋是否走出正確應對）但最終結果，左面形成打劫，白棋就此逆轉！此後雖然在右邊和左上角還有激戰，但雙方均應對無誤，最終白中盤勝。

縱觀全局，AI下出的白120手，是本局逆轉的最大勝負手，如果不是這手看似無理的拼搏手段，就不會有後面一系列複雜的變化，從這裡能看出AI在劣勢下，絕非束手待弊，它也會像人類一樣，走出將局面導入複雜卻看似無理的手段，然後在激烈的搏殺過程中等待對手犯錯。

我認為AI也是從人類的棋譜中訓練出來的，人類在劣勢下的攪，它當然也能學會，因為有太多盤人類的逆轉的棋局是靠攪棋成功的。

我認為本局的精彩之處，正是由於雙方的水平相當，才能真正逼出AI的極限，真正讓大家看到AI在劣勢下的爆發力和精彩的對殺算路，也讓大家知道AI並不是神，並非不會犯錯，也並非不可戰勝，只是人類目前自己的水平是真的遠遠落後AI了.......

我覺得賽事沒安排好。

在必要的地方應該設立分歧點。

如果人或機有一方投降或者嚴重不認同對方的下法，立即分歧，以當前局面，擺兩局棋，此後人機分開下。

新版 AlphaGo 遭遇「首敗」，但卻輕鬆戰勝了五位人類高手的圍攻

作為本次「圍棋峰會」中相對輕鬆、有趣的項目，今天舉行的「人機配對賽」與「組團對抗賽」雖然不像柯潔的比賽那樣有關注度，但通過前者能夠觀察人類和機器能否合理配合的情況，後者則也許能通過多人合力的方式對 AlphaGo 發起衝擊。因此在對 AlphaGo 進行研究的意義上，今天的比賽仍然很有看點。

「人機配對賽」節奏輕快，古力拒絕認輸成亮點

經過了兩場柯潔與 AlphaGo 之間的激烈對決之後，形式上別開生面的「人機配對賽」在今天早上上演了。與柯潔比賽時承受的巨大壓力不同，這場比賽由於雙方都有 AlphaGo，所以在勝負上其實沒有太大的意義，更重要的地方在於觀察人類與機器在協同配合上的特點。直白一點說，就是要看看機器在這個過程中究竟能不能理解「人類隊友」的思路，雙方能否互相理解、相互配合。

事實上，這也是圍棋雙人比賽，甚至是所有體育運動多人配合項目的難點。熟悉圍棋的朋友也許知道，圍棋比賽中的雙人項目由來已久，甚至還成為了 2010 年廣州亞運會的正式比賽項目。圍棋雙人賽既可以有男女搭配，也可以師徒組合，但毫無疑問，人與機器的搭配肯定是史上頭一回。

因為在勝負上壓力不大，所以比賽一上來就節奏非常快，不管是古力九段還是連笑八段，他們在落子上的速度幾乎都與 AlphaGo 差不多。

不過，在白 46 手時，由於白棋在形勢上有些微妙，連笑陷入了長考，用去了超過 10 分鐘的時間思考，要知道每方總共的比賽市場才一個小時。在隨後的幾手中，白棋都在棋盤右下方的爭奪中處於不利局面，連笑多次出現較長時間的思考。

隨後，雙方進入棋盤左側進行爭奪，在 AlphaGo 們的帶領下，戰鬥愈發激烈。但由於白棋在局面上較為不利，連笑也不得不用更長的時間來思考，在用時上逐漸甩開了古力組合。下到 96 手時，連笑組合的用時僅剩古力組合的一半。

進入中盤爭奪之後，黑棋的優勢越發明顯，白棋一方也出現了較為明顯的配合失誤。在白 120 手時，AlphaGo 選擇了較為激烈的「沖斷」，但隨後連笑沒有跟進，造成了配合失誤。此時，黑棋在場面上的優勢已非常明顯。隨後在用時上，在古力組合還剩 20 分鐘的時候，連笑組合就進入了讀秒階段。

然而，就在大家都認為可以去吃午飯的時候，場上局面突然出現了大逆轉。連笑組合沒有放棄，通過在棋盤左側的絞殺，對黑棋造成了巨大壓力，場上局面瞬間緊張起來。雙方又繼續在右上方展開爭奪，這時場外的圍棋冠軍們已經認為黑棋危險了。

到了第 197 手時，古力組合的 AlphaGo GU 選擇認輸，但被古力強硬拒絕，於是戰鬥繼續進行。但二十幾手之後，古力終於不得不在第 220 手主動投子認負。

在下午的解說時，古力也反省了一下自己早上的表現，雖然他認為 AlphaGo 的一步棋值得商榷，但他也承認「是我首先下出了失誤，因為我導致了後面逐漸的失敗」。連笑則在後來的採訪時表示「AlphaGo 其實挺像人的」，不過他也認為古力組合的 AlphaGo 在那一步沒有下出最好的應對，有點可惜。

「團體對抗賽」暴露人類劣勢

下午進行的則是團體對抗賽，也就是五位中國棋手周睿羊、時越、唐韋星、羋昱廷、陳耀燁組團對抗 AlphaGo 的比賽，其中由周睿羊執子，其他四位選手坐在他後方提供參考意見。根據古力透露，前一天晚上，團體賽的成員也聚在一起商量了一下策略。

比賽開始之後，人類團隊一方順風順水，直到白第 26 手時，五位人類選手似乎出現了第一次重大的分歧，用去了 10 分鐘以上的時間來討論。在隨後幾步中，五位棋手每一步幾乎都需要較長的討論時間，到了第 34 手，現場解說嘉賓古力表示五位人類棋手在開局的布局上「可能不是太理想」。

隨後，人類整體協同作戰的劣勢就充分暴露了出來，平均每次長時間商議的結果也只能落兩子左右，在下到 60 手左右的時候，用時就已經比 AlphaGo 多出了一個小時。雙方在這一階段在左上方纏鬥，黑棋試圖在這一區域掌握優勢，但 AlphaGo 非常穩健，沒有留下什麼漏洞。

由於在開局階段受損，黑棋不得不尋求「屠龍」的機會，但困難重重。在下第 83 手時，幾位棋手都出現了搖頭、嘆氣的情況。

不過，有點像 23 號和柯潔的第一場比賽，在掌握優勢之後，AlphaGo 一如往常選擇了穩妥的下法，在局部讓黑棋扳回了一些，在領先目數上選擇退讓，穩穩地將領先局面保持到了最後。雖然在進入讀秒階段之後，五位棋手派出了風格更加突進的唐韋星執子，但他也難以力挽狂瀾。最終，AlphaGo 第 254 手中盤獲勝。

可以說，相比柯潔之前的表現，五位人類棋手的表現並沒有做到合力，而是在開局階段出現了多次長時間的商議和爭論，既消耗了時間，更糟糕的是在布局上就失了先機，現場解說王磊八段也說五位棋手今天的開局遭到了研究室內其他選手的一致批評，聶衛平甚至表示這個表現要「打屁股」......

有趣的是，主下的周睿羊在賽後接受採訪時表示，今天沒有發揮好也不全是他的原因......但他同時也表示他們在猜先的時候沒有能夠猜到想要的白棋，只能不情願的執白棋，而「AlphaGo 在第四步就下出了超出我們預料的一步」，所以全盤都沒有找到好的機會。

當然，就像今天比賽的整體氛圍一樣，這種多樣化比賽的形式更重要的地方真的就是「探索圍棋的奧妙」。在比賽之後，不管是古力還是連笑都表示在今天的比賽中看到了不少之前想不到的「奇招」，收穫很大，而這也許就是圍棋的真正意義吧。

本文出自龜途慢慢，來源極客公園。

技術上的意義比較有限。更期待的比賽模式是人和一隻 AlphaGo 一方，另一隻 AlphaGo 自己一方，然後人有權否定自己隊友 AlphaGo 的下法，代之以自己的下法。

看完全局先說結論

古力：阿狗狗你在幹嘛((慘叫

狗：我先前已經算好半目勝了，你看不懂怪我亂下？

這局明顯地看出狗和人的最大差距：用勝率去考慮每一手棋。

最讓人驚豔的應該是連笑在左邊叫吃的那一手，乍看打將，中文台兩位老師一度以為棋局要結束了，沒想到棄去中復白6子後轉黑左邊陣地二路下跳，我覺得黑Alphago已經算好了，選擇了碰一手，這手是最大的分水嶺，賽後復盤時古力馬上倒回那邊探討，我不曉得研討結果如何，但以剛看完比賽的人類棋手角度，那手在雙方的理解上有非常大的差異。

這局黑方到左邊白棋開啟亂戰前確實是佔優的，我個人認為黑狗下出的勝率最高的棋，與人類棋手(古力)出現嚴重落差，黑狗為了確保勝利願意退讓，而人類棋手還在算局部攻殺，導致黑方最後落敗

左方開劫後白方不斷削減黑地抵抗，黑方前期建立的優勢漸漸不再，在黑上方強殺白角失利後，出現了有趣的一幕：黑狗主動認輸，而古力舉牌continue，黑狗說我不玩了，而古力覺得仍有戲唱，之後黑狗就開始招降亂下，這點似乎與去年黃博士說bug修好了有所牴觸，從人類角度看的話可以說目前狗的最大問題就是用勝率考慮每一手棋，成也勝率，敗也勝率，領先時不設法擴大優勢，落後時不設法輸到最少，人類棋手落後時會東挖一些西偷一點縮小差距，但狗判定勝率低於一定程度就會自暴自棄，另一個角度說，也許這個bug根本沒有修復，因為狗的自我對局中不會出現落後之後還繼續下的棋，而是投降。對於兩隻狗狗而言，結局早已算好了，所以它們不會掙扎，而人類棋手在官子則還有翻盤的機會。

無論如何，我覺得人機交叉下還是挺有趣的，看兩邊都在猜狗狗的思路，這盤棋對兩位職業棋手而言一定都有不同的啟發。

順風浪，逆風投，不給就送。

這個表面上娛樂化的對局在我看來預演了未來人類與人工智慧共生的圖景。未來人們會非常普遍的遇到和古力一樣的矛盾，看到人工智慧做出其無法理解匪夷所思的決策，即使你們最終目標一致，但因為它無法解釋它的用意是欲擒故縱還是大局為重，你還是沒法配合它。難道，人類未來的結局就只有盲從人工智慧，從智能層面淪為進化隆隆列車的棄子的份？

人的思路里，如果你算到你目前有5目優勢，而你的目的是贏，那麼你的判斷應該是爭取更大的優勢，這樣從勉強贏到未來局面之間的空間就更大[1]，就更能忍受失誤，贏的概率就越大。

在狗的思路里，如果你算到你目前有5目的優勢，而你的目的是贏，那麼狗的判斷則是，在當前局面上佔便宜的想法都會存在風險，而這個風險是全局性的，因此確保最高勝率的想法則是規避這些風險，贏的概率就越大。

事實上我一直認為狗的判斷才更偏向正解，master的快棋賽也證明了這一點。人很難正確處理【目數優勢】和【勝利概率】間的關係，而且通常會認為兩者【線性相關】，而顯然這並不是線性相關的，這就是對[1]的修正，而蒙特卡洛樹處理這個問題上就要直白的多。

更有趣的是，狗的想法是將對面判斷為運算力相同的純粹理性對象，因此才能得出勝率判斷，但事實上無論和人對弈，還是和狗自身對弈，都是有運算力上限的對象。人狗vs人狗的合作局，狗在自己的樹搜索里以對面為理性對象為前提下發現自己勝率永遠不過50%的時候，任何穩健的步驟(你可以認為狗和狗之間是在運算力上限下互相透明的)只會讓最終勝率無限逼近0%，那狗狗自然選擇【對方下一步選擇更多】的非正常落子，這樣在估值網路里才會反應出更高的勝率，因為特定棋局存在最優落子點，狗狗發現自己要輸了，可能是把估值網路翻過來了，然後挑了個最大的走

?|?x?`)

如果某點小說的天降系統文里，豬腳某天腦子裡突然出現了一個AlphaGo，這也許就是他下圍棋時的樣子。

黑狗在第一次認輸，即認為自己敗局已定的情況下出現了如同去年對李世乭第四局時一樣的在人類看來屬於「發瘋亂下」的損棋，古力還想搶救一下但黑狗繼續損，古力才認輸。好奇AlphaGo決定認輸及此後的表現是基於怎樣的判斷，AlphaGo對勝率評估的動態變化完全公布了的話也許可以從中解讀到一些信息。

最值得關注的有趣細節是AI要認輸古力不讓，AI就開始亂下。

未來戰爭使用AI指揮後，很可能也會出現AI判斷要投降（再打下去已經沒有意義，且會造成國家更大的損失），將軍拒絕（人類還看不出已經是必輸的局面），於是AI給將軍發把步槍把將軍打發到前線去了（最大限度減少戰爭損失）。

執政官模式圍棋版？

古力：我以前只知道有豬隊友，這次才發現原來還有狗隊友。

仍然希望看到每一次落子後， AlphaGo 對雙方勝率的估算。

在 AlphaGo 認輸後，古力或者一些人潛意識的認為還存在一些變化的時候，我覺得 AlphaGo 已經準確的計算到任何的變化趨勢，己方的勝率都已經是0了。

這就是戰勝 AlphaGo 的關鍵，就是對於整體趨勢的勝率計算的點，這個點究竟在哪裡會出現，一旦出現了， AlphaGo 的勝率在任何變化趨勢都保持增長或100%。而人類推演這個點的能力，似乎還沒有。

強烈呼籲DeepMind 公布出 AlphaGo 在每一次落子，雙方勝率的值。很想知道， AlphaGo 在多少子以後，就能算盡天命！！

狗：這個碳基，菜的摳腳

本答案節摘自我的專欄：人機大戰II 中 / 終場：頑皮的AlphaGo、天才棋士柯潔的淚目

昨天（5.26）上午的那場比賽，雙方陣營分別是：連笑配合AlphaGo VS 古力配合AlphaGo。最後，前者執白中盤戰勝後者組合。

總體而言，相比前兩把，柯潔與AlphaGo對戰時的「緊張與壓抑」。這場比賽，是全世界首次，人類圍棋高手，與AI棋手做搭檔，雙方互搏的情景。

從未有過「打將」體驗的古力與連笑，這次也體會到給人「打下手」的感覺。

來自人民網：

人機配對賽連笑逆轉獲勝古力搭檔AlphaGo或出昏招

這局棋從開始到中盤，執黑的古力+AlphaGo組合一直下得順風順水，空圍得又多又厚，一直保持著較大的優勢。
過程中，古力和連笑不時地表現出驚訝的神情，似乎在感嘆搭檔AlphaGo的圍棋思路之與眾不同。
從棋局內容中看，AlphaGo確實下出了許多手令人震驚的好棋，但百思不得其解的是，155手似乎古力的搭檔AlphaGo打了一個勺子。
通過之前的對局，我們可以看到，AlphaGo在優勢情況下經常會做出一些不必要的讓步，讓局勢簡化優勢減少。
而AlphaGo在劣勢情況下會如何表現，這點大家都非常好奇。
這盤棋白棋在劣勢情況下，連笑的搭檔AlphaGo下得非常激進兇猛，這點與連笑的思路一致。
在形勢不利後，連笑154手打入左側，試圖「搞事情」，令人驚訝的是，黑方的AlphaGo155手靠似乎出了勺子，致使左側局面形成打劫，在現場做講解的華以剛八段說，這時如果黑棋簡單尖一個，似乎沒有看出白棋可以怎麼做活。

棋局後期，連笑一方在右側繼續勇猛追擊、士氣高漲，最終掏掉了黑棋左右兩側的大空，將局勢成功逆轉。

對於古力一方而言，左側形成了「打劫」之勢，那基本意味著「大勢而去」。

最有趣的地方來了：

古力方面，「理性」的AlphaGo要求認輸，古力拒絕了本方AlphaGo的「無理要求」，後來古力方的 AlphaGo「大感絕望」，開始在對方的空里亂走棋，好像表示有一點「不爽」，最終古力也無奈認輸。

呵呵，我都替某些不嫌事兒大的「新聞工作者」，起好標題了：

人工智慧自我意識崛起！地球馬上就要被毀滅了！
求轉發，人工智慧竟然自己知道認輸了！

為什麼古力方的AlphaGo，會如此「任性」呢？

AlphaGo的每一步棋，都按照最保險係數高的（當前節點的勝率/領先對手子目）的決策進行，假設有兩種決策：

AlphaGo認為，在領先對手，10子目的前提下，勝率為10%；
AlphaGo認為，在領先對手，1子目的前提下，勝率為90%。

由於依據演算法的「絕對理性」傍身，AlphaGo自然會選擇第二種走法，這就是機器所認為的「最優策略」

所以，戲劇性的一幕出現了：

當古力一方的AlphaGo，認為勝利無望後，在主動宣布「投降」，又強行被古力按著繼續走棋後。

因為賴以判斷「保險率」的規則失效，其走步路數越來越混亂，每一步都在降低「勝率」，逼古力認輸。

與其認為這是AI的「反抗」，還不如認為，這是DeepMind團隊，提早預料到了，AlphaGo可能出現的這種情況，而人為預設的一種「自爆」策略，避免AlphaGo進入到類似「邏輯陷阱」的死循環里。

我們還暫時不用擔心，AI是否可能統治地球，AlphaGo仍然是「弱人工智慧」的一種。

它所展現的「任性」和「小聰明」，只不過是人類工程師制定的演算法、策略；以及兩台AlphaGo之間，長期對戰，得出的，屬於一個AI的「圍棋之道」。

另外一點有意思的是，由於雙方人類棋手，與AlphaGo的實力差距過大，僅憑雙方AlphaGo的實力，就可以勢均力敵地左右互搏。人類棋手，反而進入了「陪襯」角色。

到了後期，連笑與本陣AlphaGo的配合，越來越心有靈犀，這種天衣無縫的合作，引發現場不少圍棋評論家們的驚嘆。

這場特別的「人機大戰」，讓我們大開眼界。倚天劍，最終只有最強者，握在手裡，才能發揮出它的最大價值，有人類對棋局分支做宏觀的判斷，配合AlphaGo強大精確的計算和概率判斷能力，這樣的一對組合，才真可謂是「天下無雙」。

我們創造了機器，機器又在幫助我們，跳出對圍棋的固有認知，發現我們以前從所未知的領域，這個世界，沒有什麼比這樣的探索，更激動人心了。

AI介入下的，後人類智力遊戲時代，連笑是第一位「戰勝」AI的人類，從今往後，配合AI的強大輔助，人類在自己創造的智力遊戲領域，一定可以續寫更多的傳奇篇章！

據說下到中盤的時候，黑狗計算勝率已經到了75%

然後古力下了一步，勝率爆跌到60%左右

然後古力又下了一步，黑狗投了

但是古力拒絕投降，然後黑狗開始亂下

場面一度十分尷尬

黑狗：寶寶有小情緒了

古力：我真是日了狗了

古力發現自己是豬隊友，決定改名為：朱古力。

（騰訊新聞評論裡面看到的。）

狗：誒…走，走，對，這裡碰一手，這就很舒服…誒你怎麼…？？

古力：你tm在幹嘛。

狗：點了點了，沒法玩。

古力：點你妹。你怎麼不好好下呢？？

狗：…那我送。