李世石連續輸給 AlphaGo，其中自己的失誤佔了多大比例？

01-11

這兩場比賽里李世石本身的表現如何？是在自己已經表現的很完美的情況下被打敗，還是出現了明顯的失誤？
----
本題已收錄至知乎圓桌 ? 對弈人工智慧，更多關於李世石對戰人工智慧的解讀歡迎關注討論。

作為一名科班出身資深棋渣~看了詩詩全部兩盤對局~從最開始比賽之前到現在經歷了以下幾種坑比心理活動:

不以為意

alphago贏了歐洲冠軍樊老師？水平不錯但是以往的圍棋軟體水平不就是業5業6嘛？沒事，有提高也沒事，有提高正常，人家程序員哥哥嘔心瀝血還不讓人提高了？樊老師水平不算太高，充其量弱職業，距離頂尖棋手至少兩三個子的差距，圍棋界還很安全，超一流還能戰個把年。

信心滿滿

要來挑戰李世石？詩詩是什麼水平的棋手？頂尖高手好嗎？下那個棋就我看來簡直驚為天人！不管是計算還是經驗還是棋感，不管是布局還是對殺還是官子，都是top5，雖然不在個人巔峰，但是也是超強。這麼高水平的~這次幹掉阿狗不成問題！信心滿滿

謹慎評估

看了一些評論，名家解析以後，感覺阿狗還是有很多架構上的進步的~以審慎的態度判斷李九段和阿狗應該是有不大的差距，至少是個李授先~李九段有不少優勢~五番棋肯定能贏！但是阿狗也得有個職業五六的水平~很強~而且半年一年後就得超過了。

第一盤獃獃噠

李九段發揮不太好，有些地方沒處理好，對戰機器人比較慌，沒有經驗，阿狗就是亂拳打死老和尚，確實也證明了阿狗能和九段一戰，但是好多緩手，無理手沒被反擊~李九段疏忽了，沒事調整調整定能扳回一局！四連勝大逆轉不錯呦~

第一盤晚上

看了知乎的各種分析好久~發現可能稍微有點樂觀了~但是他們不懂棋~阿狗那麼臭~明天看詩詩整他！

第二盤徹底驚醒

第二盤可以說發揮了至少詩詩八九成以上實力~現場也是看得出來詩詩十分謹慎也十分專註~在前期小優的情況下被慢慢走成阿狗大優~在場的俞老師和古力老師全都沒發現詩詩什麼特別大的失誤~有些地方處理的還很不錯~很穩健~而阿狗還放出幾手緩著~在這種情況下仍然盤面黑領先十目以上！我感到深深地絕望。而阿狗似乎還有提升空間，柯神即使強李世石一個子，在阿狗預留出來的棋力面前似乎也是遠遠不夠用。

第二盤晚上

思考人生，思考未來，思考人工智慧，思考科技，思考個人職業規劃。對我們這些下圍棋的，教圍棋的，甚至靠自己的技術，勞力，知識吃飯的人，我感覺都是一次巨大的警醒。和同學通電話互相探討~越發感覺阿狗深不見底深不可測。而人工智慧的發展將會漸漸取代人們~從勞動導向型工作到技術到知識甚至最後到文學藝術美術領域。不寒而慄。

這兩盤棋，李世石所犯的錯誤不多，看起來也不致命，甚至可能走的本手還不壞只不過不是最優解而已~而阿爾法狗在每一步李世石沒下出最優解的時候實際上都增加了阿爾法狗的勝率。換句話說，只要李不是每一步都是客觀上的最優解，那麼勝利總是慢慢一點一點傾斜到阿爾法狗那一邊的。而即使是所有棋手組成聯盟對戰阿狗，也難以確保每一步都是最優！這太可怕太令人絕望了。

李世石承受著常人難以想像的痛苦。換做我，第一盤尚可以稱作偶然安慰自己，而第二盤則是對自己圍棋生涯，對全人類圍棋事業的一次否定。有些人窮盡一生探索黑白世界，卻不如兩歲的電腦，這對所有的圍棋人都是一個打擊。

不管怎樣~希望李世石哪怕扳回一局，證明我們人腦尚可以與之抗衡，哪怕我等雖然淪陷但也還沒有完全潰敗~我們每個人都還能追求心中的神之一手。

其實我想說：哪怕再拖半個月呢，給我們個心理準備阿！

突然襲擊我們一波推沒意思阿！

阿狗你得留一波別直接推基地，浪一浪！

懂么你？

哼╭(╯^╰)╮不解風情！(～￣(OO)￣)ブ笨

表情打不上去~其實我真實的心理活動如圖所示恭喜詩詩扳回一局！看到新聞也是眼眶濕潤~李九段的抗壓力爆發力高超的水準也是讓我很感動！

業餘5段作答。

AlphaGo在今天這一局中下出了不少好棋，李世石較之前幾局也更有經驗。然而實力的差距是很顯著的，即使整盤棋雙方盤面都十分接近，也做了數次轉換，但AlphaGo在這種殘局中顯然更勝一籌，確保了自己的勝利。

我個人覺得1:4是一個相對真實而且較為合適的比分。李世石在第四局中78手妙招導致了AlphaGo的bug下出一系列損棋才因此贏得一局，否則結果依舊難說。

五盤棋看下來，AlphaGo已經擁有超強的實力，第一局在李世石相對隨意得情況下夢夠準確抓住漏洞，第二句第三局可以看出無論對手是保守還是強攻，它都能從容應對，第五局則體現了它殘局中的處理能力和轉換的判斷。我個人感覺它甚至有能力讓大部分職業九段兩子。它在小範圍的計算與大小場的判斷都十分準確，可以說讓圍棋界的我們有了新的認識。

記得看過這麼一段話

曾經有一個口出狂言的韓國少年，連克強手從未被擊倒。每次比賽我們都會支持他的對手，我們學棋，都希望有一天能夠有人戰勝他，將他擊敗。

然而當這一天真的來到，他被徹底戰勝的體無完膚的時候，我們卻又高興不起來。

從一開始就不應該告訴他是和機器人下。

反對當前得票最高的答案

不懂圍棋但是看過google發在nature上的那篇論文

只想說一句因為alphago一直判斷自己佔優而說alpha全程沒有失誤只是人類不能夠理解他的高明之處這點是完全不成立的

3/13/2016 更新

今天的第四局似乎alphago陷入了劣勢，google deepmind ceo發布了兩條tweet，內容分別是

Lee Sedol is playing brilliantly! #AlphaGo thought it was doing well, but got confused on move 87. We are in trouble now...

李世石下的非常棒，alphago認為自己下的不錯，但是在87步時產生了困惑，看來我們麻煩了。

Mistake was on move 79, but #AlphaGo only came to that realisation on around move 87

錯誤的是79這一步，但是alphago直到87步才認識到這點

個人猜測，在87步時，alphago的演算法沒有找到一個勝率高於50%的下子點。而錯誤在79這步的結論，不知道是圍棋專家給出的，還是alphago內部演算法用87步的局面倒退發現79步時第一次出現了劣勢。但是這已經可以說明，alphago對局勢的判斷，並不是一直正確的，以及alphago確實會有失誤。

剛剛Demis又更新了twitter，內容如下：

When I say "thought" and "realisation" I just mean the output of #AlphaGo value net. It was around 70% at move 79 and then dived on move 87

翻譯一下，我提到的「認為」值的是alphago的value network輸出值，在第79步時輸出值為70%，但是到了87步時開始下降。

（好了，這和我最開始回答此問題時的說法就是相同的：alphago對局勢的判斷來自於value network)

=====================================================================

看到評論，有很多人似乎誤解了我的觀點，這裡解釋一下

這張圖來自於google在nature上的論文Mastering the game of go with deep neural networks and monte-carlo tree search。展示的是在當前局面下alphago是如何選擇下一步落子於何處的。可以看到，圖中的很多位置都標註了數字，下面解釋一下這些數字。圖a中的數字是alphago內部的value network算出的，單憑當前的局面，如果落子在此處的勝率，而value network的training和testing accuracy分別是22.6%和23.4%。圖b仍然是基於value network，但是考慮了未來的落子位置，是多次搜索後的平均值結果。圖c同樣考慮了未來的落子位置，但是用了一種較為簡單的快速策略模擬整盤棋局至結束，而這種快速策略的正確率是24.2%。圖d則是採用了alphago內部的policy network，而policy network的正確率是55.7%。

無論google所指出的alphago所判斷的自己佔優是基於任何一張圖中的數字，其準確率都不是很高。因此這個所謂的佔優，只是演算法計算出來的一個準確率不高的數值，並不能用來說明

alphago的水平已遠超過人類的水平，在某些人眼中的alphago的幾處所謂的「失誤」，恰恰是人類處於弱勢的證明。alphago的某些下法已超出了人類的理解水平，但事實證明了它是更出色的。

===================以上為更新內容，原回答如下====================

因為alphago下一步棋要怎麼走原本就基於他的value network 如果這個佔優的說法也同樣是基於value network 那他自然一直覺得自己是佔優的而這個value network是否真的很好的抓住了圍棋的精髓他對什麼要的局面可以帶來最後的勝率的這一判斷是否準確這個答案顯然不是100%的肯定

另外關於之前其他答主關於打劫的說法想說一點 alphago在做reinforcement learning時回報(reward)只有一種就是這盤棋最後是否取勝勝多少目對於他來說得到的回報都是一樣的所以在打劫的問題上是沒有專門演算法進行特殊區分的

（3/11/2016 10：11：00更新：這裡說他一直覺得自己佔優確實不妥因為也許確實會出現局面導致alphago認為無論下子在何處獲勝機率都小於50% 但我這裡想要表達的是 alphago下子所採用的策略和他用來判斷自己是否佔優的演算法本身就是相同/相近似的因此並不能用一方來證明另外一方）

人跑的過汽車、火車嗎？這問題現在看起來白痴，可在問題發生時，卻是大問題；

去看蒸汽機的歷史，最開始的時候，利用效率並不高，如果用「水燒開，可以把壺蓋抬起來」這個道理去給當時的人解釋，他們覺得這就是奇技淫巧，不足掛齒；事實也正如此，蒸汽機發明開始，好像只是用在挖礦領域，一些簡單的機械工作；即便到用在車輛、運輸上，都發生過人們用馬車和他比賽、打賭的事情，因為蒸汽機沒有改良之前，用在火車上，時速好像不超過10英里（沒記錯的話），反正就是很low了。

而今天，用人和車比賽就是搞笑了，但是這並不影響百米飛人大戰，以及F1。

這僅僅是開始。

個人覺得沒有必要神話阿爾法。

早期的幾手，由於棋盤上的空格很多，落子的不確定性也很高，出乎意料的棋路也許正是這種不確定性的結果。

比較有參考價值的，應該是阿爾法中後期的處理方式。

第一局中李世石的失誤是比較多的，開局非常規的過分手段屬於戰略失誤，但姑且當作是一種試探吧。在後半盤的勝負關鍵處，李世石也出現了致命的判斷錯誤，否則肯定是有望取勝的，畢竟當時局面變化餘地已經不大，一旦取得優勢，並不容易被葬送。所以第一局之後，儘管AlphaGo展現出的實力令人震驚，我還是認為勝負應是五五之數。

然而今天這一局，我覺得除了70手打拔黑一子是明顯的緩著，全盤李世石几乎沒有走出什麼不合情理的著法，下得堂堂正正，卻反倒輸得更加無話可說，幾乎沒有明顯機會。要知道，在人類世界，即便是狀態不佳的小李，也不是一個可以輕易戰勝的對手。不得不承認，這場對決極有可能會向一邊倒的方向發展了，而圍棋界基本不會有人想到無還手之力的一方會是李世石。

如果只從棋上來說，我對AlphaGo的感覺，就是對於局面的把控能力極為強大，即使今天這一局在左下角走出了明顯虧損的變化，也能把局部的損失自然地稀釋、消弭於全局之中。而當進入後半盤棋盤逐漸變小時，AlphaGo安全運轉，將優勢轉化為勝勢的能力，棋壇可以說無人能夠匹敵。當你面對這樣一個控制力有如巴薩而又冰冷無情的對手時，你的任何一個當時覺察不到的錯誤，都可能成為壓死自己的最後一根稻草。更或許，我們今天所認為的李世石」堂堂正正，沒什麼問題「的著法，在計算機的眼中，可能都是錯誤。

下到這個份上，技術層面的討論都已經不重要了。人機大戰，機器就是贏了，贏的很徹底。

業餘5段奕城9段~

先回答題主問題：並不大，起碼第二盤不大。但這個不大是基於我們人類棋手的棋感得出的結論。失誤是基於時間，注意力和自我對棋優劣的感覺做出的錯誤判斷三者綜合產生的的。可以說，李世石在這方面是現役棋手中的佼佼者。

不過，阿法狗也有錯誤的，有錯誤的，有錯誤的！重要的事情說三遍！！並非不可戰勝！！

我看到很多人用Google給出的數據來證明阿法狗「感覺」自己一直處於優勢，而得出阿法狗是完美的的錯誤結論。

從設計原理方面：阿法狗是以贏為目的而設定的，即以哪個選點為當前最大幾率勝利。並非是哪個選點最優。並且在有限時間內，他的運算規律是遵照比較最優解而非絕對最優解進行的。

從棋理方面：阿法狗開局不穩定，有明顯的漏洞。就算圍棋開局是一個開闊的思路，實戰也絕對有比阿法狗某步棋更好的選擇。另外有些步數是只要懂棋的人就看得出，是差了目數的絕對失誤。而並非是大眾所認知的阿法狗沒有輸棋，所以沒有失誤。但這些失誤是建立在阿法狗邏輯中他感覺已經取得優勢的前提下。

但阿法狗也有他獨有的優勢，後半盤發力強勁！在運算可能飛速減少的過程中，快速選擇出最優解且沒有讀秒和人類的負面情感影響。

至於如何戰勝阿法狗，估計就要學習國際象棋的方法了。即電腦作為輔助參考，提供數據幫助人類選擇。

不過最後我想說的是，圍棋是一種能體現棋手風骨的競技博弈，電腦還是安生些才好。

這兩天一直在關注這次比賽，說下自己的看法：

反對有些人說的alphago的幾處明顯的失誤。Google團隊提供的勝率數據表明整個對弈過程中從始至終alphago都在領先。alphago下出了幾處讓大師都感覺不符合棋理的下法，也就是某些人眼中的alphago的幾處所謂的「失誤」，恰恰是人類思維的盲區。alphago的某些下法已超出了人類的理解水平，但事實證明了它是更出色的。

回到題目上來，就第一局而言，不可否認的是，李世石確實有失誤，但我認為這並不是他失敗的主要原因。

對於開局的變化，是李世石主動採取的變化，他肯定清楚自己這個變化所產生的後果，在他看來，這個變化完全在他的控制之中，或者在他看來這根本就不是一個失誤。對於中後盤的失誤，由於圍棋有著無數種變化，如果他變化了下法，結果我們就不得而知了，但是，我們仍可以根據現有的資料進行科學的推測：目前alphago還只是計算勝負，並不計算勝多少目，我們完全有理由相信，alphago表現出的水平是隨著對手的水平而有所變化的，也就是說，對於一個低水平棋手，alphago的表現也就一般，因為alphago只追求勝，而對於一個高水平棋手，則會激發出alphago更出色的表現，因此，我們完全有理由認為李世石的失誤並不是他失敗的主因！

人工智慧就像一列火車,它臨近時你聽到了轟隆隆的聲音,你在不斷期待著它的到來。它終於到了,一閃而過,隨後便遠遠地把你拋在身後

Alphago的目的不在於「贏多少」，而在於」贏「，所以只需展示出比對手&>=1目的實力求穩即可。

所以如果對手失誤，它就可能會「失誤」，對手不失誤，它就不會失誤。

現在返回來看和樊麾的對弈，可能就是在此目的驅使下的結果，才會表現出只比樊麾「高一些」的實力。

所以以後只要沒人贏過Alphago就無法對其棋力上限進行考量。

唉，只說這一盤，個人認為失誤所佔比例不大！這局棋稱得上失誤的地方個人認為並不多，開局階段

這步棋後白棋的選擇有待商榷，再有就是打到後邊右上角的交換吃虧一些。但個人認為這些都不是決定性的因素，實力也許確實有差距。開局30步內黑棋有3個很出乎意料的走法也許證明了alphago的水平確實高於我們，我們甚至無法理解它的目地，但它卻就是能用勝利證明自己的正確。

個人覺得，單個棋手和阿爾法狗作戰有失公平，阿爾法後面是龐大的網路雲計算，而李世石是一個人，有點類似於以一己之力對抗全世界，應該試試人類頂尖棋手組團對戰阿爾法狗，而且人類一樣可以利用計算機做輔助計算。

小李是位情商極高的人，對局中你的任何一個肢體動作或者表情都會被他捕捉，然而阿法狗確冷酷的執行程序，這讓小李茫然，

電腦圍棋演算法已經發展到碾壓人類圍棋頂尖高手的地步！

於被我發現阿法狗的秘密了！怕被滅口，冒死公布！這根本不是一個下圍棋的軟體！它是一款可以和冥界交流的軟體，在冥界客戶端的那邊坐著黃龍士、秀策和吳清源～看到坐在李世石對面的人了嗎？那根本不是程序猿，他是個職業巫師，俗稱問米婆者是也～

實際上李世石這幾局已經下的相當不錯了，第二局開始，在沒有明顯的大失誤情況下被狗完虐，今天的第三輪對局，狗更是展現了碾壓人類圍棋理論體系的手段。至於之前最著名的陰謀論--狗不會打劫！今天狗就狠狠的用劫粉碎了李世石的最後一勃，讓人類選手留下了羞恥的呻吟～

平心而論狗對圍棋展現出態度和人類不一樣，至今為止的三局讓我覺得苟像天龍八部里的掃地老僧，從棋風上看來，狗行棋皆是順勢而為借力打力，綿里藏針，防守之嚴密幾乎沒有破綻可言，靠深厚內力碾壓對手，積小勝為大勝以空間換時間，一般行棋到中後盤對手就會陷入狗觸手的汪洋大海之中。

所以今天看來，李世石的失敗非兵不利戰不善，乃是敵人有高達之故也，面對身穿重甲，歐不，是身穿城堡的阿法狗，李世石就是有方天畫戟也要趟了～

作為一個只是入門水準的人，在看棋過程全程都很辛苦，以至於看完四點半了疲倦得都得去睡一覺。。。第二局李世石布局階段下的感覺並沒有緩手，全局幾乎沒有失誤，當然也有可能有，只是我水平看不出。但是最後收官階段卻莫名其妙慢慢被拉開了。只能說阿爾法狗確實水平在其之上了。感覺棋風來說李世石不是最適合和阿爾法狗下的，李世石的布局並不是他最強的地方。不過這也並不影響太多，人工智慧確實是超越人類了。。。

感覺就像當初sai對塔矢行洋那局網路比賽一樣。

不知道按套路出牌算不算一種失誤。。。可能AlphaGo就是贏在那幾手我們覺得怎麼可能下在這的棋，讓李世石沒有想到

個人認為，李世石的失誤，占的比重並不大，兩成吧。畢竟人在面對讀秒的時候，做出的反應肯定會有影響。

今天的比賽，看到最後收官的時候，李世石自己數完目，就投子認輸了，臉色很不好，兩眼無光，個人感覺他有點絕望了（當然也因為下了那麼久的棋）。並且在發布會的時候他說，希望自己在這個系列賽中能夠拿下一場勝利。

感覺整體上李世石並沒有出現很嚴重的失誤，但是任何一個細小的失誤，都不會逃過AlphaGo的眼睛，特別是中盤之後。當中盤之後，如果你落後5目以上，個人感覺翻盤的希望真的很渺茫了。古力說，李昌鎬中盤之後的實力是十二段的話，那AlphaGo中盤之後的實力是十五段。

不是說，李世石這兩場沒有失誤，但是，面對AlphaGo的時候，中盤之後你不能有一丁點的失誤。

又或者說，你在中盤之前要擁有明顯的優勢，然後在中盤及收官的時候，給AlphaGo消耗一下，你還能贏。

最後說一下對打劫的看法。

感覺有些人把打劫神話了，認為因為沒有打劫所以李世石才會輸，不然還有翻盤的機會。但是個人並不認同這種觀點。AlphaGo的運行就是最優解，如果這個劫的價值大，那他就有可能會打。為什麼我說有可能，如果你落後AlphaGo十五目，而這個劫才值五目，那麼AlphaGo有可能就會放棄它，轉而讓局面更加明朗，利於自己分析。

Google團隊已經說了，內部數據顯示AlphaGo從開始一直到結束都是遙遙領先的。

AlphaGo的可怕之處不在於贏了人類最頂級的圍棋手，而在於它知道自己遙遙領先但是在盤面上還是讓人類以為它是可以被打敗的。

從貼吧轉的，不知道原作者是誰。侵刪。

看了人機大戰直播，從李世石的路數來看，明顯很混亂，與我差的不是一點。從29手開始，就已經決定棒子不行了，而不是柯潔說的46手。大家可以仔細看看，29手、85手，隨便哪一手下面再下一手黑子，就已經連成五個了，他媽的卻偏偏不下，非要嘚瑟，結果掛了吧，活該！

所以大局觀和意識都是什麼呢？會不會有一天我們技術足夠了發現我們大腦其實就是個「程序」？而所謂的意識只是冗餘計算的產物？而腦洞就是bug。

圖忘了來源了，侵刪