第四局的AlphaGo發生了什麼？

02-16

從頭到尾全程看了四局，這局實在揪心，當看到AlphaGo竟然孤立在對手虎口來了一手和右邊絕境兩首無謂長，實在震驚，就像在中國象棋里看見對手走了步馬飛田結合前三局，並且作為軟體工程師實在無法想出任何一個合理的解釋：在什麼情況下AlphaGo會有如此的動作？

用比較粗淺的話來說是這樣的：

首先，這個棋表面上看差距沒有這麼大，但是AlphaGo當時已經算清楚了，覺得自己勝率很低，可能是低到對手不失誤就贏不了的局面了

然後，它要尋找讓他最大概率提高勝率的點。

點A，對手1%應對失誤，能讓我勝率從0.2提高到0.9，那就是0.007的提升

點B，對手2%應對失誤，能讓我勝率從0.2提高到0.5，那就是0.006的提升

點C，對手5%應對失誤，能讓我勝率從0.2提高到0.3，那就是0.005的提升

右邊的長就是A，左下的挖就是B，你覺得的正招就是C。

還好李世石後面的所有應對都沒有錯誤把棋贏了，否則回頭棋手們又要去研究這些對人來說根本不存在的棋了……

引用：AlphaGo 對李世石「放水」？棋手說不可能！

第四局下出78的妙手（被古力稱為神之一手）後，局部已經出棋了：

AlphaGo 前半盤大優，不是防水的態度。至於AlphaGo 第97步的表現可以用「瘋狗病發作」來形容。78-97步，機器應該有足夠的（時間來）緩衝調整計算出局面走勢。97確實是很「丟狗」的一步，說明演算法還是有極大的問題，抗擊打能力不足，崩潰的太脆了」。

那麼，AlphaGo 為何會出現如此明顯的異常表現？

根據Alphago原論文第一作者之一的Demis Hassabis 在賽後的總結，

「李世石下出白78後，AlphaGo自我感覺良好，在程序的「值網路」(用於評估電腦勝率)中，誤以為勝率達到70%，直到第87步才反應過來。」

換句話說，78手已經超出了Alpha狗的計算。是它的盲點，棋局再進行了十手棋，它才算「意識」到形勢不對。

棋局再進行下去應為勝率太低，阿狗就開始下一些無厘頭的棋了，大概是它認為如果對方不應的話就會提升勝率吧。

Its a win of humanity