第四局的AlphaGo發生了什麼?
從頭到尾全程看了四局,這局實在揪心,當看到AlphaGo竟然孤立在對手虎口來了一手和右邊絕境兩首無謂長,實在震驚,就像在中國象棋里看見對手走了步 馬飛田 結合前三局,並且作為軟體工程師 實在無法想出任何一個合理的解釋:在什麼情況下AlphaGo會有如此的動作?
用比較粗淺的話來說是這樣的:
首先,這個棋表面上看差距沒有這麼大,但是AlphaGo當時已經算清楚了,覺得自己勝率很低,可能是低到對手不失誤就贏不了的局面了然後,它要尋找讓他最大概率提高勝率的點。
點A,對手1%應對失誤,能讓我勝率從0.2提高到0.9,那就是0.007的提升點B,對手2%應對失誤,能讓我勝率從0.2提高到0.5,那就是0.006的提升點C,對手5%應對失誤,能讓我勝率從0.2提高到0.3,那就是0.005的提升右邊的長就是A,左下的挖就是B,你覺得的正招就是C。
還好李世石後面的所有應對都沒有錯誤把棋贏了,否則回頭棋手們又要去研究這些對人來說根本不存在的棋了……引用:AlphaGo 對李世石「放水」?棋手說不可能!第四局下出78的妙手(被古力稱為神之一手)後,局部已經出棋了:
AlphaGo 前半盤大優,不是防水的態度。至於AlphaGo 第97步的表現可以用「瘋狗病發作」來形容。78-97步,機器應該有足夠的(時間來)緩衝調整計算出局面走勢。97確實是很「丟狗」的一步,說明演算法還是有極大的問題,抗擊打能力不足,崩潰的太脆了」。
那麼,AlphaGo 為何會出現如此明顯的異常表現?
根據Alphago原論文第一作者之一的Demis Hassabis 在賽後的總結,
「李世石下出白78後,AlphaGo自我感覺良好,在程序的「值網路」(用於評估電腦勝率)中,誤以為勝率達到70%,直到第87步才反應過來。」
換句話說,78手已經超出了Alpha狗的計算。是它的盲點,棋局再進行了十手棋,它才算「意識」到形勢不對。
棋局再進行下去應為勝率太低,阿狗就開始下一些無厘頭的棋了,大概是它認為如果對方不應的話就會提升勝率吧。
Its a win of humanity
推薦閱讀:
※28 天自制你的 AlphaGo (1) : 圍棋 AI 基礎
※如何打造一個AI遊戲玩家?(AI遊戲代碼資源庫—隨時更新)
※再次對決AlphaGo,柯潔的勝算有多大? | 陳經
※《深度卷積網路:從AlphaGo到GAN》連載:1.3.6~1.4.5
※AlphaGo 用了哪些深度學習的模型? 模型的輸入是什麼?
TAG:AlphaGo |