現場報道 | AlphaGo被授職業九段,DeepMind將公開其所有版本細節

機器之心原創

記者:杜夏德

5 月 27 日,經過 3 小時 38 分鐘的鏖戰,209 手,柯潔盤中投子再負 AlphaGo,至此中國烏鎮圍棋峰會圓滿告落。賽後,中國圍棋協會為授予AlphaGo職業九段稱號。

AlphaGo 被中國圍棋協會授予職業九段

柯潔完成可自己與 AlphaGo 的最後一戰,而AlphaGo 也將推出圍棋競技賽場,被打造成圍棋學習工具。

最後的戰役:寧為「玉碎」

上午 10:30,比賽開始,柯潔如願執白,DeepMind 黃士傑博士代替 AlphaGo 執黑。開局黑子還是在第一手下在了右下角,走了星小目。已丟兩局的柯潔依然在努力思考每一步棋。職業棋手胡耀宇八段認為,柯潔這盤棋的策略非常明確,就是不拘泥於局部糾纏,放眼全盤大格局,四處挑起戰鬥。但是柯潔在 28 手點三三,追究黑棋,被黑棋簡單處理後無應手。實戰選擇脫先,AlphaGo 判斷清楚,靈活轉身,取得相當優勢。白棋 40 手飛點,被黑棋點角再度虧損。接下來中央白 90 有疑問,置下方大塊不顧,造成兩邊無法兼顧。AlphaGo 掛到 99 手時,已是大勢已去。柯潔雖然奮力搏殺,但始終無法逆轉,最後階段選擇「玉碎」,在 209 手中大龍被吃,投子認負。

縱觀柯潔與 AlphaGo 的三局比賽,第一場,柯潔雖然只輸 1/4 子,但是從整盤來看,沒有贏的機會。但是第二盤雖然盤中認負,但在很多地方都看到了贏的機會,複雜的棋局能給柯潔帶來奇蹟。Hassabis 稱這是是人機大戰以來最勢均力敵的一局,柯潔在 AlphaGo 的實時評估中多次出現完美的評分。

相較於前兩場的平淡和精彩,柯潔對第三場的表現充滿了深深自責。「我很遺憾自己沒有下的好一點,不值得大家對我的讚美。」自責的同時,柯潔發自內心地大讚 AlphaGo,稱其是一個「可怕、冷靜、完美的棋手」。最後階段的 AlphaGo 讓柯潔感到前所未有的無奈。

「後面我想到的擔心的棋,它一定會下,我想不到的地方,經過一番思考之後,我才知道這是好棋。我和它的差距太大了,以後也會越來越大。我對自己很遺憾,但是也為 AlphaGo 驕傲。」

峰會亮點

AlphaGo將推出競技舞台,成為圍棋學習工具,DeepMind陸續公開50局自我對弈棋局。

最後一場比賽結束後,DeepMind 正式宣布 AlphaGo 退出圍棋競技賽,將把 AlphaGo 打造成為學習圍棋的工具。

該工具可以展示 AlphaGo 對圍棋落子位置的分析,幫助大家更好地了解這個程序是如何思考的,最終讓職業棋手以及愛好者可以從 AlphaGo 的視角來重新審視圍棋。尤其讓我們感到榮幸的是,柯潔同意成為我們的第一個合作者,和我們一起來分析他與 AlphaGo 的對局。我們很興奮能聽到他的精彩分析,同時也有機會分享 AlphaGo 的自我分析。

從現在開始,AlphaGo 的研發團隊將把精力投入到其它重大挑戰中,研發出高級通用演算法,為科學家們解決最複雜的問題提供幫助,包括找到新的疾病治療方法、顯著降低能源消耗、發明革命性的新材料等。如果人工智慧能夠在上述領域發現新的知識和策略,那在這些領域的突破將十分可觀。我們已經迫不及待地想看到這一切的發生。

另外 DeepMind 宣布將會與柯潔合作,分析本次棋局,並將分析過程和結果做成視頻分享所有圍棋愛好者。DeepMind 官方發言人稱,「AlphaGo 的自我對弈是其最寶貴的財富,我們將會公布 50 局自我對弈。目前 DeepMind 官網上已經能下載 10 盤自我對弈棋局,以後每天都會更新」

事實上 DeepMind 已經比賽期間與棋手們分享了 AlphaGo 的三盤自我對對弈。團體賽棋手時越九段觀棋時稱彷彿對戰雙方彷彿來自遙遠的未來。

DeepMind下半年將公布AlphaGo所有版本的技術細節

賽後,DeepMind 宣布下半年會發布論文公開所版本的 AlphaGo 的技術細節和架構,包括本次比賽中最新的技術,讓開發者可以打造自己的 AlphaGo。目前已經很多開發者使用初版的 AlphaGo 在打造自己的 AI。AlphaGo 的未來是通用人工智慧,Hassabis 相信,「這些通用演算法能處理各個方面的問題。」

在 DeepMind 官方公開的資料中,David Silver 聲稱,「我們始終堅信 A.I. 擁有幫助全社會探索新知識的潛能,並讓我們從中受益。而 AlphaGo 則讓我們真切的感受到了這一點。對於圍棋選手來說,AlphaGo 更像是獲得靈感的工具,而不僅僅只是對手。通過 AlphaGo 的啟發,棋手們能夠在這項具有 3000 年歷史的遊戲中,嘗試全新的思路與策略。」

Master已升級,無需從人機對戰中找弱點,但訓練未脫離人類棋譜

AlphaGo 研發負責人 David Sliver 稱,今天的 AlphaGo 比年初時的 Master 又有了改進。去年與李世乭的第四局第 67 手棋中出現的弱點,現在已經不會再有了。新版本的 AlphaGo 已經無需人類提點就能發現自己的缺點並補足,但我們仍然沒有讓 AlphaGo 完全脫離人類棋譜。

AlphaGo 也有「情緒」

在人機配對賽中,收官階段,古力一方的 AlphaGo 量出「resign(認輸)」的牌子,遭到了古力的拒絕(AlphaGo 認輸,人類有權拒絕,但如果人類選手認輸,AlphaGo 則不能拒絕),之後 AlphaGo 的落子開始消極,「逼迫」古力認輸。從這一點上看,人機配對賽中,AlphaGo 掌握全局。獲勝方連笑在接受採訪時稱開局與 AlphaGo 配合有點困難,把隊友帶入了一條不歸路,後面 AlphaGo 的表現逐漸穩健,感覺很像人類。

第一局收官最後,AlphaGo 是否有所保守

第一局,柯潔看似以 1/4 子微弱之差惜敗。但事實上,AlphaGo 在收官階段有所退讓,Hassabis 在賽後發布會上解釋道,第一盤最後,AlphaGo 在讓自己獲勝的概率最大化,這意味著有時候它會放棄一些點,這就是 AlphaGo 的策略:只為了贏得勝利,這是它的最主要的目的。

第二局是人機大戰史上最勢均力敵的一局,前半場看,雙方都有贏的幾率

在柯潔與 AlphaGo 的第二局比賽中,Hassabis 發 Twitter 稱柯潔表現完美、難以置信。

在賽後的新聞發布會上,樊麾透露了 Hassabis 這句話的內因:在黑白兩方在右上角纏鬥的時候,柯潔和 AlphaGo 的下法和 AlphaGo 系統中預測的行棋步驟完全一樣,這是機器認定的最優解。Hassabis 本人表示,「我們一直在後台關注整個比賽的情況,我們看到柯潔的表現非常完美,前 100 步是目前為止和 AlphaGo 與人類棋手之間最勢均力敵的比賽。前 100 手兩人差距非常小,我認為雙方在前半部分都有機會。」

柯潔自評也是有遺憾,但非常滿意。「我在賽中出現捂胸口的動作,是我覺得這棋有機會,在這一盤如果有人懂棋的話,因該會看到有一個劫,它不補是因為我認為它輸不起這個劫,在中途我一度認為我距離勝利很接近了,但是因為太緊張的緣故,我下了不好的棋,我的心一直在跳,這或許是人類的缺陷吧。」

「我發揮得很好,對於布局我非常滿意。但是中期在激烈的戰鬥時,很遺憾沒有發揮好。我今天下的很熱血沸騰,但還是緊張了。」

點擊閱讀原文,查看機器之心 GMIS 2017 大會官網↓↓


推薦閱讀:

十二生肖各版本
20多年來,各版本的《白鹿原》
伏羲!人類始祖的世界版本!!5
破軍在辰戌宮坐命(令東來編寫,新版本)
0397 13 P0001 大方等大集經(60卷)【隋 僧就合】「寶庫」錄校版本貳

TAG:職業 | 細節 | AlphaGo | 版本 | 報道 | 現場 | 公開 |