AlphaGo又搞大新聞,嚇得柯潔要重新學下圍棋....

先強調,本文標題絕無虛言,別玻璃心,不信去問問柯潔...

事情是醬紫的,昨天,Google 旗下的 Deepmind 又雙叒叕在圍棋界搞出了一個大新聞(它搞得新聞還不夠多嗎!!)。還記得被 AlphaGo 擊敗後不斷為其打 call 的棋手樊麾嗎?這回,他又替阿爾法狗公布了一個重磅消息,嚇得柯潔留言表示要重新學下圍棋了。這到底是怎麼回事?今天就給大家詳細八一八。(文末附贈本次的論文,大家可以好好學習)

昨天晚上八點不到三十分,樊麾老師在微博上發布消息稱,採用 AlphaGo Master 人工智慧製作的 AlphaGo 教學工具正式上線。據說,他本人已經在這個工具里通過 AlphaGo 的視角,分析研究了許多圍棋開局的下法優劣,現在每一個感興趣的人都可以親自來體驗一下,還能直觀地看到 AlphaGo 對每步棋的勝率分析!是不是很厲害!

至於很多人會擔心今後布局的標準化,棋手李喆也給出了定心丸:其實不必擔心。教學工具並不是告訴大家「只能這麼下」,而是告訴大家「有些下法不太好」以及「可以這麼下」。有些圖中沒有的下法只是因為模擬的隨機性而未被收錄,它們之中包含很多高勝率的選點,仍可以大膽嘗試。

上圖:妖刀定式

// 教學工具介紹

關注這方面的讀者可能記得,在不久之前,Google 的 CEO Sundar Pichai 就曾表示,他們將開放圍棋學習工具 AlphaGo Tools。現在最終放出的這個工具中,不但收集了 231000 個人類對局棋譜,還包含了 75 場 AlphaGo 與人類對戰的棋譜,而且從中總結出了約 6000 個近代圍棋史上的主要開局變化。

圖為AlphaGo採用的蒙特卡羅樹搜索

在教學工具中,每一步都能看到 AlphaGo 評估的對應著法的勝率,以及 AlphaGo 給出的推薦下法。這些數據都是 AlphaGo 經過1000萬次模擬後得到的數據。對於每一個特定的開局,AlphaGo 都將固定向後延伸20步棋。加上 AlphaGo 自身的下法,整個教學工具約有 2 萬種分支變化,37萬個盤面。開發團隊的黃士傑博士表示,希望大家享受 AlphaGo 教學工具中的創新下法,也能從中有所收穫。

圖為 AlphaGo 和樊麾的對局中,決定某一步下法時的決策流程

// 試玩體驗

這麼帶勁的大玩具,怎麼能不玩一下過過癮?在 Deepmind 放出的這個工具頁面上(alphagoteach.deepmind.com),簡單地點擊棋盤上的彩色圓圈,或使用棋盤下方的導航工具,即可探索不同的開局變化,並能直觀地看到 AlphaGo 對於每一步棋的【黑棋勝率】預測。

如下圖所示,棋盤中紫色實線的圓圈代表過去的棋譜中,職業棋手曾經下過的著法,青色虛線圓圈代表 AlphaGo 推薦的下法,圓圈中的數值代表 AlphaGo 對該著法的評估。當輪到黑棋落子時,數值越接近 100 表示黑棋優勢越大;當輪到白棋落子時,數值越接近 0 表示白棋優勢越大。 50 則表示均勢。這樣,即使對圍棋定式不甚瞭然的玩家,通過選擇某一手,並觀察局面和概率分析的演變,就能大致了解 AlphaGo 對當前局面的分析結果。

也許有人會問,那為什麼 AlphaGo 不選擇勝率最高的下法呢?Deepmind團隊對此的說明是:「這是因為每一個下法的勝率都是得自於單獨的一個 1000 萬次模擬的搜索。 AlphaGo 的搜索有隨機性,因此 AlphaGo 在不同的搜索可能會選擇勝率接近的另一種下法。」

// 微博上的評論

一石激起千層浪,微博上的圍棋大咖們對這個大新聞也議論紛紛,九段棋手世界冠軍常昊認為,「教學工具不一定是標準答案,更多的是給予了我們無限的思考空間」,周睿羊興奮地稱他「看到工具一些高級下法之後感覺到又可以起飛了」,甚至還有人覺得「彷彿跟柯潔站在了同一起跑線上」…而人類第一棋手柯潔呢?柯潔直接表示要重新學圍棋……

深度學習 | Udacitycn.udacity.com圖標

最後雙手奉上此次熱騰騰的論文《Mastering the game of Go with deep neural networks and tree search》PDF,有需要的同學可以關注我們微信訂閱號(id:youdaxue),回復關鍵字【阿爾法狗】 獲取。

想看更多關於阿爾法狗的文章,戳阿爾法狗逆天超進化!8小時碾壓3大棋類無人能敵!

本文首發於微信訂閱號優達學城Udacity(id:youdaxue),關注訂閱號,回復關鍵字「學習資料」,獲取來自矽谷的包括「機器學習」、「深度學習」、「數據分析」和「前端開發」在內的獨家學習資料。優達學城 (Udacity) - 傳授矽谷的名企官方課程

歡迎大家踴躍投稿~可以通過私信聯繫優達菌~


推薦閱讀:

人類與AlphaGo的恩怨情仇(五):最後一戰
柯潔和 AlphaGo 的第一盤棋有哪些值得關注之處?
柯潔單挑阿爾法狗,九成會輸,但人腦不會因此喪失最後的陣地
如何看待阿爾法狗3:0擊敗柯潔?
人工智慧可以戰勝柯潔,卻為何遲遲沒有搞定自動駕駛?

TAG:柯洁 | AlphaGo | 围棋 |