Master沒學過人類棋譜？他可能比老阿法狗更恐怖

07-06

在Master完成60勝，結束人機車輪戰後，因與AlphaGo對戰而成名的歐洲圍棋冠軍樊麾就在社交網路上發表了一篇公告。

在這篇公告中，谷歌公司明確表示Master是「阿法狗」的升級測試版，而在其中更是有個驚人的所在——Master可能完全沒學過棋譜，而這也側面印證了Master不按常理出牌的套路。

柯潔微博。

人類與人工智慧共同探索圍棋？

樊麾目前是谷歌DeepMind團隊測試工程師，在公告中，樊麾代表DeepMind團隊寫道：

「我們最近很努力地開發阿爾法圍棋，剛過去的幾天我們在網路的對弈平台進行了一些非正式的快棋對局，目的是為了檢驗我們最新版本的阿爾法圍棋是否如我們的預期。」

「我們需要感謝所有與我們的Magister(P) 和Master(P) 賬戶在弈城圍棋網以及野狐圍棋網對弈的棋手，也要感謝所有觀戰的人！最新的阿爾法圍棋在對局中所富有啟發性的創新，我們從中可以學到的，以及對局的結果都令我們非常激動。」

谷歌團隊聲明。

在這段公告中還有耐人尋味的一段：

「世界冠軍古力與阿爾法圍棋對弈以後寫了，『人類與人工智慧共同探索圍棋世界的大幕即將拉開』。我們現在結束了非正式的測試，非常期望今年能有機會與圍棋組織以及專家共同探索神秘的圍棋，在相互啟發的氣氛中共同領會圍棋的奧妙。我們希望儘快發布其他公告。」

人類與人工智慧共同探索圍棋世界的大幕即將拉開？是的，谷歌看上去是要將圍棋AI領域探索作為一個重要突破口。

要知道，DeepMind公司創始人哈薩比斯此前在一次採訪中曾透露，他們的團隊正在嘗試訓練一個沒有學習過人類棋譜的人工智慧，這也可能就是Master和AlphaGo不同的原因。

如果Master真的沒有學習過人類棋譜，而有了突飛猛進的實力，那恰恰印證了谷歌AI技術的全新突破。

《自然》雜誌封面。

它的棋力哪裡是極限？

AlphaGo的棋力已經不言而喻，但更可怕的是它的學習能力。

在2015年10月，AlphaGo在與歐洲冠軍樊麾的對弈中就在公平的情況下以5比0完勝。樊麾在接受媒體採訪時認為，AlphaGo的可怕在於「從不犯錯」。

但在樊麾與AlphaGo的五盤大戰棋譜被放上網路後，就有不少圍棋業餘高手在網路上發表評論，其中不少人認為樊麾這次的棋下得並不出色。

但當時《自然》雜誌就寫道，「人類在下棋時有一個劣勢，在長時間比賽後，他們會犯錯，但機器不會。而且人類或許一年能玩1000局，但機器一天就能玩100萬局。」

「圍棋AI的學習能力非常強大，就像當初『深藍』第一次輸給了卡斯帕羅夫，但不到一年第二次對弈就贏了比賽。」

據《自然》雜誌介紹，AlphaGo的核心是兩種不同的深度神經網路：「策略網路」（policy network）和「值網路」（value network）。它們的任務在於合作「挑選」出那些比較有前途的棋步，拋棄明顯的差棋。

更恐怖的是它的「進化」深度學習能力，用了2000萬局的對子對弈進行訓練，每一次都能提升棋力。

本文來源：澎湃新聞網責任編輯：王鳳枝_NT2541
推薦閱讀：