圍棋人機大戰一周年急速短評

飛舊金山的 CA985 起飛前,微信公號「量子位」約我談談對圍棋人機大戰一周年的看法。時間緊,就匆匆梳理了思路,擇要點敲了寥寥幾行字。剛下飛機,「量子位」的《圍棋人機大戰一周年:被 AlphaGo 改變的世界》就已發出。這裡把文章中我的回答摘出來,算是一個《急速短評》。

量子位:一年後再看 AlphaGo 有何改變?有什麼記憶猶新的片段?

王詠剛:AlphaGo 出世一年,其實進入大家視野的是三個版本:5:0 擊敗樊麾的內測版本,4:1 擊敗李世石的版本,以 Master 網名 60:0 快棋挑落中日韓高手的版本。三個版本演進脈絡明顯,每次迭代都有重大升級。

最震撼的是計算機在人類傳統認為極其玄妙的、電腦無法掌握的「大局觀」上突飛猛進,遠遠將人類選手甩在身後。電腦計算「大局觀」的方式,和人類培養「大局觀」的思路,有根本的差別。人類沒可能在這方面趕上電腦。

和樊麾對局的棋譜基本上還看不出 AlphaGo 的大局觀有多強,和李世石對局就下出了聶衛平讚不絕口的五路肩沖,到了 Master 的 60 局,大局觀體現在兩個地方:

1)從始至終對局勢的把握,比如第 60 局古力用 AlphaGo 的思路對付 AlphaGo,把中央撐得很滿,但 AlphaGo 不緊不慢,總是恰到好處地保持勝勢。

2)已經深刻影響人類對布局的思考,大飛守角之類的變化迅速被人類棋手模仿,這和當年深藍問世後,國際象棋的布局革命是一樣的。

量子位:過去一年,有什麼具體產品或研究,是基於 AlphaGo 的么?

王詠剛:AlphaGo 用的是 AI 領域應用非常普遍的演算法:深度學習、蒙特卡洛演算法、增強學習等。

從概念上可以說,機器視覺相關的深度學習技術,包含環境-決策-反饋的智能系統,裡面都有 AlphaGo 的影子。當然,直接的代碼實現層面,肯定沒有複製、粘貼這樣直接借用的關係,因為 AlphaGo 的深度學習模型畢竟是圍繞圍棋的特徵建立的。

DeepMind 去年發布的讀唇術 LipNet,與英國國家醫療服務體系 NHS 合作推出的醫療輔助應用 Streams,與眼科醫院合作幫助眼部疾病診斷等等,可以說都是與 AlphaGo 同源的技術。

量子位:AlphaGo 是否已經攻克圍棋?未來可提升的空間還有哪些?

王詠剛:「攻克圍棋」,如果說戰勝人類選手的話,AlphaGo 已經實現了,而且現在「絕藝」,DeepZen 之類的程序對人類勝率也很高了。

未來最多三年必將發生的是,手機上的本地 APP 就可以戰勝人類職業高手,現在熱鬧的網上圍棋對弈平台都會死掉(因為對手可以輕易用手機作弊),人類圍棋將回歸現場競賽,圍棋培訓講師將更重視普及教育,因為中高級的提高訓練完全可以用機器代練。

不過,如果說「攻克圍棋」是像計算機可以窮舉西洋跳棋的所有變化那樣,讓電腦成為圍棋「上帝」,這個應該還不大可能。現在AI大部分的招數,還在人類高手可以理解的範疇內。AI也有一些可疑的「弱點」,比如官子水平到底如何等等。

以後 AI 和 AI 之間的競賽,應該會不斷促進 AI 提高(但這種沒有太多商業利益的事情,有沒有持續投入是個問題)。人類應該望塵莫及,但可以不斷從 AI 中學習新的思想。

按:匆匆短評,既不深入,也不精確。錯漏難免。回頭也許真要抽時間,從技術角度好好梳理一下 AI 下棋這件事。

推薦閱讀:

語義網路,語義網,鏈接數據和知識圖譜
推薦系統PM最主要的工作是哪幾件事?_討論輸出_AI產品經理大本營
腦芯編 | 窺腦究竟,結網造芯(三)
《人工智慧》第一周問題集agent & enviroment
余凱:不做AI晶元,如何改變世界?

TAG:AlphaGo | 人工智能 | 围棋 |