剛剛,柯潔再次惜敗國產圍棋AI,星陣到底是何方神聖?
本文由 「AI前線」原創(ID:ai-front),原文鏈接:剛剛,柯潔再次惜敗國產圍棋AI,星陣到底是何方神聖?
策劃編輯 | Natalie
撰文 | Vincent,Debra
AI 前線導讀:2018 年 4 月 27 日,與 AlphaGo 交手一年之後,棋士柯潔再次迎戰 AI 棋手,這次的對手又是國產的 AI 棋手,名曰:「星陣」。這是柯潔第三次與 AI 棋手對陣,在棋局進行到 1 小時 50 分左右的時候,柯潔認輸,隨後雙方收盤離場。盤點一年多來的數次對戰,AI 棋手在圍棋領域似乎難再有人類對手。
更多乾貨內容請關注微信公眾號「AI 前線」,(ID:ai-front)棋手柯潔中盤認輸 AI 棋手
柯潔又跟 AI 棋手對陣了!
在剛知道這則消息的時候,相信大多數人的內心是有些驚訝的,號稱「不再跟 AI 下棋」的棋士柯潔居然又跟 AI 杠上了。
其實柯潔在當初與 AlphaGo 對陣之後,雖然表示不再與 AI 棋手對陣,但是他同時還表示過願意在圍棋領域的 AI 研究上貢獻一部分自己的力量,so,這次的比賽,與其說是「人機大戰」,不如說是一場人類對 AI 棋手的測試吧。
本次比賽採用中國圍棋規則,黑貼 3 又 3/4 子,用時為每方 2 小時,保留五次一分鐘讀秒。裁判由 2016 年 AlphaGo 與李世石人機大戰的裁判長樊麾擔任。隨著中國圍棋協會主席林建超的一聲宣布,比賽正式開始。星陣圍棋第一作者金涬博士擔任「人肉臂」,落下了星陣的第一顆黑子。
自從第一次 AlphaGo 與李世石的人機大戰之後,職業棋手們就開始對圍棋人工智慧進行了深入研究。普遍認為把棋局導向複雜的戰鬥,人類棋手取勝的概率會更大。今天執白的柯潔選擇了「宇宙流」開局,做出一塊巨大的模樣。黑棋打入之後,雙方展開了驚心動魄的「短兵相接」。
柯潔攻殺黑棋大龍非常堅決,但星陣下得非常靈活,棄掉數子,破掉了白棋的潛力,全局實地黑棋領先不少。
局勢不利之下,柯潔做出一個劫爭,尋求變化。但星陣計算精準,借打劫的機會,活出了此前陣亡的大龍。柯潔見強殺無望,遺憾投子。
讓我們簡要回顧一下柯潔經歷過的三次「人機大戰」:
- 2017 年 5 月 23 日,柯潔於杭州烏鎮迎戰升級版 AlphaGo,首日以 4/1 子遺憾落敗,總比分以 3:0 敗於 AlphaGo。
- 2018 年 1 月 17 日,柯潔對陣國產 AI 棋手「絕藝」,在 AI 讓二子的情況下,柯潔依然慘遭碾壓,在 77 手時告負。
- 2018 年 4 月 27 日,柯潔對陣國產 AI 棋手「星陣」,中盤認輸。
不過,柯潔也並非只有敗績,在 1 月 24 日與「絕藝」的另一局對陣中,柯潔在 72 手時力挫對手,完成了一次漂亮的復仇。
國產 AI 棋手「星陣」到底是何方神聖?
今天下午三點與柯潔九段對戰的星陣是深客科技有限公司開發的圍棋人工智慧程序,它的前身是清華大學研發的「神運算元」,曾在比賽中戰勝世界冠軍孔傑九段。在賽前網上熱身中,星陣與職業棋手進行 30 盤大戰,取得了 28 勝 2 負的佳績,對陣的棋手包括周睿羊、朴廷桓等世界冠軍。因此在本次賽前預測中,專家普遍認為柯潔戰勝星陣將是「小概率事件」。
此前,清華 AI 神運算元的程序作者由小川曾說過,星陣的前身神運算元開發中特別注重深度學習演算法上的研究和挖掘,而星陣的開發團隊也曾透露它的兩個特點:第一,星陣圍棋學習和借鑒了 AlphaGo 的基本架構,但在特徵體系、模型結構、MCTS 演算法架構等方面有所創新,力爭用更少的計算資源和更少的訓練樣本完成模型學習,趕超人工智慧圍棋的最高水平,比如可以下出更容易讓人理解和學習的圍棋,下出優勢下不退讓的圍棋,進行任意棋盤路數的對局,也可以進行任意貼目數的對局。我們知道,助力 Alpha Go 打敗人類的是一大利器是強化學習技術,但星陣所用的技術卻另闢蹊徑,這是「星陣」超越 Alpha Go 的地方。第二,它由中國人工智慧團隊傾心打造。
相比大家都很熟悉的 AlphaGo,星陣到目前為止還是顯得有些神秘,關於它背後開發團隊的具體情況、所採用的技術細節都未曾對外界詳細透露過。
星陣這個有特點的名字其實是圍棋的別稱之一。圍棋棋盤有 361 個交叉點,中心點「天元」象徵著混元一周天的度數,棋盤上的九個星標座與易理八卦相通,整個棋局用黑白兩種符號組合排列,隱含太極陰陽。每顆棋子著在棋盤上,象徵星星在周天排列陣勢,借喻指圍棋。據說「星陣」命名還有另一層意思,只是星陣團隊暫時並未透露。
在星陣之前,回顧圍棋 AI 的歷史,多個圍棋 AI 的表現一次次刷新了人們對 AI 的期望值。其中,AlphaGo 可以說是圍棋 AI 領域一座劃時代的里程碑了,甚至引起了一陣對機器有一天將會控制人類的恐慌。AlphaGo 在「人機大戰」第一回以 4:1 大勝世界冠軍李世石打響了名聲,之後化名 Master 打敗網路「無敵手」,緊接著在「人機大戰」第二回完勝柯潔。再到 2017 年 10 月,Deepmind 又公布了最新研究成果 AlphaZero,該演算法可以進行自我對弈訓練,僅通過 72 小時內 490 萬對局的訓練就用 100:0 擊敗了初代 AlphaGo,進步神速。
除了 AlphaGo,絕藝、天壤等圍棋 AI 同樣名聲廣播。在 2017 年 12 月 10 日的第一屆圍棋 AI 龍星戰(AI RYUSEI)中,絕藝(中國)、DeepZenGo(日本)和天壤分別瓜分了冠、亞、季軍。
騰訊 AI Lab 研發的絕藝誕生於 2016 年 3 月,其研發團隊透露其使用了蒙特卡洛搜索樹技術,而這正是 AlphaGo 的核心技術之一,也是其取得突破的關鍵。
由中國 AI 公司天壤智能團隊研發的天壤智能圍棋,正是在 CGOS 上以 89 勝 5 負戰績迅速爬升的 define-3.0。天壤團隊在賽後採訪中公布了 define-3.0 的一些細節,坦誠天壤圍棋參考了最新發表的 DeepMind 論文,通過機器自我學習提升模型的能力。
這麼看來,包括絕藝在內,AlphaGo 及之後的圍棋人工智慧可以認為都是「同宗同源」。而這次,星陣是否也會延續這一「血統」?
寫在最後
從首次對陣 AlphaGo 之後的淚灑現場,到與絕藝對陣之後的無語凝噎,再到今天對比賽的淡然一笑,棋士柯潔一直在不斷成長。
同樣的,他的對手,這些 AI 棋手們也在不斷學習實戰經驗而成長。對於圍棋這樣需要大量計算的領域,人類與 AI 的對戰已經沒有太多意義,「人機大戰」這樣的比賽持續舉辦,目的是增進雙方的技術水平。比如「絕藝」已經成為中國圍棋國家隊的訓練工具,相信未來它還會被應用在更多領域。
正如 DeepMind 創始人,AlphaGo 之父——Demis Hassabis 所說:「我們希望 AlphaGo 在未來能夠成為一個工具,這不是人機大戰,而是人使用電腦發現新的奧秘和知識。和哈勃望遠鏡一樣,探索宇宙,AlphaGo 就是新的哈勃望遠鏡。我們最終的目的不是誰贏,因為最終的勝利屬於人類。」
今日薦文
晶元風波後,李開復仍堅信中國 AI將領先世界,MJ和 LeCun怎麼看?
向17W+AI愛好者、開發者和科學家,每周一節免費AI公開課,囊括上萬人的AI學習社群,提供最新AI領域技術資訊、一線業界實踐案例、搜羅整理業界技術分享乾貨、最新AI論文解讀。回復「AI前線」、「TF」等關鍵詞可獲取乾貨資料文檔。
覺得柯潔同學雖敗猶榮,百折不撓的小夥伴點個贊,給柯潔小哥哥一點鼓勵吧!
推薦閱讀:
※嚴謹對棋手有多重要
※柯潔第97手,出了什麼問題?
※教你如何找劫材(下)——減少給對手的劫材,把握劫材的個數
※跟著職業棋手學棋感(一)
※圍棋入門教程——獻給初學者