人機大戰成「絕唱」:人類圍棋向何處去?
前言:
5月23號到27號,中國圍棋知名選手江鑄久九段和芮迺偉九段伉儷在浙江烏鎮親歷了AlphaGo對陣柯潔的人機大戰。他們嘆服於「AlphaGo Master」的功力之深,水平之高,也因此堅定了繼續在中國開展圍棋教育的信念。
這場比賽也成為AlphaGo的最後一場圍棋比賽。據DeepMind CEO 德米斯·哈薩比斯介紹,接下來,AlphaGo團隊將轉而解決人類在醫療健康和科學研究等領域面臨的新挑戰。AlphaGo的演算法已經在幫助谷歌伺服器節能方面取得成效,他希望未來能開發出「AI科學家」,幫助科學家們在能源、材料設計、藥物研發等領域取得突破。
AlphaGo 過往左右互搏的50張棋譜也將被公開,供全世界的圍棋選手研究。在江鑄久看來,這是一筆寶貴的財富,必將成為今後棋手最主要的一種學習模式。以下,是江鑄久記錄的觀賽感想。
撰文 | 江鑄久(圍棋職業九段)
責編 | 徐 可
● ● ●
|5月23號|
AIphaGo和柯潔的人機大戰開戰,這是一場讓人期待已久的對決,因為AlphaGo Master在今年年初的時候用快棋在網上橫掃中日韓高手。60盤棋不敗,這是非常令人震撼的勝率。但是畢竟是快棋,是人類要在30秒之內作出決定的快棋。我們還是希望能夠看到人類棋手在更充裕的時間內,與AlphaGo對陣,比如每方三小時會下成什麼樣。AlphaGo的厲害,人們已經知道了。我更想知道,人類與AlphaGo究竟差距幾何?
第一場比賽,柯潔執黑下出了三三,跟著在白棋第六手小目高拆二守角的情況之下,又下了點三三,這是採用了AlphaGo在新年期間的手法。也許這就是柯潔準備的作戰計劃——故意模仿AlphaGo的風格。可是AlphaGo在針對厚味的棋形處理上是駕輕就熟的。最重要的一點是這不是柯潔本身最擅長的地方。給我的感覺是柯潔太在意如何遏制AlphaGo了。可以說從這個點三三起,AIphaGo就開始利用全局的厚味一點點去擠壓黑棋。
白棋從48拆開始讓人感到有點意外,因為從小目拆一符合棋理,離對方的厚勢稍遠一點。它拆二,然後黑棋當然是打入下邊白陣地了。嘿,白棋在黑厚勢上點一下,這個也算是正常。緊跟著白棋尖頂俗手把自己的角上方地緊緊攔住,這樣讓我們擔心起跟厚勢一起如何補的時候白棋下出了54斷,勇於落後手的下法。第一感覺是吃了一驚,因為這就是中盤時甘心落了一個明顯的後手。
普通的人類棋手是不會這麼於閑著處落後手的。細細品,這步後手的妙味慢慢地泛出濃郁的芳香。因為有了這手棋,白棋徹底消掉了黑棋的左邊厚味,左下角得到加強,全局的主動性都變得簡明起來。
當天我就發了一條朋友圈:
「AlphaGo在今天最亮的一個亮點,是抓住了人類沒有想到的一個盲點。這也顯出了人類思維的局限性。
從新年以來,俺開始打譜學習AIphaGo master留下的60局棋譜,並且做了學習筆記,匯成了內部資料供孩子們學習。AlphaGo行棋速度快,效率高,掌控局面的能力超強。今天再次給我們上了一課。」
|5月24號|
今天是論壇,DeepMind團隊給大家講解AlphaGo是如何深度學習的。其中爆炸性的新聞是說AlphaGo經過這一段的深度學習,已經比同李世石下棋時的版本進步了三個子。這三個子在棋盤上就是不得了的距離。由於本來現在的職業與業餘之間的距離都非常小,我們不太相信AIphaGo能夠真的讓三個子。
? 與DeepMind CEO 德米斯·哈薩比斯交流。因此午飯的時候我們特地找到哈薩比斯先生去求證。哈薩比斯給我們的解釋是說系統自己測定的是這樣的差距。首先,已經修正了跟李世石下棋時的bug。不會再出類似錯誤。這是在「AlphaGo李」同「AlphaGo柯」的內部測定對局。科技時代的速度使得他們內部評估的距離是三個子。當然他說並不代表能讓人類棋手三個子,也許是兩個子。即便如此,這也是非常震撼的消息。聽到上午發表的論文消息,柯潔立刻發表了微博,表示了震驚。那麼我們再聯想到AIphaGo跟柯潔下這盤棋,取得些許優勢之後,幾近於滴水不漏的感覺,那確實是AlphaGo非常強大的表現。想起3月份到日本的時候,碰到了武宮正樹老師、趙治勳老師和小林光一老師,他們都不約而同地認為如果是60連勝,按照棋份來說,那是兩個子的棋份了。
不管怎麼說有一點各國棋手是相通的,那就是大家都在打AlphaGo的棋譜。AlphaGo吸取了以前強手的精華,並且幾乎在每一盤棋里都有新的創造,這些彌足珍貴。可以預計這將成為棋手下一步最主要的一種學習模式,那就是認真學習AlphaGo所下的棋。如果有一天AlphaGo出單機版,我相信很多棋手都會儘可能跟他對練,從中學習到很多有意義的招法。
但是人類的學習深度也有了幾千年的積累,現在圍棋的核心部分是人類棋手創造的。AI也是抓住了這樣一些歷史上精彩的瞬間讓人能感受到AlphaGo人文的一面,有情感的一面。
從學習的角度我們希望多看到一些人機對決。現階段AlphaGo的棋還基本上沒有看不懂的。雖說他的有些招法你暫時不理解,但是仔細琢磨之後還是能夠明白的,當然你未必下得出來。
像第一盤AlphaGo最妙的當然是白54,可是對於人類棋手來說,更想了解的是,他是從48手的時候就有這樣的計劃嗎?還是說從更早一點吃掉對方角上兩個子時就已經開始準備呢?消除黑棋厚勢是早做了這樣的準備呢,還是隨時可以看到很遠的招法及時調整呢?真是讓人覺得意味深長的事。
這些是人類的深度學習。這實際上因為到目前為止AlphaGo確實是超越了人類最強的棋手。但是它究竟有多強?我的感覺是AlphaGo遇強則強。大家在看棋的時候自然期待人類的最強棋手能夠戰勝AI,不過,如果能夠把它的最強逼出來,就已經是成功了!
|5月25號|
第二局,感覺柯潔放開了,拚命了,下得非常出色,可以說是逼AlphaGo使出了渾身解數。據賽後公布的數據,AlphaGo認為前100手是雙方最善。雖然後半盤柯潔弈出問題手,棋局戛然而止。但是那一局棋,令許許多多的觀眾熱血沸騰。
很多記者在第一局第二局後都在不停追問DeepMind準備何時公布後台的數據。我們可以設想,現在的AlphaGo還遠遠沒有達到完美的境界,但是他站在人類的肩上已經使我們看到了一個非常遠的未來,那就是還有很長的路要走,圍棋可以有更加廣闊的空間。
AlphaGo的出現,是我們人類棋手的幸運。至於說今後整個社會是不是會有一少部分人去控制發明創造人工智慧,而另一部分人的工作可能都會為人工智慧所取代,這可能是一個更加宏大的人文課題。
|5月27號|
第三局,柯潔前半盤弈出問題手,之後奮力拚搏,一度使形勢非常接近,但後半盤還是被拉開了距離。到了這時候,我感覺勝負不是最重要的(當然對柯潔可能是)最重要的是他們兩個下出什麼樣的棋,給我們看到什麼樣的精彩內容,這一點,我想大家沒有失望。
? 與DeepMind 強化學習研發團隊暨AlphaGo 技術負責人David Silver (右一)和研發專家Thore Graepel (中)合影。賽後的新聞發布會上,主辦方DeepMind之父哈薩比斯先生宣布AlphaGo將退出圍棋賽事! 也就是說,AIphaGo將退出江湖,從現在起只給我們留下背影。DeepMind團隊同時宣布,將陸續公布AlphaGo互搏的50局棋譜。今天先公布10局,我看了幾個片段,那真的是有著許多可以顛覆圍棋觀的內涵啊,谷歌的武功秘籍公開了。
經過這幾天下來與AI的接觸,讓我們感受到,中國的兒童圍棋教育顯得更加迫切,這些棋譜是寶貴的財富,是圍棋真諦的延續。2011年,我們開辦了針對孩子的江芮圍棋學校,平時也通過「江芮圍棋」微信公眾號發布和學棋有關的文章。學習圍棋可以讓孩子從很早開始就接受邏輯推理訓練,培養他們的集中力和如何抵禦挫折,「潤物細無聲」。我們需要學習的太多了,老師也跟著要學習,圍棋教育跟我們用什麼方法關係很大。新的一代獲得了比前輩更高的起點,更應該去把圍棋精神發揚光大。
致敬谷歌,同時又非常感傷,一段傳奇真的就這樣離開了嗎?
回味這場「絕唱」,在傳承方面,AlphaGo吸收了很多前輩高手的精華並予以再創造。在棋局中,我看到它的很多招法有當年吳清源老師的影子,心裡非常感動。也許,上天是通過AlphaGo映照出了很多職業棋手在歷史上那些讓人難忘的場景,那些可歌可泣的精神。我相信,無論科技進步到哪一層面,人類文明的精神、圍棋的精神是永遠值得我們景仰和致敬的。
製版編輯:艾略特丨
本頁刊發內容未經書面許可禁止轉載及使用
公眾號、報刊等轉載請聯繫授權
copyright@zhishifenzi.com
歡迎轉發朋友圈
知識分子為更好的智趣生活ID:The-Intellectual投稿:zizaifenxiang@163.com
推薦閱讀:
※圍棋史上的今天:1月18日 難產的花甲國手 被斷絕的道統傳承 文明的真諦
※圍棋史上的今天:12月27日 豪情十三連霸 死守名人 最後的雙龍會
※圍棋史上的今天:8月5日 面壁十年終破壁 屬於馬曉春的1995
※圍棋,這樣算誰贏,還是平局?