為什麼說AlphaGo的勝利是件驚天動地的大事?|AlphaGo|圍棋

李世石對戰AlphaGo

鳳凰科技訊 北京時間3月10日消息,據科技網站TheVerge報道,隨著人工智慧技術的進步,各種棋類高手一一被電腦斬落馬下,圍棋是人類碩果僅存的驕傲,但在昨天的一場世紀之戰中,谷歌旗下的AlphaGo電腦卻成功擊敗韓國九段棋手李世石,引起了全世界的關注。李世石也在賽後表示:「我非常吃驚,沒想到真的會輸,AlphaGo的實力居然如此強悍。」只是下盤棋而已,為什麼AlphaGo的勝利如此引人注目呢?想要真正理解該問題,就要先了解圍棋的特性和DeepMind團隊如何去破解圍棋中的各個難點。

以下為文章全文:

昨天DeepMind的AlphaGo戰勝傳奇圍棋選手李世石的消息成了全世界各家媒體的頭條,同時,這也是人工智慧(AI)歷史上最重要的時刻之一。「我非常吃驚,」李世石說道。「我沒想到會輸,AlphaGo的實力居然如此強悍。」

不過就是下個棋而已,為什麼AlphaGo的勝利如此引人關注呢?想要真正理解該問題,就要先了解圍棋的特性和DeepMind團隊如何去破解圍棋中的各個難點。

圍棋發源於中國,是一項擁有3000年歷史的古老遊戲。它非常抽象,所有的戰鬥都發生在19 x 19的格子棋盤上,棋手通過落子圍住對手的棋子來獲勝。雖然規則不多,但變化多端的棋路讓其變得非常深奧,因為任何細微的變化都有可能引起戰局的突變。

韓國圍棋協會高級秘書長

英國圍棋聯盟裁判托比表示:「圍棋是世界上最為複雜的智力遊戲,它簡單的規則加深了棋局的複雜性。」托比還引用了20世紀傳奇圍棋選手愛德華·拉斯克(Edward Lasker)的話,後者表示:「國際象棋中有許多巴洛克式規則(意為華而不實),它們都是人們故意添加的,而圍棋則不同,它的規則是如此優雅自然,有著嚴格的邏輯,如果宇宙中還有其他智慧生物,我想他們也會愛上圍棋。」

正是因為圍棋超凡的複雜性,想要成為傳奇選手,你需要經過多年的訓練。棋手需要磨練自己的直覺並學習識破各種棋路。「剛剛上手時,你會覺得圍棋的規則簡單易懂,但在長期的練習中你會發現這項運動深不可測,」韓國圍棋協會高級秘書長Lee Ha-jin說道。「即使你已經在圍棋界浸淫幾十年,你依然會發現自己還有許多東西可學,圍棋棋藝是沒有天花板的。」

五歲時Lee Ha-jin就表現出極強的圍棋天賦,因此她的父母將她送去首爾的私立圍棋學校學習,她跟老師同吃同住,平日上學,晚上回來後還要練習幾小時的圍棋。經過11年的訓練,她最終成為了一名職業棋手。

小小棋盤中蘊藏著無數奧秘

我採訪過的每個圍棋選手對這項運動的評價都如出一轍:圍棋的魅力就在於簡單規則後無數的變化。這些複雜的變化正是電腦難以捉摸並真正掌握的地方,畢竟機器沒有人的直覺。

「國際象棋和西洋棋與圍棋不同,它們不需要選手對棋局做複雜的形勢評估,」喬納森·謝弗(Jonathan Schaeffer)說道,他是加拿大阿爾伯塔大學的計算機科學家,此前他的Chinook程序曾戰勝過頂級的西洋棋選手。「在國際象棋和西洋棋中,只需簡單的啟發,你就知道下一步該怎麼走,衡量各個棋子的價值是選手最重要的任務——如果在國際象棋中多一個車的棋子,那你已經基本勝券在握了。但這些方式在圍棋中都行不通,從人類的角度來看,圍棋的棋路過於複雜,電腦很難學會。不過AlphaGo做到了,它擁有世界上首個有效的評估函數系統。

那麼DeepMind是如何做到的呢?其實解決這個問題的關鍵是深度學習和類神經網路技術,有了它們,研究人員就能教AlphaGo下棋。就像Google Photos能幫你從無數圖片中找出貓咪一樣,其背後是該應用對超大量級的貓咪圖片做分析後的結果,這些分析處理甚至細化到了像素級別。而AlphaGo能有如此成績,則得益於對數百萬項圍棋數據的學習,包括各種棋路和棋手的比賽。

眼下,AlphaGo還在不斷學習,其能力也在不斷增強。起初,它還是靠學習套路(策略網路)來預測對手的落子方式,不過隨著價值網路訓練的深入,AlphaGo已經有了那麼點「直覺」,它可以分析出比賽的態勢了。在棋局中,AlphaGo已經可以通過快速對各種可能性做分析,提前考慮後面幾步的落子和排兵布陣了。其實AlphaGo擁有的各項技術都是相互輔助的,類神經網路可以降低電腦的負載,提高工作效率;套路學習則可以減小其搜索範圍,而價值網路則可讓它從每次的比賽中總結出自己的經驗。

AlphaGo擁有自己的「思考」能力

這一增強版的學習系統讓AlphaGo變得更像人類,而不是靠驚人計算能力戰勝國際象棋大師的IBM深藍電腦,畢竟圍棋和國際象棋在複雜程度上不屬於一個量級,用深藍電腦的方法是無法在圍棋上戰勝人類的。在五場比賽的間歇,DeepMind都不會對AlphaGo做調整,因此電腦只能靠自己來學習,但每天一場比賽的量確實有些少。此外,DeepMind公司創始人傑米斯·哈薩比斯(Demis Hassabis)稱AlphaGo的計算能力在去年十月的比賽後一直都沒有得到增強,因此現在它的能力已經達到現有硬體條件下的頂峰。

不過深藍電腦的開發人員認為AlphaGo在國際象棋上並不一定是世界最強。「我相信DeepMind可以開發出戰勝所有國際象棋大師的程序,」IBM研發工程師坎貝爾說道(他認為AlphaGo是一個令人印象深刻的程序)。「不過我不認為AlphaGo可以在所有棋類比賽中站上世界之巔。為什麼這麼說呢?因為國際象棋在搜索能力的要求上與圍棋有著本質上的不同,而該能力是電腦戰勝國際象棋大師最為關鍵的一環。雖說圍棋上電腦也需要深度搜索來輔助,但圍棋更重視直覺和對棋局形勢的判斷與預估,而在國際象棋比賽中,搜索能力就是唯一,這正是AlphaGo最為缺乏的。」

不過DeepMind公司可不這麼想,它們認為在AlphaGo上取得的經驗可以在多個領域中得到應用。哈薩比斯曾講述過深藍電腦上的AI與AlphaGo的不同,他認為後者更加靈活,適應性也更強,而深藍電腦的應用範圍則較窄。未來,DeepMind的人工智慧技術將用在機器人,智能手機語音助手和醫療保健等領域。

AlphaGo有可能改變圍棋運動未來的走向

其實無論隨後四場比賽結果如何,AlphaGo都已經創造了歷史。上周在接受採訪時李世石曾表示:「圍棋很有可能在此次比賽中走下神壇,此前我們一直將該運動視為驕傲,因為它是唯一未被電腦戰勝的棋類運動,如果這一紀錄作古,確實會讓人有些失望。」

不過AlphaGo的勝利也會從另一個角度推動該項運動的發展。圍棋協會成員都對AlphaGo的能力感到十分震驚,他們認為AlphaGo有時落子的方式有些一反常規,如果自己這樣下棋,肯定會被老師罵的。

「我們當然非常震驚,」圍棋選手傑克遜表示。「業內一直有所謂正統的落子套路,AlphaGo這樣不按套路出牌能給我們帶來什麼啟示呢?難道它要引發業界大地震?難道我們此前辛苦訓練學會的那些技能都是錯誤的嗎?」(編譯/呂佳輝)


推薦閱讀:

28 天自制你的 AlphaGo (4) : 對於策略網路的深入分析(以及它的弱點所在)
柯潔那麼年輕,有沒有可能轉行搞人工智慧?
第三十七期:機器人是如何思考的?
為什麼我們對人工智慧的這些預測都不準? | 精選
人機大戰成「絕唱」:人類圍棋向何處去?

TAG:AlphaGo | 圍棋 | 大事 |