新聞晨報:人類可以被擊敗 但圍棋依然在那裡
谷歌圍棋挑戰人類
上周出了大新聞。
「谷歌的計算機圍棋程序與歐洲圍棋冠軍、職業二段樊麾下了5盤19路分先對局,計算機5:0戰勝樊麾,並且今年三月會與李世石對決。這個成績加上棋譜分析表明計算機圍棋程序已完全接近職業棋手水平。計算機圍棋程序主要使用了神經網路的方法,具體的細節還有待於閱讀論文。」1月28日早晨,人工智慧專家劉知青教授發來這封電郵。
消息已經在網路上引起了圍棋愛好者的一些熱議,大多數棋手和愛好者不認為變化馬上就會到來。在他們眼裡,圍棋代表了東方智慧,是唯一不能被機器打敗的。打敗了圍棋,就是打敗了人類……
我們,劉教授和我,辛苦一年多的《對面千里——人工智慧和人的圍棋談話》正在上海文化出版社三審。我們的書要想表達高科技時代人們對於圍棋的認識,似乎就是為這個新聞而寫。書的最後一章《未來》,就是預想一旦計算機圍棋戰勝了人類的最好棋手,人們會作何感想,圍棋會如何生存。
我們也曾思考過是不是要對這本書做一些修改。劉知青教授再次發來電郵,他確信:「好在我們基本的觀點仍然不受影響,唯一有疑問的是我們關於戰勝人類的時間預測過於保守了。」
在我們的書中,劉教授預計未來5至10年,計算機將會戰勝人類最好的棋手,可稱作「圍棋界的卡斯帕羅夫」。樊麾二段雖然還不能稱為「最好的棋手」,不過 他邁過了「專業門檻」,去年10月,計算機戰勝了他,就是一個非常巨大的突破。劉教授相信,很快將會有接二連三的專業棋手被計算機戰勝。
學習方法
「新聞」剛剛過去24小時,劉教授深夜的電郵,對這一比賽作了技術上的分析:
谷歌的計算機圍棋程序叫作AlphaGo,引入了深度神經網路(Deep Neural Networks)的新方法,來改善盤面評估和落子選擇。
負責盤面評估的神經網路叫做價值網路; 負責落子選擇的神經網路叫做策略網路。這兩種神經網路都是通過機器學習方法來訓練獲得的。
策略網路的訓練是通過使用職業棋手的棋譜進行有監督的機器學習; 價值網路的訓練是通過自己與自己的對弈,根據勝負的結果進行無監督的增強性學習。
不加任何搜索,谷歌的深度神經網路已能夠達到現有蒙特卡羅樹搜索方法所能達到的最高圍棋對弈水平。在兩種深度神經網路之上,谷歌又引入了一種新的搜索算 法,把蒙特卡羅評估與價值網路和策略網路結合在一起。可以看到,谷歌以把計算機圍棋技術提升到了「專家系統」和「蒙特卡洛評估」之後的第三個階段:「基於 深度神經網路的機器學習」。
這些機器學習的方法與人類的學習方法是完全一致的。在這個意義上,我們目前很難估計這些方法的瓶頸是什麼。
經驗的價值
請注意劉知青教授這樣分析:「這些機器學習的方法與人類的學習方法是完全一致的。」而「很難估計瓶頸」,說明AlphaGo的這些方法還有很大的空間。
在棋盤面前,機器和人在學習什麼?我們在書中,引用中國科技大學和美國明尼蘇達大學神經認知科學家在實驗報告中的一段話:
中美兩國研究者另一引人注目的實驗發現是:下國際象棋和圍棋時,都沒有用到之前科學家認為的與通用智力關係密切的腦區——前額葉。對於這一違反「常識」的發現,美國斯坦福大學的一位教授認為,這可能是因為多數被認為反映「聰明」的智能活動,其實主要是基於經驗。
在書中,我們沒有展開探討。「經驗」在哲學上有其特別的意義,沒有深度領會哲學家的思考,不敢貿然說話。當谷歌在和專業棋手對弈中獲得巨大突破時,使我 們不得不倉促寫下感想。如果斯坦福大學那位科學家的推測成立,那麼,他所說的,不會僅僅是棋手個人對局的體會。我們可以將圍棋看成是一個非常有象徵性的經 驗樣本,數千年圍棋史寫滿了經驗,有著人類智慧的意義。這些經驗已經越出了棋界,成為社會的精神財富。
曾經詢問過參加工作的科學家,得知參加實驗的,大多數都是業餘棋手。這一實驗,可能沒有包括創造力特彆強大的棋手,不過,這沒有關係。當圍棋經驗被計算 機看作是一個巨大資料庫的時候,任何大棋士的創造,只能是無邊森林中的一棵樹。在網路時代,棋譜已經迅速公開,幾乎所有的對弈技術,一經在比賽中出現,都 可以很快成為共同的經驗。個人經驗發揮作用的時間越來越短促。
棋手和計算機都用圍棋經驗下棋,誰學得好,誰就能贏。如果說,人在對弈時必須要學習的是圍棋技術那一部分的經驗,那麼機器學到的、處理的也是這些經驗。而在學習的速度和質量上,AlphaGo具有非常大的優勢。
研究終點不僅是贏棋
劉教授的注意力,聚焦在Al-phaGo的「學習能力」上,這是必然的。
這次突破可能最重要的影響,就是讓我們更清晰的認知了基於機器學習的神經網路的能力,這種能力應該遠遠超出我們早期的預想。
這種能力將在不久的將來,應用在我們生活的方方面面,可以改變我們生活的方式和質量。
那些聚在谷歌旗幟下的人工智慧科學家,絕不是在搞一件網路遊戲。他們並不將戰勝專業棋手當作研究的終點。劉教授就說過,如果僅僅為了戰勝專業棋手,那麼全世界無須有那麼多人,花費那麼多的精力來研究圍棋。
果然,有報道說,谷歌希望AlphaGo能夠運用這些技術解決現實社會最嚴峻、最緊迫的問題,從氣候建模到複雜的災難分析。
AlphaGo研究者哈薩比斯說:「儘管遊戲是快速和高效率開發和檢驗人工智慧演算法的完美平台,但最終我們希望把這些方法應用於現實世界的重要問題上。」
正因為科學家的目的不在擊敗棋手,而是從圍棋經驗獲得借鑒;因此,面對圍棋經驗,計算機僅僅取其所需。人機對弈是科學家驗證人工智慧演算法的平台,樊麾二 段和李世石九段,是計算機能力的標尺。即使計算機擊敗了所有九段棋手,那隻證明了「單個的人」趕不上計算機學習和掌握經驗的能力。
在書中,我們討論計算機能不能「道法自然」的時候,劉教授說:由於數學模型的客觀性,它沒有人的感情,棋手對於棋子的感情。它只有計算機的理性,所以它在某種程度上面更接近勝負師,它還是把勝負看得最重要,勝負之外它沒有任何「感情的牽掛」。
圍棋永遠是圍棋
計算機能夠解讀的圍棋經驗,雖然數量極大,但都在勝負範圍之內,和勝負無關的,計算機目前還不會學習和處理。可以說,機器不過是在比較局部有限地使用圍棋的經驗而已。
圍棋經驗存在於人類圍繞圍棋的活動之中,人創造和積累了圍棋經驗,全面並深入理解圍棋經驗的,也只有人。機器對於圍棋經驗的整體,不可能取否認的態度。 圍棋依舊在那裡,表達人類智慧高度的圍棋經驗依舊在那裡。圍棋繼續可以擔任人類智慧的試金石,在很多棋手心目中存在的「圍棋上帝」,可以看作是圍棋經驗的 總和,仍舊可以令無數人,包括計算機科學家頂禮膜拜。
圍棋巨大的空間依舊存在。或許棋手今後會將注意力更加集注於對弈中發現的嶄新形狀,獲得嶄新的體驗和經驗。當然,這也包括計算機對弈中「一不留神」下出的妙手。計算機的學習,在一定程度上跳過了棋理,只有專業棋手才知道這棋妙在何處。
圍棋經驗應該是全方位的經驗。陳祖德先生早就說過,勝負對於棋手非常重要,可是圍棋並不僅僅是勝負,勝負以外的東西更多。我們將下棋當作生活,從生命或 者生活的意義上去理解棋手,理解對局,那麼經驗的天地更大。例如圍棋經驗的棋理部分,雖然大多數離不開棋盤,不過經過了棋手和文人的語言化,便具有中國學 問的特點,它在生活中產生,形成的過程,不是依靠概念推演,而是離不開具體形象,和具體對局。棋理最後成為思想,在社會上傳播。在哲學上或者生活上,都有 重要的意義。
人的一生,都在讀一部叫做生活的大書。學會圍棋,知道有圍棋經驗的存在,就等於找到了一本生活辭典,遇上疑難,在棋盤上或許可以找到註解。
我們想要對每一個愛好者或者棋手說,安心繼續下圍棋吧,計算機和頂尖棋手的較量無論誰贏,都不會改變你在棋盤邊上獲得的快樂,圍棋依舊值得成為你終生的愛好。
(註:文中楷體字為劉教授郵件引用)
(作者簡介:著名圍棋記者、作家,著有《黑白之道》《黑白之境》和《名局》等圍棋著作)
推薦閱讀:
※圍棋死活新題型與教學淺談
※圍棋筆記
※如何評價2017年1月4日Master(最新版AlphaGo)60場全勝?
※誰給你的勇氣拍《棋魂》真人版,梁靜茹嗎?
※我與李昌鎬的第三局(中):生死劫爭