從AlphaGo對戰柯潔看圍棋

文章的最開始,我希望宣揚一個觀點。請大家不要把柯潔或是李世石當做我們人類最後的守關者,AlphaGo(下稱阿法狗)?並不是抱著侵略目的來的,而柯寶寶不是什麼肩負人類最後尊嚴的角色,更不是輸了就代表人類的失敗。柯潔的落淚,我們該用驕傲與寬容去安慰。

我更願意把柯寶寶和李世石看做人類中最早的一批探險者。因為阿法狗現在的棋路完全擺脫了人類的束縛,展現的是前所未知的圍棋世界。柯潔與李世石,是看到這個全新世界絕景的第一批訪客。

有很多人對阿法狗三勝柯潔後退役倍感不滿,其實很沒必要。因為1997年「深藍」在首次戰勝卡斯帕羅夫之後也是速度退役,卡斯帕羅夫可是當時的世界冠軍呀!這反倒能證明柯寶寶在圍棋界的地位有多厲害。

我們的戰鬥。

說到人類對戰人工智慧的棋類比賽,我想大家首先想起的估計就是「深藍」了。不過其實,我們人類與人工智慧的棋類戰史可以一直追溯到上個世紀50年代。那時候還不發達的電腦也存在著遊戲,而其中一個遊戲就是「井字棋」(Tic-Tac-Toe)。這可以被認為是最早的棋類人機對抗了。

《五便士》主演,明星丹尼·凱耶正在與電腦進行井字棋對戰,人類勝出!

而如果是要說到真正的棋類對決,目前有記載的棋類常規賽中,人工智慧首次戰勝人類也並非是電腦「深藍」而是「深思」

深思這一名字取自於道格拉斯·亞當斯的超著名小說《銀河系漫遊指南》。小說中思考出生命、宇宙,以及任何事情的答案是「42」的終極電腦正是叫「深思」。而這個名字在1988年名聲大噪,原因就是「深思」擊敗了國際象棋大師本特·拉森(六度丹麥全國象棋冠軍)。這被認為是人工智慧首次在棋類常規比賽上戰勝人類。(「深藍」是正常時限的比賽中首次擊敗了等級分排名世界第一的棋手。)

拉森大師已經於2010年9月9日去世,RIP......

而1988年的這場戰鬥,拉開了人類至今與人工智慧棋類博弈的序幕。而為什麼上個世紀多選擇用國際象棋作為與人工智慧的對戰棋類呢?因為井字棋這類棋存在一定局限,人工智慧利用的是強大的計算能力來暴力計算著下棋,很難體現出「智能」。而與人類下棋在當時被認為是檢驗人工智慧成熟度的有效方式之一,所以國際象棋與圍棋的嘗試便應運而生。

有個名詞叫作「香農數字」(Shannon number),由密碼學家、數學家、資訊理論之父克勞德·香農提出,用於計算棋類遊戲的移動可能性,這個數字是10的50次方。而近期對香農數字的修正指出,就是如果排除掉一些特別荒謬的下法,國際象棋8X8的棋盤,下棋可能性約是10的40次方種。由於計算量太過巨大,暴力搜索很難達成目的,而這時候人工智慧必須進行「優化搜索」,也就是去掉一些不合理的棋路,大大減少選擇空間。

插一句,可能這裡有人要問,圍棋的下法是多少種呢?如果按照19X19的棋盤計算,可能性大約是2.0816乘以10的170次方。這是什麼概念?我給個對比。目前已知宇宙的構成原子數約為10的78次方到10的82次方之間。比我們知道的所有事物構成原子數的總和還多一倍。國際象棋與圍棋近乎無窮的變數,讓人工智慧難以付諸暴力計算,只能以經驗選擇優先。

圍棋下法計算。總之知道這數字超大就是了。

之後有這麼幾場重要戰役:1996年、97年,卡斯帕羅夫對戰電腦「深藍」;2002年,以色列名將斯米林對陣電腦國際象棋軟體聯隊;2006年,國際象棋世界冠軍克拉姆尼克與「深弗里茨」在德國對戰。

其實人類與人工智慧的對弈,在阿法狗出現之前,還是各有勝負的。

比如1996年2月10日,超級電腦「深藍」(Deepblue)首次挑戰國際象棋世界冠軍卡斯帕羅夫,但以2-4落敗。其後研究小組把深藍改造為「更深的藍」,並於1997年5月再度挑戰卡斯帕羅夫,最終3.5–2.5擊敗人類獲勝。而「深藍」的原型,正就是電腦「深思」。

深藍與卡斯帕羅夫。

又比如2002年,國際象棋世界冠軍克拉姆尼克與超級計算機「深弗里茨」(Deepfritz)對弈,並在國際象棋「巴林智力」賽中戰成平局。克拉姆尼克為此還拿了80萬美元的獎金。可好景不長,四年後的2006年,在德國波恩的國家藝術展覽館的舊敵重逢中,克拉姆尼克最終二負四和慘敗於「深弗里茨」。

還比如2002年另一場驚人的戰役中,以色列名將斯米林一人單挑電腦國際象棋軟體聯隊「Shredder」、「Hiarcs」、「深青年」(Deepjunior)、「虎」。先後交手之後,電腦方兩負六和,人類竟無一敗績,而斯米林在最後更是以5:3的比分取勝。

所以在那時候,國際象棋和圍棋還被認為是人類智慧的最後堡壘。

說到「深藍」的獲勝就不得不說一說深藍的棋路了。深藍具備有一定的對棋局評估和預判的能力,甚至很多判斷演算法都是根據一些特殊棋局設計的。IBM研製小組在培養「深藍」時,輸入了100年來所有國際特級大師開局和殘局的下法(國際象棋也是有棋譜的,比如西班牙式開局),美國國際象棋特級大師本傑明等四人也作為背後「人類智囊團」提供支持,將他們的棋路進行編程研究

也就是說,「深藍」是集人類國際象棋大成者與先進的計算機運行技術為一體,戰勝卡斯帕羅夫有些勝之不武。 一個形象的比喻就是——人類最優秀的象棋頭腦們藉助計算機的演算能力,在圍毆一個卡斯帕羅夫。

阿法狗和「深藍」們有什麼不同?

如果說到阿法狗1.0,是和「深藍」們大同小異的升級版。阿法狗1.0的主要演算法叫做蒙特卡洛樹搜索演算法,一種更為優化的搜索方式,強過深弗里茲、深青年等電腦。而開發者更是輸入了大量人類棋譜與棋路規律讓阿法狗進行模仿,同時讓阿法狗進行自己VS自己的下棋對弈,不斷提升棋藝。

我曾經看過這樣的網友評論,其實解答已經在上面了。阿法狗從1.0版本開始,提升棋藝的一個重要方式就是自己和自己下棋,下十萬次、百萬次來積累經驗。在與柯潔對戰之前,阿法狗就已經至少輸入了三千萬種棋局,自我博弈超過一百萬次以上。有人做過粗略計算,阿法狗和自己下過的棋數放到人類身上可能窮盡一生,而人類就算從娘胎那天起不眠不休的下棋到21歲,也就下個5萬局左右。

說到「深藍」,估計很多人都知道它使用了人工神經網路技術(現在的機翻、人臉識別很大都依基於此)。而阿法狗不同於深藍,它的系統用了兩種神經網路,一種叫做預測網路,一種叫評估網路。預測網路顧名思義就是想對手下一步會怎麼走,而評估網路則是判斷每一步落子的勝負概率。

而就是在阿法狗2.0版本上,它居然拋棄了蒙特卡洛樹搜索演算法。不光如此,它同時拋棄掉的還有人類所有的棋譜和輸入的千萬種棋路,而是真正從0開始自己與自己博弈並積累著經驗,探索一條新的圍棋之路。在阿法狗強大的性能幫助下,電腦可以結合樹狀圖的長遠推斷,又可像人類的大腦一樣自發學習進行直覺訓練,以提高下棋實力。

所以,柯潔在對決的時候才會覺得,他感覺不到阿法狗對圍棋的熱情和熱愛。可以這麼說,一代的阿法狗和人類一樣,它也背過棋譜,也在探索「圍棋」到底是什麼。 但二代之後的阿法狗,已經是純粹的圍棋機器了,沒有思索,沒有模仿,只有不斷積累經驗,然後贏得比賽。

只要和自己下足夠多的盤數,阿法狗就能不斷進化。所年去年與李世石對決時,聯機版的阿法狗還輸給了李世石的「神之一手」,而今年單機版的阿法狗,已經可以做到三局穩贏了。阿法狗的棋路里充滿著理性到最可怕的概率,人類不知道阿法狗下一步的棋路,而阿法狗已經預測出了人類的輸贏的可能性。

輸給阿法狗=不再需要圍棋?這是個偽問題。

人機對弈是否有存在必要?值得探討。

在這次決戰結束後,很多人對人機對弈有著悲觀態度,就好像汽車發明後,許多人對人車賽跑丟失了興趣一樣。不過這種態度並不是今天產生的,1988年「深思」擊敗大衛後,「人機對弈沒必要」的看法就已經在國際上傳開了。更有甚者,極端地點出,計算機下棋之後,人類棋遊戲的末日就來了

圍棋的末日,是否到來了?我認為答案是否定的。而人機對弈是否有意義?我認為這意義不但有且很有價值。

計算機只關心贏和不贏,甚至不在乎勝多少子、贏得爽快還是險勝。只要結果固定是勝利就好,贏一盤棋的指令,其實和做一道計算任務並沒有多少區別。

如果把追求圍棋的至高真理認為是一個已經尋求千年的問題的話——棋手和阿法狗是兩種不同的嘗試。

柯寶寶曾經感嘆,人類數千年的實戰演練進化,計算機卻告訴我們全是錯的。不過在我看來其實人類數千年的經驗並不是錯,而是「局限」

阿法狗最大的貢獻就是——它讓我們見到了圍棋的廣大,明白了棋路的可能性之多,更明白了人類積累幾千年的經驗其實不是全部。阿法狗讓我們見識到了在圍棋里,在這人類所創造出來的事物中,存在著無限的可能性與探索。而這種可能性,作為發明者的我們,還僅參得一二。

區區兩年內,人類積累的幾千年的經驗,就被阿法狗給否定了。然而我們的態度該是故步自封的「阿法狗真可惡。」,還是驚喜不斷的「原來圍棋還可以這麼下!」呢?

人類的經驗成就了現在的頂尖棋手,卻也束縛了他們。我們必須承認一點,人類對於圍棋幾千年的經驗積累,只是圍棋無數種可能性中的冰山一角。而阿法狗就是拍攝下了冰山的下部分,它告訴人類,圍棋的其他方面還有無數的可能性與未知,還有千千萬萬可以創新可以廝殺的高峰。

阿法狗的出現是好事,而在它退役後的今天,谷歌公司更留下了50副阿法狗自我對戰的棋譜供世人參考。在阿法狗曇花一現之後,我們人類終於可以放下包袱,重新看待「圍棋可以怎麼下」、「圍棋究竟是什麼」、「圍棋可以為我們帶來什麼」。

因為我們知道了我們不是最強的,也不可能是最強的。新的世界已經打開,人類以後對於圍棋的探索只會增加而不會卻步。雖說當世頂尖高手逐一惜敗於阿法狗,但別忘了,知難而上、勇於探索也正是人類得以發展至今的優點。再怎麼說,圍棋的發明者,可是我們人類。

李世石的「神之一手」,強或非強

去年阿法狗和李世石的博弈中,很多人說李世石那神之一手很平庸只是騙棋而已——我個人認為,對神之一手的理解必須是基於當時的棋局之上。「神之一手」未必是必須要無論何時何地都必須高明精妙的一手,而是在恰當的時間、恰當的機會,以最普通的方式造成最意外的結果。

而谷歌開發阿法狗不只是為了下圍棋,下圍棋只是為了驗證其演算能力而已。但是可以這麼說——如果讓阿法狗再這麼下下去,可能有一天,阿法狗的每一步都將是神之一手。

對比人類,機器當然比人類要快得多,也準確得多。但阿法狗不懂什麼是下棋的快樂,對它來說下一盤棋只是個任務,做一個比較複雜的演算任務而已。過分強調是非對錯,功利性太強了,反而會讓圍棋失去它該有的意義。

我們的圍棋,並不只是輸贏。

在阿法狗對戰各個世界高手的比賽里,很多人都陷入了為了贏而贏的怪圈裡。

圍棋並不只是演算記憶的結論,它的意義是多方面的既是那種為了對弈而日夜努力的汗水,也是在勝負中積以跬步的經驗,更是只屬於自己的,從背棋譜開始的圍棋之路。

如果人只追求一個輸贏的結局,那我們真的和機器就沒有區別了。為了下棋而下棋,單純以輸贏判斷排位和棋手價值——那麼我們等於是逼著我們的棋士變成「深藍」和阿法狗。

柯潔這些新一輩棋手的出現,正告訴所有人,圍棋不是為了落子的結局而存在,而是為了它所寄託的,我們人類所傾注的情感。阿法狗下棋無比精準,但缺乏樂趣。人輸給機器,並不代表輸的項目就毫無意義。前世界冠軍克拉姆尼克白給「深弗里茨」之後感嘆,「輸給電腦比輸給同行要難受兩倍」,可人工智慧難以理解這種輸的痛苦,也正是它們的不完整之處。

輸贏正誤不是那麼重要,終究會過去。而輸棋時抱憾的撕心裂肺,和局裡的無奈著惺惺相惜,勝利後甩著汗昂首微笑,這種發自內心的反應,才正是我們人類所獨有的。

人類做事從來都是追求過程,而結果只是順理成章。我們早就輸給了汽車,但如今運動員們一樣在賽道上奔跑著。

在古人眼裡,圍棋是「映竹無人見,時聞下子聲」;是「日長來此消閑興,一局楸枰對手敲」;是「戰罷兩奩分白黑,一枰何處有虧成」。圍棋是運動,是遊戲。運動有輸贏,但是也有尊重對手、有共同成長;遊戲有輸贏,但更有峰迴路轉、有笑逐顏開。

發明圍棋的目的,不是為了輸贏,而是為了以棋交流——為了快樂,為了心酸,為了體驗成功,也同樣為了享受失敗。

與其想著人工智慧的威脅,不如想著怎麼在未來和智械和平相處。我們該有的未來——如霹靂遊俠與基特,如戴爾·斯普納與Sunny,如秀樹與小嘰,如巴特與塔奇克馬,如源氏與禪雅塔。

請堅定地相信一點:阿法狗的出現不是人類的末日,而是——

一個更偉大的故事的開始。

在文章最後,我放出我好友魂醬曾經繪製的《棋魂》同人。漫畫里設想著佐為和阿法狗也鏖戰了一番。這是我特地找她要的,主要是因為目前我看到的相關作品中,這篇漫畫最能表達「圍棋」與「輸棋」還有「努力」對我們人類究竟有什麼意義。我希望大家可以都放下浮躁、喧嘩與無意義的找樂,好好沉下心看看。

無論對手強大與否,無論輸贏概率幾何,一旦黑白子落下,棋手的路就只有一條——那就是抱著求勝的自信心態,相信往日的刻苦練習,拋除緊張與雜念,最後收穫成功,亦或,享受失敗。這是圍棋的天之道,更是棋手們的人之道了。

據說阿法狗的下一個挑戰目標是撲克和星際爭霸,而我更希望它也在麻將上也試試。 順帶推薦兩篇小說,一篇是美國科幻鬼才菲利浦·迪克的《機器人會夢見電子羊嗎?》,另一篇是我國科幻作家韓文軒的《上校的軍刀》。本文題目正是致敬《上校的軍刀》中最後一句話——這世上有一種智能,叫做善良。


推薦閱讀:

從人機大戰前兩局推測AlphaGo演算法的重大進展|陳經
如何看待柯潔在人機大戰後持續連勝?
2016 年 3 月 9 日 - 15 日 李世乭 對弈 AlphaGo 都有哪些有講解的直播?
為什麼柯潔會宣布 2018 再戰 AI?
AlphaGo 終於還是贏了,

TAG:AlphaGo | 圍棋 | 柯潔 | 對戰 |