AlphaGo折射的中西方思維差異
05-27
前期熱門的人機大戰,是圍棋界「棋王」李世石對戰谷歌Deepmind(Google Deepmind)研發的阿爾法狗(AlphaGo)。經過五回合激戰,李世石落敗,阿爾法狗則排名世界第二,如果下回合能成功挑戰「世界第一」的柯潔,便會拿下真正的「世界第一」,從此揭開圍棋界人機地位翻轉的序幕。
「人機大戰」這個沒有硝煙的戰場其實早在1996年便已開始,不過當時的對象是西洋象棋(亦稱國際象棋,簡稱象棋),挑戰人類的一方是國際商業機器(IBM)研發的深藍(Deepblue)。《時代》雜誌當時估計「計算機要在圍棋上戰勝人類,還要再過100年,甚至更長的時間」。光陰荏苒,在僅僅過了估計時間的五分之一之後的2016年3月,人工智慧便正式擊敗人類圍棋界的標誌性人物。 機器的再一次勝利引來諸多有關機器道德、人類尊嚴、人工智慧商業化、科技懷疑論等討論;不過從未有人考究過一個最明顯不過的現象——圍棋人機戰的評論員之一雷蒙(Michael Redmond)是世界上唯一的一位非東亞裔的圍棋九段。在現今圍棋為人所周知的世界,為什麼只有一位非東亞裔的圍棋九段?這個現象是不是揭示了圍棋與象棋思維模式本質上的不同?兩種面對「無限組合」的取態
國際象棋和圍棋都是一對一的搏奕,不過這場搏奕從一開始已經註定分道揚鑣的命運。象棋的棋盤有64格,圍棋則有361點,其中蘊涵無數的可能性。 根據美國數學家香農(Claude Shannon)在1950年計算所得,象棋所有可能的步數是10^120步;德國計算器工程師特隆普(John Tromp)計算得到圍棋的可能步數為2.08 x 10^170步。 這個天文數字的組合即使對於電子計算器來說也不可能實踐,更何況區區一個人腦。但莫要忘記創造這兩款棋類遊戲的卻是「有限」的人類,面對不可能計算的深淵式的「無限」,象棋與圍棋分別發展出兩種思維的策略,朝著兩種不同的意識進發。 象棋:一種偏執狂的自我意識「我到現在還是沉溺於西洋象棋。它不但擁有所有藝術之美,還有就是,它不能夠被商業化。西洋象棋比起藝術而言它的社會地位無疑是更純粹的。」杜尚(Marcel Duchamp)是20世紀實驗藝術的先驅,被譽為「現代藝術的守護神」。的確,象棋的搏奕講求純粹的計算而沒有銅臭味,不過將之升華到藝術之美的層次,則等於否認其隱藏在規則背後比商業化更純粹的「殺機」。 象棋反映的是「生存還是死亡」的價值觀,棋局的目的是單一直接的「勝負」概念,對與錯在象棋的系統中是有絕對價值的(absolute value),就是透過不停的吞噬對方棋子直至「將死」(checkmate)對方結束。玩家的任務是思考策馬從斜刺跳出踩踏八方、驅車長途奔襲控制兩線又或是「兵的升變」,從棋本位出發計划下一步行動以刺王殺駕。 這種非勝即負的二元對立思想其實是一種特別的「自我意識」顯現,要了解這種自我意識就要從棋盤的設計開始談起:象棋的棋盤在棋局初始便包含了32隻功能不同的棋子,每個棋子有它獨特的規則(rule),而棋手依據這些法定的規則去進行攻防。棋子的「身份」是不能替換的,除了在兵的升變可以有一次身份轉換的可能之外,但棋子有身份這個事實本身不能被否認,象棋棋子這種帶有個人特色的形而上取態就有如今天西方人講「個人主義」——我可以為社會的進步出一份力,但首先,你得先讓我享受我的「自由」、我的「人權」。 試問,如果不放棄自我的身份能夠帶來真正的社會進步嗎?我們不要走太遠,象棋這種「自我意識」同時表現在毀滅對手的自我意志(will to destroy)當中,棋手不可避免地落入「我者/他者」的對立當中,「我」的任務是要碰撞「他者」然後將其摧毀、「我」要成為皇者、「我」要精密計算每一下殺著……「我」「我」「我」;這個不停自我複製的過程只會導致病態的自戀,將重點轉換成摧毀一切來擺脫對「無限」的恐慌,結果還是一場零和遊戲。 無怪深藍面對這種線性的(linear)、單一的計算思維模式可以在編程還不算髮達的90年代擊敗人類。然而,將零和遊戲演繹到極致的思維又如何容得下「圍棋中的精神「?
圍棋:揚棄自我的辯證思維 圍棋大師吳清源說:我認為,圍棋是一種和諧的狀態。它的重點不在於競技或爭勝負,而是調和。由一枚一枚講究均衡的棋子最後所構成的一盤棋,便是建立在和諧的基礎上……其實圍棋之道就像中國的陰陽五行,做得不好就會相剋,做得好就相生兼容,「21世紀圍棋」就是要相生兼容。這個「相生兼容」用得很好,真正點出了象棋與圍棋本質上的不同:圍棋追求的不單單是「吃子」,如果依照象棋的邏輯只顧廝殺對方,圍棋只會有一個結果——輸棋。 了解圍棋的第一步便是揚棄象棋那種「自我意識」,圍棋的棋盤本來就是「空」的,黑子白子本質上是沒有功能的,是無調性的(atonal),所以落子便會有「輕、重、厚、薄」之分,下子時信手拈來,只有當它在棋盤的搏奕當中才被賦予身份,「敵我對立」在圍棋中得到辯證的統一,因為黑子白子沒有先在的功能而只有抽象的「氣」的概念,當搏奕開始白子黑子同時存在於棋盤上時,才能具體化整個「空間」概念。而這個空間並不像象棋那種唯我獨尊的空間,圍棋容許「公共空間」的存在就是所謂的「雙活」——黑白雙方誰也圍不住對方共同存活的狀態,而這個「空間」並不屬於任何一方,一個消融了對立的「純粹空間」在象棋的世界裡是不能被理解的。 圍棋是用辯證的思維(dialectical thinking)進行計算,這種辯證的思維最能表現在圍棋部分與整體的關係(part-whole relationship)之中:邊角上的死活雖是局部的處理,但死活之爭只是手段而不是目的,由死活帶到「脫先」,由部分到全體局勢的發展才是圍棋之道。 圍棋有一種特別的叫吃方法——「劫」,提掉對方一子之後,己方所落子即使僅剩一氣,對方也不能立即落子提回,必須要在其他地方落子等到下一手才能再提。與一般的死活不同,劫的巧妙運用可以帶來棋局的轉變契機,在「尋劫」「打劫」「應劫」「消劫」重複性落子的搏奕中,靠著一子的距離爭取有利的一手扭轉局面。
由劫的概念引申出圍棋獨有的生死觀,循環式的、周而復始的,由空無一物的棋盤開始,黑子白子此起彼落的出現,一方「提子」並不代表過程的完結,而是被提的一方可以重新「落子」在被提位置發展下一步的攻防。每一粒棋子的角色是相對於中國棋聖聶衛平所謂的「大局觀」而言,即只有在圍「地」的前題下衡量棋子才有份量,同樣地,每一粒棋子也反饋到大局的布置中。 所以圍棋言「勢」,經驗老到的棋手下棋時都有一種「棋感」,簡單而言就是「落子」之時不可能將所有可能步驟都計算一遍,而是依靠「直覺」(intuition),一種對「勢」下判斷的能力,是一種對抽象「地形」的直感;所以「神之一手」不是殺敵的一著,而是看似「莫名其妙」的惡手棋可以在二十手後發揮轉逆的效用。「棋感」對於象棋來說是範式錯誤(categorical error)的形容詞,因為象棋不是以發展觀思考大局,而是以機械式的計算執行任務。 從西到中的範式轉移 象棋囿於「自我意識」的思維而無法揚棄身份去進行更高層次的搏奕,無怪在象棋還是主流的西方國家只有極少數的高段位圍棋棋手。 這種揚棄身份的舉動並非一個單純的視點轉換(change of perspective),而是哥白尼革命式的範式轉移(paradigm shift)——世界觀的轉變。
由揚棄「自我」到看見「氣」「公共空間」「大局觀」和「勢」,是需要從根本上改變自己的。那是否意味著東方的思想比西方更值得學習? 由西方而來的逆襲 諷刺的是,兩次人機大戰的編程人員都來自西方。吳清源說「下圍棋就是兩個人接連地犯錯誤,犯得大的、犯得晚的輸棋。」中西的搏奕不單從棋盤上有之,在現實生活的較勁也是比誰犯的錯較大,是時候來一個倒置,重新思考一下中西思維的問題癥結——深藍與阿爾法狗的出現是否意味著西方人對把握東方思維精髓的能力已經超越東方人? 即使只有雷蒙,唯一一位非東亞裔的圍棋九段,也不能忽視設計阿爾法狗的是英籍的哈薩比斯(Demis Hassabis)。比起強調中西思維的異同,我們更應該「三省吾身」,重新發掘自身文化的價值,「西方的精英階層是否從基本性上把握了東方思維的精髓,而我們卻在一步一步遠離自己」,顯然是一個更迫切的問題。 知識點:從象棋到圍棋,下棋程序的關鍵之一即是如何減少計算器需要考慮的棋步。當年IBM深藍國際象棋程序,靠的正是在30個IBM RS/6000處理器的並行計算器上運行的搜索法。簡而言之就是允許忽略一些未來不會發生的事情,這種演算法也稱為剪枝演算法。而AlphaGo的圍棋之役,由於棋盤是19x19,幾乎所有的交叉點都可以走子,初始的分支因子為361,這對於常規搜索法來說太令人生畏了,AlphaGo採用的是蒙特卡洛搜索樹(MCTS),它是一種隨機採樣的搜索樹演算法。把大量矩陣數據作為輸入,通過非線性激活方法取權重,再產生另一個數據集合作為輸出。這就像生物神經大腦的工作機理一樣,通過合適的矩陣數量,多層組織鏈接一起,形成神經網路「大腦」進行精準複雜的處理,就像人們識別物體標註圖片一樣。 單純從計算的角度來講,國際象棋棋盤上共有8行8列,構成64個格子,而圍棋棋盤上共有19*19總計361個點,也即意味著國際象棋有10的7次方種變法,而圍棋的變法達到了10的100多次方,從數字上看差別確實很大。AlphaGo此次不僅在棋譜大數據儲存、計算能力上比深藍要高出許多數量級,而且機器原本擅長發現數據間的相關性而非因果性,AlphaGo在深層機理方面的變化,以及「計劃」方面都有大幅提升。
(賴俊夫 撰寫)
推薦閱讀:
※讀書人的思維到底出了什麼問題?
※形成一種思維
※羅爾事件——提升你理性的一次好機會(1)
※量化思維,幫助你更好決策
※推薦一些邏輯思維能力方面的書?