標籤:

王路:阿爾法狗,阿爾法元,阿爾法人

昨天看了AlphaGo Zero(阿爾法元)的新聞,有很多感想。這些感想中,絕大多數,和大家差不多,就不再重複了。製造冗餘信息,是一種罪過。所以,只聊聊剩下的。

1、

阿爾法元是靠跟自己下棋成長起來的。人類也是。阿爾法元達到目前人類的棋力,只花了3天時間,大約70小時,下了490萬局。很多人說,阿爾法元3天,超過了人類3000年。我想補充一種視角。整個人類歷史上,下過的所有圍棋局數,也就是數百萬的量級。如果針對個體看,比如柯潔,他看過的所有盤數,不會超過10萬局,目前人類的頂級棋手,一生最多看過的局數都沒有超過10萬。相當於阿爾法元的五十分之一不到。從這個意義上講,人類的學習能力,不能說是很弱的。

整個20世紀,人類棋力進步的幅度超過了此前兩千年。但這麼比沒有意義。之前的人類圍棋,缺乏交流傳授的機制。很多前人走過的路,後人要從頭再走一遍。這就好比,把阿爾法元放到70台機器上,每台跑1小時,和放在1台機器上跑70個小時,是沒法比的。

阿爾法元達到人類頂級水平,用了70個小時。如果我們把它比喻成一個人,70個小時看作70年。會發現,這樣的進步方式,在人類社會,是行不通的。——你按照這種成長路徑,可以在70歲時,成為人類頂級高手。但你在50歲以前,始終要人被虐,以至於根本不能進入圍棋圈子。

阿爾法元幸運在哪裡呢?它被允許在50歲以前很笨。——縱然很笨,它仍然可以堅持既定路線,按照自己的方式去成長。如果是一個人,你在30歲,還比不上同齡人,你就被社會淘汰了。社會不會等你到70歲。所以人類學棋,從小就要背棋譜、學定式。你要先拿到門票,才能走上這條路。你要先向時代妥協,等本事大了,再試圖掙脫時代束縛,去克服時代的局限性。想上來就克服時代的局限性,就會先被時代克服掉。而一旦你先向時代妥協,就勢必染上時代氣息,後來再想克服時代的局限性,就很難了。——時代的局限性,已經成了你的局限性。不過,你可以生個兒子,克服你所在時代的局限性。

這就是為什麼阿爾法狗要花幾千萬局戰鬥經驗,才達到人類水平,阿爾法元只花了幾百萬局。其實,有很多圍棋軟體,在最初設計時就考慮過完全不用人類棋譜,結果根本不行,上來就被人類打的稀里嘩啦。阿爾法元為什麼可以?因為阿爾法元是從阿爾法狗來的,它雖然是一張白紙,但白紙的質地上,帶著阿爾法狗的基因。這就好比,阿爾法狗先向人類學習,拿到門票,又生個兒子阿爾法元,克服了人類的局限性。

2、

阿爾法元很幸運:在他能夠打敗對手之前,始終是靠自己跟自己下棋來成長的。這就避免了,一些很好的苗頭被扼殺在搖籃中。最開始,它是不會征子的,它可能過了十個小時以上,才慢慢學會征子和點三三。如果人類棋手,學棋十年才會征子和點三三,老師早就讓他改行了。但阿爾法元並不因此吃虧。因為他的對手和他一樣,也是慢慢學會征子、點三三的。如果一開始對手就是人類或者阿爾法狗,就會因此被痛虐。為了應付人類,它就會放棄一些可能發展很好的下法,被人類帶著走,受到人類下棋模式的染污。

這就好比,一個創業公司,哪怕別的方面很強,很先進,就因為融資能力不行,就要被淘汰。它沒有辦法活下來。因為活不下來,那些先進的地方,也會隨著它的死掉而死掉。

再比如,一個孩子很有物理天賦,完全有潛力成為一流的物理學家。前提是,他要進入好的大學。但是,他的英語不好。因為英語不好,他連一本都考不上。假如他的競爭者英語和他一樣差,他就可以靠物理的優勢,進入好的大學,成為物理學家。他最終沒有成為物理學家,並不是因為他的物理不行,而是因為英語差,拖了後腿。

這個世界上,很多人不能充分發揮天賦,是因為不能像阿爾法元那樣,始終成長在自己和自己競爭的環境里。人類社會,面臨的是和別人競爭。你為了成為物理學家,要把很多精力花在補英語上。很多時候,我們要首先關注自己的短板,而不是發揮自己的長項。從短期看,和他人競爭會讓自己在一開始時少吃虧;但從長期看,它會制約成長速度。

現在很多基礎學科,人才流失很嚴重。如果一個人智商很高,十分適合去研究基礎數學、物理。但是他會轉行搞金融、計算機。因為來錢更快。我們活在世界上,要和別人競爭。如果搞基礎研究,能拿到熱門領域待遇的話,整個世界的科學進步會更快。這就是為什麼,阿爾法元進步比阿爾法狗快。

有人講,阿爾法元的例子,是不是說明,我們以後做研究就不用寫文獻綜述了?阿爾法元表明,可以在一個新領域內從一張白紙出發,做到頂級水平。

但是,這有個前提,就是你要活得足夠久。比如說,你從零開始研究物理,起步是阿基米德時代普通人的物理水平,不受人類歷史上一切物理學家的影響,獨立研究。你完全有可能在第1000年或者2000年的時候,研究出來超過人類現在水平的成果。但問題是,你在活到100歲之前就死了。阿爾法元成功的前提是,戰鬥經驗超過這世界上任何人類50倍以上。它在10萬局經驗內和人類對弈,是要被吊打的。如果你可以保證你的壽命是一般人的50倍,你可以不寫文獻綜述,不基於別人的任何研究。

還可以延伸到其他事上,比如婚姻。「門當戶對」很重要,或者說:旗鼓相當。這樣,彼此能夠共同成長,誰也不嫌誰幼稚。如果出發時兩人就認知相差太遠,有依附與控制的關係,對誰的長遠發展都不會太好。

3、

再說定式。實際上,沒有什麼定式。在阿爾法元70小時經驗里,沒有任何定式是一開始就有的。一切定式(我們把對局中出現概率大於某個數值的下法組合叫定式),都是到了某些時間節點才出現的,慢慢達到峰值,又漸漸下降,在某個時間節點後,漸漸消失。

這和人類定式發展的過程差不多。100年前的定式,現在有很多淘汰了,有些還保留著。保留至今的,也不代表一定成立,只是壽命比那些淘汰掉的更長一點。如果某個定式壽命超出了一代人,從你學棋的時候,就知道它是定式,等你死的時候,它還是定式。你就可能認為這個定式是天經地義的。實際上,可能再過兩年,它就不成立了。

所謂定式,只是當對方棋力在某一水平區間內時,你按照這個套路下,不容易吃虧。一旦對方棋力突破了那個區間,舊有的定式就廢掉了。我們看古代讓子棋的很多下法,現在是不成立的。這種不成立,是在現在的人類棋力下不成立。古人當時那麼下,考慮到對手的水平,用這個套路欺負他,是沒毛病的。

我想從定式聊聊佛教。佛教有八萬四千法門,可以看成八萬四千定式。每一種定式,都有它適合的契機和土壤。過去的人可以靠某個法門成佛證果,現在的人就不一定行。因為任何定式,都有它適用的條件和環境。如果有永恆的定式,佛陀只需要說一個法門就夠了,沒有必要開演八萬四千法門。

有些聲聞乘修行者,不承認大乘佛教,認為大乘不是佛說的。這就好比,阿爾法元在前30小時里沒有出現的定式,就認為它不成立。佛教有個詞叫「聖言量」,釋迦牟尼佛說過的,就叫聖言量。實際上,不止釋迦牟尼佛說過的才叫聖言量。其他人只要證到聖果,說的話,也是可以作為依據的。阿羅漢、八地菩薩也是聖者,他們的話,也是可以作為依據的。如果認為,只有釋迦牟尼的話才叫聖言量,才是唯一的依據,就否認了其他眾生也可以修行成佛,否認了過去未來十方諸佛的存在。

釋迦牟尼佛有些東西沒明講,是因為他在娑婆世界只示現了80年世壽。但不能僅僅通過80年的有限示現,去理解他全部的智慧。就好比阿爾法元在第40個小時中,不會下出一切定式,很多定式是後來才出現的。《解深密經》說:阿陀那識甚深細,我於凡愚不開演。為什麼不開演?因為當對手在這個水平的時候,很多別的定式是不需要的。到現在,南傳佛教不承認中有身,不承認第八識。理由是沒見釋迦牟尼佛明講過那些定式。不過,雖然不承認中有身、第八識,但也承認「有分心」,靠「有分心」建立起三世流轉。這「有分心」,與潛在相續的「細心」、「第八識」等,只不過是定式的不同變化,是並沒有什麼矛盾的。

再比如,念佛法門。如果去考察梵文,會發現「念佛」的「念」,本義是用心繫念,不是口念稱名。有些人就講,中國傳下來的凈土法門搞錯了,錯會了經文意思。這就是不了解,法無定法,「定式」是不斷變化的。過去合用的定式,後來可能就不好用了。最早的時候,念佛是要觀想佛像的,這是此前流行很久,在印度就流行的定式。到了後來,不好用了,照這個定式修,能成就的人越來越少。為什麼?因緣變化了。

「法」有不同的時代:正法時代、像法時代、末法時代。正法時代的定式,到像法時代就不好用了,像法時代的定式,到末法時代也不好用了。據此,道綽法師強調了新的念佛法門,到了善導大師,發揚光大。佛教不是像考古學,過去有的東西,就是成立的,沒有的,就不成立。更像是科學,後起的研究,承續了前人,在表現上有所不同,只要內在精神一致,就是應當信受的。而表現形式不同,正是內在精神一致的必然要求。

今天,漢傳佛教的修行者,一般都說現在是末法時代。但南傳佛教不這麼認為,上座部認為現在是正法時代。這並不矛盾。上座部到現在還流行著傳統而古老的法門。這就好比,針對不同的對手,應該下不同的「定式」。所謂定式,並非一成不變,永恆有效。

4、

阿爾法元在官子方面,和人類下法相差不大。這沒有任何疑問。因為官子是一種有固定解的題目。既然有固定解,誰下都差別不大。但阿爾法元在布局方面,和人類相似,可能說明兩點:1、阿爾法元的布局還沒有達到最高階段。2、人類很聰明,在沒有達到阿爾法元棋力的時候,就可以下出和阿爾法元接近的布局了。

如果在人類內部,比方假定,中日韓的圍棋,不能進行任何交流,各自封閉發展一段時間,棋力應該會出現明顯的高下之分。但這並不意味著,彼此下棋天賦有差距,而意味著其他變數的差別。一旦放開交流機制,彼此棋力就會漸漸趨同。因為,人和人在構造上,差別是很小的。而人類和人工智慧,棋力不可能趨同,因為彼此的構造不一樣。

不過,由人類研發的不同人工智慧,未來有一天,會達到同樣的棋力水平,那個時候,就接近了圍棋的終點。也就是說,人類是可以窮盡圍棋的。人類窮盡圍棋,並不能靠自己死下,而是要藉助人工智慧。當圍棋被窮盡的時候,也不是人工智慧窮盡了圍棋,而是人類窮盡了圍棋。

阿爾法元雖然目前棋力已經高出人類很多,但並不是圍棋的終點。什麼時候會是圍棋的終點呢?可以從兩方面看,一方面,棋力最高的人工智慧自己跟自己下,勝負完全取決於執白執黑,就接近圍棋的終點了。

另一方面,不同的圍棋軟體,給定某個局面,會下出非常接近、甚至一樣的下法——不是說某一手的下法,而是說隨後到終局的序貫下法,那就接近圍棋的終點了。為什麼說「接近」呢?因為,能不能給出一致的下法,主要取決於給定局面進展到什麼程度。越接近收官,越容易趨同;在布局階段就下得一樣,是不太容易的。假如說現在的頂級圍棋AI,平均在100手的時候,能夠給出一致的判斷,未來會慢慢變成50手,甚至20手,10手。如果在給定任意10手的情況下,不同的圍棋AI,能給出完全一致的勝負判斷。就是說,下十手,棋就結束了,勝負已定。我們可以說,窮盡了圍棋。

5、

現在很多文科博士不好畢業。很多文科博士很累,並不是因為需要你有多聰明,而是需要你看很多文獻。這樣的工作,是可以被人工智慧取代的。有了資料庫,我們做學術和古人做學術就很不一樣了。清朝的乾嘉學派做了很多考據工作,那些工作如果交給AI做,很快就完成了。那些人如果生在今天,就會不幸一些,他們博聞強識的長處,沒有辦法發揮得淋漓盡致。我們照著過去的路子做學術,很多時候就不再能走得通。很多人想,過去的大師有什麼稟賦,如果我也有,就可以達到跟他一樣的高度,這是不會的。稟賦要跟時代結合起來才有意義。吳承學老師寫了一篇《微信上的萬里校書記》,放在過去,是不可以想像的。過去誰做了這樣的工作,非常不容易。今天,完全有可能一個文科博士,花了七八年時間做好一篇博士論文,在他快寫成的時候,人工智慧介入,半個小時完成了同樣的工作。

人工智慧的介入,會給很多職業帶來衝擊。很多人首先想到的是一些體力勞動者,比如送外賣,裝卸貨。實際上,難道寫論文就不是體力勞動嗎?體力勞動在博士研究生的工作中,佔到了很大的比重。很多時候你能做出成果,不是因為你比別人更聰明,更有洞見,只是因為你比別人更勤奮,更走運,有機會見到別人見不到的材料。

我的職業寫作,人工智慧也很容易介入。現在人工智慧已經可以寫新聞稿,寫地震報道、財經稿件。很快,也能夠寫流行雞湯,隨筆散文。今天,還有很多新媒體從業者報名學習「如何寫出10萬加的文章」,明天,人工智慧就可以批量生產10萬加了。不過,這並不會對業已賺到錢的人造成太大打擊,因為他們已經賺到錢了。很少有什麼錢可以賺一輩子,如果有什麼錢可以賺一陣子,又合理合法,就非常不錯了。

這種變化,從根本上講,並不是人工智慧帶來的。任何事情,都有它的生命周期。即便沒有人工智慧,像學京劇、吹嗩吶、說書,這些行當也慢慢不行了。但它們的變體仍然可以在新的時代找到新的適應方式,比如當演員、談鋼琴、講脫口秀。有些定式徹底廢棄不用了,有些定式局部做了改進,演化出新的變化。

有種說法,未來的時代,人人都得會編程,不會就是廢材,會被淘汰掉。有人三四十歲了,聽到這話,趕緊去學編程。這是沒有必要的。為什麼呢?因為即便到了那個時代,你也已經死掉了,至少是退休了。所以完全不用擔心。

我們不需要與人工智慧賽跑。就好像老虎要吃人,我們不需要比老虎跑得快,只需要比周圍人跑得快,就不會被吃掉。如果你周圍很多人都不會編程,你有什麼好害怕的呢?如果把50歲的孔子扔到現在,他也會很麻煩,很多東西,他已經很難再掌握了。他會出現很難與時代適應的問題。但如果是把10歲的孔子扔到現在,就一點問題也沒有,他會適應得很快。所以,我們的最大問題,並不是不懂什麼,而是不再年輕,不再了解新一代人。不過這個問題也不要緊。

只要我們不比周圍的人跑得慢,就無需太過擔心。有些人什麼都不會,只會種地,人工智慧來了,他們就要受苦了嗎?不。從另一個角度看,他們要享福了。人工智慧要幫他種地了。他就可以躺在家裡因為失業而領國家補貼了。雖然發不了財,但相比付出來講,還是不吃虧的。

只要我們能大體保證和周圍人一樣的節奏和步伐,就完全不用擔心自己變成廢材。變成廢材的唯一路徑是,活得足夠久——活到別的不適應新時代的人都死了,自己還沒死,就真的成了廢材。但鑒於自己不可能那麼長壽,所以廢材的問題自然而然解決了。

有人否認這一點。他們認為,人工智慧會帶來天翻地覆的變化,此刻的人類正站在節點上。未來,永生是可能的。這個觀點,就牽涉到另外的話題了。我並不想做更多的說明,只想簡單說一句:以佛教的看法,並沒有什麼永生和死亡,有的只是,新東西不斷替換掉舊東西。

未來會阿爾法元統治世界,人類變成乞丐嗎?不會的。未來世界的統治者,即便不是人類,也不會是人工智慧,只會是智能人——人類的智能後代。唯一的問題是衰老,如果持續地衰老下去,就會淪為乞丐。但死亡替我們解決了這個問題。而死亡,正意味著新生。

推薦閱讀:

在我們的日常生活中,那些事或細節體現了我國13億人口所帶來的便利和不便之處?
30不立 - 後經濟危機時代美國苦逼的8090後 (1)
為什麼有人掏耳朵的時候,不自覺的會閉眼?
丟書大作戰,我在7年前丟了第一本書

TAG:生活 |