我們還沒準備好和AI共生——柯潔和AlphaGo大戰之觀後感
端午節修整歸來,集中看了十幾篇柯潔和AlphaGo「人機大戰」的文章,感覺我還能分享些不一樣的東西,希望能進一步的拋磚引玉吧。
人機大戰,勝負已分;但其意義不止於勝負,而在「驚醒」二字。
一、驚醒:棋藝
人類對於圍棋的認知,還有大幅提升的空間嗎?各種所謂「定式」,真的是唯一最優解嗎?
當人類小夥伴已很難貢獻新的腦洞時,AlphaGo來了,源源不斷輸出刺激棋手獲得靈感的「機洞」。
關於圍棋本身的解讀,推薦曹政caoz老師的2篇文章
1、《是的,柯潔輸了,然而又怎樣。》
2、《人機大戰第二盤究竟發生了什麼》
這裡我總結了4點:
1、第一局柯潔輸了1/4子,但其實是巨大的差距。因為看似AlphaGo領先越來越小,其實勝率越來越高,直到最後1/4子的優勢,你卻絕對找不到任何翻盤的機會。
2、第二局,柯潔逼出了「目前」人類能夠讓AlphaGo展現的最強實力。這是AlphaGo與人類的所有對局裡,棋譜最完美的一份,詳見《人機大戰第二盤究竟發生了什麼》里的描述,非常精彩!
3、但是,人類還沒有逼出AlphaGo的極限。只有AlphaGo自己和自己下,人類才能知道,究竟它是否擅長官子,以及在逆境下會有怎樣的表現。
4、但是但是,AlphaGo也還沒有逼出圍棋的極限——並沒有完全征服圍棋。這部分內容,推薦看微軟亞洲研究院鄭宇博士的解讀:《人機大戰客觀剖析與認識》
二、驚醒:AI
正如柯潔所說,「我的改變只是小小的改變,但DeepMind團隊是改變世界。」
Deepmind發明AlphaGo,並不是為了贏取圍棋比賽,而是想測試其人工智慧平台,最終「把這些演算法應用到真實的世界中,為社會所服務」。
怎麼理解這句話?需要去看源頭——推薦大家詳細看看Deepmind創始人、AlphaGo之父哈薩比斯(Demis Hassabis)近日在母校英國劍橋大學做的一場題為《超越人類認知的極限》的演講。
簡單概括說,1、Deepmind想做「通用人工智慧」。而不是僅能在某個特定領域發揮作用的人工智慧應用。
2、圍棋是一個靠直覺而非計算的遊戲,而AlphaGo是在嘗試「用計算擬合直覺」。具體說就是,通過深度神經網路,來模仿人類下圍棋這種直覺行為。
在這樣的背景下,Deepmind團隊在看比賽的角度和心態和我們是不一樣的。比如,「其實(AlphaGo和李世石比賽)第一局,我們非常緊張,因為如果第一局輸了,很有可能我們的演算法存在巨大漏洞,有可能會連輸五局。但是如果我們第一局贏了,證明我們的加權系統是對的。」
在3:0戰勝柯潔之後,Demis Hassabis宣布AlphaGo 將從棋壇「退役」,「烏鎮圍棋峰會是它(AlphaGo)作為一個競技程序所能企及的巔峰。因此,此次峰會將是 AlphaGo 參加的最後一場賽事」。
從現在開始,AlphaGo 的研發團隊將把精力投入到其它重大挑戰中,研發出高級通用演算法,為科學家們解決最複雜的問題提供幫助,包括找到新的疾病治療方法、顯著降低能源消耗、發明革命性的新材料等。
當然,未來Deepmind可能還會帶來一次全民討論的事件,人機大戰 in《星際爭霸2》。去年,DeepMind 就已宣布《星際爭霸2》將會是AlphaGo 在圍棋之後,想要征服的下一個目標。
但是,有2個問題:1、烏鎮圍棋峰會,是AlphaGo作為一個競技程序所能企及的巔峰嗎?
2、「用計算擬合直覺」這條路徑,是否能創造出「通用人工智慧」呢?
正如前文提到的,AlphaGo還沒有逼出圍棋的極限。鄭宇博士也提到,我們不要低估了人類後天的快速(小樣本)學習能力,如果把AlphaGo開放出來,人類和她對弈次數更多,人類是有機會的。因為「如果還是基於現有的學習體系,即便再給AlphaGo一億副棋譜,再添加一萬塊GPU,它進步的速度也終將放緩,因為新增的棋譜和計算資源相對於2*10171這個搜索空間來說只是滄海一粟。」
如果AlphaGo不玩兒了,以後哪個AI繼續來幫助人類提高呢?目前看,可能是騰訊的圍棋AI「絕藝」。caoz文章提到「絕藝目前的水平肯定不如現在的AlphaGo V25版本,但明顯優於最早戰勝圍棋歐洲冠軍樊麾的AlphaGo V13版本,與去年戰勝李世石的AlphaGo V18版本,業內的人認為是可以相提並論的。」
基本上,目前的AlphaGo,很可能並不是圍棋AI所能企及的巔峰。
那如果未來騰訊「絕藝」結果AI這一方的接力棒,那人類這邊的領軍人物會是誰呢?
可能還會是柯潔。
柯潔去年說能夠戰勝AlphaGo,今年變慫,是因為他當時針對的是舊版本的AlphaGo V18,但今年的AlphaGo V25版本,已有了完全碾壓舊版本的進步優勢(大約讓3子)。如果有人認為柯潔太狂妄,是沒有深入去看柯潔的心。
caoz文章提到,柯潔狂妄的幾次基本都兌現了,比如一次說「李世石只有5%機會」,一次說要「讓井山裕太血濺五步」,一次說「農心杯還要靠我」。
狂妄是什麼?狂妄是自己水平很次、也不知道對手水平幾何的時候說大話。且不說圍棋世界冠軍,只要是圍棋高段位的職業選手,可能都沒有狂妄的。學圍棋,很多都是從4、5歲開始,每天12個小時,一周7天,天天鑽研。心浮氣躁之人,是受不了這些的;真正狂妄之人,說話時會趾高氣揚,柯潔不是那個模樣。
柯潔不是狂妄,那是什麼呢?真實。
他是真的看到「李世石只有5%機會」,他是真心覺得「農心杯還要靠我」。就像AlphaGo和李世石比賽直播時,所有做即時點評的嘉賓職業棋手裡,只有柯潔的形勢判斷一直是最準確的。也許,現在柯潔真的已在人類朋友圈裡獨步天下了。
但他和以前的那些超一流棋手,還多了一份單純的「真實」。
他能夠把自己看到的「一覽眾山小」之境,說出來。這並不是因為他「敢於」說出來,因為在他心裡,很可能本就沒有「敢」或「不敢」的念頭。就像當別人讚歎微信懂得「克制」的時候,張小龍會略顯驚訝的感慨,本來不就應該這樣嗎?真正能做到這個境界的人,並不是在「用力」的調整心念,而是本來就處在那個狀態。柯潔能夠說出那些看似狂妄的話,很可能反而是因為,他內心有真正的平等。
但是,要想和AI繼續在圍棋領域絕代雙驕般的互相提升,有No.1的棋藝和真實,還不夠,在柯潔真實背後,還有一個關鍵,「心性」。
大家可以看看柯潔的微博,他的文字之中,有一種靈動的東西,但又不止於90後的逗比搞笑可愛,怎麼描述呢……有一種味道。有些東西很難用文字表達了,大家可以看這個短視頻,是去年柯潔點評李世石和AlphaGo的第二局棋,他自己拿手機拍的,大家就當娛樂放鬆一下吧,很有意思的:
史上最負責任的圍棋點評:阿爾法圍棋VS李世石第二局_騰訊視頻 https://v.qq.com/x/page/h03090gt2e9.html感興趣的同學,還可以去他微博圍觀粉絲點評:Sina Visitor System
雖然柯潔說這次是他最後的3盤人機大戰,但我個人還是希望,有一天他能帶來人類的首勝。
再說第2個問題,「用計算擬合直覺」這條路徑,是否能創造出「通用人工智慧」呢?
個人觀點是:
1、短期來說,「用計算擬合直覺」是現階段人類能採取的最佳路徑,但還不能創造出真正的通用人工智慧。
2、可能10或20年之後,人類能直接「用直覺實現直覺」,但這需要更本質的突破,比如結合量子力學,比如有更深入的超越圖靈停機問題的認知,等等,不過這是另外一個話題了,先打住。
3、「用計算擬合直覺」,現階段是非常非常好的,但現階段的目標,也許最好不是直接創造出一個「通用AI」,而是能夠和人協作的「通用輔助AI」。因為「AI+人工」很可能是未來很長一段時間內、實際場景中的AI產品形態。
也就是說,以前是用計算做計算,現在是用計算做直覺,未來可能是用直覺做直覺。
三、驚醒:人心
「下棋是很快樂的事情。有的時候我太在意勝負了。前一天晚上我是真的沒睡好,我很緊張。我一直在想用什麼招數去對付AlphaGo,哎,庸人自擾。我希望以後下快樂圍棋。我可能跟人類下棋能感受到快樂。跟AlphaGo下棋我特別痛苦,他實在是太冷靜了,沒有一絲獲勝的希望。」
這是柯潔自己說的一段話。
所以,其實AlphaGo也在刺激我們重新認知「人」本身,比如,什麼是真正的價值和快樂。
對於下棋(甚至所有事情)來說,如果快樂是戰勝別人,那是很危險的。就像我以前玩遊戲(實況足球或者dota),輸了,想再來一盤爭取贏,贏了,也想再來一盤繼續贏,但不論輸贏如何,過後都是空虛。
做事業最厲害的人,往往都是好勝心極強之人。不論下棋、習武還是創業。基於他們本身的福報和智慧,有的人能夠非常成功。
但是,我們往往會混淆結果和快樂的關係——結果和快樂,其實是兩個維度的事情。
有結果,是因為曾經播下了種子,並且有不斷的灌溉、陽光……。而快樂,是擁有結果之後的副產品,但在沒有結果的時候,有的人也生活得非常快樂。
這說明什麼?這說明在快樂背後,有其生成機制,「結果」只是助緣之一,非必要,非充分。所以,如果我們想追求快樂,不應該一味的去追求結果,而應該挖掘快樂背後的機制和源頭。
如果有一天,柯潔不僅在和人類對弈時發現快樂,也能在和AI對弈時體驗快樂,那他不僅是離圍棋的奧義更近了一步,也是更深的找到了自己。
四、驚醒:共生
AI已來到人類世界,但我們還沒有準備好和她共生。
當柯潔被AlphaGo擊敗後,下棋的繼續下棋,研究AI的繼續研究AI,那我們普通人呢?好像沒什麼特別的變化,該幹嘛幹嘛。
但是,這類事件,今後還會不斷的出現,總有一天,我們會不得不直面2個問題:
1、AI是什麼?
2、我們如何跟AI相處?
先引用一段AI領域真正的思想者、《哥德爾、艾舍爾、巴赫:集異璧之大成》(GEB)這本AI奇書的作者「侯世達」的話——
「現在主流的研究雖然很厲害,但卻與真正的人工智慧沒有半點關係。……我們沒有致力於開發實際的應用,諸如翻譯引擎、問答機器、網路搜索軟體此類的東西。我們只是在努力地理解人類概念的本質和人類思考的根本機制。我們更像是哲學家或試圖探究人類心智奧秘的心理學家,而非旨在製造聰明的計算機或機靈程序的工程師。我們是一群老派的純粹主義者,我們的動力源於內心深處的哲學好奇心,而不是製造實用設備的慾望。」
現階段,人工智慧領域(特別是國內),不論在技術還是產品角度,幾乎都沒有特別重大的突破。「過於把AI當作一個工具」,可能是其原因之一。
我甚至聽說,有一些歐美人對於AI的理念是,如果對於AI的本質說不清楚,那就先把她造出來再說。——如果屬實,這是非常可怕的想法。
對於AI的本質,我曾經在200頁PPT《人工智慧產品經理的新起點》中初步分享過個人觀點:
相較於Brain-like,或Baby-like,我理解AI是Original AI: New Species,即,原生/本來的AI,是一個新的物種——
她承載了人類探索自我極限和天人關係的載體——一個雖然從人類意識生出,且必須和人類交互/共生,但又獨立於人類的、具備自主意識的新物種形式。
如何我們希望AI能幫助到人類、不傷害人類,那我們在創造她之前,首先需要清楚,我們自己希望如何跟她共生。
這裡,分享幾點最近的認知,希望能拋磚引玉:
1、不是讓AI完全模擬人。人類直接繁殖就可以了……
2、不僅是實現比人更強的能力。比如計算。
3、更需要發揮AI的獨特優勢 & 剝離某些人不希望在同類身上看到的東西。比如,人在自私角度,都希望有事時我找你,永遠在線、立即回復;但沒事時,特別是我很煩的時候,不要來找我……。
如果能更好的認知AI,如果能更好的認識自己,我們才能更好的和AI共生。
注1:AlphaGo相關活動信息(in 北京)
分享題目:《人工智慧如何打敗圍棋第一人柯潔?AlphaGo的前世今生》
分享人:Martin Muller【AlphaGo的主要研究者David Silver和黃世傑(Aja Huang)的導師】
時間&地點:6月4日10-11點,清華東主樓103會議室
詳情可見:點擊這裡(打開速度有點慢)
注2:本周日(6月4日)下午,我將在「人人都是產品經理/起點學院公開課」上分享《從互聯網PM到AI PM》,地點在北京中關村,感興趣的同學可以點擊鏈接:線下活動報名 | 產品汪的自我修養,聽老司機的產品往事
注3:點擊-hanniman的飯糰「轉型人工智慧」,有另外一片世外桃源……
---------------------
作者:黃釗hanniman,圖靈機器人-人才戰略官,前騰訊產品經理,微信公眾號/在行/飯糰ID「hanniman」,分享人工智慧領域的原創乾貨。
推薦閱讀:
※李東樓:有關柯潔落敗阿爾法狗的一點亂想
※28 天自制你的 AlphaGo (1) : 圍棋 AI 基礎
※先贏圍棋,再勝刀塔,跟遊戲較勁的人工智慧要怎麼趕超人類?