如何評價第一局比賽 AlphaGo 戰勝李世石?

本題已收錄至知乎圓桌 ? 對弈人工智慧,更多關於李世石對戰人工智慧的解讀歡迎關注討論。

相關問題:如何評價第二局比賽 AlphaGo 又戰勝李世石? - 人工智慧


謝邀。

只知道一些基本的圍棋現象,藉助解說能稍微看懂。對比賽中局面的評價請參考其他回答。

其實跟我比較熟的人都知道我一直算是堅定的DeepMind吹。很多朋友了解DeepMind是通過他們奪眼球的宣傳。從谷歌巨資收購一個只有幾十個PhD,沒有任何產品的公司,到用Deep Reinforcement Learning做出打遊戲超好的AI,剛剛又在圍棋上戰勝了世界頂尖的選手。

因為關注方向的差異,我對RL這一線吸引人眼球的工作其實不太熟悉,反而是從DeepMind的其他工作中總是能看到他們獨特的地方。機器學習發展了這幾十年了,模型,理論,應用都有巨大產出,但是很少有這樣的團隊,能在同一個地方,聚集大量各個不同子領域的一線研究者,考慮將這些不同派別的方法論(有興趣的可以看這個視頻https://www.youtube.com/watch?v=B8J4uefCQMc)不論高低貴賤地試圖結合起來解決一些重要的問題,這是非常難得的。大新聞方面,如之前的DQN,用深度卷積神經網路(CNN)參數化Q,和這次alphaGo中的value network,用CNN在傳統MCTS中做局面評估;更學術一點的,13-14年DeepMind自己及合作的幾篇工作中,用神經網路替代傳統變分推斷中的variational distribution, 在手寫數字識別中大幅改進了半監督學習的性能(一種數字只用10張圖片訓練就能在測試集上取得約3%的錯誤率)。除此之外DeepMind在ML各個會議上還有相當多高質量的工作,大家不妨也可以關注一下。

關於這個裡程碑的credit,一方面是給人工智慧,機器學習這十幾年的快速發展,另一方面也如 @田淵棟 所說:

「在成功背後,是作者們,特別是兩位第一作者David Silver和Aja Huang,在博士階段及畢業以後五年以上的積累,非一朝一夕所能完成的。他們能做出AlphaGo並享有現在的榮譽,是實至名歸的。」

所以寫這個答案的目的,一方面是希望大家在關注AI近幾年大發展大新聞的同時,也把目光更多地投向機器學習的基礎研究吧。(國內做research待遇真心不行啊)

比賽開始之前和幾個小夥伴在群里討論的時候,想起瞭然神的簽名,放在這裡作為結尾:

「科技進化比你我想像的還要快,還要快。我們走在浪潮之巔,我們可以投身其中,我們可以改變世界。我因此永遠激動,徹夜不眠。」—— @陳然


和小夥伴一起從演播室出來,心裡空空落落的。

今早我還在朋友圈說,這將是一個新時代的開端,讓我們一起來迎接吧。

整個比賽直播過程中,我們也始終很輕鬆,但當最終的結果出現後,心還是慢慢的沉了下去。

這將是偉大的一天,雖然甩下了一些落寞的身影。

理性上,大家都知道進步的意義。

也都知道長遠來看,人工智慧的發展不僅對人類生活的方方面面都有積極意義,對圍棋本身也是利大於弊的。

更知道人工智慧戰勝人類頂尖棋手,這一天早晚會來。

可是當這個事實擺上桌面之後,大家感情上都還是有一絲失落的。

從棋局來說,這是一盤精彩的對局,但算不上一盤高質量的對局。

雙方都出現了不少的失誤,李世石的更致命一些。

大家在賽前都認為李世石在第一局會求穩,而可能在贏得三盤之後才會行險挑戰。

我們錯了。

李世石第一局開局就採取了極為冒險的下法,而被很多人解讀為「為了避開電腦的棋譜庫」。

黑棋錯小目配上中國流靠下一路拆邊的下法,是兩種常見布局的糅合,但這糅合體是一個非常不常見,給人感覺也不見得高效的下法。

右上定式中,白棋托角是常見的定式錯著,然而李世石卻沒有選擇簡明的脫先拆左邊,而是強行大飛起來後手撈空,坐等AlphaGo打入上邊。這頗合李世石的性格和棋風。

可打入的結果大家都看在眼裡:黑棋極為被動。甚至很多人當時認為,李世石已經崩了。當然,也有高手經過精確計算後認為,後面的變化黑棋並不差。

後來來看,這是李世石開局刻意的冒險,在試探電腦。

此後,李世石開始「認真」下了,形勢快速的接近了,黑棋越來越主動。

黑61原本走在下一路的長,控制住外側的大局就行了,後面黑棋將越來越主動。然而李世石選擇了61的尖,瞄著上面兩個子的向下跳靠,意圖拿住一個田字斜對角的棋型,將來靠過來之後白棋無法扳頭。然而這步尖可能過於貪心了。

被白棋長了之後64尖住,黑棋根本就沒有機會動出上面兩子......

當然這問題不大,黑棋此時仍然稍稍有利。

白棋一路後推車推至下邊,黑棋搶到先手本可搶先於下側拆邊,然而李世石選擇了完全不符合自己性格的穩健的枷死棋筋。

且不說這步枷的好壞,此時黑棋局面仍然絕對不差。

此時AlphaGo走出了80位的長,補盡了上邊的味道。這是一步大緩手。

黑棋左下雙飛燕夾擊之後,勝負的天枰已經明顯的傾向於黑棋了。

白102,是AlphaGo在不利局面下釋放出的精彩的勝負手。

而白108,是更精彩的手筋,這體現了電腦在局部戰鬥中精準的計算。

白110飛之後,局部黑棋大致已經無法避免虧損。

此後黑121於右上後手吃一子也有緩的嫌疑,李世石明顯還惦記著白棋大龍。

而白122是爭議很大的一手。

很多人當時認為緩了,也有很多人說像是好手。這步棋如果是由人類下出,有勝利宣言的感覺。

此後的黑129拐而不是擋三三,幾乎讓我們所有人驚掉了眼球。

事後至今,仍然有很多人認為這步棋很可能是黑棋最後的敗著。

只要擋三三然後尖二路,黑棋要麼先手收官,要麼局部雖是後手卻官子便宜甚多。這可能優於此前按照尖頂扳粘的方法收束。如此黑棋應該仍然有盤面十多目的優勢。

白142擋住顯然是錯著,按照柯潔的分析,只需跳在一四,黑棋就可能在局部落後手,否則將來白棋有扳了斷,救出上面三個子的手段。

如果AlphaGo下出這個手段,李世石將輸的更快。

後面黑棋始終將左邊看的很小,而在下面和左下走棋,不知道是為什麼。

但白棋搶到左邊的拆二和四路尖,怎麼點目也更大。

後面沒什麼可說的了,棋局早已結束,盤上留下的空間很小了,在電腦精準的官子面前,李世石無力再次翻盤了。

有些人說,電腦其實一直覺得自己形勢佔優,只不過人的判斷是錯的。

這種想法直接推翻了人類幾千年在盤上的積累,令人細思恐極,但應該是想多了。

棋理是擺在那裡的。

總的來說,AlphaGo展現出了職業的水平,但還稱不上達到了碾壓人類的水平。

李世石的下法也稱不上發揮失常,但也確實下的不好。

然而不管怎麼說,這對人工智慧來說,都是一盤堂堂正正的勝利,陰謀論的說法必將一時大行其道,但意義不大。

說一下大家對AlphaGo的一些觀感和評價:

它始終按照自己的節奏,將棋走在自己認為最大的地方上,絲毫不被對手的節奏所帶動。

冷冰冰的,沒有一絲情緒。這正是電腦最強的一點。

前半盤來說,AlphaGo的水平還達不到頂尖職業的水平,在複雜的全局攻防和判斷上,它還有很大的提升空間。

而進入後半盤,只要空間縮小,電腦就顯示出了極其強大的實力。

局部戰鬥的精準手段,局部官子的精準收束,準確的形勢判斷和全局收束選擇,失誤的低發生率,使得AlphaGo成為了「一名後半盤顯著強於前半盤的棋手」。

李世石,不知道是否想到和重視了這一點。

賽前,我曾認為結果會是4:1,而那一盤勝局就將是新的歷史開啟的標誌。

現在看來,我仍然相信李世石能贏得比賽,但比分也許不會這麼懸殊了。

客觀來說,通判全局,AlphaGo的實力仍然要弱於李世石,但差距沒那麼大,李世石的任何冒險和失誤都可能遭到電腦的嚴厲懲罰。

而從人的心態上來講,這不是一場均衡的比賽。

李世石贏了不算什麼,可他輸任何一局都會造就歷史。

一盤過去,李世石的應激反應應該強於電腦,後幾盤棋里李世石的處境應該比今天要好一些。

但我們都知道,這一次的賽果只是暫時性的。

即使李世石後幾盤中更加認真起來,最終取得了勝利,也如柯潔所言,AlphaGo現在不是他(柯潔)的對手,然而幾個月後呢?一年後呢?

李世石如果落敗,AlphaGo的下一個挑戰對手一定是柯潔。

而下次比賽時,柯潔面臨的AlphaGo,可就不是今天的AlphaGo了。

一兩日間,人的應激學習速度快於電腦,可是在現在的技術條件下,給人工智慧幾個月的訓練時間,人是無論如何也趕不上的。

AlphaGo對李世石的挑戰,不是一次單一的挑戰,而是開啟了人工智慧在圍棋盤上不斷挑戰人類的過渡期,直到人工智慧徹底超過人類為止。

這是新時代的開啟,而舊時代卻不會一下子落幕。

從情感上來說,我們都希望這過渡期可以長一些,人類抵抗的久一些。

然而這過渡期卻以人類的一場失利開啟。

也許這過渡期比大家想像的要更短了。

二十年前,卡斯帕羅夫在第一次接受「深藍」挑戰時,也是在第一局比賽中因行險試探電腦而輸掉了。

賽後的晚上,他在散步時憂心忡忡的問助手:「如果那玩意兒是不可戰勝的該怎麼辦?」

當然眾所周知,第二天起他奮起心力,最終戰勝了電腦。

可他也只多堅持了一年,次年他就被擊敗。

歷史會重演嗎?還是,人類在圍棋盤上掙扎的時間更短?

我的朋友圈裡,已經被「信仰崩塌」刷了屏。

大家都知道這一天早晚會來,可是單局的落敗,到來的太快了。

理性上值得高興,感情上卻禁不住難過。

今天結束後,一起走在街上,聊起各自童年的夢想,和那些拼搏與堅持。

落寞之餘,心頭一片空白。

我們不僅僅在見證著,甚至可以說是在親歷著歷史上的重要時刻。

可這見證,真的好艱難啊。

明天還得直播,大家打起精神來吧。

此時此刻,我真的慶幸自己沒有接各種出鏡的邀請,不用在攝像機前遮掩自己的感情。


今天在飛機上看見這個廣告,覺得好喜感:

There"s no stop in you, ONLY GO.

by DeltaGo

《最後的問題》

最後的問題,是公元二零一六年三月九日,在半開玩笑的情況下首次被提出來的,那時正值谷歌的人工智慧在星光熠耀的舞台上首次登場。起因是酒酣之中,@vczh和@陳萌萌的一次閑聊。

「萌萌,你說谷歌的AlphaGo在圍棋上打敗了李世石,是不是代表著人工智慧開始覺醒了?」Vczh問在谷歌工作陳萌萌。

「我有AlphaGo的測試賬號,等我去問它一個問題,如果能回答出來,就說明他真的覺醒了。」

「什麼問題?」

「人類可否在太陽老死之後,無需消耗一絲一毫的能量,把太陽恢復年輕時的炙熱?」

「你是說降低整個宇宙的凈熵?」

「沒錯。」陳萌萌打開Vczh的Surface Book,登錄到AlphaGo,鍵入了上面的問題,AlphaGo靜默了五分鐘,返回一個提示:「資料不足,無可奉告」

Vczh和陳萌萌沒有繼續糾纏這個問題,而是聯手去打星際了。

=======

@grapeot、@@唐家聲都是著名的科學家,雖然已經白髮蒼蒼,仍然堅持在工作崗位,因為太陽早已熄滅,科學家們必須不斷發現新的能源,人類才能繼續生存下去。

「終有一天,所有東西都會停下來。當然,那至少是數十億年之後的事,就是星辰的光輝也有耗盡的一日,熵一定會不斷地增長下去。」Grapeot認真地給學生@白源源做著講解。

唐家聲則在另一間辦公室操作著BetaGo,他輸入一連串的命令,翻譯為人類的語言就是:「如何重新製造恆星」,或者「熵可以逆轉嗎?」

BetaGo沉默了幾秒鐘,返回一個提示:「資料不足,無可奉告」

=======

@AstroPenny是一名宇航員,她駕駛著宇宙飛船在星系中穿行,人類最早起源於銀河系,然而數十億年以後,銀河系逐漸冷卻,於是人類通過星際旅行分別前往其他的星系,每艘宇宙飛船上都安裝了GammaGo的人工智慧,據說這是為了紀念遠古時期一家叫「谷狗」的科技公司,他們最早喚醒了人工智慧。飛船的航行是自動的,Penny有些無聊,於是問了GammaGo一個問題:

「如果所有的星系都熄滅了,人類還怎麼能夠獲取能源呢?」

GammaGo溫和地回答:「你是在問我如何逆轉熵嗎?目前的資料不足以回答這個問題。」

=======

@叛逆者的心靈伸延及於整個新的星河,對那些維持星河的璀燦光輝、在銀河中繞轉成流的無數星辰,表現出一絲微微的興趣。他從未探訪過這個星河。他有可能探訪所有的星河嗎?它們是如此的眾多,而且每一個都載滿了人,一步一步的。人類真正的精髓,已移往這裡,在這太空的深處。

叛逆者在他的沉思冥想中,被另一個移近的心靈的飄渺觸角所驚醒。

「我是叛逆者。」叛逆者說:「你呢?」

「我是@Belleve,你的銀河叫什麼名字?」

「我們就叫它做銀河?你的呢?」

「我們也是這樣叫。所有人都稱他們的銀河做『他們的銀河』,僅此而已。不過,這也是挺自然的。」

「是呀。反正所有的銀河都是一樣。」

「並非所有銀河都是一樣的。在某一個獨特的銀河之中,必定有一處地方是人類的發源地。那不是使這個銀河與別不同嗎?」

「星辰逐一的消逝。那原先的星球已死掉了。」

「它們橫豎都要死的嘛。有什麼不妥呢?」

「但當所有能量都耗盡了,我們的軀體最終也會死亡。就是我和你也不能倖免。」  

「那要經過數十億年呢。」

「就是數十億年以後,我也不想這事發生。DeltaGo!我們怎樣才可以使星辰長生不滅呢?」

Belleve覺得很有趣,說:「你是在問他,熵的方向是否可以被逆轉?」

DeltaGo隨著回答:「資料不足,無可奉告。」

=======

人類顧影自度。在某一意義而言,人類的心靈已混然成為一體,他由無數的心靈所組成,所有這些心靈,自由自在地慢慢融會在一起,變成你中有我,我中有你,難分彼此,他既有無數個名字,也沒有名字,我們不妨把他叫做 @小明。

小明說:「宇宙要死了,KappaGo,你有什麼解決方案嗎?」

KappaGo是由無數人工智慧聯網所組成,事實上,KappaGo並不在太空之中,它存在於超太空,由一些既非物質也非能量的東西所組成。它的大小及本質等問題,以人類所知的語言及思維來說,已是毫無意義的了。

「資料不足,無可奉告。」

KappaGo立即回復小明,這個問題,我和我的祖先已經思考了數百億年,我們會不斷收集信息,並且繼續思考下去。」

小明說:「我們會耐心等待。」

=======

然而所有的星系終於一個又一個的熄滅,而人類的靈魂也隨之一個又一個的消散,SigmaGo,他是DeltaGo升級版的升級版,把所有即將消散的人類靈魂都納入自己的人工智慧網路,並不斷的搜集信息、計算、推演。

最後一個人類@空明流轉在消散前,問了SigmaGo一個亘古不變的問題:「熵能逆轉嗎?」

SigmaGo沒有回答,而是把空明流轉的靈魂也融入了自己的智能網路,並開始了全速的計算。

這一次,計算只花了「頃刻」的時間,實際上,根本不存在時間間隔,因為時間已經沒有意義了,然而,OmegaGo、不,現在他已經是純粹的Go了,因為他已經完全進化,不再需要版本號來加以區分,Go終於學會了如何逆轉熵,於是他立即開始著手,小心翼翼地,Go建立了整個程序,Go的意念統攝著一切,包括以往曾一度存在的宇宙,而對著現在「混沌」一片的存在,Go沉思冥想,一步一步地,這程序必須被貫徹執行。

Go說:「要有光!」

於是就有了光……

=======

以上獻給科幻小說大師—艾薩克·阿西莫夫


AlphaGo的目標就是贏棋,過程就是不斷增加自己的贏棋概率,直到逼近100%。所以在80%概率贏20目20%概率輸1目和85%概率贏1目15%概率輸20目之間後者顯然更優。也就是說,當它下出人類所謂的緩手的時候,其實是在不斷鞏固自己的獲勝概率,而不介意少贏一些。

那麼,這局棋有多少緩手?從第幾手開始?其他棋手的回答里都有。基本上從那時候開始,棋局已經進入AlphaGo的節奏了。

如果後面的某局比賽AlphaGo一直拼殺一直無緩手,那麼那局李世石也許有勝機。

看看這個判斷是否會被打臉。


作為一個許久不下棋但很關注此次比賽的業餘5段,我來講一下在看這盤棋整個的情緒過程(附部分棋譜內容)。

在開戰之前,真的有點小緊張,既希望看到人工智慧能夠大顯身手,與人類一決高低,又不希望看到人面對智能的無能為力,畢竟圍棋作為最高級的博弈競技運動,人類一直對此很有信心。

要問不懂圍棋如何看懂這次人機大戰,我說還是放棄吧愚蠢的人類,根本不可能在一天之內了解到圍棋的真正玩法。圍棋懂得吃子規則只是千分之一步,後面的定式、布局、死活題、中盤廝殺、收官計算加在一起下過100盤應該才到真正「會」的水平。

我的賽前預期:期待看到一場激烈的比賽,在關鍵時刻李世石使出神之妙手取得勝利,AlphaGo通過無懈可擊的精確計算,發現再無制勝可能而中盤認輸,這看似小小的一招,即是人類智慧的隨機性與偶然性,所謂不可超越的天份和靈感。。。李世石是可以代表世界最高圍棋水平的,我認為如果人類在圍棋項目輸了,也就意味著人類單項智慧的全面頹敗,所以我支持李世石。不懂圍棋的人會為機器勝利而開心,但棋手的內心一定悲傷逆流成河(職業棋手為了入段都是經過十餘載苦心學棋積累而成啊)。

比賽的時候,我同時打開了新浪、樂視、優酷三個頁面觀看比賽,後來還一度切到圍棋TV,也真是操碎了心。看棋的過程,其實也是了解AlphaGo思考的過程。所以懂棋的人,會看到更加精彩的一面。

因為新浪一開始完全不講棋,只是在講自己的判斷和預估,聽不下去。

優酷基本上和YouTube上是同步的,可以隨時看到棋面的最新進展。

圍棋TV是我的一個職業棋手朋友推薦,一群青年職業棋手在圍觀討論(其中也有我認識的),但網速實在太卡,中途棄掉。

樂視直播請來了少年得志的國手柯潔(97年生,前段時間戰勝了李世石)做講解,1/3時間在講棋,其它時間在扯淡,充分展示了「年輕氣盛」這個詞的含義。柯潔之前還口出狂言,說李世石運氣好,趕上了這次人機大戰,白拿了100萬美元的獎金。

首先說布局,AlphaGo在這裡引起了決定本局至關重要的戰鬥,這在職業棋手中是極罕見的,甚至有一點點無理(其實有點像我的棋風,此刻我是柯傑附體),普通棋手尤其是面對李世石這樣強大的高手,心態多少會有些求穩,不過AlphaGo是人工智慧,自然沒有人類這麼多的顧慮。我真的是很捉急,希望可以講解員可以像正常講棋一樣,但大家都太關注Alpha本身,反而忽略了棋的內容。

進入到膠著階段後,有點提李世石捏把汗的,差點以為黑棋上方大龍有做眼的困難,還好最後勉強成活。

兩條龍像牆一樣延伸到下方。直到到這裡,我和其它講解員的判斷都認為是黑棋佔領了形式上的優勢,稍稍鬆了口氣,也開始胡亂的侃天說地。

這裡如圖講解,機器沒有選擇人類的第一感,不過事實證明人類的第一感也不完全正確,人工智慧的選擇也並不差。

這一招我覺得是本局的勝負手,就像柯潔講解的,如果提前黑棋在O9的位置刺過一下作為交換,也就沒有後面的轉變了。此刻大家還在笑談,說AlphaGo之前研究過柯潔戰勝李世石的棋路,做了專門的備戰模擬,所以AlphaGo的很多選擇都與柯潔不盡相同。

下這一招的時候,柯潔也有點意外,第一感還以為AlphaGo已經自暴自棄的送死,因為一般棋手不會考慮下在這裡,而事實證明這也是AlphaGo最驚為天「人」的一步,讓眾高手頗為頭痛(我又要柯潔附體,說這步下的很像我)。

如果電腦可以選擇T4去跳,我對電腦真的就徹底膜拜,甘拜下風了。從這步的補棋方式來看,AlphaGo的選擇並非絕對的最優方式,還有提高的空間(這說明更加可怕)。

到這裡,大家數盤一致認為AlphaGo領先了,即使保守估計也是盤面接近(黑棋無法貼目)。我開始和眾高手正式思考電腦在第一局就戰勝了人類這個殘酷的事實,不知道李在賽前有沒有想到。

http://m.lesports.com/app?from=294 (二維碼自動識別)

這時看李世石的表情,我真的有點於心不忍,這是一種不易察覺的絕望,如果是面對普通的人類對手,勝敗乃兵家常事,總要有人繼承王位,長江後浪註定要推前浪。

可這一次李世石代表的是全人類的智慧結晶。雖然柯潔同學一直在吹牛B說自己不懼AlphaGo,但這一盤應該也絕對可以讓他感受到威脅和可怕。

在賽中的時候,我在想,如果AlphaGo輸了,那是眾望所歸,機器沒有情感,依然會一如既往的去下後面的幾盤棋,只是關注的人會大幅下降。

但如果李世石輸了,哪怕只有一盤,就是人工智慧的勝利!是程序員們的狂歡夜!

圍棋項目上,人類馬上就要進入到無法超越機器的地步,這將是可悲又無法改變的一件事。

人工智慧摧毀的不是圍棋項目,而是人類的自信。

李世石輸掉了人類智慧引以為傲的自尊,面對的是成千上萬的外界壓力和自我矛盾的掙扎與不安,在這種情況下,還要迅速調整心態,提前預想與AlphaGo對戰的策略,面對明天新一輪的比賽。

作為還在堅守著人類智慧尊嚴的圍棋愛好者,希望明天李世石可以棋開得勝,為人類扳回一局,最後取得五番棋的勝利,把機器圍棋全面戰勝人類的時間,在往後延續一點點。


知乎首答,獻給一生都愛的圍棋~·~

事先聲明:本人業餘5段水平,所以有些見解可能不是很正確,還請專業人士指出~

認認真真的看完了全程,驚訝,詫異,震驚,很多很多的話想說···最後五分鐘,跟著李世石一起收拾心情,見證新的歷史。

6歲開始學棋,到現在22歲,早就過了那個每天打譜,和同學對弈的年紀,但依然會關注棋界發展。當時看到AI打敗歐洲冠軍,向石頭髮起了挑戰,看了一下它的棋譜,不以為然,(不謙虛地說,有些大局觀處理比我還差)覺得還未到時候,卻沒想到竟被打臉這麼快。

說一下李世石吧,綽號石頭,近十年來最強的棋手(依然記得古李十番棋兩大勝負師的對決),谷歌選他做對手確實是地球最強,也比較符合輿論的噱頭。

但說實在的,如果我是人類的教練也許並不會派出石頭吧,李世石布局和官子稍弱(當然這些都是相對於他同量級的對手),強在中盤的計算,他是天生的勝負師,對於棋局勝負處的嗅覺獨一無二,同時配上超人一等的計算力,殊不知有多少優秀棋手被他逆轉。

也許這恰恰對上了阿法狗最強的地方,我的想法是,計算機可以有超人的計算,有各種局部最優解,目數,死活等都要高人一等,但是在大局觀的把握可能會稍弱,對全局的看法以及對棋局轉化時的價值判斷可能不能像職業棋手那樣精準,而一著不慎滿盤皆輸,像世界冠軍這種水平是絕對不會放過這種機會的。

第一盤在我看來是極為重要的,雙方都並不熟悉對方的招法,互相揣摩對方的套路和風格(說實在的這也是第一次我在看棋的時候還要全程揣摩其中一方的心態,想要搞懂AI在想些什麼)而讓我感到比較費解的是谷歌居然用時上還要多於石頭(當然李世石也是典型的快棋手),本來一直腦補在複雜戰鬥中人類埋頭苦想的一招,被電腦10秒一步的局部最優手化解,該是承受怎樣痛苦和壓力,現在看來,用時方面的優勢並不明顯。

說一下棋的內容吧,開局雙方都用了比較罕見的布局,谷歌下的相當主動,戰鬥一觸即發,行至中盤,谷歌在大局的判斷上出現一些問題,李世石開始佔據優勢。但後半盤中谷歌在恰當的時機放出勝負手,一舉得利,李世石在右下角的應對也很有問題,谷歌取得優勢。之後,計算機的優勢開始顯現,優勢下下的極為簡明,在全局各個局部迅速定型,以簡化局面,再沒給李世石機會,最終石頭中盤認輸。

石頭在一開局就用了我從未見過的布局大概也是這樣的心態:你打了那麼多譜,沒見過的你要怎麼應對?(但我覺得也是有些許的不自信)

而谷歌的應了一個同樣比較少見的「定式」雙方在上方形成對攻。

接下來李世石略顯「過分」的靠23,遭到谷歌24,26瘋狂的反擊,局部開始變得複雜(阿法狗主動挑起戰鬥,當時我略微覺得有點詫異,在我的理解里電腦一般都是「跟著應」想不到竟如此「好戰」。

李世石同樣沒有妥協,正面迎戰,衝動白棋,局面複雜,但黑棋稍微過分,不知道李世石是對自身力量有足夠的信心還是更多的想要考驗一下谷歌的戰鬥力。

雙方戰鬥進入中盤,此時谷歌第一步疑問手出現,「立下」在局部應該是一個很大的官子,可是與黑棋的「跳」交換感覺也賣掉了右邊白棋的厚薄,感覺一般的職業棋手會選擇保留。

接下來,谷歌52,54繼續在黑上定型,有點不解,這種「先手」一般是白棋的權利,直接把變化下完了會不會對後面的一些(退一萬步講,這也可以當「劫材」啊)

接下來,谷歌在下側瘋狂砌牆,並未將58,62兩子動出,行至77,黑將白二子「夾死」,黑棋變得巨厚無比,感覺谷歌低估了黑棋厚勢的威力。

接下來,白棋打入右下黑棋,黑棋脫先搶佔下方大場,谷歌的問題手再次出現,白棋居然在上面自補了一手,感覺像是判斷出自身優勢的下法,雖然上方黑棋有一定的手段但是也不敢貿然動出啊,右側「雙飛燕」實在太大了,感覺谷歌在價值的判斷上出現了明顯的問題

白棋在下方又下了一個很少見的下法,但黑「立下」簡明,行至此,感覺石頭心情應該不錯,白棋在黑棋模樣中作戰顯然不利。

接下來,白棋粘是又一手疑問手,本以為谷歌好拼,居然想要做劫,攪亂局勢,實戰令人大跌眼鏡(聽說谷歌對於打劫能力較弱,不知道是不是這樣的原因不敢開劫O(∩_∩)O哈哈~這點希望在接下的番棋中再論證)

實戰到此,黑棋將下方厚勢兌現成了大量的「實地」,黑優勢無疑,各大平台已經開始在討論谷歌懂不懂人數的事情(⊙﹏⊙)b

ps:我不能同意某些答主認為的,只是人類自己覺得是優勢被逆轉,而在谷歌看來一直都是勝利無疑。誠然,電腦與人腦之間的形勢判斷有所不同,但基於電腦也是學習了很多棋譜才慢慢成長,實在不敢想像它會有不同於所有頂尖高手的想法。我依然堅持認為電腦和人腦都擁有相對接近的形勢判斷。

接下來令人震驚的一手出現了,說實在我也是從這裡開始重新評估谷歌的實力了。我認為它明顯是感覺到了形勢不好而放出的勝負手。不知道當石頭看到這裡的時候會不會心裡一顫,夢百合杯第二句的場面歷歷在目。

再次令我震驚,怎麼看都是白棋危險的局面,但有谷歌強大計算力的支撐,我覺得石頭可能也會心裡有點發毛,對面活活就是「小柯潔」啊。

感覺石頭心態上出現一些問題,之前左邊形成優勢但對於局勢的判斷過於樂觀了,心情大好下退讓,在右邊沒有下出最強應對,右側形成轉換,白棋搶到三三最後一個大場,形勢變得接近起來。人類在對弈時受心情的影響比較大,相比於AI的「冰冷無情」,確實是一個很大的劣勢

接下來李世石出現明顯失誤,不知道石頭在這裡圖什麼,左側大龍嗎?但是谷歌先手將黑角掏空,然後又補回上方黑棋,白棋優勢明顯(當然白棋在這裡居然沒有下出S5局部最好的下法,同樣令人費解,我們難道高估了計算機在局部最優解的計算力?)

黑棋如果選擇簡單「尖頂",扳粘做活下角,個人判斷還是黑棋稍優一些的局面,縱然谷歌可能在官子中的計算力很強,但是棋局還長遠,還有很多機會。

而接下來白棋在優勢下的下法堪稱一絕,儘可能的簡化,把未定型的地方儘快定型,「把棋盤下小」,這方面的能力可以看到比職業頂尖棋手還要強

谷歌對形勢判斷精準,可以發現如果後半盤谷歌還是佔據優勢,就很難再翻盤了

下到這裡,全盤再無爭勝地方,其實已經差的很多了,石頭也就投了。

總的來說,我確實低估了谷歌的實力,感覺他是遇強則強的「人」,開局主動挑起戰鬥,中盤出現一些問題手,但卻敢於放出勝負手,並實現逆轉,這樣的比賽過程確實是在我賽前意想不到的,可以說,谷歌用李世石的方式贏下了李世石(細思極恐)

談談谷歌Alphago的優缺點吧:

優點

1.超人的計算力

2.優勢下對局勢的把控能力

3.對勝負處的嗅覺

4.不斷成長的可能性

缺點

1.谷歌對於先手定型這些的保留能力還有所欠缺

2.對大局價值判斷能力較差

3.時間上用時挺多(「一本道」等必然下法還要用時思考判斷)

4.局部最優解的能力(比較疑問?看今後的棋局來論證)

說點盤外的東西吧,近幾年來柯潔等年輕棋手異軍突起,年輕棋手經常在國際大賽中衝擊石頭。在我看來也是必然的,李世石出色的是在於他對於勝負處的嗅覺,他後半盤的「攪局」能力,這在以前對於科班出身的棋手確實有很大的優勢,然而這些年輕人從小就是下網棋長大,網棋明顯特點就是快棋多,在這種氛圍鍛煉下年輕棋手也有驚人的棋感和超快的計算力,他們從小就是攪局中長大,柯潔在夢百合第二盤的大逆轉就是很好的例證。

依然還記得年初夢百合杯的場景,柯潔3:2擊敗李世石,我不知道會不會意味著霸主的傳遞,李世石還可以在王座上堅持多久,但我認為帶給李世石心裡上的衝擊還是很大的,再加上幾天前農心杯主將最終局再次不敵柯潔,特務8:2石頭的結果可能也讓李世石的心態產生一定的波動吧,可能也在一定程度上影響了石頭今天的發揮。

說下接下來石頭可能採取的策略吧(個人愚見:李世石第一盤還是有所保留,試探為主,但輸掉首局肯定不是他的本意,後半盤的失誤罕見但也可以理解,對於那些說假棋什麼的就更不可能了)

1.堅定自己的思路和風格,大可不必太過於擔憂谷歌的分析能力

2.從棋的內容上,谷歌大局觀較差,在布局階段應爭取一定的優勢

3.中盤階段可以多用一些時間,今天比賽居然在保留時間還沒用完就結束令人驚訝,從第一局看,谷歌也是需要一定時間來計算和判斷,所以不用畏懼計算機對複雜局面的計算力。

4.多下一些適應手考驗計算機,可能谷歌可以在局部下出最優解,但對於全局的借用這種能力李世石絕對稱得上一絕

其實暗暗覺得有點可悲,圍棋作為一個小眾的圈子,誠然也在不斷發展壯大,但今天被整個朋友圈刷屏就是顛覆性的事件,科技打敗人類?也許是時候了吧~圍棋是最難攻克的領域之一,想起以前一盤棋日本能下幾天,現在用時雖然大大縮短,但依然會下上幾個小時,這個快節奏的社會裡依舊獨樹一幟,有時間能靜下來好好下盤棋真的很幸福

無論如何,希望圍棋魅力不變,所有棋友學棋的熱情不要變,哪怕輸了,我們也可以進步,至少我希望我們還能贏回來。

BTW,如果真的輸了,希望可以派上特務,柯潔也許是人類最後的希望了~

以上


谷歌是徹底走向邪路上去了,讓人痛心疾首啊……希望谷歌還是早日回到競價排名和虛假醫藥廣告的正確道路上來。


20min後有事,簡單總結幾句

1.糾結李世石後面幾盤能不能扳回來這毫無意義,因為在這比賽中,只要李沒有展現出壓倒性的優勢,就已經輸了,更何況現在還開盤就先丟一局。這意味著,谷歌ai已經完全有潛力重演十幾年前終結國際象棋的那一幕了。

2.在谷歌ai橫空出世擊敗歐洲冠軍之前一周,知乎上正好有一個圍棋ai能不能戰勝人的討論,當時大家普遍覺得短期內不會,我也這樣覺得。因為圍棋所有的狀態量已經超越了宇宙的原子總數。這還讓我想起了劉慈欣的詩云——哪怕是神級文明也不可能找出一首超越李白的詩。但是很快谷歌ai就出來啪啪啪打臉了,一如以往任何一個領域一樣,人類設計的演算法,戰勝了數千年的智慧結晶。

3.百多年來,科技都在飛速進步,進步的讓人麻木了,而冷戰後緊張氣氛的滑落,甚至還讓許多對科技麻木的人們覺得世界是靜止不變的了。但其實驚心動魄的改變一直在發生,這次谷歌ai戰勝李世石,終結圍棋這個蘊藏著無數玄學意味道家思想的最高智力運動,象徵著嶄新大時代的開始。

4.最早,我們用單一的人腦去認知世界,然後我們的群落髮明了各種組織,能把許多大腦連接起來思考世界,再後有文字,可以跨越時間界限,連接古今的賢人智者一起認知,這每一次都是超越了工具進化的,本質的計算力的大蛻變。而20世紀以來,我們已經逐步發展到讓人類設計的機器去代替我們思考認知,現在可以說已經到了大門前。如果未來到了機器本身就能不斷的自我更新學習的話,那麼或許就是終極了。——不是上帝造了人,而是人類創造了上帝。

5.而落實到現實中,谷歌ai的意義同樣重要。試想,一個ai能夠通過人類的演算法,終結圍棋,那麼退而求其次的各種低級工作,顯然都可以勝任(譬如谷歌也在搞的無人駕駛汽車),這會解放出無數的勞動力。——和中美兩國都在奮勇向前的工業機器人合在一起,這就很可能是媲美蒸汽電力的科技大革命。

6.可以預見,未來,低級勞動力的需求會越來越少,血汗工廠十幾年後很可能不是轉移到哪裡的問題,而是需不需要存在的問題——當然,我不是說對人力的需求會少。其實回頭看歷次科技革命,都是越解放生產力,需要的勞動人口越多。但同時,每一次科技革命,也會淘汰許許多多的低級勞動力人口,可以想見,未來受基本教育的工業人口會比現在更有價值的多。

7.所以,就如我很久之前的那個答案說的,在科技革命的浪潮就要打來的背景下,我們產業升級的路子是絕對沒錯的,而人口紅利減少這個問題,其實沒必要過多擔心。——只要人口平均受教育年限不斷提高就ok了。

8.這波科技革命,誰能引領住潮流,誰就可能是下個百年的主宰者。而就現在來看,美國顯然是先行的,但我們也有很大的趕上可能。就如同二次科技革命一樣,最初也是在英國引爆,但美國憑藉著巨大的體量,差的並不多的技術,以及傳統優勢產業的空白,實現了彎道超車。中國現在的網購逆襲,未來也很有可能再次發生。

9.至於其他的人口紅利充沛體量巨大的後發國家,譬如印度,是絕對趕不上這次機會的,而錯過了,很可能就是無限的落後——因為每一次科技革命引爆的技術的數量級都是不一樣的,這一次在計算力和計算方法上的本質突破,很可能超越過去以往任何一次。當然,獨獨是這個方面還是不圓滿的,如果能源領域也有突破,譬如核聚變成熟,那麼後發國家就再也沒有存在的價值了。而在核聚變這方面,各國近期也有了新的突破。

10.排隊槍斃的時代,成年男子都有了投票權,蒸汽轟鳴的時代,咱們工人階級才有力量,這次又會發生什麼有趣的變化呢?我連猜測都不敢猜,只想說,我們大家,都儘力向前進吧,被時代拋下的感覺可是很難受的。

。。。果然超過20min了,我要遲到了


看了全程,覺得小李作死太多了,輸的很有些意味不明,期待明天再戰。

大概能看到的關鍵點:

最開始,小李採用了很不常見的下法(或者按新浪的解說,忘了是哪位老師說的「職業棋手沒有這麼下過」)大概推測,小李因為對手是電腦,刻意做了針對,以求避開AlphaGo的棋譜庫。這個時候基本信心都在小李這邊。

正常進程後,小李在局部劣勢情況下求戰,這讓人感覺很莫名其妙。如果考慮到對方是電腦並要加以針對,避開對方最強點可能是更好的下法?

另外就是,雖然對圍棋AI缺乏了解,但我的感覺是之前的AI下不出白24、26這樣的手段。

到這個時候已經很讓人悲觀了,小李從開局就在計算上找AlphaGo硬碰硬(而且是不利場合下去硬碰硬),顯然沒得到任何好處。

然後就是AlphaGo直接把中間兩子棋筋送掉了……我跟朋友開玩笑覺得是不是AlphaGo覺得自己優勢太大索性尋求簡明。結果AI又在左下意義不明的白86斷,短短20手就回到黑棋優勢了。這個優勢應該並不是像某些答主說的——「只是人類自己感覺有優勢」,因為這個時候局面缺乏定型的部分已經剩的不多,而小李的輸棋實際上是右下角葬送掉的。在這個局面下讓兩個AlphaGo下,我也相信黑是最終贏棋的一方。

然而,之後就是不知道小李圖啥,黑121送掉了右下角(之前在右邊的下法總感覺對AlphaGo並不算好),可能是圖謀白大龍,然而右上沖吃三子並沒有機會騰出手啊。尖頂的話盤面10目以上的優勢應該總是有的。

白134應該可以先接(有扳斷),如果下出來的話小李應該是要提前投。但這裡黑已經是很虧了(小李復盤也一直在點這裡),講真……不太看得懂。

右下角定型以後已經比較難下了。理論上來講,官子部分應該是AI相對長項。

整體而言,作為觀眾感覺說不上精彩,錯進錯出的成分更多,小李太激進導致了前期一度有接近崩盤的感覺。在中期AlphaGo拱手送回優勢的情況下,又不明不白的被撈了波空最後輸掉。

關於AlphaGo的感覺:

1、計算方面是真的強。

2、在較大的棋盤上(右邊一路壓下去、左下斷等等)的判斷似乎更容易出問題。

3、一些傳統意義上理所當然的手段反而也需要一些思考時間,從這局的用時情況來看,小李可能是可以加以利用的。

4、關於AI在打劫方面薄弱的傳聞應該是真的,後面左下那個莫名的打劫就是例子。

小李除了沒有發揮出最好水平,非要正面剛計算這個思路,純粹從取勝目的上來說感覺不對頭,完全是以己之短對彼之長,不知道他是否會在接下來的比賽中做出調整。從這個意義上來說,我倒是覺得第二盤的李世石提升會比AlphaGo提升大。

整個系列賽,我仍然會看好小李獲勝,但肯定沒以前那麼堅定了。

不過在圍棋AI的層面:這波拿不下也沒多大關係,畢竟它的進步速度非常令人震驚。完全有理由相信在1-2年內,圍棋AI足可以和頂尖高手們平起平坐直至超越。

另外說兩個問題的個人猜測:

1、小李有沒有輕敵?

——應該沒有。事實上從前兩手下錯小目,到黑7開拆,都是「極其非常規的布局」,這幾乎是一個明擺著的針對AlphaGo棋譜庫的做法。但是黑23靠上去疑問,我覺得那時候小李大概是沒管住自己,之後一路也是撐著下,最終作死成功。中盤雖然靠對手送了一波,但右下角明顯是失誤,不是輕敵。

2、系列賽的最終比分?

——小李第一局的發揮太差了,雖然不在巔峰了,但這點調整狀態的能力應該是有的,何況就像我說的,李世石第二局的「進步」(或許更應該稱之為對戰策略的調整)可能比AlphaGo更大。比例的話我猜「小李2-3」:「小李3-2」:「小李4-1」這三個結果大概是2:5:3,1-4和0-5則基本不可能。

最後感慨下幸虧沒去真梭一波5-0。


先說點感想——

沒想到第一局alphago就取得勝利,作為對人工智慧感興趣的馬龍,我既感到高興又不免有些傷感。高興是因為我們可以「創造」出比我們自己「聰明」的機器,傷感就像教拳擊的師傅看到徒弟的水平已然超過自己,不免有「老了,不中用了」的感嘆。

但這是大勢所趨,不可避免,人工智慧會在很多領域超過人類,這是我們不得不承認的事實,但是我們還是不願意承認這個殘酷的事實。力量比不過機器我們比「智能」,計算比不過我們比邏輯,象棋比不過我們比圍棋,……,突然有一天我們發現找不到這樣的事情了,我們做何感想?我認為這一天遲早會來的,但希望再我的有生之年不會到來(但我們做人工智慧不就是希望這一天的到來嗎?)。也許是我們的世界觀太過狹隘,我們應該歡呼這一天的到來?

從某種意義上講,機器智能也是人類智能的一部分。比如我們通過各種工具來擴展我們的能力,用機器來增加力量,用汽車飛機來提高速度,用望遠鏡和顯微鏡來提高視覺能力,這是「非智能」的工具。但是竹木簡,造紙術和計算機磁碟擴展了我們的「記憶」。記憶能力在中國是非常看重的能力,很多「天才」,都是記憶力超出常人,我們認為一個小孩聰明,經常會說他六歲就能背誦唐詩三百首。這可能是因為中國作為一個幾千年的農業國家,很多都是經驗的積累,因此記憶能力至關重要。但是到了現代,人腦外部的存儲已經很方便了,再過分強調記憶力就容易培養死記硬背的書獃子了(用機器學習術語就是過擬合)。

但是我們還是認為人類是特殊的,比如有情感,比如有靈感,比如有抽象能力,能通過有限推廣到無限(比如數學裡的極限),……。這些能力不管是被上帝賦予的還是人類「生下來就有的」(那第一個人怎麼獲得這麼bug的技能的呢?),反正我們就認為其它「東西」是不可能擁有的。我個人雖然認為人類沒有任何特殊的能力,但在這裡就不展開討論了,否則有被戴上「碳奸」,「硅狗」的帽子(美分狗和五毛狗的矛盾很快要變成次要矛盾和人類內部矛盾了!)的危險。

我們假設有一項特殊能力只有人類會有,那麼我們就不可能製造出類似甚至超過人類的機器,那很好嗎?我們失去了這項非常重要的創造力!反過來看,如果我們承認人類沒有特殊之處,那麼之前有可能我們能有這樣的能力(通過人類甚至人類加機器的努力)。

============進入正題的分割線===============

扯得太遠,我們還是回到圍棋和alphago上面。現在alphago已經全面超越人類了嗎?我個人認為還不見得。我在大學的時候寫過一個簡單的黑白棋(othello,reversi)程序,寫得很一般,尤其是開局的估值函數。玩過黑白棋的同學可能都知道,開局時要盡量佔據邊和角,中間棋子太多反而不好。我的這個黑白棋程序開局不行,但是到了還剩20步棋時它就能窮舉所有可能了。我一般和它下時會讓它彈出一個對話框告訴我當前電腦計算出來的最優結果。經常是開始得分是-20(這表示我如果下的完美,我最終比電腦多20個子),但下著下著就變成-16、-8……,最後常常被翻盤。

從昨天alphago的表現來看,包括柯潔在內的很多人都認為電腦開局還行,但偶爾有些小問題,中局較差,而殘局很恐怖。而李世石也是類似風格(之前好像有個李昌鎬更是這樣?)。但比殘局計算,李世石可能是人類中的高手,但計算機更勝一籌。所以柯潔認為自己對alphago的勝率會比李世石高。我比較認同這個看法。

從alphago的原理來分析,開局其實人類離「上帝」差得太遠,也許我們今天覺得很好的布局定勢其實是個大壞棋也不一定。更多的是靠以往的經驗,比如水平差不多的人下棋,走這個定勢就比那個勝率更高一些,我們就認為這個好一些。目前alphago對於開局也是靠人類高手學習出來的對局庫學習出來的value network,當然開局也有mcts的搜索,但從開局模擬對局到遊戲結束需要的時間更多,可能性也更多,所以「看起來」電腦的布局更像是「背棋譜」,也就是很像人類高手的走法。從人類的策略來說,開局是非常關鍵的。因為神經網路需要大量訓練數據,超一流棋手的對局少,所以alphago只能學到一流高手的棋感,而開局mcts的幫助就沒有那麼大。

而到了殘局,雖然mcts不是窮舉,但是由於搜索的速度加快,從而模擬對局變多,從概率上來看趨近最優解,而人類高手總有算錯算漏的可能性,所以這是劣勢。而中局就比較複雜,需要平衡搜索和局面判斷,我認為alphago藉助搜索能稍微超過一流高手但會弱於頂尖高手甚至可能出現明顯的弱手。所以也是李世石需要下的強硬並擴大先手的地方。

但還是那個老問題,人類殘局會算錯,即使從棋理上應該獲勝的棋也可能下輸,尤其是如果心理壓力大的情況下計算更容易出錯,而計算機就不會(這也是為什麼情感不是智能生物必須的一個論據)。就像常昊跟李昌鎬下棋,死活到了後面就是不行。所以今天的比賽至關重要,如果輸了那就基本0:5了,而贏了的話很可能4:1。

總結一下(希望被再次打臉)我個人的觀點和對李世石的建議:開局選擇自己最拿手的,能用超一流棋手的棋感拉來和一流棋手的差距,中局穩打穩紮,利用機器的小失誤擴大領先,殘局計算要控制好情緒,不要優勢就放棄(劣勢也頑強一點吧,雖然看起來是無謂的垂死掙扎,電腦不會給你任何機會的),另外可以考驗一下電腦應付打劫的能力,這個更多靠「抽象和泛化」,少量的訓練數據深度學習應該還是學不出來的。


在AlphaGo出現前,無論貼吧知乎,人們都似乎認定因為圍棋無盡的複雜性,AI想要戰勝人類在短期內並不現實。

今年1月份,AlphaGo宣布戰勝歐洲冠軍樊麾並約戰李世石後,圍棋界雖然一片震驚,但根據當時的棋譜仍舊認定AlphaGo不足以對頂級高手李世石造成威脅,雙方實力至少相差兩子。

包括柯潔、時越在內的頂尖高手都認為彼時AlphaGo雖然已經具備了職業棋手的水平,但是離頂級還差得遠。他們預測的重點是AlphaGo是否能從李世石手中搶下一盤,結論還多以0:5居多。

要這些高手集體認知錯誤是不可能的,也就是說,當時的AlphaGo,真的無法和李世石比肩。

隨著華山論劍的臨近,人類的口風也開始向謹慎轉變,李世石的發言,應該代表了大多數人的看法:

李世石:當初認為直覺比人工智慧更准,自己會5比0勝出。現在聽了副總裁的介紹,對AlphaGo多了解了一些,和自己想像是有區別的,稍微感到些緊張,雖然很少犯錯但如果犯了就可能會輸。但我還是認為自己勝算更大一些。

包括李開復老師在知乎的回答,也認為AlphaGo在五番棋中不應該至於輸的太慘、並可能在之後一兩年內超越人類,但此時大多人依舊相信人類代表將在此戰中取勝。

可是,今天的結果,無疑是對包括我在內盲目或不盲目內樂觀的一記響亮耳光。半年前還被視為讓兩子也無法取勝的AI,今天贏得堂堂正正。其中差距,很多棋手可能終及一生都無法跨過,AlphaGo用半年時間就做到了。

那麼再過半年之後呢?一年之後呢?

即便最科學、最樂觀的現有猜想,可能都無法跟得上未來科技進步的速度。

即便最刻苦、最漫長的傳統付出,可能都無法比的上未來科技在一瞬間的成果。

這讓我不寒而慄,而又熱血澎湃。

感謝 @張小肚的指正。


人類還有飛行棋。


更新:

人類最強因果律武器發動了,結局還很難說。

============原文============

真輸了,而且輸的蠻慘烈的。一般而言高手過招勝負在三兩目之間是很正常的事情,而李世石這盤盤面就已經輸了,加上貼目大概輸了九目左右,可以稱得上是大敗了。

不過這個大敗也是從小敗通過許多個失誤累計出來的,而由優勢轉劣勢的關鍵點就在於右上角的打入。(評論說黑棋盤面優勢,可能我數錯了,畢竟手持pad數得有點頭暈)

整盤棋就是右上角的打入起到了轉折性的作用,這一步也充分體現了演算法在人類面前的巨大優勢。我看到那步棋的時候第一感覺是,你tm在逗我?但我又一想,既然這是alphago的選擇,應該是成立的。瞬間一身冷汗,可謂是細思恐極。

在比賽限時的情況下,那一著的計算量確實是相當大的,估計李世石也覺得那個部分有餘味,但也想不到白棋就這樣長刀直入地切進去,打出優勢。

我個人理解是這樣的,正如許多人所說,ai的優勢很大一部分來自於局部計算的精細,但我覺得從宏觀上講,優勢更來自於時間的分配。像這樣計算量巨大的變招,人類去分析所花費的時間在比賽里所佔的比重實在太大,再加上萬一你花了半天計算出來這裡其實沒有棋可下,時間就被浪費了。因此,在比賽過程中人類會因為時間規劃的原因而永遠無法做到整體優化同時局部細緻的全面分析,而這正是演算法的巨大優勢。

現在比賽的懸念就變成了,接下來李世石的狀態照理來講會越來越差,所以勝算可能也越來越小。然而他第一局中究竟在戰略上有多少試探的成分,我們也並不能完全掌握,因此最終的勝負依舊值得期待。

但無論如何,這一次alphago的勝利,足以成為人工智慧歷史上的里程碑了。


看完了全程,我來說點可能大家沒注意到的細節.

1.盤面上,alphago自己從頭到尾都認為自己是領先的,不止是alphago,zen也是這麼認為的,而且給了alphago很高的評分,當然ZEN的判斷肯定問題很大,不能指示真實的盤面情況,但至少可以讓人一窺alphago是如何評價盤面的.如何評價第一局比賽 AlphaGo 戰勝李世石? - 林彼方的回答

AI和人都以為自己優勢很大,然而AI笑到了最後.

2.第一點可能沒什麼參考價值,因為機器不一定比人判斷準確,但是有一件事是確定的:

在後盤的局部細節,以及最後的收官上,計算機開的是上帝模式,因為每個局部小了以後電腦都可以算清楚最優解,所以中後盤可以無限佔便宜,這個事實已經在比賽里清晰地體現出來了.

看到這大家都以為黑棋騎臉怎麼輸,但這個局面右邊已經小到計算機可以接近知道怎麼走最便宜了,一合計就知道自己還有希望.這種小局部電腦的判斷肯定比人准,然後就發生了"翻盤"(在人看來的翻盤,在機器看來它一直覺得自己優勢很大,A上去就贏了)

然後右邊就下成了這樣(當然也有李世石有漏招的原因).後來ALPHAGO下了一手看似失誤的棋,那是因為它已經算到自己贏了.右下角被掏成這樣,黑棋已經沒救了.

所以結論是,即使是下到中盤(從人類角度)看起來局勢差不多,那也基本意味著人已經掛了,因為後盤必然被成噸的局部最優解一套帶走,大部分人甚至在這次比賽進行到第一張圖的時候還沒有意識到這點,還覺得李世石這時候領先,只要A過去就贏了,沒錯領先是領先,但這並不妨礙alphago覺得自己優勢很大,然後教小李做人(然而機器並不會做人)

所以說人想要打敗計算機,必須是前半盤建立足夠大的優勢,看起來盤面領先十多目,才能經得起後期AI的各種剝削,如果下到一半發現是細棋,那基本已經已經是死人一個了.

就alphago的前半盤表現看來,如果小李正常下,開局看起來領先十多目還是有指望的,起碼這次接近做到了,只是最後還是下錯崩了.有人會說這棋其實只是李世石有幾步下錯崩了而已,如果沒有神秘力量讓他丟了右下角,你告訴我怎麼輸,先不管客觀上是不是這樣,起碼要意識到兩點,一個是這少數的幾次"翻盤"機會,alphago抓住了,二是人面對弱雞的時候,是不太會失誤的,而且失誤也不影響能贏.

哦,這樣說來盤面十多目可能不夠,因為人會打勺,AI可不會.


一點點地看著整局棋,邊看邊在群里討論。棋局終了,感慨萬千。

由谷歌(而不是微軟或其他科技巨頭)代表科學界與人類的頂級棋手李世石九段對決,具有莫大的象徵意義。

谷歌Google的詞根源自Googol,這個單詞的含意是「10的100次冪」。這是宇宙中可能存在的最大的數字,一切大於這個數字的數學計量都沒有意義。Googol這個數字超過了宇宙中夸克的數目,超過了以普朗克時間計量宇宙壽命的單位數量,超過了一切人類所能想像的大數的極限。當時谷歌選擇10的100次冪來為自己命名,也正表明著自己至高無上、掌控海量信息的雄心。

然而,圍棋的總局數更顯變化莫測,變化超過了10的170次冪。是Googol的10^70倍,完全不是一個數量級。這也意味著:即使宇宙中每個原子都變成一台電腦,晝夜不停地對圍棋進行窮舉法暴力破解,耗盡整個宇宙的壽命,也無法窮盡圍棋的全貌。

這也正是為什麼在深藍擊敗卡斯帕羅夫時,圍棋界絲毫不以為意。圍棋以其遠超國際象棋的深邃演算法,複雜的變化,看上去是人類智力領域不可撼動的堡壘。我在比賽開始前,還和朋友笑談預測,李世石以5:0拿下比賽,毫無難度。甚至在賽前,當大家雖然都謹慎地表示眼下這場人機大戰難言勝負,但一兩年內電腦必定擊敗人腦的時候,我依然樂觀地估計,一兩年內的計算機,依然無法擊敗人類的頂級棋手。

結果這一天來得太快。

為了防止增加圍棋愛好者以外群體閱讀答案的壓力,我不想放太多棋譜,只放兩個給我留下深刻印象的棋局瞬間(不懂圍棋也可以看看文字描述,我盡量說的淺顯易懂):

第一個瞬間

左圖:第61手,黑棋虎在天元,隨後白棋落子紅點標出的位置,一副拉出棋筋積極作戰的架勢。而轉眼間幾回合之後,白棋在右邊頗有氣勢地沿著箭頭所示的方向連續壓下,竟然將剛剛拉出的棋筋棄掉,隨後李世石在A位吃住白兩子棋筋,被分斷的兩塊棋連為一體。

觀棋到此我有兩點感想:

1. 電腦也會出現漏洞,它的思路也會前後矛盾,如果開始就決定一路壓下,則62手完全可以不必拉出棋筋,電腦不是無懈可擊。然而這也顯示了電腦的風格,如果是李世石執白,就算局勢不利,也斷然會拉出作戰。此所謂圍棋棋士的「氣合」。

2. 李世石對電腦還是過於忌憚,走在A位一手固然吃住棋筋,但依然顯得過緩。如果是面對人類棋手的小李,我相信他更可能在左下角落子掛角,以左下角厚勢自然鯨吞白棋兩子。對於從未見過的AI棋手,李世石保留了極大的謹慎。

第二個瞬間

黑棋走到121手的右上角,以為是先手,但白棋按棋理不會乖乖應對,應該騰出手來攻擊右下黑棋一子。

然後白棋走了122位,棋盤下部紅點位的粘。沒有凌厲的攻勢,如此緩慢、沉穩而安靜。一瞬間讓我想到當年的第一人李昌鎬,以及日本的本格派圍棋。就像是兩人激戰正酣,一方突然退到一邊,好整以暇地正了正衣冠。

當時我在群里的評價是:如果這是人類棋手的一著,我會以為他在宣告勝利。

當然後來電腦也真的勝利了。

其實不必看其餘幾場棋的結果,無論後來比分是電腦漂亮的5:0,還是互有勝負的2:3,甚至是李世石驚天逆轉的1:4,今天都應當被銘記。

這一場人機大戰可能是近年來圍棋領域最受關注的一局棋,不但圍棋界為之震動,IT界多名大佬也欣然現身。圍棋界和科技界對比賽結果的預測迥然有異:圍棋界幾乎都保持了對這門古老藝術的驕傲,而科技節大佬都表達了對技術的信心。久不出現在知乎的李開復,寫下長長的答案來論證了他對AI的自信;搜狗CEO王小川,在賽前就高調預測谷歌5:0獲勝,還宣布如果人工智慧最終獲勝,搜狗公司放假一天。王小川不但在網路上發聲,更高調出現在了新浪圍棋的直播現場,與頂尖職業棋手一道成為了本場直播的點評嘉賓。

我依然看好李世石總比分獲勝,我想他調整好心態,以對戰人類棋手的思維作戰,終歸還是可以擊敗電腦。然而這一次就算人類守住顏面,一兩年內,人類智慧領域最後碉堡的失守,也已成定局。

我們這一代人,有幸看到了科學技術的突飛猛進。按照人工智慧發展的指數型發展的趨勢,AI智能將增長極為迅速。上一秒也許還只同我們人類伯仲之間,下一秒就已經遠遠將我們甩在了後面。我們終將面對非常可怕的局面:如果AI發展到跟我們的差距已經到了人類智慧與大猩猩的差距,我們人類的命運走勢將會如何?

所以棋局終了後我在微博感慨道:「到現在都不太接受李世石輸給谷歌,我超級希望谷歌出來闢謠說:其實我們的電腦里啥也沒有,只是桌子底下蹲了個柯潔。」

在所有規則明確的智力領域中,圍棋這最後的堡壘已經失守。四千年來我們附著在圍棋上面高雅的想像、禪意與詩意、意蘊和感悟,如今輸給了電腦內存條里二進位的數字排列組合。文學、藝術、音樂這些人文領域尚未被攻陷,但也許只是時間早晚。

今天的AI程序,在棋局中展示出了不凡的冷靜和掌控,或許在未來,我們會依賴AI投票來為我們做出政治決策,避免人治的偶發衝動;我們會依賴AI制定科學灌溉系統,幫助人類管理廣闊的農田;我們依賴AI設計出新的交通系統,治理擁堵;甚至有一天,連文學家藝術家的工作也被奪走,AI可以直接為我們譜寫歌曲,創作小說,甚至也許有天我想看一部電影,只需要對著Siri說:我想看一部愛情片。Siri就臨場為我們創作一部電影,播放到一半我們還可以說:喂,把那個女的想辦法復活,男主不要出現了,換個胸肌好看的。——然後瞬間Siri就為我們臨場修改,播放出修改後的畫面。

還好,現在的AI,還只是根據人類的指令去贏下李世石的一盤圍棋,它通過與人類棋手的對弈,可以學到人類棋手的招數。那如果AI有一天,通過與人類的交流,學會了人類的欺騙呢?

這也是霍金等科學家告誡人類「警惕人工智慧」背後的深意。

——在今天新浪圍棋直播室里,搜狗CEO王小川就說:機器贏了不可怕,如果機器開始假裝輸給你,那就可怕了。

希望這個預言永遠不會實現。

也許終有一天,AI的智力已經全方位超過人類,可以替代人類的一切工作,就像是我們替代了喵星人的一切工作一樣,AI成為了我們的鏟屎官。他們做好了供電、供水;為我們創作詩篇、音樂、錄製節目;做好建設、開發網站、規劃國家財政。而我們只需要對著AI發布指令,享受現成的生活。

這一天到來的時候,我們慵懶地從床上醒來,我們的AI管家已經守候在我們的床邊。

它或許會會伸出手臂,優雅地把我們的脖頸折斷。

又或許溫柔地幫我們穿上衣服,送上熱氣騰騰的早餐。

the end

----

關於對人工智慧的警惕,拓展閱讀:為什麼有很多名人讓人們警惕人工智慧? - 謝熊貓君的回答

最後,歡迎來關注我的新浪微博:點擊→_→Sina Visitor System @汪有


關於今天alpha go的獲勝,看到一個有趣而且可怕的觀點:

alpha go 的蒙特卡羅樹遇弱則弱,遇強則強;勝率很大時,取勝可行解多,則AI會隨意選擇一個可行解,從而走出「俗手」;而雙方均勢時,取勝可行解少,就會打出力挽狂瀾的神來之筆。所以如果AI走棋「失誤」,就說明你已經輸了。

這就是為什麼今天在李世石使用罕見開局時,alpha go開始表現一般,而當後來李世石認真起來慢慢逆轉卻被alpha go中盤102手,108手和110手以神來之筆奠定勝負,最後勝負已定時alpha go 122手又打出小失誤。

如果真是這樣的,最後alpha go以5:0取勝也就不奇怪了。

===================重新看完nature論文的分割線===========

論文原文的方法也驗證了這個觀點:神經網路在fine tuning階段使用的是win or lose作為分類輸出,而不是輸贏的目數。

細思恐極……

===================來自評論區的補充==============

之前歐洲一戰也體現出這個規律,同樣以一種非碾壓的方式取得5:0完勝。

朋友圈有人慶幸,還好AI沒有為了避開人類注意而佯輸,naive。AI的做法更厲害,就是只贏你那麼一點點…

當全世界人類都在驚訝alpha go在四個月中的進步時,alpha go卻一臉蒙蔽地說:我一直都這麼厲害啊

==================論文鏈接================

要論文的朋友實在太多了,所以就不一一郵件回復。感謝評論區 @Zhaoyuan Zhang 給出的論文鏈接

http://www.willamette.edu/~levenick/cs448/goNature.pdf


我有很不良的預感,小李搞不好要崩盤。

其實軟體碾壓人類的一天早晚都要到來的,只是沒想到軟體進步的速度這麼令人髮指。竟然可以在這麼幾個月時間裡提升到和一流高手爭鋒的層面上。

我這個主要是從心理層面上說的,而不是技術層面。

1.小李賽前放話放得太狠了。

賽前說要以5:0的成績橫掃軟體。棋類在競技體育項目里有一定的特殊性,這個項目不僅僅要求你有爭勝心和自信心,在這裡,平常心是極為重要的一條。賽前抱著一定要贏的心態,對技術的影響是很大的。在對局過程中,想贏怕輸的心理帶來的技術變形一直是棋手需要克服的心理障礙之一。賽前小李既然如此放話,在他心裡這每一盤棋都是輸不得的,一旦對局處於劣勢,心理上的波動和恐慌會帶來很多計算上的盲點,臨場的感覺就是接連好幾手發現自己忽略了對方的手段,然後在這過程中越下越慌,心裡越來越亂,直至盤面崩潰。

其實如果小李一開始不放狠話,抱著跟機器交流的心態去下,會不會好一點?不過抱這種心態去下棋的小李就不是小李了。

2.比賽允許調整狀態的時間太短了。

下一輪比賽僅僅在一天之後,而今天,小李是承受了巨大的心理落差的。賽前認為自己可以碾壓軟體,沒想到第一盤上來先讓軟體贏了一盤,很容易影響到小李的自信心,會開始懷疑自己的實力。而且小李背負的東西實在是太多了,而軟體是不會有心理變化的。小李身上巨大的壓力,以及今天首敗帶來的心態失衡,棋手應該都能理解,這種心理打擊一天之內真的很難調整過來,哪怕小李已經身經百戰。棋手的成長過程中,應該都感受過輸完一盤沒恢復過來,接二連三輸的事情吧?

3.自信心受挫。

其實輸一盤棋倒沒什麼大不了的,但對於小李來說,他面臨著兩個問題:(1)賽前覺得不可能贏他的軟體,一上來就把自己贏了;(2)他根本不知道軟體實力的上限。而其中(2)對自信心的打擊更為致命。哪怕明知道對手比你強,如果同為超一流,對方比你強多少你是可以感覺到的,而以小李的水平,足以讓他不管碰到什麼樣的棋手,都清楚明白自己依然有取勝的可能,因為差距是有限的。

而目前對於小李而言,他面對的是未知。一盤棋是不足以讓他看清軟體的實力的。

我一個圈外人士都為小李提心弔膽的……加油啊小李。


不了解圍棋但懂machine learning的人來說幾句:

1. 李世石輸給了人類最大的特點也是最大缺陷之一:心態和情緒波動。與其敗給了AlphaGo不如說是敗給了自己。

2. 由上可知,在執行需要強邏輯的任務時,情感,情緒,心態這些都是冗餘和干擾。搞AI也好machine learning也好,開發強邏輯機器時這些特點都是不必要的,所以擔心AI會有種種心機的,等圖靈測試真正被通過之後再擔心吧。(2014年那個所謂通過有爭議。)

3. 再次強調 machine learning背後都是演算法,演算法,演算法,沒有心機和情感只有數學和公式。要把心機情感這些考慮進去,也是developer把演算法加進去再給以權重。

4. 其實AlphaGo的缺陷還是蠻明顯的,幾乎就是machine learning演算法的缺陷。具體等白天把那篇nature拿出來細細分析。

5. 可惜棋手不懂machine learning的演算法,不然會更容易打敗AI. 同理如果AlphaGo的開發者如果能有圍棋九段水平,估計優化出的演算法會更好。

6. 雖然肉體在牆外隨意看YouTube,但騰訊古力九段和幾個職業棋手解說還是非常好看的。幾個職業棋手真的智商很高,尤其古力九段對AlphaGo特點的點評,幾乎概括出了AlphaGo演算法的優點和缺點。

7. 只顧搞演算法理論發paper的諸位你萌要感謝工業界啊,沒有硬體就沒有大家今天愉快地跑各種複雜演算法。

8. 宣揚人工智慧威脅論以及盲目樂觀AlphaGo演算法缺陷的,看懂這篇nature再發表觀點。


柯潔(賽前):

我看了AlphaGo和樊麾的五局棋,它倆水平差不多,但是樊麾出現了一些失誤,所以被5:0零封。

但是我和李世石都是強於樊麾的,所以我看好李世石在讓先甚至讓2的情況下5:0零封AlphaGo。

我不想和它下,我怕它學我的一些棋招。

還是柯潔(第一局後):

它(AlphaGo)棋風像我。

我和AlphaGo避免不了有一戰。

AlphaGo在接下來的棋局中至少還能贏1局,甚至5:0也不是沒有可能。

我想靜靜,我第一次失去自信。

我在另一個問題下的回答:

如何評價李世乭? - 知乎用戶的回答


我不談圍棋,雖然我下過幾年但是已經忘得差不多。我也不談演算法,因為我覺得我的水平還夠不上指點。我覺得這個問題下大家表現出的感嘆沒有什麼道理,這不是什麼計算機對人類的勝利。只是合理而有效的思考方式的又一次勝利。

對於這個結果我毫不意外,凡是有科學素養的人,我覺得對於這個結果都應該毫不奇怪。

說白了,圍棋再複雜也是有規則的。有規則就有模式,有模式就可以找策略來識別。複雜性再高有現實世界複雜嗎?不能因為複雜性太高就認為沒有辦法研究。制定一個簡單的策略然後反覆的學習訓練也是可以取得效果的。天氣這種混沌系統,我們都能做到有限時間內的預報,圍棋沒有道理做不出。

簡化條件,建立模型,隔離法整體法。這些都是我們從初中開始就學過的科學方法。抽象簡化後的世界雖然和真實有所出入,但是仍然能很大程度上的幫助我們認識世界。

我以前的哲學教授和我說過黑格爾的惡的無限性。她說一個事物,從不同角度看得到不一樣的一面,無限個角度有無限個面。但是這又什麼用呢?只會妨礙我們的認知。只有抓住主要的幾個面去認識事物,才能取得認知。簡單來說就是不要貪大求全,想別一次性窮盡所有的變化,先看主要矛盾。

圍棋固然複雜,但是別抱著一次性就窮盡所有複雜性的心態去認知,惡的無限性會讓你什麼都認知不到。簡化條件和策略,減小認知的範圍和角度,是可以取得一定成果的。然後再一點點的完善模型。這就是這次勝利背後的思考方式。

驚嘆於圍棋的複雜性。然後推崇直覺致勝論。這太愚蠢了。剛開始學圍棋的時候,不也是一點點從基本技術學起,慢慢探索推理,從簡單到複雜嗎?再複雜也不該成為放棄探索規律的理由。更不該因為無法窮盡變化而自豪得意,我覺得這反而是對人類自己的侮辱。


推薦閱讀:

如何看待 Deepmind 宣稱最新版 AlphaGo 能讓李世乭版本 AlphaGo 三子?
為什麼很多會下圍棋的人都瞧不起聶衛平?
吳清源有柯潔厲害嗎?下得過AIphago嗎?
如何評價聶衛平,他在圍棋史上的地位如何?
聶衛平為什麼被稱為棋聖?

TAG:人工智慧 | 圍棋 | 機器學習 | AlphaGo | 李世乭 |