如何評價alphago連贏3局,最終贏得系列比賽?
3月12日下午,AlphaGo第三次戰勝李世乭
這個結果其實第一局之後就已經註定了。
因為AI的實力,即使在這幾天之內也不停的提升,而人類的棋士,除非有特別的變故,否則實力基本不可能在一夜之間暴漲。如果第一局不能表現出上手對下手的壓倒性優勢,則AI必然在短時間內超越人類對局者。實際上,這一盤李世石已經下崩了,基本是脆敗。展現出來的實力差距,已經達到讓子的程度!目前公認狀態最好的最強者柯傑,戰績上達成讓李世石降級(8:2)也花了一年多,而AI只需要數月甚至幾天,所以不服氣者希望請其他棋手出山的念頭也趁早斷了。
但是人類,是一種愚蠢的生物,有時候必敗的局面,也會奮戰不息,為的就是尋找那萬分之一的機會,即使自己不能成功,也要為其他人照亮前路。李世石後半盤近乎於玉碎般「攪棋」,實際上根本不可能改變勝負,他要做的就是用自己身上的傷口,讓其他棋士看明白AI的刀法如何。所謂的勇敢,就是知道會輸,也絕不後退。人類的情懷,在AI看來蠻不可理喻的吧。三局中,次局質量最高,但是這個第三局更加可以幫助人們看清楚實際情況————對局者之間的實力差距,已經達到了讓子的程度了。那個名字叫做下棋的AI的列車,已經風馳電掣的開過去了,只留下人類在原地風中凌亂。首先我站在一個業餘選手的角度上總結一下整盤棋。
開局第五步,李世石下出了自己從未在職業賽場上的冷門布局。第十步的時候,電腦亮出了自己鮮明的特色:儘可能將棋局往戰鬥狀態引導。
但是看過李世石棋的人都知道,他是一個從不懼怕挑戰的男人,即使自己對面是還算不上是一個人。
於是強硬的選擇了開戰,並且逐漸將戰火蔓延成4塊黑棋與4塊白棋的絞殺。
這時候人與機器最根本的區別開始發揮作用。
機器因不能窮盡棋盤的變化,其設計人員轉而將其設計為局部區域的求最優解的演算法。這就導致了一個與人類棋手截然不同的風格。
在面對一個可下可不下的局部變化時,人類會更傾向於將變化保留。用棋院總指導孫國梁教練的說法,就是把它養著,雙方心照不宣的把它留著,待周圍環境發生變化,這個當初無關緊要的局部變化也許將成為對某一方極其有利的勝負手。
這就是所謂先後,也是圍棋里蘊含的重要哲理之一:我今天不下不代表我永遠不下,我只是埋下一顆種子,在未來某種情況下也許會變成壓垮駱駝的最後一根稻草。
但是我們的阿發狗先生不會這樣想。縱然它對於落子先後的理解已經有職業選手的風範,但是演算法的設定令它很難將這種所謂「可能存在的機會」具體量化。
於是阿發狗先生出現了第一次也是最關鍵的一次「人類棋手不會選擇的」的做法:將上方變化幾乎下完。從而成為導致其之後無法放開手腳與李世石絞殺的根源。
這就是圍棋千年以來所積累下經驗的價值,這種價值你說不清道不明,因為它無法被真正量化。一步棋今天下能讓你獲得局部一目左右的便宜,而明天下它有可能讓你虧一目,但是同樣有可能讓你因這一步而獲得某場戰役的勝利,從而奠定比賽的勝局。
之後比賽的進程如國手古力先生預計的一樣,棋局朝著對李世石有利的一面發展。
進入中盤時,人類選手李世石帶著幾乎壓倒性的優勢。這個優勢要量化的話,大約在十目到二十目之間。
以致於比賽現場的一些記者都談笑著去喝茶了。
但是,成也周瑜,敗也周瑜。就在全人類都以為李世石勝券在握的時候,阿發狗先生站出來說了一聲不。
當然,他並不是因為不甘失敗,他只是依據著自己天生的演算法,做著和前半盤一樣的事情。
只是前半盤的李世石已經不見。
千百年積累下來的經驗轉化為對電腦的的優勢的同時,求穩的心態開始對他的下法起了微妙的影響。
情緒從一開始的無所畏懼開始變成有所羈絆,這種羈絆就是電腦永遠不會有的。
就像我們從來無法要求馬雲永遠保持著初創阿里時的奮鬥意志一樣,看著大局已定,他對於僅剩的棋盤右側的爭鬥顯得無心戀戰而掉以輕心。
有人說這是放水,谷歌許了李世石第二天股價大漲的分紅。
我不置評論,我只知道自己看到了一種幾乎每一個優勢方都會有的心態。而戰局從此開始扭轉。
王磊六段也說道,李世石就是那種逆境中能夠激發出無限鬥志,但順境中容易自滿的選手。
這是飛禽島少年的性格,這種性格令其在職業賽場上幾乎所向無敵。眾所周知,其面對中國棋手古力的幾次國際決賽對決,有很多都是逆境翻盤。越是逆境,越是冷靜到冷酷。
這種性格也同樣令每一個坐在他對面的人類膽寒。
只不過這次坐在他對面的不是人類,而是一台機器。機器沒有恐懼,機器沒有人類無法避免的心理變化。
阿發狗,它永遠在海量的變化里尋找自己想要的,無論現在是順風還是逆風。它不會因為現在是順境,就放棄值80分的激進策略轉而選擇只值60分的保守策略。
於是,李世石還是一而再再而三的遭到阿發狗的逼宮,割讓出自己棋盤右側的土地。
而官子階段,更是阿發狗的強項,70%的棋盤已經填上棋子,其計算能力開始大發神威,每一步都像手術刀走在最精準的部位,這讓人類中的官子聖手李昌鎬都自嘆不如。
十目的優勢就這樣一點點蠶食直至化為泡影。
最終,代表人類出戰的李世石先生在山窮水盡時選擇了投子認輸。
阿發狗成為人類歷史上第一位在公開公正的圍棋比賽中戰勝人類的頂尖棋手。只不過和當年深藍戰勝卡斯帕羅夫不一樣的是,與其說是阿發狗戰勝了人類的智慧,不如說是李世石敗給了自己性格里還不夠完美的一面。
不像當年的國際象棋,無論棋局進行到哪一步,換世界上任何一個人來戰都只能鎩羽而歸。
今天的對局,在中盤大優勢的情況下,若是換成古力或者較低段位的職業選手,勝率都在八成以上。
更或者,李世石若能出去抽支煙(他是煙鬼)回來,冷靜一下,也不至於出現右半盤面的嚴重判斷失誤。
這就是電腦令人類膽寒的地方,就像終結者中將人類視為其生存威脅的天網會永無止境的追殺人類,電腦無論何時都不會受局勢左右或者改變自己走下一步棋的初衷:尋找當前狀態下勝率最高的一手。
當李世石瓦解了自己的頑強意志,動搖了自己開局時的心態,面對每一步都追求精確的計算機,人類棋手的失敗毫無懸念。
當然,五番棋還有四盤,我不能說人類在這次比賽中就真的輸了。相反,今天的棋局給了李世石指了一條戰勝電腦的明路:學著像電腦那樣了無羈絆,無論盤面是優是劣。
因為很明顯,論棋藝的高低和下法的深遠思考,電腦與人類還有著長足的差距。從古力的現場解說就聽得出,阿發狗在大局觀上的判斷還處於業餘與職業的交界。
只是電腦是一個越戰越勇的鬥士,因為面臨的樹狀選擇越來越少,後半盤的電腦幾乎就是一個自帶精準點目的超九段棋手,想要在它手裡守住人類前半盤的優勢是需要堅韌意志和清醒頭腦的。
ANYWAY,我還是相信在圍棋這個人類至今為止設計出的最複雜的競技遊戲里,電腦與我們還有著一段距離,即使這段距離也許在不久的將來會被抹去。
但是至少不是現在。
本文作者:浙江大學信電系luoliang學長。
聊足球,也聊一切。學的雜了。
怎麼可能!第四局我裝作死機了!
alphago的核心處理器等價於李哥的大腦,按對弈時間為4小時計。人工智慧能耗為2e9焦耳,合500大卡。一包速食麵或者三兩麵條。世石哥多吃點或者找個相撲選手去?
想當初,AlphaGo戰勝樊麾的棋譜在職業高手眼中還很稚嫩。如今,不管李世石怎麼不及當年勇,畢竟還是一個職業九段,而且在職業九段中還是水平較高的存在。前三盤棋應該可以看出,AlphaGo的「水平」已經達到了相當高的層次。看來阿法狗每天左右手互搏100萬次進步神速啊。不過話又說回來,李世石是殭屍流的代表,布局並不是他眾多技術中的最強項,而這同樣不是AlphaGo的擅長之處。而李世石擅長的後期,恰恰又是AlphaGo比較擅長的。與此說來,李世石也許並不是對陣AlphaGo的最合適人選。
推薦閱讀:
※2016年李開復老師分析 AlphaGo 的文章還有存在的價值嗎?
※為什麼人工智慧領域把圍棋視作擊敗人類的「最後一道壁壘」,圍棋特別在哪?
※若使用AlphaGo訓練人類,能提升人類圍棋造詣嗎?
※李世石VSAlphaGo第二局,直播室一個李博士說AlphaGo可以自己修改源程序,真的嗎??
※圍棋中黑白棋子至少要各多少枚剛剛好?