大家好,今天給大家讀的雜誌是《自然》,就是英國著名的那本《Nature》,它應該是人類科學自然科學雜誌里的頭一號,創刊時間是1869年,是個老爺爺一樣的雜誌。今天咱們讀的是2016年1月28號出刊的這本。封面故事是《電腦人工智慧戰勝人類圍棋職業高手》。 人工智慧啊,我們每個人好像都能聽見它越來越接近的腳步聲了,這次它又狠狠地向前邁了一大步。圍棋是人類發明的最複雜的棋類遊戲,這個沒有之一,最複雜。在此之前,人類高手對電腦那是絕對優勢,也幫我們人類守著這塊尊嚴和陣地吧。但是就在最近,這個陣地塌了一個角,到底發生了什麼?背後有什麼故事?而且圍棋領域的人機大戰,一場終級決戰將會在2016年3月8號上演,你想知道這次對決的雙方是誰嗎?聽完這期音頻你就都知道了。 《自然》雜誌的原文上來是從一件過去的事說起,1997年一個名叫「深藍」的電腦第一次戰勝了俄羅斯的國際象棋高手,震驚了世界。9年之後,也就是2006年,國際象棋的人類高手最後一次戰勝電腦,之後就下不過了,等於說從第一次戰勝到完全超過人類,電腦用了九年,而且和電腦對抗智力,你這個陣地一旦一丟,將來好像再也沒有奪回來的可能了。 但是圍棋電腦一直下不過人類,主要有兩個原因,一個原因是計算量太大,還有一個,圍棋很多時候它的招數是比較抽象的,要理解這兩點的意思,需要大致知道一下圍棋的玩法。 在《自然》的官網上,給這篇文章配了一個視頻,裡面用最短的語言介紹了圍棋的玩法,圍棋就是一張19×19格子的棋盤,19×19就得到的361個點,那麼黑棋和白棋輪流往這些點上放子,這個子放上去就不能動了,看黑棋和白棋誰能占這個點超過50%,因為你佔到51%,對方不就只有49%了嗎?於是誰就贏了。 好,規則聽上去就是這麼簡單,但是這個玩法就帶來兩個特點,第一就是它的變化非常多,原文中說了一組數字,一盤國際象棋最大的可能性是10的47次方,而一盤圍棋,就按圍棋的平均長度算,大概是10的170次方,也就是1後面加170個0,這是個大得可怕的數字,文中說,這個數字比整個宇宙的原子數量還多,所以第一,就是計算量非常大。 第二,就是圍棋在最開始下的時候,棋盤是空空的,所以說前面幾個子的可能性非常多,或者說非常抽象,而對於抽象的東西,電腦就不太靈。所以在此之前,人類高手對電腦基本就是砍瓜切菜,但是這次逆轉發生在2015年10月,電腦機器人第一次戰勝了人類圍棋職業高手,比分是5:0,完勝。 先說對戰雙方,人類這邊是歐洲冠軍,叫樊麾,他是個中國人,從小就下棋,目前的段位是職業二段,水平反正在歐洲是夠用了,基本是橫掃,有點像乒乓球隊,中國一個國手到了歐洲就挑大樑的那種感覺。有人可能會說,我聽說圍棋最厲害的人是九段,你戰勝一個二段,沒什麼了不起吧?不過請注意,圍棋的職業二段和九段的差距沒有想像中那麼大,圍棋的段位就是一個參考,有的時候一些職業的五六段也能戰勝九段,所以說段位不是一個絕對標準,有點像網球世界排名第80和第8名,也不是沒得打,而樊麾的對手,就是這台電腦,它有個名字叫Alpha Go,Go就是英語中圍棋的意思,也就是日語里圍棋的發音,而且大家都沒想到,就是Alpha Go的開發者,竟然是做搜索起家的,就是大名鼎鼎的谷歌,說到這兒的時候,《自然》雜誌把電腦戰勝人類這件事說成了一個feat,就是英語中的feat,直接翻譯過來就是豐功偉業,這個詞選得非常大,我幫大家搜了一下feat這個詞的造句,一般都是說一些英雄乾的大事,什麼鄭和下西洋什麼的,所以說從這個選詞可以看出《自然》雜誌對於這個事非常看重。 那麼比賽的細節是什麼呢?比賽的細節,《自然》雜誌里說得不多,我給大家收集了一下,中國的《華西都市報》的記者通過微信採訪了樊麾,就是這個歐洲冠軍,樊麾說下棋的時候,不是在電腦上拿滑鼠下的,而是像傳統的那樣,用棋盤和棋子下的,在樊麾對面坐著個工作人員,就當電腦的傀儡吧,就是他負責擺子。 補充一點,這種傳統的下法在中國古代有一個專有的名詞,叫手談,也是形容圍棋的,就是說兩個人是在用手來交談,之所以選擇這種比較傳統的方式,是為了讓樊麾儘可能地感到熟悉,這樣可以充分發揮水平。樊麾說他全程沒有感到對方是電腦,感到就是個中規中矩的高手,而且非常強大,他原文用了四個字,叫做像一堵牆。事後五盤的棋譜都公布出來了,於是大家圍棋愛好者、高手紛紛過來就圍觀,看看樊麾怎麼敗的,大家一看,輸得不冤。五盤棋里只有一盤是下到最後階段的,剩下四盤都是中途認輸。圍棋的規矩有點像拳擊比賽,就是如果比賽很膠著,那就打到最後,雙方拼點數,比如紅方112:109,於是紅方勝了。但是也有中途擊倒的獲勝,就是圍棋里,經常中途一方就覺得自己肯定不行了,就沒必要下了,於是就中途認輸了,就像拳擊里被擊倒了一樣,那麼這五盤比賽,只有第一盤下到最後,剩下的四盤全是中途被擊倒。 大家可以戳一下文稿,我們一起看一張樊麾比賽現場的截圖,這個圖裡有亮點,大家看到拍照的這一刻,樊麾的雙手是在空中舞動的,而且是模糊的,動得還挺快,但圍棋下棋的時候,手是不用飛到天上去的,所以一看,就是樊麾當時輸棋了,所以非常激動,手都揮起來了。
好,那這五盤棋譜不都出來了嗎?於是大家就趕緊盯住這個棋譜看,希望分析出Alpha的棋風,現在普遍認為,它的棋風非常正統,就不講究那些野蠻的無理棋,什麼我不想好好下,你也別想好好下,沒有,就非常正統。 同時,前期布局的時候,樊麾都能占那麼一點便宜,但是到了中盤,就被Alpha一點一點往回扳,那麼圍棋下到中盤的時候,往往伴隨著一些激烈的戰鬥,這個被稱為中盤絞殺,這就需要非常強的計算能力,這時候Alpha電腦就佔了上風,而且越到後來,Alpha就越精準明,簡直是天衣無縫,所以越到後來越絕望。 那麼Alpha憑什麼這麼厲害呢?咱們還是回到《自然》雜誌里,原文說,Alpha使用了一種叫做深度思維,原文是deepmind,深度思維的計算模式,這個模式中有兩個網路,第一個叫做價值網路,是Value network。還有一個叫做策略網路,Policy network。什麼意思呢?咱們先說價值網路,說白了就是負責控制計算的廣度,寬廣的廣。因為圍棋的可能性太多了,不可能電腦把每一種可能性都一路算到黑,這樣你電腦的計算量太大了,而這個價值網路就做判斷,就是哪些是肯定不靠譜的招數,就不用想了,比如說上來就把你的棋子給對方吃,這肯定不行。這就跟打拳擊,你上來就給自己臉上一拳,這倒是可以,但是這種事就不用考慮了,這是價值網路乾的,負責控制思想的廣度。 第二個呢,策略網路,策略網路控制的是思維的深度,它就用自己超強的運算能力,就是深挖剛說的六個點,哪個短期對戰局好,哪個長期對戰局好,因為你知道每個點都意味著一個完整的遊戲不同的走勢。所以Alpha內部就是這兩個,等於是一個點、一個面的網路在輪流發揮作用。 同時,Alpha還具備一個人類絕對沒有的優點,就是它沒有人類的情緒的起伏還有生理上的疲憊,高手對決,其實就是比誰不犯錯誤,一旦你犯了錯誤,你就會被對方攻擊,於是你的情緒就受影響,情緒低落,很快就惡性循環,而電腦呢?沒有情緒,我沒有壓力,我也不會唉聲嘆氣,我也不會得意忘形,這一點它完勝人類。 好,上面就是大致的戰況吧。在《自然》這篇文章的最後,預報了一次終極決戰,2016年3月8號,Alpha將出戰世界圍棋頂尖高手李世石,這是個韓國人。 從過去十年的數據來看,韓國棋手李世石可以代表人類圍棋的最高水平。可能很多人說,怎麼到這個時候沒找個中國高手,找個韓國人來代表我們博大精深的圍棋?大哥,這都什麼時候了!你還有功夫琢磨哪國,是吧?人類都快被超越了。 那麼這次終極決戰大家怎麼看呢?我給大家收集了一些名人的看法,中國19歲的年輕小將柯潔九段看好李世石,順便說一句,柯潔最近連續戰勝李世石,所以他的話是有參考價值的,他在春節期間,在微博上發話說,只能說李世石運氣太好了,以現在計算機的實力,戰勝李世石的可能性不到5%。 為什麼柯潔說運氣好呢?因為背後還有錢啊,谷歌這次掏了一百萬美元,李世石贏了就拿走,輸了就不用罰款,等於說就只賺不賠,這太好了,所以柯潔的意思是說,李世石這根本就是在取錢。 被稱為四大業餘天王的棋手胡煜清八段認為,目前Alpha軟體的水平就是業餘五段到六段,同時棋手王煜輝七段也持相同的觀點,他認為Alpha可能還不到六段,這是棋手們普遍的觀點,他們認為李世石的贏面比較大。 那麼我們聽聽另外一邊。谷歌「深度思考」工程的總裁表示,他希望提醒這些看好李世石的棋手們,提醒你們,Alpha是一個會進步的系統,他當時接受一個記者採訪,他對記者說,甚至我在和你交談的時候,這個系統也在進步。聽了真是怪厲害的。要知道戰勝樊麾是五個月之前的事,這五個月的時間,誰知道它又學了什麼新招? 而搜狗公司的CEO王小川的判斷更加大膽,他提出了斷言,斷言一,Alpha Go將會完勝李世石。斷言二,除了圍棋,人工智慧在其他博弈類封閉遊戲里也會橫掃一切,完勝人類。 好,那麼人類的代表李世石怎麼看呢? 最近李世石發表了一份聲明,他說我很榮幸能夠對戰谷歌發明的人工智慧系統,我認為這將是圍棋史上最重要的一場比賽,因此,我接受了挑戰,我很有信心贏得比賽。 哎呀,這話聽上去有點像套話,就是我們最需要李世石說點人話的時候,結果他反而說的話有點像機器人說的,這是臨陣的鎮定呢?還是為了掩蓋內心的緊張呢? 3月8號,Alpha對抗人類,你更看好哪一邊呢? 撰稿:懷沙 講述:懷沙
推薦閱讀:
※迅游手游加速器這款軟體有什麼特點?
※軟體的圖形用戶界面(GUI)設計能夠申請專利保護嗎?
※ps技巧|照片變素描,可以這麼美!
※Bootstrap 項目推薦
※打車軟體:便捷背後存隱憂 專車之路在何方?
TAG:人類 | 軟體 | 圍棋 | 挑戰 | 圍棋軟體 | 谷歌 |