谷歌圍棋軟體挑戰人類

06-10

大家好，今天給大家讀的雜誌是《自然》，就是英國著名的那本《Nature》，它應該是人類科學自然科學雜誌里的頭一號，創刊時間是1869年，是個老爺爺一樣的雜誌。今天咱們讀的是2016年1月28號出刊的這本。封面故事是《電腦人工智慧戰勝人類圍棋職業高手》。　　人工智慧啊，我們每個人好像都能聽見它越來越接近的腳步聲了，這次它又狠狠地向前邁了一大步。圍棋是人類發明的最複雜的棋類遊戲，這個沒有之一，最複雜。在此之前，人類高手對電腦那是絕對優勢，也幫我們人類守著這塊尊嚴和陣地吧。但是就在最近，這個陣地塌了一個角，到底發生了什麼？背後有什麼故事？而且圍棋領域的人機大戰，一場終級決戰將會在2016年3月8號上演，你想知道這次對決的雙方是誰嗎？聽完這期音頻你就都知道了。　　《自然》雜誌的原文上來是從一件過去的事說起，1997年一個名叫「深藍」的電腦第一次戰勝了俄羅斯的國際象棋高手，震驚了世界。9年之後，也就是2006年，國際象棋的人類高手最後一次戰勝電腦，之後就下不過了，等於說從第一次戰勝到完全超過人類，電腦用了九年，而且和電腦對抗智力，你這個陣地一旦一丟，將來好像再也沒有奪回來的可能了。　　但是圍棋電腦一直下不過人類，主要有兩個原因，一個原因是計算量太大，還有一個，圍棋很多時候它的招數是比較抽象的，要理解這兩點的意思，需要大致知道一下圍棋的玩法。　　在《自然》的官網上，給這篇文章配了一個視頻，裡面用最短的語言介紹了圍棋的玩法，圍棋就是一張19×19格子的棋盤，19×19就得到的361個點，那麼黑棋和白棋輪流往這些點上放子，這個子放上去就不能動了，看黑棋和白棋誰能占這個點超過50%，因為你佔到51%，對方不就只有49%了嗎？於是誰就贏了。　　好，規則聽上去就是這麼簡單，但是這個玩法就帶來兩個特點，第一就是它的變化非常多，原文中說了一組數字，一盤國際象棋最大的可能性是10的47次方，而一盤圍棋，就按圍棋的平均長度算，大概是10的170次方，也就是1後面加170個0，這是個大得可怕的數字，文中說，這個數字比整個宇宙的原子數量還多，所以第一，就是計算量非常大。　　第二，就是圍棋在最開始下的時候，棋盤是空空的，所以說前面幾個子的可能性非常多，或者說非常抽象，而對於抽象的東西，電腦就不太靈。所以在此之前，人類高手對電腦基本就是砍瓜切菜，但是這次逆轉發生在2015年10月，電腦機器人第一次戰勝了人類圍棋職業高手，比分是5：0，完勝。　　先說對戰雙方，人類這邊是歐洲冠軍，叫樊麾，他是個中國人，從小就下棋，目前的段位是職業二段，水平反正在歐洲是夠用了，基本是橫掃，有點像乒乓球隊，中國一個國手到了歐洲就挑大樑的那種感覺。有人可能會說，我聽說圍棋最厲害的人是九段，你戰勝一個二段，沒什麼了不起吧？不過請注意，圍棋的職業二段和九段的差距沒有想像中那麼大，圍棋的段位就是一個參考，有的時候一些職業的五六段也能戰勝九段，所以說段位不是一個絕對標準，有點像網球世界排名第80和第8名，也不是沒得打，而樊麾的對手，就是這台電腦，它有個名字叫Alpha Go，Go就是英語中圍棋的意思，也就是日語里圍棋的發音，而且大家都沒想到，就是Alpha Go的開發者，竟然是做搜索起家的，就是大名鼎鼎的谷歌，說到這兒的時候，《自然》雜誌把電腦戰勝人類這件事說成了一個feat，就是英語中的feat，直接翻譯過來就是豐功偉業，這個詞選得非常大，我幫大家搜了一下feat這個詞的造句，一般都是說一些英雄乾的大事，什麼鄭和下西洋什麼的，所以說從這個選詞可以看出《自然》雜誌對於這個事非常看重。　　那麼比賽的細節是什麼呢？比賽的細節，《自然》雜誌里說得不多，我給大家收集了一下，中國的《華西都市報》的記者通過微信採訪了樊麾，就是這個歐洲冠軍，樊麾說下棋的時候，不是在電腦上拿滑鼠下的，而是像傳統的那樣，用棋盤和棋子下的，在樊麾對面坐著個工作人員，就當電腦的傀儡吧，就是他負責擺子。　　補充一點，這種傳統的下法在中國古代有一個專有的名詞，叫手談，也是形容圍棋的，就是說兩個人是在用手來交談，之所以選擇這種比較傳統的方式，是為了讓樊麾儘可能地感到熟悉，這樣可以充分發揮水平。樊麾說他全程沒有感到對方是電腦，感到就是個中規中矩的高手，而且非常強大，他原文用了四個字，叫做像一堵牆。事後五盤的棋譜都公布出來了，於是大家圍棋愛好者、高手紛紛過來就圍觀，看看樊麾怎麼敗的，大家一看，輸得不冤。五盤棋里只有一盤是下到最後階段的，剩下四盤都是中途認輸。圍棋的規矩有點像拳擊比賽，就是如果比賽很膠著，那就打到最後，雙方拼點數，比如紅方112：109，於是紅方勝了。但是也有中途擊倒的獲勝，就是圍棋里，經常中途一方就覺得自己肯定不行了，就沒必要下了，於是就中途認輸了，就像拳擊里被擊倒了一樣，那麼這五盤比賽，只有第一盤下到最後，剩下的四盤全是中途被擊倒。　　大家可以戳一下文稿，我們一起看一張樊麾比賽現場的截圖，這個圖裡有亮點，大家看到拍照的這一刻，樊麾的雙手是在空中舞動的，而且是模糊的，動得還挺快，但圍棋下棋的時候，手是不用飛到天上去的，所以一看，就是樊麾當時輸棋了，所以非常激動，手都揮起來了。

　　好，那這五盤棋譜不都出來了嗎？於是大家就趕緊盯住這個棋譜看，希望分析出Alpha的棋風，現在普遍認為，它的棋風非常正統，就不講究那些野蠻的無理棋，什麼我不想好好下，你也別想好好下，沒有，就非常正統。　　同時，前期布局的時候，樊麾都能占那麼一點便宜，但是到了中盤，就被Alpha一點一點往回扳，那麼圍棋下到中盤的時候，往往伴隨著一些激烈的戰鬥，這個被稱為中盤絞殺，這就需要非常強的計算能力，這時候Alpha電腦就佔了上風，而且越到後來，Alpha就越精準明，簡直是天衣無縫，所以越到後來越絕望。　　那麼Alpha憑什麼這麼厲害呢？咱們還是回到《自然》雜誌里，原文說，Alpha使用了一種叫做深度思維，原文是deepmind，深度思維的計算模式，這個模式中有兩個網路，第一個叫做價值網路，是Value network。還有一個叫做策略網路，Policy network。什麼意思呢？咱們先說價值網路，說白了就是負責控制計算的廣度，寬廣的廣。因為圍棋的可能性太多了，不可能電腦把每一種可能性都一路算到黑，這樣你電腦的計算量太大了，而這個價值網路就做判斷，就是哪些是肯定不靠譜的招數，就不用想了，比如說上來就把你的棋子給對方吃，這肯定不行。這就跟打拳擊，你上來就給自己臉上一拳，這倒是可以，但是這種事就不用考慮了，這是價值網路乾的，負責控制思想的廣度。　　第二個呢，策略網路，策略網路控制的是思維的深度，它就用自己超強的運算能力，就是深挖剛說的六個點，哪個短期對戰局好，哪個長期對戰局好，因為你知道每個點都意味著一個完整的遊戲不同的走勢。所以Alpha內部就是這兩個，等於是一個點、一個面的網路在輪流發揮作用。　　同時，Alpha還具備一個人類絕對沒有的優點，就是它沒有人類的情緒的起伏還有生理上的疲憊，高手對決，其實就是比誰不犯錯誤，一旦你犯了錯誤，你就會被對方攻擊，於是你的情緒就受影響，情緒低落，很快就惡性循環，而電腦呢？沒有情緒，我沒有壓力，我也不會唉聲嘆氣，我也不會得意忘形，這一點它完勝人類。　　好，上面就是大致的戰況吧。在《自然》這篇文章的最後，預報了一次終極決戰，2016年3月8號，Alpha將出戰世界圍棋頂尖高手李世石，這是個韓國人。　　從過去十年的數據來看，韓國棋手李世石可以代表人類圍棋的最高水平。可能很多人說，怎麼到這個時候沒找個中國高手，找個韓國人來代表我們博大精深的圍棋？大哥，這都什麼時候了！你還有功夫琢磨哪國，是吧？人類都快被超越了。　　那麼這次終極決戰大家怎麼看呢？我給大家收集了一些名人的看法，中國19歲的年輕小將柯潔九段看好李世石，順便說一句，柯潔最近連續戰勝李世石，所以他的話是有參考價值的，他在春節期間，在微博上發話說，只能說李世石運氣太好了，以現在計算機的實力，戰勝李世石的可能性不到5%。　　為什麼柯潔說運氣好呢？因為背後還有錢啊，谷歌這次掏了一百萬美元，李世石贏了就拿走，輸了就不用罰款，等於說就只賺不賠，這太好了，所以柯潔的意思是說，李世石這根本就是在取錢。　　被稱為四大業餘天王的棋手胡煜清八段認為，目前Alpha軟體的水平就是業餘五段到六段，同時棋手王煜輝七段也持相同的觀點，他認為Alpha可能還不到六段，這是棋手們普遍的觀點，他們認為李世石的贏面比較大。　　那麼我們聽聽另外一邊。谷歌「深度思考」工程的總裁表示，他希望提醒這些看好李世石的棋手們，提醒你們，Alpha是一個會進步的系統，他當時接受一個記者採訪，他對記者說，甚至我在和你交談的時候，這個系統也在進步。聽了真是怪厲害的。要知道戰勝樊麾是五個月之前的事，這五個月的時間，誰知道它又學了什麼新招？　　而搜狗公司的CEO王小川的判斷更加大膽，他提出了斷言，斷言一，Alpha Go將會完勝李世石。斷言二，除了圍棋，人工智慧在其他博弈類封閉遊戲里也會橫掃一切，完勝人類。　　好，那麼人類的代表李世石怎麼看呢？　　最近李世石發表了一份聲明，他說我很榮幸能夠對戰谷歌發明的人工智慧系統，我認為這將是圍棋史上最重要的一場比賽，因此，我接受了挑戰，我很有信心贏得比賽。　　哎呀，這話聽上去有點像套話，就是我們最需要李世石說點人話的時候，結果他反而說的話有點像機器人說的，這是臨陣的鎮定呢？還是為了掩蓋內心的緊張呢？　　3月8號，Alpha對抗人類，你更看好哪一邊呢？　　撰稿：懷沙　　講述：懷沙
推薦閱讀：

※迅游手游加速器這款軟體有什麼特點？
※軟體的圖形用戶界面(GUI)設計能夠申請專利保護嗎?
※ps技巧｜照片變素描，可以這麼美！
※Bootstrap 項目推薦
※打車軟體：便捷背後存隱憂專車之路在何方？

TAG:人類 | 軟體 | 圍棋 | 挑戰 | 圍棋軟體 | 谷歌 |