千年未有之大變局:關於DeepMind團隊AlphaGo的更多信息

城頭變幻大王旗2016年1月28日,Google公司DeepMind團隊在Nature雜誌上發表學術論文,介紹了人工智慧的圍棋程序AlphaGo的構建原理與具體實現,同時宣布AlphaGo在分先的公平對局條件下以5:0的成績擊敗了職業棋手樊麾。這是人工智慧領域了不起的成就。我讀了這篇Nature文章,也看了網上的很多評論。我的專業水平不足以做科普,我的圍棋水平也不足以衡量AlphaGo的棋力。下面是關於AlphaGo的一些信息,比賽信息來自於Nature文章,其餘來自於網上文章。AlphaGo與樊麾的比賽:1、2015年10月5-9日,連續五天比賽。五局勝負制,無論勝負如何,五局都要下完。2、每天兩盤棋,第一盤是正式比賽(慢棋,1小時加3次30秒的讀秒),第二盤是非正式比賽(快棋,只有3次30秒的讀秒)。3、分先對局,採用中國圍棋規則(黑棋貼7.5目)。4、最後成績只記錄正式比賽結果。5、比賽規則在比賽之前就已經確定,得到樊麾的認可。6、AlphaGo在正式比賽(慢棋)中以5:0戰勝樊麾。樊麾3次執黑(第一、三、五局);第一局AlphaGo執白2.5目勝樊麾,其餘四局都是中盤勝。7、AlphaGo在非正式比賽(快棋)中以3:2戰勝樊麾。樊麾2次執黑(第一、三局);5盤都是中盤勝。AlphaGo與其他電腦的比賽:1、對手為CrazyStone、Zen、Pachi、Fuego、GnuGo,他們和AlphaGo一樣,都是單機版。具體版本和棋力如下:AlphaGo(無),CrazyStone(2015,KGS 6d)、Zen(5, KGS 6d)、Pachi(10.99,KGS 2d)、Fuego(svn1989,無)、GnuGo(3.8,2k)。KGS大致相當於國內圍棋網站如弈城、新浪、Tom等。2、還有一個更強的對手,Distributed AlphaGo,即分散式的AlphaGo。3、AlphaGo和Distributed AlphaGo的演算法是相同的,差別在於硬體資源。AlphaGo有48個CPU和8個GPU,而Distributed AlphaGo有1202個CPU和176個GPU。作為比較,CrazyStone只有32個CPU,而Zen只有8個CPU。4、AlphaGo慢棋5:0勝職業二段樊麾,快棋3:2勝樊麾。5、電腦之間的比賽,每步棋最多5秒鐘。6、AlphaGo(單機版)比其他電腦強很多:495局比賽中,只輸了1局;在與CrazyStone、Zen和Pachi的讓四子對局中,AlphaGo的勝率分別是77%、86%和99%。7、Distributed AlphaGo的棋力更強,他對單機版AlphaGo的勝率是77%,對其他電腦是100%。關於電腦的棋力:1、AlphaGo之前的電腦可以算是業餘高手,CrazyStone和Zen都是KGS 6d,大致是弈城6d或者更好一些的水平,大概是業餘5段的水平。2、職業棋手對此前電腦(大致是Zen)棋力的評價:周俊勛和俞斌都說能讓4-5子,羅洗河說能讓9子。估計也應該有業5的水平。3、職業棋手認為AlphaGo的棋力應該有職業水準,大致是頂尖棋手先二的水平。也就是說,頂尖棋手可以讓先或者讓二子。4、AlphaGo對Zen的讓四子對局,勝率為86%。Distributed AlphaGo的棋力更強,他對單機版AlphaGo的勝率是77%。5、Nature文章估計,AlphaGo的棋力大致是職業二段(樊麾是職業二段,也是用來衡量棋力的標尺)。從文章給出的誤差棒來看,樊麾的水平(誤差棒)在1p-4p之間(也許是9d-5p,反正起伏很大就是了),而AlphaGo的水平很穩定,就是2p。Distributed AlphaGo的棋力大概是4-5p。6、因為所有的對局都是去年10月之前的,AlphaGo現在的棋力應該是更強了。7、已經公布的信息不足以推斷AlphaGo的棋力,只知道他至少具有業餘頂尖高手的棋力, 強於樊麾,弱於Distributed AlphaGo。關於AlphaGo與李世石的比賽:1、比賽時間是今年3月,地點是韓國首都漢城。五局勝負制,無論勝負如何,五局都要下完。出戰李世石的是AlphaGo而不是Distributed AlphaGo。2、業餘愛好者都看好李世石,職業棋手認為沒問題,AI專家認為值得期望。柯潔(目前中國排名第一的棋手,也是現在世界最強的棋手)認為AlphaGo取勝的機會不到5%。3、李世石是冠軍數最多、人氣最高、名聲最大的現役棋手,他出來拿這100萬美元的廣告費是實至名歸的。4、當事人都謹慎樂觀:李世石說要爭取4:1或5:0;DeepMind團隊很有信心,認為大致是五五開。5、第一局比賽非常重要。對於李世石來說更是如此。6、形勢對李世石非常不利。「勝之不武,弗勝為笑」。李世石在明、AlphaGo在暗。AlphaGo知己知彼,而李世石知己而不知彼。AlphaGo肯定研究過李世石的所有棋譜,甚至與李世石交過手的棋手的所有棋譜;AlphaGo的有效棋譜只有5-10盤,甚至連這幾盤棋譜也談不上有效,因為這些棋譜顯示不了他的真實棋力,只能說明他比樊麾二段強。不知道比賽協議里有沒有說在比賽前給李世石提供足夠的棋譜,即使提供了李世石也很難得到多少有效信息。7、我看好李世石,我認為至少是七三開(前幾天我認為是九一)。我認為AlphaGo和李世石應該都能贏至少一盤棋。李世石應該是4:1拿下比賽。如果直落三局的話,有可能是3:2.山雨欲來風滿樓附錄一: 學術論文google公司DeepMind團隊Mastering the game of Go with deep neural networks and tree searchDavidSilver, Aja Huang,......,Demis HassabisA computer Go program based on deep neural networks defeats a human professional player to achieve one of the grand challenges of artificial intelligence.Nature 529, 484–489 (28 January 2016) doi:10.1038/nature16961 Received 11 November 2015 Accepted 05 January 2016 Published online 27 January 2016Facebook公司(田淵棟,Yan Zhu)Better Computer Go Player with Neural Network and Long-term PredictionYuandong Tian, Yan Zhu(Submitted on 19 Nov 2015 (v1), last revised 26 Jan 2016 (this version, v2))http://arxiv.org/abs/1511.06410附錄二: 棋界反響新浪專題: 圍棋人工智慧來襲http://sports.sina.com.cn/zt_d/deepmindalphago人工智慧5-0歐洲冠軍 李世石將捍衛人類尊嚴http://sports.sina.com.cn/go/2016-01-28/doc-ifxnzanh0180135.shtml李世石:請人類支持我 爭取不讓電腦贏到2盤http://sports.sina.com.cn/go/2016-01-30/doc-ifxnzanh0405068.shtml世界冠軍談谷歌圍棋:人類應放下自己的驕傲http://sports.sina.com.cn/go/2016-01-30/doc-ifxnzanh0397466.shtml樊麾裁判設計者專家談谷歌圍棋 或戰勝李世石http://sports.sina.com.cn/go/2016-01-30/doc-ifxnzanm3838179.shtml文章來源:環球科學附錄三:知乎科普如何看待Google圍棋AI AlphaGo擊敗歐洲圍棋冠軍?https://www.zhihu.com/question/39905662田淵棟,卡耐基梅隆大學機器人系博士,Facebook人工智慧組研究員https://www.zhihu.com/people/tian-yuan-dong附錄四:我的看法1、棋力很難從棋譜上估計出來的。終究是盤上見勝負,旁觀者很難看出來的。就像日本人當年評價中國的古棋,有說黃龍士中盤十三段的,也有說范施不過業6的,但是也有人說公道話:不到棋盤上下一下,誰也不知道他到底有多強。對林海峰的評價也類似:林先生的棋看起來一點也不厲害,可是你坐到棋盤對面,就能感覺到他的力量了。2、我看了第一局樊麾(黑)對AlphaGo的棋譜。 白136,居然在圍中腹,儼然宇宙流的架勢。 通盤沒有劫爭,沒有轉換,不知道為什麼。按理說,他們這種棋手,劫爭、轉換是必然的啊。 眼看著要輸棋,也不用勝負手,就這麼輸掉了, 太奇怪了。難道AlphaGo的形勢判斷、局面控制能力都非常強?劫爭、轉換、懲罰無理手,無論哪個都很強?按說不應該啊。一眾職業棋手說他是先二的水平,未免太託大了。 就算是柯潔對陣樊麾,也沒有橫掃五蛋的把握吧?3、剛看了AlphaGo對戰李世石的新聞發布會,DeepMind信心滿滿,自認為勝負五五開。不知道他們為什麼這麼牛,難道對樊沒有出全力?4、要跟AlphaGo對局,必須進行戰鬥,鋪地板肯定是不行的,一定要做劫、轉換。李昌鎬上場也不一定必勝,因為他的看家本領是不出錯;老聶上場估計不行,因為他雖然前五十步天下第一,但是後半盤的漏招太多;曹燕子、古大力之類的上去,估計收拾AlphaGo就像收拾菜一樣,說不定擺上兩子都能贏。所以說,這次比賽,李世石必勝!5、期待三月的對局,我相信李世石會贏。他肯定會做戰、糾纏、劫爭、轉換,希望電腦能拿下一局,要是成了黔之驢的話,就太無趣了。6、好在很快就要和李世石比賽了。是騾子是馬,拉出來遛遛。我覺得李世石肯定能拿下來,但是,圍棋能堅持幾年呢?也許五年,也許十年,但絕對不是遙遙無期了。有感於DeepMind擊敗圍棋職業選手http://blog.sciencenet.cn/blog-1319915-953005.html圍棋之幸與不幸http://blog.sciencenet.cn/blog-1319915-953081.html關於AlphaGo戰勝職業棋手的一些評論http://blog.sciencenet.cn/home.php?mod=space&uid=1319915&do=blog&id=953190千年未有之大變局:關於DeepMind團隊AlphaGo的更多信息http://blog.sciencenet.cn/blog-1319915-953678.html千年未有之大變局,我們適逢其會了。PS:居然置頂了。那就補充一些信息。現在網路上對這件事情的討論很多、很熱烈,但是坦率地說,價值並不大——因為絕大部分都是事後諸葛亮。另外幾個就是當事人了:DeepMind信心十足,當然你可以認為他是在給自己打氣;樊麾認為對手非常強大,當然你可以認為他是在給自己的失敗找借口;李世石認為自己肯定贏,但是他沒有任何對手的有效信息,AlphaGo和樊麾的那幾盤棋能夠告訴李的信息量基本為零。我只見到一個局外人預見到了這件事情。2014年底,他就認為現有技術已經可以使得電腦在圍棋上戰勝人類了。所以,他的意見是值得考慮的——他認為,這次李世石很可能會輸的。馬駿 編輯於 2016-01-29https://www.zhihu.com/question/39906815/answer/83954700立個FLAG,能戰勝。雖然AlphaGO和樊麾比賽的時候,棋力是弱職業選手水平,但已經證明這條路走對了(更重要的是,終於有大公司投錢搞圍棋AI了),接下來提高水平只是時間問題。雖然從去年10月到今年3月,AlphaGO是否已經進步了足夠多能夠戰勝李世石,我也沒有100%的把握,但這不重要。是今年3月超過,還是再過幾個月超過,長期來看無關緊要,重要的是在不遠的將來,AI和人類圍棋水平的差距,必將達到賽跑水平的差距。所以我這次先大膽投給AlphaGO了。附一個我2014年立的FLAG,當時大家對圍棋AI的前景還很悲觀:圍棋作為唯一一種電腦下不贏人的大眾棋類,是何原因導致?以及量子計算機出現後有無可能? - 馬駿的回答馬駿 發佈於 2014-12-23 :https://www.zhihu.com/question/27169866/answer/35693685以目前的硬體水平,已經足以在圍棋上擊敗人類了,根本沒量子計算機什麼事。目前下不過人類,只是因為沒人去研究圍棋演算法,畢竟在歐美不夠流行。http://www.ifanr.com/476606這個新聞里的演算法是非常非常粗糙的,訓練集也很小,就已經有很好的效果了。只要有人願意出錢研究,戰勝職業棋手只是時間問題。
推薦閱讀:

讓熟睡的蛇繼續睡吧:關於蛇咬傷的預防和治療信息
主管功名利祿的是哪位神仙 - 神仙譜系 - 宗教頻道 - 鐘鳴網 - 彙集海內外的信息綜合...
於宏潔信息:穩行在高處
無訟閱讀|冒用他人身份信息登記結婚會遇到哪些法律問題?
食品包裝上的信息,你讀懂了嗎?

TAG:AlphaGo | 團隊 | 信息 | 關於 | 更多信息 |