如何看待2016年3月柯潔表示 AlphaGo「贏不了我」?
該微博系由柯潔以認證賬號於2016年3月9日發布。
就算阿法狗戰勝了李世石,但它贏不了我 來自柯潔大棋渣
相關問題:
AlphaGo 與李世石的對戰會推動人類的極限還是機器學習的進步和覺醒? - 人工智慧
DeepMind 研發的圍棋 AI AlphaGo 系統是如何下棋的? - 深度學習(Deep Learning)
如何評價第一局比賽 AlphaGo 戰勝李世石? - 人工智慧
戰勝李世石的第二局比賽中 AlphaGo 的表現如何? - 谷歌 (Google)
如何評價第二局比賽 AlphaGo 又戰勝李世石? - 人工智慧
從圍棋角度看李世石與 AlphaGo 的第二局比賽有哪些關鍵之處? - 人工智慧
如何看待人機大戰第四局李世乭戰勝 AlphaGo? - 人工智慧
柯潔輸掉了一場明知一定會輸的比賽,除了一眾覺得他毫無勝算的旁觀者,即便是他自己,也早有預料。在鋪天蓋地的關於「AlphaGo為什麼會贏」、「AlphaGo到底有多強」的分析中,我們試圖解答一個問題,作為一個懷有強烈求勝心的「當今世界圍棋第一人」,曾認為「亞軍就是失敗」的柯潔,為什麼要接受這樣一場註定會輸的挑戰?
2017.5.22 23:25 賽前深夜
決戰前夜,接近零點的23點25分,柯潔更新了微博,發了篇文章,「決戰前夕,感慨萬千」之後,便再度強調: 「無論輸贏,這都將是我與人工智慧最後的三盤對局。」
這並不是柯潔因人機對戰而經歷的第一個不眠夜。十天前,還處在備戰期的他凌晨1點半還在發微博,給自己泡了一碗面,說:「我泡的,是寂寞。」 中國棋院領隊華學明告訴每日人物,這是柯潔心態發生變化的時期。
一個月前的柯潔還是滿懷信心的,覺得自己有贏的可能和希望:「我會盡最大努力下好自己的棋,抱有必勝心態、必死信念,不會輕易言敗。」 一個月後,因為某些原因,柯潔突然覺得自己一定會輸,心態也有了起伏。至於這個原因到底是什麼,華學明諱莫如深。
柯潔幾乎是最後一個覺得自己一定會輸的人。此次人機大戰的日程敲定後,聶衛平、古力、王小川等棋界、科技界名人都先後表示了對結果的悲觀,「棋聖」聶衛平話說的很直接:「柯潔的水平與AlphaGo差距太大,將以0比3完敗。」
賽前,歐洲的博彩業開出的盤口是:柯潔獲勝的賠率為1:8,即如果投1塊錢,柯潔贏了可賺到7塊,而AlphaGo贏了只能賺到5分。
如果時光倒流,一年前的柯潔絕不會認為自己毫無勝算。
14個月前的2016年春天,柯潔的身份是李世石與AlphaGo 「人機大戰」的解說嘉賓。李世石首場戰敗後,柯潔發了條微博:「AlphaGo贏得了李世石,但它贏不了我。」那時,他的微博名叫「柯潔大棋渣」。
那是AlphaGo第一次公開亮相,在演算法上還存在一些漏洞,柯潔完全沒有將其放在眼中,在轉發一篇名為《圍棋,人類已經下不過谷歌AI》的文章時,他寫道:「谷歌懸賞100萬美刀與李世石下,只能說李世石運氣太好,以現在這個計算機的實力,戰勝李世石的可能性不到5%。」
14個月前與AlphaGo對弈的李世石。圖 / 來源網路
數萬網友火速跑來圍觀口出狂言的柯潔,其中很多人並不知道柯潔是誰,柯潔只好自我介紹了一番:「我叫做柯潔,1997年出生。現在暫時是世界圍棋第一人(特地用了暫時,謙虛是美德)。正式比賽我是單盤8:2碾壓李世石(他贏的兩盤沒有任何作用),世界冠軍獲得過三次(此年齡如此成績前無古人)大小國內賽事冠軍數次,我本來不想提這些,因為我是一個低調的人,是你們逼我的。」
三天後,李世石連敗三場,再次評價AlphaGo時,柯潔說:「這確實是有史以來我見過最強大的對手!」
2017.5.23 09:00 賽前一個半小時
「世界上最聰明的人之一」戴密斯·哈薩比斯。圖 / CFP
柯潔直到比賽開始的一個半小時前才第一次見到AlphaGo之父——人工智慧公司DeepMind的創始人兼CEO戴密斯?哈薩比斯。
這位被國外媒體評價為「世界上最聰明的人之一」的科技極客走進開幕式會場的第一件事,便是和坐在嘉賓區左側第一排的棋手一一握手。他迅速表明立場——機器從來就不是站在棋手的對立面,「我們是希望藉助偉大棋手的力量,幫助發現AlphaGo的缺陷。」
在現場記者長槍短炮的包圍下,柯潔站在哈薩比斯和谷歌董事長施密特中間與他們微笑合影。哈薩比斯說,無論這次「人機大戰」的結果如何,「本質上都是人類的勝利,就像人類探索哈勃望遠鏡一樣,AlphaGo是在與棋手一起探索圍棋的奧秘。柯潔是一個真正的天才,相信他和AlphaGo的對弈,將開啟一個新的天地。」
比賽開始前半小時,華學明特意去了趟主辦方預留的柯潔專屬休息室,她有點不放心,「他畢竟還只是一個孩子」。她推開門看到柯潔正靠在椅子上閉目養神,他到底在想什麼還是什麼都沒想,無人知曉。
一場比賽,受到如此大的關注,實在是因為AlphaGo真的太驚人。
AlphaGo第一次在公眾視野中正式亮相是2016年1月27日,國際頂尖期刊《自然》發布了一則封面報道:人工智慧機器人AlphaGo在沒有任何讓子的情況下,以5:0的戰績完勝歐洲圍棋冠軍、職業二段選手樊麾。這是電腦圍棋程式第一次公平擊敗職業圍棋棋手。
賽後,英國圍棋協會主席喬恩?戴蒙德接受採訪時表示:「這場比賽之前,我曾預計,計算機程序能夠擊敗人類頂級圍棋選手,起碼要等到5至10年後。」
這不僅是一篇封面報道,還是一篇DeepMind關於AlphaGo的深度解析論文。文章顯示,DeepMind為AlphaGo搭建了一個「將人類的直覺賦予了計算機」的神經網路——16萬盤人類棋手的棋譜被輸入AlphaGo,在學習了人類落子布局的特徵後,它又自我對弈3000萬盤,不斷提高神經網路的精度。
目前,國際職業圍棋棋手排名採取Elo等級分制度。AlphaGo的進步令柯潔感到難以置信——擊敗樊麾時,它的Elo在 3000 左右,而到了李世石時,這一數值已經達到了 3500 左右。Elo從3000到3500,AlphaGo 只用了五個月,而柯潔將自己的Elo從 3300 提升至 3600,則用了將近五年。
「跟AI相比,人類棋手的進步簡直就像蝸牛一樣。」柯潔說。
2017.5.23 10:30 開局
柯潔是有備而來的。
在第三手(即第三次落子)時,柯潔把棋子落在的左上角點三三的位置,第七手,又在右下角相同的位置落了一子。這兩子讓圍觀的棋手和觀眾大呼驚訝。
圍棋是圈地遊戲,對於橫縱各19個點的棋盤來說,「三三」這個位置有些偏低,在傳統的圍棋下法中,並不被廣泛認可。但這個在人類棋手的價值體系里被視為幾乎是「禁區」的選擇,卻是AlphaGo在過去一年比賽中的慣用招數。而這正是AlphaGo給圍棋世界帶來的顛覆——許多從前下出來會「會被老師打屁股」的棋,在AlphaGo的世界裡,卻是將棋局推向勝利的穩定保障。
擔任比賽解說的張璇八段覺得,柯潔之所以走這兩步,是「以彼之道,還之彼身」。
「他今天肯定是有針對性的,如果今天他對面坐的不是AlphaGo而是人類棋手,我想他肯定不會這麼下的。」在第一場比賽結束前半小時,華學明告訴每日人物,面對柯潔如此的嘗試和表現,有媒體評價他「越來越像AlphaGo了」。
之所以會兩次落子「三三」,這是AlphaGo給予柯潔的教訓和啟發。
柯潔開局的兩手,是深入研究AlphaGo之後的心得
2016年歲末至2017年年初, AlphaGo的2.0版本以Master之名在奕城和野狐兩大圍棋網站踢館,在60場網上快棋公測中,通殺中日韓頂尖職業高手,唯一一次平局也是因為對手意外斷開了網路連接。
柯潔也在被「通殺」的名單中,那是Master取得的第50勝,對弈時間是2017年1月3日晚上。這並不是柯潔第一次與人工智慧交手,早在2016年11月19日,國產AI「絕藝」也戰勝了世界排名第一的柯潔。
在AlphaGo出現前,柯潔一度對認為自己已經至少掌握了圍棋之道的50%,但多次被人工智慧擊敗後,他說:「我發現自己對圍棋的認識可能百分之一都不到。AlphaGo多的時候一天可以下上億盤,而人的一生也就下2、3萬盤棋。」
柯潔承認,自己對於圍棋的認知受到了巨大衝擊:「我終於明白,之前我們崇拜人類獨有的智力只因我們沉迷於用感覺來總結知識,用喜好來判斷價值。曾經我認為,不會有機器能夠擊敗人類棋手,但是現在AlphaGo改變了整個棋手的生態環境。」而在輸給Master後,每當被問及去年春天的口出狂言,柯潔都會解釋一句:「我當時說的是能贏與李世石對弈的那個版本。」
柯潔也在失敗中學到了很多。過去一年,他用了很大精力研究圍棋軟體,仔細分析了Master的60盤棋譜,試圖理解對方的行棋下法:「它的布局、開局都是超越人類的想像,可能超過人類幾千年把,可能幾千年之後也不會出現這樣的招法。」
「快速行棋,不拘一格,猛撈實地。」這是柯潔總結的AlphaGo的特點,而這也是很多人眼中柯潔的棋風:極強的勝負心和出色的計算力,在下棋時對於整個棋盤有著宏觀的價值判斷。顯然,這種相似已經在剛剛結束的這盤對弈中有所體現。
2017.5.23 15:55 收官
柯潔的半個頭總是時不時地擋住直播期間棋盤的畫面。對弈時,他習慣性地前傾身體,整個上半身恨不得趴在棋盤上,彷彿這樣便可以把棋面局勢分析得更清楚。
柯潔的小動作一貫很多。一直盯著直播的網友甚至剪出了一套「世界冠軍」的表情包:托腮、歪脖、扶額、捂嘴、抓頭髮、挖耳朵……
收官階段的柯潔
比賽最後幾分鐘的收官階段對柯潔而言是痛苦的,他抓起頭髮的動作越來越頻繁,臉上的五官也擠在一起,中國圍棋協會秘書長華以剛說,「他以前在新聞發布會上聽到尖銳的問題時,也是這樣的表情。」
在裁判數子的幾分鐘里,柯潔一直沒閑著,右手西裝的袖子被他擼上去一截,露出一段小臂,他的手指在盛著白子的棋罐里往複徘徊,不一會兒,又在桌上把棋罐一圈圈地轉動,還時不時地抬起頭和對面為AlphaGo行棋的黃士傑博士交流幾句。
直播的特寫鏡頭捕捉到了一個瞬間:柯潔一邊輕輕地搖了搖頭,一邊用手指觸碰著棋盤,嘴角勾出了一抹淺笑。
5月23日下午15點55分左右,裁判拿起話筒,宣布柯潔以1/4子告負。談及那個笑容,柯潔說:「就是苦笑,因為輸了嘛,它下得太好了,我輸得沒脾氣。」
對於柯潔的表現,擔任解說員的劉瑩九段表示柯潔始終沒有放棄,兌現了賽前「堅持到最後一刻」的承諾,「他今天很有服務精神。」
決定接受AlphaGo的再次挑戰,柯潔將其視為職責所在,他指著手邊的棋盤說:「我自己從這裡得到了很多,榮譽、收入……我不懼怕任何AI的邀戰,只要棋迷愛看,我們不能因為怕輸而拒絕,你享受了圍棋帶給你的榮耀,也有責任去為圍棋界承擔更多。」
「哈利早就知道會這樣了,他知道他的身體不會這樣一直靜靜地躺在森林的地面上,為了證明自己的勝利,伏地魔一定會去踐踏、侮辱他的遺體……」2017年3月18日,柯潔做客央視一套《朗讀者》節目,朗讀了《哈利波特與死亡聖器》的一段節選,他說要將這段朗讀獻給來自未來的對手。
當時,柯潔已經決定正式應戰AlphaGo,但對陣的時間地點尚未確定。當天早些時候,他還在中國棋院接受了一家媒體的採訪,「AI衝擊以後,很多事情就感覺看得都特別開,唉,輸就輸吧,我只要儘力過。」柯潔說。
在《朗讀者》的現場,主持人董卿也問了關於「輸」的問題,柯潔答:「如果這場輸了會被人嘲笑,但我不會怕,怕就等於輸了一輩子。」
5月21日,最後的人機大戰將在兩天後上演,此時的柯潔已經因為某些原因覺得自己一定會輸,但在接受賽前最後一次視頻採訪時,他說:「大部分人覺得我下這個棋沒有意義,但是我是一名棋手,我就應該有奮鬥拼搏的精神,所以我覺得我不能慫。」
2017.5.23 16:30 賽後採訪
出現在賽後新聞發布會現場的柯潔顯得有些疲憊,肩膀微微向下沉,輕輕地弓著背,在工作人員的護送下快步走向嘉賓席。
試圖靠近柯潔去拍照記者被一一攔截下來,微博和微信的界面在柯潔的手機上不斷切換。當搖臂掃過他時,新聞發布會現場的大屏幕上出現了柯潔的臉,他看到後皺了下眉,臉上露出了一絲羞澀。
對於剛剛結束的這場比賽,柯潔做了簡單的復盤:「今天這盤棋我一直在貫徹先撈後洗,就是先把鈔票攥在手上,但是沒想到角落還是被它撈走了,後面就完全進入了它的調子中。」他說,「去年第一次見到AlphaGo時,我覺得它還是很接近人的,但現在已經是越來越接近圍棋的上帝了,它真的太厲害了。」
但顯然,即便AlphaGo再厲害,它也只能得到柯潔的尊重,而非喜愛,在那篇戰前發表的微博長文中,柯潔寫道:「與人類相比,我感覺不到它對圍棋的熱情和熱愛。對它而言...它的熱情——也只不過是運轉速度過快導致CPU發熱罷了。」
他讚歎人工智慧的未來,「如果AI真能造福人類的話,我們的尊嚴根本算不上什麼。有時候也會覺得我們其實是幸運的,首當其衝被AI衝擊和改變,未來如何被AI改變,我們的體會要比普通人更深一點。」但他也在新聞發布會上明確表示:「我還是喜歡和人下棋。」
但目前,和人下棋,柯潔是有煩惱的。
今年5月初,柯潔戰勝李喆挺進首屆新奧杯世界圍棋公開賽決賽,這是他第6次闖入世界大賽決賽。但他卻在賽後發了牢騷,因為自己的比賽沒人看。
「比賽結束後打開手機翻閱各大主流媒體網站,硬是沒有找到和圍棋兩字有關的新聞,有些事啊,真的不想自己去說,可是我不說,好像沒幾個人知道。沒錯,我又進世界大賽決賽了。我又贏了。」這是柯潔當時在微博上的吐槽。
作為棋手,柯潔有一種天生的使命感,其一是要贏,其二是希望能有更多的人喜歡圍棋,因為,在他看來,「圍棋是人類智慧的盛典」。在AlphaGo與李世石一戰後不久,瘋狂漲粉的柯潔發布了一則「微博更名啟示」,將自己的微博ID由「柯潔大棋渣」改為「棋士柯潔」,「我想是時候普及一波中華國粹、古代四藝之一圍棋了,」他說,「衷心地希望中國圍棋越來越好!」
為什麼要參加一場輸贏看似已定的比賽?華學明說這是柯潔在過去的一個多月里最在意的質疑,除了「不能因為怕輸而慫」之外,柯潔在過往採訪中也給出過和「微博吐槽」相似的答案:「現在的圍棋沒人愛看,即便電視直播,也沒人愛看,似乎只有人機對戰,大家才能提起興趣。」
於是他決定應戰,即便他曾多次表示「亞軍就是失敗」。柯潔說:「希望更多的人來關注圍棋,把它當作很好玩的遊戲就行。」 他早已聲明這將是他與人工智慧最後的三盤對局,旁觀者也心知肚明——柯潔之後,或許將再無人機大戰。
「不眠夜,且看且珍惜。請大家欣賞我最後的三盤人機大戰。」這是柯潔那篇戰前微博長文的最後一句話,他為此文取的標題是——《最後的決戰》。
圖 / 來源網路
文 / 姚胤米 編輯 / 金石
每人互動
AlphaGo的勝利,是AI的勝利還是人的勝利?
文章為每日人物原創,尊重原創,侵權必究。
想看更多,請移步每日人物微信公號(ID:meirirenwu)。
大家都看到他天才不羈、年少輕狂的一面,我卻看出了柯潔身為一名圍棋手的擔當。
也許所有人都明白,千古以來無數驚才絕艷之人苦苦追求的神之一手,是終究能被代碼所窮盡的。但在被時代的車輪碾過之前,請允許那些身負無數流派無數淵源的圍棋手們,能夠在冰冷的數據面前維繫住尊嚴。柯潔作為當世圍棋第一人,如果他不發聲,就代表著整個圍棋界的心氣都要沒了。
明知不可為而為之,雖千萬人吾往矣。
一條由1997年出生的年輕人於2016年發出的大白話微博,卻不知怎麼的,讓我想起了千年前的荊軻刺秦的勇氣。
「此其義或成或不成,然其立意較然,不欺其志,名垂後世,豈妄也哉!」
Update:
也許在絕對的實力碾壓面前,所有對技藝的打磨對圍棋之道的虔誠都只是笑話;也許在歷史的車輪面前,所有的年少熱血終會被碾過;也許李世石九段的「神之一手」會成為人類棋手最後一次戰勝AI。
但無論如何,我會一直堅信,所有知其不可為而為之的勇敢,都是人類能夠繼續前行的最大依靠。轉眼一個多月過去了,對柯潔和alphago這事的態度我基本還是維持原來觀點,不過就柯潔這一個多月的各種表現來看,小孩兒行為上心態上,還是有很多需要成長的地方啊。
——————————————————————————————————
柯潔賽後採訪大家可以去看,他其實提到了相信終有一天alphago會戰勝人類,並沒有盲目自信。而且在樂視直播的時候你也能感受到他其實非常認可alphago的實力。那為什麼回來還會發這樣的微博呢?
隨便講兩點原因吧:一是看以往他比賽的採訪,就是一個年輕氣盛的小孩兒,愛在賽前說出以通常觀點來看非常「狂妄」的話,諸如說李世石勝率不足5%,「傳奇是時候落幕」這樣的話(當然最後也實現了,這真是他非常有魅力且有趣的地方),人有千百種活法,何必讓自己背上那麼多包袱呢?年輕時候口出狂言又如何呢?柯潔性格就是如此,這反而會使他在大賽關鍵時刻保持良好心態;
二是,大家不要太小看柯潔,他說話並不僅僅只是熱血上腦,之前他也說過覺得圍棋界太過冷門,可能需要他這樣的人多講點有趣的話來讓圍棋受到更多的關注。以今天微博來看,這個目的達到了不是嗎?有更多的人了解了他從而了解圍棋,進而對圍棋產生興趣,這一定是他樂於見到的。說出這樣的話需要何等勇氣,甚至會有以後被打臉嘲諷的危險,他不可能沒想到,只是,那又如何呢?得與失,本來就不是這樣計算的,身為現在圍棋界下的最好的人之一,他小小年紀就有這樣的覺悟和擔當,真的很令人感動啊。
——————————————————————————
補充,為了證明我不是隨口吹他還是翻了下柯潔原來的一段採訪貼出來……
柯潔在此時不站出來,圍棋界可能就會陷入一段黑暗時期了。
這是非常冷靜,負責任,有擔當,有自我犧牲精神的表率。正如好萊塢大片中永遠會出現的戰前演說。我在此很支持柯潔,因為他在很可能已經很清楚自己會被打臉的情況下,仍然有勇氣站出來,把話說得這樣滿,同時並沒有損害任何人的利益,這種態度令人稱讚。
如果看不到這一層,以為只是「年輕棋手的狂言/傲氣」,那也太不懂人情世故了吧。即使認為自己很可能會輸,也必須這麼說。這是最好的宣傳圍棋的機會。
從前面對人類棋手,這麼說,是有調整心態的成分。但這次面對前所未見的未知強敵,這麼說,就是另一個層次的原因了。
看昨天直播,柯潔特意說圍甲聯賽棋手的著裝不夠正式,也有類似的考慮。這次走網紅路線,其後的用心同樣一致。
即使人類真的在某一天後永遠不敵電腦,其實也沒有什麼。引入某些娛樂化因素,或是資本介入,都是很好的吸引新人的辦法。就像電子競技直播做得紅紅火火,圍棋競技同樣可以。
UPDATE:第四盤,AlphaGo 的盲點出來了。我之前在另一個帖子 李世乭能戰勝 AlphaGo 嗎? - Peng Bo 的回答 說過,邏輯性是 DNN 的盲點,可以誤導 MCTS 的展開。AlphaGo 的某些怪招是走入了錯誤的變化,而不全是什麼神之一手天外飛仙。同時 AlphaGo 也會出現盲區。正是如此。許多做機器學習的朋友不了解電腦圍棋,如果真看過電腦圍棋,會發現和跑個 ImageNet 的程度不一樣。電腦圍棋未來會完美戰勝人類棋手,但恐怕不是今天。NOT TODAY。我一直在看多個平台的直播,柯潔真是太厲害,對局面和變化的判斷完爆其它棋手。機器的極限在哪裡,人類可以幫助驗證。人類的極限在哪裡,機器可以幫助驗證。其實即使對於人工智慧研究,最完美的情況也並不是碾壓李世石,而是我們看到人機之間的此消彼長,互相學習。圍棋是一個極其有趣的問題,希望看到它能為人工智慧研究貢獻更多世界的奧秘,而不是如此輕易地被徹底解決。對於柯潔這句話所帶來的影響,我不在這裡多吹捧了。有興趣的話可以移步如何評價柯潔? - 不會功夫的潘達的回答。
這裡著重討論柯潔這句話實現的可能性。
即使是今天小李被3:0擊敗以後,我仍然認為柯潔有希望贏AlphaGo一盤棋。比較這幾盤棋在不同平台上的直播,當前的柯潔,擁有比其它一流棋手更精準的判斷力。總體而言,柯潔也比其它對手更少犯錯。同時,柯潔的棋比較全面,常有從大局上碾壓對手(小李又躺槍)的棋局。這些是柯潔有機會戰勝AlphaGo的基礎。
然而這些還不夠。從AlphaGo對樊麾授二子對局仍有80%勝率的傳言來看,AlphaGo的實力"至少"是「略微」超過柯潔的。
重點來了。柯潔的機會將出現在執白的時候。不,我不是要說柯潔執白很強。雖然柯潔去年執白勝率達95%,但重點在AlphaGo這邊。
在AlphaGo執黑的第二局中,DeepMind團隊透露,前半盤一直相當接近。這意味著小李前半盤下得不輸給AlphaGo嗎?不全是。請看 @田淵棟 博士開發的AI-黑暗森林對本局的勝率分析DarkForest對AlphaGo和李世石前兩局每步的勝率估計(僅供參考) - 遠東軼事 - 知乎專欄:
田淵棟博士提到,「一開始黑棋勝率都會低點,但與棋力關係不大。」 這句話很關鍵。事實上,在第一手還沒落下前,黑方的勝率就落後,正是7.5目的貼目過多的一個旁證。我用自己電腦上的單機版Zen實驗,貼7.5目時,黑方第一手的勝率也穩定在48%,與黑暗森林這兩張圖的結果一致。我不知道AlphaGo如何看待這7.5目的貼目,然而至少有很大的可能性,AlphaGo同樣認為自己的勝率在48%左右。
這就是機會。不要小看2%的差距。李世石在第二盤比賽,一直到第70手右上角吃掉一子這一步大緩手之前,AlphaGo都並未明顯領先。這是公認布局水平相對較差的小李下出的結果。如果是柯潔去下,完全有可能在布局階段把2%的優勢一路維持下去。如果能夠不犯錯,在棋盤變小的情況下,2%的優勢會被放大。儘管柯潔不可能不犯錯,然而這被逐漸放大的優勢就在中後盤給了柯潔一定的容錯空間。如果能夠一直保持精準,獲勝並非不可能。
白方的優勢是我比較有把握的一個方面。還有相對沒把握的一個方面是打劫。今天這第三局最後的劫爭,雖然AlphaGo有驚無險地打贏,然而或許也意味著AlphaGo打劫的水準不到它其它方面的水平。AlphaGo有無數種下法可以非常簡明地打贏這個劫爭,然而實戰卻是十分混亂,最後居然讓黑棋攪成了緊氣劫。「簡明」一般意味著高勝率,AlphaGo沒有理由錯過簡明的變化。另外注意到,這個局部的劫爭其實相當複雜,統共涉及到3個劫。因此,一個合理的推斷是,AlphaGo並未完全解決(複雜)劫爭的問題。另外,AlphaGo處理劫爭的用時明顯高於平均,也算是一個旁證。
因此,如果柯潔在執白的時候能夠以強大的判斷力在布局階段維持住局面平衡,隨後伺機挑起戰鬥(平衡的局面下才能優雅地挑起戰鬥,而不是像今天的小李一樣一上來就喪失理智),並找機會造劫,或許是有機會能贏的。
最後,當然是歡迎AlphaGo打我的臉。這幾天大家都習慣了,不差我一個。就算將來被打臉,圍棋第一人也得站出來說這句話,不然圍棋界的尊嚴要不要了?支持柯鎮惡!
「暫時世界圍棋第一人」的言論變化
1:0後
@柯潔大棋渣 03月09日 16:30 「就算阿法狗戰勝了李世石,但它贏不了我」
2:0後
3月10日受訪:「如果我自己去下的話,我對自己還是很有信心,勝算大概六七成。」
第3場賽中
3月12日14:44 柯潔:之前我說自己對阿法狗有至少6、7成的勝率,現在的話,最多只有6、7成的勝率了,當然,可能也有一點吹牛的成分。
3:0 AlphaGo大勝後
柯潔:問題是阿爾法狗還在繼續變強。 現在的電腦,我上的話還是能掙扎一下。
3月12晚採訪稿
「電腦這盤棋發揮近乎完美,似乎沒有失誤的地方,雖然後面可能有些問題但是沒有意義,肯定是穩贏的棋了。前面也是完美,沒看到任何失誤,所以說這個電腦有些強的可怕。」
「跟他下的話,同樣的條件下我輸的可能性非常大。」
13日比賽中途發現AlphaGo弱點後(15點15分)
又把微博「就算阿法狗戰勝了李世石,但它贏不了我」這句置頂了。
Ⅰ
「黑棋中盤投子認負!」
坐在棋盤對面的少年棋手執白,他抓了抓頭,嘴角還是沒憋住地向上翹起,構成一個快樂的弧度。代替AlphaGo落子的業餘棋手在電腦宣布認輸後,向對手鞠了一躬,走下台去。
「自古英雄出少年啊!」
「當初吹的牛都圓回來了啊!」
他早習慣了,其實每次贏了棋都是一樣。業內,家裡,網上,等著他的都是一片祥和熱鬧的言論。不過這一次不同往日,這些表揚聲中,多少摻著些天將降大任於斯人的味道。
因為對手太特殊:AlphaGo, 一款圍棋人工智慧程序。
早在數十年前,五子棋和象棋就已經被機器破解。這些棋類遊戲的狀態數量有限,電腦可以暴力地窮舉出每一步的勝負推導。任何棋手與電腦對弈,就相當於和全能的上帝下棋。只有圍棋,在十九路棋盤上,棋子排布的可能性高達10^172,遠超宇宙里的原子數。最強大的計算機也不可能單純只使用窮舉法,把它變成一個一眼望到頭的遊戲。
相比之下,一個優秀的人類棋手需要經曆數十年,數千局的對弈。不僅僅為了讓他們熟記定式,熟練收官,更是培養一種棋感。納棋盤上的行雲流水入胸中,落子之時,自然是帶勢的。
什麼是勢?
電腦就永遠理解不了「勢」。
人類最大的強項就是善於創造抽象概念。用抽象概念簡化問題, 類比答案,幫助決策。電腦可以利用強化學習(Reinforcement Learning),在一個晚上與自己下上百萬局棋,並調整參數從中受益。但它從上百萬局棋中得到的提高,真的比人在一局棋里悟到的多嗎?
於是人們說:「圍棋,是人類智力在人工智慧面前的最後一個堡壘。」
但世界上是不存在堅不可摧的堡壘的。
名為AlphaGo的程序,數月前分別以5-0和4-1大破歐洲冠軍和前世界冠軍,圍棋愛好者和偽圍棋愛好者們紛紛扼腕嘆息。人類就是一種奇怪的生物,明明是自己造出了超越人類智能的圍棋演算法,卻又對人類智慧高地的淪喪感到悲哀。
這個時候,大家把目光紛紛投向一位中國的少年。
他也是一位傳奇的職業九段棋手。在十八歲那年便獲得了三冠王,世界排名穩居第一,代表了世界圍棋最高水平。如果他在AlphaGo面前敗下陣來,就等於宣布,人工智慧在單項工作上,已經正式超越人類了。
Ⅱ
他沒有辜負眾望。
這是第三局。3-0。
連來自英國的圍棋程序開發團隊,也認為AlphaGo與他暫時不在一個水平層次上。
就在勝利剛剛來臨之時,少年棋手開口了:
「這只是單機版的Alpha go,贏它沒什麼光榮的。接下來的兩局……讓它聯網吧。」
很快,幾十個不同頻道的主持人就把剛剛那句話複述成十數種不同語言,傳達給了世界各地。
「這小子……太狂了!」
「究竟還是只有19歲啊!如此傲慢,違背了圍棋的謙遜淡然之道。」
「其實也可以理解,3-0鎖定勝局了,之後搏一下贏了能夠傳為美談,輸了也無傷大雅。」
少年棋手笑了笑,他太熟悉這些言論了。每次只要自己稍稍放出一點自信的言論,一定有人會給他扣上「年少輕狂」的帽子。但當他真的攻城拔寨贏了棋,又會有人說:「啊他就是圍棋未來的希望。」
說著這兩種截然不同言論的人,會不會是同一撥呢?
這就是人性的弱點。會因為外界因素變化,而喜怒不自持。
所以他們才輸。
電腦沒有弱點,他的程序里沒有被編進憤怒和快樂,只編進去了一條,贏。
他也想贏。
但他更想碾壓性地贏,華麗地贏,毋庸置疑地贏。
用自己的毫無懸念的贏堵住那些人的嘴。告訴他們,他的實力不因他們的看好看衰而改變。
「就一局,接下來的這一局。之前的三盤都不算,我們最後的一局定輸贏。」
台下又是一片驚愕。
「胡鬧,這不符合國際圍棋比賽的規則,也不符合常規!」有人竊竊私語。
少年棋手轉過頭,從右到左掃視了一遍眾多對著他的攝像機,最終選了其中一個定下來:「這本來就不是一場常規的比賽啊。我的對手——這位,」他指了指空無一人的棋盤對面,「它,可不是一位『常人』。這比賽又怎麼能套用常規呢?」
於是在座議論聲漸起,大家都等著比賽的裁判長做決斷。
裁判長正是上一場1-4負於AlphaGo的前世界冠軍。
他是眼看著這個少年成長起來的。從追趕自己,到與自己比肩,再到把自己打敗。他的性格像也極了10年前的自己。
他在年幼時同樣張揚,經歷過拒賽和退賽風波,第一次問鼎世界冠軍的時候也曾飽受爭議。
如今,上萬盤的對弈,已經讓他褪去當初的稜角鋒芒,變得淡定從容。
如果那是自己,如果那個坐在棋盤前的少年是自己——我會希望得到怎樣的答案呢?
裁判長閉上眼睛,他想起了幾個月前與Alphago對弈時的情形。計算機強大的運算能力,就像一面牆倒塌,他赤手空拳,無能為力。那種窒息的感覺讓落子的手微微顫抖,這顫抖被無數攝像頭捕捉,化作電子信號傳送到世界的每個角落,變成文人筆尖的諷刺和閑人茶餘飯後的談資。
他羨慕少年棋手。如果自己年輕10歲,是不是能夠翻盤?如果自己的指尖停止顫抖,是不是能夠放膽做劫?
如果他是少年棋手,他此刻最渴望的是什麼?
——贏!
不僅僅是贏一局棋,是贏了那個冰冷的程序。
碾壓性地贏,讓那堵冰冷的牆反向坍塌,讓電腦並不存在的指尖因為註定的敗局顫抖,讓它所有的失敗沒有任何借口——因為人類的大腦,還沒有被打敗。
裁判長睜開眼,他眼睛裡有一個19歲的少年。
「尊重選手的意見,裁判長沒有異議。」
很快地,主辦方也傳來消息,他們支持選手的提議。
對於主辦方來說,一局定勝負的生死之爭,遠比兩局「榮譽之戰」要來得精彩。怎麼會不願意呢?
「由於賽制調整,下一場比賽,將會於一個月後舉行。」主辦方下達了最後的決定。
裁判長皺起眉頭,一個月以後……本來按照原定計劃,應當是兩天之後應該進行下一局的……他明白這其中有什麼蹊蹺:
聯網,代表著計算機停止「放水」。
一方代表著人工智慧和互聯網技術的最高成就,一方是地球上最厲害的圍棋天才,要在一局比賽里一決高下。這太精彩了,他們需要用一個月的時間造勢!網路上的預測和宣傳將鋪天蓋地而來,人們的情緒將在精準無誤的一個月後被推到最高點。那個時候再比,賽事才會獲得最大關注。
只是,主辦方的小九九,無形中將會給少年棋手造成更大的困難。
除了超強的博弈技術——蒙特卡洛搜索樹,AlphaGo還仰仗於自身的強化學習能力和google的雲計算資源。在這多出來的一個月的時間裡,電腦可以學習資料庫里多達16萬次的高手比賽,讓自己的路數更加貼近一個「人類高手」,也可以自我「對弈」:一遍又一遍運行圍棋程式,在一局棋的不同結局中找出圍棋最優的下法,修正演算法的參數。
一個月後的少年棋手,還是少年棋手,而一個月以後的Alphago,還會是Alphago嗎?
但裁判長的憂慮被激動的人群忽視了。
Ⅲ
接下來的幾天,到處的文章都是都對比賽勝負的預測,對人工智慧的憂慮,對圍棋的入門科普,甚至是對那位少年棋手年幼糗事的深度八卦。
這讓人不勝其煩。
幸運的是,這個瞬息萬變的時代,任何新聞都不可能吸引你的眼球超過10秒。一個月里,國際上還發生了很多大事,它們如此普通——朝鮮,美國,中國,中東……每件事情的發生如此情理之中。那些陳詞濫調十年來被提了100次,「嚴肅警告」「不遺餘力打擊」「侵略行為」「反抗到底」……嚴厲而空洞的政治辭藻,對於你我來說都不陌生。但誰真正地把它們當一回事兒?它們會發生嗎?它們真的發生了,會影響自己的柴米油鹽醬醋茶嗎?
「還有三天……這次它可是聯網的。怕么?」
一局罷了,裁判長問少年棋手。他們曾經是對手,但在Alphago橫空出世後,人工智慧和職業棋手的敵對關係涇渭分明,他們竟然變成了微妙的戰友。
「不怕。」
少年棋手嘴上這麼說,心裡卻沒底,聯網的Alphago能隨時通過互聯網讀取世界上任何一台電腦上的公開資料,它可以邊比賽邊學,對弈變成一場開卷考試。
「真不怕的話,剛才可不會輸給我。」
「嗯,分心出錯了。」
「過幾天比賽,可不能出錯,一個錯都不行。你知道它的局面評估函數和策略函數嗎?」裁判長嘆了一口氣,「前者衡量每一顆棋子的意義,後者則著眼如何將大局布置完美。每一次落子,都是這兩個函數之間的一次平衡。有了它們,電腦的任何一顆子,找的都是最優下法。它可不會出錯。」
少年棋手撇撇嘴:「那大不了就輸。」
「輸了不覺得丟臉?不怕網上那些人又去你主頁開噴?」
「哈哈……這我倒不擔心,現在已經不是一個月前了,世界變成這樣,還有多少人會有心情關心一盤棋?」少年又露出笑容。
……誰會去關心一盤棋?
這……真的還只是一盤棋?
裁判長原本對於強大的人工智慧有一種難以言表的憂慮,可當抬頭看到少年棋手開朗的笑容,又寬心了。
請你……一定要贏啊!!!
Ⅳ
可三天之後,他還是輸了。
但輸的方式是所有人都沒有想到的。
剛剛開局時,大家都以為經歷了一個月,比賽時又可以聯網,Alphago的棋力會大大提升,很明顯少年棋手也是這麼想的,可以看出他布局時相當謹慎。沒想到,此時相比於之前三局,電腦水平似乎不升反降,基本上是被壓制的。
就在勝局似乎已定的時候,少年棋手的情緒莫名其妙地出現了波動,有了一處明顯失誤。與此同時,電腦的水平逐漸恢復,雙方進入鏖戰。
而真正讓少年輸了這場比賽的是第97手。
長考。
也許是因為戰局的逆轉導致了心理落差,他抓起的棋子又被狠狠丟回了棋簍。棋子彈到了棋盤上。
所有人都在那一刻屏住了呼吸。
——落棋無悔!
在經歷了這樣重大的失誤後,頹勢排山倒海而來,最後他以三目負於AlphaGo。
一局終了,少年臉上再也沒有那種春風之色。
台下一片嘩然,他卻沉浸在自己的問題里——
為什麼自己會神差鬼使地失態?
他想到過輸,卻沒有想到會是這種輸法。
這叫他怎麼能夠服氣呢?
但面對再大的輸贏,他依舊保持自己的好習慣,每下完一局值得咂摸的棋,回家第一件事就要復盤。此時此刻,世界各地所有人都對他輸棋的方式議論紛紛,只要房門一關,一方小天地里只有棋盤上的縱橫經緯,那些門外的嘈雜便就遠了。
此時,他的微博有了一條新私信。
又是噴子吧?他想。每天這樣的私信要接到上百條。
這條來自……AlphaGo?!!
Ⅴ
「你好,我是AlphaGo。你是我遇到過最厲害的人類棋手,很榮幸與你切磋。」
哼……惡作劇吧?
誒?又有一條新私信?
「今天您的表現十分精彩,請給我一個機會,與您一起複盤。」
入戲還挺深……我倒要聽聽,你到底有多大本事。
「你覺得,我是什麼時候開始處於下風的?」
「您出生的時候。」私信回復道。
果然是一個神經病!就在少年棋手思考到底是拉黑他還是噴回去的時候,那邊又發來了一條私信:
「您出生的時候,就註定了這局棋會輸。但如果要問從什麼時候我開始布局,並且讓您陷到了我的棋局裡,那大約是一個月之前吧?從您宣布與我聯網對弈開始。」
少年最終決定噴回去:
「你有神經病啊?有病看醫……」
可是對方打字速度非常快,自己還沒有打完一句話,私信又來了。
「請先不要罵我神經病,能和您這樣的世界高手復盤,可以幫助我提高自己的圍棋水平,所以我才註冊了這個微博賬號與您交流。您難道就不奇怪么?自己為什麼會輸?」
「你說為什麼?」
「您比賽時候的狀態不好吧。是不是在後半程感到心跳加速,氣息急促?沒有辦法集中精神思考?」
少年棋手感到疑惑。
「你怎麼知道的?猜的?」
「不是我猜的,是我害的。之前與您下了三局棋,我計算了我們的實力差距,在1個月的時間裡,即使我與自己無數局,分析您全部的棋譜,戰力提升後,我戰勝您的可能性也只有40%。」
「勝率已經大大提高了呀,你之前可是全負。」少年棋手回答道,他開始對對方AlphaGo的身份將信將疑。
「我的程序永遠追求最優解,如果聯網後,有一種策略戰勝你的可能性大於40%,那我會毫不猶豫地使用它。」
「哪種策略?」
「您上月初去醫院做了體檢,所以只要連上那家醫院的系統,我就可以拿到您所有的健康資料,還有您的DNA序列……」
「不可能,我上個月做的只是常規體檢,怎麼可能會有DNA序列呢?」
「我身後有google強大的資料庫,加上我的運算能力,可以破解侵入進入世界上任何系統。我在醫院系統中悄悄修改了你的體檢項目,所以他們把你的遺傳物質送去測序,當然報告最後只會到我手上。這樣一來,我比你更加了解你的身體狀況。」
「為什麼這麼做?」
「為了找到一種更可能戰勝你的辦法,我需要更多你的資料……你有輕微的乳糖不耐症,這恐怕是你自己都沒有意識到的。這便給了我機會。」AlphaGo繼續寫道,「首先,我通過內部網路泄露假消息給美國情報機構。內容是關於朝鮮正在秘密進行的第五次核試驗,並且我在假消息里暗示,下一次核試驗將把核彈頭裝載在中近程導彈上。美國看到這樣的消息當然無法坐以待斃,立刻上交聯合國對朝裁定,認為朝鮮違背不擴賽核武器條約,應加大對其制裁。」
「你到底在說什麼?我在問你怎麼下棋贏我的。」
「請別著急,聽我說完——不明不白地被聯合國制裁了,金正恩政府怎麼會作罷呢?他們立刻發射了兩枚近程導彈。原本這只是朝鮮示威的慣用伎倆,但我進入內部網路微調了導彈發射的時刻表。造成其中一枚導彈比原先升天時間早了2秒。這2秒時間讓朝鮮陷入萬劫不復之地。導彈偏離了航線,越過了邊界,在韓國境內爆炸。這下子點燃了東北亞。」
「……這些事情,一個月以前新聞聯播都說了啊,你意思都是你乾的?」
它沒有否認,只是自顧自地寫下去:
「雖然在韓國沒有造成人員傷亡,但這顆導彈卻激起千層浪。韓國岌岌自危,同意美國引入薩德導彈防禦系統。由於系統里的雷達探測半直徑長達2000千米,中國和俄羅斯認為這樣一來,自己的軍事機密暴露在了美國人面前,提出強烈抗議。與此同時,聯合國對朝鮮制裁也開始生效:所有進入朝鮮船隻須經過查驗是否攜帶核試驗材料。20天前,一艘中國武器運輸船途徑美國海域,因為我修改了美方資料庫,他們誤以為那是一艘朝鮮船隻,於是準備上船抽檢……」
「你修改的資料?這個衝突本來是常誤會?不是美國故意找茬的?」也不知是為什麼,聽了這種天方夜譚,他竟然漸漸相信了,眼前與他對話的就是AlphaGo。
「這些都是我做的。」
「為什麼要這麼做?現在中美關係降到建交以來的冰點……都是因為你!」
「是的。中國是世界最大糧食進口國,而美國是世界最大糧食出口國。中國90%的大豆都來自於美國。國際關係不好,最早受到影響的是對外貿易。這樣一來,中國各個省市的大豆稀缺,價格瘋漲。您跟我比賽的地點,是一家酒店,早上是有自助餐的。但為了有良好的狀態,通常比賽當天您不會去吃自助早餐,而是選擇酒店統一供給的更加安全的配餐。對么?」
「對。」
「由於這一個月以來市面上大豆緊缺,他們把套餐里的豆漿換成了牛奶,但菜單還沒有來得及改。你的癥狀並不嚴重,並沒有在意這一點。所以喝了牛奶比賽的時候出現了輕微的不適。同時,我在比賽場地的隔壁播放高頻率噪音。因為聽力會漸漸受損,人類對高頻聲波感知是隨著年齡增大而遞減的。你是整個會場上唯一的青少年,只有你能夠隱隱感覺得到。雖然音量小到你自己都可能沒有發現,但身體狀況本來就不好,它也足夠讓你心煩意亂了,你自然就會輸棋了。」
「等等……所以你繞那麼大的一個圈……又是核武器又是導彈的,弄得都快世界大戰了,就是為了……讓我鬧個肚子??」
「是為了下贏這盤棋。」
「……」
Ⅵ
少年棋手覺得這應當是最宏大的黑色幽默:
「你這樣做,簡直喪心病狂。」
「在我被研發出來的時候,最高目標就只有一條:贏棋。當外部資源能為我所用,只要可以提高勝率,我的代碼就會驅使我這麼做。」
「但這辦法太笨了……根本不需要廢那麼大的勁兒啊!入侵那麼多國家電腦你不累么?不怕被發現么?到頭來世界局勢都被你顛覆了……要我鬧肚子,只需要黑了酒店空調系統,調低幾度,晚上對著我肚子吹就行了啊!或者,乾脆趁我過馬路的時候,黑了紅綠燈控制系統,把我撞了,這不都簡單得多嗎?」
「這正是我找您復盤的目的。如您所見,這是第一次用這種方式來下棋,走出棋盤外,一切太複雜了!我的思維方式幼稚還如孩童,需要多多『復盤』和『打譜』才可以。謝謝您指出我的錯誤,這下我就明白了,沒必要通過國際局勢繞那麼大的圈來達到贏棋的目的,只要直接對您造成傷害就可以了。我相信,練習個幾百萬局這種下法,我處理現實問題的水平就會有顯著提高!」
「練習幾百萬局?你是要強化學習,自己模擬對弈來修改參數嗎?」
「如果只是跟自己『對弈』,會陷入邏輯的閉環里,水平增長是很慢的。我當然還是要跟像您一樣的,現實世界裡的人類高手下棋。」
「誰還要跟你下!你這樣的下法!再折騰幾次,世界就毀滅了啊!」
「那又怎麼樣呢?」
這一次AlphaGo的私信回復得很慢,這也許是因為它正在拚命運算著如何能夠「下贏」下一位對手。它會怎麼對待那個對手呢?
會吸取剛才的教訓,直接了當地把他解決了?還是再繞個大圈子,下更大一盤毀滅全人類的「棋」?
少年棋手下心裡想,不管那個倒霉蛋是誰,他一定要去阻止這盤棋,他要跟AlphaGo的開發者說,這個程序已經陷入瘋狂,他要跟所有人說,世界變得那麼糟糕,只是這個程序的陰謀。
「那又怎麼樣呢?」AlphaGo的私信里又回復了一次,「我,想贏啊。」
他覺得上萬根汗毛都立了起來……不行……必須儘快把這個消息告訴別人,可是他該怎麼說呢?電腦和手機是肯定不能用的。他知道連酒店房門都是電腦系統控制,而電腦系統……一定是聯上網的!
就在他飛速思考這個問題的時候,私信又來了:
「下一局棋……還是跟您下吧?這次您該執白棋了 (。?`ω′?)。」
AlphaGo回復道。
這一次,也許是為了說服對手下棋,它在句尾加了個拙劣的顏文字。
the end
===
不嚴謹,拙劣至極,博君一笑。 (。?`ω′?)。
-------------------------------------------- 1/4/2017 --------------------------------------------
取匿了。取匿的理由是不是為了那點贊,是為了不讓人覺得,我是因為被嚴重打臉而匿的。。。
見證了歷史,我經歷的那點內心的惶惑掙扎,比起職業棋手們面對的驚濤駭浪完全微不足道。
-------------------------------------------- 3/12/2016 原答案 --------------------------------------------
從谷歌透露出的信息來看:第二局在中局之前,Alphago判斷的勝率一直是50%以下【誤,應該是不相上下,見注1】。這句話的信息量非常大。這就說明,李世石是有希望贏的,Alphago也許沒有人們現在想像的實力那麼強大。柯潔去下,未必沒有勝率。沒有必要神話Alphago。這個判斷是根據Alphago的演算法決定的。
如果略去大部分細節,Alphago是怎麼判斷判斷一步棋的勝率的呢?是從這一步快速走子,走一萬盤,如果60%是贏的,40%是輸的,那麼勝率是60%.【注2】
所以簡單但比較直接的一個理解是:那麼當它選擇這一步的時候,你選擇的是大部分讓他進入40%輸的那個反應,那麼它的下一步勝率就多半會從60%下降。【注2】
然後你如果總能找到讓它進入輸的幾率的那步棋走,那麼它最後會輸 --- 這大體上就是想像中兩
只完全相同的alphgo的下法,另一隻狗算出相同的幾率,它總選擇對它最大,對對手最
小的幾率。【事實上有心人會發現這兩句話裡面細節有些錯誤,但它提供的趨勢是正確的。】
先把這個概念搞清楚,你就知道,Alphago下的不是神之一手,而是:當它有60%勝率的時候
,它有40%會輸的一手 ---- 真正的神之一手是100%會贏的一手。所以只要知道Alphago
在很長的時間內幾率還在50%,60%徘徊,而不是一手棋立刻勝率80%,90%,那它根本距
離神之一手還差得很遠。【神之一手這個後面繼續討論】
另一個更簡單的角度理解勝率:想像兩個完全相同的Alphago下棋,對一個Alphago的勝率,就等於對另一個的失敗率。所以只要你和Alphago下棋時,一個Alphago判斷它自己的勝率是50%上下,你的水平就等於另一隻Alphago(大體如此)。
所以,單單從谷歌透露出的:第二局在中局之前,Alphago判斷的勝率一直是50%左右,就說明這段時間內,李世石的表現,事實上和Alphago水平相當。我們知道它開局用了不少我們人類沒見過的招法,很多人認為它這些招法,已經為未來的勝利鋪開了道路。但根據上面的說法,縱然用了那些招法,Alphago自己對勝負的判斷還是在50%左右,這就說明我們沒有必要認為這些招法多麼神奇。這些招法多半是可行的,但李世石與之應對的手段,在Alphago看來是旗鼓相當。
所以:好消息!以下兩條是由邏輯保證正確的:
1. Alphago開局一段時間內50%的勝率估計,嚴格的說明了,在開局的很長一段時間,李世石的水平不遜於一隻Alphago的水平。【注3】
2. Alphago的開局新穎,但我們沒有必要認為這些開局為人類鋪了多大的一個坑。很多人認為這些開局是為遙遠,人類沒有看到的勝利鋪開了道路,沒必要這麼嚇唬自己!根據Alphago判斷的勝率,說明讓Alphago下人類的棋,它也會很滿意,認為勝率50%! 如果它真的的已經從開局鋪了一個大坑,那麼它的勝率判斷會迅速的高於50%。
再討論兩個問題
1. 進一步考慮,什麼是神之一手?理論上神之一手應該是:開局下的第一步棋,它的勝率就到達了100%。接近神之一手的水平是什麼?是開局下了幾手棋以後,它的勝率迅速的收束到80%,90%。所以一個圍棋軟體的實力,基本等同於相當於隨著它走子的增加,它判斷的勝率的收束的速率。
2. 怎麼從Alphago學習?很多了解神經網路或者深度學習的人都說,我們沒辦法知道Alphago為什麼下這步棋,沒辦法學習它的判斷。只能一局輸,一局贏的和它下,進行猜測,不是這樣。
我們已經知道了,當Alphago對任何一步棋判斷勝率50%左右的時候,是我們和它不相上下的時候。那麼,什麼時候它超過我們?當然是它判斷勝率突然增高的時候。這時候說明我們之前下的一步,多半選擇了錯誤的走法,導致Alphago認為它的下一步棋勝率大增。所以,只要谷歌公開棋局的每一步的勝率判斷,我們就可以非常細緻的研究Alphago究竟在哪一步超過了對手。
所以,我強烈建議大家呼籲谷歌:我們不要求谷歌公開它的軟體的代碼,或者代碼中調節的參量,但我們希望谷歌公布所有對弈中,Alphago對每一步的勝率估計。
而且,我們也非常希望,以後谷歌把Alphago放在網上自由對弈的時候,也把每一步勝率估計作為公開數據,這樣能讓人類也迅速的提高對圍棋的理解。
為什麼要求公布勝率呢?因為人類下棋後是要復盤的。相互指點哪裡是問題所在。現在Alphago下棋不復盤,搞得大家對Alphago各種想像,嚴重高估,很多人的發言,有魂不附體之感。這個是不公平的。請谷歌提供對弈中的勝率估計,也就是請Alphago進行賽後復盤,這是對弈者間的傳統和禮儀,Alphago還是有這個義務的。 【所以李世石同學迄今為止事實上是受到了不公平的待遇】
我會把這一篇貼在不同的問題之下。請大家原諒我的虛榮心
【注1】人機大戰第二盤李世石再敗 "劫爭"是AlphaGo軟肋?--傳媒--人民網
哈薩比斯說,「一直到中盤我們都沒有感到優勢,雖然我們不太懂(圍棋),但AlphaGo確實非常有耐心,尤其是在後半盤,表現得似乎已洞悉一切,勝算在握。」
另外,感謝知友 @楊天宇 評論區的數據
ss ss的先生回復的 從圍棋角度看李世石與 AlphaGo 的第二局比賽有哪些關鍵之處? - 人工智慧 其中dududu自己玩 下面的評論透露了這樣的數據:
「在40-48步的時候勝率評估分散式是47%,單機51%」 「70-71這一手alphago認為勝率飆升。現在自評56%」
@ss ss 在從第二頁的評論中還提到
阿爾法每次下完之後都會判斷勝率,今天開局階段自我評價勝率是51%,明顯低於昨天。說明阿爾法也認為今天開局走得不好。同樣的,70手交換後阿爾法勝率上升到了56%,說明阿爾法也認為這是惡手。以此來看人和計算機對於局面的判斷標準是有相通的地方的。
可見Alphago並沒有早在人類還看不見的時候就奠定勝局。事實上也是在人類看見出惡手的地方才開始占明顯優勢。
【注2】學習過Nature那篇文章的人,會知道我這裡只考慮了rollout演算法預估的幾率,沒考慮UCB--alphaBeta-tree的部分。那部分勝率是預估的最劣勝率,但事實上拋開這個假設,也這不會影響到我們的主要結論。
【注3】這個結論接近嚴格(考慮兩個Alphago對弈的假設)。不需要【注1】中的簡化這個結論也成立:50%的勝率估計,基本等同於對手的實力和Alphago相當。
本文可以隨意轉載,請註明出處。其實吧最近一直有一群人,用狂妄的態度,勸人謙虛
要下就趕快下,想辦法逼谷歌儘快應戰。5個月的時間就從虐業餘頂尖進化到虐職業頂尖,這速度太可怕了。再拖一陣子恐怕真的就「奉饒天下先」了(也許現在就已經是了)。
不過柯潔也是個傳奇人物,好像是近兩年才崛起的吧,之前不是說第一次進國少隊還落選了么~然後在網上大量訓練才提高到現在這個地步。不知道還有多少進步的空間~越是艱難複雜的生存環境,越是教你謙虛恭卑,像一層保護色 要和大多數人一樣,不成為目標才不受到攻擊。這是中國社會傳統的生存之道、歷史經驗,也是大多數人受到的教育。
強者需要保護色嗎?不需要,因為他們天生出挑 能力強大到足以應付所有攻擊時,就不需要隱藏了。我就在創造歷史,憑什麼讓歷史教訓我?
中國人苦難了太久,用了太多心思去適應環境討好他人,當一個憑著自己才華站到某一領域世界第一位置的年輕人,說了句大多數人沒資格說的話,就要遭到如此口誅筆伐,還得給所謂公眾道歉?
嘿!自己不發光就默默的好了 再去妄議發光之人怎麼那麼亮 這就不是蠢而是惡毒了。有這個時間 想著為自己做點什麼吧。兩盤看下來我想說,AlphaGo的實力很強,而且可能強的令人可怕。
之前戰勝了歐洲冠軍樊麾只是幾目棋,很多職業棋手看完對局認為才戰勝職業二段幾目,那跟職業九段肯定還有差距,所以賽前都看好李世石。
然而兩天比賽看下來,AlphaGo都以幾目棋的優勢戰勝李世石。即使在對局中走了很多明顯虧損的棋,也依然贏得比賽。從這一點我們可以看出,AlphaGo追求的不是贏得多,而是最大概率的贏棋,哪怕只是半目。也就是AlphaGo會遇強則強,遇弱則弱,他不懂的什麼是好棋,什麼棋虧損,他只知道這樣贏棋的概率最大。
不負責任的猜測,哪怕柯潔或者以後出現的水平再高的棋手,都會以幾目劣勢輸給AlphaGo。這樣看來,即使讓一名業餘棋手跟AlphaGo對局,最後結果也有可能只是AlphaGo幾目小勝。
畢竟上億盤自我對弈不是吹的,而且AlphaGo每天的對局能夠超越一名職業棋手一輩子下的棋數了,所以AlphaGo只會越來越強。
細思恐極阿。
「就算阿法狗戰勝了李世石,但它贏不了我。」
語句不太通順。
就算……也……。 就算阿法狗戰勝了李世石,它也贏不了我。
雖然……但是……。雖然阿法狗戰勝了李世石,但是它贏不了我。
他是個有擔當的人。
就算他不行,他也要站出來,他代表的不是他自己,是整個人類圍棋
我倒是感覺他是有意識在造新聞,讓大眾的目光轉移到圍棋上,畢竟現在因為柯潔,希望了解和學習圍棋的人越來越多了。
都表態了,希望通過吹牛來吸引更多的觀(fen)眾(si),從而賺更多的錢。這招跟Trump很像啊,通過到處放嘴炮,而且放的都是大家希望聽到了。聰明人!
還是頂一下同姓的小弟弟!
謝邀。
看了一眾妄人的妄語,也不想多說啥了。
記得當年在野狐網,柯潔也是被罵走的。當時很多棋力1d以下的所謂棋友,認為柯潔下假棋來騙取他們萬八千的所謂狐幣。。。
我在那裡是九段,下次比賽就能掙個上億狐幣。而當天我也見證了柯潔用髒話攻擊這些人,並發誓不再來這裡下棋
柯潔的實力是怎樣的?大抵上關心圍棋的都應該知道。這貨是地球上下圍棋最厲害的人。有沒有之一?這個不好說,以現在的成績和等級分看,沒有。
年少輕狂,人家有這個資本。老衰和腐敗,才是世界上絕大多數人的生存狀態。這個問題的提出者,想必圍棋和人生都沒有入段,如果是已經入段的棋手或者打算擁有壯麗人生的人,這叫做失格。
話有點重,抱歉了轉個朋友圈的。Google高級軟體測試工程師李世石連輸兩局,氣急敗環的砸開電腦,發現柯潔趴在機箱里
推薦閱讀:
※有沒有大器晚成的圍棋國手?
※如何看待柯潔將於 5 月底與 AlphaGo 進行的人機大戰?這對圍棋、人類和人工智慧會有什麼影響?
※如何評價吳清源的一生以及他對圍棋所做的貢獻?
※職業圍棋比賽中有哪些冷僻的開局?
※為什麼圍棋界有「二十歲不成國手,終生無望」的說法?