為什麼 AlphaGo 沒用過「打劫」戰術?

我看到很多人提到AlphaGo不擅長打劫,這是為什麼?
--------------------------------------------------------------------------------------
圍棋屆主流觀點都說AlphaGo不會打劫,有沒有懂圍棋的也懂演算法的來解釋一下。我覺得劫爭也是一種邏輯推演吧,不存在演算法做不到吧?


AlphaGo作者黃士傑澄清:沒有劫爭保密條款

11日早上,黃士傑博士就在網上留言,對此進行了澄清,全文如下:

  現在網路上有許多謠言,有些人甚至對李世石九段作出人身攻擊,我覺得有必要澄清。這次比賽不論勝敗如何,我覺得我們都應該尊重李世石九段。他接受AlphaGo的挑戰,所承受的壓力一定很大。

  1、這次比賽並沒有所謂的不能打劫的保密協議。第一、第二盤棋覆盤時李世石九段都有擺出打劫的變化,只是實戰他沒有下出來。我們也想知道,AlphaGo在對陣李世石九段這種級別的棋手,打劫時的表現。

  2、這次比賽我們使用的是分散式版的AlphaGo,並不是單機版。分散式版對單機版的AlphaGo勝率大約是70%。

人機大戰不許打劫?裁判長闢謠:希望大家尊重李世石

樊麾闢謠:請尊重李世石

「我很想質問一下那些對『不許打劫』懷有疑問的職業棋手,如果是你們上場與『阿爾法』交手,賽前會不會和谷歌簽署那樣屈辱的協議?」歐洲冠軍、「人機大戰」裁判長樊麾晚間接受華西都市報記者電話專訪時這樣反問。

他當時情緒有點激動,在他看來,谷歌或許不在乎這樣的質疑,但對李世石來說,相當於質疑他的棋和人品。「如果有可能,我現在有一個心愿就是——希望大家尊重輸了棋的李世石。今天的第二局,我就坐在裁判席上,看到李世石臉色發紅,看到他落子時手在微微發抖,感同身受啊!與毫無感情的電腦下棋,被它無情地推倒,我感同身受啊!我一度真的和李世石一起在難受,因為只有我知道他的內心正在經歷著什麼。職業棋手其實很單純,他們的生活也很單純,下棋就是想贏,因為那是我們的生活來源,但有時候,失敗誰也逃不過的。在我印象中,從來沒有看到李世石面對哪位人類對手時,手發過抖,但這一次,我看得真真切切。李世石輸了兩局,但是大家都得知道,他其實並沒有發揮自己的真實水平,下棋就是這樣,有些特殊的背景下,就是會難以發揮的。」他說。

對「不許打劫」的傳言,樊麾昨天還再次強調:「我不知道這個謠言的根源在哪裡,以至於今天我在很多個微信群里忍不住站出來澄清。事實上,早在我去年十月和『阿爾法』的棋譜里,就有過很多劫爭,大家判斷之前,就不能先看一下棋譜嗎?


當一名人類代表全人類在一個領域跟AI抗衡時,

卻遭到其他人類的奚落、嘲諷、惡意揣測,

這恐怕是比阿法狗在圍棋戰勝人類更令人絕望的現象。


AlphaGo愛不愛打劫先不提,不過目測今天下完會有鋪天蓋地的「谷歌和小李有保密協議不讓打劫」的流言出現,然後在下幾局小李挑起劫爭後選擇性遺忘,正如「樊麾水準業餘,電腦不堪一擊」「谷歌買通棋手,意在推高股價」等等流言一樣。

我將這歸之於人性的傳統弱點:見不得別人超過自己,總要找個借口……

「弱小和無知不是生存的障礙,傲慢才是。」


谷歌的保密協議規定棋手不準贏,證據就是這麼多盤都沒人贏。

-----------------------------------

更新:
AlphaGo開發者:不存在秘密協議 請尊重李世石_Google 谷歌_cnBeta.COM


首先,AlphaGo在和樊麾的對局中出現過劫爭。

其次,盤面清楚時優勢方不需要打劫搞混局面。

最後,爭議點在於為什麼李世乭沒有打劫而非AlphaGo。


這是王檄(前國手,職業九段)在雪球上的發言,陰謀論說李世石不打劫是因為桌底協議的可以閉嘴了。

另:聽說狗哥在跟樊麾對弈的時候打過劫,求證。


原文位置 : http://www.yigo.org/modules/newbb/viewtopic.php?post_id=87902#forumpost87902

作者:aja 回覆: 電腦圍棋程式人工智慧大突破-Google AlphaGo #137 現在網路上有許多謠言,有些人甚至對李世石九段作出人身攻擊,我覺得有必要澄清。這 次比賽不論勝敗如何,我覺得我們都應該尊重李世石九段。他接受AlphaGo的挑戰,所承 受的壓力一定很大。

1.這次比賽並沒有所謂的不能打劫的保密協議。第一、第二盤棋覆盤時李世石九段都有擺 出打劫的變化,只是實戰他沒有下出來。我們也想知道,AlphaGo在對陣李世石九段這種 級別的棋手,打劫時的表現。

2.這次比賽我們使用的是分散式版的AlphaGo,並不是單機版。分散式版對單機版的 AlphaGo勝率大約是70%。 請大家自由轉貼我的文章。
-------------------------------------分隔線-----------------------------------------------------------------------------------
原文位置 : 李喆:這兩盤棋 沒人會比李世石做得更好!

0、莫須有的「協議禁劫」

  這一節是本文最沒有價值的部分,也是我最不想寫的部分。謠言自破,本不需我來回應。但一方面我對謠言擴散到圈外而感到羞愧,另一方面也能幫助大家稍微理解AlphaGo的演算法。

  關於「協議禁劫」的質疑大概來自「AlphaGo七盤棋都沒出現劫爭」這一說法。

  或許DeepMind會官方回應此事,或許在接下來的對局謠言自散。

  但不需要這些證明,難道我們就不能分辨了嗎?

  由弱到強,我先給出三個回應。

  1,懂圍棋的朋友,你真的相信李世石作為一名世界頂級棋士在代表人類出戰的歷史時刻會簽這樣的協議?不懂圍棋的朋友,你真的相信谷歌團隊會簽這種改變圍棋玩法的協議?

  2,AlphaGo的演算法決定了他在不打劫就能獲勝的條件下會盡量避免劫爭,因為優勢下的劫爭增加了搜索的不確定性,常常會使他對勝率的估計降低。這也是我在上一篇里談到的逃避劫爭問題的本質。但是,非勝不可的劫,電腦必然會打。可邏輯推斷或參考第3條。

  3,難道不能去看一眼去年10月AlphaGo對樊麾的棋譜嗎?第三局、第五局,都出現了劫爭。其中第三局馬上消劫形成轉換;第五局劫爭過程持續18手,亦形成轉換。


  在圍棋受到空前關注的時刻,我認為圈內人有闢謠的義務,不助長謠言則是底線。」

「 看完第二盤之後所有認為AlphaGo 只是後半盤強的人,如果你能理解前面提到的知識和邏輯,那你也應該能理解這一點:

  是李世石的強大逼出了AlphGo的後半盤。

  為什麼第一盤AI的後半盤」失誤「更多?因為」失誤」時AI已經勝定。

  第二局賽後的採訪中,Demis Hassabis表示程序中間一度認為形勢接近(根據勝率顯示),而李世石表示自己是完敗。

  如果說第一局李世石輸棋之後還有曾經領先的錯覺,這一局他自己則完全沒有了錯覺。即使在棋界幾乎公認為AlphaGo明顯虧損的左下角定型之後,李世石都不覺得自己有過任何優勢。正是這種正確(保守?)的認識加上前半盤相對熟練的格局,使得AlphaGo一度認為局勢接近(很好奇AlphaGo有沒有認為自己落後過)。這也激發出AlphaGo強勁的後半盤,在對陣世界頂尖棋士時,僅僅通過收官就將勝負差距擴大到盤面十多目。


  對於這件事情的誇張程度,棋手們能否正視?人類面對不能理解的事物,總是用固有的知識體系來理解。但是,新時代真的來了。」

、在後三盤可以做什麼

  第二盤之後,我在上一篇文章中推測得出的最優策略已經被AI強大的實力證明難以取勝。雖然這一策略在最大限度上利用了人類集體的經驗,從而能夠在中盤取得接近的局勢,但在這種情況下AlphaGo的後半盤不是限時人類所能抵擋的。那些認為李世石發揮太差、自己上去可以不失誤的選手,既低估了人性的弱點,又低估了AlphaGo的實力。

  昨天給出的次優策略則是關於劫爭:

  2,另一個策略是在局面選擇中儘可能製造劫爭,即製造對方不開劫就不利的局面。當然,AlphaGo目前沒展現出複雜劫爭的能力並不能證明它沒有這種能力,因此這種策略是存在風險的,太過刻意是不行的,還要考慮局面的自然和均衡。

  但是在看完第二盤AlphaGo的表現之後,我認為這一策略實際上也已經破產了。AlphaGo的演算法使得它只會去打那些能影響到勝負的劫爭,與勝負無關的劫他就不會打了。

  雖然如此,我覺得李世石還是會去試試。我在第一局時只看到了AlphaGo的兩個弱點,第二局則基本證明這兩個弱點都是人類所無法利用的。AlphaGo在儘可能避開劫爭的條件下仍然能完勝李世石,這才是關於劫爭方面應該關注的焦點。

  關於弱點,李世石在第二局賽後表示,沒找到AlphaGo的弱點。我認為他非常誠實,而且他確實已儘力尋找。

  雖然我非常希望李世石在這次比賽能夠獲勝,為圍棋行業的發展爭取時間。但在我看來,後三盤在正常情況下李世石將毫無勝算。

  空中開局是否有效?我認為無效,但或許比較有趣。


  如果不去找bug,剩下的事情就只有——跟AI學棋。」


古人說「三人成虎」,誠不我欺啊。陰謀論永遠有市場。還簽協議不讓打劫??請認真研究alphago的所有棋譜再來瞎說。不會打劫,那它怎麼學的以前的棋譜?不要再侮辱谷歌的信譽、李世石的職業道德和榮譽感。 美國登月,都有人能找出「鐵證」來說是假的呢。


AlphaGo:我能贏就行,你們老糾結這些沒用的。

別人不僅僅能下棋,它只關注能不能贏,打劫那是人定的叫法


因為打劫會增加複雜性和不確定性,對嬴棋有不利的影響,所以電腦傾向於優先不使用打劫的方式解決問題。

而如果電腦覺得劫材準備很充分,而經過推算打劫對他贏的正面影響是比較大的他就會選擇打劫。

電腦做決定是基於輸贏概率的。打劫是一個非常簡單的遊戲規則,就算你下載一個圍棋軟體他也能做到。有什麼難的?這完全是謠言。


【謠言可以止了吧?】 不許打劫?樊麾激動闢謠:無"打劫保密協議"

來源:華西都市報 作者:賈知若
[摘要]勝負似乎不再重要。用中國棋聖聶衛平的話就可以概括整個世界棋壇的心情——「現在不是『阿爾法』能不能贏的問題,現在的問題是,李世石可能一勝難求……」
李世石坦言昨日比賽沒什麼機會
勝負似乎不再重要。10日,在韓國首爾四季酒店賽場,當韓國天王李世石再次倒在人工智慧「阿爾法」的鐵蹄下,用中國棋聖聶衛平的話就可以概括整個世界棋壇的心情——「現在不是『阿爾法』能不能贏的問題,現在的問題是,李世石可能一勝難求……」
由於「人機大戰」的前兩盤並未出現過複雜劫爭,包括孔傑九段、羅洗河九段在內的諸多中國職業棋手在質疑,甚至還有人懷疑——是不是李世石賽前與谷歌公司簽了「不許打劫」的保密協議。
賽後,李世石也遭遇了這個問題的突襲,有記者問:是否與谷歌簽署了保密協議,對局過程中不許打劫爭勝?對此,強顏歡笑的李世石似乎答非所問:「我中間確實有勝機,以後比賽會儘力下好。」
樊麾闢謠:請尊重李世石
「我很想質問一下那些對『不許打劫』懷有疑問的職業棋手,如果是你們上場與『阿爾法』交手,賽前會不會和谷歌簽署那樣屈辱的協議?」歐洲冠軍、「人機大戰」裁判長樊麾晚間接受華西都市報記者電話專訪時這樣反問。
他當時情緒有點激動,在他看來,谷歌或許不在乎這樣的質疑,但對李世石來說,相當於質疑他的棋和人品。「如果有可能,我現在有一個心愿就是——希望大家尊重輸了棋的李世石。今天的第二局,我就坐在裁判席上,看到李世石臉色發紅,看到他落子時手在微微發抖,感同身受啊!與毫無感情的電腦下棋,被它無情地推倒,我感同身受啊!我一度真的和李世石一起在難受,因為只有我知道他的內心正在經歷著什麼。職業棋手其實很單純,他們的生活也很單純,下棋就是想贏,因為那是我們的生活來源,但有時候,失敗誰也逃不過的。在我印象中,從來沒有看到李世石面對哪位人類對手時,手發過抖,但這一次,我看得真真切切。李世石輸了兩局,但是大家都得知道,他其實並沒有發揮自己的真實水平,下棋就是這樣,有些特殊的背景下,就是會難以發揮的。」他說。
是的,賽後主辦方看到李世石情緒非常低落,在新聞發布會上添加了一個規定:李世石只回答三個媒體問題。是的,李世石只是一個戰敗的鬥士,他不是罪人。要怪,得怪科技的力量遠比我們原先想像的要強大。
「柯阿大戰」,或未確定
如果李世石真的脆敗於「阿爾法」之手,人工智慧在圍棋領域的下一個目標會不會是中國的柯潔?據樊麾透露,「我這些天都和項目老闆哈薩比斯在一起,說實話,我沒有聽說有這個安排,或者說沒有聽到有具體的比賽日程。此外我得申明,作為一個中國人,我非常希望看到『阿爾法』挑戰柯潔的精彩比賽。」
「柯阿之戰」源起媒體採訪,一方面,哈薩比斯曾表示「阿爾法」肯定還會到中國、日本去繼續「人機大戰」。另一方面,最近在樂視體育講棋的柯潔九段公開表示願與「阿爾法」一戰,因為「百聞不如一見,百見不如一試」。不過目前看來,在與李世石的「人機大戰」尚未結束之前,棋迷們喜聞樂見的「柯阿大戰」應該還沒有作為一個方案遞送上谷歌老闆的辦公桌。
至於「人機大戰」的第二局,「阿爾法」的表現繼續令人驚異,當它下出右邊一帶的「五路肩沖」時,在北京觀戰的棋聖聶衛平表示,「我要向電腦脫帽致敬」,而這個消息迅速通過網路傳到身在韓國的DEEPMIND項目組人員耳中,他們的感想,除了欣慰還是欣慰。
在業餘棋迷看來,最後的官子階段「阿爾法」似乎出現漏算,一隊黑子被李世石「挖吃」,不過,在網路上講棋的古力九段迅速給大家解惑——「這不是漏算,而是它為了安全贏棋,要確保大龍成活所作出的犧牲。」是的,「阿爾法」就是一台爭勝的機器,能贏就行,棋下得漂不漂亮並不重要。
身在韓國現場的樊麾對「阿爾發」的布局招法也是讚不絕口,「那手棋看上去很臭,好像損了很多實地,但是那手棋與此前的黑子配合是絕妙的,這樣強大的布局構思,還有誰能教它?我猜想,它是自己悟出來的,這就是它強大的根源吧?」
對「不許打劫」的傳言,樊麾昨天還再次強調:「我不知道這個謠言的根源在哪裡,以至於今天我在很多個微信群里忍不住站出來澄清。事實上,早在我去年十月和『阿爾法』的棋譜里,就有過很多劫爭,大家判斷之前,就不能先看一下棋譜嗎?」
華西都市報記者賈知若
新聞來源:http://news.eastday.com/eastday/13news/auto/news/sports/u7ai5392369.html#bsh-24-1013826996


在和樊麾的第3局(白96)和第5局(白148等)中都出現了打劫


從技術的角度來看,程序實現打劫並不困難。

整個AlphaGO的基本構架就是搜索和評價。對於打劫來說,無非是把搜索的可能某些move禁止而已,對評價沒有任何影響。所以,沒有理由認為是由於AlphaGO方面的原因而禁止對手打劫。

對Google來說,此次人機大戰首先是一個商業活動。如果他的程序把打劫規則去掉,嚴格講這就不是圍棋了。應該叫AlphaGO-! 而敢這樣高調地來宣稱挑戰人類頂尖棋手,一旦醜聞成立,那她的商業利益損失將是不可估量的。

那麼我們想一想,他是如何保持這個秘密?我想不能。所以,我不認為AlphaGO不允許打劫。

我相信在後三盤中,會出現打劫的局面的。


韓國選手玩劫公認還是很厲害的,但faker的劫常被認為世界第一。打劫,要先出中亞,用克制的英雄最佳,如小魚人。
——————————————————————————————
不要摺疊我啊


外行的不懂裝懂而已,事實上,白棋102點入以後,有一個打劫的變化圖,黑棋不好,所以小李迴避了這個下法選擇了轉換。而阿法狗必然是看清了這些變化的,不然不可能下出102和108。實戰譜里不出現打劫不代表雙方思考的變化圖裡沒有。


第一天:棋走偏招為試探;
第二天:保密協議不打劫;
第三天:小李收金暗放水;
第四天:比分早就定好了;
第五天:機箱內藏大棋渣。


打臉一次是運氣,兩次是陰謀,三次、四次、五次是上頭早有安排。


「弱小和無知不是生存的障礙,傲慢才是。」


1、電腦不需要打劫。電腦讓兩子,才和韓國人勢均力敵,不讓子則必勝。 在必勝的情況下, 電腦演算法求保險,萬無一失,不需要打劫也能贏。

對歐洲冠軍也一樣,毫無疑問必勝,懶得打劫

2、李世石不敢打劫。你敢跟計算能力是你10000倍的對手打劫?古力都說了打單劫沒用,各大棋手都說了打了劫也輸,柯潔是抱著僥倖心理才質疑為什麼不打劫的,圍棋TV目數已經很明白了。李世石想找個體面點的輸法還被拿來質疑

萬一李世石打劫還輸了這臉怎麼辦?


看下DeepMind老大在牛津的演講視頻吧。他反覆跟大多不懂圍棋的現場聽眾強調圍棋就兩條規則,一是吃,二是劫。請問:就兩條規則,還有一條沒搞定,需要跟對手簽協議禁用,你讓Google的臉往哪放?


李世石第三盤,連環劫爭,謠言不攻自破
戰況慘烈,人類落日已到
------------------------------------------------------------------------
李世石 人類最強名不虛傳,四盤棋四種策略風格,第三盤那麼慘烈的對戰之後還能自信的說alphago有弱點可以戰勝,並在第四盤證實。只能是佩服,光芒萬丈的78手永載史冊,拍個動畫片落這一子不給個10集都不好意思。


推薦閱讀:

高手可以談談ROS機器人操作平台開發的一些經驗嗎?
如果機器人知道自己是人造的,他會覺得屈辱嗎?
RoboMaster是一個什麼樣的機器人比賽?
剛剛開始做機器人,打算做SLAM,不知道機器人定位領域現在有哪些比較新的演算法?希望大家推薦推薦
個人職業如何更長遠發展?

TAG:機器人 | 圍棋 | AlphaGo |