為什麼柯潔認為執白對抗阿爾法圍棋贏面大?可行的取勝之鑰是什麼?
在賽後訪談中,柯潔認為盤中一度很有機會,執白殺得熱血沸騰,最後因為緊張失誤而投子認輸,但他希望第三盤也能執白對戰 AlphaGo,因為勝率更高。Deepmind 和圍棋協會這邊也都同意第三盤柯潔繼續執白,感覺第三盤也非常有看點
柯潔第三盤執白是否真的贏面更大?他能怎麼贏?
本題已加入圓桌 ? 人機對弈終章,更多「AlphaGo(阿爾法圍棋)」相關的話題歡迎關注討論
柯潔認為執白對抗阿爾法圍棋贏面更大有如下幾個因素。
其中最主要因素就是:現行中國規則,貼還3又3/4子,貼多了。
中國規則的特點決定了,針對黑棋先行進行的貼還數。貼還的增減只能以1個子為最小單位。貼還3又1/4子和2又3/4子沒有區別。而日韓規則可以以1目為最小單位。
2002年,全球差不多同步進行了規則的變化,日韓規則從貼5目半改為了貼6目半,中國規則原來2又3/4子和5目半是幾乎等價的,然而在日韓改為6目半之後,中國規則由於最小步長的關係,變成了3又3/4子,約等於7目半。
7目半情況下,職業棋手認為如何呢?大部分職業棋手都認為貼多了。在應氏規則的比賽中,由於猜先猜對方可以選擇黑白,大部分職業棋手都會選擇白棋。甚至不少棋手發出了拿黑棋已經不知道怎麼下的感慨。
不僅是職業棋手,AlphaGo本身也認為白棋勝率高,每盤棋開局總是白棋勝率佔優說明了這點。
第二個原因就是:柯潔的白棋勝率確實高。雖然貼7目半後職業棋手普遍喜歡白棋,但是像柯潔這樣能夠如此高勝率的還是少數。大部分人執白可能也就比執黑好一點而已。但是柯潔的白棋曾經下出過全年不敗戰績(同年黑棋輸了6盤以上)。這點可能和柯潔棋風非常靈活,善於針對對手有關。(與此相對的是武宮正樹這類型的棋手,以主動構建自己的陣勢為主,就比較適合黑棋)
第三個原因可能是:白棋有模仿棋的可能性,而黑棋沒有。模仿棋這一大招柯潔並未在第二盤用出。但如果要用,也只有白棋用才有意義。因為如果是黑棋的話,AlphaGo只要不斷降低天元一子的子效就可以了,而這是很簡單的。但是要讓天元一子發揮最大的子效,卻是很難的課題。
至於可行的取勝之匙,顯然沒有任何人知道。從AI的原理看,可能還是要盡量攪亂局面吧。
與其說持白贏面大不如說持黑毫無希望,中國規則貼目3又4分之3子太多了。
你看第一局棋阿法狗可怕的布局和控制能力,作為白棋一方有天然的目數優勢 而阿法狗有及其擅長控制優勢,alphago只需布局體現出自己部分的大局觀佔據目數上的優勢 接下來的棋就像nba規則的垃圾時間,alphago甚至不用下"正確"的棋而是下「能贏」的棋就夠了。alphago最最擅長的我覺得就是控制優勢的能力(我不是說他其他的不擅長我的水平也不能完全看出來,但是控制優勢他做的無懈可擊這點),本來布局就是人類感官上的棋感而不是絕對真理,而alphago的布局是為了勝利,再強的人類棋手布局我認為都會遜於alphago,然後布局產生的領先加上黑棋要貼的7目半在alphago眼裡就變得那麼不可動搖,所以拿黑棋人類棋手完全沒戲 而且很容易變成第一場一切都在掌控之中。
以上是我對alphago持白為什麼無敵的一些猜想,所以柯潔會選擇未知,他其實也不知道alphago持黑自己是有1%還是0.5%的希望贏 但是第一局內容告訴我們alphago拿白棋在貼7目半的情況下, 人類沒有可能贏 而且人工智慧是用反人類的方法贏下比賽
第一次在知乎回答那麼詳細 我本人也就是一個業餘5段 人工智慧一竅不通 通過棋局分享一些個人的看法和感受 其中對人工智慧的圍棋思路只是根據棋局的猜測,大神們勿噴 希望能多多討論指正
ps:聊些題外話 個人認為第二局棋的表現無論事後人們怎麼評價,我覺得柯潔很可能藉此成為圍棋歷史前幾位的傳說存在,這次太多因素為柯潔職業生涯的傳奇程度填磚加瓦了
1 官方說李世石的版本存在bug且那場唯一的勝利基於bug,這點對小李雖然挺不公平的但是不可否認在這兩場人機大戰 柯潔的地位比李世石高。當然正是因為柯潔是世界第一,所以alphago會用更成熟的人工智慧來跟柯潔下,這也是他自己打出來的成績自己爭取的機會,就今天柯潔的表現來看一年前換柯潔來下確實可能贏。
2 deepmind CEO說後台數據前半盤完美,逼出alphago極限,前30-40步棋alphago和柯潔的著發和電腦評估最優點完美契合。這真的就是神跡了,因為全場的職業棋手場外的解說都能為柯潔的那手二路點是不明智的。我印象很深刻古力就是其中一個,八冠王古力啊,alphago就這麼打臉說柯潔的下幾步棋完美,那麼柯潔和古力誰離圍棋真理更近在未來的人心目中就會拿這盤棋作為標杆。不一定alphago就是真理,不一定這步棋就是正確的,但是足夠說明柯潔過去一年做的功課確實充足和對人工智慧的理解,讓當之無愧是全世界最懂alphago的棋手了。
3 明天的團體戰的成員周睿羊說:本來看了第一場覺得他們沒有希望贏alphago 但是看了這場比賽對明天的團體戰更有信心了,這無意中透露出柯潔和 明天即將出戰的五人就像呂布和五虎上將的關係, 柯潔的地位無雙。假設明天相談棋他們五人神勇的戰勝alphago一定會認為今天alphago被柯潔逼出極限是他們贏棋的基礎。當然這只是個假設 就算5個人也很難,天知道alphago除了這一重極限還有沒有更高的境界
4 跟這次比賽無關柯潔的三冠王我一直都覺得很不可思議,因為這個年代跟李昌鎬 李世石 古力的年代不一樣, 圍棋理念進化過一次 百花齊放太多人有爭奪冠軍的實力了 在這個大環境下拿下一年三冠真的是傳奇了 還刷新了最年輕記錄 如果柯潔拿到超越八冠他的歷史地位碾壓古力 如果他拿到15+ 柯潔的歷史地位應該也超過二李了。
為什麼柯潔認為執白對抗阿爾法圍棋贏面大?
1. 柯潔執白勝率是當今棋壇第一,柯潔更擅長執白,2015年所有計算等級分比賽中柯潔執白只在最後12月底時 夢百合杯世界圍棋賽決賽首局 輸了一盤,只差一盤全年執白不敗
2. AlphaGo自我對弈結果也認為白棋有利(黑棋貼目負擔重)
可行的取勝之匙是什麼?
1. 很多人說AlphaGo一定有bug,程序代碼一定有bug,神經網路只是近似而不是完美,任何人都可以毫不猶豫地說AlphaGo有缺陷,比如官子不是完美(Demis/Aja Huang/David Silver都知道這一點,但是目前AlphaGo前面優勢太大,這一點不影響AlphaGo取勝,勝率足夠高了,v18以來只出過一次致命失誤輸給李世石一盤。官子問題希望以後能解決,完美主義者不能忍,搞計算機的不少完美主義者,我覺得會解決的,時間問題,這個問題也不簡單。)
2. 說AlphaGo有大量Bug的,真是胡說八道了,什麼叫大量?AlphaGo就是一個程序,測試程序是否有大量Bug就是用一個測試程序做大量測試,測出Bug就是成功。換個做法,對DeepMind以外的任何人來說,可以製造一個更高明的NumberOneGo,贏AlphaGo一次類似於你發現了一個gmail的bug,報告給google拿一筆不低的獎金(完全可以設立一個勝局獎金)。到目前為止,絕藝是世界第二的圍棋AI,從網上對弈的勝率看遠不如AlphaGo-Master,明顯不能威脅AlphaGo。如果哪一天絕藝新版本勝率可以和AlphaGo-Master媲美,那麼Google不會繼續拒絕和其他圍棋AI比賽。換句話說,AlphaGo v18以來到現在的新版本,戰績驚人,無人能敵,從勝率角度看這個程序夠完美的了,你見過AlphaGo比賽時出現過死機或藍屏嗎?或者讀秒超時?
3. 圍棋就是一種策略智力遊戲,要贏就是應該追求每一步最優,追求每一顆子高效,什麼先撈後洗、多頭緒亂戰都是針對對手弱點某些情況下可行的策略,卻不是最本質的。
AlphaGo有情緒嗎?有偏好嗎(比如實地,外勢,攻擊,鋪地板)?沒情緒、沒偏好,只按照程序設計的Goal來執行,最大化勝率,基於Value Network等來決策,這是很接近「追求每一步最優,追求每一顆子高效」的本質啊。
所以,最佳策略就是回歸本質,不要像對付人一樣,以為AlphaGo有偏好或者有不全面的技術短板,AlphaGo如果有短板那是程序設計不完美的地方,而不是由於Aja Huang或樊麾棋風偏好或棋力強弱影響了程序的「棋風」。
目前已知的AlphaGo「偏好」就是追求勝率,在優勢時不介意放棄一點目數利益簡化局面、減少變化風險,那都是在它看來可控的情況下的退讓,當然如果它沒算清楚,退讓過多輸掉也不是不可能,但是目前只有李世石第四局它出Bug後劣勢時的下法顯示出演算法的「弱智」,優勢下它從未丟失過好局。人類看起來只好寄望於出Bug,AlphaGo水平已經超出職業棋手不是4-5目的優勢,保守一點說讓先不貼目AlphaGo應該勝率都極高。究竟是讓二子好勝負,還是讓三子依然無敵,這就難說了,沒有這樣的比賽實踐,大家都是分析推測紙上談兵。
因為中國規則貼3又4分之3子,不嚴謹的對應就是七目半,比起日本規則的6目半多貼了一目,造成黑棋大貼目的現狀,增加了執黑的壓力。而柯潔執白更強,這已經是棋界的共識了,詳見:2015年新聞:
柯潔今年創執白34連勝不敗神話 豪取6個賽事冠軍以及李世石在柯潔與alphago下完第一盤後:
李世石:首局柯潔完敗 下一盤執白會做得更好當然上面說的「子」和「目」的對應關係是「不嚴謹」的,這牽涉到日本規則和中國規則的差別。本來貼目和貼子是可以按照:目數 / 2 = 子數來對照的。然而這只是一個簡單的結論。因為中國數子法中,棋子佔地和圍空都算作「地」,也就是常說的子空皆地,而日本數目法中僅有空算是目。這就引發一個很重要的問題了——就是如果終盤時候,黑白雙方手數不平衡(具體說來就是黑棋可能比白棋多下一個子),那麼這就對白棋很不公平了。所以如果說黑棋手數比白棋手數多一手(通常叫「黑棋收後」),那麼貼的7目半其實就又變成了貼6目半了,所以說,中國規則的「大貼目」對黑棋有壓力是有前提的,那就是白棋收後的情況。
但縱然這個「大貼目」所體現的壓力貌似沒有想像中那麼大,但是在高手間,半目可能就是無法跨越的鴻溝了。柯潔在今天的賽後新聞發布會也提到了——「黑棋第一手棋下去之後,AI顯示黑棋的勝率就只有48%」。也印證了現存貼目規則可能不完善的現狀。
值得一提的是,李世石去年人機大戰第四局結束後,也提出要選定第五盤先後手(按番棋規則最後一盤應該重新猜先):
李世石請戰 最後一盤我執黑_信報網但不同的是,李世石神之一手獲勝的第四盤執的是白棋,他只是想全方位地打敗alphago而已,初衷跟柯潔完全不一樣。不得不感慨:石頭還是那塊頑石!
第一柯潔個人喜歡下白棋,前兩年還有過執白不敗的事情出現,第二,看一下狗狗的自戰棋譜就看出來了,中國規則貼目貼的確實對黑棋很不友好。今天放出來的10局裡面黑棋勝的只有兩局
這不奇怪。
中國規則之下,黑棋貼子為3.75,相對日本、韓國規則,「換算」過來的話黑棋多貼0.5子。AlphaGo一直使用中國規則(包括對韓國棋手李世石的比賽),雙方各走一手的情況下,AlphaGo天然地判斷白棋勝率更大一些。
此外,柯潔和人下棋的時候,執白棋的勝率也是超級高……
要看精彩的其實很簡單:狗兒執黑時,直接把狗兒的規則參數改為黑貼20目,馬上就能看到狗兒殺得雞飛狗跳了。
謝邀。
我認為可行的取勝之鑰匙就是白棋下模仿棋。從騰訊AI絕藝的表現來看,AI對陣模仿棋的勝率比正常下棋要低非常多。我印象中絕藝就沒贏過白棋模仿棋。alphago當然比國產AI絕藝強很多,但用白棋下模仿棋怎麼說也是一個有利因素。
最後,我覺得下模仿棋沒什麼丟臉的,想怎麼下就怎麼下。圍棋本就是自由的。
所以,我們還是5月27日再看吧。我覺得最後一次大型人機大賽,柯潔該下啥就下啥,這次再留著以後也沒機會了。
人贏不了AI,又不是丟臉的事。我舉東西,比不過叉車。跑步比不過摩托。這都是正確的,正常的。在圍棋上,AI不會犯錯,人腦子發暈會犯錯。這事沒啥害羞了的,沒必要糾結。不如這樣好了,第一次讓一個子。第二次讓兩個子。看看,人和AI到底差幾個子!人只要贏過人就可以,沒必要一定要贏過AI。現在還有誰介意自己加減乘除不如計算器?我不介意。我桌子上放個計算器,兩位數加減我都用計算器。不害羞,不丟臉。
執白也沒有取勝之道,只有幻覺,取勝之道只有讓三子(至少兩子)。
我如果是柯潔,就會老老實實地要求狗狗讓三子試試看。
三子在圍棋中是個坎,也是個梗,這是業餘和職業的差距,是有可能勝和無可能勝的差距。
中國棋界史上有個故事,就是黃龍士讓三子徐星友十盤血淚篇。讓三子十盤讓徐星友成為國士。
有個梗,就是任何時代任何高手被問到和圍棋之神差多少?這個答案就是三子。
當現在有個接近圍棋之神的出來了,棋界的第一反應卻是:我要捍衛人類尊嚴,與神一戰。
沒有一個圍棋界人士足夠謙虛,表示說,我願意以下手的姿態學習,請圍棋之神下三子指導棋。
說不定,下10盤後,棋力就上等級了。
平下不能漲棋力嗎?
是的。不能。
因為規則是黑貼7目半,個人認為7目半有點偏多,本身柯潔就比較擅長於執白棋,而且之前阿爾法狗對阿爾法狗自己也是執白勝率更大,好像是百分之55的勝率吧,可以理解為執黑的阿法狗跟執白的阿法狗比偏弱一些
是因為alphago執黑的話下完第一手它自己判斷白棋勝率為55%黑棋為45%
如果給人更多的思考時間呢?比如讀秒時間變得極長。。
人腦在高度緊張的情況下,思維運作能力本就會下降;機器不會疲憊,不會有情緒——這其實是不公平的。
畢竟我們期望的是比較人與機器的棋力,但現在其實「身體機能」這一因素也被考慮進去了。機器不耗體力,人類消耗體力,這個實驗顯然就有了第二變數。
所以想著人機大戰,讓子還不如大大拉長讀秒時間——人類棋手對戰,時間類似一種對內力的限定;現在機器通過硬體提升單方面打破時間的束縛,也算一種勝之不武。
不然,你把阿爾法狗裝在我們學校圖書館電腦上,再和人類棋手下棋試試看——下一步就卡死你。
如果阿爾法狗靠的是演算法程序,而不是硬體支持,那我覺得有必要本著「消除干擾變數」的準則,和人類選手下「沒有時間束縛」的一盤棋——這才是真正把人類棋手對圍棋理解的極致發揮出來。大概,早上吃白片不瞌睡?
以上
用 AlphaGo A的招對付 AlphaGo B,用 AlphaGo B對付 AlphaGo A。柯姐對AlphaGo A,AlphaGo B總能贏一盤。除此之外沒有 取勝之匙 。
不可能贏ai的。圍棋本質是靠對方的錯誤贏棋的。ai不會犯錯o(╯□╰)o。。。
人造人也許有可能
模仿棋應該不是執白的主要因素吧,畢竟任何一個學棋的小孩很小就都被教過兩點:如何應對模仿棋(比如征子);電腦不會模仿棋(我學棋的時候厲害的電腦應該不會超過業餘1段水平)。時至今日,alphago已經完善如此,對基本的模仿棋不過沒有基本準備的。
在我看來執白勝望更大的一個原因是貼目壓力。眾所周知電腦的一大長處在於更加精確失誤更少,尤其是在定型和官子階段。拿黑棋的話在大貼目時代更有可能被牢牢控制拉開,功夫棋顯然是人類棋手不願意看到的。
除此以外我覺得還有一個心理原因。就像當年不貼目時代吳清源大師的棋被很多人認為偏薄,執白面對alphaGo想贏的情況下肯定會不知不覺把棋下得更激進,更容易產生作戰混亂的局面也更容易形成與過去棋譜不同的棋形,因而在alphaGo按historical data選點算勝率的演算法下,無疑會有更多的機會。個人感覺:柯潔的想法可能是,人工智慧依靠許多過往對局數據形成一套演算法和策略。如果對方先行,相對來說沒有那麼多數據依據,更多靠的是自身的自主思考。
推薦閱讀:
※2013年圍棋包攬全部世界賽事冠軍,能說明中國圍棋崛起了嗎?
※如果舉行一次圍棋大賽,金庸小說中的哪個人物能一舉奪魁?
※如何評價谷歌圍棋人工智慧AlphaGo戰勝李世石?人工智慧的下一個高地在哪?
※第一手天元真的不好嗎?
※如果圍棋已經被人工智慧完全破解,得出某色必勝,那圍棋還有什麼意義?