標籤:

如果允許悔棋,人類能在 100 年內下贏 Alpha Go/Master 嗎?

允許悔棋,理論上也許可以通過窮舉來贏,但是時間太長,即使用計算機來算到太陽爆炸都算不完,所以不考慮這種情況,加了 100 年的限制。允許悔棋,主要是為了修正人類犯錯誤的可能性,盡量來達到人類理論上能達到的最高水平。在這種情況下,每一步都地球上所有人類都挑不出錯誤的情況下,人類能下贏機器嗎?


不認為樓上幾位真正懂圍棋。

能無限悔棋,對一個懂得自我檢討的高手的提升非常強大,大家看職業棋手的自戰解說就明白,很多棋下完沒多久自己就能發現出了什麼問題。

和20s一步的快棋相比,無限悔棋加不限時的提升至少在兩個子以上。(這還是保守估計)

那問題就是,提升這麼多之後,人類還能不能戰勝alphago。

另外,某個答主說人類永遠無法真正戰勝ai,因為ai在不斷進步不斷修正且速度比人類快,這觀點很沒意思。把過去的ai和未來的ai算做一個連續的整體,我認為沒啥意義,答案是顯而易見的。

最後給個個人結論吧。無限悔棋職業棋手戰勝v18沒有問題,戰勝master難說(沒見過master劣勢下的棋),戰勝之後的坂本很困難

更新一下,無限悔棋的柯潔大概率戰勝不了alphago zero。後者在我心目中接近完美圍棋ai。祥見評論區


我不知道題主所說的阿爾法狗是指黃博士團隊不斷改進進步的那個AI,還是特指master或者是和李世石下棋的那個版本。如果可以不斷進步,那麼人類應該還是不敵AI的,因為AI畢竟是以人下的棋為基礎加上恐怖的計算量和幾乎為零的犯錯率。但是如果是指那兩個版本,或者說專指master,那麼人類復盤勝我相信還是有機會的。


在人類思想統一這個問題上,不是所有的時候都會產生1+1》2的效果,有時候集體決策反而是個誤判。所以我們說:真理往往掌握在少數人手上,而且就算悔棋,A 是機器啦,最不怕耗時間了,只要你不斷電保持散熱它就一直堅持,排除無限長時間這種特殊情況。


謝邀。抱歉我匿名回答你的問題。

不可能。

可能你對圍棋界不太熟悉,不存在「地球上所有人類都挑不出錯誤」的著法。

例如,一方二連星開局,一方星小目,第五手如果掛角,我估計掛角的方向就得吵十年。


題主邀了我回答兩個問題,都是關於人類怎麼戰勝AI的。

我這邊一起答了。

====================================================

結論我先提上來:

人類很難真正意義上,再戰勝AI。

就算人類發現了某一個AI的演算法盲區,打敗了AI。

只要使用同樣的方法,微調訓練方向,AI可以在很短的時間內訓練數據,再次打敗人類。

====================================================

其實,圍棋這個遊戲,沒有那麼玄,就是個決策遊戲。

比的是什麼呢?

是棋手對等同有限資源(棋子)的利用效率

兩個棋手,一人一個子,每個子四口氣,不管你是先下還是後下,氣沒了,你就要死。

每個棋子的能力一模一樣。

也沒有說李世石的棋子,每個棋的單兵作戰能力就碾壓我們愛好者啊。

這是什麼意思呢,也就是說,如果雙方誰都不死棋的情況下,終盤的時候,棋盤上的棋子應該是一樣多。

輸贏比的是,誰能把一樣多的資源(棋子)用出最大效率。

什麼樣的人圍棋下的好——

局部計算快,快速發現每個棋子的潛在價值。

具有豐富的對局經驗。

這個對局經驗來自兩部分:

一部分來自於其他人的對局,就是我們說的打譜,還有一些總結出的死活題(其實也是一種經驗規律)。

另一個部分,來自於自己的對局,就是實戰中總結的經驗。

(這一點和深度學習的原理其實很相似)

不過,我們討論了幾千年仍舊無法得出最合理的經驗規律。圍棋是少數還在不斷更新下法和理論的古老遊戲。

圍棋的變化實在是太多了(千古無同局),圍棋的變化是一個幾乎無法窮極的天文數字。

有句著名的話說:棋道一百,我只知七。

於是,能給出最佳判斷的假想存在被稱為圍棋之神

下出的最佳一手棋被稱為神之一手

所以,我們輸給AI輸了什麼?

並不是說,AI的智商比我們高了。

只是AI使用了一種大數據統計得出的判斷方法,戰勝了人類以往所討論研究的判斷方法。

(不一定是完全優於人類,很多棋,還是沒到最準確,但是配合上AI計算量大,不失誤的特點已經在快棋上完勝人類了)

請大家仔細品一品我這句話。

包含兩層意思:

1、AI比我們計算的快。(這一點大家應該早已達成共識)

2、AI在從大數據中總結出的規律,比人類準確。(或者幾乎接近於人類討論得出的最佳下法)

也就是說,一旦我們認同這個AI戰勝了人類,相當於認同了,在圍棋上電腦總結規律的能力已經可以與人類相比,或者接近人類。

這用知乎的一句話就是:比你有天賦(算的快)的人,同時還比你努力(訓練數據量大)

那麼,所謂的戰勝,就不再是競技性質的戰勝了。

而變成了一種測試性質。

從這個電腦挺厲害,我要打敗他。

變成了我試試能不能測試出電腦的bug。

或許,我們能像去年3月份,李世石第四盤對局中下的那樣,發現電腦的某一個判斷短板,並通過電腦數據訓練的盲區戰勝它。

這個時候,開發團隊只要做一件事。

就是把這個判斷的失誤考慮進去,再次訓練數據。

不需要多久,就能再次打敗人類。

畢竟0到1的過程才是最難的,而這個方法通了,剩下的問題就不那麼難了。

從年初的這60盤快棋中,不管是從愛好者和職業棋手的角度對AI的評價都是相當高的。

之前,我們對電腦的棋評價還是,怪,但是仔細看卻有點道理。

但這一次的評價,更多的是,均衡而且靈活。

柯潔在和Master交手後也說,他現在也是一名狗吹。(狗是棋手對AG的愛稱,狗吹就相當於是AG的粉絲)

其實,我個人認為,這完全是沒必要較真的一件事。

就算AI能給出最佳的判斷,並不影響我們,把圍棋當做一種優秀的智力娛樂活動。

相反,以前我們研究了半天,仍然不知道我們是不是學了臭棋。現在有阿老師幫我們驗證一下,不是挺好的么。

我們在圍棋中會獲得更大的樂趣的。

這就好比,有了攻略了,你就不玩遊戲了么?

在遊戲卡關的時候,你會不會想,這時候有個聲音告訴我,這邊該怎麼做就好了。

下個時代絕對不是圍棋藥丸的時代,而是人類和AI攜手享受圍棋快樂的時代。

希望這個答案你能滿意。


如果悔棋有用,重下一盤不就得了嗎?

老聶的勺子論基本上就是個笑料,或者說是被寵壞了的小孩子脾氣。

我一直有個想法,把歷史上判斷為兩分的局面(下至布局或中盤均可),或者是對於黑好還是白好沒有定論的局面,找兩位棋手各自選黑白決勝負。

回到老聶悔棋的事兒,如果Alpha Go不怕羞辱對手的話,就從老聶「出勺子」那手棋開始重下,你押誰贏?


謝邀。

單從這60盤棋來看,客觀的評價是:人類頂尖高手和Master的差距至少是讓先倒貼這個級別的。

把同等量化的棋份放在不同級別的棋手身上,差距是不一樣的,級別越往上,進步的棋份空間越小。

怎麼理解這句話?

比如,一個被柯潔讓3子的業餘高段棋手A和一位被這位A選手讓3子的業餘低段棋手B,假設他們天資相同,A付出努力到柯潔的水平和B付出努力到A的水平是天壤之別。

因此對於頂級人類棋手來說,進步一個貼目簡直是千難萬難。

那麼問題來了

假設C是二十年前的標準業餘5段,C和柯潔的差距大概是讓2-3子。現在C可以無限悔棋與柯潔下...你覺得C能贏嗎?


允許悔棋

棋的質量會高些

至少聶老這樣的不會出大勺子

但要贏的話

估計很難

不信?

你找個你下不過的象棋程序

可以悔棋的

試試


是放棄勝負,還是放棄對圍棋境界的追求?

落子無悔是我學棋第一課就學的規則,真的為了追求一勝而放棄么?

放棄勝負也許人類尚可獨善,然而當我們放棄圍棋的規則和境界的時候,無論怎麼樣都已經贏不了了。


其實這是一個好問題,在我看來,這個問題可以類比為,

僅考慮棋藝,人類和電腦誰更強?

事實上悔棋並不是很好的選擇,如果可以悔無限步,那自然沒有意義了。如果只能悔一步,發現問題時也難以挽救。

所以其實可以用一個更簡單,更能操作的辦法來解決人類和電腦誰更強,用兩個電腦,一個用人類棋譜訓練(當然為了對局數量,也要用電腦間對弈),一個只用電腦間對弈。看看人類的棋譜對他到底是好是壞。如果後者贏了,那麼可以說電腦領先我們的不僅僅是技術,而是關於圍棋的所有想法。


人類能在100年內跑贏汽車么?人類做四則混合運算能在100年內算贏計算器么?

下圍棋本質上是一項搜索工作,人根據經驗能在龐大的搜索樹上做一些剪枝。以前因為圍棋的複雜性(同時也是人類搜索能力的局限性)掩蓋了其背後的機械性,弄得玄妙而難以捉摸。AlphaGo只是還原了圍棋的本質。


然後一路悔到開局(?_?)


http://www.zhihu.com/question/41171543

說明一下,根據deepmind公司發布的李世石與AlphaGo第一局的對局數據,白在第80手的時候勝率為74%。

下面是人類對第一局的棋評。

絕大多數人認為勝負處在102手以後。然而這個時候黑已經早就是砧板上的鹹肉,橫豎被切的命了。

人類想要悔棋勝,怎麼毀?怎麼勝?

但是,現在的情況好多了。棋手紛紛反應,到四五十手的時候就已經感覺有失誤出現了,除了聶老開局大優以外。我認為,光靠悔棋很難追趕AI的步伐。如果能看到後台數據的話,棋手會進步很快。

絕大部分人都認為白的102


在想這是不是就是Master左右互搏能快速提升的原因。

自我反省才是技能(注意不是智利)提升的源泉。


幾有 顯!


AI是啥?這個阿發狗靠的是統計數據和高速硬體,同樣的時間,對人類是不公平的。所以,不管阿發狗強到什麼地步,要是真能無限悔棋,那肯定能戰勝它,這等於無限增加運算能力。不過,人計算的速度太慢了。


悔棋已經算改變規則了,類似人和汽車賽跑,人先跑100米一樣沒太大意義。人和機器最大的區別就在於人擅長設計和創造,機器作為人能力的衍生擅長確定規則下的重複訓練而提高,沒有誰期望人能跑過汽車吧。真要把機器和人對立起來看,贏棋很容易的,臨時用中國古代圍棋規則如座子還棋頭不限時,不給人和機器訓練時間直接來下,人應當勝率更大。


悔棋意義不大,找三五個頂尖棋手商量著下可能更有效。有文章介紹講阿發狗的演算法,認為思考時長對阿發狗的著法不會有顯著影響。但對人類棋手而言,二十秒一步顯然太倉促。如果由三五個頂尖棋手以充分研究的方式下,可真正考驗AI到底是真在圍棋的未知上超越了人類,抑或只是一個精準的模仿者。


能啊,比如兩個alpha go對弈你說alpha go 會輸嗎?而且人類是能贏現在這個版本的,柯潔也是測試master的一員,他自己都說,私下裡有輸有贏,不過年代越久,棋譜質量越高,就不好說了。


如果是正式比賽,人類棋手不同意,觀眾不滿意,主辦方也不幹。


推薦閱讀:

AlphaGo在和李世石對戰時採用的是單機版本么?
當類似於AlphaGo的人工智慧發展到一定程度,由其扮演朱日和藍軍或歐文堡紅軍的指揮機構,將會怎樣?
韓國媒體和民眾是如何評價 2016 年 3 月 AlphaGo 和李世石的對決的?
AlphaGo 用了哪些深度學習的模型? 模型的輸入是什麼?
當前AI最厲害的戰略遊戲是什麼?

TAG:圍棋 | AlphaGo |