棋盤大小以及所用時長,對 AlphaGo 的獲勝概率有影響嗎?

本題已收錄至知乎圓桌 ? 對弈人工智慧,更多關於李世石對戰人工智慧的解讀歡迎關注討論。


先說棋盤大小。影響巨大。

如果立刻換成n×n(n在19左右,不太小也太大。太小9×9可以暴力求解,太大99×99,李世石會累傻的。)棋盤,AlphaGo針對19×19訓練的各種參數基本上白訓練了。李馬上就能連克三局3:2獲勝。(此刻AlphaGo已經2:0領先了。)

就算給AlphaGo一個月時間重新訓練的話,李還是能3:2逆轉。n×n的棋譜是如此少,職業級的n×n棋譜更是稀缺,以至於根本不可能餵飽AlphaGo的神經網路。相反,以李這種級別的天才,練習十局又是一個頂尖高手。

簡單來說,棋譜極少的時候,AlphaGo就是戰五渣。人類從極少量的數據(比如數十個樣本)中學習推斷的能力,一直是深度學習望塵莫及的東西。在未來,其他學習演算法(尤其Bayesian Learning)可能會在這方面取得突破。

除非Google能再造一個可以產生職業級n×n棋譜的輔助AI,把alphago的自我對弈生成一些基本棋譜,然後給AlphaGo喂招。那我就服了。。(其實這也是不現實的。就算Google真弄出來這麼一個AI,也同樣沒有數據喂。數據要慢慢積累,Google再黑的科技也不能在一個月里把大量數據憑空變出來。)

再說時間。

按照30秒一手的快棋走法,對AlphaGo會有一定影響。但基本上影響不大。無非是收斂條件不要那麼嚴格就行。之前第二局裡,讀秒階段每一手60秒,AlphaGo表現得也相當好。

如果時間短到只有數秒,李世石可能會憑棋感佔優。優化時間少一個數量級對人工智慧的性能的影響還是相當大的。在雙方棋力大減的情況下,發生各種偶然的情況就會大增了。


19路棋盤,361個交叉點,黑棋181粒白棋180粒可布滿整個棋盤。

如果升級到21路,對應441個交叉點。類推則一罐子黑棋最多221粒,白棋220粒。

但在對弈的難度和行棋風格和思路上就不止是增加了22%的棋子數這麼簡單了。

19路棋盤的邊角實地與中央厚勢的均衡格局,進入21路棋盤就完全被打破了。中央戰鬥取得收益的價值比19路棋盤就大至少30%甚至50%了。

無論是人類棋手還是電腦AI,基本上都需要重新評估行棋的策略了。

反正人類還沒有大規模實踐過,沒有足夠的經驗積累可以回答這個問題。

電腦AI如何,我也不知道。


棋盤越大,每一步產生的可搜索狀態空間就越多也越深,那麼想搜到最優解就需要更多的時間,如果棋盤達到100*100,理論上的計算量是現在機器很難達到的,無論你怎麼優化演算法,

其次,理論上機器可以自己對弈學習,但無論怎麼學短期內,棋盤達到100*100這個級別,機器是無法戰勝人的,除非有新的更好的學習策略,而現有的學習策略僅僅是模仿人類,並沒有超越人類

可以想像,如果是9*9的棋盤,那麼在五年前,甚至十年前就已經完敗人類了

不過如果真的是大棋盤,是否可以分割成小棋盤,在理論上還是可以行的同通,比如把100*100棋盤分割成25*25*4*4再分別計算,然後加總,一方面減少計算量,一方面統籌規劃,好比真正的戰爭分成局部戰場,然後一個總司令部,這在布局階段可能適用

另外還有一種分割是在中盤依據棋塊來分割

參考我的另一個回答

如果把棋盤放大到25*25,現有的圍棋理論有哪些可以通用

圍棋講究實地和外勢平衡,追求效率,這是基於現在19或13路棋盤下。

每個棋子能影響周圍四個點,在棋盤越小的情況下,每個棋子越重要,在棋盤越大的情況下則每個棋子的重要性降低

星位作為19路棋盤控制著16個格子的進出門戶,在25路棋盤中重要性降低。

圍棋本質一個是棋子佔據的一個點,還有若干個是棋子的連接構成的勢,在棋子佔據的點隨著棋盤越大對整體的重要性越低,那麼連接構成的勢的重要性會相對提高。

所以結論一,起手比19路棋盤重外勢更輕實地,所以下星位的人更少可能偏重於55到66之間選擇一個點作為起手…進而逼迫對手佔據實地,自己取外勢

角和邊容易占實地,但容易被封鎖,所以邊角重要性降低

結論二

5,6路成為新的外勢和實地的平衡線,取代原來3,4路成為新的戰火線

越重實地越保守,越重外勢越積極,極端例子,如果是6路棋盤肯定是佔地為主,沒誰求外勢,先手占實地的人肯定保守,所以棋會比較悶,可能

結論三,重外勢,輕實地導致圍棋更激烈對抗

結論四,大模樣的棋更少I,因為一塊棋你千辛萬苦圍起來一看,中間可以做活,或是別人趁機佔了更多地盤,得不償失,自己把自己圍死了

結論五,天元作為一個中點的重要性提高,因為圍棋大,更講究勢,就是對四周的輻射力,無疑天元是最佳選擇之一

如果上面結論對,猜測一下金角銀邊草肚皮要大逆轉可能,天元成為新的起手棋編輯於


棋盤小的話運算量小,人類神經系統的模擬特性(比如把光波振動不同模擬成一目了然的顏色)並不能獲得優勢。在運算量小的其他棋類中人類早就完敗了。

時間長度一般來說越短對人類有優勢,因為同等時間計算人類是不可能擊敗電腦的,人類只能利用經驗 感覺 靈性,這種非計算的快速方法獲得優勢(主要是前期,計算量大)。


局部演算法已經早被超越,只能大局觀積累優勢。


旁觀者一點粗淺的理解

棋盤大小

有影響。其一,棋盤越小,暴力窮舉計算量越小。其二,alphago訓練的時候用的就是19x19的棋盤,所以TA的決策都是基於這個棋盤的,並不能「臨時」換成別的棋盤。當然我覺得李世石也不行。不過假以訓練時間,讓alphago適應一個別的棋盤比如21x21,是完全沒有問題的,只是需要重新訓練而已。

走子時間

也有影響。alphago有所謂的快速走子模式,即犧牲一定的精度來提高走子的速度。不過實際上也看到alphago時常也會長考。不同的時間限制應該會制約alphago選擇何種策略,以及搜索深度等等。最終都會影響走子選擇的好壞。


棋盤大小

alphago中用於訓練棋感Policy Network是用KGS圍棋網站上3000萬個 (棋盤狀態,下一步走子)state-actions pairs(s,a).如果將棋盤大小增加到21*21或者更高.alphago就沒有現成的可用於訓練的資料庫.

不過,別忘了,alphago可以自己和自己下棋,提高棋藝.沒有訓練棋感的資料庫,問題不是很大.

對於人類,棋盤大小增加,好多棋理是相通的.可以按照19路棋盤的知識,順推到更高路數的棋盤.需要將中腹的權重加大.

走子時間

如果是雙方都用同樣的時間的話,減少或者增加走子時間,影響肯定是有的,但不會很大.

不過隨著時間的推移,晶元的計算能力的提升,alphago可以通過更換更好的硬體,而人類就只能一邊乾瞪眼了.

alphago是攜著深度學習的東風而來,在時代的浪潮之下,就算更改棋盤大小,限制時間,限制硬體等等.

都只是緩兵之計.


應該是有影響的。棋局越大,需要的計算量越大。同等配置的機器人,所需要的時間也會相應增加。所以對於機器人來說,棋局大了,選擇在哪個位置落子,其難度會加大。


棋盤的大小會影響處理時間,但長遠考慮的話,估計未來配置升級後,棋盤的大小將不會明顯影響algo的所需要的時間,也不會降低它的勝率。


有影響的,棋盤越大,每一步產生的可搜索狀態空間就越多也越深,那麼想搜到最優解就需要更多的時間;

而目前規則是2小時後耗盡後,每一步的思考時間只有1分鐘,那麼就會導致AlphaGo為了節約時間,可能未搜索到最優解就走出一步棋,從而贏得概率就會降低。

昨天第一句里可以看到後期AlphaGo的耗時是很多,從而也說明了,AlphaGo為了求勝,花了更多的去搜索概率勝率較高的下法。


取某一下界,顯然有窮舉可能性,又根據某定理能確定終盤狀態,故有影響。


應該還是有的。今天看直播的時候忘了那個解說說的,在足夠小的局部死活棋里電腦的水平其實早就超過了人類。


YES

The smaller the board is, the easier the algo can reach the bottom of tree.

學校電腦不能打中文,先回答了標記下然後換手機回答。

下棋就是在進行選擇,機器強大的在於計算不同下法的勝負效率很高。

每條路的終點是白是黑本就決定了,區別在於你要順著哪條路走。

基礎的AI演算法就是提前算好每條路的結果,然後每次選擇對自己更有利的方向。

當路算不到底的時候,簡單方法是算到某一步,然後看這一步的黑白。而這一步的黑白,可以由資料庫提供答案,或者別的演算法去估算。

當棋盤不大的時候,機器暴力拆解可能直接就探底了最終答案,加上不斷自我對戰產生的大量已有數據,機器對最終結果的預測會越來越準確,越來越能在早期建立優勢。人可能棋力有限,對當前局勢還不能完全看清的時候,機器已經有了對結果的判斷。


我想,AlphaGo恐怕只考慮了19路圍棋,一般來說,當棋盤是大小是一個常量的時候,可以得到更優化的代碼.而且,它的開局庫肯定也是19的.


如果升級到20x20就完全可以虐Algo了

據說是從3的(19x19=361)次方升級到了

3的(20x20=400)次方,

3^(20x20=400) = 7.055079108655332e+190

3^(19x19=361) = 1.740896506590319e+172

(如果AlphaGo沒有保留實力,就當半分鐘出一個策略的話)

複雜度高了萬萬萬億倍~你說現在的alphaGo會不會跪?


推薦閱讀:

關於L2範數如何避免過擬合?
中國基層編作曲從業人員是否可能被人工智慧取代?

TAG:圍棋 | 機器學習 |