AlphaGo Zero 的棋譜體現了什麼特點與棋風?
Deepmind的最新論文公布了不靠人類棋譜完全自我學習的AlphaGo Zero,並公布了AlphaGo Zero的自戰棋譜和與之前AlphaGo版本對局的棋譜(可在弈客app看到)。這些棋譜給人類哪些啟示?
看了Zero和master的一些對局,簡單說說感想:
1、並沒有所謂的zero的棋更像人類,不知道這種說法依據在哪裡。zero在局部並沒有回歸人類總結的定式套路,在全局依然思路清晰方向明確,沒有什麼投石問路考驗對手之類的幺蛾子招法,可謂堂堂正正。
2、zero在局部戰鬥中的計算深度更勝master一籌,在局部接觸戰中雙方扭殺在一起時,絕大多數情況都是zero得利,說明圍棋的本質還是計算,算得深就是比算得淺牛逼。(當然不是說master計算不行,master的計算深度和廣度也是遠超人類高手的)。
3、zero更願意採用二連星開局而不懼對手點三三。自從master展示了點三三的威力後,這一下法迅速在職業棋界流行,甚至一度達到開局走星位的下法大幅度減少。但是zero告訴我們:點三三沒什麼大不了。二連星是一種簡明快速開局,迅速擺脫布局套路進入中盤作戰的開局下法,zero對二連星的偏好說明了zero更傾向於棋局不要拘泥於布局套路,應該儘快進入中盤作戰。
4、圍棋真的是一種高自由度與強必然性結合的遊戲啊(這句是廢話)。
更新一下,抱歉,我之前說的全是錯的,前面說的可以理解為說的是master版本的alphago的棋。我剛剛看到了youtube上的這兩個視頻。國內的,請翻牆看一下吧,高川格老師解說的Alphago zero對master的棋:https://www.youtube.com/watch?v=ZRFKTITxXBEt=2s 。https://www.youtube.com/watch?v=_XLi1SjnSow
這盤棋的看完之後,我都懷疑人生了。zero的強大在於你簡直不知道他下的好在哪,但是合在一起,就像洪水一樣,完完全全的衝垮了一切的防線。
我記得曾經李世石說過一句話,圍棋不在於什麼什麼定式啊,棋理啊什麼的,圍棋就是誰的力量大誰說的算。這一點在人類的圍棋上,基本上真的是這個理。但是到了master的時代,master證明給人類看,圍棋還是棋理為王,沒用什麼力量,就是以德服人就把你擊敗了。
但是到了master和alphago zero這邊,又回到了力量的比拼上,alphago zero用人類幾乎連想像都無法想像的力量,一下子擊垮了master。
也許這就是看山是山,看水是水。到看山不是山看水不是水的境界。再到看山還是山,看水還是水的境界吧。
Alphago zero對上李世石版本的alphago,我們還是能看懂的,能看得到裡面的道理。但是到了zero對陣master的時候,就完全是神仙打架了,我們只能看得懂master的棋好,卻完全看不懂zero的。
到目前還沒有看到職業棋士對這些棋譜的講解。作為一個外行愛好者來看,我的感覺主要是三點:
1,永遠在精確的計算全局最大的點在哪,只走全局最大最穩的點,哪怕局部虧成狗也毫不在意。
2,注重外勢,寧可虧實地,但是不願意失勢。
3,棋走的很善,或者說每一步都走的堂堂正正。幾乎沒有任何無理手或者欺負人的棋。總體來說,alphago給人的感覺就是內力渾厚的名門正派的高手,沒有任何類似辟邪劍法的邪著,也沒有任何用小無相功催動少林七十二絕技的痕迹。純粹用堂堂正正的方式去贏。但是就是擋不住
以玄鐵內力(無敵的計算力),驅動獨孤九劍(實時選擇最優解,沒有任何定式、棋型、薄厚等的束縛)。別的高手一敗難求,難找對手,他卻會左右互搏……
之前看到的一個新聞。
阿爾法狗蛋下的棋譜,有一個特點就是,開頭與人類強者下的套路幾乎相同。但是令人訝異的是,在下棋的中間段,阿爾法狗蛋下的方式與人類完全不同,而且下的更完美。
這個特點的原因,是阿爾法狗蛋並沒有基於人類歷史的棋譜學習,而是自己左右互搏。換句話,他是靠TPU(有局部優化的特點),通過各種統計,最後統計出來的演算法(走法)。
給予人的啟示的話,或許以後ai能比人類,在某個領域得到更完美準確的知識。因為人類會被自己所困,而產生盲區。
不過阿爾法狗蛋的編程師說,ai並不會成為超越人的。。。東西(?),而是與人類共同和諧相處的工具。
我也看了高川格的點評,說一下,master的棋非常正,zero的棋會更加緊密,而且可能是對殺能力更強,所以拼殺度更高,也更傾向於用更為強大的計算力的殘差網路(深度更深,局部的計算能力,死活能力更強)產生殺招,戰鬥力更強。而且我們的看不懂,其實也是需要解釋的,要像圍棋tv裡面樊輝解讀的5局棋裡面一樣,將很多內容掰開,揉碎了來講,才發現master或者zero預計到的局面是什麼,具體就像柯潔那時候講的李世石對戰第一版alphago的時候,有時候他會突然冒出這裡其實是要算征子的,但一些棋力差一點的一點都沒有算出來,不知道說的征子是什麼一樣。
所謂的全局最優點,其實就是吳清源大師講的發揮所有棋子能力最大的點,你看進化中的alphaGO其實有過第11手走天元的棋,你就逐漸明白,其實進化來自於更多的算路精準,不同的棋局比較。在這個方面,其實master可以出一個棋庫,裡面講述了它比較認可的定式的樣子,就像黃博士在面書上面拆解的幾個難定式一樣,將我們很多的觀念都改過來而已。
還有一點,zero的進攻性棋子更多了,所謂的點三三其實就是針對星位弱點的進攻,看東西更加辯證,盡量的針對你所下的棋所放棄的東西進行攻擊。裡面的2路的棋子更多見了,其實也是預示著我們的平時的金角銀邊的內容是正確的,而且權重還在加強。
總體三點,1、局部死活能力更強而更為傾向於實地;2、全局考慮更加傾向於穩妥做活與收起拳頭再攻擊;3、 看不懂是因為我們對於計算力的弱項,希望alphago團隊再找幾局棋子出來回答解讀。
AlphaGo Zero對戰2.0版棋譜 ,第一印象神級的zero在布局上並沒有讓我很驚訝,跟人類的布局差不多,說明人類上千年總結的經驗還是很有道理的。中盤星位的點角定式就下出了跟2.0版本一樣的招數,說明在這個局部我們人類的定式確實有問題。不知道是幻覺還是咋回事,我感覺他倆有風格了,且不一樣 。
zero證明了柯潔的棋感是對的,他覺得他有機會贏阿爾法狗1.0版本。zero證明了1.0版本和2.0版本的差距是zero自我進化37天的差距。
我也玩了一個叫圍棋手談的app號稱是根據阿爾法狗的演算法做的,19路下不過我,但是9路完爆我最開始,後來我找到他的弱點,當我下出一招制勝招時,他瞬間智商下降成特別弱的水平,開始胡下,我覺得可能是因為他判斷之後每招棋的勝率都低於50%所以就不正常了,跟輸李世石的那局棋後部分情況一樣不管master還是zero,只要概率一降低,就經常莫名其妙的下,比如下面這步,這要是在外面棋攤子某人下這步,估計對手一把掀翻棋盤要給此人一頓老拳了!
從Zero想到一個問題:可以通過它證明中國古代座子制的合理性。我覺得中國古人傳下的這個規則不會是毫無道理的。想到的一個方法,是讓Zero計算在座子局面下的勝率,如果接近50%,就說明這時基本可以不貼目。另一方面,Zero基本下星位,它認為星位最佳,說明小目等其他定式其實是沒必要的。這也與座子的星位吻合。
古棋與現代最新科技成果有這樣的吻合不僅讓人驚奇,我想圍棋的起源恐怕不只是「古人發明」這樣簡單。木哈哈哈,霸佔下這個問題。智子沒有辦法鎖住AI的發展吧,AI技術爆炸給AI面壁者和面壁計劃成為可能。顫抖吧,三體。
沒有特點,只給最基本的圍棋規則,自己左右互博,4個TPU花三天時間就可以有490萬的記錄,而阿爾法狗需要48個TPU花三個月才能學習三千萬的已有棋譜才能打敗人類
推薦閱讀:
※Alphago Zero 取得的進步是突破性的嗎?
※如何看待 Deepmind 宣布 AlphaGo 退役?
※柯潔與 AlphaGo 對戰勝算有多少?
TAG:人工智慧 | 風格 | 圍棋 | AlphaGo | GoogleDeepMind |