AlphaGo Zero 的棋譜體現了什麼特點與棋風？

12-31

Deepmind的最新論文公布了不靠人類棋譜完全自我學習的AlphaGo Zero，並公布了AlphaGo Zero的自戰棋譜和與之前AlphaGo版本對局的棋譜（可在弈客app看到）。這些棋譜給人類哪些啟示？

看了Zero和master的一些對局，簡單說說感想：

1、並沒有所謂的zero的棋更像人類，不知道這種說法依據在哪裡。zero在局部並沒有回歸人類總結的定式套路，在全局依然思路清晰方向明確，沒有什麼投石問路考驗對手之類的幺蛾子招法，可謂堂堂正正。

2、zero在局部戰鬥中的計算深度更勝master一籌，在局部接觸戰中雙方扭殺在一起時，絕大多數情況都是zero得利，說明圍棋的本質還是計算，算得深就是比算得淺牛逼。（當然不是說master計算不行，master的計算深度和廣度也是遠超人類高手的）。

3、zero更願意採用二連星開局而不懼對手點三三。自從master展示了點三三的威力後，這一下法迅速在職業棋界流行，甚至一度達到開局走星位的下法大幅度減少。但是zero告訴我們：點三三沒什麼大不了。二連星是一種簡明快速開局，迅速擺脫布局套路進入中盤作戰的開局下法，zero對二連星的偏好說明了zero更傾向於棋局不要拘泥於布局套路，應該儘快進入中盤作戰。

4、圍棋真的是一種高自由度與強必然性結合的遊戲啊（這句是廢話）。

更新一下，抱歉，我之前說的全是錯的，前面說的可以理解為說的是master版本的alphago的棋。我剛剛看到了youtube上的這兩個視頻。國內的，請翻牆看一下吧，高川格老師解說的Alphago zero對master的棋：https://www.youtube.com/watch?v=ZRFKTITxXBEt=2s 。https://www.youtube.com/watch?v=_XLi1SjnSow

這盤棋的看完之後，我都懷疑人生了。zero的強大在於你簡直不知道他下的好在哪，但是合在一起，就像洪水一樣，完完全全的衝垮了一切的防線。

我記得曾經李世石說過一句話，圍棋不在於什麼什麼定式啊，棋理啊什麼的，圍棋就是誰的力量大誰說的算。這一點在人類的圍棋上，基本上真的是這個理。但是到了master的時代，master證明給人類看，圍棋還是棋理為王，沒用什麼力量，就是以德服人就把你擊敗了。

但是到了master和alphago zero這邊，又回到了力量的比拼上，alphago zero用人類幾乎連想像都無法想像的力量，一下子擊垮了master。

也許這就是看山是山，看水是水。到看山不是山看水不是水的境界。再到看山還是山，看水還是水的境界吧。

Alphago zero對上李世石版本的alphago，我們還是能看懂的，能看得到裡面的道理。但是到了zero對陣master的時候，就完全是神仙打架了，我們只能看得懂master的棋好，卻完全看不懂zero的。

到目前還沒有看到職業棋士對這些棋譜的講解。作為一個外行愛好者來看，我的感覺主要是三點：

1，永遠在精確的計算全局最大的點在哪，只走全局最大最穩的點，哪怕局部虧成狗也毫不在意。

2，注重外勢，寧可虧實地，但是不願意失勢。

3，棋走的很善，或者說每一步都走的堂堂正正。幾乎沒有任何無理手或者欺負人的棋。

總體來說，alphago給人的感覺就是內力渾厚的名門正派的高手，沒有任何類似辟邪劍法的邪著，也沒有任何用小無相功催動少林七十二絕技的痕迹。純粹用堂堂正正的方式去贏。但是就是擋不住

以玄鐵內力（無敵的計算力），驅動獨孤九劍（實時選擇最優解，沒有任何定式、棋型、薄厚等的束縛）。別的高手一敗難求，難找對手，他卻會左右互搏……

之前看到的一個新聞。

阿爾法狗蛋下的棋譜，有一個特點就是，開頭與人類強者下的套路幾乎相同。但是令人訝異的是，在下棋的中間段，阿爾法狗蛋下的方式與人類完全不同，而且下的更完美。

這個特點的原因，是阿爾法狗蛋並沒有基於人類歷史的棋譜學習，而是自己左右互搏。換句話，他是靠TPU（有局部優化的特點），通過各種統計，最後統計出來的演算法（走法）。

給予人的啟示的話，或許以後ai能比人類，在某個領域得到更完美準確的知識。因為人類會被自己所困，而產生盲區。

不過阿爾法狗蛋的編程師說，ai並不會成為超越人的。。。東西（？），而是與人類共同和諧相處的工具。

我也看了高川格的點評，說一下，master的棋非常正，zero的棋會更加緊密，而且可能是對殺能力更強，所以拼殺度更高，也更傾向於用更為強大的計算力的殘差網路（深度更深，局部的計算能力，死活能力更強）產生殺招，戰鬥力更強。而且我們的看不懂，其實也是需要解釋的，要像圍棋tv裡面樊輝解讀的5局棋裡面一樣，將很多內容掰開，揉碎了來講，才發現master或者zero預計到的局面是什麼，具體就像柯潔那時候講的李世石對戰第一版alphago的時候，有時候他會突然冒出這裡其實是要算征子的，但一些棋力差一點的一點都沒有算出來，不知道說的征子是什麼一樣。

所謂的全局最優點，其實就是吳清源大師講的發揮所有棋子能力最大的點，你看進化中的alphaGO其實有過第11手走天元的棋，你就逐漸明白，其實進化來自於更多的算路精準，不同的棋局比較。在這個方面，其實master可以出一個棋庫，裡面講述了它比較認可的定式的樣子，就像黃博士在面書上面拆解的幾個難定式一樣，將我們很多的觀念都改過來而已。

還有一點，zero的進攻性棋子更多了，所謂的點三三其實就是針對星位弱點的進攻，看東西更加辯證，盡量的針對你所下的棋所放棄的東西進行攻擊。裡面的2路的棋子更多見了，其實也是預示著我們的平時的金角銀邊的內容是正確的，而且權重還在加強。

總體三點，1、局部死活能力更強而更為傾向於實地；2、全局考慮更加傾向於穩妥做活與收起拳頭再攻擊；3、看不懂是因為我們對於計算力的弱項，希望alphago團隊再找幾局棋子出來回答解讀。

AlphaGo Zero對戰2.0版棋譜，第一印象神級的zero在布局上並沒有讓我很驚訝，跟人類的布局差不多，說明人類上千年總結的經驗還是很有道理的。中盤星位的點角定式就下出了跟2.0版本一樣的招數，說明在這個局部我們人類的定式確實有問題。不知道是幻覺還是咋回事，我感覺他倆有風格了，且不一樣。

zero證明了柯潔的棋感是對的，他覺得他有機會贏阿爾法狗1.0版本。zero證明了1.0版本和2.0版本的差距是zero自我進化37天的差距。

我也玩了一個叫圍棋手談的app號稱是根據阿爾法狗的演算法做的，19路下不過我，但是9路完爆我最開始，後來我找到他的弱點，當我下出一招制勝招時，他瞬間智商下降成特別弱的水平，開始胡下，我覺得可能是因為他判斷之後每招棋的勝率都低於50%所以就不正常了，跟輸李世石的那局棋後部分情況一樣

不管master還是zero，只要概率一降低，就經常莫名其妙的下，比如下面這步，這要是在外面棋攤子某人下這步，估計對手一把掀翻棋盤要給此人一頓老拳了！

從Zero想到一個問題：可以通過它證明中國古代座子制的合理性。我覺得中國古人傳下的這個規則不會是毫無道理的。想到的一個方法，是讓Zero計算在座子局面下的勝率，如果接近50%，就說明這時基本可以不貼目。另一方面，Zero基本下星位，它認為星位最佳，說明小目等其他定式其實是沒必要的。這也與座子的星位吻合。

古棋與現代最新科技成果有這樣的吻合不僅讓人驚奇，我想圍棋的起源恐怕不只是「古人發明」這樣簡單。

木哈哈哈，霸佔下這個問題。智子沒有辦法鎖住AI的發展吧，AI技術爆炸給AI面壁者和面壁計劃成為可能。顫抖吧，三體。

沒有特點，只給最基本的圍棋規則，自己左右互博，4個TPU花三天時間就可以有490萬的記錄，而阿爾法狗需要48個TPU花三個月才能學習三千萬的已有棋譜才能打敗人類