如何評價基於 AlphaGo master 的教學工具？

01-02

官網 https://alphagoteach.deepmind.com/

隨著AlphaGo教學工具的到來，作為職業棋手的一員，想在此寫下一些自己的感受，

當朋友給我發這個消息時，我就迫不及待的點開了鏈接，並且先找了一些自己感興趣的圖，來進行判斷與比較後，找了一些個人覺得比較有意思，比較有代表的圖，再加上我個人的一點理解呈現給大家。

圖1 選擇了一個看似沒有什麼必然性的開局，黑棋天元，白棋碰上去形成扭斷後，竟然又回歸到了正常的布局軌跡，這裡揣測它的思路是不是說中間也沒有什麼一下擊潰的對手，終歸還是要先下到價值大的地方伺機而動？

圖2 隨後開始進行實戰中出現比較多的圖，右上角點三三形成這個棋形，黑棋竟然勝率最高的一手是脫先不粘，這一定會讓所有人驚訝的，在此之前這個世界上大概不會想到脫先的背後是什麼故事吧。

圖3 這也是一個長型，在此之前大概都覺得白棋不好吧，但是白棋猛一脫先細細品味後確實覺得黑棋虧了，白棋下到了實地上，黑棋凈死了一個子，反之白棋外面這個子還很有活力。這裡的理解哪怕只有正確的十分之一也是很有意義的。

圖4 這裡帶給我們是直觀的感受，自從AlphaGo對戰李世石出現過虎後脫先，棋手們的研究確實也是在進步中，目前來說這是最好理解的，因為虎一個速度相對較慢，無嚴厲的下一手。

圖5 這是第二次人機大戰第二局AlphaGo執黑對戰柯潔的一盤棋，進行至如圖柯潔的勝率反而增加了，這對於當時的人類棋手來說實屬難能可貴，可見人類棋手如果可以一直保持對棋正確的理解是可以與之一戰的，不過對人類來說未知的東西要大於AI所以我們要先向它學習，但柯潔的發揮也證明了世界第一人的實力。

圖6 前面的進程似乎還好理解一些，白第20手點瞄著黑棋弱點，黑棋23反擊，白24跳完靠外面，其實是順調棄子！

圖7 這是之前曾經經常出現的局面，之前都是下在G17，AlphaGo告訴我們應該走在J17，可能是覺得G17有幫黑棋出頭的感覺，這就為我們打開一個很好的思路。

圖8 此局面下它認為黑2路尖最佳，大家都知道AlphaGo下棋注重效率，但也時有如此穩重厚實的棋，真是讓人捉摸不透。

圖9 原來的妖刀定式，現在已經被徹底推翻，就連看似必然的一長在此局部下完時竟然又差了5%的勝率，這在AI看來是巨大的差距。

圖10 這又是一個典型的例子，從學棋開始這個定式就有，可以說一直到今天，白棋頂要優於連扳出來所謂的定式，但頂完後續的下法也是要貫徹下去的，有興趣的棋友可以看一看這個圖的後續，如果不按照這個思路下去，反而未必是好的甚至可能是虧的。

本次AlphaGo教學工具推出37萬個變化，我從中挑選了一些比較常見或是有一定代表性的圖，作為棋手亦或是棋迷我們一定要去學習並理解其中背後的邏輯，從小見大，提升自己圍棋盤上的價值觀，從而在複雜的中盤和官子的收束下出更符合邏輯的棋。

如果方便的話也可以關注聶衛平圍棋道場的知乎專欄，我會定期在上邊發表文章，同時也會在我個人的專欄再發布一遍，希望大家多多關注，多提寶貴的意見和建議。

昨晚公布的阿法狗教學工具，在整個圍棋界炸開了鍋。下面我們來看一看阿法狗究竟有哪些異於常人的招法？

首先，開局的時候，黑棋的勝率就落後了，保持在47%左右，說明阿法狗默認中國貼目規則白棋有利。從這張圖中可以看到星位的勝率最高，小目其次，兩者之間相差0.4個百分點。

其次，阿法狗標誌性守角是大跳守角，無憂角反而在阿法狗的對局中很少見到，可能認為效率不高吧。

第三、阿法狗一般對於星位，更傾向於點三三。白棋12之後更傾向於脫先。

第四、星位掛角一般不守角，直接掛別人角。

第五、對於小目，更傾向於低掛。

第六、小目高掛，一般很少選擇雪崩型。差2%的勝率。

第七、對於有些局面人類感覺明顯虧了，但是阿法狗認為可行。比如下圖，黑棋角非常大，白棋外面沒有根據地，也不能稱為厚勢，確實很令人費解。大飛守角的對局中經常會形成類似的判斷。

目前阿法狗教學只有布局25手左右，雖然棋盤上每一個點都被量化了，但是其實誤差0.4個百分點的小目和星位對於我們人類來說是極其微小的，去探究其意義並不大，因此，我們可以看到阿法狗雖然認為星位勝率高，但是每一盤開局都會有多樣性，其實圍棋真正的勝負在於後半盤。對於角部定式的變化和人類一樣，阿法狗認為基本上只此一手，只不過它的定式和我們人類的定式相差比較大，比如星位不守角被雙飛燕，阿法狗覺得這個完全可行，人類通常是要守角的。

鑒於目前公布的2萬多個變化，都是布局階段，我覺得對於圍棋提高來說意義不大，雖然，它給了我們更多的視角，但是，阿法狗是有1000多萬盤衍生變化作支撐的，我們人類不可能算的那麼遠，萬一，遇到對手變招了，我們能像阿發狗一樣應對無誤嗎？所以，我希望阿法狗開發出幫助我們愛好者復盤功能以及變化圖的學習軟體，讓我們輸入棋譜後，知道自己在哪一步棋下錯了，應該如何進行，這樣才能不斷學習糾正、提高！

有沒有人拿已有棋譜去遍歷一次這個工具。

看看已有棋譜哪些局面是敗招？

這個網頁有API嗎？

增加：做了下，發現只有開局，無法遍歷啊

圍棋菜鳥提問

如圖

星位勝率明顯高於小目，為什麼電腦的第一手仍然選擇小目而非星？

除了勝率，電腦還有什麼其他的判斷標準沒體現出來么？不體現的目的又是什麼呢？這種不下最高勝率的走法，是否會對我們對其的使用有什麼影響？

AlphaGo新版本問世：自學40天就能勝贏柯潔的版本 AlphaGo的首席研究員大衛·席爾瓦(David Silver)表示，由於未引入人類棋手的數據，AlphaGo Zero遠比過去的版本強大，我們去除了人類知識的限制，它能夠自己創造知識。

換言之，這個所謂的教學工具，遠比Zero弱小，誰會跟著「弱小」學棋，誰的腦子一定燒糊塗了。千萬不要學，一旦形成思維定式，以後有更好的招法，再想改就難了。

AlphaGo人肉臂黃士傑首度公開演講 Zero未達極限 AlphaGo Zero 用了 2000 個 TPU 、訓練了 40 天。第 40 天還沒有到達其極限，但因為我們機器要做其他事情就停下了，所以它還有很大的潛力。

請看清楚，遠比Master強大的Zero「沒有到達其極限」。也就是說，這個基於Master的教學工具是弱小的平方。千萬不要學，任何一招都是錯的，所謂勝率全部是鬼畫符。

這件事的來龍去脈是怎麼樣的？本來，起碼本人對什麼阿爾法狗教學工具就沒抱任何期望。是這位知乎大神，似乎又在百度圍棋吧擔任小吧主的「不會功夫的潘達」，在知乎放風說「茲事體大，棋圈或將換了人間」，又有人轉貼到百度圍棋吧，引起棋迷大範圍猜測和討論。本人看到後經調查，認為是中國棋院將民營化，但是「不會功夫的潘達」否認了我的猜測，「不會功夫的潘達」並強調說：「我了解的情況是AlphaGo Tools。」看清楚沒有？這才是廣大棋迷對所謂教學工具無限期待的原因，因為太了不得了，因為「茲事體大」，因為「棋圈或將換了人間」。結果東西拿出來了，端上桌的卻只是一個沒有互動，且只有24手，甚至連布局都算不上的東西。好了，百度圍棋吧大吧主發帖侮辱網友「不識抬舉」，大神「不會功夫的潘達」不許「亂噴」。我說你們這幫小孩都算什麼東西，把網友棋迷玩弄於股掌之間，事後還振振有詞，毫無慚色，臉皮厚到這種程度，真可謂厚黑二字，得一可三分天下矣。

執黑不貼目時代的吳清源名局，無。執黑貼五目半時代的中日圍棋擂台賽名局，無。比Master強得多的AlphaGo Zero的招法，無。無，無，無。對於谷歌公司最新發布的只有24手的所謂教學工具，我們稱之為「三無產品」。

看看所謂的AlphaGo教學工具，也就是Master教了職業棋手些什麼？最新的AlphaGo ZERO對戰Master四十局的第一局，ZERO白6點了黑棋右上的33，所謂教學工具卻根本沒有這個選項。請問Master和ZERO孰強孰弱？職業棋手到底應該聽強的，還是應該聽弱的？證明了所謂教學工具，因為Master根本不是ZERO的對手，教出來的東西只能全部是錯的。何況現在更強的通用型ZERO又出來了。還要跟著三流學錯招嗎？

本帖內容，圖片部分昨晚發在百度圍棋吧某帖，當時就被刪了幾張圖片。文字部分，以下第一段，剛剛發到百度圍棋吧某帖，剛才再想發以下第二段內容加圖片時，發現那個帖子竟然已經被刪除了。說明百度圍棋吧已經被谷歌買通，只許說好話，不許牙迸半個不字。這種公司被趕出中國是應該的，因為太黑了。

這東西有什麼價值呢？首先，阿爾法狗的所謂勝率，是基於終局計算的結果，僅僅開局這幾步棋，對於任何職業或業餘棋手來說，能在之後一百多招都下出阿爾狗的水平嗎？其次，這個所謂工具僅僅能擺到24手，稍懂圍棋的人都聽說過，聶衛平前五十手天下第一，等等，說明布局起碼應該到50手左右才算告一段落。最後，本人試著擺了幾盤吳清源的對局，每一盤都是只擺了幾手，在這個所謂工具上就無法繼續擺下去了，沒有提供實戰對局的那步棋，根本就沒那個選項。如此則所謂錄入了多少萬盤對局從何談起呢？吳清源對局全集的sgf棋譜是網上現成的，這個你都不收錄，你到底收了些什麼呀。結論就是瓜菜代，上墳燒報紙，你糊弄鬼了吧。

再看這個，中日圍棋擂台賽，江鑄久執黑VS片岡聰，僅僅到了黑棋的第7手，阿爾法狗所謂教學工具就沒有實戰的那步棋了，僅僅提供了一步下托，沒有實戰下出來的二間高夾。吳清源對局不收錄，中日圍棋擂台賽對局還是不收，都收了些什麼呀？還有一點點用處嗎？