如何評價在AlphaGo大戰李世石之前突然出現的「異構神機」？

01-04

一開始我以為看走眼了，明明說的是9號啊，怎麼突然提前了？
異構神機測試棋勝職業棋手圍棋AI中國不落後
人工智慧項目「異構神機」真可怕！
說實話，能找到柯潔對戰也很不錯啊。但後面日程表好像只有15分鐘的連線時間。。。

「添加了一點蒙特卡洛演算法作為驗算輔助，運行這個程序的只是一台蘋果筆記本電腦」更是震脫了我的下巴
請問有沒有對異構神機比較了解的？謝謝！

謝邀。

來看這張圖。

如果這是對應的技術路線，異構神機最多達到AlphaGo在去年10月份就到達的高度。

蒙特卡洛樹搜索不說了，傳統的AI技術。目前只要是個AI就要用。

全局搜索與局部搜索其實是在利用棋譜數據。請參見萬同開發的圍棋搜索引擎：萬同搜索。棋型搜索的本質是將盤面轉化成一個19X19的矩陣，再從海量棋譜中做查找處理。對於搜索出來的選點評分主要基於查找棋型在棋譜數據中出現的次數。當棋譜數達到一定的量級後而產生的搜索引擎搜索分值最高的落子和職業棋手實戰落子的重合度達40%以上，因此一定程度上可以用來支持輔助落子。搜索引擎和深度神經網路比起來，前者容錯性遠遠不及後者。

圍棋棋感——所謂棋感即對棋型的感覺，也是從棋譜數據中來，不贅述了。

佔地評估——利用靜態評估的影響函數來做的，可以被簡單理解成去弈城下棋時點一下形勢判斷。

局面估值——這個真不知道，主要是提法沒聽說過，沒有見過paper前不宜妄加揣測。

簡單的說，我猜測這個AI下棋的策略是先用搜索給出若干個候選點，然後用蒙特卡洛樹搜索來做驗證。可以說加入數據搜索後的MCTS程序已經可以到達超越傳統的Zen，Crazystone，Dolbaram的級別，比起Facebook的Darkforest會略弱(這要依賴棋譜的數據樣本)，但遠不及擁有兩個神經網路的谷歌AlphaGo。

以上均為基於現有媒體報導及個人經驗得出的結論（畢竟異構神機沒有發布任何學術性材料），如有偏差，敬請指正。

對於國內出現可以挑戰圍棋界頂級高手的程序，如果做得出來，我是衷心歡迎的。但目前就我了解的情況看，我是不相信異構神機有戰勝柯潔的可能，我認為這件事情純粹是炒作。

先羅列一下事實：

1. AlphaGo在去年10月與職業二段的樊麾的比賽前，就已經進行了海量的訓練（3000萬次的自我對弈）。如何看待 Google 圍棋 AI AlphaGo 擊敗歐洲圍棋冠軍？ - 谷歌 (Google)

2. 圍棋界評價AlphaGo的棋力在職業二段，頂尖棋手應該能讓先或者讓二子，不太可能戰勝李世石。圍棋界人士普遍預測今年3月李世石將會以5:0或4:1戰勝AlphaGo，而人工智慧領域的專家則相對而言更相信AlphaGo有機會勝。參見AlphaGo能戰勝李世乭嗎？ - 人工智慧

3. 柯潔對陣李世石的最近歷史記錄是8:2，不敢說絕對比李世石厲害但也至少旗鼓相當。參見農心杯決戰柯潔再勝李世石中國豪取三連冠。

4. 「異構神機」是他(吳韌博士)基於人工智慧深度學習技術設計出的圍棋人工智慧程序，目前雖然只是剛剛起步，但從原理上已經思考清楚，技術上暫時並沒有什麼瓶頸，所欠缺的只是大量的圍棋高手對局數據來繼續「深度學習」和其餘幾個輔助系統的增加和優化。「異構神機」的目的則是幫助人類棋手提升圍棋水平，而不是打敗人類去證明什麼。引自異構神機測試棋勝職業棋手圍棋AI中國不落後。

5. 在3月6日，圍棋程序「異構神機」第一次與圍棋職業高手進行了測試對局。在這位參加測試的職業棋手坦言，第一盤測試棋時心理極其不適應。不過後面的測試棋，人類漸漸找到了對付電腦的訣竅，電腦在某些細節的處理，還有大局的把握上，還是有一定的問題。吳韌博士在測試棋的時候，通過調整電腦的思考時間，對比招法區別，甚至現場修改程序代碼。同樣是引自新浪的新聞。

6. 2013年9月25日，百度宣布，異構計算專家、前AMD異構系統首席軟體架構師吳韌博士日前正式加盟百度深度學習研究院(Institute of Deep Learning，IDL)，出任「傑出科學家」。2015年6月11日，吳韌-在百度ImageNet國際計算機視覺挑戰賽（ILSVRC）中，曾指示初級工程師們每周進行超過2次的提交，違反了ImageNet規定。被百度公司解除勞動協議，決定即刻生效。引自吳韌_百度百科。還可參見如何評價idl主頁上面team成員中已經沒有吳韌老師了？ - 百度和如何評價百度對 ImageNet 大型圖像識別挑戰賽作弊事件的處理結果？ - 互聯網。

從這些事實來看，深度學習系統要在圍棋領域打敗人類需要極強的計算能力和海量的數據，這個突然出現的「異構神機」應該不具備打敗圍棋界頂級棋手的可能。因此7日晚「異構神機」與柯潔進行對戰的勝率很小。不過我很期待實際過程。聶衛平等邀你見證中國人工智慧挑戰世界第一人。而且因為AlphaGo的詳細演算法已經發布在nature上了，因此吳韌博士所謂的「原理上已經思考清楚，技術上暫時沒什麼瓶頸，所欠缺的只是大量的圍棋高手對局數據」也並沒有什麼說服力。事實上深度學習理論本身就具有這樣一種特色，理論上不困難，只要數據多就會看起來很智能。我覺得DeepMind讓AlphaGo約定今年3月份與李世石進行比賽，可能也是因為需要更多的對弈訓練或者需要提升計算能力。而現在馬上就要比賽前突然冒出來異構神機要跟柯潔對戰，好似要搶在AlphaGo之前就要戰勝人類圍棋頂尖選手，拔得頭籌一樣。我看了一下公布的安排，19：50-20：05 連線柯潔，似乎只有15分鐘的時間，我很納悶15分鐘能打完一局？7日晚的比賽就算有也只有一場，比賽結果無非是：

1. 異構神機被柯潔碾壓：這種情況我覺得還不如不打，不成熟的產品拿出來沒什麼好炫耀的。這真的只能讓所有人看出來異構智能公司的不靠譜。所謂的「這次，圍棋世界冠軍柯潔和最強人工智慧「異構神機」將攜手呈現圍棋史上新的巔峰對局，譜寫圍棋和人類歷史新的篇章」只會讓人看了笑話。更談不上「邀請谷歌開發的AlphaGO、日本開發的DeepZenGo等人工智慧以及其他世界頂尖圍棋選手，共同打造一場圍棋人機巔峰大戰！」

2. 異構神機與柯潔有一戰之力，無論戰勝或戰敗：我覺得如果這樣的話那很好啊，讓異構神機與AlphaGo賽幾把就知道誰厲害了。反正兩個機器打架，落子速度都很快，一場比賽要不了多久，不如賽個一千把或者一萬把如何？高下立判。

其實如果是作為宣傳推廣，搞出這麼一個事件，我只能說時間選的真賊，借著大家的目光都集中在人工智慧約戰人類棋手的勢上擴大自己的影響力。我最擔心的是如果柯潔讓異構神機贏了的話，被圍棋界的同行高手看出來作弊的嫌疑，或異構神機公布演算法讓研究人工智慧的專家看出來不過爾爾，那就丟了中國圍棋界和人工智慧研究領域的臉了。希望不要有這種事情發生。

另外夾帶一些私貨，在我看來人工智慧領域目前還處於「有多少人工（包括演算法設計，訓練數據量和計算量）就有多少智能」的階段。全面趕上人類水平的強人工智慧還比較遙遠（10年以上吧）。以目前馮諾依曼機的架構實現在小型機中集成高智能演算法是不太現實的，需要專門的計算架構和對應的晶元才能實現真正的有實用價值的人工智慧設備。

晚上看了一下新聞中國圍棋程序「異構神機」擬年內約戰柯潔，今天只是宣布要比，並沒有真正開始，而且柯潔也宣布尚未接受挑戰，所以僅僅是發了個信號而已。目測年內能比就不錯了。看來這個頭籌中國隊是不太可能搶到了。幾天後AlphaGo比賽結果很快就會出來，大家都會關注，也會看棋譜分析實力差距。我覺得我如果是柯潔，我會說你異構神機先跟AlphaGo賽一賽，打贏它再挑戰我，免得侮辱我的水平。不過說句實話，圍棋上人類被機器超越也並不能說明人工智慧就已經能與人類比肩了。雖然說「人工技能」有點過於貶損，畢竟學習演算法的通用性還是有的，但是所謂「人工智慧」還真的達不到大家心目中或者電影中展示的那樣。參見人工智慧迷途：計算機的高技能等於高智能嗎？

國內圍棋 AI 挑戰世界冠軍，並非嘩眾取寵，而是深度學習的勝利 - 深圳灣 | ShenzhenWare - 知乎專欄

來源：知乎

本文作者：楊作興來源：深圳灣原創

編者按：人工智慧 ALPHAGO 與圍棋選手李世石的世紀之戰開賽在即，國內人工智慧異構神機也趁機向另一位圍棋冠軍柯潔宣戰。那兩者的區別是什麼？開發時間僅一個多月的異構神機是否在嘩眾取寵？本文作者楊作興親身參與了異構神機的比賽過程，對於它的實力，以及人工智慧均有獨到的看法。感興趣的朋友可以在他於深圳灣的主頁，與他交流。

3月7日，我參加了由異構智能公司，極客幫和聶衛平圍棋道場三方共同主辦的「異構智能挑戰未來」發布會。相關報道可閱讀深圳灣此前的文章。

作為 AI 領域的行業人士，我很有興趣了解吳韌博士異構神機演算法的獨到之處，以及硬體實現的獨到之處，在媒體提問時間，我搶先問吳博士這個問題，吳博士好像沒有給到我答案。

發布會結束後，大家意猶未盡，吳韌，俞斌，華學明，蔣濤等仍在發布會邊上的一個房間繼續熱聊。俞斌九段是應該是圍棋界最懂軟體的，他之前有寫過圍棋方面的軟體（蔣濤曾經買過俞斌的圍棋軟體），現在也在做關於圍棋教育方面的 APP。他一直試圖做一個高水平的對弈軟體用於圍棋教學，但效果不好。吳博士的圍棋智能軟體在 3 月 6 號贏過一個職業四段一局，俞斌對這個事情很有興趣，問吳博士演算法原理，並希望能看看吳博士的源碼。看到俞斌如此有興趣，有人建議俞斌跟吳博士的圍棋智能軟體切磋一下，找找感覺。儘管第二天俞斌要以嘉賓身份坐早上 8 點的飛機參加 ALPHAGO 跟李世石的對弈，但對於圍棋智能的強烈興趣，他欣然前往吳博士下榻的 Westin 酒店考察一下圍棋智能的實力。

第一局俞斌執白，10秒走1步，大約50步左右，圍棋智能認輸。第二局，俞斌繼續執白，讓兩子，30秒走1步，大概用了1個多小時，結果如下：

俞斌的評價是，走了一步臭棋，兩步好棋，讓兩子情況，他還佔些優勢，如果讓三子，結果還很難說。總的來說，他覺得實力還不錯，超過他的預期。我當時的感覺也比較吃驚，我一直認為圍棋智能需要用到 ALPHAGO 那樣的 170 個 GPU 加上 1200 個 CPU 那樣的計算能力，才可能跟職業選手對弈，但吳博士智能圍棋硬體就是一個蘋果筆記本。而且吳博士就兩個人花了一個月的業餘時間，寫了這個演算法和軟體，當時感覺：吳博士真厲害，人工智慧真的很棒。

作為一個人工智慧行業人士，我一直在思考這是如何做到的，ALPHAGO 是大神，吳博士是大神？聶棋聖認為圍棋最難的是棋局判斷，這就是所謂的棋感，就是頂尖九段對一個局面也可能有多個看法，計算機是不可能做到這一點的，圍棋智能能做到這點么？

之後，結合我對計算機硬體和人工智慧演算法的了解，以及俞斌九段在 3 月 7 日晚上跟圍棋智能下棋過程中的一些講解，我好像想明白了，把我的想法跟大家分享一下。

在下面闡述之前，我需要申明一下，我是晶元的專業人士，對人工智慧演算法有一點了解，但不是專業的，對圍棋連業餘都算不上。因此對於我闡述中不太對的地方，歡迎大家拍磚（微信號：yangzuoxing001）。

人工智慧搞了好幾十年了，人們一直寄予了很高的期望，但失望大於期望。直到 2005 年 HILTON 發明了神經元卷積網路(CNN)：

這個網路的基本原理是對物體特徵的逐層抽象，它有三個重要的意義：

1）物體特徵是通過計算抽取出來的，不是模式識別年代由專家假定的特徵。採用 CNN 抽取出來的特徵，設計者自己也不知道它應該出來什麼特徵。
2）卷積神經元的參數對於每一個小窗口的參數是一樣的，這個極大的降低了特徵提取的計算量。
3）提取特徵的模型參數是通過學習出來的，隨著學習樣本的增多，模型參數會越來越準確，特徵的提取也越來越準確，使用者會感覺它越來越聰明。

採用以CNN為代表的深度學習方法以後，人工智慧開始取得突破性的進展：

人工智慧在語音和圖像識別方面開始超越人：

1）語音識別（錯誤率）：機器（6%） &< 人（8%）
2）人臉識別（錯誤率）：機器（0.23%） &< 人（0.8%）

AlphaGo 完勝歐洲圍棋冠軍、職業二段選手樊麾，進一步顯示了深度學習在方法學上的成功。那圍棋智能是如何使用深度學習做到這一點的？他未來還會做到多好？它的軟肋在哪裡？

圍棋最難的是什麼？是棋感，聶棋聖如此說，很多下過圍棋的也這麼說。為什麼難呢？因為當前的局面說不清楚是好是壞，一個人一個感覺。一顆子下去，好還是不好，大部分情況由感覺決定。為什麼出現這種情況，大家下棋不是要計算么，為什麼不是棋手算出來的？圍棋每一個子下去有 361 個位置，凡是空的地方理論上都可以下子，如果我們能看兩步棋，那我們就需要在腦子裡邊考慮 361*361=13.0321 萬個棋局，如果考慮四步，那就是 312.7704 萬種棋局，如果 361 步都能算出來，那就是——抱歉，採用 EXCEL 算不出這麼大的數。因此圍棋很難通過計算來下棋，大家在訓練和實戰中，通過定式和感覺來下棋。這個人搞不定的事情，計算機可以搞定么？計算機的計算力能力遠大於人，但很遺憾目前的計算機也搞定不了這麼大的計算量。

但是深度學習改變了這個局面，計算機通過訓練，可以培養出來棋感。具體情況見下圖：

這裡邊有三個重要的要素：

1）海量的棋局，幾十萬，幾百萬的對局，越多越好。
2）CNN計算網路，可以設計成不同的層數，每一個的大小可以不同，中間還可以加入各種保證收斂的非線性層。
3）網路模型參數，這個最重要，這個就是棋感。

訓練的過程是這樣的，輸入海量棋局，調整 CNN 網路結構和網路模式參數，使計算出來的局面判斷結果跟人判斷的結果一致。最後局面的結果是確定的，但從第一子到最後結局之前的局面如何判斷？初期的局面的確很難判斷，但一個基本的傾向是，凡是最後結果好的，前面走的局面都做正向判斷，哪怕有幾步明顯是臭棋。如果我們採用同一套 CNN 網路結構和同一套模型參數，讓海量棋局的計算機局面判斷和人為判斷是一致的，那從原理上來說一個計算機沒有見過的棋局它也能以極大的概率判斷正確。這樣計算機的棋感就訓練出來了。

有了這個棋感模型，計算機下棋就簡單了。在當前局面下，計算機可以採用蒙特卡洛方法隨機設定幾個落子點，根據這幾個落子點評價一下局面，選擇幾個對自己有利的落子點（根據局面判定），然後假設幾個對手的落子點，為對方做局面評估，選幾個對對方有利的下子點，如此繼續，這樣計算機就可以看到後面的多步棋。

上圖是例示了黑棋四個可能下子點，白棋根據黑棋情況的相應兩個可能落子點。

那麼採用深度學習方法後，計算機能算多少步呢？

Step：計算機能算的步數
T：落子限定時間
N1：第一步的可能落點
N2：第二步可能的落點
Nm：第m步的可能落點
CNN_time：採用CNN網路評估一個棋局需要的時間

舉例來說，如果 CNN_time = 0.5 mS, T = 30 S, 那總共可以計算 6 萬次 CNN。我們可以採用如下策略：

N1：50，50個局面判斷完成後，我們選擇其中20個最好的落子點
N2：30，根據第一步優選的20個落子點，第二部每個點嘗試30次，從30次裡邊選擇最好的10個落子點
N3：20, 根據第二步的10個落子點，第三步每個點嘗試20個落子點，從中優選10個落子點
N4：15，根據第三步的10個落子點，第四步每個點嘗試15個落子點

那總的計算次數為：50+20*30+20*10*20+20*10*10*15=34650 次 CNN。也就是說在 CNN_TIME = 0.5 S，每步限定時間為 30 S的情況下，計算機可以算出 4 步棋。

根據上面的知識，那我們現在回頭看看吳博士的圍棋智能：

1）關於計算能力。吳博士採用蘋果筆記本，而 ALPHAGO 採用 170 個 GPU 和 1200 個 CPU，這兩者的計算能力可以初略認為差距是 1000 倍，那 1000 倍的計算能力對圍棋智能意味著什麼呢？如果下一步選擇都是 10 個可能的話，1000 倍的計算力就相當於 ALPHAGO 可以比吳博士的圍棋智能多算三步棋。但吳博士的程序跟 ALPHAGO 是差三步棋么？這個還不一定，因為 CNN 的計算時間除了跟計算機的性能相關外，還跟 CNN 的結構複雜程度，模型參數大大小有關。而由於 CNN 的結構和模型參數的大小，可能造成一個數量級的計算時間差異（在圍棋局面評估結果差不多的情況下）。
2）關於圍棋直覺。這個主要來源於深度學習和 CNN 網路。但如果 ALPHAGO 跟吳博士的圍棋智能比較，那就是模型結構和輸入圍棋局數和質量的差異了。那我們再想，如果一個做深度學習的資深工程師，給他海量的圍棋數據，他是不是也可以很快造一個挑戰圍棋職業選手的神機？這個是可能的，但是要打敗 ALPHAGO 或者吳博士的圍棋神機，就不一定了。

到這裡，相信大家對圍棋智能應該有所認識了。圍棋智能還是沒有思維，他不是我們普通人想的那種智能，他是計算機，他會的只有計算和存儲。但他又有智能表象，他會學習，他可以準確分析棋局。

今天就是 ALPHAGO 跟李世石的世紀大戰了，我想根據上面的分析，對這個比賽預測一下：

1）第一局至關重要，如果第一局李世石贏了，那後面幾局 ALPHAGO 基本沒有什麼機會。因為在短短几天智能 ALPHAGO 很難大幅度調整它的計算能力，模型結構和模型參數。ALPHAGO 應該會準備很多版本，但這些版本跟第一局用的版本應該沒有太大差別。ALPHAGO 當然知道第一局最重要，第一局使用的應該是最好的 ALPHAGO。不過這次 ALPHAGO 即便輸了也沒有關係，他很快可以繼續提高計算能力，繼續更大的海量數據訓練，它可以在一個月內提高一個量級，但李世石一個月提高不了一個量級。因此計算機打敗頂尖棋手就是這一兩年的事情。
2）如果第一局李世石輸了，他通過第一局的較量，能摸到 ALPHAGO 的規律，做出調整，他能贏下後面的四局。我想有一個簡單的調整辦法。ALPHAGO 會對李世石的所有棋局做充分的學習，如果李世石不採用自己通常的走法，甚至不採用普通棋手慣常的走法，ALPHAGO 面對自己沒有學習過的東西，會比較愚蠢的，這就是圍棋智能的軟肋。我想李世石作為圍棋頂尖高手，他應該可以發現 ALPHAGO 更多的破綻。

我認為，吳韌做出的圍棋人工智慧，是深度學習的進步，他可以做到，別人也可以做到，這是方法學上的成功。

對於文章中的錯誤和不足之處，歡迎到文章原文頁留言區討論。

基於現有的公開信息，是跟某職業棋手下過，棋譜也得到了確認和簡單講解（本中腹可以簡單獲勝但為了繼續測試而選擇了其他著法，後來又犯了錯誤）；讓兩子的棋譜未見。但基本可以確認不是純粹的炒作；柯潔那個有標題黨嫌疑，只是連線15分鐘加上非正式約戰。

但是根據讓兩子的信息以及其原理描述，我認為其比較接近當前FB的darkforest的原理，是一個深度網路加MCTS（因為FB的文章也公開的早，相對來說也有足夠時間來進行實現；我看見最早新聞時的第一反應是從1月28日開始如此短時間很難從零實現一個圍棋AI），而其水平也跟谷歌只用policy network + MCT和darkforest較符合，約業5左右（弈城7D+）。田淵棟博士最新文章和異構神機（這名字實在太山寨讓人第一反應像炒作）也從側面證明了alphago採用深度學習解決圍棋的思路應該沒錯。

btw，2014年底arxiv上首次出現了兩篇用深度學習下圍棋的文章，但當時實力還很差。當時我的判斷是深度學習結合MCTS應該挺有希望，只是沒想到谷歌如此之快就搞出了如此之好的結果，我當初的確有點低估了深度學習的能力。

吳韌搞computer chess很多年了叫異構神機這麼山寨的名字是因為吳韌本來是靠夢入神機http://wapbaike.baidu.com/subview/655341/9174508.htm?sublemmaid=9174508adapt=1 發的跡夢入神機本身是個中國象棋古譜的名字 http://wapbaike.baidu.com/subview/655341/9174507.htm?sublemmaid=9174507adapt=1 所以炒作肯定是有技術和情懷甚至文化也同樣是有的

就轉發以下一張微博截圖。

很明顯是去碰瓷當今世界第一人，借阿法狗炒作一波。而柯潔是明智，可以接受挑戰，但對手必須是世界公認的最高級別AI才行，不然贏了只是拿錢對自己名聲沒有半點好處。

有篇報道3月6號該AI已經與某位沒有提及姓名的職業棋手對局，第一局職業棋手優勢下屠龍失敗被翻盤，後職業棋手認真下，讓兩子也可以獲勝，感覺和alphago不是一個檔次

2aê?????3?D?à?ì?óy?? 3??6è? òì11é?

我覺得最好玩的應該是以後讓「異構神機」跟AlphaGo大戰一場~看看誰的學習方法比較到位~

說實話，都是在吹牛。現在的問題是，谷歌拿出的測試方法無法驗證它是否作弊，這個吳博士看到了可取巧之處。既然谷歌可以不接受公正的監督，我為什麼要接受。

既然不用接受監督，就可以作弊。作弊以後還可以宣傳自己和公司，何樂不為！

谷歌開了一個壞頭。需要接受公測，至少有一個開始公測的時間表。

先去跟zen、瘋石比比吧。

明顯是借alphago vs 李世石這個營銷的