如果2個阿爾法狗程序對下圍棋,結果會如何?

昊體育 天津日報體育中心官方頭條號 06-01 16:26 65贊

這個問題就不用如果了,網上已經放出了50盤兩狗互掐的棋局。直接說結果,黑棋勝了12盤,白棋勝了38盤。從這個統計數據可以看出很多問題。

其一,白棋勝率遠遠高於黑棋說明現在的貼目規則並不「科學」。現在的圍棋規則是黑貼7目半,根據阿爾法狗的互掐測試說明黑棋貼目貼多了,理論上來講,如果可以讓兩隻狗在貼6目半或者5目半的前提下再各下50盤,黑白勝率基本相同的時候就是相對科學的貼目。

其二,中盤勝的盤數是19盤,另外31盤都下到了最後。這說明了圍棋還是太深奧了。比如說一盤棋的終局手數是230手左右,雙方水平越高,就越可能在越早的手數時知道最終的勝負(共識)。既然阿爾法狗的」互掐「大部分也需要在終局決出勝負,說明阿爾法狗還遠遠未到」圍棋上帝「的水平,只能說咱們老祖宗發明的這個圍棋太偉大了,太深奧了。現在才知道當年日本著名棋手藤澤秀行先生的那句「棋道一百,我只知七」並非謙言。

其三,從放出的50盤棋來看,棋局中已經有很多招數人類已經看不懂。這裡說的人類指的是人類中的頂尖圍棋高手。現在已經有很多頂尖高手在模仿阿爾法狗的下法,但僅僅是模仿,也許個別的招法人類有一些理解,但顯然還沒有理解透徹。就像人類所說的定式,某一個定式有的人知道5種變化,有的人知道50種變化,但無論知道多少,並不妨礙使用。知道這樣下是高招,但裡面蘊含的千萬變化還要通過千萬盤實戰去試著理解。

其四,阿爾法狗放出的50盤「左右互搏」將掀起一場圍棋革命,人類對圍棋的理解也許能從原來的7%有一個質的飛躍。

52評論

天涯棋人 棋牌媒體人 體育問答專家 06-20 15:41 2贊

在5月底柯潔對AlphaGo「人機大戰」後不久,AlphaGo團隊將AlphaGo相互之間對戰的棋譜選了50盤公布在網上,看了那50盤棋後,職業棋手們的反應都是驚呆了。看看這個棋譜,就知道AlphaGo現在下的已經不是人類棋手的棋了,因為人類棋手完全看不懂。

鄔光亞六段在微信中寫道:「看阿(爾法狗)老師左右互搏真是件艱難的事情。看人類下的棋看完一盤總是能記住的,但看阿老師下棋,真心記不住。特別是那些隨處可見的脫先和眼花繚亂的次序,我現在想的是,還好谷歌只公布了50盤。」

柯潔九段在這條微信後跟帖:「看完就忘了挺好。」已經打進首屆新奧杯世界圍棋公開賽決賽的彭立堯五段回復:「後面的棋不敢看了,怕走火入魔……」

AlphaGo團隊中的樊麾二段說:AlphaGo左右互搏的棋譜看似荒誕不經,但它們也是經過了大量的計算才確定這麼下,因為它們的運算量極大,而且在極短時間內可以進行人類無法企及的大計算,所以它們的著法也是建立在充分運算的基礎上,換言之,它們認為,必須這麼下。

問題是,像圖中白10、白12、白14這樣的著法,人類棋手下了這麼多年的圍棋,永遠也沒法接受這樣的著法,人類棋手真的理解不了AlphaGo,所以跟AlphaGo下棋,又怎麼去贏它呢?這樣的著法人類棋手也不敢妄自評論,所以至今也沒出現講解AlphaGo對戰棋譜的書籍,而在前兩次「人機大戰」後,相關講解書籍很快面世。現在別說寫書講解了,連看都看不懂,誰還敢輕易地加以講解?

2評論

百盈足球 資深彩票從業者 05-25 19:13 11贊

兩個AlphaGo下棋,誰會贏?答案很簡單,當然是AlphaGo會贏。

不過我們也可以來詳細分析一下。

AlphaGo採用了深度學習演算法,即其具備了分析已發生對局提升自身水平的能力,AlphaGo的下棋方式除了學習別人的對局外,還可以自己跟自己下棋,通過對不同下法產生結果的分析來改善自己的下棋方式,頗有一種老頑童周伯通的絕技「左右互搏之術」的意思。

這也就是說,學習時間長、學習案例好的AlphaGo贏的可能性更大一些。

而對於兩個「同樣學習環境」的AlphaGO結果又會如何呢?

首先要說明,決策不存在絕對的對錯,有些決策可能短時間看效果不好但長遠看會產生更多效益,有些決策可能從一方面看存在失誤但從另一方面看又十分明智。對於下棋而言,有些棋招經過後來無數人長時間的分析,依然難以斷定它的好壞。

考慮到這種結果的不可量化性,AlphaGo在計算落子位置時引入了一定的隨機性,即AlphaGo兩次對同一棋局的判斷,可能會產生不同,這種情況下,只能說「運氣」好的AlphaGo會贏。

其實AlphaGo和柯潔的對戰,結果並不重要,因為無論是誰贏都是人類智慧的勝利。因為即使AlphaGo戰勝了柯潔也只不過是在人造硬體上運行的人編寫的程序取得了勝利,因此而擔心人工智慧毀滅人類就有點危言聳聽了。

4評論

穀雨醇 05-25 21:41 4贊

對阿狗來說這是每天進行成千上萬次的平常事,狗每天的訓練就是通過左右互搏來訓練自己的價值網路和決策網路,只有積累巨大的對局數據,才會讓這兩個網路形成正確的判斷。阿狗不會對圍棋盤上所有的可能進行計算,也只是根據蒙特卡洛演算法隨機挑選決策網路給出的一些可能選點進行深入的計算,只要是隨機挑選就不可能每步都給出完美的走法,所以兩隻狗下棋和兩個人下棋完全一樣,互有勝負。狗並不能達到圍棋上帝的程度,應該還差的很遠,所以也不可能下到當機的程度。其計算規模完全是規定在一個允許的程度之內的。

1評論

武俠大師金庸 05-25 23:25 5贊

谷歌去年公布了三盤阿爾法狗對陣阿爾法狗的棋譜,棋局跌宕起伏,波瀾壯闊。過程都是勢均力敵的博弈,雖然最後都是白棋獲勝。有意思的是阿爾法狗評估第一手黑棋的勝率是45%,白棋是55%。

1評論

你最珍貴18122522 06-02 01:56 23贊

爛簡單的問題,A阿爾法會計算出所有可以用的套路。B阿爾法又會計算出所有可以用的對策。A阿爾法又會計算出破解B阿爾法可能會出的招式,B阿爾法再次計算出A阿爾法對於自己計算結果可能會用的招式。所以第一顆棋都不一定能放的下來。

最後導致兩個阿爾法,卒~

1評論

奧數來了 06-02 00:12 4贊

感謝谷歌公司公開了阿法狗左右互博的50局棋,白棋明顯贏的多些,說明黑棋貼7目半過重了。仔細數下目,很多白中盤勝的棋,其實是局勢相當接近的細棋,黑棋也沒崩盤。裡面有許多巔復性的著法,值的職業棋手去慢慢琢磨。

1評論
推薦閱讀:

他創立了元旦節,並準備在這天搞個大新聞,結果杯具了
奧巴馬與普京通話 稱絕不承認克里米亞公投結果
百變,來自狠狠努力的結果(陳數播文)
我今早空腹查血糖,結果是6.9是屬糖尿病嗎?

TAG:程序 | 圍棋 | 結果 | 阿爾法狗 |