人機大戰,個人期待+偽預測

這篇文章會比較短,和大家隨意聊聊我的想法。

因為這個問題如何看待柯潔 5 月底將與 AlphaGo 進行的終極人機大戰?這對圍棋、人類和人工智慧會有什麼影響? 實際上是去年就有的,我去年的回答已經過時了。現在也不好把原來的答案全部改掉,所以最新的想法就寫在這裡。

首先,我簡單評論一下【新浪】人機大戰柯潔專訪-柯潔:曾經準備秘密武器 面對阿法狗奮戰到死 這篇新浪對柯潔的專訪。這篇文章里柯潔的回答都非常好,和之前接受採訪時忽高忽低的說話水平相比,進步很大。其中提到了模仿棋的事,柯潔是這樣說的:

問:當時因為住院最後一戰沒上場,還發微博說準備了秘密武器?

柯潔:當時準備對付AlphaGo的是模仿棋,因為沒人用過。不過*古哥*肯定測試過,所以我認為模仿棋恐怕也沒什麼用,真正下的時候我也不一定會用,但網上可以試試。不過黑棋下模仿棋不太合適,天元一子發揮不了作用,屬於白白浪費機會。

之前我寫過一篇模仿棋的分析模仿棋,對戰AlphaGo的最後一招 - 知乎專欄。柯潔證實了之前準備對Master使用的「秘密武器」就是模仿棋。所謂「*古哥*肯定測試過」,也確有其事。就在上個月,紀錄片《AlphaGo》首映式,我在現場詢問DeepMind首席執行官哈薩比斯,AlphaGo能否對付模仿棋。哈薩比斯的回答是「It should be okay, but we will see.」 我的解讀是,AlphaGo團隊針對模仿棋曾做過針對性的測試,且沒有出紕漏;不過,在沒有上戰場之前,哈薩比斯也不敢打包票。

即使如此,我還是期待柯潔能夠下一盤(執白棋的)模仿棋。和AlphaGo下模仿棋,柯潔可以慢悠悠搖著紙扇,喝著龍井茶,笑看對手出招;否則,以對手的強大,柯潔難免要咬手指、揪頭髮。畢竟全國人民都看著呢,形象很重要。

(配圖來自新浪)

在之前模仿棋那篇文的評論區,有些人把模仿棋理解成耍賴。要知道,職業棋手在正式比賽中罕用模仿棋的原因,不是因為它不道德,而是因為模仿棋在技術上風險較大,容易被對手牽著鼻子走。然而,除非AlphaGo已經成精,她不會對模仿棋有什麼針對性的策略,也就談不上牽著柯潔鼻子走。相對地,模仿者的優勢,在人機大戰中被成倍放大:一是節約時間;二是能將局面拖入亂戰或者後半盤收束,也就是AlphaGo相對不那麼強的領域。小結一下,從勝負角度看,模仿棋是柯潔最好的策略之一;從測試AlphaGo的目的看,模仿棋能夠檢驗AlphaGo是否已經成精,強大到無死角的地步。

除了模仿棋,柯潔可能還有其他秘密武器。我猜測「三三」是其中之一。「三三」開局,和布局階段的直接「點三三」,在過去二十年里,極少出現在職業棋譜上。自吳清源、木谷實掀起「新布局革命」以來,星、小目、三三、目外的占角曾齊頭並進數十年。近期的棋譜里,只見星、小目,不見目外、三三。在布局階段的「點三三」,也被認為是送對手外勢的損棋。然而,化名Master的AlphaGo變身「點三三」狂魔;不僅掏空對手的角地,還追著對手的外勢攻擊,極其兇殘。

(右下角帶圈一子,就是Master 「點三三」。「三三」是從棋盤兩邊數起各三條線的點。在對方先佔「星位(四四)」的情況下,在「三三」落子,就是「點三三」,即右下角的棋型。)

Master之後,柯潔也開始大量使用點三三這一招。前不久的新奧杯半決賽,柯潔就下了點三三,擊敗李喆。不過,柯潔也曾在用到點三三的棋局裡嘗到敗績。除了點三三之外,柯潔還嘗試了三三占角開局。這個嘗試也很好理解:既然點三三是好棋,那麼我就讓你沒有三三可以點。既然我占星位你點三三不吃虧,那麼我先佔三三,被你星位肩沖,我的內心毫無波動,甚至還可以脫先。此前與AlphaGo的對局中,人類很少用三三開局。說不定,三三開局就是柯潔的又一個秘密武器。

最後是個人向偽預測。

1. 比分(柯潔在前,AlphaGo在後)。

3:0或2:1,幾率<1%; 1:2,幾率 10-15%; 0:3,幾率 85%-90%.

柯潔贏一盤就是偉大的勝利,足以載入史冊。全敗是正常結局。總比分獲勝。。也許AlphaGo的機箱里真的藏著另一個柯潔呢?

2. 柯潔使用秘密武器的概率:

模仿棋: 40%; 三三開局:30%; 布局階段點三三: 60%; 妖刀、雪崩定式飛刀: 15%.

3. 團戰(五人組)勝率:2%。時間太短,至少要五小時基本用時才能發揮相談棋的優勢。五人組的配合可能也不如金龍城杯的三人組合。

4. 聯棋:預測 古力+AlphaGo 中盤勝 連笑+AlphaGo。

最後的最後是廣告:知乎 Live - 全新的實時問答。 @雲天外聯手世界冠軍@范廷鈺 在知乎Live全程解說人機大戰,僅售5.99!這是知乎Live首次引入視頻講解,而范廷鈺是國內在視頻里解說得最好的棋手之一。六塊錢,你買了不吃虧,不上當!


推薦閱讀:

從「機器學習」到「學習機器」:人工智慧的文化影響
這個機器人說要毀滅人類
解讀AlphaGo教學工具
李世石連續輸給 AlphaGo,其中自己的失誤佔了多大比例?
如何評價周志華在微博對 AlphaGo 和機器學習技術的評論?

TAG:围棋 | AlphaGo | 对弈人工智能 |