柯潔輸了！人不是那個人，「狗」更不是那個「狗」

07-02

??柯潔還是輸了！

2017 年 5 月 23 日，在舉行於中國烏鎮的「人機終極對決」第一局中，當今世界排名第一的中國圍棋選手柯潔，輸給了 Google 旗下的人工智慧程序 AlphaGo。

按照比賽規則，柯潔和 AlphaGo 各有三個小時的時間；但在現場的比賽中，整體的節奏比預想中的要快很多。尤其是 AlphaGo，它的平均出子時間為 30 秒左右，現場解說的職業八段棋手張璇和職業九段棋手常昊多次用「高效、果斷」來評價它的表現。而柯潔的應對狀況比較多變，有時會立刻下子，有時也會思考很長時間。

愛范兒（微信 ID：ifanr）在現場注意到，當柯潔用時一個小時的時候，AlphaGo 所用的時間不到二十分鐘。

最終比賽的結果也並不十分出人意料，在比賽進行了四個多小時之後，柯潔九段執黑負於 AlphaGo，AlphaGo 贏四分之一子。

不過，關於這場「人機終結對決」的最終結果，目前還存在一定的變數；今天只是這場對決的第一局，第二局和第三局將分別在 5 月 25 日和 5 月 27 日舉行，愛范兒（微信 ID：ifanr）將保持關注。

關注微信公眾號愛范兒（微信號：ifanr），回復關鍵詞「阿爾法狗」，獲取 AlphaGo 下圍棋的乾貨，了解機器學習和深度學習的區別。

這次的狗，亦敵亦友

就在昨天晚上，柯潔在新浪微博發表了題為《最後的對決》的賽前宣言，不無傷感地提到：

決戰前夕，感慨萬千…在這個特殊的時間，我有些話想和熱愛圍棋、關注圍棋、關注我的朋友們說:無論輸贏，這都將是我與人工智慧最後的三盤對局

這種離別的氣氛，反而給了這次比賽更多「且看且珍惜」的意義。

今天的比賽之後，柯潔還將在 25 日和 27 日進行對 AlphaGo 的後兩盤對決，無論第二局輸贏，三盤比賽都將完成，與之前 1 月份化身 Master 的 AlphaGo 要求下快棋不同，本次比賽採用傳統規則，雙方各有三小時的時間。

直到本次「中國烏鎮·圍棋峰會」，已是 AlphaGo 第三次刷屏，前兩次人機對決的場景還歷歷在目，但整個人類世界對於兩方選手的感情卻發生了顛覆性的變化。

2016 年 3 月，AlphaGo 首次挑戰韓國棋手李世石時，整個世界都希望 AI 獲勝，就像柯潔當時所說，「就算阿法狗贏了李世石，它也贏不了我」，大家以看熱鬧的心態打量著新生者 AI。

而當 2017 年 1 月，化身 Master 的 AlphaGo 在互聯網上連掃世界第一柯潔、韓國冠軍朴廷桓、日本冠軍井山裕太時，AI 似乎已經不可戰勝，柯潔也在微博深夜感慨「人類千年的實戰演練進化，計算機卻告訴我們，人類全都是錯的……」

直到今天，當柯潔在賽前說到「能夠代表人類出戰，是我以前不敢想像的事情，這次選擇我作為主角，我也會竭盡全力去一爭勝負」時，世界的選擇已經變成了希望人類贏一盤。

這種心態在賽制上也有所體現，除了代表中國選手最高水平的柯潔個人之外，新加入的配對賽和團體賽也非常值得關注。

配對賽將由古力、連笑兩位九段當中的一人分別與 AlphaGo 組隊，再與剩下的一人進行對決，每方只有 1 小時時間，比賽在 26 日上午打響

團隊賽則是時越、羋昱廷、唐韋星、陳耀燁和周睿羊 5 位世界冠軍組成人類聯隊，合力對抗 AlphaGo，每方 2 小時 30 分鐘，這將在 26 日下午進行。

當 1 對 1 的對決已經過於殘酷，人機組隊又會擦出怎樣的火花，人類聯合組成的「神經網路」面對 AI 又是否還有勝算呢？

人不是那個人，狗不是那條狗

千萬別以為「坐」在場上對弈的雙方一年來都沒有變過，用很哲學的說法來說，他們都已經不再是當年那個存在。

自從今年 4 月確定了本次人機對決之後，柯潔已經有意識地在尋找對抗 AlphaGo 的「神之一手」，在先前進行的新奧杯世界賽和中國圍甲聯賽中，柯潔在 8 盤比賽中輸掉了兩盤，而這兩盤中出現了一些之前並不常見的運子方法，有觀察者表示這是柯潔在嘗試以傳統套路之外的方法尋找 AlphaGo 的軟肋。

從這個角度講，這三盤比賽中的柯潔的策略或許將與之前完全不同。

（那一年，柯潔的世界排名還在 AlphaGo 前面）

但 AlphaGo，恐怕在以令人絕望的迭代速度進化著。同樣在今年 4 月，AlphaGo 之父哈薩比斯在英國劍橋大學進行了演講，專門提到為了幫助 AlphaGo 提升，他們還開發了名為 Anti-AlphaGo 的防止過擬合的擾亂工具，之前 AlphaGo 提升一個版本需要 3 個月，現在只需要 1 周。

AlphaGo 對陣李世石時的版本號是 V18，而當下的版本估計已經到了 V60，在邏輯上和棋局策略上已經今非昔比。

這種進化的力量源泉與意義，是蒙特卡洛搜索演算法和深度學習模式的不斷進化。

為了解釋上面這兩個似乎每個字都能看懂，但其實都看不懂的詞，我們先來看兩組數字。

如果讀過人工智慧的科普文章的話，一定知道 20 年前的 1996 年 5 月，IBM 的?「深藍」計算機在國際象棋中戰勝了世界排名第一的卡斯帕羅夫。

從數學上考慮，國際象棋棋盤上能夠發生的不同可能大約是 10 的 46 次方，也就是 10000000000000000000000000000000000000000000000。

但這在圍棋面前就是小巫見大巫了，圍棋共有 19X19 個落棋點，加上不同的落字方式，全部可能大約是 10 的 170 次方左右，根據荷蘭科學家 John Tromp 的計算，大約是 208168199381979984699478633344862770286522453884530548425639456820927419612738015378525648451698519643907259916015628128546089888314427129715319317557736620397247064840935。

大家知道，困擾人類很多問題的原因在於算力，比如一個密碼鎖，如果只有兩位，那麼如果忘了密碼很多人都會嘗試去從 00 試驗到 99，但 4 位數的手機密碼就沒幾個人去試了，因為試出來花的時間太長，這就是算力不夠。

對於現在的 AI 來說，對弈國際象棋所需的算力已經基本達到，但是妄圖用窮舉法算出來圍棋的各種可能的算力還沒達到，這種情況下，就要考慮演算法了。

而 AlphaGo，就採取了一種「大智若愚」的辦法，讓算力不足的計算機「大愚若智」起來。

這就是蒙特卡洛搜索演算法，我們明白，很多時候兩人對決，其實不需要每一步都走當時最好的那一招，只要出的招是妙招，或者比對方能想像的好就行。這時候，就是一個概率問題。

舉個非常簡單的例子，從你家到火車站共有 ABCDE 五條路，或許你不知道每條路具體的長度和用時，但此時，如果從你家同時出發 500 人，每條路 100 人，然後你到火車站去觀察，假設半小時內到達的人里，走 B 的最多，你就可以斷定走 B 是條好路。

當然，路越多，路口越多，這種情況的分析會越複雜，但是放出的人越多，結果也會越精確，雖然沒有人能打包票說某條路一定是最對的，但是分析結果足夠做決策了。

這是用最最不嚴謹的方法解釋了這種概率學的取樣方法，但這相比逐項窮舉的辦法，大大前進了一步。

而深度學習，指的是 AlphaGo 會根據之前人類棋手的大量歷史棋局，記錄下每個棋局當中的分步局面，並把當前的棋局按照進行視覺分析，跟以往的數據進行比較，找到最類似的局面，再在當前最高質量的點上去下子，不至於把所有的位置都考慮一遍。

而當下版本 AlphaGo 最駭人之處，在於它已經跳出了學習人類棋盤的方法，而進入了自己左右手互搏，自己學習各種情況的局面，一方面它所學習到的棋局廣度非人類可想像，另一方面它的出招可能越來越沒有「套路」可言。

更別提 AlphaGo 只要有電就可以無休止學習這件事了，由於圍棋本身有明確的規則判斷勝負，所以 AlphaGo 可以在無需人類標註的情況下就能判斷自己出招的好壞，更是強化學習的一大優勢。

現在的狗，是人類智慧和機器智慧的結合體了。

明知不可為而為之，是為了費電么

我預測結果是 0 比 3，AlphaGo 勝出——聶衛平人類的勝算為 0 ——李開復

既然在比賽層面，已經如此的沒有看點，為什麼人機對抗還要繼續進行呢？

賽前有媒體認為，這是為了向社會繼續推廣 AI 的概念，為行業的發展做宣傳，這種說法雖然都有一定的合理性，但格局未免太小。

就像在手機應用商店中會在「益智遊戲」中找到圍棋一樣，進行這種遊戲的目的還是為了益智。

而進行 AI 於人類的對抗，根本目的還是檢驗和優化演算法，並且力爭在其他更有價值的行業中進行應用。

就像在《智能革命》一書中，李彥宏說的那樣，「2017 年初，AlphaGo 的變身 Master 橫掃中韓頂級高手，一時間人們分化為悲觀派、降臨派、冷靜派、腦洞派……我們希望有更多人是默默學習派」。

從最初的 AlphaGo，到 Master，再到今天的 AlphaGo，三代產品，三段歷程，對應的恰好是「理論，實驗，再創新」的三段論。

而這種基於互聯網大數據的深度學習和決策支持系統，將在很多人類算力不可及的領域提供支撐。

Google 大中華區總裁石博盟就透露，AlphaGo 的第一個結合點會是醫療領域，AI 將在一定準確率的情況下，給予醫生診療判定方面的輔助，對於糖尿病、癌症等疾病的治療和研究大有裨益。

而未來在更大的深度和廣度上，AlphaGo 積累的決策模型，將逐漸把人力從需要反覆的勞動中解放出來，同時對腦力勞動進行反哺，對絕大多數社會元素進行快速解構並解讀，再反饋給人類。

如同去年大熱的科幻片《降臨》一樣，人工智慧與人類本體，終將會找到一條智慧結合的發展大路。

最後，我想以暢銷書《深澤直人》中文譯者路意今早創作的《最後一局人機對弈》當中的一段話做結：

在今年閱讀到 Jacob Bronowski 的 The Ascent of Man 的時候，被他所寫到的生物界中，只有人可以遠離他所誕生的環境，甚至在極端不適合生存的地方生活所啟示，人之所以能夠具備現在的能力，必然是與其敢於離開自己的舒適區有關。而藝術，愛，智商，想像力，創造力…這些似乎都不能是必要條件，而更像是在數十萬年中，人類在不斷抗爭和追尋夢想的過程中所進化出的特質。

智能是人可以步入今日之成就的必要條件，但非充分條件。機器智能想必也會如此，大多數是不會具備人的意識的，但是不可排除的是，隨著時間的推移，其中有些會開始覺醒，擁有自我意識，開始抗爭，和追尋夢想，也會有貪嗔痴，真善美。

那時，它們自然也可稱之為人。人也不再只限一個血肉之軀。

文章評論(-)正在載入中

TAG:柯潔 |