阿爾法狗已今非昔比,柯潔年內大戰阿爾法狗能否獲勝?
DeepTech深科技 麻省理工科技評論傾力打造
本文轉自澎湃新聞 記者 王心馨
谷歌人工智慧系統阿爾法狗(AlphaGo)下一個對手或許會是目前世界排名第一的中國棋手柯潔。
6月4日,在第37屆世界業餘圍棋錦標賽新聞發布會上國家體育總局棋牌運動管理中心黨委書記、國際圍棋聯盟事務總長楊俊安透露,如果不出意外柯潔九段將在年內進行和「阿爾法狗」的圍棋「終極人機大戰」。
不過,這場對決的具體時間地點目前尚未確定。
今年3月15日,阿爾法狗最終以4:1的比分戰勝韓國棋手李世石,隨後韓國棋院為阿爾法狗頒發名譽九段證書。
根據「Go Ratings」世界圍棋等級分排名,截至2016年6月4日,柯潔排名第一,AlphaGo排名第二。
世界圍棋等級分排名。
AlphaGo軟體、硬體升級,變得更加強大
AlphaGo與李世石之戰,是人工智慧首次與最高段位圍棋選手之間的對弈。不同於1997年深藍對弈的國際象棋,AlphaGo對弈的圍棋更加複雜,每下一步後能產生的可能性也更多。但AlphaGo背後的演算法在比賽中已經顯示出自己的優勢。通過深度學習,它已經能模擬人類下棋,擁有「直覺」,並能給出下一步的最佳策略選擇。
對於AlphaGo來說,贏了李世石後,並沒有停下學習的腳步,在軟體和硬體上都進行了升級。就在今年5月份,谷歌宣布它已經建立了專為機器學習定製的「TPU」(Tensor Processing Unit)的ASIC晶元,它專門針對TensorFlow進行優化,性能要優於英偉達的 GPU,相當於谷歌依據摩爾定律向前跳了三步。
根據《the verge》的報道,谷歌其實利用TPU來處理數據已有一年多時間,並利用其來優化了搜索結果和谷歌街景項目。同時,AlphaGo與李世石的挑戰也用了TPU處理器。
對於計算機來說,幾乎所有的應用程序都可以通過專用硬體加速,但你必須讓這樣的操作物有所值。例如,因為人們喜歡看視頻,大多人會使用一些標準的編解碼器,使得回放更流暢,電池消耗也更少一些。現在谷歌可以從「TPU」的ASIC晶元中受益。
此外,AlphaGo若真的確定與柯潔對戰,谷歌可能會使用另一個更強大版本的AlphaGo。AlphaGo兩個版本,一個是「單機版」,另一個是「分散式」,也可以稱為聯網版本。兩者的演演算法完全相同,差別在於所用的硬體。
單機版AlphaGo擁有48個中央處理器(CPU)和8個圖形處理器(GPU)。而分散式版AlphaGo則擁有1202個中央處理器和176個圖形處理器。
作為比較,在AlphaGo之前的幾個圍棋人工智慧程序,CrazyStone只有32個CPU,而Zen只有8個CPU。單機版AlphaGo曾經與5種圍棋程序進行了495場比賽,對手是CrazyStone、Zen、Pachi、Fuego 和 GnuGo,AlphaGo 全部取得壓倒性的勝利。即使是讓4子,AlphaGo對Crazystone和Zen的勝率也達到了77%和86%。至於分散式版的AlphaGo,如果對上自家的單機版AlphaGo,則分散式版本的比賽勝率是77%。另外,有外媒稱,AlphaGo團隊在與李世石的對戰後,經過簡單的休整,不但沒有減少對圍棋的研究,反而擴大了團隊人數和投入資源。換句話說,柯潔將會面對一個更強大的「阿爾法狗」。
除了自身能力的改進讓外界期待外,此前AlphaGo與李世石對決時,被人詬病的比賽規則這次可能會改變比賽走向。AlphaGo與李世石大戰5盤,使用的是中國圍棋競賽規則(比賽結束時,後走棋的棋手貼目),也是Alpha Go平時「訓練」使用的規則,而李世石則更熟悉韓式規則。按照比賽規則,雙方各有2小時的布局時間及3次60秒的讀秒(棋手將限時用完後的倒計時時間)。每場比賽預計需要4-5個小時。
柯潔揚言:阿法狗戰勝了李世石,但它贏不了我
在李世石與AlphaGo大戰期間,中國職業圍棋九段選手柯潔曾在微博上介紹過自己:我叫做柯潔,97年出生。現在暫時是世界圍棋第一人,正式比賽我是單盤8:2碾壓李世石(他贏得這兩盤沒有任何作用),世界冠軍獲得過三次(此年齡如此成績前無古人),大小國內賽事冠軍無數次。在阿爾法狗贏下第一盤棋後,柯潔發微博稱,「就算阿法狗戰勝了李世石,但它贏不了我。」
最終比賽以4:1結束,柯潔揚言:「來吧!管你是阿法狗還是阿法貓!我柯潔在棋上什麼大風大浪沒見過?讓風暴再來的猛烈點吧!這個X我就裝了怎樣!」
谷歌方面也在贏下李世石後就將目光投向了柯潔。DeepMind的研發工程師拉利亞·哈德塞爾在其個人Facebook賬號上公開表示,「AlphaGo現在可以有正式排名了。(謝謝輸給你,李世石,如果一直贏棋就不能被排名演算法統計)。現在AlphaGo的積分是3533分,排名世界第4。柯潔,準備好了嗎?」
最終,無論柯潔與AlphaGo的比賽能否成行,以及柯潔能否在比賽中獲勝,我們或許更應該關注的是谷歌對於人工智慧的投入和戰略眼光。
AlphaGo的開發團隊DeepMind的創始人Demis Hassabis在AlphaGo擊敗李世石後說:「在一定程度上,我們只對那些有助於我們研究計劃的東西感興趣。
DeepMind的目標不僅僅是獲得遊戲勝利,還要從中獲得樂趣和啟發。但從個人角度來說,我喜歡玩遊戲,我也曾開發過電腦遊戲。可是從某種程度上說,它們又都是試驗台,即嘗試編寫演算法並對其進行測試的平台。最終,我們希望能將技術應用於解決現實世界的難題。」
深科技招聘外腦團隊,還科技內容應該得價值
《五十大突破技術》深度剖析版
麻省理工科技評論出版首部中文圖書
推薦閱讀:
※柯潔為何沒有機會 人類棋手該如何學習AlphaGo
※AlphaGo將對戰柯潔,人工智慧未來會全面取代人類么?
※柯潔闖入八強
※柯潔輸了!人不是那個人,「狗」更不是那個「狗」