業界 | DeepMind牽手暴雪:要讓人工智慧征服星際爭霸

選自Bloomberg

作者:Jeremy Kahn

機器之心編譯

參與:李澤南、蔣思源

谷歌的 DeepMind 團隊在今年 3 月剛剛使用 AlphaGo 擊敗了圍棋世界冠軍李世乭,現在他們終於把注意力轉向了經典即時戰略遊戲《星際爭霸 2》。

DeepMind 剛剛在一年一度的 Blizzcon 上宣布他們與著名遊戲公司暴雪達成了協議,在《星際爭霸》系列遊戲中進行合作,這家隸屬谷歌的公司將在遊戲平台中引入機器學習方法,進行人工智慧研究。DeepMind 總部位於倫敦,在 2014 年被谷歌以 4 億英鎊巨資收購。

目前,DeepMind 還沒有宣稱自己的程序已經能夠玩《星際爭霸》了。「要打敗人類職業選手,我們還有很長的路要走。」DeepMind 科學家 Oriol Vinyals 說道(此人曾是西班牙頂尖的星際爭霸玩家),但公司在活動上的聲明表示現在他們正像對待圍棋一樣認真對待《星際爭霸》,並決心以此作為機器智能研究的突破點。

《星際爭霸》一直被人工智慧研究者視為下一個目標,因為它相比國際象棋與圍棋更接近「複雜的現實世界」,Vinyal 表示:「能玩《星際爭霸》的人工智慧必須能夠有效利用記憶,能夠進行長期戰略規劃,同時還得根據不斷出現的新情況做出反應調整。以這種標準開發的機器學習系統,最終完全可以應用到現實世界中的任務中去」。

雙方的合作目前仍在開始階段,暴雪《星際爭霸 2》首席製作人 Chris Sigaty 說道:「目前我們正在進行一系列討論。」他同時表示目前《星際爭霸 2》的電腦玩家與 DeepMind 想要實現的人工智慧系統有很大區別:「它們的設計難度不在一個級別上,遊戲中的電腦玩家其實有一點「作弊」,因為它可以得知人類玩家無法知道的信息,例如電腦可以在同一時間向所有單位發出指令,即使對於你來說有些單位「不在屏幕中」。暴雪製作電腦玩家的目的是創造一個比人類更強的 AI 玩家,同時保證它受到遊戲規則的約束。

虛擬擴張

在《星際爭霸》里,遊戲實時在線進行,玩家需要從三個種族之中選擇一個進行遊戲,每個種族都有不同的優缺點。玩家在遊戲中必須掌控生產,探索地圖,開採水晶和氣礦,然後開拓新的礦點。富有經驗的玩家會記住地圖中的大量信息以獲得優勢,即使地圖還未被探索。

玩家的視角下,對手的信息是有限的——這與圍棋這樣的棋盤遊戲不同。而且,不像棋類遊戲的回合制玩法,機器學習系統在即時戰略遊戲中需要不斷適應變化的環境。《星際爭霸》需要玩家能夠同時具有長期戰略規劃與應變對手的快速決策能力——設計能夠同時處理這兩種類型任務的系統對於研究人員來說是一個巨大的挑戰。

Facebook 和微軟的行動

Facebook 和微軟的人工智慧研究者們都已發表過人工智慧在《星際爭霸》一代中進行遊戲的研究。一些玩《星際爭霸》的機器人已經被開發出來,但目前這樣的程序距離擊敗人類職業玩家還相去甚遠。

微軟 CEO 薩提亞·納德拉對谷歌在人工智慧研究中注重遊戲的路線進行過抨擊,他曾在 9 月份亞特蘭大的一次活動中告訴觀眾「微軟不會把錢花在讓人工智慧在遊戲中擊敗人類」,微軟希望把人工智慧「用在解決急迫的社會與經濟問題上去」。

電子遊戲一直是人工智慧研究和測試的重要組成部分。在二十世紀九十年代中期,IBM 的超級計算機「深藍」數次擊敗了國際象棋世界冠軍卡斯帕羅夫。後來到了 2011 年,IBM 的沃森人工智慧在遊戲《危險邊緣》就擊敗了最優秀的人類玩家,並展示了 IBM 在自然語言處理的進展。早在 2015 年,DeepMind 就開始使用機器學習來訓練人工智慧玩一些復古的雅達利遊戲(Atari games),並使其至少能做得和人類一樣好。後來在 2016 年的三月份,DeepMind 通過另一種方法訓練了 Alpha Go,並擊敗了圍棋世界冠軍李世乭。

《星際爭霸》自從 1998 年發行以來,已經積累了大量的忠實粉絲。在第一個十年里就售出了 950 多萬冊的原版遊戲,其中超過一半的銷售量出現在韓國,它在那裡實在是太受歡迎了。2011 年發行的《星際爭霸 2》以 48 小時內售出 150 萬冊打破了即時戰略遊戲的銷售記錄。讓兩個玩家實時互相對壘,這種方式使《星際爭霸》成為首屈一指的專業視頻競賽遊戲。儘管它的地位目前已被其他遊戲取代,但仍然是一個重要的世界級電競遊戲。

DeepMind這次的對手也許不是韓國人,在WCS2016中,美國選手Neeb獲得了世界冠軍

暴雪和 DeepMind 計劃在明年第一季度發布一個新環境,對所有人工智慧研究人員開放。在新界面里,《星際爭霸 2》的圖形將被簡化以便於機器學習系統進行識別,同時他們也將開放 API,允許系統讀取遊戲中的數據,實現原先電腦玩家的部分功能。暴雪將在未來發布遊戲 replay 文件數據集以供機器學習。DeepMind 的最終目標是讓人工智慧系統和人類玩家一樣,通過處理視覺信息理解遊戲。

那麼什麼時候人工智慧可以擊敗世界冠軍呢?暴雪和 DeepMind 都對此持謹慎態度,兩者都沒有給出一個確切的日期,雖然 AlphaGo 的勝利比大多數人預測的要早。「我認為人工智慧的支持者們會很興奮,以至於曲解我們的話。」Sigaty 說道,所有人都十分期待這一刻。無論這需要多久時間,現在基礎已經打下,《星際爭霸 2》的舞台上,又一段傳奇即將上演。


推薦閱讀:

姚頌:挑戰GPU人工智慧霸主的創新勇者 |「35歲以下科技創新35人」中國榜單專欄
面對選擇,一定要選困難那件事兒
國內無人超市真來了,再不努力你將無工可打!
【人工智慧】2017「智能製造」產業鏈研究報告!
HyperOpt中文文檔導讀

TAG:人工智慧 | 星際爭霸 | 智慧 | 征服 | 人工 |