標籤:

過去十年,我們用了哪些即時戰略遊戲訓練AI?

譯者 | 李夢

編輯 | Vincent

AI前線出品| ID:ai-front

AI 前線導語:「在 RTS 遊戲中進行 AI 研究有著悠久的歷史。在過去的十多年裡,研究人員一直致力於構建能打敗最強人類玩家的機器人,但是要走的路還很長。在 2016 年的暴雪嘉年華,DeepMind 和暴雪宣布合作,將為星際爭霸 2 的 AI 研究開放 API。

本文旨在討論 RTS 遊戲的一些發展進程,以及 AI 研究在其中的貢獻。要想詳細了解 RTS 遊戲相關研究,還請查看 Onta?on、Robertson 和 Watson 等人的文章」。(詳見文末)

過去的十年里,研究人員已經從在 RTS 遊戲中獨立研究不同的 AI 技術過渡到了在更複雜的遊戲中通過合作和競爭將不同的技術相互匹配。為了這項工作順利進行,需要以下條件:

  • 研究人員構建和評估機器人的開放 API
  • 可以讓研究人員對比不同技術的競賽
  • 用於訓練學習演算法的錄製回放
  • 人類選手對機器人的性能進行評估

在 2009 年發布的母巢之戰 API 中以上大部分的條件都得到了滿足,但由於平台的封閉特性使研究人員很難將 AI 系統的訓練過程自動化。隨著星際爭霸 2 環境的公開,研究人員將有機會開發一種能夠在 RTS 遊戲中表現出專家級性能的系統。下面一些是我認為的在朝著這一目標的發展歷程中的重大事件。如果有疏漏還請在評論里留言。

1998

星際爭霸 1 的發布

星際爭霸原作是在 1998 年 3 月發布的,資料片母巢之戰也於同年 11 月發布。它迅速風靡全球,並在韓國引發了職業遊戲的熱潮。

Freecraft

在星際爭霸之前,1995 年發布了魔獸爭霸 2。魔獸爭霸 2 的克隆版 Freecraft 也在 1998 年首次發布,它後來更名為 Wargus。這個克隆版構建在 Stratagus 遊戲引擎上。Freecraft 是 RTS AI 研究的一個重要項目,因為大部分的初始工作都以 Wargus 作為實驗平台。

2001

學術界對遊戲 AI 的興趣

遊戲 AI 的一篇重要文章是 John Laird 和 Michael van 在 2001 年發表於《AI Magazine》的文章 Human-Level AI』s Killer Application Interactive Computer Games。這篇文章意義重大,因為它是 AAAI 的出版物中第一批認識到實時遊戲可以作為 AI 研究的良好環境。它還改變了學術研究人員試圖將現有方法應用於遊戲的心態,轉而考慮為遊戲構建全新的和專門的方法。

2002

魔獸爭霸 3 發布

魔獸爭霸 3 的一大特色是高度可擴展的地圖編輯器,它被用來創建獨特的內容,比如最初版本的 DOTA。地圖編輯器還擁有一些腳本功能,可以用來編寫自定義 AI。然而,以這種方式編寫的 AI 僅局限於單一地圖,腳本語言也僅向作者提供了一個命令子集。研究人員可以在這個框架內實現他們的 AI 技術,但不可能用不同的機器人互相測試。

2003

RTS 遊戲被推薦為 AI 測試平台

2003 年,Michael Buro 和 Timothy Furtak 發表了一篇文章稱 RTS 遊戲提出了許多構建人類水平的 AI 時需要解決的新穎問題。他們還提議開發一個開源的 RTS 遊戲引擎提供給 AI 研究社區使用。

星際爭霸中的狀態估計

2004

ORTS 發布

接下來一年,Michael Buro 就發布了第一個版本的開源 RTS 引擎——ORTS。這個遊戲在圖形和非圖形模式下都可以運行,這讓機器人可以在成千上萬的遊戲過程中快速訓練。而使用 ORTS 的一個主要挑戰是,雖然它為人類玩家提供了一個交互界面,但是沒有專家級的人類玩家對機器人進行對抗評估。

ORTS 遊戲引擎

第一次 Wargus 研究

Freecraft 更名為 Wargus,它使用 Stratagus 遊戲引擎。Wargus 的主要優勢之一是它的開源,這為研究人員打開了一個平台,讓他們可以使用任何技術進行探索。Wargus 面臨的挑戰是缺乏可以用來分析的錄製回放,它沒有活躍的玩家基礎,而且在測試機器人的互相對抗受到網路代碼的限制。在使用 Wargus 作為 AI 測試平台的文章中,Marc Ponsen 是最早的發表者之一。

TIELT 的提出

在 2004 年提出的另一個 AI 項目是 TIELT 系統,它是一個 AI 框架,為多個遊戲主題提供統一的 API。該系統的目標之一是讓研究人員可以為一款遊戲開發 AI 並將學到的知識轉移到新的遊戲中。例如,在 Wargus 中學到的領域知識可能適用於其他 RTS 遊戲。我在這裡討論 TIELT 正是因為 DeepMind 和暴雪的合作成果之一就是一個 API 和潛在的樣本數據集。對於這個 API 來說,重要的是不要為 AI 的操作做出假設。TIELT 面臨的挑戰在於它沒有提供直接進入遊戲狀態的許可權,這也就限制了可以利用它的 AI 技術的數量。這個系統許多目標現在都已經在 Facebook 的 ELF 平台實現了。

TIELT 架構

2005

Wargus 中的增強學習

Wargus 迅速成為研究人員開發 RTS AI 的環境。2005 年,研究人員開始探索強化學習技術,這正是 AlphaGo 使用的策略之一。最終由於研究人員無法對彼此的工作進行對抗評估導致 Wargus 的工作停滯不前,他們太過依賴一小部分硬編碼腳本的性能。

2006

第一次 ORTS 競賽

在 2005 年公布了第一次 ORTS AI 競賽,該活動在舉辦於斯坦福的 AIIDE 2006 大會上舉行。第一次比賽有 4 個參賽項目,比賽規模逐年增加,直到 2009 年結束。

2007

IICup 啟動

International Cyber Cup 是星際爭霸的第三方伺服器平台。這個伺服器對 AI 研究非常重要,因為你可以在這個伺服器上運行機器人,不過它不是暴雪官方伺服器。這個伺服器的另一個優點是為玩家提供了一個字母評分,玩家可以用來輕鬆地交流技術。例如,我在 2010 年認真玩的時候最高拿到了 D+。

2008

第一次星際爭霸 AI 研究

我所知道的第一篇關於星際爭霸 AI 構建的文章是在 2008 年發表的。Hsieh 和 Sun 通過挖掘數千的遊戲錄製構建了一個模型來預測玩家會生產什麼建築和單位。

星際爭霸建造指令預測

2009

母巢之戰 API 發布

在 2009 年,我發現了一個叫做 BWAPI(母巢之戰 API)的 Goole 代碼項目,它提供了星際爭霸的編程介面。該庫使用了一個第三方 DDL 工具將 API 注入到星際爭霸的運行環境並提供一系列調用遊戲內部函數的掛鉤。自此之後,該項目的貢獻者規模不斷增長並且被移植到了多種語言。它現在託管在 GitHub 上並且有一個 Java 版本。

2010

星際爭霸 2 發布

在 2010 年,星際爭霸 2 自由之翼發布,母巢之戰的競賽也繼續活躍了幾年。2013 年又發布了蟲族之心資料片,2015 年發布了虛空之遺。

第一屆星際爭霸競賽

第一屆星際爭霸 AI 競賽在 AIIDE 2010 舉辦。其主要賽事由伯克利 Overmind 團隊獲勝。競賽中還出現了人對抗機器的表演賽,人類選手輕易地擊敗了 AI 對手。

伯克利 Overmind 團隊

2011

第二屆 AIIDE 星際爭霸競賽

艾伯塔大學的 Dave Churchill 主辦了第二屆以及後續的 AIIDE 星際爭霸競賽。他編寫了一個錦標賽框架,可以自動運行錦標賽,並修改了一些規則以促進合作,比如要求必須開源提交。

學生星際爭霸 AI 錦標賽

第二屆星際爭霸錦標賽開始後,學生的提交成為重點。錦標賽不再與每年的大會聯繫在一起,而是每年舉辦好幾次。

sscaitournament.com/

2013

星際爭霸母巢之戰機器人天梯

Krasi0 為星際機器人開發了一個全天候運行的天梯系統。這為研究人員提供了一個評估不同 AI 方法的環境。

2014

星際爭霸 2 自動化玩家

Matt Webcorner 演示了一個星際爭霸 2 機器人,它可以通過攔截 DirectX 命令來推斷遊戲狀態。這種方法的主要限制之一是該機器人只能訪問當前顯示在屏幕上的遊戲狀態。

2016

AlphGo 擊敗李世石

2016 年 3 月,DeepMind 的 AlphaGo 系統擊敗了圍棋世界冠軍李世石。這次勝利之後,許多人認為星際爭霸將是 DeepMind 的下一個挑戰目標。

Facebook 加入

2016 年 Facebook 的 AI 研究人員開始使用星際爭霸作為強化學習測試平台。他們發表了一篇關於星際爭霸中的微觀管理的文章。他們的機器人參加了 AIIDE2017 競賽,但是它的學習模式表現不如重點關註腳本的機器人。

暴雪嘉年華公告

在 2016 暴雪嘉年華,DeepMind 宣布他們正與暴雪合作開發一個 AI 的開放平台。現在 Google 與 Facebook 競相開發專業級星際爭霸遊戲的機器人,競爭也變得日趨激烈。

2017

星際爭霸 2 API 發布

暴雪在 8 月 9 日發布了用於編寫機器人的星際爭霸 2API,同時揭曉了一個編寫機器人的工作室。

查看原文

towardsdatascience.com/

參考資料

[1]:

hal.archives-ouvertes.fr

[2]:cs.auckland.ac.nz/resea


-全文完-

人工智慧已不再停留在大家的想像之中,各路大牛也都紛紛抓住這波風口,投入AI創業大潮。那麼,2017年,到底都有哪些AI落地案例呢?機器學習、深度學習、NLP、圖像識別等技術又該如何用來解決業務問題?

2018年1月11-14日,AICon全球人工智慧技術大會上,一些大牛將首次分享AI在金融、電商、教育、外賣、搜索推薦、人臉識別、自動駕駛、語音交互等領域的最新落地案例,應該能學到不少東西。目前大會8折報名倒計時,更多精彩可點擊閱讀原文詳細了解。

t.cn/Rl2MftP


推薦閱讀:

顛覆者的自我顛覆,榮耀以AI破局行業死水
Unity 中的 AI 模擬群組行為
前方高萌!這款會扒著你手指賣萌撒嬌的智能機器人,你確定你拒絕得了?
高科技范兒的智能音箱,這個很洋氣的東西為什麼火不起來呢?
大疆,大疆,路在何方(一)

TAG:人工智能 |