業界 | 用遊戲測試人工智慧,Nature盤點三大開源3D測試環境
選自 Nature
機器之心編譯
參與:李澤南
《我的世界》對於 José Hernández-Orallo 而言並不陌生,他是一名計算機科學家,正在使用這款遊戲進行自己的研究。他在瓦倫西亞理工大學的研究團隊設計了一種測試機器智能性能的基準,這種方法的設計靈感來源於他看到自己的孩子在 3D 虛擬世界中遊戲的情形。在《我的世界》中,玩家通常需要通過互動解決問題,而不是射殺怪物。
《我的世界》是一款風靡全球的遊戲,現在科研人員們正在使用它來測試人工智慧
2014 年,微軟購買了《我的世界》的所有權,這家科技巨頭的研究機構——微軟研究院隨後在此之上設計了一個用於科研的新版本,讓計算機程序和科學家們可以探索和自定義遊戲中的 3D 環境。隨後,微軟邀請了包括 Hernández-Orallo 在內的一些外部研究人員下載了這個機器友好版本的《我的世界》。從 2015 年 7 月起,微軟將其完全開放,現在任何人都可以免費使用它,微軟希望以此加快人工智慧領域的研究速度。
人工智慧在各種遊戲中的研究最近變得非常火爆,很多公司正像微軟一樣在遊戲中投入研究力量。12 月 3 日,DeepMind 開放了自己的 3D 虛擬世界程序 DeepMind Lab,供所有開發人員下載和自定義使用。這家谷歌下屬公司設計的虛擬環境一開始被用於訓練自己的人工智慧程序。僅僅兩天以後,OpenAI 發布了一個「元平台」允許人工智慧程序在其中與最初為人類玩家設計的十幾款 3D 遊戲互動,另外,這個環境還包含了一些網路瀏覽器與手機 app。
這三個工具讓研究人員與軟體開發者們可以輕鬆地開展自己的實驗,測試程序在遇到前所未見的問題時如何進行解決,同時可以幫助程序在類似真實場景的環境中進行自我訓練。「這樣的虛擬環境將會為人工智慧的發展奠定基礎,」西雅圖華盛頓大學的機器學習研究者 Pedro Domingos 說道。
DeepMind Lab,一開始被用於訓練谷歌自己的人工智慧程序,現在已經向所有開發者開放
Atari 演算法
人工智慧是各種視頻遊戲的老玩家,但在早期,每個用於通關的演算法都是特殊定製的。近年來,人們的研究重點開始轉向於使用機器學習讓程序自我積累經驗。在 2015 年上半年,DeepMind 推出的演算法在 Atari 遊戲中擁有了超越人類玩家的水平,演算法通過不斷試錯來獲得遊戲高分,設計者並沒有告訴程序每個遊戲的目標是什麼。
Atari 遊戲僅僅是 2D 世界而已。像《我的世界》這樣的「第一人稱」3D 視頻遊戲可以讓玩家置身於一個充滿立體感的環境中,相比前者更接近於真實世界,因此吸引了更多研究者的目光。
在《我的世界》中,玩家可以和虛擬世界中的磚塊互動,使用它們蓋房子,同時也可以探索路線,和遊戲世界中的其他內容展開交互。面向開發者的版本被稱為 Malmo,允許機器演算法像人類玩家一樣在遊戲中進行探索。Hernández-Orallo 正在使用 Malmo 來探究虛擬環境是否可用於創建機器智能的基準。不同演算法可以相互競爭,看看哪一個可以將磚塊搭建成某個物體的形狀,或者比較它們在同一個迷宮中尋路所需的時間,這種測試的涵蓋面相比圖靈測試——機器智能最有名的測試方式——要廣泛的多。
讓《我的世界》吸引人工智慧學者們的另一個原因是,在遊戲中玩家們可以打字互相交流。「這可以幫助專家們研究人工智慧在現實世界中與人類互動的情況,」微軟研究院的科學家 Katja Hofmann 說道,她在英國劍橋領導著開發 Malmo 的團隊。
目前約有 100 個研究機構正在使用 Malmo 3D 世界,它由微軟研究院開發,用於人工智慧研究
訓練機器人
「虛擬世界的人工智慧訓練對於機器人的發展大有益處,」Hofmann 說道。「因為虛擬環境的定製成本很低,定製速度和安全性也有保障。虛擬環境也可以讓機器人研究者們專註於解決機器人的智能問題——機械的問題有時的確令人分心。」
除了 Hernández-Orallo 以外,微軟研究院還與不少其他研究機構合作開展了一系列 Malmo 項目。Hofmann 認為真實的用戶數量不止於此,也許有 100 家。
Malmo 平台包括 Java 版本的模塊,以及幫助智能體在 Minecraft 環境中感知和操作的代碼。這兩個組件可以在 Windows,Linux 或 Mac OS 上運行。
DeepMind Lab 和 Malmo 類似,也允許研究者創建迷宮,讓不同演算法學習如何尋路,獲得獎勵。DeepMind 正在嘗試將「更自然的元素」(如起伏的地形和植物)整加入到這個虛擬世界中。目前這個 3D 環境已經開源,DeepMind 希望在其他研究者的幫助下,這個平台能夠更加複雜,從而訓練更聰明的訓練演算法。「通過開源,我們可以讓所有人參與進來,不斷改進這個項目,」DeepMind 的一位發言人說道。
OpenAI 的元平台,Universe,相比前兩個 3D 世界則更進一步。通過為同一個人工智慧程序提供多種不同類型的環境,這一平台或許可以解決領域內最棘手的問題:如何創建一個可以解決任何新問題的演算法。目前的深度神經網路——通過模仿腦細胞和視覺皮質層的結構創建的計算機系統——可以快速學會在 3D 迷宮中尋路,但同樣一個系統卻無法將自己學會的方法用於在其他迷宮中導航。「你僅僅改變一下迷宮的顏色,系統就會迷失其中了,」Hernández-Orallo 說道。「這就是目前最先進的技術,令人哭笑不得。」
看來,人工智慧的發展還有很長的路要走。目前微軟現在正努力讓 Malmo 可以在 Universe 中使用。「擁有一個社區平台將使所有人從中受益,」OpenAI 的共同創始人,首席技術官 Greg Brockman 說道。
相關鏈接:
Microsoft Project Malmo:https://www.microsoft.com/en-us/research/project/project-malmo/
DeepMind Lab:https://deepmind.com/blog/open-sourcing-deepmind-lab/
OpenAI Universe:https://universe.openai.com/
原文鏈接:http://www.nature.com/news/tech-giants-open-virtual-worlds-to-bevy-of-ai-programs-1.21151
本文由機器之心編譯,轉載請聯繫本公眾號獲得授權。
------------------------------------------------
加入機器之心(全職記者/實習生):hr@almosthuman.cn
投稿或尋求報道:editor@almosthuman.cn
廣告&商務合作:bd@almosthuman.cn
推薦閱讀:
※關於國內遊戲數據分析的N個真相
※了解一些遊戲測試知識
※淺談遊戲測試
TAG:人工智慧 | 遊戲 | 環境 | 測試 | 智慧 | 開源 | 盤點 | 遊戲測試 | 測試環境 | Nature | 人工 |