OpenAI人工智慧1v1擊敗Dota2頂級玩家:明年開啟5v5模式

計算機已經在國際象棋和圍棋等經典遊戲中打敗世界上最厲害的人類。現在又有一台計算機在 Valve 舉辦的 Dota2 國際錦標賽現場打敗了「Dota 2」世界頂級玩家,該賽事獎金高達 2400 萬美元。

在 Dota2 一對一表演賽中,由 OpenAI 設計的 bot 打敗了 Danylo "Dendi" Ishutin,一名在職業生涯中已經贏得 735,449.40 美元獎金的職業玩家。OpenAI 的 bot 在第一場比賽開始約 10 分鐘打敗了 Dendi。在第二場比賽中 Dendi 放棄,並拒絕進行第三場比賽。

在人機匹配賽之前,OpenAI CTO Greg Brockman 解釋了該公司的特製 bot 接受了一千次比賽的訓練,訓練由 OpenAI 進行指導。Brockman 還聲稱這個 bot 已經打敗多個「Dota 2」職業玩家。

人工智慧公司向來喜歡通過視頻遊戲測試其技術:DeepMind 選擇了星際爭霸 2,而微軟則在最近宣布要在 Ms. Pac-Man 取得佳績。Brockman 說,OpenAI 並不打算淺嘗輒止,而是希望其 bot 明年可在 Dota 5 對 5 遊戲中作戰。同時,OpenAI 將會發布該 bot,從而人人可以與其對決,並且舉辦方 Valve 將為擊敗該 bot 的第一個人類玩家提供遊戲幣獎勵。

以下是 OpenAI 官方博客對該比賽的介紹:

OpenAI DOTA2人工智慧_騰訊視頻 https://v.qq.com/x/cover/e0536rq7gig/e0536rq7gig.html

我們已創建了一個 bot,它在標準聯賽規則下的 Dota 2 1 對 1 比賽中擊敗了人類頂級職業玩家。該 bot 通過自學從頭學習 Dota,但並沒有使用模仿學習或樹搜索。這向構建在涉及真實人類的複雜環境中達成精確目標的人工智慧系統邁出了前進的一步。

今天我們在國際賽的主賽場與 Dendi 對戰,贏了一場三局兩勝比賽。在過去一周中,我們的 bot 在與許多頂級專業玩家,包括 SumaiL(世界 1v1 頭號玩家)和 Arteezy(世界頭號全能玩家)對戰時依然保持不敗戰績。

Dota 1v1 是一個具備隱藏信息的複雜遊戲。智能體必須學習規劃、攻擊、設局以及欺騙對手。玩家技能和每分鐘操作數(actions-per-minute)之間的關聯不是很強,事實上,我們的 AI 的每分鐘操作數相當於人類玩家的平均水平。

OpenAI 讓人工智慧學會打Dota2_騰訊視頻 https://v.qq.com/x/cover/s05363y887a/s05363y887a.html

在 Dota 中取勝需要玩家基於對對手的直覺而採取相應操作。在上面的視頻中你可以看到我們的 bot 已經習得了——完全通過自我對弈——預測其他玩家的下一步操作,在陌生的環境中隨機應變,以及通過對其他玩家的友軍施加影響而幫助前者成功。

一場完整的 Dota 比賽包括兩個戰隊,每隊五人。每個玩家需要從一百個英雄和數百種裝備之間進行選擇。我們下一步將創建一個可與人類戰隊競爭和合作的 Dota 2 bot 戰隊。

選自OpenAI 機器之心報道

推薦閱讀:

米波玩得6的人是一種什麼樣的體驗?
如何評價西方dota2戰隊「殺手」Bulba?
DOTA2 這個遊戲對你有多重要?
如何以古龍的風格寫DOTA故事?
09現在開始進行dota2直播能不能推動dota2的發展?

TAG:刀塔DOTA2 | openai | 人工智能 |