對戰全程視頻！頂級高手苦練DOTA半輩子，就這樣被AI擊敗

01-27

李林若朴假裝發自西雅圖

量子位報道 | 公眾號 QbitAI

一直只聽說你們AI圈要打星際，怎麼忽然打起DOTA了！

今天一早，AI似乎震驚了不少同學：在堪稱「DOTA圈世界盃」的TI7邀請賽上，頂級選手被AI完爆。而且，這個AI只訓練了兩周……

先來看下最後分出勝負時的畫面：

https://www.zhihu.com/video/879713284473913344

看AI完虐頂級選手Dendi

在TI7主舞台上被AI「完爆」的，是Dendi，NAVI戰隊的烏克蘭職業DOTA2選手，從DOTA1開始打了小半輩子，擅長中單solo，被評價為大局觀強，操作犀利，手速極快。

Dendi同時也是一名非常有想像力的選手，他經常會做出令人意想不到的事情，但往往也能收到意想不到的效果。

可惜，這次他遇到了可惜遇到了AI。

打敗了Dendi的這個AI，是馬斯克等人創立的人工智慧非營利機構，OpenAI悄無聲息研究出來的，如今一舉搞了個大新聞。

第一局，開場5分鐘，Dendi就打出了gg；

第二局，從開始到gg不到3分鐘。

Dendi的手都在抖。

Dendi也不是唯一的「受害者」，上周，這個AI還和世界級中單1v1選手SumaiL、被稱為「天才少年」的Arteezy等很多職業玩家交過手，都沒輸。

我們再來看一下剛剛出爐的Dendi被虐全程視頻：

Dendi被OpenAI虐慘全程視頻_騰訊視頻 https://v.qq.com/x/cover/g0536nln273/g0536nln273.html

AI如何學會打DOTA？

說公道話，你們邀請汽車參加人類賽跑，這本來就不合適。不過，我們接下來還是要科學地分析一下DOTA2這個賽場，和這位橫空出世的AI選手。

對於AI來說，DOTA 1v1是一個包含隱藏信息的複雜遊戲，想要打好這個遊戲，AI需要學會計劃、攻擊、欺騙對手。

而且，不要以為AI是靠手速快取勝的，雖然我們平時會稱讚某些玩家手速快，但APM並不是決定遊戲勝負的關鍵，這個AI的APM也並不比人類高。

要在DOTA里獲勝，需要玩家對對手的操作建立一種「直覺」，然後做出應對。比賽結束後，OpenAI還在YouTube上專門發視頻秀了一下各種操作：

https://www.zhihu.com/video/879721696871989248

這個AI現在會補刀、會卡位、會長途追擊敵方英雄，也會誘敵到塔下。也就是說，它掌握了通過當前的狀況，預測地圖上其他單位會如何移動的技能。

這些技能，完全是通過自己和自己對局學會的，而且沒有用到模仿學習、樹搜索等模型。

△ 從左到右分別是：Dendi、主持人、兩位OpenAI研究員、OpenAI的主機箱

OpenAI的研究員在賽後採訪中說，他們的AI從零開始達到這個水平，只需要兩周；要打敗DOTA的內置程序，也就是和普通玩家一樣能打得過電腦，只需要1個小時。

「Bloody hell！」主持人聽完給出了一句簡短的回應。

訓練AI打DOTA只是第一步，這個項目的終極目標，是讓AI能在雜亂的、甚至有人類內的環境中完成設定的目標，比如說外科手術。

當然,打DOTA這個問題也還沒有真的完成，現在還只是1v1，讓AI學會合作打5v5，還有很長的路要走。

AI打得怎麼樣？玩家這麼說

怎麼看這件事？這是Reddit上最好的一條評論。來自網友Screye，量子位搬運如下。

好吧，我對DOTA還算有所了解（玩了8年）。我試著談一下。

事件：

這個AI擊敗了一眾頂級DOTA玩家。（Sumail，RTZ，Dendi）

環境：

兩名玩家在一條峽谷對攻，獲勝條件是摧毀對方的防禦建築，或者殺掉對方兩次以上。每30秒會有一波兵線進入峽谷，幫助應用攻擊對方。殺敵對方的兵線可以獲得金錢，併購買裝備提升等級。

對戰採用了迷霧模式，每個玩家只能看到附近一定距離內的情況。不過需要強調的是，這種1v1的對戰，並不是DOTA遊戲正常的模式（5v5）。

不過這種1v1的對戰，的確可以用來在兩個玩家之間一決高下，看看誰的操作技能更好。

數據：

AI是跟自己對戰訓練的。不過，DOTA的各種對戰視頻，或者說人類玩家的相關數據，都是可以公開獲得的。

基本動作：

一個專業DOTA玩家大約每分鐘要執行200-300個操作，包括行動、法術、攻擊等命令。在這方面，AI的手速應該不會弱於人類頂級玩家。

高級動作：

DOTA中的英雄角色攻擊之前，會配有特定的動作，這些動作施展之後，可以誘使對手也施展特定動作的回應，此時玩家可以發出命令取消動作。

另外法術和技能釋放之後，會有一個冷卻時間，在這段時間裡這個法術或技能無法再次釋放，所以這些都是有限的資源，如何使用也是一種技巧。

當然這些高級動作遠不止這些。

遊戲：

在這次的對抗中，人工智慧已經掌握了上述基本和高級動作，而且會用多種不同的策略展開攻擊。而且有很多需要一年以上聯繫才能掌握的高級操作，例如Creep pulling，coolodown，mana abuse以及動畫取消。

總之，人工智慧的風格似乎非常「人性化」，不像是一個機器。

結論：

DOTA是一個依賴戰略（宏觀和微觀）的遊戲，現在人工智慧也殺進來了，我覺得這是一個大事兒。這個遊戲需要考慮多方面因素，例如傷害的輸出、承受，法力和技能的消耗與冷卻等等，這些很難，我很想知道人工智慧的策略到底是怎樣指定的。

—— 完 ——

歡迎大家關注我們的專欄：量子位 - 知乎專欄

誠摯招聘

量子位正在招募編輯/記者，工作地點在北京中關村。期待有才氣、有熱情的同學加入我們！相關細節，請在量子位公眾號(QbitAI)對話界面，回復「招聘」兩個字。

量子位 QbitAI

?? ? 追蹤AI技術和產品新動態