人類又輸了!OpenAI完虐Dota頂級職業玩家,推塔如割草

人類又輸了!OpenAI完虐Dota頂級職業玩家,推塔如割草

來自專欄新智元36 人贊了文章

OpenAI今天凌晨與DOTA2職業玩家隊伍對戰,並且以2:1的成績戰勝了人類玩家,這是AI歷史上一個值得紀念的里程碑,意義或許比AlphaGo戰勝李世石還要巨大!這意味著AI在需要團隊配合的複雜決策實時戰略電子競技中,超過戰勝人類職業玩家,AI的決策力、判斷力和相互配合,都提升了一大步。

OpenAI Five又贏了!

今晨,OpenAI Five在複雜實時多人(5v5)戰略電子競技遊戲DOTA2團隊戰中,以 2:1的比分戰勝了人類職業玩家!

一個多月前,OpenAI Five才剛剛戰勝人類業餘選手,進步神速!

獲勝後人類職業玩家在第三局對戰終於獲勝後露出惋惜的笑容

全世界有將近30萬名網友觀看了直播,見證了這一歷史!

OpenAI Five與人類職業玩家對戰中

人類隊伍:DOTA 2排名全球前0.05%的玩家

OpenAI這次對戰的人類隊伍由5名DOTA2大神組成:Blitz, Cap, Fogged, Merlini和Moonmeander,前三名都是世界頂級的Dota 2主播,第四位是前知名DOTA2職業玩家,最後一位則是現役職業玩家。

準確來說,這支隊伍並不能嚴格算「職業DOTA 2人類玩家隊伍」,但是他們對DOTA 2的了解以及他們所共同掌握的信息,都是巨大的資產,而且他們全部MMR排名Top 0.05%

AI在DTOA2中首次戰勝人類職業玩家——2:1

OpenAI的聯合創始人Greg Brockman一直在Twitter上直播這次對戰。

實際上,事情還有一些曲折,在2:0獲勝後,第三局對戰中,OpenAI Five一直不敵人類,但是堅持抗衡,還是對人類職業玩家隊伍造成了一定傷害。

尤其是在最後,AI(OpenAI Five)成功殺掉一個人類玩家的英雄。

不過,要知道第三局對戰的英雄是AI這邊是由現場觀眾選出的,AI對自己的勝率估計為2.9%……

實際上,在最後這局的整個對戰過程中,AI一直沒有太大的取勝希望。

因為在Dota 2中,選對英雄基本上意味著成功了一半。

第一局和第二局:成功戰勝人類!

但是,在第一局和第二局對戰中,OpenAI Five成功戰勝了人類。

實際上,在第二局對戰中,AI一直碾壓人類。

第二局對戰雙方陣容:

AI:巫妖,直升機,火槍 ;

人:牛頭,巫醫,影魔,死亡先知,隱刺

第一局對戰更是讓人想起了當年AlphaGo橫掃人類職業圍棋選手的模樣。

第一局對戰雙方陣容:

AI:巫妖,直升機,火槍,死亡先知,萊恩;

人:牛頭,NEC,冰女,剃刀,影魔

最後一局AI一方的英雄,由現場觀眾共同選出,相當於AI「放水」。選完後AI對自己的勝率估計只有2.9%。最終,人類選手勉強扳回一局。但這也無法改變AI的勝利。

最終對戰:取消大部分限制,英雄池擴大

7月19日,OpenAI在其官方博客上公布了他們在DOTA 2對戰上的最新進展。

此前,OpenAI Five與業餘人類的對戰(並且取得勝利)時,有較為嚴格的限制,比如不允許插眼,不允許打肉山,雙方陣容是相同的等等。

但在正式比賽中,很多這些限制都被取消了。此前,很多評論員認為實現這一進步至少需要一年的時間,但OpenAI用差不多一個月就做到了。

為了衡量OpenAI Five的水平,OpenAI Five與全球職業DOTA 2玩家進行了測試賽(5局3勝),職業人類玩家隊伍具體成員包括:Blitz, Cap, Fogged, Merlini和Moonmeander(平均7000分的大神)。

OpenAI團隊緊張觀戰

去年,OpenAI在DOTA 1v1 單人賽中擊敗了世界上最好的職業選手之一Dendi;今年7月,在特定規則下 5v5團隊常規比賽中又擊敗了業餘隊伍(天梯水平約為4000)。

在這次比賽中,OpenAI證明了他們的AI完全能夠達到TI8邀請賽參賽選手的水平!

實際上,從今年6月開始,OpenAI已經學習一些複雜的技能。很多DOTA 2玩家表示,插眼和肉山非常重要,如果排除這些因素,對戰並不公平。因此OpenAI教授了OpenAI Five插眼與打肉山,同時候選英雄池也增加到18個。

OpenAI Five正在打肉山

這次對戰的具體規則如下:

  1. 在18個英雄內進行BP,分別是斧王、冰女、死亡先知、撼地者、矮人直升機、巫妖、萊恩、瘟疫法師、痛苦女王、剃刀、力丸、影魔、斯拉克、狙擊手、斯文、潮汐獵人、冥界亞龍以及巫醫。(此前僅能使用固定陣容:瘟疫法師、狙擊手、冥界亞龍、冰女和巫妖)
  2. 禁用購買聖劍和魔瓶。(此前禁用的還有補刀斧、遠行鞋、知識之書以及凝魂之淚)
  3. 禁止使用幻象和分身
  4. OpenAI Five 方有五個無敵的信使,不過也禁止使用這些信使看視野以及承受傷害
  5. 禁止使用掃描
  6. 不再禁止打肉山(拉仇恨)
  7. 不在禁止使用守衛和使用隱身物品(消耗品及裝備)

OpenAI Five的反應時間已經從80ms增加到200ms

這個反應時間更接近人類水平,但是Openai Five的玩法並未出現變化,其遊戲水平的進步仍然是依靠團隊合作和協調,而不是反應。

在比賽開始前,人們曾對這次對戰的獲勝雙方進行預測。基本來說,是人類比AI為1.45:2.55——大多數人類都對人類獲勝不抱什麼希望

這次人類玩家能夠自由地從18種英雄中選擇5個組隊,是一大優勢。因為AI從來沒有遇見過這一點,對於人類如何組隊,也十分難以預測。

另一方面,從最開始兩局來看,AI選擇的英雄都是事先確定好的,可能在這幾個月訓練中已經很強優化,所以才能完虐人類。

而第三局,更換英雄後,馬上露出敗筆,從這個角度看,OpenAI Five還遠沒達到「solve dota2」的結果。

(特別感謝啟元世界對本文的支持)

推薦閱讀:

OpenAI發布強化學習環境Gym Retro:支持千種遊戲
AI計算力6年提升30萬倍,遠遠遠超摩爾定律 | OpenAI分析報告

TAG:刀塔DOTA2 | OpenAI | 人工智慧 |