人類一敗塗地!OpenAI血虐Dota2半職業戰隊!
來自專欄玩轉AI12 人贊了文章
北京時間早上5點58分,人類半職業Dota高手隊對戰OpenAI Five第二局接近尾聲,被稱為「大老師」的dota plus大數據對人類戰隊宣判了死刑。
它說,AI勝率100%。
6點整,人類第二次打出GG(good game,投降),AI宣告勝利。
這是OpenAI Five首次在5v5戰局中,對上職業選手。今天的人類代表隊由職業和半職業選手組成,在舊金山和AI展開三局兩勝的廝殺。
一方是「從未輸給過人類職業選手」的OpenAI Five,另一邊,人類戰隊中的現役職業選手MoonMeander也在Twitter上高調宣布「從未輸給過bot,這次也不會」。
事實證明,這個Flag立得太高。
AI以碾壓之勢,連勝兩局。加上正賽前,AI已經碾壓了兩局現場觀眾玩家,整個對戰AI的過程中,人類陣營可謂一敗塗地。
最後一局,改了規則。AI一方的英雄,由現場觀眾共同選出,最後得到一個奇葩陣容。人類玩家靠這種方式,勉強扳回一局。但這也無法改變AI大獲全勝的事實。
總有人把OpenAI的勝利,歸功於已經退出董事會的Elon Musk。對於今天的勝利,鋼鐵俠怎麼說?我們最後揭曉,先說正事兒。
4局被碾壓,1局挽尊
正式比賽之前先進行了兩場OpenAI Five對觀眾的娛樂賽,毫無懸念,均以人類失敗告終,AI拆塔如入無人之境。其中第二場比賽9:28分人類上路高地塔告破,不到14分鐘,觀眾隊就輸給了AI。人類先折兩陣。
不過,後面職業選手的比賽也沒有強多少。
正賽第一局
由於只有18個英雄,正式的比賽雖然有BP,但大家只是象徵性的BAN了一些18個英雄之外的英雄。夜魘的人類選了小牛、瘟疫法師、冰女、剃刀和影魔,天輝的AI選了巫妖、飛機、火槍、DP和萊恩。
一開始,merlini的剃刀越塔送了一血,AI在各路拿下5個人頭後,人類終於拿下一個,此時AI勝率94%。一波團戰後,人頭變為AI 9:3,勝率給到了AI勝99%,象徵性的給人類留下了1%的尊嚴。
之後,AI開始了瘋狂的推塔進程,四一分帶,巫妖一人推掉上路一塔,其餘4人滅掉人類對手,推掉下路一塔。隨後,野區爆發一波團戰,AI前後夾擊,將被包圍在中間的三人統統滅掉,旁邊的一人也殘血逃命不及被補刀,此時已進行到13分鐘,人頭數22:4,AI經濟領先5k。
1分鐘後,下路2塔告破。隨後,人類終於認真配合,四人包圍抓了一個巫妖,然而就在此時,AI隊其餘4人推掉了上路高地塔,人類趕回家救塔,blitz的影魔完成本場人類唯一亮點操作,完成雙殺。然而無濟於事,AI已經開始醞釀最後一波團戰了,他們衝上中路高地塔前,越過人類小牛的阻礙,越塔拿下2個人頭後,淡定拆塔。
最終,人類gg,以8:30慘敗。
這一場彷彿人類完全沒有配合,彷彿被割韭菜一樣推掉。惹得直播間彈幕驚嘆:這哪是排名1000名左右的高手,簡直像新手一樣被虐。
正賽第二局
這次人類在天輝一方,選擇了巫醫、影魔、小牛、死亡先知(DP)和隱刺,夜魘AI選擇的是巫妖、火槍、萊恩、冰女和飛機。
第二局的人類似乎稍微有出息了一點,拿下一血,人頭屬於影魔,甚至還推掉了一個塔。AI的勝率成功被堅強抵抗的人類壓低了……1個百分點,降到了98%,甚至開始時,人類經濟都領先了1k。
AI被人類拖到了20分鐘才開始推中路高地塔。然而這點「優勢」沒有持續多久,AI如拆遷隊一般,推完中路後迅速去推下路,緊接著趕去了上路,開局25分鐘,上路塔被拆,人類本局終於沒有機會了。
三局兩勝下,也意味著這場比賽人類還是輸給了AI。而且人類和AI之間的差距,實在是太大、太明顯。
正賽第三局
既然AI已獲兩勝,第三場就變成了娛樂局,由人類觀眾來「刁難」OpenAI Five,為他們選出5個英雄。人類選手MoonMeander為了一雪前恥,號召大家選5個脆皮來噁心一下它們。?
所以,人類觀眾們給AI選出了小魚、斯溫、斧王、隱刺和痛苦女王這樣的陣容,而人類則拿到了絕對優勢的死靈法、萊恩、飛機、DP和巫妖。
這套陣容勝率怎麼樣?
沒開打之前,預測勝率為2.9%……
一開場,5個脆皮的劣勢陣容果然很有用,至少在經濟上人類狠狠地壓過了AI。
△ 綠色為人類的經濟
可憐的AI斧王辛苦賺錢養家,不但沒有突破經濟限制,甚至還從全場第三掉到了全場第四。
開始的十幾分鐘里,AI還在努力的拿人頭,取得了比分上的暫時領先。不過很快,被人類選了5脆皮陣容的AI自知團戰打不過,只好選擇猥瑣帶線,悄悄偷塔。
比賽進行到14分鐘,人類終於追評了比分,14:14平;2分鐘後,人類在草叢堵死了一隻小魚,終於獲得了優勢比分16:15,AI勝率跌到了8%。
22分鐘,人類27:16,AI終於被大老師判了死刑,勝率只有1%,而經濟也被人類壓了8k。
絕望的AI拚死一搏,無腦帶線,以1人換1塔的精神,義無反顧衝上人類的塔下,被人類狠狠的包圍,群毆一頓。
29分鐘,人類終於開始推高地;5分鐘後,人類推掉中路高地塔,AI還不放棄,悄咪咪搏命偷塔(未果);2分鐘後,人類終於推掉AI的基地,以絕對壓制的陣容取得了唯一的一場勝利。?
整個比賽過程中,不斷有圍觀群眾質疑著人類選手的段位。
這支被AI虐殺的人類隊伍,按照OpenAI的描述是99.95%以上。如果看MMR(匹配分,約等於天梯積分),都在6500以上,天梯排名最低的也只有1000名出頭。
他們是:
- William 「Blitz「 Lee:Dota2解說,前職業選手、教練。
- Austin 「Capitalist「 Walsh,簡稱Cap:Dota2解說,曾經與Gamer University、Vegetables Esports Club等戰隊打過半職業比賽。
- Ioannis 「Fogged「 Loucas:曾經是職業戰隊Steak Gaming、半職業戰隊Vegetables Esports Club選手。
- Ben 「Merlini「 Wu:前職業選手,退休解說。
- David 「MoonMeander「 Tan,加拿大戰隊compLexity Gaming的職業選手。MoonMeander是本次人類戰隊中的唯一一名現役職業選手,也是OpenAI Five對戰的第一個職業選手。
AI一日200萬場比賽訓練
OpenAI一路贏得輕鬆,現場觀眾的呼聲幾乎全是送給AI的。
看直播的小夥伴里,則有人對AI全程摩擦人類的贏法表示失望。
「懷疑」OpenAI請了群演的,不止一人。
可被按在地上摩擦的人類,也很絕望啊。
來自人類戰隊的MoonMeanderated發推說,AI一天能打200萬場比賽呢。
人肉訓練的強度,真的沒有那麼大。
與此遙相呼應,中國網友的表達,就更直接一點。
大意可能是,AI學了180年,每天200萬把,比人類厲害不意外,比人類菜就是真菜了。
另外,關於賽前OpenAI宣布把智能體的反應速度,降到與人類接近的200毫秒,這件事……
看了比賽的觀眾,似乎並不買賬,強烈質疑官方宣傳的反應速度有假。
Reddit也這樣說。
對於同胞的戰敗,人類心有不甘。
也有人擔心,DotA終究會是AI的天下。
好在第三局贏了,雖說有些「小人得志」。刷彈幕的小夥伴們已如願,可以洗洗睡了。
AI挑戰職業選手靠什麼?
目前已知的情報是這樣的:
OpenAI訓練Dota選手的方式,是讓AI從隨機狀態開始,依靠自我對局來優化。
這支AI隊伍長這樣:
簡單來說,每個選手,也就是每個智能體(agent),都是一個包含1024個節點的單層LSTM(長短時記憶網路),能夠通過V社(Valve)的Bot API觀察當前遊戲狀態,控制英雄去移動、攻擊、施放技能、使用道具。
智能體能夠觀察到的信息和人類差不多,包括自身、隊友和敵人的狀況,比如位置、血量、攻擊力、護甲、攜帶物品、能力等等。
這些信息,對於智能體來說是一個包含20000數值的列表,而它判斷之後發出的行動指令,是8個值的列表。
選手們的訓練,使用的是擴展版的近端策略優化(PPO)方法,這也是OpenAI現在默認的強化學習訓練方法。這些智能體的目標是最大化未來獎勵的指數衰減和。
去年訓練1v1 AI的時候,OpenAI針對卡兵的操作專門設置了獎勵,在5v5版本中取消了。不過,5v5模型還是藉助其他獎勵信號學會了卡兵。
AI選手們在訓練中飯量驚人,承載它們需要256塊P100 GPU和12.8萬個CPU核心。
上面的5v5版本與1v1版本對比,有一個令人欣慰的結果:OpenAI Five需要的CPU和GPU計算力,與去年擊敗Dendi的1v1版相比,並沒有翻到5倍。
OpenAI說,AI每天的訓練量,都相當於人類打180年遊戲。來自人類戰隊的MoonMeanderated說,AI們每天要打200萬局Dota。
5個智能體訓練出來,它們之間又是怎樣配合的呢?總不能像我們人類開黑一樣互相喊話吧?
答案是,他們之間沒有那種人類可以理解的溝通渠道,而是由一個「團隊精神」超參數來統一控制。這個超參數的範圍在0到1之間,決定了選手對與自身獎勵函數和隊友平均獎勵函數的關注程度分配。
OpenAI操作也一樣是通過bot API,能夠移動位置、攻擊、使用道具,根據獲勝、血量和補刀情況得到獎勵。
從誕生到對戰職業選手,這隻AI走過了一年半的成長之路。
從1v1版本算起的話,它最早誕生於2017年3月,去年8月在TI7上一鳴驚人。只訓練了兩周的AI,影魔中單1v1完敗頂級職業選手Dendi。
質疑之聲也不少,最核心的吐槽在於,1v1的難度根本不能和5v5相提並論,而且這個AI會用的英雄,也只有一個。
當然,AI進化得比人類選手快得多。
時隔不到一年,AI在今年6月掌握了5v5技能。6月26日,OpenAI Five出現了,它掌握了5個英雄,能在做了各種限制的5v5 Dota里,擊敗MMR 4000-6000分的強大路人隊,但面對MMR 4000-5500分、有團隊訓練的隊伍,就沒能取勝。
過了一個月,這個AI掌握的英雄數量增加到了18個,遊戲的限制也只剩下沒有召喚單位和幻象、沒有聖劍和瓶子、沒有掃描、依然需要5隻無敵信使。
另外,OpenAI還把AI的反應時間從原來的80毫秒拉長到了200毫秒,不在反射弧上占人類便宜。
7月24日,離直播還有不到兩周,OpenAI Five和5位MMR在5000到6500的選手打了4場,2勝2負。
gdb說,他們的團隊分析了比賽中的失誤原因,在AI的訓練中做了一些調整。比如說,去掉那些1v1時代遺留的腳本寫下來的邏輯,除一除bug,增加一些隨機選擇。
然後就有了今天這場對決。
向AI圈的世界盃進發!
這場對戰之後,OpenAI Five就邁進了下一個階段:向著Dota圈的世界盃,頂級賽事TI8(The International)進發。
之前,GDB說想通過這次比賽,看看有沒有希望在8月底之前達到TI(The International)大賽上頂級職業選手的水平。
現在看來,我們只能寄希望於頂尖人類戰隊,來與AI一戰了。
沉默的鋼鐵俠
每次OpenAI取得進展,AI在Dota2戰場斬獲勝利,總有人將其歸功於伊隆·馬斯克。中外概莫能外。畢竟,馬斯克是OpenAI的創始人之一。
不過今年2月,鋼鐵俠已經退出OpenAI董事會。
2015年,馬斯克與YC董事長Sam Altman、天使投資人Peter Thiel等一起創立了OpenAI,對標DeepMind。然而眾所周知,馬斯克對於AI發展的態度,十足悲觀,是地球上知名的「AI威脅論」持有者。
對於今天的勝利,Sam等公開表達了祝賀。
而馬斯克看起來內心毫無波瀾,甚至都沒有想笑一下。話癆一般的他,沒在Twitter上主動提一句這件事,只是悶頭說特斯拉Model 3。
當然,有人問他支持誰,馬斯克只是簡單地回復了兩個字:
「人類」
相關資源
視頻片段:Sina Visitor System
完整錄播: Twitch
B站直播:嗶哩嗶哩直播,二次元彈幕直播平台
知乎討論:如何評價 OpenAI 在 8 月 5 日 dota2 中擊敗人類 7000 分路人隊伍?
文章轉自: 人類一敗塗地!OpenAI血虐Dota2半職業戰隊!馬斯克僅評價了兩個字
推薦閱讀:
※DOTA 2 用灰燼之靈打輔助為什麼會經常不被理解?
※如何評價北美賽區為了爭取直邀名額而故意換人 退賽的行為?
※dota2 1到5號位都分別是怎樣的定位?
※如何打好中單沉默術士?