如何評價 2016 年暴雪嘉年華上暴雪宣布《星際爭霸2》AI開源，並和 Deepmind 展開合作？

01-03

北京時間2016年11月5日，2016年暴雪嘉年華上，暴雪宣布《星際爭霸2》將和AlphaGo合作，並且《星際爭霸2》的AI也將進行開源，供更多的玩家和機構進行開發和研究。
相關新聞鏈接：暴雪宣布《星際爭霸2》AI開源並和人工智慧AlphaGo展開合作

星際爭霸本來就是AI的一個很好的試驗場，以前星際1印象中就有一些嘗試，但是這次和DeepMind的合作，顯然技術難度要更高一些：這次的AI跟人類是完全平等的。從DeepMind的公告中（https://deepmind.com/blog/deepmind-and-blizzard-release-starcraft-ii-ai-research-environment/）有幾點：

1、跟人類玩家看到的畫面是一樣的，沒有所謂的「API後門」。直接從原始畫面作為輸入（raw pixel），即讓AI直接理解畫面，沒有內部API給你調用，你需要自己去理解畫面上看到的各種單位代表的含義:

2、操作手速跟人類是一樣的！AI的操作速度，原文說是 within the limit dexterity of human APM，即不會出現逆天的作弊操作速度

這個基本上就是hard-core的人工智慧啊！技術上現實么？

如果熟悉DeepMind以前工作的話，你可能會發現這個跟DeepMind當年做Atari紅白機級別的遊戲是一個套路，直接從遊戲畫面，不教AI任何規則，直接讓AI通過很多很多次的 trial-and-error（試錯）的Reinforcement Learning (RL，準確的說，DeepMind搞的都是基於深度學習的Deep RL) 的套路，自己去試出最好的方法。因為不需要人工手動去教AI遊戲規則，DeepMind已經在近一半的Atari遊戲上做出了超過人類水平的AI

印象很深的就是BreakOut這個遊戲（中文翻譯打磚塊），在經過無數次的試錯學習之後，AI能自動學出來，獲得高分的最好方法，就是盡量把彈球打到磚牆的後面去：

鏈接地址（需要翻牆，或者搜索DQN Breakout）：https://www.youtube.com/watch?v=TmPfTpjtdgg=========================

最後，我一直很期待三國殺也可以做個類似的開源項目出來。當年上學的時候，收集了很多sgs replay文件，可惜不知道如何解密讀取這些文件；想嘗試從海量的牌局對戰的復盤裡面，能否讓AI自己學一些東西出來，比如根據某些玩家的出牌判斷忠反內，甚至判斷下一步應該怎麼出牌。

謝邀，那就再帶大家回憶一下好了。

==============================

180人口的暗本帶這波飛龍要吃AlphaGo的部隊輕而易舉啊。AlphaGo現在根本不敢推，四礦又沒開起來…

哎呀奶不死的啊這怎麼奶死嘛。ＭＤ老子是專業解說好嗎？這怎麼奶死嘛，專業解說看這種局面還看不懂啊？

180人口打120人口你有飛龍的情況下怎麼輸你告訴我？直接A臉都贏了。怎麼可能輸嘛換家穩贏ban，A 臉也贏了。不可能輸的…不可能的…

哎呀換他家啊，你別沖路口啊你~，你沖路口你讓我怎麼解說嘛。你等他下來再沖……

沖了，沖了沖了沖沖沖沖了沖了，讓你們看看什麼叫專業解說好嗎？直接騎臉了。什麼叫飛龍騎臉。

力場隔的好有什麼用嘛。

…欸？…別啊？！哎~！呀~！這解說不下去了，哎呀這！！呃啊~~

…為什麼會這樣？…別打那麼驚險吶~~你別害我呀！MD這個罪名我背不起呀！！我背不住這個罪名啊！！哎呀……

un~~believable~~我打你妹啊（數十秒的停頓）

讓我冷靜一下，讓我冷靜一下，讓我冷靜一下…讓我冷靜一下……這是個意外…這肯定是個意外，MD不可能出現的情況啊~！

180人口飛龍狗毒爆打120人口輸了我怎麼遭得住~~啊…

難道我真的是三鹿？哎呀你妹呀這…這以後我怎麼面對自己的人生啊？

===============================

反正我再也不會因為打不過電腦而感到羞愧了 (￣▽￣)"

多年以後我們會想起，末代人類WCS冠軍BYUN

星際2 AI的研究將徹底拉開人類攻克強人工智慧的序幕，AlphaGo只能說是前菜！

這個AI的實現非常非常困難，實現後的意義遠遠超過AlphaGo。並且具有非常強烈的軍事意義！

對於AI研究者來說，這是個百年不遇的機會！

天網：好懷念當年打星際的日子……

阿爾法狗虐完所有人類後，以後我們是不是得看ai打ai的比賽？各國各俱樂部招募各種叼炸程序員組成星際戰隊。。。

暴雪已經被從未來穿越回來的天網控制了。

現在天網要通過星際2學習軍事戰術，徹底打敗人類軍隊。

一支悍不畏死的機械大軍，加上有出神入化的軍事才能的統帥。

世界已經再度陷入危機，而這個世界需要英雄。

望有識之士助我一臂之力，現需300元買機票，20元買菜刀，8元坐地鐵。我不玩爐石傳說，更不知道什麼龍爭虎鬥加基森。

進化形成了這個星球上有情感和知覺的生命體

Evolution forged the entirety of sentient life on this planet

用的唯一的工具就是錯誤

using only one tool--the mistake.

你就是千萬億個錯誤的產物

You"re a product of a trillion of them.

上禮拜Deep Mind的負責人來我學校做過講座，有幸聽到了他們在video game領域的一些project。首先很多人可能會誤解讓AI學習打遊戲，以為是以前那種遊戲里的電腦AI，其實Deep Mind他們做的是不告訴AI任何遊戲規則，運用machine learning來測試和學習；而且AI所能看到的其實只是像素塊的移動，這樣一幀一幀的不同，就等於一個個不同的state，以此來探尋最優化。

目前他們在8bit的遊戲上已經取得了很大的成功了。

但是有兩點還不太可以：1. 目標只能是一個（要麼是快速結束遊戲，要麼是取得最多的金幣；想要同時做到兩個，結果就很差了）。玩過鬼泣的玩家應該知道，鬼泣的SS評價建立在各種因素之上：是不是滿血過關，所用時間，擊殺華麗度等等。我估摸著這種情況Deep Mind應該還無法解決。2. 無法通過訓練很多款遊戲，來讓AI無縫銜接一款類似的遊戲。比方說我是ACT高手，那麼遇到一款新遊戲，我自然會比其他人玩得好一點。目前AI還做不到這個，學習只能是一個遊戲一個case。

當然星際爭霸在難度和操作性上都比8bit的遊戲要複雜很多，所以Deep MInd具體會怎麼做，還是很有看頭的。

關於暴雪與谷歌的「星際Alpha Go」計劃，我覺得網易有位叫JBR的小編寫得很好。剛好昨天看到，轉載過來~

原文地址：9句話讓你了解暴雪與谷歌的「星際Alpha Go」計劃

在北京時間11月5日進行的2016暴雪嘉年華開幕式上，暴雪宣布了有關Deepmind人工智慧與《星際爭霸2》在未來領域關於AI人工智慧的發展計劃。

谷歌研究科學家Oriol Vinyals登台簡述了有關谷歌Deepmind人工智慧與《星際爭霸2》緊密合作的最新進展及未來的計劃，他透露，谷歌正在研製新一代的人工智慧，將在未來的《星際爭霸2》中為玩家、甚至是全人類帶來幫助，以及像不久前Alpha Go與人類對弈圍棋一樣，和人類挑戰《星際爭霸2》。

11月6日的暴雪嘉年華星際2人工智慧未來座談會上，暴雪星際2工程師Kevin Calderone與谷歌DeepMind團隊科研人員Oriol Vinyals具體講述了這個未來「星際2 Alpha Go」的具體計劃。

本文小編將用9句話簡單概括暴雪與谷歌的這項星際2人工智慧計劃，並用簡單易懂的語言為大家講解這項科學計劃。

谷歌的DeepMind團隊設計《星際爭霸2》「Alpha Go」的最終目的，並不是像圍棋那樣擊敗人類最強者，而是為了探索未來智能AI的研究方法。

Oriol Vinyals在演講中提到，雖然不久前DeepMind團隊研製出的Alpha Go和更早之前的深藍打贏了人類最強的圍棋選手，但目前他們研究的星際2人工智慧，不再只是以打敗人類這樣狹隘的目標。

DeepMind期望通過開發星際2的人工智慧，來研究未來人工智慧如何應對更加複雜化的環境，去針對現實生活中各種複雜情況作出正確的動作決策、應激手段等。

2011年，DeepMind公司創始人就曾宣布將挑戰《星際爭霸》的AI開發，但最後以失敗告終

也就是說，研製星際2的人工智慧是人類通往未來人工智慧社會的一個階梯，通過以「讓機器人學習玩好星際2」的課題，來探索未來研發高級人工智慧的方法。

圍棋的Alpha Go只會下圍棋，星際2的Alpha Go卻能做的更多

從早期的深藍電腦到Alpha Go擊敗圍棋高手，DeepMind為深藍和Alpha Go設定的目標僅僅是學會如何下圍棋，但僅限於圍棋範疇，所以即使這些人工智慧雖然擁有簡單的學習能力，但如果讓它們去嘗試玩最簡單的掃雷，都學不會。

因此DeepMind期望未來研發的人工智慧擁有更高級的學習能力，那麼讓人工智慧去學著打星際2，就是首先要突破的一個目標。對於機器來說，圍棋只局限於棋盤，只要機器擁有足夠強大的計算能力和「經驗積累」，那麼它們的圍棋水平就可以提高很快。

但對於星際2這樣的遊戲來說，則更加複雜，星際2並不如圍棋那樣能看清整個棋盤（地圖），眾所周知，星際2的開局地圖被戰爭迷霧所覆蓋，需要你去探索獲取對手的動態。

所以簡單的來說，相比圍棋，星際2有更多更複雜的環境互動，以及更多的動作指令。

當然，更高級的學習能力只是其中之一。讓星際2的智能AI不局限於腳本設計出的AI，還需要有記憶力、想像力和縝密的計劃。如何制定一個計劃以執行出戰術，在對手家探路偵查後如何記憶住獲取的信息並處理，這些都是基礎。打好星際2的另一個關鍵性因素，就是知己知彼。一個出色的星際2選手，他在運營操作自己陣營的同時，還會同時判斷對手此時的動態，如果星際2的智能AI想要變得強大，就需要像一流選手這樣擁有一定的想像力。

未來的「星際2 AlphaGo」並不是操作非人類的「變態難度」對手

許多人提到未來星際2的Alpha Go，都會想到「悍馬2000」。這個AI是之前玩家研製出的一種腳本AI，這種腳本AI能夠計算遊戲內的數據從而完成逆天的操作，比如機槍兵可以完美的一邊分散後退一邊甩槍，完成人類根本不可能完成的操作。這種操作對於只有兩隻手、肌肉反應和動作有限的人類來說，就算你苦練一百年，也無法做到。

所以對於之前「Alpha Go」和人類對決星際2的計劃，大部分人的第一印象都是一個APM10000的機器人用各種逆天的操作和10線騷擾吊打人類。

請注意，這毫無意義，也並不是DeepMind想要研發的星際2 Alpha Go的目標。正如前文所說，谷歌的這項計劃，更多的精力會投入在如何讓Alpha Go學習打星際2並提高、應對星際2中複雜的戰局情況。

星際2傳統AI、我們心目中的「星際Alpha Go」以及谷歌期望的「星際 AlphaGo」是有明顯區別的。

我們先前說到了谷歌目標研發出的「星際2 Alpha Go」是不同於大部分人想像中那樣操作逆天AI的。它不會有逆天的操作，只會有和人類一樣甚至超出人類的學習能力。

暴雪工程師Kevin Calderone動畫展示星際2中AI的演算法

那麼谷歌和暴雪共同研發的這款人工智慧和現在星際2遊戲里的AI電腦有什麼不同呢？

暴雪星際2的工程師Kevin Calderone解釋道，暴雪目前在遊戲里設置的電腦AI是工程師們基於腳本設計出的，說到底，遊戲里的AI還是十分死板，按照工程師制定的演算法和玩家進行遊戲。他們並沒有學習能力。

為什麼選擇《星際爭霸2》，因為它的難度和複雜程度有助於研究未來AI用於現實世界

不過有些事對於人類來說非常簡單，但對於機器人來說卻非常複雜。

比如Oriol Vinyals今天來到暴雪嘉年華演講，他只需要準備一份演講稿就可以了。而對於機器人來說，它需要先被植入一個上台演講時間的腳本、制定一份如何走到講台正確位置的路線等等。對於人類來說，他可以聲情並茂的演講出核心思想，知道哪些地方需要著重脫稿講述，必要的時候還會下意識的作出一些手勢讓演講更加精彩。而機器人恐怕很難做到這點，至少如今我們所能研發出的機器人，他只會生硬的朗讀演講稿。

這就是谷歌研究未來人工智慧的一個攻堅舉例，當然這和星際2有什麼關係呢？

DeepMind選擇星際2作為研究的原因：

戰爭迷霧、操作空間、經濟運營、及時性遊戲、大局觀、三個不同種族的互相對抗

星際2是當今世界上最複雜的一款即使戰略遊戲，運營流程、戰術運用和針對、應激性操作這些不僅難度高，而且不像圍棋那樣套路固定，它需要根據對手的情況作出不同的改變。就如同搏擊一般，招數只能讓你掌握基礎，而實戰的千變萬化則需要你通過經驗的積累和紮實的基本功來千變萬化。

所以對於DeepMind團隊來說，這款遊戲作為人工智慧研發平台再適合不過了，人工智慧在未來現實生活中想要幫助人類解決情況，自然會有許多難以預測的突發情況，所以它們必須要既作出正確的對策，還要根據實際情況細微的調整對策。

「星際2 Alpha Go」也會和人類一樣犯錯、糾錯、學習、分析戰局，然後變得更強

既然DeepMind提到了「通過星際2研發未來更高級的人工智慧」這個偉大的目標，那麼他們必然還會有更多複雜的技術攻堅。Oriol Vinyals說，他們將要研製的星際2人工智慧，首先得學會如何去學會玩這款遊戲，比如和新手玩家一樣最基本的造兵、採礦發展、用什麼樣的戰術、針對對手的戰術。

星際2目前的AI可以指定多種戰術，但都基於工程師腳本設計

接著就是如何做出更高級的動作了。這也是人類區別於其他動物或機器人的最顯著特點，什麼樣的地圖用什麼樣的戰術，什麼樣種族的對手用什麼樣的戰術、什麼情況下適合快攻或是運營發展，這些概念化的東西則需要讓人工智慧和人類一樣擁有學習和分析功能。想想都覺得好難...

所以，既然這款星際2的人工智慧得核心是擁有學習能力，那麼它一開始必然是個菜鳥，所以也會和人類一樣犯錯，但也會像人類一樣糾正錯誤，去分析自己輸在哪裡，如何糾正錯誤，作出更加正確的決策，改進自己的應對策略。

讓「星際2 Alpha Go」更加擬人化，也是DeepMind非常樂於研究的方向

前文也提到了這款人工智慧會和人類一樣犯錯，當然在其他方面，DeepMind也更加期望人工智慧在未來能更加像人，這樣可以讓在未來一天星際2的Alpha Go和人類頂尖選手挑戰時更加公平。

所以DeepMind希望能像人類那樣擁有一些生理機能上的限制。除了APM（每分鐘操作數）限制到和人類相當，在精力分配上也盡量做到擬人化。比如說，此刻你的頭腦一定不會去注意感知手上戴著的手錶或是脖子上戴的項鏈。所以即使是世界上最強大的職業選手，他也無法保證時時刻刻能關注到比賽時戰場上的每一個點，所以有時候他們也會因為精力分散而忽略一些地方的戰局，比如過一段時間才會去拉走被對方騷擾的農民。DeepMind也希望能努力研究出這樣擬人的犯錯，而不是機械化的無時無刻對所有情況都作出應激反應。

研發「星際2 Alpha GO」不僅可以當你的星際2教練，還可以在未來做你的生活助理

既然未來這款星際2人工智慧這麼牛掰，那麼自然它不僅可以和你對抗，還可以教你如何打好星際2。它在未來可以為你分析你在玩星際2時的不足，幫助你提高，成為你的星際2教練。

當然，有了這樣的技術手段，未來DeepMind也就很容易研究出在現實世界中也可以輔助你的人工智慧。成為你的生活助理，就像星際2中的人類副官。

Oriol Vinyals通過自己的谷歌公司舉了個簡單的例子，未來可以讓人工智慧協助維護谷歌公司的伺服器，以節省更多的能耗。但小到一個擰緊閥門蓋的動作都需要人工智慧作出及時的判斷——閥門蓋鬆動到什麼程度，需要多大力氣以及讓閥門蓋擰緊到什麼程度這些都是視情況而定的，而無法通過固定腳本設定，具體怎麼做？先從複雜的星際2里找答案。

現在「星際Alpha Go」的研究進度才剛剛起步。

為了探索未來更高級的人工智慧，DeepMind選擇從遊戲切入，並列為主要研究方向，在此之前，DeepMind從最簡單的紅白機遊戲開始嘗試，讓人工智慧學會並精通簡單的紅白機遊戲，再到複雜的3D遊戲，最後再到複雜的《星際爭霸2》。DeepMind在遊戲中慢慢讓人工智慧學會通過像人類那樣的記憶、空間想像能力來提高遊戲水平。

但對於研發出星際2的Alpha Go來說，Oriol Vinyals則表示DeepMind才剛剛起步。谷歌與暴雪目前已經開始緊密合作，他們聯合打造了一款協助研究這種星際2 Alpha Go的工具，並把研究成果開放給全世界的研究人員共同研究。

更值得我們讀者注意的是，即使你不是科學家，而只是一個星際2玩家，不久之後也可以通過在遊戲中來給暴雪提供反饋數據，協助星際2的Alpha Go學習提高。

在2017年第一季度，暴雪將想會在星際2中推出API工具包，通過玩家進行遊戲的反饋來協助AI的腳本開發。

未來人類和無數「Alpha Go」一起參加星際2比賽不再是夢

沒錯，如果未來真的成功研發出星際2的Alpha Go，那麼成為你的教練、甚至批量生產成為你在比賽中對手自然也不再是夢。也許未來的星際2比賽將不再是韓國選手與非韓選手的大戰，而是人類與智能機械的大戰。這點倒是很像《守望先鋒》中描述的人類與智械大戰。

AI智能與人類在星際2上更多的互動未來不是夢

開個有趣的玩笑，如果未來真的有一天人工智慧統治了星際爭霸2，請不要忘了，這都源自今天的我們通過API工具包為它們的提高提供了幫助...

（註：DeepMind目前並未命名未來星際2的智能AI名字，因此本文所提到的「星際2 Alpha Go」旨在助於讀者理解）

本文來源：查爾星港責任編輯：陳傑_NG2621

ps：如果真的實現了，人工智慧技術真的很成熟了。離」深入尋常百姓家」也不遠了~

或許我們有生之年還看不到AlphaGo指揮著機器人大軍消滅人類。畢竟AlphaGo離科幻小說中的人工智慧還很遠。

但是當AlphaGo戰勝星際最強的人類代表後，它在真實的戰場上的表現又會如何？它需要多久才能超越人類最強的軍事指揮官？

這不是龍族裡的eva了嗎！

看來李永菜又要重出江湖了

現實版的智械戰爭：AlphaGo Vs 黃旭東

如果Alphago拿來指揮無人機…… @牢不萌

「哎，我家這孩子以前天天打遊戲，最近竟然開始自學編程了，你說怪不怪？」「啊？這麼一說我昨晚還錯怪我兒子了，我就說怎麼寫一會程序就跑起遊戲來了，還狡辯說在跑程序。」

我就想看看機槍滾毒爆的第一視角╮(‵▽′)╭

我就想知道阿法狗限制APM值不限制，限制的話還好說，不限制的話，玩個蛋。

放心，絕對奶不死。

以後BN前十名分別是阿爾法0?9

我記得黃旭東之前說自己單手閉著眼都能打得過阿爾法狗（手動滑稽）