如果AlphaGO級別的AI去玩爐石傳說,會怎樣?


1.如果一直打天梯,並不斷總結經驗,根據環境不斷完善套牌,勝率絕對會超過百分之五十,經常登頂,但不會一直登頂。
2.會大致總結出每個職業在當前天梯環境下最強套牌。
3.我們極有可能會發現我們忽視的一些很nb的卡牌。
4.讓設計師們明白那些牌該削弱了,233333
5.讓兩個這樣的機器自己對戰,會發現爐石傳說先手優勢價值是否達到或超過一張牌和一個硬幣的程度,設計師可以改變遊戲規則,並繼續演示並找出更合理的後手補償。
6.在ai眼中有一張無可替代的神卡,我們叫它「北京龍」。

-------↑20160311第一次回答~↓20160313更新------

沒想到獲得這麼多贊,還以為沒人會看呢,謝謝大家,先解釋一下結論
1.勝率會超過百分之五十,很好理解,根據環境不同而改動卡組這一點,對有學習能力的人工智慧而言很輕鬆。但為何不會一直登頂,原因是爐石相比圍棋而言更加不穩定。但相比更加不穩定的石頭剪子布而言還有一些穩定的套路在裡面。至於為何會經常登頂,我在下文解釋。
2.某職業ai一直帶a這張牌,那麼就說明當前環境下a牌不虧~
3.ai突然帶了冷門的卡一段時間,沒有換下來,那麼這張牌有很大潛力(別跟我說北京龍他不算)。
4和6不解釋
5.這一點是我最想探討的地方,在下文說

說實話,我很討厭神抽論,把一切有關神抽的話題都當做娛樂的段子來看,看到了哈哈一樂。對卡組強度提升沒有任何價值。把自己打不上天梯的罪責全都推到對面神抽身上,不說自己打的場數少也不考慮自己卡組強度,我不敢苟同這樣的思想。
要知道神抽建立概率上。
買彩票中大獎的天天見,只靠彩票發家致富的我沒見過,估計那些人都餓死了吧。可能有人會說爐石神抽的概率遠遠大於彩票中獎,那麼我們不妨將彩票中獎率提高,但總獎金不變,會有人靠買彩票掙錢么?再對比一下炒股,不知大家是否明白了什麼,靠炒股能掙錢原因是經濟經常是增長的,而不能靠買彩票活著原因是獎池總金額小於大家買彩票花的錢。
靠神抽獲勝是有前期卡牌的鋪墊的,同樣也跟卡組構築有關,卡組實在差的不行,又有多大可能會出現神抽。

接下來我進行一下AlphaGo級別的評估,大概判斷了AlphaGo在圍棋上到底強到什麼程度才能對應看出同樣級別的在爐石上強到什麼程度。
下第一局前很多人說AlphaGo導入的是舊棋譜無法適應新棋形,李世石下了新棋形
AlphaGo:你看我下的咋樣
李世石:你擊敗了我
下第二局前很多人說,李世石好好下就能贏
AlphaGo:我也好好下
李世石:這次是你贏了
第三局前,大家說,AlphaGo不會打劫
AlphaGo:打劫就打劫唄
李世石:打得好,我認輸
綜上我們了解到了,AlphaGo具有學習能力,面對自己沒見過的環境也能做出很好的應對。
所以AlphaGo級別的ai,從第一局和第三局可以看出,在面對天梯黑科技等也能做出較好的應對,第二局也可以看出對於常見卡組也有很不錯的表現。

接下來說一下我個人所看到的爐石和圍棋的區別
1.信息不公開性
對於對方有什麼手牌,ai不知道只能靠曾經對局以及對方是什麼職業來猜,然後根據局面以及曾經的對局來算對方有什麼牌的概率,這些計算相比圍棋而言還是比較簡單的。不過,對於不公開信息的處理是AlphaGo所沒有的功能,不過降低AlphaGo計算能力以使其獲得不公開信息的處理能力,讓這樣的ai算得上跟AlphaGo同等級不算過分,大家應該可以接受吧~
這裡亂入一段,可可認為是呈上啟下的一段。不久前deepmind公司也在以星際爭霸為研究對象製作人工智慧,不知大家是否想過為什麼。個人認為這個公司是在看ai對於不公開信息處理能力如何,如何把我們看來難以計算的東西數據化,哎呀,本人才疏學淺想想都難,對於為何不找爐石我感覺因為下面一點原因——隨機性。
2.隨機性
我雖然沒玩過星際,但星際隨機性遠遠小於爐石感覺大家都能認同。

這裡我解釋一下ai為何會經常登頂,大家想想,能夠根據環境配置套牌,能夠比我們更容易理解爐石上的隨機,人會因為時間匆忙做出錯誤決定,而ai不會,暫定ai勝率達到百分之八十五貌似不為過。ai每天打24小時每天出現三次20連勝就會第一好像也不過分(本人沒進過前100不太了解這幾個數字是否準確,反正權且這麼定吧,錯的不太離譜就不改)
ai20連勝的概率=0.85^20=0.03875953
百分之三概率貌似很低好像不應該說「經常」登頂。
每天三次一個月90次
一個月沒登過頂的概率=0.028502581
每個月基本上都能穩定登頂相比算得上經常登頂了。神抽什麼的對於ai沒有任何影響,卡組好決策對ai也能神抽。

對於ai進入爐石的意義我感覺我之前說的那5點就第五點有意義。其他四點我沒看出來有什麼用。1、在天梯瞎混對我們沒啥好處,並不能增強我們遊戲體驗。2、3、4我感覺總結套牌發現被忽視的牌都是遊戲過程,ai把部分遊戲過程搞丟了不好。
對於第五點我感覺對所有回合制遊戲都一樣,先手優勢到什麼程度,怎樣給後手補償。就圍棋而言,時至今日,圍棋先手貼六目半合理還是七目半合理還存在爭議。我們很容易就能明白現在黑棋貼目明顯就比曾經不鐵目更合理,遊戲體驗也更好。如果在每個回合制遊戲發布前都設計個小ai測試一下給後手什麼補償使遊戲更合理,想想對回合制遊戲就有很大的推動作用,但是畢竟ai造價高,普適性差不能一個ai測多個遊戲,目前無法實現。希望能夠有造價低廉且對於回合制遊戲普適的ai儘早出現吧。(我感覺我有生之年見不到)

說實話我沒想到這麼快ai就能達到這種水平。新時代的列車就是這麼快的滾滾從你的身旁經過,如果你眷戀現在的天空而不願探尋前方更美麗的彩虹,那麼註定會被新時代的列車狠狠的碾壓。
最後留給大家說一句話共勉:「新時代的列車就要來了,沒時間解釋了,快上車!!!」


「alphago因為連接斷開輸掉了這場比賽」
「經爐石傳說服務商認定,alphago已經嚴重違反爐石傳說服務條款,使用未經認證的輔助程序進行遊戲…該帳號將被封停,詳情請諮詢客服」


先說結論是這樣…打天梯肯定上傳說…
但是打比賽就應該不會像下圍棋那樣零封對手了。

畢竟爐石隨機性比圍棋大多了。


有些東西。真沒法算。
比方說阿爾法狗場面大優,解收割機出末日…
比方說阿爾法狗場面全是2血,四驅車救命…
比方說阿爾法狗場面大優,傳送門出大下巴清場…
比方說阿爾法狗5費20滴血,熔岩元氣彈一發入魂…
同福亂斗同福爆破什麼的就不說了。


發牌員就是不給面子你怎麼算能贏?
天胡德是不是吊打變臉德?
機械法2費鋪滿場你怎麼解?

再者說。我是獵人。你場上一個4血,一個2血。我空場掛奧秘,奧射打4血的。
是不是按概率算我掛的是爆炸?
對不起,我詐你。我只有個毒蛇能掛。

程序都是算概率。但人可以賭嘛…


很容易就成為最強的爐石傳說選手。
但是然並卵,還是能被天梯5級的選手乾死。
畢竟這遊戲,還是太看運氣了。


這你只能指望阿法狗出現同福爆破同福亂斗、老夫還有傑克遜然後傑克遜被爆掉、各種收割機出末日出周卓、連環爆裂打最低等等隨機性比較高的逗魚時刻素材。


AlphaGO:雖然我這回合打不死他、但是他已經沒有手牌了、只要我把它場上的怪全解了就穩了、我就不信他還能神抽張炎爆扌


牌類遊戲和棋類是很不一樣的。因為牌類的隨機性。所以圍棋的AI將來可能發展到對陣人類勝率99%甚至100%,但爐石是不可能的。

雖然如此,但爐石AI要超出現有所有人類玩家的水平,是很容易的。恕我直言,圍棋是職業性很強的競技遊戲,職業選手大多經過十年以上的刻苦訓練,還有數百年的前人研究為基礎;而爐石只要有幾個月的遊戲經驗,大家都可以打得很好。我沒有參與過職業比賽,但天梯上經常遇到職業玩家,排名超過他們,甚至競技水平超過他們,並不是件多麼困難的事情。因此對AI來說,比最強的人類要強可能不費吹灰之力。

舉個例子吧,電腦可以瞬間完成很多人類無法想像的判斷。比如該不該解收割機的問題,電腦可以瞬間列舉出可能導致崩盤的隨從(吵吵,米爾豪斯,末日之類的),可以做出概率上的絕對最優判斷。該不該解場,怎樣解場,對方有哪些手牌會崩盤,神抽的概率有多大。這些判斷方面,電腦較人類要優秀得多。

另外,如果有大數據的支持,電腦的天梯水平更是會超出常人很多。因為它能針對大多數人的牌組來判斷,為了組牌也可以進行大量模擬,而不像人類更多依據主觀感覺。我去年天梯的勝率是56%,很多職業選手在57-58%,我相信電腦可以輕鬆達到2/3以上。

當然,爐石的AI設計起來應該還是頗有難度。他需要完成自己組牌,判斷對手牌組,起手留牌,判斷對手手牌,打牌,根據環境調整卡牌等不同方面的工作。儘管他在打牌時的選擇不多,但抉擇所需要考慮的因素還是很多的,因此程序寫起來會很瑣碎,工作量也是極為龐大的。

最後,儘管AI可以很容易地比人類做得更好,但AI的確會在有些方面可能不如人。比如手牌推斷這種可能包含欺騙性的行為的地方。如果人類了解AI的機理,很有可能可以通過某些手段欺騙AI。一個典型的例子是呼啦博弈,人類可能在打出呼啦是最好選擇時仍然保留呼啦,這點電腦可能不會明白並因此作出錯誤判斷。

以上。


1、黑騎砍佛丁虧不虧終於有定論了。

2、「這個回合有點難,我們來看看電腦會怎麼選擇。」

3、可以訓練出,具有幾千萬盤經驗的咆哮德、T7獵,但是電腦肯定學不會組牌。

4、上個傳說什麼的沒問題,想要和人類爭勝,基本沒戲。


絕壁會先學會「打得不錯」和「抱歉」。


mark,在寫關於這個的小說,先編一個小段子。
黃金賽廣州站大家都看了吧?表演賽里小魚魚各種神抽,而且下了逐星馬上盾過藏寶圖過猴子,挖寶之後還挖到了表演賽前就在問「一張牌怎麼解」的霍格,這種種巧合,真的可以被稱之為巧合么?
毫無疑問,其實並不是,暴雪是在實驗他們能否遠程控制指定的一盤爐石比賽,為了就是幾年之後,當阿爾法狗來挑戰爐石時,暴雪可以通過遠程控制給人類選手最大的便利,讓人類保住最後一塊遮羞布。


如果天梯不是月結束 只要打得盤數足夠多 什麼ai都能上傳說


帶有運氣性的遊戲不會那麼強,但是邏輯分析不會出錯,大量遊戲勝率超過人類,如果面對面遊戲的話,給alpha加入情緒感知,紅外線探測心跳等,電腦會強到可怕。


然並軟。
還是打不過無腦678的佛祖騎。


在被人類運氣碾壓多次後,Alpha爐石決定每局都帶時光龍。


我只想知道,在AI看來,黑騎砍佛丁到底虧不虧…


如果AlphaGO級別的AI去玩爐石傳說,會怎樣? - 劉澤放的回答 的答案說得很好了,大部分都很贊同。其實現在橋牌的 AI 發展也不錯,爐石則已經有好多個 Simulator 和 AI 了: Projects | Hearthstone AI Central。

另外我想從技術角度解釋為什麼會這樣。

1. 你肯定能贏爐石版本的AlphaGo

對圍棋這樣的遊戲來說,雙方在同一時刻獲取的信息完全相同,即對局是完美信息博弈(perfect information games)。

而爐石傳說這樣的大多數牌類遊戲並非如此。牌類遊戲是一種依賴不完整信息提供策略的概率遊戲,開局時所獲的信息僅限於自己的手牌,隨著遊戲不斷推進,每個人獲得的信息不斷增多,但總是不完整的。

既然信息不完整,無論是人還是AI,對局都存在一定的運氣成分,因此最弱的你也可以擊敗最強的 AlphaGo,就像藍毛也可以被小學生吊打:畢遊俠爆料黃金賽藍毛被小學生吊打詳情。

2. 天梯上AlphaGo肯定大概率碾壓人類選手

和AlphaGo的演算法類似,牌類遊戲AI的蒙特卡羅方法方法是這樣運作的:

  1. 根據當前明牌猜測對手手牌組成。由於爐石有卡組的概念,所以解空間被大大壓縮了,運算只會更快。
  2. 每個回合,都根據當前猜測狀態(自己手牌、猜測的對方手牌、雙方的出牌)創建出牌分支(平行宇宙),並估算每個分支的勝率。
  3. 如果第二步算出了結果,或者快超時了(燒繩),就做出一次合理出牌。

AI 的強大不但在於第二步,即每一回合都能更準確地估算不同打法的最終獲勝概率;也是在於第一步,有機會比人類更早地猜到對手的卡牌組成,從而調整應對策略。

正因為牌類遊戲存在概率,因此勝率比單場勝利更能說明選手的水平。所以在基於大量穩定卡組的天梯中,使用 T1 卡組的 AlphaGo 可以肯定能比人類更容易登頂。

3. 比賽是另一回事

主要體現在兩方面:

a. 賽次少,隨機性強。
正如上文所言,牌類遊戲的競技比賽比棋類而言隨機性更大,因此具備不一樣的可觀賞性。不過,畢竟運氣也是實力的一環嘛。

b. 戰略影響遠超戰術影響。
爐石的卡組克制性很強,不但快攻、控制、中速三大類卡組之間存在制約關係,特定套牌之間也有克制性:例如大多數冰霜法師vs防禦戰士是大劣勢對局,而對動物園術士這樣的站場卡組則是優勢對局。
現行的爐石競技規則都要求提交參賽卡組,也就意味著卡組克制性的影響可能會超過打牌的細節。再加上比賽時黑科技外掛卡牌滿天飛,這對 AlphaGo 顯然是不利的。

無論如何,跟 AI 玩爐石的好處在於,雖然勝率不行,但是總殘存著戰勝對手的機會,不至於在完美信息博弈中被碾壓得透不過氣來。

微笑吧人類,對你可好了。


。。。根本不需要AlphaGo那個水平的。。。
很一般的腳本就可以打到5級。。(50%勝率)

如果有耐心的話,50%勝率就可以打上傳說。


按費用下隨從,判定優先順序:潛行&>亡語&>戰吼&>觸髮式&>白板/衝鋒
隨從可否觸發進攻?
不可----過
可---可打臉不?可,打臉
不可(有嘲諷)有沉默不?有----沉默,打臉
沒有----有加攻隨從否?有---加攻打嘲諷
沒有----有傷害技能否?沒有-全家老小一起上;有,先技能解,再隨從換

或者,起手1費2費和6費有生物否?有?保留
1費,有奧秘、秘密不?有,上;沒有,掛機過
2費,有聖盾人飛刀不?有,上;沒有,轉報告過
3費,有THREE個代表不?有,上;沒有,轉報告過
4費,有收割機不?有,上;沒有,轉報告過
5費,有塞步or淤泥不?有,上;沒有,轉報告過
6費,有佛豬不?有,上;沒有,轉報告過
7費,有砰砰不?有,上;沒有,轉報告過
8費,有總司令不?有,上;沒有,轉報告過
9費,就是干就是了,不用判定了


reddit上有人訓練了一個,以卡組和手牌公開為前提,總體來說打不過強傳說玩家。


話說我也想過「如果用類似alphago的AI對戰會怎樣」的問題,說下我的想法。
我方9種職業,敵方9種職業,共81種職業對戰可能,每種對戰取五級以上分段(保證決策質量)的100w場出牌決策用卷積神經網路進行訓練。應該可以達到傳說分段水平(比較已有腳本可以做到這點了)。
但是爐石也有它的隨機性,不像國際象棋或者圍棋每次落子都是實實在在的,25,螺絲,爆破,亂斗等都導致局勢不一定按照計算機的預想進行。
還有就是,訓練的大多數可能都是天梯的主流卡組,如果對手拿的是一套基礎卡或者黑科技,計算機就可能懵逼(就像今天的alphago一樣)了,還有一種情況就是出現了9職業以外的角色(螺絲,大王),計算機又要怎麼處理。
以上純屬自己YY,我很期待看到有高智能的AI和玩家對戰的場面。


推薦閱讀:

先有引力波,後有阿爾法狗,我們是不是站在大時代的起點?
如何評價第四局比賽 AlphaGo 輸給李世乭?
DeepMind 研發的圍棋 AI AlphaGo 是如何下棋的?
如何看待人機大戰第四局李世石戰勝 AlphaGo?
如何評價 AlphaGo 自我對弈 50 盤棋?

TAG:電子競技 | 爐石傳說Hearthstone | 腦洞網路用語 | AlphaGo |