類似 AlphaGo 的人工智慧在遊戲王、萬智牌等卡牌遊戲中勝率如何?
群口相聲:《打電腦》
出演:遊戲,十代,遊星,游馬,游矢
遊戲:各位非洲的父老鄉親
十代:決鬥學院各位同學
遊星:衛星區的無產階級
游馬:星光界還有巴利安
游矢:四個次元的各位水果蔬菜們
齊:給您拜年了!
游馬:等會,這還沒過年呢,怎麼就拜年呢?
游矢:哎呀游馬前輩,今天您這是不知道吧,我們是用決鬥盤穿越來2017年二月份給大家來說相聲來的,會局都禁了快倆月了,你不會不知道吧?
遊戲:什麼?決鬥盤還有這功能?
遊星:什麼?打個牌還能穿越時空?
十代:……哎呀你們別鬧了,游矢你快說說我們今天為啥會穿越到這裡啊?
游矢:這個啊,我們今天是來給全中國的決鬥者來表演節目的,在這個舉國歡慶的夜晚,我們今天春節聯歡晚會還請來了一位特別的嘉賓,我們今天就來和這個嘉賓互動,來表演決鬥!
游馬:這是個什麼嘉賓啊?
游矢:這可不是一般的嘉賓,這是人工智慧,叫alpha go!
(電腦被推到了舞台上)
遊星:就這麼一個鐵殼子?恕我直言決鬥機器人這種東西在22世紀都被我們吊著打。
游矢:這可不是一般的決鬥機器人,這可是在圍棋上戰勝了人類的超智能電腦呢。要不要您先來試試?
遊星:這,這怎麼行呢,我們五代決鬥王得有個老少尊卑啊,我怎麼能第一個上呢(退後)
游矢:哎哎哎前輩你別跑啊。要不十代前輩你試試?
十代:(環視左右)唉,游矢,這就是你的不對了,我們五個人先後順序不是很明顯嗎,那就是-----
遊戲:------年輕的先來!對,尊敬長輩嗎,我一個兩千多歲的法老王怎麼能第一個上呢,游矢你不是娛樂決鬥者么,你先來表演一下給大家開開心好不好?大家說好不好?(觀眾:好!)
游矢:……我知道了,前輩們你們不就是怕打輸了出醜嗎!好,我先來就先來,我就先來一把!這一把我無論贏了還是輸了你們都得一個一個來,行不?
四人:好好好,你先上吧!我們答應你!
(游矢準備套牌)
游馬:這玩意看著挺厲害啊,還能下贏圍棋,這要是輸在機器人手裡老臉不保啊。
遊戲:不急,我們先看看這玩意的實力,就算能下贏圍棋也不一定打贏牌啊。我們靜觀其變,總之不能在全國人民眼裡出醜,明白沒?
三人:嗯!
(游矢準備好了)
游矢:大家看看這四個人,不就是表演個決鬥嗎,給全國人民表演節目還這麼要面子,唉呀。前輩們,我們說好了啊,這把無論輸贏,你們接下來都得一個一個上,好不好?
四人:好好好!答應你!
游矢:那我開始了啊。猜拳我先攻,那我先P個火布偶……
游馬:你等會!火布偶是禁卡!
游矢:可我就這麼點卡啊。我來的時候帶的就是動畫片里的牌,人家沒有辦法嗎。
遊戲:能用禁卡?嘿!那還怕個什麼……
十代:得得得,大家牌組裡誰沒有幾張禁卡啊,就這麼先玩吧。
游馬:是除了我以外都有禁卡吧!這不公平啊!而且火布偶根本就不是你的卡吧!
遊星:……哎呀這都是小事,游矢你繼續吧!
游矢:那我繼續了啊,另一邊P龍劍龍劍起效拿火布偶特招雜耍人,再P火布偶眼查招戲法小丑拿猴子,猴子拿小丑小丑拿蜥蜴,先疊個鎖鏈龍埋千刀跳小丑,召喚色之,另一邊P蜥蜴,P召喚招三個,疊蟲妹,墓地雜耍人效果拿帽子,帽子特招疊巨岩掌,色之宣魔法,蓋三後過。到你了。
電腦:…………五後過。
游矢:我的回合,羽毛掃,有動作么?神宣?連鎖神宣。P怪平A。耶,我贏了!(電腦打出了GG)你看,各位前輩,這不是不挺簡單的么。
遊戲:……這麼一看其實也不難贏嗎。
游馬:等等等等等等絕對不是吧!難道不是因為某個人的牌組太強了才看起來電腦很弱的么?這可是能下贏圍棋的電腦啊!大家三思啊!
十代:哎呀。游矢一個小學生贏得,我贏不得?來就來!先攻我就拿下了,我的回合!
游馬:喂喂喂,不應該猜拳嗎?為什麼都是你們先攻啊?
十代:唉?帥氣的說出「先攻我就拿下了」搶得先攻難道不是常識么?我們決鬥學院都這麼干啊。我的回合抽卡……
游馬:你先攻還抽卡啊!這也太特么不要臉了!
十代:我們決鬥學院先攻都抽卡的……
遊星:你們不要爭了!快繼續決鬥吧!
十代:發動英雄到來,特招天空俠,天空俠拿影霧,召喚哥布林飛行員拉影霧,蓋卡,特招水泡,發動E呼,特招水泡,疊色之……
游馬:你也疊色之啊!這明明是NO.卡為毛你們一個個疊的都那麼熟練啊!
十代:……發動增援,再拿水泡,特招疊蟲妹,發動變化招暗爪,拿天空俠,色之宣魔法回合結束……
游馬:你tm竟然還下了兩個天空俠!十代你變了!你不再是五換一的那個單純的十代了!你簡直就是王霸十代!我看錯你了!
電腦:……回合結束。
十代:我的回合,平A,耶我贏了真是場愉快決鬥下回再一起玩吧…………
遊戲:我去這電腦好弱啊,來來來讓我會會他……
遊星:不。應該是我了。那麼先攻我就拿下了,我的回合抽卡……
游馬:……怎麼辦槽點太多沒法吐槽了……
遊星:(以下全是複製粘貼的說書可以跳過)手牌發動速攻同調士的效果扔蒲公英獅特召兩隻token再通招數學家效果把偷星蟲堆墓偷星效果降低速攻同調士一星特招調王道戰士發效果拉音響戰士 貝司手效果變3星墓地等級偷竊蟲效果降王道戰士1星特殊召喚。墓地等級偷竊蟲效果再降王道戰士一星特殊召喚,LV3+LV1+LV1=LV5同調召喚」加速同調士「。
等級偷竊蟲效果減王道起跳加速同調士效果把「噴氣同調士」堆墓地降低一星,Lv6+LV4=LV10解除限制器 10星 主要低音助推器控制 全部通過 無限的力量 現在在此釋放 沖向次元的彼岸吧 GO 加速同調 COME ON!"科技屬刃槍手"!!!
噴氣同調士效果丟一手牌特殊召喚。LV1+LV1=LV2解除限制器,2星!打開調節器!導航系統,全部通過!GO!同調召喚!COME ON!「科技屬 互換蜻蜓」!
科技屬 互換蜻蜓的效果分解科技屬刃槍手,特殊召喚墓地的王道戰士、加速同調士。墓地復活的王道戰士發動效果拉噴氣同調士,墓地的等級偷竊蟲發效果降星王道戰士。加速同調士效果丟「同調士探索者」,LV7+LV3+LV2=LV12解除限制器,最高星!打開調節器,全部通過!無限的力量,突破時空,開啟未知的世界吧!GO!三角加速!COME ON!「科技屬 戟炮手」!!!!
LV1+LV1=LV2解除限制器,2星!打開調節器!導航系統,全部通過!GO!同調召喚!COME ON!科技屬 互換蜻蜓!
科技屬 互換蜻蜓效果分解科技屬 戟炮手,特殊召喚王道戰士、加速同調士、科技屬 互換蜻蜓A;此時發動手牌的「貪慾之壺」回收墓地的兩個科技屬和隨任意3個怪抽兩卡。墓地偷星降加速同調士一星起跳LV1+LV=LV5解除限制器 5星 打開調節器 推沖器暖機 OK 上行線路 全部通過 GO同調召喚COME ON 「科技屬 超圖書管員」!
發動手牌是「死者蘇生」特殊召喚墓地的加速同調士,加速同調士發效果丟「廢品同調士」加星。LV2+LV8=LV10解除限制器,10星!主要低音助推器控制,全部通過!無限的力量,現在在此釋放,沖向次元的彼岸吧!GO!加速同調!COME ON!科技屬 刃槍手!!
科技屬 超圖書管員效果抽一卡,科技屬 互換蜻蜓A發效果分解科技屬 刃槍手,特殊召喚王道戰士、加速同調士、科技屬 互換蜻蜓B。加速同調士效果丟廢品同調士降星LV2+LV2+LV8=LV12解除限制器,最高星!打開調節器,全部通過!無限的力量,突破時空,開啟未知的世界吧!GO!三角加速!COME ON!科技屬 戟炮手!!!
科技屬 超圖書管員效果抽一卡,科技屬 互換蜻蜓B發效果分解科技屬 刃槍手,特殊召喚王道戰士、加速同調士、科技屬 互換蜻蜓A。加速同調士效果丟廢品同調士降星LV2+LV2+LV8=LV12解除限制器,最高星!打開調節器,全部通過!無限的力量,突破時空,開啟未知的世界吧!GO!三角加速!COME ON!科技屬 戟炮手!!!
科技屬 超圖書管員效果抽一卡,發動手牌里的」鳳凰神的羽毛「丟一手卡回收墓地的貪慾之壺到卡組最上面。科技屬 互換蜻蜓A發效果分解科技屬 刃槍手,特殊召喚王道戰士、加速同調士、科技屬 互換蜻蜓B。加速同調士效果丟鑽頭同調士降星LV2+LV2+LV8=LV12解除限制器,最高星!打開調節器,全部通過!無限的力量,突破時空,開啟未知的世界吧!GO!三角加速!COME ON!科技屬 戟炮手!!!
科技屬 超圖書管員效果抽貪慾之壺,貪慾之壺回收墓地的科技屬和廢品同調士,抽兩卡。科技屬 互換蜻蜓B發效果分解科技屬 刃槍手,特殊召喚王道戰士、加速同調士、科技屬 互換蜻蜓A。加速同調士效果丟廢品同調士降星LV2+LV2+LV8=LV12解除限制器,最高星!打開調節器,全部通過!無限的力量,突破時空,開啟未知的世界吧!GO!三角加速!COME ON!科技屬 戟炮手!!!
科技屬 超圖書管員效果抽一卡,科技屬 超圖書管員效果抽一卡,科技屬 互換蜻蜓A發效果分解科技屬 刃槍手,特殊召喚王道戰士、加速同調士、科技屬 互換蜻蜓B。加速同調士效果丟廢品同調士降星LV2+LV2+LV8=LV12聚集的群星化為一體時 新的牽絆將照亮未來 成為光芒照耀的道路吧 超越極限加速同調 進化之光!!!出來吧「流天類星龍」!
科技屬 超圖書管員效果抽一卡,王道戰士拉卡組的噴氣同調士。等級偷竊蟲降科技屬 超圖書管員特殊召喚,LV1+LV1=LV2聚集的祈願將引向全新速度的地平線 成為光芒照射的道路吧 希望的力量
同調調星師!」方程式同調士「!
科技屬 超圖書管員、方程式同調士效果抽兩卡,此時手裡八卡。L2+L8=LV10同調召喚「星塵戰士」,科技屬 超圖書管員效果抽一卡,發動發動速攻魔法「神秘的中華鍋」祭品掉科技屬 超圖書管員。再從手卡發動「靈魂充能」特殊召喚墓地的王道戰士和兩個速攻同調士,把兩個速攻同調士疊放網路超量召喚R5「電子龍 新星」,再把電子龍 新星疊放網路,升階召喚R6「電子龍 無限」。
王道戰士發動效果特殊召喚卡組的「惡魔 費蘭肯」,發動手牌里的第二張神秘的中華鍋祭品掉王道戰士。惡魔 費蘭肯支付5000LP拉額外的「自然木龍獸」,發動手牌里的假面二型丟一手牌把惡魔 費蘭肯送入墓地出「假面英雄
暗爪」。
combo完成此時我還有4張手牌其中有一張絲襪,再蓋上「虛無空間」,回合結束。游馬:夠了,已經不知道怎麼吐槽了,這種時刻只要微笑就好了……
電腦:……………………
遊星:那我的回合(游馬:我去你還強制結束對手回合啊!),去吧流天類星龍兩次攻擊!天地創造擊!我贏了!游馬:夠了!夠了!我認輸!我拒絕和這台電腦打!
游矢:額,游馬前輩,怎麼了……
游馬:決鬥不應該是給大家帶來笑容的東西嗎?今天是春節晚會,本來給大家表演的應該是娛樂決鬥,大家拿著全盛的EMEm,天胡起手的廢二,甚至還有兩個天空俠的英雄,這樣的決鬥是無法帶來笑容的!我知道我的套牌僅僅是我我我卡堆而已,再怎麼加強也不可能達到各位前輩的強度,但我平時也和朋友們玩的很開心啊!大家打牌不就是為了開心嗎?大家……為什麼不能真的拿齣動畫片里的垃圾套牌和這台電腦打一把呢?這樣才是娛樂決鬥,不對么?(眾人沉默)
遊戲:沒關係的。游馬,我很理解你的。
游馬:遊戲前輩……
遊戲:aibo他的性格和你很像呢,決鬥不僅僅是戰鬥的手段,也同樣是和朋友們娛樂的方式……沒錯。我今天就要用我在動畫里的垃圾卡堆來和這台電腦戰鬥!這才是真正的娛樂決鬥!來吧,alpha go!決鬥!我的回合,抽卡!(沉默)
游馬:誒,前輩,你怎麼不說話……
遊戲:……(沉默)
游馬:前,前輩?
遊戲:…………(沉默)
游馬:到底怎麼了?前輩你說話啊!
遊戲:哎呀,我抽到五老埃了……
四人:去你的吧!
(鞠躬,下台
ygo不懂行不評論,畢竟經常聽說有大佬上來一通說對手就投了的,
僅就萬智談談看法,
不知道各位pro是什麼看法,
我是無法想像,對面坐著一個完全不會失誤的牌手,你的壓力會有多大,
基本上以吾輩一般牌手的水平,偷一局的可能性有,但是三局兩勝,基本沒有太多贏面,
AI的話,不像人,他的局面的判斷建立在人工智慧和深度學習之上,
那麼他拿出來的牌一定是他認為對整體勝率最高的無弱點套牌,
以摩登為例,基本就是Jund/Abzan/Grixis這樣的套牌,
主牌局對任何套牌都至少有四六開的勝率,
(不會出現人魚打共鳴,黑白token打tron這樣主牌局基本一邊倒的情況),
那麼基本上利用meta從電腦這裡獲得free win的概率可以說很低很低,
作為人類牌手,這時候兩種策略,一種用fair思路,一種用unfair思路,
用fair思路,比如打鏡像戰,用臟熊,動物園去五五開,
這個時候比賽容易被拖進長盤對決,電腦的算力是佔優的,
而且電腦的出招都是理論上的最優解,在topdeck沒有明顯優勢的話作為人類牌手一方是會吃虧的,
還有一種思路是unfair的,比如玩家拿出tron對可能的Jund/Abzan進行針對,
但這個需要玩家去猜測電腦的思路,萬一一個不趕巧,一頭撞上共鳴,直接就是卒,
備牌局的話,就是針對和反針對的對決,一般unfair套牌的弱點更多,更容易遭到打擊(哪怕是Jund對tron這種烈士對局,在備牌局放入潰碎化塵和雷鳴法師也能勉強有一戰之力)
當然我不是說人類拍手沒有勝機,血,法術力,戰場,墳場,放逐區,手牌,牌庫,七大資源,
前五者都是開放的,AI能看到並算到的,
倒是手牌和牌庫是信息不公開的,好的topdeck和起手這點AI沒法針對(除非對面有手牌干擾),
畢竟做人要用夢想嘛,世界盃決賽不還有兩回合殺么?畢竟天防地防,手紅沒法防。遊戲王玩家,萬智牌尚算不得入門,姑且只答遊戲王部分。
以上
要說勝率,我覺得應該分為單局和match考慮。
之前幾位都提到了正常對戰的蓋卡、抽牌運氣等問題,這點上我也持相同態度,由於情報半公開,對於人類玩家的手牌、後台阿爾法狗還是很難猜測的。但是,如果阿爾法狗選擇使用魔爆、老i這些不需要考慮過多對方因素的卡組呢?由於計算精密度,甚至可以計算清楚下一步抽到每張卡的概率的前提下,打單局我覺得阿爾法狗還是能有不小勝率的,在運氣水平相同的情況下,可能還會稍高於玩家。最起碼,不會出現假坑騙風這樣的情況。
那麼真的用這樣的卡組進行match,阿爾法狗能不能彌補這類卡組的固有match戰side更換無力的缺陷呢?我覺得是不能的。畢竟這也是這麼多年玩家們都沒有完美解決的問題。評論區牌圈的人比較多,所以我得說說這個答案的背景知識。這個答案聊的不是怎麼打牌,而是如果要做一個比Forge/旅法師對決/遊戲王的各代掌機遊戲的弱智AI牛逼很多的,能用上比賽記錄和牌表信息的AI,大致上會有哪些部分。
如果你對條件概率/貝葉斯更新沒有概念,請參考Home page for the book, "Bayesian Data Analysis"
如果你對分類器/機器學習沒有概念,請參考機器學習 (豆瓣)
如果你對博弈論沒有概念,請參考博弈論基礎 (豆瓣)這幾乎是上面三個領域最簡單的書了,都是本科教材。看完這些教材能保證你不會瞎用概念。
如果你了解上面三塊內容,只是不會玩牌,那事情就簡單了。下載個旅法師對決自己玩一晚上就會了。學會玩牌比學會上面三個東西簡單得多。玩牌玩好也比學會上面三個東西簡單。
另外,嘗試教我玩牌前,先掂量掂量自己。牌圈都叫我冰帝。我寫過20多篇遊戲王的教程,絕大部分你都能在CNOCG找著。我寫過兩篇萬智摩登套牌的教程,你能在老營地的精華區找著。如果你玩遊戲王卻不知道我是誰,基本只能證明你玩的時間短。
==============================
趁著消食,隨手答一發。
和很多卡牌遊戲玩家一開始想的不一樣,遊戲王和萬智需要的AI會比圍棋簡單。原因是這兩個遊戲的對局回合數遠遠比不上圍棋,甚至不是一個量級的。而且如前面的人所說的,手牌就那麼幾張,費用或者通召權又限制著,選擇也不多,看上去電腦沒什麼優勢。但是這不代表計算機的數據處理能力就不關鍵了。
卡牌遊戲都是根據條件信息(conditional information)做決策的。遊戲王我太久不玩了不了解,所以例子就拿萬智舉了:
摩登賽制,G1對手1回合找地地找黑綠圈燙進寇基雷審訊,問一個問題:對方是什麼套牌?
作為一個人類玩家,你的答案可能是「這東西(最可能)是BGx」。這個答案不能說錯,但是不夠精確。比如說我問你具體是哪個亞型。你可能回答不知道,但根據你在牌店打牌的經驗,不是勇得就是阿布贊。
但是這時候一個像阿法狗那樣投入大量精力研發的AI(換句話說,不是forge那種)會怎麼想?它會先把近期牌表搜一遍,然後給出條件分布:純黑綠多少,勇得多少,阿布贊(中速/枯葉)多少,蘇勒台中速/控制多少等等。而且如果說你因為緊張或者累或者不知道前一陣有個主牌4審訊的四色禮物也打進過某個比賽的16強,就完全沒往這方面想,電腦不會。電腦會根據這三個動作給出對手套牌類型的條件分布,然後根據這個條件分布來選擇期望勝率最高的計劃。
還是前面這個例子,對手2回合下塊找地讓過,你回合結束找一塊白綠圈,請問對手是什麼套牌?
如果你是前面那個人類玩家,你很可能相信對手是一套阿布贊了。你可能會進一步告訴自己,對手沒有立刻找地挺威脅是為了衰敗你2回合挺的火爐邪鬼。但是電腦會做的是降低(不是清零,我玩勇得非要混白擱仨徘徊靈魂也不是不行)勇得、蘇勒台、純黑綠、枯葉阿布贊等類型條件概率的估計,調高阿布贊中速和四色禮物條件概率的估計。前一件事人和電腦差不多,後一件事是電腦一定會做,但是大多數人類玩家不會做的。而且即使人類玩家真的做,做的也不可能比電腦更好。因為電腦用的信息集比人更好,估計條件概率的方法也比人更好,得出來的結果一定更精確。各種拿拼掏說事的朋友,你們眼裡的拼掏在電腦眼裡都是條件概率。
條件概率這個事說完了,來說說遊戲計劃。
很多人認為,卡牌遊戲單卡種類太多,電腦算遊戲計劃複雜度太高以至於不可實現,這個觀點可能是錯的。我問一個問題:塔莫耶夫、火爐邪鬼、天界柱廊、贊迪卡夥伴基定、太古泰坦,這是五張不同的單卡,它們的共同點是什麼?
都是某一種套牌的主要威脅(之一)。
就像人類玩家會對單卡進行分類一樣,電腦也可以對這些單卡進行分類。儘管一個遊戲,一個賽制的合法單卡可能有成千乃至上萬種,但它們也無非是威脅、解、反擊等功能種類中的一種或者多種。同一種功能的牌,應對方式也可能是一致的。同樣一張魔流,你打勇得康塔鱉,打瓦拉庫就能康泰坦。同樣一張流放,你打紅藍靈技送給火爐邪鬼,打藍白中速就能給天界柱廊。
所以遊戲計劃看上去複雜,其實實現起來也沒那麼難。更進一步,你一套牌就那麼幾十張,應對手段就那麼幾種。每種應對手段的應對範圍都是固定的。而且對於威脅的條件分布,電腦依然比人清楚。所以至少在互動這塊,電腦和人至少是互有優劣的。人可以憑經驗決定忍什麼不忍什麼,電腦在學習了足夠多的對局後(MO存沒存對局過程數據我不知道),可能也能學會忍某些威脅,而不是像forge的AI一樣傻。
在取勝這塊,對於中速和控制套,AI幾乎一定能比人做得更好。因為決策就是一兩個生物要不要踢得問題——也就是和對手拉鋸還是開始對踢。這種決策的依據應該是給定場面、對手手牌數、已經用的牌等信息的條件勝率。開踢的條件勝率高於不踢,就上,反之就和對手對著看比掏。
快攻的取勝方案就更簡單了。對快攻是一種方案(主要的決策點是攻防角色何時轉換),對中速和組合技是一種方案(All-in搶血),對控制是一種方案(主要的決策點是場上保持幾個威脅)。
AI比較難學的是組合技的啟動,尤其是風暴和蛋蛋套這種操作步驟比較多的。不過用不用組合技還兩說。如果加個不用組合技套牌的限制,那麼複雜度會低很多。
說到這,大家可能已經明白了。要做一個卡牌遊戲的AI,無非就是兩件事,一個是根據對手的動作估計條件概率,一個是對單卡進行分類。至於根據對手出牌的類型選擇應對方式,在估計條件概率和分類這兩件事情做完後,根據自己訓練用的對局來選就行了。你再限制一下讓它只用快攻/中速/控制,那麼和Finkel等級的人打成五五開乃至更高勝率也只是時間問題。
PS:保險起見,這個AI最好別老跟八十崗翔太玩XD
PPS:電腦學遊戲計劃也可能有誤區。比如單遊魂和單塔鱉能互相看住這事,電腦可能不會注意。因為按照前面說的先分類再學對局計劃的做法,兩個威脅對著看很可能不被看做軟解對手的威脅。
演算法再精也怕神抽。
上述答案中有一個說到信息公開與不公開的區別。公開的遊戲,如圍棋,玩家給AI挖了個坑,但這個坑的構成要素是透明的,如此玩家勢必算不過AI。不公開的遊戲,如爐石(鄙人只玩了爐石),AI無從得知玩家的手牌,於是挖坑得以成立。
例如,我手裡有一張解卡,我這回合選擇了打臉而不是隨從交換,那麼正常的玩家便應當猜到我手裡有一張解,此時對他來說【我手裡有一張解卡】的概率大概有九成,但AI只能根據概率計算。
當然AI可以進行這種簡單地邏輯計算,但,假如我在偷雞呢?玩家判斷這種事情,靠的是分析,對手風格,以及直覺。第一點AI或許能夠做到,但人心難以揣測,直覺需要隨機,我認為AI是不具備的。這也就有了理論上的概率勝利可能。打牌的技巧,比起套牌的構築本身太次要了。
我就問你一個問題,夠你回家測試一年:摩登,美國色,是60主牌26地8找厲害,還是61主牌27地9找厲害?在阿爾法狗手裡,也許是一天,也許是一會兒。進一步說,到底什麼叫「厲害」?在你眼裡的厲害,可能隨個性變動,有些人覺得厲害是下地穩定,有些人覺得厲害是top deck有力度,而阿爾法狗眼中的厲害才是真正的厲害:抓環境,勝率高。
結果是常常是反直覺的,而阿爾法狗不受直覺困擾。只說遊戲王。
結論——暫時做不到高勝率完勝遊戲王頂尖高手,但勝率也不低,發揮會比較穩定。
曾經擊敗「遊戲之神」的【 】曾經這樣教導過我們:圍棋、象棋如是一樣,都是雙方完全公開情報無運氣干擾成分的博弈,在這種遊戲中,心理戰對機器是不起作用的,因為在這種公開在檯面上的遊戲,心理戰只有一個——「我賭你算不清接下來的招數」,而電腦恰恰算不錯。
這種遊戲的必勝法,肯定只有擁有龐大計算力的電腦可以掌握。
而遊戲王不是。
不僅雙方場面情報是半公開的,連下一張卡是什麼雙方也都不知道。
這不同於圍棋,這是真正的未知。
首先讓我們來看看電腦有什麼優勢,我們假設這個AI是和AlphaGo類似的AlphaYou。
1.卡組構築。遊戲王成功的一半首先在於卡組的構築,我認為電腦在這方面很有優勢,AlphaYou可以自己和自己打上百萬盤,從而篩選出勝率最高的卡組,由於AlphaYou的排除性演算法機制,它可以很輕鬆的排除那些一輩子幾乎都不可能參與戰鬥的卡來縮小卡池範圍,提高計算效率。比如這張。海馬獸,一張5星凡骨,糟糕的打點,不是大腿的種族,沒有(確定?)特殊欄位。我敢肯定AlphaYou選出的高勝率卡組絕不會出現它。(但或許潛藏著喚醒奇蹟的力量?)
不過遊戲王在中期曾經出現過一些匪夷所思的神奇組合,頗有些靈光一閃的味道,AlphaYou很可能無法建立聯繫,比如很經典的這個。+
但這中組合的出現得益於以前卡片的效果多樣性。而現在的卡片效果就是往強了整,哪個是檢索哪個是解場,一眼看個明白,加個特殊欄位稍稍修改修改就又是一張新卡,卡片與卡片的組合,依照特殊欄位、屬性、等級、種族、攻擊力還有這一眼就能看透的大概效果就很快能篩選出來,再沒有以前那種類似古玩市場撿漏的感覺了。此時AlphaYou應該可以很快就能篩出那些效率最高的combo。
然而對於人類,組卡組這種事,光靠想是不行的,必須組好了去試,然後不斷的調整、熟悉,所幸的是這比圍棋訓練簡單多了,幾十盤調試之後對一副卡組就能有相當的熟悉了。
2.計算力
遊戲王當然也需要計算功力,它在遊戲王、萬智牌和爐石里應該是玩法最繁複的。起手五張牌,在運氣可以配合你的情況下,你能精準的在三分鐘內招出三流天么?這不難,但也不容易,即使用爛了的卡組也很容易出錯,但AlphaYou絕對不會。接下來,讓我們看看AI的不足。
1.對局面的認識。在這方面AlphaYou當然也有其擅長的地方,比如它絕對不會忘記你墓地里的【超電磁龜】,同理也別想用【謎題】來翻盤,除非你有特殊手段。
然而更重要是的每回合對於局勢判斷與預測。這與圍棋形勢判斷之難有著根本的區別,圍棋的形勢判斷之難在於虛與實,價值隨著每一步變化而變化,但你畢竟看得見,畢竟能算。而遊戲王,有時候算不了。你手裡有一張旋風,我有一張蓋牌,你不用算,這裡只有兩種做法,然而卻沒有最正確的做法,有的只是揣摩人心。
但AlphaYou不是真正的人工智慧,它揣摩不了人心。
但我們卻能知道它在想什麼,因為***********這是更新的分割線************
仔細想了想,程序比人的差距大概只有那一點,下面我們來談談,相比於應用在圍棋,把這種程序應用在遊戲王上有什麼劣勢,為什麼不說優勢呢,因為幾乎沒有什麼優勢...
1.計算。對,沒錯,還是計算。在圍棋中計算是決定勝負的根本因素,而且圍棋中的計算幾乎是無窮盡的,這可以把電腦計算力強大的優勢發揮到最大。而在遊戲王的戰鬥局面中,計算量是有上限的,因為每回合的信息量是有限的,上面舉的三流天說書的例子畢竟是誇張的特例,即使如此,以人腦的計算力還是可以應付的。所以在遊戲王中,電腦的計算優勢被削弱了。
2.出招的自由性。這個比較好理解,在圍棋比賽中,在對方落子後,想怎麼攻擊只要在那個地方走子就行了。而在遊戲王比賽中,不是你想開始招暗爪壓制就招的,有的時候你偏偏就沒有影舞女郎。簡單來說,圍棋,算好了——出招!遊戲王,想的挺好——卡手!當然,電腦篩出來的卡組卡手率是比較低的,但最完美的戰術展開的成功率也不會逆天。下面說說賽制對於遊戲王勝負的影響。
從賽制對於勝負的影響上說,遊戲王和圍棋大概有兩點不同。
1.情報。情報之於圍棋還是有些用處的,比如古力好戰,我們簡明處理,避開亂戰;陳耀燁偏愛實地,我們搶實地,把模樣給他;李昌鎬收官天下無敵,我們盡量在前半盤結束戰鬥...但其實,到了頂尖高手,大家殺氣治孤打劫收官等基本功都差不太多,針對風格的作用有,但效果不是特明顯。AlphaGo不是說已經把李世石完全掌握了,李世石的勝率已經為0了么,照樣還是輸了一局。
而在遊戲王中,公開卡組無異於把自身放在了對方主宰的手術台上,雖然超主流現在賴的一逼,怎麼針對還是很屌,但畢竟會有很大幫助。當然這一點只是說說而已,因為比較不好操作,電腦和人互知對方卡組嗎?然後做針對?那豈不是又都變了?嗯,不討論了。
2.賽制。圍棋的勝負戰一般就是番棋,贏多者為勝。遊戲王一般是三局兩勝,看起來差不多,但最關鍵的是——中間的換side(副卡組)環節!現在不太好估計電腦的side的選擇機制,是根據幾個棘手主流多放針對卡還是把每種情況的考慮到均攤卡位呢?如果人類能根據分析猜出電腦使用的卡組可能性並充分準備好side,勝機將會提高。另外,如果是那種淘汰賽,圍棋只要不斷的依據程序走最毫無破綻的棋就好了,而電腦要經過各種各樣卡組的洗禮,情況或許會很複雜。(複雜個P啊!就那幾個啊!)
暫時又這麼多了,以後有觀點會再補充~對於套牌遊戲,最可能的情況就是電腦會收斂到1個或者n個相生相剋的牌組為最優解。如果電腦只收斂到一個牌組,那麼說明這個牌組是萬金油的,無論對其他任何牌組,電腦都有非常高的勝率。這種情況下,人類是幾乎沒有機會的,只能偶爾靠逆天的牌運加幾乎不出錯的出牌偷來一兩場勝利;如果電腦收斂到三個或者三個以上相互克制的牌組,那說明這就是一個複雜的石頭剪刀布遊戲,人類贏的概率會大一些,因為如果正好選到克制電腦的牌組,出牌不需要太精確也能贏。
所有的完全信息博弈,電腦總是可以把它簡化到先後手直接定勝負;所有帶有隨機變數的博弈,在電腦看來就是複雜一點的的擲骰子比大小而已。隨機性越大,電腦的優勢越小;越是需要邏輯,需要智商的「聰明人」遊戲,電腦越是有優勢。個人認為勝率應該會很高。連比較玄學的圍棋,阿爾法狗都達到了那種高度。。
遊戲王雖然套路比較多,但是規則與邏輯非常嚴謹,而且以賺卡為目的,以削減生命值為獲勝方式,這些都是計算機非常擅長的類型。再多種類的卡組,固定展開就這麼幾種,坑對坑都是一換一的事情,非常清晰。聽說阿爾法狗要在LOL上打EDG?像MOBA類遊戲都可以上手了,公式化卡片遊戲估計是小菜一碟……
但全勝是不可能的,無論如何遊戲王還是有一絲絲運氣成分在裡面,哪怕是3局2勝,甚至5局3勝。
光是一個AI自行組卡,估計就要抓狂了。
以萬智牌為例,永久賽制卡池太大了,變數也太多(all spells, 250+鬥智,150+天光,999蹤徒套這些我覺得還是放過吧,我不覺得AI能組出來,給定方向優化倒是可能),我就不展開了。(250+鬥智,150+天光,999蹤徒套這些我覺得還是放過吧,電腦)(但是我覺得AI要是能組出明燈控並參賽應該相當厲害,直接記住萬智有史以來所有套牌,看對手下地找地就能預判對手整套牌了。)以標準環境為前提。
讓AI自行組卡,滿足基本構築條件的套牌數量可以超過全宇宙沙子的數量。
滿足構築條件指,主牌有60張,備牌15張。(250+鬥智,150+天光,999蹤徒套這些我覺得還是放過吧,電腦)每張咒語能夠被正常釋放,既地的數量=咒語最高CMC,切顏色相符。
即使AI通過學習得到了基本的組牌匯率,它還需要預測Meta.
Meta 的概念就是對局預測,在跑團里就是超游。在TCG里Meta Gaming 是遊戲的一部分。玩家通過了解現在的流行成功套牌,改變自己的套牌。一種是加入成功,流行單卡,比如大家都開始用寶船巡遊,因為發現真的強。另一種是針對流行單卡,發掘流行起來,大家放各種墳場hate.
這要求AI採取數據,進行分析。要麼AI本身就能模擬出外界玩家對局。通過這些手段來達成預測Meta 的手段。
有了套牌之後,我們再來談對局,假設套牌的構成與Pro 的選擇相差無幾。
我覺得在隨機性的影響下,AI最多也只能和Pro 打成六四開。AI能有六,很大一部分是在記憶力,預判,和觸發不會遺漏上佔優。
Pro 們如果用一些手段雞AI 頭一次可能行,第二次AI 就能學會了。還是要靠硬實力。人的精力是有限的。所以我覺得只能有四成勝率。
取決於和誰打吧……
要是碰到一個大喊:
真正的決鬥者,一切都是必然!!!
的電腦,
發生什麼還真的很難說勝率為0,因為AlphaGo根本就不是拿來干這個事的東西。
阿爾法圍棋(AlphaGo)是一款圍棋人工智慧程序,由位於英國倫敦的谷歌(Google)旗下DeepMind公司的戴維·西爾弗、艾佳·黃和戴密斯·哈薩比斯與他們的團隊開發,這個程序利用「價值網路」去計算局面,用「策略網路」去選擇下子。2015年10月阿爾法圍棋以5:0完勝歐洲圍棋冠軍、職業二段選手樊麾;2016年3月對戰世界圍棋冠軍、職業九段選手李世石。
AlphaGo只能下圍棋,別指望拿它打遊戲王和萬智。
(怒抖機靈2333)
——以上為原答案,問題修改後的答案在下方,此為分割線——
題主已經把題目修改成了AlphaGo類似的人工智慧打遊戲王或者萬智的時候會怎麼樣。我不懂萬智,單提遊戲王,默認match戰。
說組卡問題的話,AlphaGo這個級別的人工智慧(以下簡稱AlphaGo了)並不一定會比人類弱到哪裡去,大不了讓AlphaGo也學著人類抄上位便是了,畢竟上位主流卡組除了影靈衣這種後媽系列一個表就挨刀的一般會持續半年免死光環,相對穩定,所以說讓AlphaGo抄上位是完全可行的,反而讓AlphaGo自己組卡可能會組出一堆power單卡放在一起然後混在一起都不知道怎麼打的卡堆。
(當然我對AlphaGo的組卡還是很有信心的,除了side,因為面對單個牌手AlphaGo不知道對方卡組的情況下完全不知道如何應對,side位畢竟只有15張)。
組卡方面AlphaGo不輸人類,那打牌方面呢?
卡牌遊戲,一個最重要的因素,就是臉。
縱使AlphaGo拿著理論上最優化的EM龍劍,然後發現自己手上全是兔子和反擊坑,那這就很尷尬了。AlphaGo再厲害,終究解決不了臉的問題。
但問題是人類也解決不了,玄不救非氪不改命你換再多洗面奶都沒有用。
AlphaGo卡起手來也不一定會比人類做的更好,胡起來也不一定會比人類做的更好。因為現在的卡組基本上屬於固定化展開,定式非常嚴重,比如說龍劍老爹火布偶3卡你也就那麼個玩法了(詳情請參考那個公式圖),在定式方面AlphaGo並不一定會比人類好到哪裡去,但是如果是微操的話,毫無疑問AlphaGo會比人類強。
遊戲王這個未知性也是一個好玩的地方。比如說AlphaGo正要展開突然挨了一記遮什麼的那就比較尷尬了,鬼知道蓋下去的是哪門子坑,是攻宣啊是召喚坑啊是fc啊還是偽坑啊還是乾脆就是蓋下去騙風的啊之類的。
雖然有答案說電腦是可以計算出蓋下實坑或者手上有遮的概率的,但是問題在於AI是只會按照這個期望去做事,也就像某個答案說的一樣,電腦只求穩,不會去賭。
再說手卡有沒有遮除了對方玩家之外誰知道啊,難道說要讓AIside心崩嗎(笑)。
總結一下,我的觀點是,AlphaGo這種級別的AI,打人類並不會完全佔優,倒是能打的有來有回,match戰應該是相當好看的。
勝率逼人。
首先,像阿發狗一類的AI在與人對戰中最大的優勢在於計算模擬,劣勢在於學習與理解能力。
曾經德國有人寫過海巨人薩滿腳本,集鋪場 解場 打臉等,並且成功上傳說。
而爐石本身很看發牌員和隨機性的,只要AI組一套卡組,操作不比人差,又不會因為感性打錯,顯然就是看臉了。
有人寫過一套奴隸戰斬殺計算的程序,只要3s就能算出最優解。即使信息不對等,AI也能有很高的勝率。贏起來相當簡單,和別人玩的時候一直用一種卡組,和人工智慧對局突然用別的卡組
還有,實卡決鬥還是網戰?洗牌是自己洗還是人工智慧幫洗?
遊戲王實卡決鬥的決鬥者為了不損壞卡片都是用切牌的方式洗牌,這樣的話絕大多數卡片的順序還是不會變的,就這麼說吧,假設你一開始實卡決鬥5老艾疊在一起切牌,切完牌之後5老艾還是有很大幾率疊在一起,而人工智慧是單純的洗牌,就是將牌完全打亂的那種,所以人工智慧抽到某張牌的可能性每次都是均等,但是決鬥者不一樣,記住之前這套卡組的排列,看下自己這次抽卡抽到的什麼卡,基本就知道自己下回合能抽什麼卡了。畢竟哈吉咩社長洗牌測試抽黑老法抽了12次就抽齊了(當然實際幾率是多少我就不說了)……
所以,打牌能不能贏,那要看雙方如何洗牌(滑稽)
天胡黑法也不是沒有~而且,讓我們假設這樣的場景,對方場上有蓋卡,自己有【旋風】的時候,職業玩家可能會去想,這是不是【黑羽-地雷】之類的被破壞了才會觸發的卡,而人工智慧基本上連想都不想,直接發動【旋風】破壞蓋卡。或者說對方3蓋卡0怪,玩家可能會揣摩對方的心理和卡組適性從而猜測出那三張有沒有【魔法筒】之類的反擊坑,但是像人工智慧吧,我覺得就是看到3蓋卡就基本不會選擇攻擊,因為被反擊的概率超過50%,即使那3蓋卡是3張【沙塵的龍捲風】且空手牌。
在這,我特意要說一下某卡
所以我認為人類在某些方面可以完勝人工智慧……
【格斯】(沒錯名字被我閹割了!)
人工智慧準備用【黑魔導】直接攻擊
你卡組裡組了【格斯】
卡組不公開,人工智慧認為你卡組裡有【格斯】的可能性是多少?
你抽到【格斯】了嗎?
人工智慧認為你手上有【格斯】的概率是多少?
職業玩家認為你手上有【格斯】的概率是多少?首先說結論:
在以下兩個前提下:
1:只要對戰局數超過一定的數字,掩蓋掉隨機性。
2:只要AlphaGo針對此類卡牌遊戲進行設置調整。人類VS目前這個AI程度的AlphaGo類智能計算,幾乎沒有任何勝利的可能性,人類必然完敗!!!
很多朋友侃侃而談什麼萬智牌如何如何淵博,遊戲王卡組如何如何豐富,爐石傳說中戰術如何如何多變,我都不反駁,各位應該是遊戲行家,你們說的都對。但是我認為,此類朋友在根本上沒有明白AlphaGo所代表的「深度學習計算」究竟是個什麼意思,也根本沒明白AlphaGo戰勝李世石究竟意味著什麼。
過去,在人工智慧嘗試解決「下棋」、「打牌」之類的「下一步決策」時,大部分解決方案說穿了就是「利用計算機的野蠻計算能力」去對抗「人腦的模糊計算、直覺和經驗感覺」。比如,你移動一個象棋里的「車」,可能有30種移動方案,人類憑「感覺」、「經驗」、「直覺」感覺到其中5種移動方案是最有效的,計算機無法這麼做,所以計算機是利用其強大的計算能力,去枚舉所有的30種移動方案,以及之後可能帶來的300種應對方案,以及之後可能再產生的3000種反應對方案。。。以此類推。早在90年代,人工智慧已經通過這種野蠻計算的方法,計算一個殘局中5步之內的「全部變化」,這已經是非常恐怖的數字了。(很多人可能沒有意識到,一局頂尖象棋,雙方其實全部下的步數加一起,也不過30-50步,圍棋也只有60-120手。。。爐石傳說?不好意思,大部分的比賽只有15-30手而已。)利用這種野蠻計算的解決方案,人工智慧早在90年代初就可以和世界頂尖級的國際象棋大師平起平坐了。1997年之後,深藍戰勝卡斯帕羅夫,是一個劃時代的標誌,從此以後,人工智慧在計算上,已經遠遠將人類中的「天才」甩到身後了。
可能各位不下棋,我需要指出的是,卡牌遊戲的趣味性可能很高,觀賞性可能很強,但是在競技性和計算值上,是遠遠不如國際象棋的,和圍棋更不是在等量級之內。卡牌的計算量是非常小的,即使是《爐石傳說》也不過是數百張卡牌,去除掉「完全不可能使用的卡牌」,單一比賽中的「可能變化」數量,相對象棋來說,也是非常小的,跟圍棋。。。就更沒法比了。一次《爐石比賽》,在一個5步殘局中,大概有多少種「所有的變化」?我可以告訴大家,不超過10億種(我都很懷疑有沒有1億種)。而在國際象棋中,5步之內的變化一共是500億種。
光在「計算」這件事情上,AI可以達到的高度,其實早在數十年前,就已經遠遠超過卡牌類遊戲可以達到的高度。從AI測試的角度來講,卡牌類遊戲,根本沒有資格參加這個「頂級腦力大戰」的競爭。AI之所以從來沒有挑戰過萬智牌、遊戲王或者打百分,那是因為不值得。
但是,90年代的深藍,其主要展示的,還是「計算能力」而不是「人工智慧」,說白了,那就是一個野蠻的窮舉計算,是IBM展示他們硬體能力的舞台。它在智能性上是很普通的。所以,當深藍之類的野蠻計算跨越了國際象棋這個天塹,面對其計算數量遠遠超過國際象棋的圍棋時,有人預言,計算機永遠無法戰勝人類。
為什麼呢?因為圍棋的計算量和國際象棋不能同日而語,前面說了,圍棋的手數是國際象棋的3-5倍,問題是,每提高一手,都要以乘積的方式去提高計算量。而國際象棋中,單個棋子的「可以移動的範圍」受到規則限制是有限的,比如,一場象棋比賽到中盤,紅方哪怕不顧輸贏利弊,尋找當前「所有可以移動的棋 X 所有可以移動到的點」可能只有70種(8個兵只能進1或者不動,馬只有8個位置,象、車、皇后多一些),但是圍棋有361個點可以著子。幾步下來,圍棋就是一個天文數字了。按照某種說法(未證實),要窮舉圍棋20步之內的變化,以今天計算機的能力,需要計算到太陽熄滅之日。
但是,這個差距,短短二十年之內,就被AlphaGo抹平了。AlphaGo戰勝了目前人類最頂尖的棋手之一李世石。而且這一次,不是計算機的「野蠻計算能力」提升了多少,而是「深度學習」代表的人工智慧的勝利。
AlphaGo的運算能力號稱是深藍的8萬倍,僅僅依靠這8萬倍的提升,還不足以讓AlphaGo在計算上多算半步。但是AlphaGo的計算方法——「深度學習」,卻幾乎完美演繹了此類「下一步決策」中AI能夠達到的碾壓人類的計算能力。
AlphaGo的「深度學習」運算模型簡單來說是這樣的(要說複雜完整了,以我的能力還不夠):它並不窮舉「所有的可能」,而是窮舉「所有歷史上發生的可能」,比如,人類自從誕生以來,可能其實全部加在一起,也就是下了300億場圍棋,其中,有價值的高手對局,可能也就是300萬場,它將這些對局的步驟全部記憶下來,並且根據最終勝負,去理解某一步的「形態」更加類似「可能勝利的形態」,從而學習如何去下棋。比如,人類在應對一個角落的局部纏鬥中,有「尖」、「大尖」、「飛」、「托」等應對模型,AlphaGo用模糊的演算法,去理解可能使用「托」或者類似「托」的手法,勝率達到了64.7%,是最高「可能勝利的形態」,所以,它選擇了「托」。當然,實際中,它還另外使用了類似深藍這樣的「野蠻計算」,用兩套方案去相輔相成的配合著演算,得出「我下一手怎麼應對」「更容易獲得勝利」。
就是這個解決方案,攻克了人類「腦力競爭」中幾乎可以說是「皇冠上的明珠」圍棋,使得李世石最終鎩羽而歸。下過圍棋的朋友才明白這意味著什麼,這意味著人類在AI面前最引以為傲的一樣東西「感覺」、「直覺」、「味道」被AI以深度學習的方案,碾壓了!事實上,我們再回溯AlphaGo的計算方法,他其實和一個人類學習圍棋,理解圍棋,練習圍棋是幾乎一模一樣的。李世石也好,李昌鎬也好,柯潔也好,他們對「下一手怎麼下比較好」,說白了,不就是因為他們研究過幾十萬盤棋,可以在短時間內得出的某種「經驗感」么?我為什麼要下「托」,是因為我覺得「托」的「味道」比較好。。。這是下棋的棋手常說的話,這個「味道」,計算機以「更可能的勝利方案」去理解了。而不同的是,人力有極致,即使是窮盡一生去學習圍棋,練習圍棋,你又能看多少個譜,十萬個?三十萬個?三百萬盤是極限了吧?但是計算機可以毫不費力的學習一億盤棋。。。計算機唯一遺憾的是:該死的人類歷史太短,下的圍棋太少了。你又能下多少盤棋?三千盤?三萬盤?只要計算機願意,它甚至可以自己和自己在一個月內「練習」一百萬盤棋。。。
李世石的落敗,其實意味著在類似的「有勝負的模糊決策」問題上,人類最後的堡壘圍棋被攻克了,計算機已經可以取代人腦了。之後,AlphaGo的經驗會越來越豐富,它的棋力會越來越逼近圍棋的極限,不是說它每一盤都能贏,而是下的盤數只要超過一個基本數字,人類已經不可能下贏計算機。
最後,回到卡牌遊戲上。。。看了我上面的說明,有幾個同學還想不明白么?集換式卡牌類遊戲,其實無論是在「計算量」、「感覺」、「直覺」、「應對可能性」、「歷史經驗」上來說,根本和國際象棋都不在一個水平線上,更不要談圍棋了。。。和AlphaGo玩《爐石傳說》?AlphaGo可以輕易的了解「人類歷史上所有發生過的爐石傳說的所有出牌牌序。。。」,並且教導你「其實1費使用A卡牌的勝率是53.45%,1費跳過的勝率是44.41%」,不僅如此,它還可以輕易的演算「接下來1-4費,一場牧師對戰薩滿,雙方最多的變化一共是10億種,全部枚舉如下。。。我應該如何選擇,才能最靠近勝利」。
當然了,卡牌類遊戲本質並不是公平競技,本質還是遊戲,是娛樂,是消遣,所以,隨機性在其中起到了重要的作用。甚至可以這麼說,如果一個圍棋高手(目前國際象棋世界大師已經是肯定下不過AI了,不用再比了)和AlphaGo下100盤,也許人類圍棋高手只能贏3盤;那麼一個爐石傳說的高手和AlphaGo打爐石,反而是爐石高手可以贏的多一些,甚至說不定可以到贏30盤。。。但是,只要這個「對局數字」高到一定的程度,掩蓋掉隨機性,卡牌類遊戲的這點很有限的「變化」是根本不夠人工智慧看的。
阿爾法狗最新外設:四次元印表機。滿足你現場印卡的快感
從遊戲王上講,不用主流的娛樂卡組大戰那alphaGO的勝率恐怕不會太高,沒人知道娛樂卡組裡面到底有什麼黑科技,估計勝率能和一般的牌手差不多就不錯了。如果是主流卡組,也就是正規比賽的話,相信ai算牌肯定會比人強,但就像另一個答案說的一樣,不是你會不會胡,而是能不能胡的問題啊。
還是運氣成分的問題
alphago如果一直按照計算出的概率期望來進行遊戲的話毫無疑問會很穩
然而也只是很穩
卡牌遊戲的隨機性是一個點
alphago在組牌上與頂級玩家拉不開也不可能拉開什麼差距
這是另一個點
當然在操作上alphago是具有優勢的
只不過不可能因為你的操作很完美你就必然會贏
遊戲王的話,比萬智更有可能對alphago造成麻煩
一個是萬智牌有費用這個概念,而在計算費用上alphago無疑是有優勢的
另一個是同樣是神抽,遊戲王比萬智更容易翻盤
也就是說,遊戲王更具有不確定性
因此我的結論是
alphago在遊戲王或者萬智中都不可能穩贏
而在遊戲王中失敗的幾率將更大
------------------------------------
再寫一點東西吧
關於alphago的套牌選擇問題
我依然堅持alphago不可能組出比頂級選手強得多的套牌
那麼套牌的選擇標準呢?
如果按照對其他卡組勝率來選擇的話
被組出來的將是一副強度足夠且不被絕對克制的套牌
也就是萬金油
這恐怕不能在對某個人的對局中確定優勢
而如果針對對手專門設計一副牌呢?
那麼alphago就處在了極其有利的地位上
當然也有被對手反常規舉動干擾的可能
越是針對某個人特化的卡組對反常規舉動的適應能力就越弱
畢竟這樣一副特化來對付某個人的套牌在對他人的戰鬥上是沒有優勢的
甚至可能只因為對面令人出乎意料的卡組選擇而確定敗局
當然如果真有不管對面是什麼卡組都能碾過去的卡組的話
那就是另一個問題了
一般來說,你的套牌未知,使用一套牌打一套牌三局兩勝,中場可換備的賽制,(我覺得)電腦基本上會組出三種完全不同風格的頂尖強度套牌,然後隨機選擇一套。感覺基本上會是傑斯凱控制(是否是炸裂鬼怪那犀利套路的話應該是電腦分析meta得出的結論),納雅燒,還有綠白底色(基本上會是阿布贊)的生物戰套牌(工具箱,組合技,生物戰)。一段時間不打牌了不知道答的如何
遊戲王803退了,現在對於環境不了解就不寫了,寫寫萬智
就t2賽制來說組牌方面可能差別不是很大,主要是單卡的處理,數量,主備的選擇有些許不同。也有一種可能就是電腦跳出我們平常的套路用一套銀鐵虐了我們這邊一堆高玩也不是沒有可能。第二種情況莫名覺得挺悲哀的。比賽的時候場面的預判還有猜測對面的手牌人類都是有優勢的,電腦認為的最優解是不知道你的手牌和牌庫的。
t2以後的牌池就不好說了,太龐大了。想想之前突然殺出來的明燈,還有之前的藍月亮。這種完全新穎的卡組在摩登點五t1裡面也許還有千千萬萬我們沒發現。尤其是組合技,有可能隨便拿出來一套就把我們虐的慘不忍睹。
但是畢竟這是一個起點不是純正公平的開局,我這邊胡了你一回合被風暴死了不管你是機器還是人沒康都得死,這一點我想大家應該都同意。
反正我覺得吧。。。電腦超過人類早晚有一天會的,而且不遠了
個人感受,輕噴
推薦閱讀:
※如果AlphaGO級別的AI去玩爐石傳說,會怎樣?
※先有引力波,後有阿爾法狗,我們是不是站在大時代的起點?
※如何評價第四局比賽 AlphaGo 輸給李世乭?
※DeepMind 研發的圍棋 AI AlphaGo 是如何下棋的?
※如何看待人機大戰第四局李世石戰勝 AlphaGo?
TAG:萬智牌 | 遊戲王 | 卡牌遊戲 | 爐石傳說Hearthstone | AlphaGo |