12個人工智慧機器人一直玩狼人殺,會出現什麼情況?
應該打到最後很平衡吧,因為前提是都一樣啊
說實話我自己一個人玩過12人標準局
然後一把遊戲一個人玩了一小時,發12個人的言
自己和自己焊跳,自己出自己
毒自己,帶走自己,插嘴自己
還要騙自己
沒有比這更痛苦的事情了最近課題和人工智慧有關,又特別喜歡狼人,小透明的首答就決定落在這個問題了(嚴肅臉
先說說看狀態的問題,機器可能開始對應不同情況會發出不同風格的言語,但學習得這樣降低勝率,也就會學會保持相同的狀態,表現出來就是處變不驚吧,所謂人肉不過是一具屍體,加上個人工智慧腦。
這裡如果十二個人工智慧系統都是完全一致的,其實這就與我們日常玩的狼人就有很多不同。
比如首刀邏輯的缺失,日常首刀落的位置或多或少是與人的特性有關係的,你總不會忍心首刀你女票吧哈哈,但人工智慧的統一則破壞了這一邏輯鏈。這只是一個簡單的例子,人工智慧的一致化其實破壞了狼人殺挺多類似的和不同人特性有關的邏輯鏈,而缺少這些邏輯鏈,加上言語的一致性,沒啥看狀態的,就差不多主要看概率了,這遊戲也就變成了純看概率毫無意義的猜拳遊戲。如果每個人工智慧使用不同的演算法的話,問題也沒太大意思,且要進行一定數量輪次以獲得別的機器如何進行操作的信息,不同情況下會發出不同的言,如何組織信息的傳達以及時機,對別人的語言信息進行分析比較,這個都是建立在很多策略上的,需要提前設定,比如場上有一個跳女巫的,你認為他是真女巫,還是狼,亦或是白痴各種戰局都得走一套邏輯分析,判斷每一種情況的可能性,根據之前大量的信息使用演算法來算出最大的可能,進行選擇判斷。
但是,眾所周知,狼人老玩家都知道,狼人中所謂狀態最重要,而機器沒啥所謂狀態,邏輯成了權重最大的因素,邏輯中除了幾個死邏輯,各種正反邏輯都是走得通正確的,所以當狼走一種邏輯走得概率大時,好人為了獲勝走建立在此邏輯的反邏輯走得概率較大,然後又負反饋給狼,讓狼在好人邏輯上建立反邏輯,然後反反覆復在正反邏輯中反覆,最後各種邏輯正確率趨於平衡,體現在大局上來看就是猜拳概率遊戲,而調整邏輯概率的過程便體現在演算法的學習率(即概率函數調整參數的梯度)的合適程度等等上,越好的演算法調整得越快越精準,獲勝的場數當然也越多。勝率預測出來最後大概就是一個類似阻尼震動圖像。
知乎首答,客官不妨給小透明一個讚唄,手動比心。
推薦閱讀: