甲乙兩個人猜拳,甲被限定只能出兩個手勢,兩個人都絕頂聰明,乙贏的次數會更多嗎?
甲乙兩個人猜拳,甲被限定只能出兩個手勢(例如石頭和剪子),乙則可以隨便出,如果兩個人都絕頂聰明,兩個人無限次玩,乙贏的次數會更多嗎?
補充描述:
乙是知道甲只能出兩種手勢,且知道出哪兩種。
是零和遊戲,贏一次計1分,輸一次計-1分,平手兩人均不得分。
多謝給位的回復!
綜合各位的回復,我的思考如下。
如果按照上邊列的甲只能出石頭和剪子,若果乙足夠聰明,則乙一定不會出剪刀,因為出剪刀乙頂多和甲打平手。
乙如果出石頭肯定不輸,頂多兩者打成平手。甲也是聰明人,知道對乙來說,乙出石頭肯定不賠,乙很可能一直出石頭,那樣的話甲為了不輸,只能也出石頭。如果一直這樣下去兩者一定會一直平手下去。
但是如果乙以一個小的概率出布,這樣甲對乙何時出布很難準確預測,乙贏的概率會增加很多,答案應該是乙一定比甲贏的多。
新的問題是如果乙想最大化的贏甲,而甲則想儘可能少輸乙。甲乙應該採取何種策略?
如果採用兩台計算機扮演甲和乙,經行遊戲,深度學習,是否能獲得最終的答案呢?
不妨假定甲只能出石頭和剪刀,且支付矩陣可以表示為下圖
12 R P S
R ( 0, 0) (-1, 1) ( 1,-1)
S (-1, 1) ( 1,-1) ( 0, 0)
注意上述支付矩陣的兩個特點:
1. 零和,獲勝方獲得的效用等於落敗方失去的效用;
2. 獲勝方無論是誰,無論是以哪種結果獲勝,所獲得的效用都相同;
此時,對於乙來說,S(剪刀)嚴格劣於R(石頭),所以乙不會出剪刀。
剩下的支付矩陣中,不存在純策略納什均衡,而混合策略納什均衡是:
甲以2/3出R(石頭),以1/3出S(剪刀)
乙以2/3出R(石頭),以1/3出P(布)
對於無限重複博弈,始終選擇單次博弈的納什均衡自動構成一個子博弈精鍊均衡,在此均衡下,甲獲勝的概率是1/9,而乙獲勝的概率是4/9,因此乙獲勝的次數更多。
Remark:
1)一般來說,無限重複博弈仍然可能存在其它子博弈精鍊均衡。但在這裡,雙方的最小最大支付(Minimax Payoff)分別是0和1,顯然零和博弈中任意策略都會使得雙方的支付加起來等於0,於是不存在同時超過雙方最小最大支付的策略,無法使用無名氏定理。
2)如果我們改變上述支付矩陣的兩個特點,那麼結論會略有變化。比如,如果雙方只關心自己獲勝的次數(而不會從失敗中獲得負效用),那麼支付矩陣就變成:
12 R P S
R ( 0, 0) ( 0, 1) ( 1, 0)
S ( 0, 1) ( 1, 0) ( 0, 0)
此時將會存在一個純策略納什均衡:甲始終選擇剪刀,乙始終選擇石頭。
1.由於每次猜拳結果獨立,所以題設中的得分期望等效為單次猜拳得分期望
2.定義「確定策略」為出石/剪/布的概率為確定值,可以證明甲乙均有確定策略(這裡我懶不想證)
3.由於信息公開對等且甲乙均足夠聰明,所以甲乙知道自己和對方的確定策略
4.由於乙出剪刀必劣於其餘兩個,所以乙不會出剪刀
綜合1234,設甲出石概率為a,出剪概率為b,乙出石概率為x,出布概率為y,易得
乙得分期望
甲得分期望 (因為甲乙得分和為0 )
由於a+b=x+y=1,期望可化為
對乙,由於知道甲的策略即知道a,要獲得最大得分的必要條件為
得 即
同理,對甲,由於知道乙的策略即知道x,要獲得最大得分的必要條件為
得 即
綜上所述:
甲的策略為以2/3概率出石頭,以1/3概率出剪刀
乙的策略為以2/3概率出石頭,以1/3概率出布
這個遊戲分兩種局面
第一種 A就是不能出某個手勢(假設為石頭)
這種局面下B接近於完勝——哪怕不清楚A不能出什麼 普通人三五局也能測出來了 然後只要按照 多出剪刀(不是完全出剪刀)不出布就是必勝
第二種 類似NGNL里的局面(假設為石頭不能出)
把NGNL的表格改一下就行了 黃色為不能出的 粉色為能出的
可以看出 大量重複的情況下
B的勝率還是比a高出一倍
所以這種前提不是玩一局勝負的話 並沒有什麼意義
會。
甲只能出石頭剪刀。乙隨便出。1.乙出布,一勝一敗。2.乙出剪刀,一敗一平,3.乙出石頭,一勝一平,考慮到乙很聰明,排除第二種情況,一三是最佳選擇。而甲同樣聰明,也就知道乙會只出石頭,所以他為了規避失敗,只能也出石頭。所以,乙為了提高贏的機會,可以時不時的出個布。類似於博弈論中美女的硬幣的不平衡版的情況。
但如果乙是計算機的話,布出現的次數應該呈現出一種穩定的趨勢。大約到百分之三十三左右。。而甲也被替換成了計算器,它知道,三分之一是布,三分之二為錘。所以嘗試穿插一些剪刀。而乙也發現甲開始出現剪刀的情況,為了使它的分數最低,所以繼續只出石頭。所以,甲受被動因素限制。就又只出石頭。此時又達到了平衡點。如此往複下去。。。。乙又開始出其不意的出布。甲也嘗試出剪刀。。。。
。。。。最後主動權完全掌握在乙電腦的手裡。所以電腦的許可權越高,越聰明。
越能掌握文件的機密和重要性。數學學渣強答。
甲只能石頭和布。
乙均可出。你如果是乙:
1,不可能出石頭,頂多平手。2,出布要麼贏要麼平手。3,出剪刀要麼贏要麼輸。加個限制條件A:如果乙要儘可能避免失敗,
則永遠出布,則一直平手。限制條件B:雙方都想儘可能贏得比賽。則甲贏25%,乙贏75%。反對前面大佬1/3和2/3的計算~與前面的思路一樣先假設乙知道甲的策略,或者說甲先指定自己的策略並把它給乙看,那麼甲為了讓自己的期望最大,會選擇1/3出剪刀,2/3出石頭的策略。但是!!!如果甲如此選擇,並且把他的方案給乙看,那麼乙無論如何出拳都一樣,這樣的話乙的出拳策略就無法確定,注意!這裡是「無法確定」,而不是乙的策略是一個「未知數」。後者指當猜拳次數趨向無窮時改值會趨向某一定值。前者就不一樣了,他指無論猜拳次數多大,他都不會有某一趨近值。也就是說乙沒有一個出拳策略,他自己都不知道自己要出什麼,可能一萬次的時候石頭所佔的比例是0.5,到了十萬次就變成0.7。同樣的,甲也不知道乙要出什麼,可以看到「甲不知道乙要出什麼」是「乙知道甲要出什麼」的一個推論,因此甲和乙是不會同時知道對方想出什麼的。那樣如果要保持他們對等,則不如他們都不知道對方想要出什麼,這樣的話勝率就無法計算甚至無從談起了。(原答案不長這樣但其實思路差不多)
兩者肯定有相剋關係,只要出贏的那個肯定不會輸
為什麼你們不說一點通俗易懂的話。本人學問不高,隨便回答下。
情景設定:
甲:只能出石頭、剪刀,聰明絕頂,知道乙知道自己只能出這兩個
乙:可以出石頭,剪刀,布,聰明絕頂,知道甲只能出哪兩個,知道甲知道自己知道(有點繞了)
遊戲開始:
甲:我只能出石頭和剪刀,我出石頭的結果為得0分,或扣1分(乙不可能出剪刀);我出剪刀的結果,扣1分,或得1分
乙:我不會出剪刀(因為得不了分還可能被扣分),這樣我相當於也只能出兩種(布和石頭)。我出石頭的結果,得0分,或得1分,我出布的結果,扣1分,或得1分
甲:扣一分的概率為1/2,得0分的概率為1/4,得1分的概率為1/4
乙:扣1分的概率為1/4,得0分的概率為1/4,得1分的概率為1/2
這個時候產生了兩個問題:
1、為什麼乙不出剪刀只出石頭和布(這個時候也相當於只出兩種),得1分的概率比甲大,扣1分的概率比甲小,這是因為我們首先限定了甲的猜拳手勢,乙這時候根據這一點選擇了「較優勢」的兩種手勢,不明白的話,可以先限制乙的,再分析一遍。
2、乙非得要出剪刀,出剪刀的結果是,得0分,扣1分。這時候乙扣1分的概率為1/3,得0分的概率為1/3,得1分的概率為1/3,而甲變為扣一分的概率為1/3,得0分的概率為1/3,得1分的概率為1/3,結果是相當於乙放棄了自己的優勢反而為甲抹平了劣勢!!!
綜上,在甲存在劣勢的情況下,乙獲勝的次數要高。
接下來我們根據以上基礎再分析:
甲:我的較優勢手勢為剪刀
乙:我的較優勢手勢為石頭
思考為什麼乙的優勢手勢會贏過甲,原因仍然在於一開始先!!限制了甲的手勢,乙選擇了更優勢的手勢!!這裡也可看到乙具有優勢
我來下一個結論,人心不可測,甲乙都是聰明絕頂(絕頂道包括人心),那麼在一切一切的條件相等的情況下,乙原本具有的那一點優勢將決定最終的勝利者為乙!!!
還可以分析嗎,可以,接下來就是根據心理分析,但是沒意義了。因為會陷入博弈思考的死循環而無法出拳,所以結論還是上面的。
這個比拼的是意志因為乙可以一直出一個不敗的手勢而甲會面臨自己永遠無法取勝,所以是投降還是耗下去的選擇
不妨換一個思路 想想甲怎麼能贏
算一下期望
會。
假如甲只能出石頭和剪子,而乙的策略是90%的石頭和10%的布
你說甲能咋辦?
想最大化分差的話,66%的石頭和33%的布吧。這樣不論甲出石頭和剪子,數學期望都是負的0.66。
假設甲只能出石頭和剪刀,那麼我們能確定乙是肯定不會出剪刀的。來畫一個圖表示剩下的情況:
乙 石頭 布甲石頭 平手 乙剪刀 乙 甲此時對於乙來說要做的是要如何分配石頭和布的出手概率才能讓自己的勝率達到最大(假設乙出石頭的概率為x,出布為y且x+y=1),而對於甲來說為了讓自己勝率達到最大只能選擇妥協,即儘可能在甲出石頭的時候也出石頭(所以乙出石頭的概率為x,出剪刀的概率是y)按照這個邏輯甲獲勝的概率為P甲=y^2而乙獲勝的概率是P乙=2xy為了讓P最大x則x=0.5,y=0.5甲的勝率是0.25 乙為0.5一定會。
如果甲不能出布,在摸清套路之後,乙只要一直出石頭就能保證不敗,想要獲勝一次只需要隨機出一次布。進行的比賽次數越多,基數越大,甲就越難以估計是哪一次會出布。
甲為了保證不敗,只能不停出石頭。想要獲勝需要在乙隨機出布的時候自己恰好出剪刀。這個獲勝概率會隨著遊戲次數增加而越來越小。
而且兩人設定都是聰明人。甲不能出布這件事是隱藏不住的。
而一局定勝負的比賽,這個影響就會小很多,然而依然是乙的獲勝概率大。會。並且乙會贏無限多次。
只要乙以1%的概率出布,99%的概率出石頭。甲的最優做法就是一直出石頭。每把乙對甲有1%的優勢。
可以證明,乙最多可以對甲保持33%的優勢。
從人工智慧角度看,這是典型的
博弈樹「極大-極小搜索演算法」用正數表示對甲有利,用負數表示對乙有利,則
極大搜索過程對應甲的思考過程,極小搜索過程對應乙的思考過程。隱含條件是甲乙都絕頂聰明,且不會犯錯,而且知道對方也絕頂聰明。
參考
《人工智慧》—與或圖搜索問題 - 博弈樹搜索。先佔坑,視心情決定填不填。我的程序都編好了hhh
import math
if math.random()>0.9:
print(「乙出布」)else: print(「乙出石頭」)#可以設置成接近1的一個數 0.9和 0.99都可以。很簡單的問題,兩句話就能解釋清楚。
比如 限制甲只能出石頭和剪子,那乙一直出石頭就好了嘛!要麼平手要麼贏,穩賺不虧呀!!!當然甲很聰明,摸清乙一直出石頭的規律後,會一直出石頭懟平局,那乙偶爾來幾個包袱打壓一下就好了呀!
甲敢出剪子碰包袱嗎?那勝率有多低?石頭多包袱少,。。
石頭剪刀布,三種技能是相互克制的,你拿兩個技能和三個技能的對打,肯定三個技能佔上風了!不能吧,比如如果甲不能出拳頭,那乙的布有什麼意義
no game no life 里的?
推薦閱讀: