一個概率/博弈問題?

為了決定誰下樓拿外賣,我和宿友想到了這個方法。

兩個人各出1~5根手指,其和決定誰下去拿,偶數他下去,奇數我下去。

但是經過分析覺得這個數學模型有一些問題。

如果假設出各種手指都是等概率的,那麼我勝的概率為13/25略高一些。

但是如果往深一點想,我如果出單數,這樣如果對面依舊是等概率的話,我的勝率就可以提升到3/5。

但是如果對面想到這一點,就會對應地出偶數。然後就是無盡的博弈層數了......

我想問的是,是否博弈可以使這樣一個本不公平的事件達到動態平衡,勝率55開?

可以從數學角度來詳細分析一下這樣一個模型嗎?


1~5的限制是沒有意義的。這個博弈最終的支付只跟雙方出的數字的奇偶性有關,跟具體數字無關。所以雙方其實都只有兩個純策略:出奇數,或是出偶數。

然後這就是個很簡單的博弈,這個博弈顯然不存在純策略均衡。不過它存在混合策略均衡。

假設兩個參與人是X和Y。當兩數之和為奇數時,X獲勝,反之,則Y獲勝。然後我們假設X以a的概率選擇奇數,則它選擇偶數的概率為1-a,而Y相應的概率分別為b和1-b。

兩個人同時做出選擇,所以我們可以認為這是獨立事件。

則X取勝的概率為a*(1-b)+(1-a)b=a+b-2ab。

X是在給定b下選擇a來最大化自身的取勝概率,所以上式對a求一階偏導,得到一階最優化條件,1-2b=0,b=0.5

相應地,通過求Y的最大化條件可以得到a=0.5。

這就是這個博弈的混合策略納什均衡。此時,雙方都以百分之五十的概率出奇數,百分之五十的概率出偶數。

此時任何人獲勝的概率都是50%。


兩個人各只有兩種有效選擇:出奇數和出偶數……所以很好分析,納什均衡是各自以50%概率選擇奇數和偶數,最後雙方勝率都是50%。

注意這不是「博弈可以使這樣一個本不公平的事件達到動態平衡,勝率55開」,而是這個問題本身恰好是公平的,所以勝率本來就應該是55開。你們一開始覺得勝率不是55開是因為你們自己策略有問題……而博弈的過程,可以使你們從不優的策略逐漸改進到最優策略,從而使55開成為現實。


每人可以有5個選擇,如果等幾率的話,結果是奇數是12/25,反之偶數的概率,如果題主出奇數,那麼結果是奇數的概率2/5。很奇怪有木有?其實被繞進去啦。

在博弈論中把雙方都當做理性人(很聰明),那麼幾率的問題直接可以轉化為出奇數還是偶數,因為1~5不過是個幌子,用混合策略,使對方選奇偶的收益一樣。算出來選奇數的幾率是50%(感覺像沒算一樣。。。)同理對面出奇數的概率也是50%,這樣已經就是55開了。

題主認為當他出奇數的時候,對面出1~5等幾率,所以贏得希望更大,可是其實對方出1,3,5的性質是一樣的,準確的說對方出2,4的幾率和等於1,3,5的幾率和(經過細緻的考慮的話),這樣的結果,也是一個55開。

這本身就是一個公平的遊戲,不需要改進就已經兩邊獲勝機會一樣大(如果你室友沒被繞進去的話)


對這個問題來說,我覺得,一旦雙方都意識到了博弈的存在,雙方就都不會隨機地出數字了,所以就不能用均勻分布來分析勝率了。而此時問題其實就變成了「兩人所出的數字奇偶性相同我贏,奇偶性不同他贏」,這就跟「石頭剪子布」一樣了,只能憑運氣。


不謝邀,沒人邀。

你所說的「一個本不公平的事件」只是在表面上「不公平」,而對應到效用函數中其實是公平的。

你和你的室友的處境完全一樣,博弈結果矩陣如下(我們假設不下去拿外賣的人,因為可以不勞動就吃飯,因此獲得正的效用1,下去拿外賣的人的效用0)

舍友

奇數

偶數

題主

奇數

(1,0)

(0,1)

偶數

(0,1)

(1,0)

上圖反應的最重要的一點其實是,你出幾根手指這個選擇本身並沒有出現在你的效用函數(就是1或者0),你出1,或者3,或者5都是一樣的,他們進入你的效用函數的時候都只體現一個屬性,那就是奇數,同理2、4對應偶數。簡化的結果是你和你舍友的選擇都只有兩個,分別為奇數和偶數。也就是在你和你室友都是理性人(都能想通這一點)的假設前提下,你們出1-5根手指,和出1-2根手指是沒有區別的。

博弈策略的選擇上來看,這個博弈的納什均衡是一個混合策略,以50%/50%的概率出奇數/偶數。計算方法上面已經有詳細說明,不再贅述。給出一個直觀解釋。

納什均衡的直觀理解是,給定對方的策略,雙方均沒有偏離目前策略的動力。

很有意思的一個地方在於,事實上,對於你來說,真的給定你室友的策略,那麼你沒有動力偏離你現有策略,但是其實也沒有動力堅持現有策略。就算你100%可能性出奇數,在給定室友是50%/50%的策略下,你的期望收益都是一樣的。但如果你100%出奇數,那麼你室友會改變策略為100%出偶數,這又會引起你的改變…如此循環改變,不能達到均衡。而上述50%/50%混合策略下雙方均沒有動力偏離,達到了納什均衡的要求。

混合策略的意義在重複性博弈中會更加明顯。在這種一次性博弈中,博弈雙方相互之間不知道對手的策略,只能假設對手是理性人的情況下,假設對手是50%/50%的策略,則己方策略(只要對手不知道且對手假設你也是理性人)其實不重要。而在重複的博弈中,如果對方發現你有傾向(如更喜歡出1),則對方可以立刻調整自己策略達到提高自己勝率的作用。


「他上兩把出了石頭和剪刀,這把就可能出布,我就該出剪刀。可能他猜到了,就會出石頭,我就該出布。他可能也想到了,會出剪刀,我就該出石頭。於是他也可能想到了……」

另外,外賣小哥等得好苦。


其實這本是一個公平的遊戲,別自己被繞過去了,當選1.3.5的意義是一樣的時候,其實它們只能當一個選項,同理,2.4隻能算一個選項,

除非你們是抽籤,每張紙寫一個數字,這樣才能叫每個數字的概率一樣


雖說按照一般論是對半

奇數加奇數 是偶數

奇數加偶數 是奇數

偶數加奇數 是奇數

偶數加偶數 是偶數

不過


推薦閱讀:

概率(Probability)的本質是什麼?
從正方體的一個頂點出發,沿著棱到達另一個頂點,經過n條棱後首次回到出發點。求n的數學期望?
如何理解概率為1的事情不一定發生,而概率為0的事情不一定不發生?
為什麼概率為1的事件不一定是必然事件?
條件概率和後驗概率有什麼不同?

TAG:數學 | 博弈論 | 概率 | 概率論 |