如何從博弈論或者概率角度為『換牌喝酒』遊戲設計最佳策略?

有種遊戲的玩法是這樣的,一副撲克牌,一桌人(假設是十個)一人隨機抽一張牌,只能看自己的,從第一個人開始依次選擇喝半杯酒換牌(把牌交回去重新抽一張),或者跳過,當一圈下來無人換牌時大家攤牌,點數最小的喝一杯酒,次小的喝半杯酒。那麼,手上牌大於多少時,選擇攤牌比選擇換牌有利呢?(即喝酒的期望值小)

條件不足的地方各位大神們自己假設好了~

嘛,忘了一個重要的條件,大王最大,其次是小王,然後KQJ這樣依次往下排,同數字的花色之間不分大小

跟清華一哥們討論了一下,他說3以上就不用換,但是時間太緊,他沒來得及告訴我是怎麼算的,我也覺得他那個模型太簡單了點,你們有沒有更好的答案?


這個遊戲被我們帝國理工一群博士給改了。

1)換牌喝一口(1/5杯),大家輪流換,可以有無限輪。

2)等到大家都滿意自己的牌的時候,開牌,最小的人喝一杯,第二的不用喝。

3)如果中途有人願意喝兩杯,可以把最小的喝變成最大的喝(稱為「反轉」)

4)最多可以反轉四次,每次懲罰杯數加一

之後這個遊戲就變得極其下酒。。。

來值乎問我問題


ok 如果有人拿到最小,他必定換,如果場上沒人換了,那麼必定沒人拿到最小,那麼次小的必換,然後場上沒有了次小。那麼第三小必換。依此類推,當換牌得到點數期望小於當前時都換,大概思路是這樣。根連鎖店悖論差不多,有興趣的可以算下。


這個題我從簡化的角度去想。

點數最小的喝一杯酒,次小的喝半杯酒。

這句話理解為,以點數計算,而不以排序計算,即存在1,1,X的情況,X仍然要喝酒。

不知道算的對不對,歡迎大家指正。

不考慮別人換不換,拿到3的人不換牌喝酒的期望只有不到0.3,換牌的話,鐵定要喝半杯,因此拿到3就不用換了。

另外,我覺得人家清華小哥真是無辜,就回答了一下就莫名被黑。

(他長得帥嗎?帥的話請聯繫我!)


@Shiyun Jin 我算錯了~~ 實際上還是一次換牌

回答你的問題:

請看下圖

總的來說 我可能得到的結果為 {A:倒數第一,B:倒數第二,C;其他}

每次換牌之後可能會改變我的payoff, 比如從A 變成B , 從B 變成A , 從C 變成B etc....

在首次的時候 唯一會選擇換牌的情況是我為 情況A 其他都不換。

為什麼不換呢, 因為:

  1. 我如果在首次屬於情況C 我無論如何換牌 都不可能 得到更好的結果。

  2. 我如果在首次屬於情況B 我也不會換 因為換牌之後 至多能維持現狀 而且還有 降低的風險。

然後假設我為情況A ,

我換牌一次之後 有機會 提升 payoff

但是當我換第二次 我至多 位置同樣的payoff, 且 有降低的風險 所以我不會進行第二次換牌。

@Shiyun Jin 您說是要跟上次一比,按您的意思是 如果我再第一次換牌以後還是倒數第一 那麼我就應該 繼續換 這樣 運氣好的話 可以 讓 payoff 從- 1.5 上升到 -1。

【  

可是 如果你是參與者 假設你運氣非常不好 每次都是抽到1 你會一直換牌嗎? 這個概率超級低 但是還是有可能的。 

你一定會在某一點 放棄 而接受懲罰 。 所以這個問題 換與不換還是要看概率期望 所以 只換一次 即便 換牌之後還是1 也必須接受 , 因為再換牌的期望永不大於 -1.是劣勢策略。】

但是 這個決策過程不能割裂看 做兩次 換牌的 決策樹如下:

在分步 排除的時候 的確是每次只要還是 最後一名我就應該繼續 換牌

所以其實 在 出現Begin →A →換→A 的情況下 開始可以繼續換的。

(謝謝 @Shiyun Jin 我做錯了。)我又錯了不過是我數據放錯了 就是只能換一次牌。

但是 換牌次數還是有限的。 從整體看 之後當換牌之後的期望值 大於 -1 我才會換牌。如果期望值 小於 -1 則不再置換。

因為 計算期望 需要知道 換牌後 各種 情況出現的概率,而 概率 取決於 當前手中的牌 和 參與人數 所以 我不會算。 但是 我假設極限情況下 換牌之後一定不是倒數 第 一 或 第二 的概率是 一定的 那麼 有 期望值如下:

從圖中可見 在最極端的情況下 在第二輪換牌之後 payoff 的期望也只是等於0 , 所以玩家至多換一次牌 。

而實際上倒數第一 和倒數第二的可能性都會大於零 所以 第二次換牌後的期望值 怎麼算都是負的所以一定不會換牌。

另附 換牌 的概率 和根據 當前手中牌的大小 覺得是否換換牌的決策表

只有玩家手中的牌小於7時 才有可能換牌, 大於七 以後 換牌不是好選擇。===================分割線===========

所以這個遊戲 目前的決策部分的必要條件為:

  1. 至多換一次牌

  2. 大於 6 之後不換牌

恩 推到這裡 我覺得玩這個遊戲可能出現的情況是 :

當 初始情況下有人 手持 1 或者2 時 , 持有 1 和 2 的人開始換牌 然後 循環 3 換牌 4 換牌 。。。。。

當所有玩家 持牌大於 6 或者 都用盡一次換牌機會後 停止換牌。 然後比較大小。

當初始狀態沒人拿到 一二 時 遊戲直接結束。因為拿三的沒機會喊 換牌了。

PS: 博弈論 一個關鍵的地方時 類似迭代的 博弈過程 每個參與者都是相關的, 大家都想到 期望大於3 於是換牌 之後 1 跟 2 都被換掉了 那麼3 成為了新的 末尾 所以 這個過程會再來一次 然後不斷循環。 小於三 換牌的策略僅僅 在首輪有效。

以下為舊的 不看也可==================================

/編輯3 :手機碼字 圖上傳不來啊。累

/編輯4:

期望部分我算得不對 但是思路不變。

假設 我期望沒錯 那麼 做reasoning rolling bank 每個玩家只要小於7就會要求換牌。不用管其他玩家 也不用等 情況一 出現。

理由: 每人 只能做一次換牌的條件不變。

然後當紙牌小於一定數值的時候 換牌會增加期望值 那麼只要我能增加我的期望 我就應該去換牌。

只有一輪 所有 持有小於某個牌面數值的玩家都會要求換牌。

這組玩家換牌以後 比較大小 結束。

編輯4: /

首先要去確定每個玩家的策略。這個遊戲輪流叫 所以每個人策略一樣

一共兩條

第一 再次叫牌 的情況 每個玩家僅可以用一次。因為換兩次會導致payoff 變壞 成為絕對劣勢策略。

第二 當手裡的牌 是7 或者更大的牌的時候 換牌是劣勢策略

第一條 下邊已經有說明條件

第二條 算概率就可以

然後 博弈過程 有兩種情況

當首次摸牌 有玩家 的牌為一 或者二。

因為一和二 是絕對劣勢 所以 一定選擇換牌

這樣 換牌得玩家會暴露信息。之後 手持「3" 的玩家會叫換牌。之後牌面數字會 持續增大 直到 玩家首輪 牌面大於「6」為止 或 因所有玩家用盡換牌機會。

情況2 : 首輪無玩家 持有 1或2 則無人叫牌 換牌環節結束 拼運氣比大小吧。

編輯3結束/

支持3的答案 直接一輪期望算出來就可以了。這個博弈 在一開始就決定了 有第二名還是有不同的。

/再編輯

只是換完以後 第二輪 拿三和四的就該著急了 所以遊戲還會繼續。

再編輯結束/

===============老答案 沉了吧===求摺疊

這個題 重點不是 拿到幾 而是 應該換幾次。

我們先簡化條件 只有最後一名喝一杯。

/編輯1:

第二名其實不太重要 接受懲罰也是半杯 換也是半杯。所以只要有人墊底 第二名就沒有換牌的動機。

換牌的方式很重要

是否可見對手有沒有提出換牌要求 ?

如果是可見 那麼是:

排隊輪流提出換牌要求 還是 都拿到牌之後 大家一起提出換牌要求

如果是 一起提出 可否允許考慮?

編輯1 結束/

第一階段

所以如果我拿到一 那麼我一定換 。

因為拿到一而不換的payoff 是 -1

拿到一換的話 payoff 可以是 -1.5 或者 -0.5。

那麼假設我還是拿到了 1 我還要換嗎?

假設我還是拿到一 那麼我繼續換的payoff 是 -1或者-2。

所以如果拿到一 就會去換一次

每個人同樣 都最多只會換一次。因為再換牌還不如接受懲罰來的合算。

而且拿到一的人一定會換牌。

第二階段 每個人都和我一樣想 所以我知道 只有拿一的會換牌。那麼他們已經暴露了。所以 這時候 如果我一開始沒有換過牌(拿的不是一)那麼我接下來的payoff 集合總會比換過牌的對手 領先 0.5 所以我還有機會換牌一次。

假設換牌之後舊的牌會放回牌庫 基本上他們再抽到一的可能性很低 所以如果我是2 我就要換牌 而我也只會換一次。

階段三

這個過程會不斷循環 二到三 到四 到五。直到一張牌 的期望不足以支撐換牌 (要算)或者 每個人都換過了 為止。

思路如此。


大家都這麼想,拿到A,2的人都鐵定換牌。

這才是博弈論。


酒費不用我付的話.什麼牌我都換...

既然是博弈論不是概率論

那麼首先拿到1的肯定是換的

那麼有人有1的情況就不存在了,這樣2就是最小的了

所以2也得要換。。。

以此類推。。。一直到Q。。。

誒好像哪裡不對


看了上面很多大神的演算法,感覺漏掉了一個重要東西。

那就是其他人抽到1和2(或者還有3)情況下喝酒換牌對結果的影響。

基於這種情況下還要討論第一個抽到小牌喝酒換牌後對之後的人喝酒換牌的影響,同理第二個換牌後對後面人的影響……所以還要討論題主在遊戲中排的位置。

可惜我不知道怎麼算,,,


一個簡單的分析:

自己拿的是3,要不喝酒,那剩下的有八個人拿的必須是A和2,並且不換牌,概率是:

因為拿到A和2的人肯定喝酒,他們肯定至少換一次牌,那拿到3不喝酒的概率還會更低,喝酒的概率接近於1了。。。


不要忽略了換牌的成本,換一個比手上牌大的成本可不是半杯酒,就算是1換個2,成本也是0.5*52/51,而要換到不是最小,那要算一下別人手上牌的概率。對那1的人來說,翻身機會很渺茫,別掙扎了。對Q來說,換到K或以上的機會也渺茫,也別換了。

最終,最好的策略都是無論手上是什麼牌,都別換,攤牌得了。


博弈論假定所有參與者都是絕對聰明的,酒桌上這個假設肯定不成立…


具體的概率還要看有多少人參加遊戲。就按十個人參加遊戲,只是說拿了三以上的有可能不用喝酒,拿了1或2肯定喝酒。當然拿到的牌越大越不容易喝酒,而且即使同樣大的牌,每一個遊戲輸贏也不一樣。玩這個遊戲的時候你可以通過別人的言語表情,他換牌的多少來推斷他拿到牌的大小來決定要不要換牌。當然換牌也不要超過兩次。在隨機情況下,54張牌抽到大於2/10就是拿到3可以不用換牌,但這個遊戲中每個人都可以換牌,所以3已經不是保底牌了。當然越大越保險。是我的話,爭取拿到8點以上的牌吧。


這是清華哥們的回答,藍線是換牌的平均喝酒期望,紅點是不換牌的平均喝酒期望,橫軸是抽到的點數,他說他要趕報告,沒時間跟我細說,下次面談,結果到現在還沒機會見面呢,估計要見得三月了,我也不好意思再去問,所以就來知乎問大神們了~


推薦閱讀:

僵局是什麼?指的是怎麼樣的博弈過程呢?
怎麼理解貝塞爾曲線?
如何證明以下問題:任意多邊形都能不改變邊長,通過推動各邊變形後使其內接於一個圓中?
在地球上怎麼判斷地球是球體?
如何想像四維空間和四維圖形?

TAG:數學 | 博弈論 | 概率 |