3人聚餐後，想玩一個遊戲來決定誰買單，這個遊戲公平嗎？

01-25

3人先約定好誰當A、誰當B、誰當C，然後同時伸出手，每個人都只有手心朝上或者手背朝上2種選擇，然後統計手心朝上的人數：0人或3人則A買單，1人則B買單，2人則C買單。
在任何2人都沒有互相串通的前提下，這個遊戲公平嗎？如果不公平，哪方佔優哪方劣勢？
----------該問題於 2017-10-23 13:06 被編輯，作了以下擴充----------
A發現遊戲並不公平，於是他決定放棄優勢。在伸手前，他將會聲明自己怎麼出。作為一個無聊的人，他有50%的概率按聲明出手，也有50%概率戲弄B與C。
這樣會更公平嗎？

假設A是一個很靠譜的人BC都很願意相信他的話，假設A是一個很不靠譜的人，BC都不願意相信他的話，這樣還公平嗎？

題主增加了一問：

A發現遊戲並不公平，於是他決定放棄優勢。在伸手前，他將會聲明自己怎麼出。作為一個無聊的人，他有50%的概率按聲明出手，也有50%概率戲弄B與C。
這樣會更公平嗎？

但是A這個承諾毫無意義，因為大家都知道他會反悔，所以他無論說自己是手心還是手背都是廢話，相當於他直接聲明自己隨機一半一半的概率。既然A的策略依然是均衡策略，那麼B和C保持不變。遊戲並沒有變得更加公平。

下面是第一問的答案：

似乎我看到這種腦筋急轉彎的博弈題主要靠 @Richard Xu 關注……

首先，這是三個人的博弈，不能預先假設每個人都是隨機的來出正反。其次，三個人都沒有佔優策略，所以我們的思路是先假設沒有純策略，先計算出混合策略的概率，然後來算期望支付。

假定三個人出手心的概率為 $p_a, p_b, p_c$ ，那麼出手背的概率就是 $1-p_a, 1-p_b, 1-p_c$ 。我們假定付錢效用為-1，不付錢效用為0.

ABC出手心手背的期望收益相等，對於A來說,如果自己出手心，那麼只有當其他人都出手心自己才付錢，如果自己出手背，那麼只有其他人都出手背才付錢，所以手心手背期望相等，就意味著：

$p_bp_c=(1-p_b)(1-p_c)Rightarrow p_b + p_c = 1$

對於B來說，B出手心，則只有另外倆人都出手背才付錢，B出手背，則任意一個人出手心付錢。

$(1-p_a)(1-p_c) = p_a(1-p_c) + (1-p_a)p_c$

化簡之後得：

$1+ 3p_ap_c = 2(p_a + p_c)$

對於C來說，C出手心，只有另外兩個人有一個人出手心才付錢，C出手背，則另外倆人出手心才付錢：

$p_ap_b = p_a(1-p_b) + (1-p_a)p_b$

化簡之後得：

$3p_ap_b = p_a + p_b$

現在就聯立解這三個式子，發現 $p_a = 1/2, p_b = 1, p_c = 0$ , 也就是說在納什均衡的時候，C的均衡策略是出手背, B的均衡策略是出手心，然後A以1/2的概率出手背和手心。

這樣的話，A是始終不用付錢的，因為B和C的策略在均衡的時候是不同的；而Ｂ和C均有一半的概率付錢，完全取決於A是手心還是手背。

這個結論可能很難讓人接受，但是考慮到納什均衡的定義，如果一個狀態，沒有人能夠通過改變的自己的策略獲利，那麼這個均衡不管多麼不可能，都是納什均衡。我們就來看看B和C能不能做的更好：

如果C不選擇手背，選擇手心，其他人策略不變，那麼顯然，C在A選擇手背的時候要付錢，在A選擇手心的時候不付錢，依然是1/2的概率付錢；
如果B不選擇手心，選擇手背，其他人策略不變，一樣的，B會在A選擇手心的時候付錢，A選擇手背的時候不付錢，還是1/2的概率；

所以我們就得到了一個這樣的納什均衡，A是唯一一個隨機出手心手背的人，期望收益為0；而B出手心，C出手背，B和C的期望收益都為-0.5. 所以就可以回答題主的問題了，這是對A有很大傾斜的機制，均衡的時候A不但不用付錢，還有了隨機決定B和C誰付錢的權力。

我來試著解一下納什均衡解吧。

a出手心手背的最優概率為0.5這個應該不用解釋了。假設b選擇出手心的概率為x，c選擇出手心的概率為y，那麼b輸的概率是 $0.5(1-xy)$ ，c輸的概率是 $0.5(x+y-xy)$ ，兩人的最優策略就是最小化自己輸的概率。

下面考慮一下每個人的最優策略（best response）：對於b來說，最優的x是

$x^*left{egin{aligned}=1, extrm{ if } y>0 \ in [0,1], extrm{ if } y = 0end{aligned}<br /> ight.$

對於c來說，最優的y是

$y^*left{egin{aligned}in[0,1], extrm{ if } x=1\ =0, extrm{ if } x<1end{aligned} ight.$

把這兩組最優策略結合起來，就可以得出納什均衡解 ${(x,y)|y=0 extrm{ or } x=1}$

Edit：剛剛發現我的計算裡面有了漏洞。要保證a出手心的最優概率是0.5的話需要保證 $x+y=1$ ，所以最優解就是 $x=1,y=0$ ，而不是一個集合了。上面答案就不改了，反躬自省……

先上結論:不公平，如果三個人都機智而且不允許交流，那麼b一定會出手心，c一定會出手背，a一定不會輸，他隨便出什麼都行，而且其實是他決定誰會買單。

懟一下某答案:三個人勝利條件不一樣，假設他們手心手背概率相等？？你這是認為他們完全沒有智商

我躺在床上用手機碼字……先不調整格式了

0.對a來說，整局遊戲都是對稱的，bc的地位，勝利條件……一切都是對稱的，如果bc都是理性的，他們採取的策略也應該是對稱的，所以他實際出什麼其實不會關係到自己的勝率

1.b和c也會看穿a的處境，於是a的行為不可預測，他們在考慮策略時，會認為a出手心手背的期望是相等的（這裡不太嚴謹，等有時間了會補充說明）

2.記b的策略是以概率x出手心，c的策略是以概率y出手心，則

也就得出了開頭的結論。

其實這個思路有一點點跳步，最嚴謹的辦法是把a的策略也先寫成參數，再算策略的平衡點……但是已經躺在床上了還沒草稿紙╮(╯▽╰)╭

其實a這種策略完全是對的吧，在不能交流的情況下，以相等概率出手心手背的性質很好，也讓bc的策略變得簡單，這才讓自己利於了不敗之地嘛，bc按這樣推測a也是合理的

天哪我是第一個給出正確均衡解的，答案竟然還只是在這個排位，傷心……

哇我看見自己排到第三了，開心^_^謝謝大家(^o^)/YES！

哈哈，博弈遊戲的前提條件是沒有愣頭青。

不加這一天分析再多也沒有意義。

不公平，A會以且必須以50%對50%的概率隨機化自己的策略才能保證不輸，如此這般那B只會出手心，C只會出手背，輸贏全看A。

A之所以要隨機化是因為如果它的結果能被意料到，那麼是必輸的；之所以50%對50%是因為如果被察覺有某種偏好，那麼BC都會跟進這個偏好。

上面的回答都沒對第二個問題進行回答。

假設B、C相信A的話。

1、A聲明手心朝上。B只會跟，因為跟的收益最大，那麼C也只能跟。

2、A聲明朝下，從C來說，朝下是最好的策略，所以B也只能朝下。

所以，A只要以聲明相反的出法，基本是最不公平的。

如果B、C不相信A的話，那麼和其他人第一段的答案一樣。

為什麼不直接大撥碎

我是題主，看完了所有的回答和評論，受益匪淺。我也說說自己的看法。

如果這是一道筆試題，那麼所有與高贊回答持相同觀點的答案，都是這道題的標準答案，都能得滿分（誰讓我手賤，貼上了【納什均衡】的標籤呢）。

如果這是一道面試題，那就仁者見仁智者見智了。為了在眾多的面試者里脫穎而出，我會發表自己獨特的看法來博取面試官的好感。

（為了簡潔，我只說結論，具體的細節需要腦補）

首先A必需嚴格隨機出，才可以保證敗率不超過1/4。否則A只要有一丁點不隨機，BC有強佔優策略的一方會雷打不動地採用強佔優策略，然後另一方只好接受這個事實，進行自保，結果導致A的敗率大於1/2。因此A不敢不嚴格隨機。

當A嚴格隨機出的時候，BC就遇到了囚徒困境。由於不能串通，BC的敗率之和必定大於等於3/4。

當BC都採取各自的佔優策略（即互相背叛）時，那麼三方的策略就達到納什均衡了，這是此三人博弈里唯一的一個納什均衡點。

（找到納什均衡點就完了嗎？反正我自己還不滿足，很後悔自己手賤，貼上了【納什均衡】的標籤。拋開【納什均衡】的標籤之後，我又繼續思考了很多）

對BC來說，堅持採取納什均衡策略的結果實在是糟糕得不能再糟糕了：BC兩敗俱傷，敗率各為1/2，A坐收漁翁之利，敗率為0。

所以BC都很想逃出這個囚徒困境。所幸的是，這個囚徒困境並不難逃脫。

這個囚徒困境與一般的囚徒困境最大的區別是：當一方堅持背叛的時候，另一方選擇合作不會有任何損失。

因此當一方堅持背叛的時候，另一方為了逃出囚徒困境，會隨機亂出或者使用完全相反的固定策略去攪局，反正怎麼攪局都沒有任何損失嘛。
於是很神奇的事情發生了：唯一的納什均衡點竟然會被人攪局，變得不穩定了！

之所以會出現這樣的矛盾，是因為納什均衡理論是基於所有的參與者都是極端理性，完全沒有感情用事（並且【所有的參與者都是極端理性】是公共知識）的前提下得出的。

當參與者有感恩之心（如果你犧牲自己的利益，選擇不對我使壞，那麼我也會犧牲自己的利益，選擇不對你使壞）和報復之心（如果你堅持對我使壞，那麼我也會堅持對你使壞），並且【每個人都有感恩之心和報復之心】成為公共知識的時候，BC的最佳策略就變成合作了。結果雙方的敗率皆為3/8，A的敗率為1/4。

這對BC來說，是好得不能再好的結果了：BC合作雙贏，將敗率從1/2減小到了3/8，將A的敗率增大到了最大值1/4。

如果對我以上的思考還不滿足，可以看看這位答主的答案（做了更多的思考）：

https://www.zhihu.com/question/67018671/answer/249626701

單從概率來說是a是1/4b是3/8c是3/8，但如果b出正則概率為1/4，出反為1/2，c出正概率為1/2，反則為1/4，如果只考慮自己的概率，那b必出正，c必出反，這樣a就擁有決策權，且a不會付錢，但如果b和c互相考慮對方或只有一方考慮對方又有不同的演算法，所以我覺得考慮到所有情況最後的概率還是會接近單純的概率，a1/4，b3/8，c3/8。

不公平，買單概率: a:2/8,b:3/8,c:3/8

先說明一下，這是我一口氣寫下來的，中間思緒重來過好幾次，所以可能有點混亂和錯誤。

稍後再整理

然後實名贊同WeineLi的答案（@不出來）

知乎用戶：3人聚餐後，想玩一個遊戲來決定誰買單，這個遊戲公平嗎？

多位答主算出了納什均衡點，但光算個納什均衡點真的算是解決了這個問題嗎？反正我是想得更多了一點，雖然可能有混亂和錯誤……權當拋磚引玉。先上結論。

雖然我是沒學過經濟啦……但Excel還是挺方便的。

————————————————————————————————————————

1.這個問題的納什均衡點看起來十分反直覺好像其實是因為，這個問題本質上好像其實就是囚徒困境

2.如果進行重複博弈，允許串通的話，最後B或C會成為最大輸家（或之一）。

————————————————————————————————————————

說說我的看法。「A應該按照50%的概率出」看起來挺合理的，就以這個為前提來。那麼這個問題其實就變成了囚徒困境。如下圖。（括弧內為A、B、C的「收益」。敗率為0記為8，敗率為0.125記為7，敗率為0.25記為6，敗率為0.375記為5，敗率為0.5記為4）（下圖中的「隨機」指「50%出手心，50%出手背」）

對於B和C來說，問題基本可以改成這樣（想這個例子花了我不少時間，重寫了五六次= =）：

B和C一起工作。

如果B按部就班的工作，C上班睡覺，那麼B會拿5000元，C只能拿到2500工資。

如果B按部就班的工作，C去說B的壞話，那麼B只能拿2500工資，C會拿5000。

如果B睡覺，C去說B的壞話，領導會覺得很有道理，給C發7500元獎金，也就是說B只能拿2500，C能拿10000。

以上三條反之亦然。

如果B和C都按部就班的工作，那麼兩人都能拿2500基礎工資+1250獎金=3750元。

如果B和C都只說對方壞話，或者都上班睡覺，不工作，那麼兩人都拿不到獎金，只能拿2500。

（當然，假設「認真工作」「睡覺」和「說壞話」成本都完全相同。）

（另外，因為不許串通，所以B和C互相無法以任何方式交流或是轉讓錢。但B和C都知道領導的性格。）

————————————————————————————————————

結論：如果是單次博弈的話，這個問題就是囚徒困境。納什均衡點確實如其他答主所說，B和C都說對方壞話（也就是B出手心，C出手背）。關於囚徒困境的討論很多，我就不贅述了。

如果是多次博弈，則這個問題和囚徒困境不同之處好像在於：

1.「雙方都工作」（B和C都按照50%的概率隨機出）的總收益低於「一方睡覺，另一方說壞話」（也就是說，如果能私下串通，B和C應該約定好兩人出相同的，並按照50%的頻率來決定下一次一起出什麼。）

2.如果「一方睡覺，另一方說壞話」的行為被A看出了規律，則A可以迎合規律（出和那倆人不同的），保證自己不敗並且將這個策略的總收益降低到不如「雙方都招」的地步。

由於2把1抵消了的存在，所以這個問題倒是很簡單。B和C應當像知乎用戶：博弈論里的囚徒困境怎麼解決？這個答案一樣，決定自己是否和對方合作。如果合作就按照50%的概率決定自己出手心還是出手背。（如果嫌那個答案有點難以理解的話，推薦這個科普小遊戲The Evolution of Trust）

這樣子的有限合作可以讓A的敗率鎖定為25%，而B和C瓜分剩下的75%敗率。雖然A依然有優勢，但對B和C來說總比A敗率0%要好。

———————下面是腦洞，以及這個問題和囚徒困境的區別之一———————

畢竟ABC智力平等，其他條件也應當平等，所以不許私下串通的話如果B和C能靠暗示合作起來，A就能立馬看穿……等等，如果B和C之間有一套只有B和C才懂的暗號，而A和B之間、A和C之間也有呢？這也是一種平等嘛。（非要舉例的話，比如說A能背e和Φ，B能背π和e，C能背π和Φ，並且他們互相都知道別人能背哪個無理數。通過這種隨機數列，一次一位，奇數代表手心，偶數代表手背。這樣一來B和C就能通過把「π=3.14159265358979323846264……」轉化為「心心背心心心背背心心心背心心心心背心背背背背背背……」）

3人串通無意義，0人串通或1人串通更無意義，所以唯一值得發散討論的就是2人串通。

如果允許這種有限串通的話，B和C就能合作了。方法就是上述的那個「1.」里說的，「B和C約定好兩人出相同的，並按照50%的頻率來決定下一次一起出什麼。」

那麼，是否存在一種A和B合作的策略，讓B比起和C合作，同樣樂意和A合作呢？（當然，存在的話，A找C也行。）

答案是也存在。A一直出手心，B以50%的概率出手心就行了。

但無論是以上B和C的合作，還是以上A和B的合作，都存在一個致命缺點：

合作方案只能把第三人的敗率鎖定在50%，但第三人可以通過策略讓合作雙方其中一人敗率變為0%，另一人50%。第三人只需一直出手心或者一直出手背就行。

50%已經是最糟情況了。這意味著第三人可以輕易打壓合作雙方中的某一人，並以此作為脅迫拉攏他。

但A有辦法有限避免第三人的脅迫：如果A和B合作，只要A和B都以2/3的幾率出手心，C的敗率就會被鎖死在4/9，並且C最多讓A或B的敗率變為4/9。44.44%的敗率也很慘，但起碼比50%好一點。這是一個能讓第三人難以脅迫合作雙方的平衡點。

（PS3：想睡覺覺了，具體過程稍後再更新）

【A能選擇把B的敗率鎖死在44%，或者把C的敗率鎖死在44%。

敗率被鎖死的人可以決定剩下兩人的敗率，但最高不超過44%，最低不低於11%。】

————————————————————————————————————

（PS：你看我開頭說了兩個「好像其實」還有那個「根據我的直覺」，意思就是有錯請指出，有遺漏就補啦，畢竟我沒學過經濟學，純粹是野路子。

PS2：半夜寫這個腦洞的過程中我吃了2枚白煮蛋和一些花生……又影響到減肥計劃和睡美容覺了……）

寫完發現有大神用支付等值法做過了_(′?`」 ∠)_

這裡用期望得益最大來做麻煩了_(′?`」 ∠)_

以U表示手心，以D表示手背

設買單的人的payoff為-1，其他人為0

畫出支付矩陣：

數字從左到右依次為ABC三人的得益

先用劃線法看有沒有純策略納什均衡

看A的選擇，給定C選U、B選U，則A選D使自己得益最大，在上面矩陣左下角A的支付下劃線，餘下的同理；B、C同理，考慮C的時候，要跨矩陣看對應的方塊。如圖：

沒有三個數字都劃線的策略組合，即沒有純策略納什均衡。再考慮混合策略納什均衡，設ABC分別以概率pqs選擇U，則三人的期望得益，並對各自的概率求偏導，解出pqs：

所以，納什均衡策略是：

A以1/2的概率選擇U或D，B選U，C選D

最終博弈結果是：

A不用買單，BC各一半的概率買單，且取決於A的選擇。

反正我跟朋友出去吃飯，他們從來不同意AA，或者玩概率均等的遊戲決定。

因為跟他們認識這麼久，他們每次都沒我吃的多……

在任何2人都沒有互相串通的前提下：

3人隨便出付款概率是：A 1/4， B 3/8 C 3/8， A佔便宜了啊！B，C肯定不爽了，如果兩人都出一樣的，這樣A付款概率就可能達到1/2，但是沒有串通的前提下，還是偏向與隨機出的結果。

A選擇聲明自己怎麼出：

然後么就看BC對A是否達出拳一致了，如果都相信或都不相信，那A的付款概率都是1/2，剩下的是BC各1/4；如果BC出拳不一致，則A付款率0，BC各1/2。雖然綜合看概率和大家隨機出是一樣的，由於多了提示，BC會做同樣判斷，A是作死，結果為A 1/2，BC各1/4。

假設A是一個很靠譜的人BC都很願意相信他的話，假設A是一個很不靠譜的人，BC都不願意相信他的話:

智商已欠費的A君在作死的路上越走越遠，恭喜A君100% 成功千里送人頭。

結論就是：只要A誘使BC出拳不一致就能免單，即使BC出拳一致，A還是有1/2概率免單。做人留一線，日後好相見。智商不夠，錢包來湊。

不公平，BC應該拒絕。在完全隨機情況下有8種出手情況，BC付錢各有三種，三種情況看B可以知道出手背比出手心付錢的概率大兩倍，會傾向於出手心；同理C會傾向於選擇手背。A付錢有2種，手心手背概率相同，不會有傾向，即便知道BC傾向，對她也是一樣的，概率最低。假設買單只會玩一次遊戲，不會無限次玩，對BC太不利。

追問的回答。就這麼著，A還借著不公平玩弄BC，BC應該聯合起來讓A這個把他們當傻帽的人買單！

A，

手背，則B手心和C手背不付錢，B手心C手心不付錢，B手背C手背付錢，B手背C手心不付錢

手心，則B手心C手背不付錢，B手心C手心付錢，B手背C手背不付錢，B手背C手心不付錢

各1/4概率

B，

手背，則A手心和C手背付錢，A手心C手心不付錢，A手背C手背不付錢，A手背C手心付錢

1/2概率

手心，則A手心B手背不付錢，A手心B手心不付錢，A手背B手背付錢，A手背B手心不付錢

1/4概率

C，

手背，則A手心和B手背不付錢，A手心B手心付錢，A手背B手背不付錢，A手背B手心不付錢

1/4概率

手心，則A手心B手背付錢，A手心B手心不付錢，A手背B手背不付錢，A手背B手心付錢

1/2概率

這樣的話A隨機B手心C手背

難道還有更多選擇嗎？

A隨機，都是1/4概率，所以A確定隨機

B如果考慮他自己手心C手背A不付錢的概率，他選擇手背，那麼他變成了1/2的概率，對別人有影響嗎，沒影響，只有他自己的概率變大了，C同理。所以結果是，遊戲不公平。

描述增加的條件沒有改變概率

分頁阅读： 1 2