3人聚餐後,想玩一個遊戲來決定誰買單,這個遊戲公平嗎?
3人先約定好誰當A、誰當B、誰當C,然後同時伸出手,每個人都只有手心朝上或者手背朝上2種選擇,然後統計手心朝上的人數:0人或3人則A買單,1人則B買單,2人則C買單。
在任何2人都沒有互相串通的前提下,這個遊戲公平嗎?如果不公平,哪方佔優哪方劣勢?
----------該問題於 2017-10-23 13:06 被編輯,作了以下擴充----------
A發現遊戲並不公平,於是他決定放棄優勢。在伸手前,他將會聲明自己怎麼出。作為一個無聊的人,他有50%的概率按聲明出手,也有50%概率戲弄B與C。
這樣會更公平嗎?
假設A是一個很靠譜的人BC都很願意相信他的話,假設A是一個很不靠譜的人,BC都不願意相信他的話,這樣還公平嗎?
題主增加了一問:
A發現遊戲並不公平,於是他決定放棄優勢。在伸手前,他將會聲明自己怎麼出。作為一個無聊的人,他有50%的概率按聲明出手,也有50%概率戲弄B與C。
這樣會更公平嗎?
但是A這個承諾毫無意義,因為大家都知道他會反悔,所以他無論說自己是手心還是手背都是廢話,相當於他直接聲明自己隨機一半一半的概率。既然A的策略依然是均衡策略,那麼B和C保持不變。遊戲並沒有變得更加公平。
下面是第一問的答案:
似乎我看到這種腦筋急轉彎的博弈題主要靠 @Richard Xu 關注……
首先,這是三個人的博弈,不能預先假設每個人都是隨機的來出正反。其次,三個人都沒有佔優策略,所以我們的思路是先假設沒有純策略,先計算出混合策略的概率,然後來算期望支付。
假定三個人出手心的概率為 ,那麼出手背的概率就是 。我們假定付錢效用為-1,不付錢效用為0.
ABC出手心手背的期望收益相等,對於A來說,如果自己出手心,那麼只有當其他人都出手心自己才付錢,如果自己出手背,那麼只有其他人都出手背才付錢,所以手心手背期望相等,就意味著:
對於B來說,B出手心,則只有另外倆人都出手背才付錢,B出手背,則任意一個人出手心付錢。
化簡之後得:
對於C來說,C出手心,只有另外兩個人有一個人出手心才付錢,C出手背,則另外倆人出手心才付錢:
化簡之後得:
現在就聯立解這三個式子,發現 , 也就是說在納什均衡的時候,C的均衡策略是出手背, B的均衡策略是出手心,然後A以1/2的概率出手背和手心。
這樣的話,A是始終不用付錢的,因為B和C的策略在均衡的時候是不同的;而B和C均有一半的概率付錢,完全取決於A是手心還是手背。
這個結論可能很難讓人接受,但是考慮到納什均衡的定義,如果一個狀態,沒有人能夠通過改變的自己的策略獲利,那麼這個均衡不管多麼不可能,都是納什均衡。我們就來看看B和C能不能做的更好:
- 如果C不選擇手背,選擇手心,其他人策略不變,那麼顯然,C在A選擇手背的時候要付錢,在A選擇手心的時候不付錢,依然是1/2的概率付錢;
- 如果B不選擇手心,選擇手背,其他人策略不變,一樣的,B會在A選擇手心的時候付錢,A選擇手背的時候不付錢,還是1/2的概率;
所以我們就得到了一個這樣的納什均衡,A是唯一一個隨機出手心手背的人,期望收益為0;而B出手心,C出手背,B和C的期望收益都為-0.5. 所以就可以回答題主的問題了,這是對A有很大傾斜的機制,均衡的時候A不但不用付錢,還有了隨機決定B和C誰付錢的權力。
我來試著解一下納什均衡解吧。
a出手心手背的最優概率為0.5這個應該不用解釋了。假設b選擇出手心的概率為x,c選擇出手心的概率為y,那麼b輸的概率是 ,c輸的概率是 ,兩人的最優策略就是最小化自己輸的概率。
下面考慮一下每個人的最優策略(best response):對於b來說,最優的x是
對於c來說,最優的y是
把這兩組最優策略結合起來,就可以得出納什均衡解
Edit:剛剛發現我的計算裡面有了漏洞。要保證a出手心的最優概率是0.5的話需要保證 ,所以最優解就是 ,而不是一個集合了。上面答案就不改了,反躬自省……
先上結論:不公平,如果三個人都機智而且不允許交流,那麼b一定會出手心,c一定會出手背,a一定不會輸,他隨便出什麼都行,而且其實是他決定誰會買單。
懟一下某答案:三個人勝利條件不一樣,假設他們手心手背概率相等??你這是認為他們完全沒有智商
我躺在床上用手機碼字……先不調整格式了
0.對a來說,整局遊戲都是對稱的,bc的地位,勝利條件……一切都是對稱的,如果bc都是理性的,他們採取的策略也應該是對稱的,所以他實際出什麼其實不會關係到自己的勝率
1.b和c也會看穿a的處境,於是a的行為不可預測,他們在考慮策略時,會認為a出手心手背的期望是相等的(這裡不太嚴謹,等有時間了會補充說明)
2.記b的策略是以概率x出手心,c的策略是以概率y出手心,則
也就得出了開頭的結論。其實這個思路有一點點跳步,最嚴謹的辦法是把a的策略也先寫成參數,再算策略的平衡點……但是已經躺在床上了還沒草稿紙╮(╯▽╰)╭
其實a這種策略完全是對的吧,在不能交流的情況下,以相等概率出手心手背的性質很好,也讓bc的策略變得簡單,這才讓自己利於了不敗之地嘛,bc按這樣推測a也是合理的
天哪我是第一個給出正確均衡解的,答案竟然還只是在這個排位,傷心……
哇我看見自己排到第三了,開心^_^謝謝大家(^o^)/YES!哈哈,博弈遊戲的前提條件是沒有愣頭青。不加這一天分析再多也沒有意義。
不公平,A會以且必須以50%對50%的概率隨機化自己的策略才能保證不輸,如此這般那B只會出手心,C只會出手背,輸贏全看A。
A之所以要隨機化是因為如果它的結果能被意料到,那麼是必輸的;之所以50%對50%是因為如果被察覺有某種偏好,那麼BC都會跟進這個偏好。
上面的回答都沒對第二個問題進行回答。
假設B、C相信A的話。
1、A聲明手心朝上。B只會跟,因為跟的收益最大,那麼C也只能跟。
2、A聲明朝下,從C來說,朝下是最好的策略,所以B也只能朝下。
所以,A只要以聲明相反的出法,基本是最不公平的。
如果B、C不相信A的話,那麼和其他人第一段的答案一樣。
為什麼不直接大撥碎
我是題主,看完了所有的回答和評論,受益匪淺。我也說說自己的看法。
如果這是一道筆試題,那麼所有與高贊回答持相同觀點的答案,都是這道題的標準答案,都能得滿分(誰讓我手賤,貼上了【納什均衡】的標籤呢)。
如果這是一道面試題,那就仁者見仁智者見智了。為了在眾多的面試者里脫穎而出,我會發表自己獨特的看法來博取面試官的好感。
(為了簡潔,我只說結論,具體的細節需要腦補)
首先A必需嚴格隨機出,才可以保證敗率不超過1/4。否則A只要有一丁點不隨機,BC有強佔優策略的一方會雷打不動地採用強佔優策略,然後另一方只好接受這個事實,進行自保,結果導致A的敗率大於1/2。因此A不敢不嚴格隨機。
當A嚴格隨機出的時候,BC就遇到了囚徒困境。由於不能串通,BC的敗率之和必定大於等於3/4。
當BC都採取各自的佔優策略(即互相背叛)時,那麼三方的策略就達到納什均衡了,這是此三人博弈里唯一的一個納什均衡點。
(找到納什均衡點就完了嗎?反正我自己還不滿足,很後悔自己手賤,貼上了【納什均衡】的標籤。拋開【納什均衡】的標籤之後,我又繼續思考了很多)
對BC來說,堅持採取納什均衡策略的結果實在是糟糕得不能再糟糕了:BC兩敗俱傷,敗率各為1/2,A坐收漁翁之利,敗率為0。
所以BC都很想逃出這個囚徒困境。所幸的是,這個囚徒困境並不難逃脫。
這個囚徒困境與一般的囚徒困境最大的區別是:當一方堅持背叛的時候,另一方選擇合作不會有任何損失。
因此當一方堅持背叛的時候,另一方為了逃出囚徒困境,會隨機亂出或者使用完全相反的固定策略去攪局,反正怎麼攪局都沒有任何損失嘛。於是很神奇的事情發生了:唯一的納什均衡點竟然會被人攪局,變得不穩定了!之所以會出現這樣的矛盾,是因為納什均衡理論是基於所有的參與者都是極端理性,完全沒有感情用事(並且【所有的參與者都是極端理性】是公共知識)的前提下得出的。
當參與者有感恩之心(如果你犧牲自己的利益,選擇不對我使壞,那麼我也會犧牲自己的利益,選擇不對你使壞)和報復之心(如果你堅持對我使壞,那麼我也會堅持對你使壞),並且【每個人都有感恩之心和報復之心】成為公共知識的時候,BC的最佳策略就變成合作了。結果雙方的敗率皆為3/8,A的敗率為1/4。
這對BC來說,是好得不能再好的結果了:BC合作雙贏,將敗率從1/2減小到了3/8,將A的敗率增大到了最大值1/4。
如果對我以上的思考還不滿足,可以看看這位答主的答案(做了更多的思考):
https://www.zhihu.com/question/67018671/answer/249626701
單從概率來說是a是1/4b是3/8c是3/8,但如果b出正則概率為1/4,出反為1/2,c出正概率為1/2,反則為1/4,如果只考慮自己的概率,那b必出正,c必出反,這樣a就擁有決策權,且a不會付錢,但如果b和c互相考慮對方或只有一方考慮對方又有不同的演算法,所以我覺得考慮到所有情況最後的概率還是會接近單純的概率,a1/4,b3/8,c3/8。
不公平,買單概率: a:2/8,b:3/8,c:3/8
先說明一下,這是我一口氣寫下來的,中間思緒重來過好幾次,所以可能有點混亂和錯誤。
稍後再整理
然後實名贊同WeineLi的答案(@不出來)
知乎用戶:3人聚餐後,想玩一個遊戲來決定誰買單,這個遊戲公平嗎?
多位答主算出了納什均衡點,但光算個納什均衡點真的算是解決了這個問題嗎?反正我是想得更多了一點,雖然可能有混亂和錯誤……權當拋磚引玉。先上結論。
雖然我是沒學過經濟啦……但Excel還是挺方便的。
————————————————————————————————————————
1.這個問題的納什均衡點看起來十分反直覺好像其實是因為,這個問題本質上好像其實就是囚徒困境
2.如果進行重複博弈,允許串通的話,最後B或C會成為最大輸家(或之一)。
————————————————————————————————————————
說說我的看法。「A應該按照50%的概率出」看起來挺合理的,就以這個為前提來。那麼這個問題其實就變成了囚徒困境。如下圖。(括弧內為A、B、C的「收益」。敗率為0記為8,敗率為0.125記為7,敗率為0.25記為6,敗率為0.375記為5,敗率為0.5記為4)(下圖中的「隨機」指「50%出手心,50%出手背」)
對於B和C來說,問題基本可以改成這樣(想這個例子花了我不少時間,重寫了五六次= =):
B和C一起工作。
如果B按部就班的工作,C上班睡覺,那麼B會拿5000元,C只能拿到2500工資。
如果B按部就班的工作,C去說B的壞話,那麼B只能拿2500工資,C會拿5000。
如果B睡覺,C去說B的壞話,領導會覺得很有道理,給C發7500元獎金,也就是說B只能拿2500,C能拿10000。
以上三條反之亦然。
如果B和C都按部就班的工作,那麼兩人都能拿2500基礎工資+1250獎金=3750元。
如果B和C都只說對方壞話,或者都上班睡覺,不工作,那麼兩人都拿不到獎金,只能拿2500。
(當然,假設「認真工作」「睡覺」和「說壞話」成本都完全相同。)
(另外,因為不許串通,所以B和C互相無法以任何方式交流或是轉讓錢。但B和C都知道領導的性格。)
————————————————————————————————————
結論:如果是單次博弈的話,這個問題就是囚徒困境。納什均衡點確實如其他答主所說,B和C都說對方壞話(也就是B出手心,C出手背)。關於囚徒困境的討論很多,我就不贅述了。
如果是多次博弈,則這個問題和囚徒困境不同之處好像在於:
1.「雙方都工作」(B和C都按照50%的概率隨機出)的總收益低於「一方睡覺,另一方說壞話」(也就是說,如果能私下串通,B和C應該約定好兩人出相同的,並按照50%的頻率來決定下一次一起出什麼。)
2.如果「一方睡覺,另一方說壞話」的行為被A看出了規律,則A可以迎合規律(出和那倆人不同的),保證自己不敗並且將這個策略的總收益降低到不如「雙方都招」的地步。
由於2把1抵消了的存在,所以這個問題倒是很簡單。B和C應當像知乎用戶:博弈論里的囚徒困境怎麼解決?這個答案一樣,決定自己是否和對方合作。如果合作就按照50%的概率決定自己出手心還是出手背。(如果嫌那個答案有點難以理解的話,推薦這個科普小遊戲The Evolution of Trust)
這樣子的有限合作可以讓A的敗率鎖定為25%,而B和C瓜分剩下的75%敗率。雖然A依然有優勢,但對B和C來說總比A敗率0%要好。
———————下面是腦洞,以及這個問題和囚徒困境的區別之一———————
畢竟ABC智力平等,其他條件也應當平等,所以不許私下串通的話如果B和C能靠暗示合作起來,A就能立馬看穿……等等,如果B和C之間有一套只有B和C才懂的暗號,而A和B之間、A和C之間也有呢?這也是一種平等嘛。(非要舉例的話,比如說A能背e和Φ,B能背π和e,C能背π和Φ,並且他們互相都知道別人能背哪個無理數。通過這種隨機數列,一次一位,奇數代表手心,偶數代表手背。這樣一來B和C就能通過把「π=3.14159265358979323846264……」轉化為「心心背心心心背背心心心背心心心心背心背背背背背背……」)
3人串通無意義,0人串通或1人串通更無意義,所以唯一值得發散討論的就是2人串通。
如果允許這種有限串通的話,B和C就能合作了。方法就是上述的那個「1.」里說的,「B和C約定好兩人出相同的,並按照50%的頻率來決定下一次一起出什麼。」
那麼,是否存在一種A和B合作的策略,讓B比起和C合作,同樣樂意和A合作呢?(當然,存在的話,A找C也行。)
答案是也存在。A一直出手心,B以50%的概率出手心就行了。
但無論是以上B和C的合作,還是以上A和B的合作,都存在一個致命缺點:
合作方案只能把第三人的敗率鎖定在50%,但第三人可以通過策略讓合作雙方其中一人敗率變為0%,另一人50%。第三人只需一直出手心或者一直出手背就行。
50%已經是最糟情況了。這意味著第三人可以輕易打壓合作雙方中的某一人,並以此作為脅迫拉攏他。
但A有辦法有限避免第三人的脅迫:如果A和B合作,只要A和B都以2/3的幾率出手心,C的敗率就會被鎖死在4/9,並且C最多讓A或B的敗率變為4/9。44.44%的敗率也很慘,但起碼比50%好一點。這是一個能讓第三人難以脅迫合作雙方的平衡點。
(PS3:想睡覺覺了,具體過程稍後再更新)
【A能選擇把B的敗率鎖死在44%,或者把C的敗率鎖死在44%。
敗率被鎖死的人可以決定剩下兩人的敗率,但最高不超過44%,最低不低於11%。】
————————————————————————————————————
(PS:你看我開頭說了兩個「好像其實」還有那個「根據我的直覺」,意思就是有錯請指出,有遺漏就補啦,畢竟我沒學過經濟學,純粹是野路子。
PS2:半夜寫這個腦洞的過程中我吃了2枚白煮蛋和一些花生……又影響到減肥計劃和睡美容覺了……)
寫完發現 有大神用 支付等值法 做過了_(′?`」 ∠)_
這裡用 期望得益最大 來做 麻煩了_(′?`」 ∠)_以U表示手心,以D表示手背
設買單的人的payoff為-1,其他人為0畫出支付矩陣:數字從左到右依次為ABC三人的得益
先用劃線法看有沒有 純策略納什均衡
看A的選擇,給定C選U、B選U,則A選D使自己得益最大,在上面矩陣左下角A的支付下劃線,餘下的同理;B、C同理,考慮C的時候,要跨矩陣看對應的方塊。如圖:沒有三個數字都劃線的策略組合,即沒有 純策略納什均衡。再考慮混合策略納什均衡,設ABC分別以概率pqs選擇U,則三人的期望得益,並對各自的概率求偏導,解出pqs:所以,納什均衡策略是:A以1/2的概率選擇U或D,B選U,C選D最終博弈結果是:A不用買單,BC各一半的概率買單,且取決於A的選擇。反正我跟朋友出去吃飯,他們從來不同意AA,或者玩概率均等的遊戲決定。
因為跟他們認識這麼久,他們每次都沒我吃的多……
在任何2人都沒有互相串通的前提下:
3人隨便出付款概率是:A 1/4, B 3/8 C 3/8, A佔便宜了啊!B,C肯定不爽了,如果兩人都出一樣的,這樣A付款概率就可能達到1/2,但是沒有串通的前提下,還是偏向與隨機出的結果。
A選擇聲明自己怎麼出:
然後么就看BC對A是否達出拳一致了,如果都相信或都不相信,那A的付款概率都是1/2,剩下的是BC各1/4;如果BC出拳不一致,則A付款率0,BC各1/2。雖然綜合看概率和大家隨機出是一樣的,由於多了提示,BC會做同樣判斷,A是作死,結果為A 1/2,BC各1/4。
假設A是一個很靠譜的人BC都很願意相信他的話,假設A是一個很不靠譜的人,BC都不願意相信他的話:
智商已欠費的A君在作死的路上越走越遠,恭喜A君100% 成功千里送人頭。
結論就是:只要A誘使BC出拳不一致就能免單,即使BC出拳一致,A還是有1/2概率免單。做人留一線,日後好相見。智商不夠,錢包來湊。
不公平,BC應該拒絕。在完全隨機情況下有8種出手情況,BC付錢各有三種,三種情況看B可以知道出手背比出手心付錢的概率大兩倍,會傾向於出手心;同理C會傾向於選擇手背。A付錢有2種,手心手背概率相同,不會有傾向,即便知道BC傾向,對她也是一樣的,概率最低。假設買單只會玩一次遊戲,不會無限次玩,對BC太不利。追問的回答。就這麼著,A還借著不公平玩弄BC,BC應該聯合起來讓A這個把他們當傻帽的人買單!
A,
手背,則B手心和C手背不付錢,B手心C手心不付錢,B手背C手背付錢,B手背C手心不付錢手心,則B手心C手背不付錢,B手心C手心付錢,B手背C手背不付錢,B手背C手心不付錢各1/4概率B,手背,則A手心和C手背付錢,A手心C手心不付錢,A手背C手背不付錢,A手背C手心付錢1/2概率手心,則A手心B手背不付錢,A手心B手心不付錢,A手背B手背付錢,A手背B手心不付錢1/4概率C,手背,則A手心和B手背不付錢,A手心B手心付錢,A手背B手背不付錢,A手背B手心不付錢1/4概率手心,則A手心B手背付錢,A手心B手心不付錢,A手背B手背不付錢,A手背B手心付錢1/2概率這樣的話A隨機B手心C手背難道還有更多選擇嗎?A隨機,都是1/4概率,所以A確定隨機B如果考慮他自己手心C手背A不付錢的概率,他選擇手背,那麼他變成了1/2的概率,對別人有影響嗎,沒影響,只有他自己的概率變大了,C同理。所以結果是,遊戲不公平。描述增加的條件沒有改變概率