囚徒困境是怎麼被「解決」的

這是本專欄的第 41 篇日記

剛才在寫一個博弈論問題的回答,本來想舉 @王瑞恩 學長的這個回答做例子:

王瑞恩:關於人性,你最想講的一個故事是什麼?

這個「Split or Steal」的故事非常經典,我在本科的博弈論課上也聽過。

但是我重新讀了一遍,突然意識到——這就不是個囚徒困境問題啊

回顧一下原文的一些內容:

1) Abraham認為,當Nick鐵定要選steal的時候,自己選steal什麼都拿不到,自己選split反而可能分到一些;

2)於是,Nick鐵定要選steal的「宣言」使得Abraham選了split;

3)Nick最後轉而選擇了split。

這三點分別說明了:

1)當對方選steal時,選steal劣於split,這已經違反了囚徒困境的條件囚徒困境中,無論對方選什麼,steal都嚴格優於split,而在節目中,在對方steal的情況下,己方選擇steal還是split的收益是相同的,甚至由於期待對方可能良心發現,split的收益反而會更高一些,這時候構成的是Chicken Game(小雞博弈/懦夫博弈),該博弈有兩個純策略納什均衡,即對稱的一方選split,一方選steal;還有一個混合策略納什均衡,雙方各以一定概率選split或steal。

2)接上條,在囚徒困境中,由於雙方都會選steal,所以不存在First-mover advantage(先發優勢);但是在小雞博弈中恰恰相反,這個博弈是存在先發優勢的:當一方先承諾一定會選擇steal時,另一方的最優反應就是選擇split。換言之,如果這個博弈真的是囚徒困境,那Abraham也會毫不猶豫地選steal,然後換選split的Nick一定已經悔得腸子都青了。

3) Nick換選split的行為充分說明他的效用中包含了非經濟的因素。他完全可以仍然選擇steal並且事後五五分成,但是他選擇了同樣帶來一半金錢收益的split,同時收穫了別人對他人品的讚揚。這意味著原答中一開始給出的收益矩陣只是Outcome(結果,以金錢衡量),而不是Payoff(支付,以效用衡量),而囚徒困境中的數值(特別是大小關係)代表的一定是Payoff。Nick換選split再次說明,當對方選擇split時,起碼Nick認為選split的效用更高,同樣違反囚徒困境的條件

另外注意到,Abraham並不確定在自己選擇split時,Nick會認為split優於steal,這裡面還有不完全信息。如果不存在不完全信息,Abraham將知道:如果自己選steal,Nick會選split(顯然),如果自己選split,Nick也會選split(因為是完全信息,Abraham知道Nick的真實支付);這時候Nick的steal承諾就是不可信威脅,Abraham一定會選steal(或者也承諾steal)。

說到底,在這個電視節目中,一個不那麼在乎罵名的人的正確做法本來就是直接承諾steal,而且如果再承諾給對方分一部分甚至可以不用背罵名;進一步地,還可以上Commitment Device啊:直接簽一張承諾書,保證如果我選steal對方選split,一定給對方一半的收益,附上保證可兌現的支票;這樣對方再選steal那就是作死了。

小雞博弈中根本就沒有承諾自己一定會認慫來騙對方認慫這種玩法啊,與其說是Nick做得很聰明,不如說是前面那些上來就承諾split的人根本就不懂博弈論,而且他們能騙到對面完全是因為對面也不懂吧……換成是我,你承諾split?好啊,那我正好樂得承諾steal。

這不禁讓我想到一個關於讓梨的故事:

甲乙兩個人分一大一小兩個梨,甲伸手就拿大梨,乙不樂意了:你不知道「孔融讓梨」嗎?

甲說:那讓你先選,你會選哪個?

乙說:我會選小的那個呀。

甲說:小的那個不還在這裡嗎?

總結陳詞:那麼到底是什麼「解決」了囚徒困境呢?

是一個並非「囚徒困境」的「不完全信息」博弈。

這就好像你問我,為什麼不受力的物體不按照牛頓第一定律所說的,保持靜止或做勻速直線運動呢?

我告訴你,因為它不僅受力,而且我們TMD生活在魔法世界當中啊

(Photo credit: giulia.forsythe via Visualhunt.com / CC BY-NC-SA 2.0)


推薦閱讀:

如何識別個體在社交網路中的重要性?
演繹思維和訓練量
關於「圖書館自習」的一些想法
理解Aumann的論文 Agreeing to disagree
[博弈論]2.混合策略

TAG:博弈论 | 囚徒困境 | 微观经济学 |