「囚徒困境」有哪些現實的例子?
摘自百度百科:囚徒困境_百度百科
「囚徒困境」是1950年美國蘭德公司提出的博弈論模型。兩個共謀犯罪的人被關入監獄,不能互相溝通情況。如果兩個人都不揭發對方,則由於證據不確定,每個人都坐牢一年;若一人揭發,而另一人沉默,則揭發者因為立功而立即獲釋,沉默者因不合作而入獄五年;若互相揭發,則因證據確實,二者都判刑兩年。由於囚徒無法信任對方,因此傾向於互相揭發,而不是同守沉默。
難道最經典的不是「不要讓孩子輸在起跑線上」?
我寫過一篇B2C電子商務的囚徒困境,或許可以用來作為一個現實的例子來回答上面的問題。因為有上下文的關係,所以我這裡保留了全文。
天貓淘寶電商賣家應該了解的囚徒困境
「囚徒困境」是個博弈理論的一個模型,它對於賣家來說,有實戰的意義。天貓,京東,亞馬遜,風水輪流轉,遊戲規則常常變。伴隨著電商環境的流轉和變化,很多「乾貨」很快就變得沒用了。但是也有一些理論知識,不管中國的電商怎麼變,它都會一直發光,一直能給你帶來新的洞察和靈感。這樣的理論和知識,還是要好好研究一下。「囚徒困境」這個模型,就是這些重要知識中的一個。
先把什麼是「囚徒困境」解釋一下。如果你已經了解過博弈論的相關內容,可以跳過這一部分。或者如果你想要得到更詳細更好的解釋,那也可以去Wiki或者別的知識網站看。
一個犯罪團伙的兩個成員(A和B)被拘捕了,他們完全被隔離開,互相之間絕對沒有辦法互通消息。警方目前缺乏證據,無法以他們所共犯的主要罪行來將他們定罪。但是警方手裡有一些次要證據,可以較輕的罪名判他倆各一年。於是警方對他們分別同時提出了「浮士德」交易的條件(別管浮士德是什麼,這不重要):
1. 如果A和B都供述罪行,那麼每人判兩年。
2. 如果A供述,B不供述,那麼A可釋放,B要坐3年牢(反之亦然)3. 如果A和B都不供述,那麼他們每人要判一年。我再解釋的清楚一些。A和B對上面交易的3個條件各自都很清楚明了地知道。也就是說,他們知道警察手裡的證據只夠判每人一年的,如果沒有這個交易,他倆也就是各坐一年牢完事。有了這個交易,他倆只要都不認罪,也還是只要坐一年。
另一個重要的假設條件:他倆都是所謂的「經濟人」。也就是說,他們每個人做出的決策,都會以自己的利益最大化為目的。在這個「遊戲」中,如果某犯的選擇是不供述,那麼我們把他的選擇叫做「合作」(意指他試圖採取跟另一名罪犯合作的策略,當然他必須指望對方也合作,才能獲益);如果某犯選擇了供述,那麼我們把他的這個選擇稱作「背叛」。
說到這裡,我把關於這個交易該交代的都交代了。但是我多次發現,對於理科生,這些信息已經夠了,但是文科生常常沒看明白。鑒於電商多有文藝青年出身的掌柜,這裡我再給一個文科生專用案情詳述(理科生跳過吧):
A和 B一起持槍搶銀行,目前被拘捕關押,互相隔離。他們被抓的時候,隨身搜出了沒有登記過的點22口徑手槍。但是除了非法持槍這個鐵證之外,檢方並沒有確鑿的證據來起訴他們搶銀行的罪行。他們知道檢方證據不足,所以他們現在只要一口咬定沒搶銀行,那就最多因非法持槍罪判一年。
對於警察來說,這也是個無奈的局面,誰讓他們抓不到證據呢? 可是這時有個年輕的檢察官說:我有辦法。這個聰明的檢察官分別給A和B提供了相同的選擇。他對他們分別說:
「你好哥們!我是地區檢察官柯南。我現在經授權可以和你達成一個交易。交易的條件是這樣的:你現在可以選擇沉默,也可以選擇把搶銀行的事供出來。如果你供述了,而你的同夥保持沉默,那我可以放了你,但是你的同夥要判三年。反過來,如果你沉默,但是你同夥供述了,那同樣,他就自由了,你要坐三年牢。如果你們兩個人都供述認罪了,那你們各自要坐兩年牢。但是如果你們倆都沉默,那我就只能以非法持槍罪起訴你們,每人判一年。你好好想想吧,明天早上之前寫好你的選擇,交給獄卒。」
於是,在這個夜晚,A和B都將輾轉反側,權衡利弊,做出對自己最有利的選擇。
他們各自的選擇會產生4種可能的結果,我在這裡把這4種結果都列出來:
好,我們來看一下他們的選擇思路。假設你是A,你現在不知道B會怎麼選,所以你必須考慮B做出每一種選擇可能給你帶來的後果。
假如B選擇了沉默,那麼你現在做哪個選擇更划算呢?如果你沉默,那你坐一年牢;如果你供述,那麼你可以不坐牢。所以如果B沉默的話,你應該選供述更划算。
假如B選擇了供述,那你的兩種選擇分別會帶來什麼樣的後果呢? 如果你沉默,那你要坐3年牢;如果你供述,那你要被關2年。2年 v.s. 3年,那還是選供述更划算。
於是,無論B做哪個選擇,你都應該選擇供述更划算。於是,「供述」便是A唯一合理的理性的,利益最大化,損失最小化的選擇。
同樣的道理,B也會選擇供述。這樣一來,第二天早上我們這位聰明的檢察官將會毫無懸念地得到兩份認罪供述。
這個毫無懸念的結局就是經典囚徒困境的唯一答案(囚徒困境有其他條件變化而產生的變體,答案也隨之會變化)。兩個囚犯被這個遊戲逼入了一個悲慘的困境,明明有一個「你好我也好」的可能,但是偏偏結果卻必然是「你不怎樣我也不怎麼樣」。而這個必然的結局就是著名的「納什均衡點」。
接下來我們本來應該把這個遊戲的結果,和對它的意義的思考,仔細地展開討論。不過這裡我先插入一個和電商賣家相關的情境,趁熱打鐵,把我們最終要觸及的話題趕緊先推出來亮亮相。
假設你是一位買家,想在網上購買一件商品(我本來想舉一個具體的商品例子,比如衣服鞋子什麼的,但是這樣一來只怕會太具象,以至於局限了我們討論和思考的範圍,所以我還是決定在此討論某件抽象的商品。故此要向文科生表示抱歉了。)。這件商品按品質大致可以分為兩種:高質量,和低質量。可是因為你是在網上購買,沒法對實物進行考察和測試,所以你不知道你現在加入購物車的這件究竟是高質量的,還是低質量的。賣家雖然明確把他的商品的質量等級向你表明了,但是你不知道他說的是真是假。
這個商品也有兩個不同的價格,高價和低價。所以你面臨著4種可能的結果:高價高質,高價低質,低價高質,低價低質。
我們把你購買這件商品所得到的價值回報用貨幣金額的數值來表達:
假如你出高價買到了高質的商品,那麼你的價值回報是7元(多出些錢買到一個好東西,還是值得的)。
假如你出低價買到了高質的商品,那麼你的價值回報是10元(這麼便宜買到這麼好的寶貝,賺大了)。假如你出高價買到了低質的商品,那麼你的價值回報是 -5元(我擦,被宰了)假如你出低價買到了低質的商品,那麼你的價值回報是3元(買的就是便宜貨嘛,就這樣了)好,我們先把這位買家放一邊不說(雖然他的選擇已經有了,你可以自己幫他計算一下應該怎麼選)。現在我們來看看賣家的情況。賣家同樣也有4種選擇:高價賣高質,高價賣低質,低價賣高質,低價賣低質。賣家在這4種情況下得到的回報金額是:
假如他以高價賣掉了高質的商品,那麼他得到的回報是7元(賣好東西,賺好利潤,不錯啊)
假如他以低價賣掉了高質的商品,那麼他得到的回報是 -5元(砸手裡了,虧啊)假如他以高價賣掉了低質的商品,那麼他得到的回報是10元(宰到了!)假如他以低價賣掉了低質的商品,那麼他得到的回報是3元(天生就是擺地攤的)現在兩邊的情況都已經清楚了,你可以自己參考上面囚徒困境的表格來計算一下最終的結局了。
在這個遊戲里,無論賣家如何選擇,買家總是出低價更划算;另一方面,無論買家如何選擇,賣家總是提供低質商品更划算。這是買家和賣家之間的囚徒困境 - 明明有一個大家都能獲得更好的回報的可能性,可是博弈的結局卻註定了是一個對雙方來說都更差的結果。
囚徒困境是一個靜態條件下的博弈遊戲,如果對它的條件進行改變的話,那麼就能夠走出困境的宿命,改變最終的結果。
最直接來說,如果這兩個囚徒能夠有機會商量一下,或者有辦法找人送個口信的話,那麼他們就可以同時選擇更好的結果。問題是,他們互相信任嗎?他們會抵制住背叛承諾的誘惑嗎? 畢竟,背叛可以得到更好的結局。這時候,可信度就變得非常重要了。
可信度可以來自於聲譽。假如這兩個囚犯是田伯光和岳不群,那麼囚徒困境的答案根本不會改變。但是如果是風清揚和令狐沖,那麼走出困境就指日可待了。
可信度也可以來自面臨的後果。如果一個犯罪團伙的幫規是要殺了背叛同夥的人,犯我幫規者,雖遠必誅,那麼合作就變得可信了。
又或者假如這個遊戲不是一次性的,而是要不斷重複下去的,那麼雙方的計算也會改變。因為總不能一直這麼虧下去吧? 其中的一方或許會選擇吃幾次虧,讓對方看到誠意,於是雙方達成長期的合作,避免了持續的困境。
對於賣家來說,你如果能夠成功地發出信號,讓買家看到你不是田伯光,而是令狐沖,那麼這就是走出囚徒困境的一條光明大道。
因此賣家需要思考的是:我怎樣才能發出可信的信號給買家? 還有一點非常重要:你的商品的品質或者功效,買家在買回來之前越難以進行評估,你發出的信號就越重要。
比如香水,你無論用多少形容詞來描述你的香水,買家都沒法判斷它究竟是個什麼味道。所以香水品牌喜歡在雜誌中提供小樣。當然,香水你只要買回來,還是可以馬上知道它的味道的。還有些商品,你買回來用了,依然很難做出評估。
比如減肥產品,買家無論如何事先都很難評估它的效果的,而且買回來也要過很長一段時間才能做出評估。其他比如以耐用性為主要賣點的商品,也有同樣的問題。於是「無效退款」,「延長保質期」等等承諾,都可以成為賣家發出的信號。可是接下來問題又來了:我真的信你能實踐你的承諾嗎?這個山寨大國里,有什麼承諾是可信的嗎?
更有甚者,有些東西買家買回去,消費完了,體驗完了,但還是無法對它的品質進行評估。比如任何吃的喝的,我作為消費者,吃完了喝完了,我真的知道我吞到肚子里的是什麼東西嗎? 這花生是不是發霉變質的又重新加工的?這咖啡是不是從非洲哪個國家收購來的陳年廢料加工的?
那麼現在,請你思考,你能做些什麼,讓你發出的信號給人靠譜可信的感覺呢?
在一個正常的商業環境里,我們還是可以想出很多辦法來的。可是我們所在的這個環境正常嗎?
我們可以把店鋪精心地裝修一番,把詳情頁做到細緻美觀,信息充分,讓買家體會到我們是很用心的,我們對品質的關注滲入到了我們日常經營的方方面面。可是轉眼,我們的這些創造都被那些地攤貨賣家複製了。信號無效。
我們可以用心地提供實物拍攝,讓買家看到我們商品的實際情況,所見即所得。可是你一回頭,發現那些地攤貨賣家直接從韓國日本網站盜來的圖片,比你的實拍圖好看多了。日本人韓國人的圖片連水印都沒有,買家哪裡分辨的清? 信號無效。
我們可以努力地積累好評和信用,以歷史事實來說話。可是,不用說你也知道 - 信號無效。
我們可以努力經營自己的品牌,讓買家看到我們是有擔當有願景的,我們有足夠的動力和激勵來提供更好的價值。然而,你看到那些地攤貨也開起了旗艦店,用網路上偷來的圖片,以地攤的價格甩著低質的廉價貨。買家是買你的還是買他的? 我們從囚徒困境中已經找到答案了 - 當然是買他的。
劣幣驅逐良幣,這就是囚徒困境帶來的結局。當你做出的各種擺脫囚徒困境的努力都失效時,事情就又回到了起點,也就是說,你沒能擺脫這個困境。
因此,囚徒困境不僅僅是你作為一個賣家所遭遇的困境,也不僅僅是買家白白被葬送的可以獲得更高回報價值的機會。囚徒困境是整個電商環境的困境,是天貓和淘寶應該面對卻始終逃避的局面。馬雲如果能夠面對這個現實,如果能夠做出改變,那麼短時間內或許他會損失一部分銷售額,但最終他將為買家,賣家,和平台都創造出更高的回報。另一方面,如果說在天貓和淘寶,信號都已經失效了,那麼就意味著,下一個有可能挑戰馬雲的人,將會是一個能夠構建起一個確保釋放有效信號的平台的人。這樣的平台,如果建起來的話,我一定會投奔的。
於此同時,你作為一個有戰略眼光的賣家,也不是束手待斃的。從囚徒困境這個模型中,你看到了一些關鍵的癥結,那麼現在你就可以發揮你的創造力了。你應該怎樣才能更好地向你的買家和潛在買家持續發出有效的可信的信號,這樣一個思路是不是為你打開了一扇門了呢?
商業是一個神秘的事物,或許它的本質是一個永遠不得而知的秘密。我們能夠做的,就是接受新的知識,從而產生新的視角,新的分析,新的洞見,以致新的靈感和創意。囚徒困境模型,也是這樣的一個知識點。了解它,運用它,拿它來磨礪一下你的商業思路,靈感的火花就會閃耀起來。畢竟,諾貝爾獎不是白給的。1. 核軍備競賽;2. 女人使用化妝品;3. 運動員使用「類固醇」,「興奮劑」;4. 氣候談判;5. 歐佩克石油定價;6. 散戶恐慌引發的股災;7. 國產手機價格戰;8. 份子錢;9. 「大家都X,有什麼辦法呢?」
@Roland Xu 所說的案例太過……呃……經典了。最近看到一個不怎麼經典然而確實很有趣的案例,以饗各位:Prisoner』s Dilemma Everywhere: Surge Pricing And The Uber Driver Strike(Wordpress搭建的博客,可能需要科學上網。)
Uber Drivers tried to organize a strike to demand higher pay.
Uber drivers are competing with each for fares. The smaller the number of other drivers on the road, the greater the chance a driver get business. Also, when demand for rides outstrips supply of drivers, Uber might activate surge pricing to increase supply. Not only does a driver stand to get more business, he gets a higher fare/mile. The incentives to deviate from the strike are huge.
So, in Chicago, during the supposed strike, the number of Uber Drivers on the road was huge. Surge pricing was not activated because it was not necessary.
HT: An Uber driver.
一些美國的Uber司機打算進行一場罷工以提高自己的收入,比如他們希望在APP上設置小費的選項,提高起步價和每公里價格,於是他們做了上面這樣的海報。底下是教授的分析:
Uber司機相互之間存在費用的競爭。在路上的其它司機越少,某位司機自己攬到客人的幾率越高;同時,當用車的需求遠超司機的供給時,Uber會啟動「浮動定價」來增加供給。所以一名司機(如果不參加罷工)不僅能夠獲得更多的生意,而且每英里的費用還能提高。這給不參加罷工提供了很強的激勵。
所以在芝加哥,在本應當是罷工的時間段,路上的Uber司機數量仍然非常巨大,完全沒有必要啟動」浮動定價「。利益相關:Uber司機。
我來釣個魚,看多少人上鉤。這個例子出自李俊慧《經濟學講義》,李是引用了別人的,這裡摘錄引用部分,她後面引用完了還有段自己的評論,這段評論就不摘錄了:
經濟學家用這「囚徒困境」解釋美蘇軍備競賽的現象。當年美國和蘇聯都花巨資擴張軍備,尤其是製造核武器,一旦爆發戰爭只會是互相毀滅、同歸於盡,於是誰都不敢開打,世界是和平的。而如果兩國都不製造核武器,雙方都沒有軍事能力開打,世界還是和平的。然而前者要多費了無數金錢用于軍事開支,顯然是比較糟糕的處境。那為什麼美蘇兩國還是要選擇進入這樣的糟糕境地之中呢?就是因為如果一國製造核武器而另一國不製造,有核武器的那一國的軍事實力就會壓倒另一國,另一國只好事事聽從對方,在外交、甚至可能在內政上都喪失了話語權,於是沒有一個國家敢不製造核武器。現實生活中這種問題很多啊。之前我就看到一個評論,最好的養老的方法就是別人拚命生小孩我丁克。其實這就是一個囚徒困境的翻版。只有你一個人生你覺得很虧,這個是沒錯的。但是囚徒困境之所以是一個問題,原因在於囚徒之間是無法交流的。但是現在我們互聯網這麼發達,誰跟誰不能說話,人類卻還陷入到這種困境裡面,真是太可憐了。這證明人跟人之間並不是不能交流從而陷入囚徒困境,而是因為不能互相信任,所以才陷入囚徒困境的。
說不定所謂的智慧生物的大過濾器,就是:」只有會導致在將來滅絕的特性才有可能產生智能「呢。你看人家綠綠雖然也由內鬥,但是人家的大方向多一致,互相之間都有飛仙的信任,真的是只有導致毀滅的特性才有可能產生繁榮,正如智慧生物都一定會死一樣。
有些時候就覺得,不如把那些傾向於不相信別人的人都自爆,看看剩下的那一小撮(如果存在的話),是不是能夠擔當起殖民銀河系的重任。
關於課程成績的啊老師說不強制寫論文,但是寫論文可以加分,即使大家都約定好不寫論文,也是會出現叛徒為了加分寫論文,最後的結果就是所有人都寫論文了。。
實習!大家都認為實習能讓自己在找工作中受益,然而卻導致了公司大量僱傭實習生幹活,年年縮減招人指標,就業一年比一年難sad…
我說一個沒人提的吧:遠光狗就是囚徒困境的典型代表。
中國的酒局廣義上講也是一個囚徒困境。
都知道喝酒傷身體,但為什麼大家在飯桌上還是要喝酒呢?這其實就是個囚徒困境。
中國人要面子,覺得喝酒是一種(用不惜傷害自己身體的方式)表達對領導的尊重和服從的心態。領導也不能隨便擺架子,所以別人給他敬酒他也要回敬,否則顯得失禮。但這終究只是個形式,實質的結果是雙方都對自己的身體造成了傷害。
之所以成為現在這個樣子,還是因為彼此要面子,以及彼此之間的不信任。明明雙方都不喝酒的話,既不傷身體也不傷感情,但偏偏就是害怕對方會找自己敬酒,要是自己不喝的話就顯得失禮,所以雙方都選擇了喝酒。
而我早就看穿了這裡面的貓膩,我知道老闆不會因為我這次飯桌上不喝酒不敬酒下次就給我穿小鞋(真要這樣做的話這家公司我不呆也罷),所以我從來不主動喝酒,如果有人執意要勸酒,我就會說,我是好孩子,所以我不喝酒,言外之意就是喝酒的肯定不是好孩子。我可是想活到 2112 年去看真的哆啦 A 夢的,現在這麼糟蹋身體還了得?
拆遷動員
工人為了提高待遇而罷工,老闆提高不罷工的部分工人的待遇
這就需要工會來破這個局在囚徒困境中,如果囚徒知道自己招了的話出去會被老大殺全家(降低了招認的收益),就會選擇沉默工會就是負責殺招供者全家的——————————
說個親身經歷的去年我哥辭職 一直閑著 臨近過年打算賣鞭炮因為統一管理 我們那一片買鞭炮的都集中在一條街
我們攤位在最西——————背景——————一盤一萬響的鞭炮進價99 賣出去可以拿10%回扣也就是9.9 因為比較貴買的不多 又是第一次干這種買賣 所以定價就是99 進價來進價走 只拿個回扣錢第二天東邊的老行家過來了,幹了五六年的老油子,跟我哥問價,說大家這麼賣不行啊 ,大過年的這麼冷,一支炮仗才掙幾塊錢,都被你們這些新來的打亂價格了,咱統一定個價 ,120。
我哥一聽 , 大家都賺錢,遇到砍價的讓他10塊也比原來賺錢多,就答應了。結果所有從我們這邊問價過去的都沒回來買
——%—————%————後來我哥讓我去他們家問問 假裝買鞭炮(那天我正好點貨 老油子沒看見我)丫的看我是從西邊過來的 一開口就是110 我說我多要點105後來我哥也學聰明了 只要是從東邊過來的 99進價給_(:_」∠)__(:_」∠)__(:_」∠)_如果大家都漲價,都賺錢,但是東邊的為了留住客戶降價,西邊的一分賺不到。——————————————————————————這個本人親身經歷_(:_」∠)_就是不知道算不算的上囚徒困境 我感覺蠻像的商場如戰場啊寫一個商業的代理這家企業,給各個代理商都有區域劃分,最初給我們是一個省,目的是打開南方某省的市場。過了三年多,品牌知名度提高了,僅次於進口的蓋茨和三之星、奧比特,價格(批發)相當於國外品牌的一半。然而,企業空降三個(或是更多)代理商制衡,我們也「降級」為一級代理。然後,整個市場開始混亂,為了奪取市場份額,打價格戰,甚至派出業務員地毯式地向既定區域外以低於廠家的價格傾銷。08年至今,一些小的代理商被大的吃掉或掛靠在大的名下。實際銷售區域相互重疊,你低價,我也低價,向企業提,石沉大海。就這樣維持現狀,誰也吞不了誰。如同樓上寫的買炮仗的一樣,協商定價,那是做白日夢。低,還有更低,廠價,包郵,扣返點,虧本都要佔領市場份額。商場如戰場,這樣的抗戰,算算也第九個年頭了。………………………第一次寫這麼多,排版不好,望諒解。………………………
排隊,大家都好好排隊都能按順序來,有人插隊,他就能獲得最大利益,但其他人就要因此多花時間,所以最後大家都會插隊。其實我還有個問題,按經濟學的原理來說,既然大家都插隊是必然的結果,但有的時候還是會有秩序井然的隊伍,就比如說wow中排隊做任務,這甚至是沒有什麼利益激勵的,這是為什麼呢?