博弈論的囚徒困境和懦夫遊戲(chicken game)有什麼區別?

希望能解說的詳細點兒,純外行。


囚徒困境(Prisoners Dilemma)是博弈論和非零和博弈中具代表性的例子,反映個人最佳選擇並非團體最佳選擇

經典的囚徒困境

警方逮捕甲、乙兩名嫌疑犯,但沒有足夠證據指控二人有罪。於是警方分開囚禁嫌疑犯,分別和二人見面,並向雙方提供以下相同的選擇:

  • 若一人認罪(Confession)並作證檢控對方(術語稱為背叛(Defection)對方),而對方保持沉默,此人將即時獲釋,沉默者將判監10年。
  • 若二人都保持沉默(術語稱為合作(Cooperation)),則二人同樣判監1年。
  • 若二人都互相檢舉(互相背叛(Mutual cooperation)),則二人同樣判監2年。

用支付矩陣(Payoff matrix)模型表示如下:

囚徒困境假定每個囚徒只尋求自身最大利益,而不關心另一參與者的利益。就個人理性選擇而言,檢舉背叛對方所得刑期,總比沉默要來得低。試設想困境中兩名理性囚徒會如何作出選擇:

  • 若對方沉默、我背叛會讓我獲釋,所以會選擇背叛。
  • 若對方背叛指控我,我也要指控對方才能得到較低的刑期,所以也是會選擇背叛。

無論對方選擇何種策略,我選擇背叛的結果,都不會比對方吃虧。背叛即為兩種策略(合作或背叛)當中的支配性策略(Dominant Strategy)。

(背叛,背叛)是囚徒困境中唯一的納什平衡,而另外三種情況(合作,合作),(合作,背叛),和(背叛,合作)是帕累托最優。其中,(合作,合作),因為兩人總判刑時間最短,使社會福利(Social welfare)最大化。有效地證明了:非零和博弈中,帕累托最優和納什均衡是互相衝突的。

這裡再簡單介紹一下納什均衡(Nash Equilibrium),帕累托最優(Pareto Optimal)

納什均衡(非合作賽局平衡):如果某情況下無一參與者可以通過獨自行動而增加收益,此策略組合被稱為納什均衡,在上述環境中,沒有一名囚徒可以單方面改變決定(改為合作)而增加收穫(減少刑期)。

帕累托最優:在不使另一個囚徒情況更加惡化(服刑更久)的情況下,已經不可能再改善某個人的境況(服刑更少)。

然而,多次重複的囚徒困境可能和單次發生的囚徒困境結果不一樣

如果博弈被反覆地進行,則每個參與者都有機會去懲罰另一個參與者前一回合的背叛行為。這時,合作可能會作為均衡的結果出現。欺騙的動機這時可能被受到懲罰的威脅所克服,從而可能導向一個較好的社會化結果。作為反覆接近無限的數量,納什均衡趨向於帕累托最優。

懦夫博弈(The game of chicken),又被稱為膽小鬼博弈,鷹鴿博弈。博弈原理是當兩個參與者都不屈服,那麼可能最壞的結果會發生。與囚徒博弈的區別如果相互背叛,那麼會有最可怕的結果。

由於此種博弈變形比較多,那麼在這裡只列舉一種最基本的博弈情境。

一場賭博,兩名車手同時向對方驅車而行,會出現以下三種情況:

  • 若一方讓開(術語轉彎(Swerving)),則讓開的一方被恥笑為「膽小鬼」(Chicken),失去賭博本金。另一方獲勝(術語直行(Driving straight)),並獲得對方的賭博本金。
  • 若雙方讓開,這場賭博平局(Tie),大家收回各自本金。
  • 若兩人都拒絕收掣(不讓開),任由兩車相撞,最終車毀人亡,記為雙方失去10倍的賭博本金。

用支付矩陣模型表示如下:

懦夫博弈結論如下:雙方都沒有支配性策略。(轉彎,直行)和(直行,轉彎)兩種情況為納什平衡。除(直行,直行)外的三種情況均為帕累托最佳(同時,也使社會福利化最大)。

現實意義:邊緣政策會引進風險不可控的元素:即使所有玩家理性行事的風險面前,無法控制的事件仍然可以觸發災難性的結果。

參考:維基百科-囚徒困境詞條

Wikipedia-Chicken (game)


謝邀。

支付矩陣不同。雖然都可以表示成

  A B

A a,a b,c

B c,b d,d

但是

囚徒困境:c&>a&>d&>b (A是抵賴,B是坦白),坦白是佔優策略,納什均衡是均坦白,不是帕累托最優。

小雞博弈:c&>a&>b&>d(A是躲避,B是直行),沒有佔優策略,納什均衡是一方躲避一方直行。


補充一個區別。

囚徒困境最大的特點是納什均衡並不efficient(兩人共同利益最大化,要增加一方利益必須損害另一方利益的狀態),而小雞的納什均衡是efficient的。


在囚徒困境中,參與人的隱瞞策略是嚴格劣勢策略。無論對方策略如何,自己選擇隱瞞的收益都比選擇坦白的收益要低。


推薦閱讀:

如何分析「都已經花了那麼多錢買A了,還在乎花XX錢買a嗎」這一句式?
能否在心理測試中誤導諮詢師?
兩人合資做生意,出資相同,更迫切獲得利潤的人會分得更少嗎?
關於羅伯特·奧曼的論文《不一致的達成》怎樣解讀?
關於博弈論闡述有哪些寫得好的書?

TAG:遊戲 | 單機遊戲 | 博弈論 | 囚徒困境 |