博弈論經典案例：兩頭豬與囚徒困境

06-23

學習管理學或經濟學的人一定都了解一些博弈論方面的知識。在博弈論中有一個經典案例——囚徒困境，非常耐人回味。----「囚徒困境」說的是兩個囚犯的故事。這兩個囚徒一起做壞事，結果被警察發現抓了起來，分別關在兩個獨立的不能互通信息的牢房裡進行審訊。在這種情形下，兩個囚犯都可以做出自己的選擇：或者供出他的同夥（即與警察合作，從而背叛他的同夥），或者保持沉默（也就是與他的同夥合作，而不是與警察合作）。這兩個囚犯都知道，如果他倆都能保持沉默的話，就都會被釋放，因為只要他們拒不承認，警方無法給他們定罪。但警方也明白這一點，所以他們就給了這兩個囚犯一點兒刺激：如果他們中的一個人背叛，即告發他的同夥，那麼他就可以被無罪釋放，同時還可以得到一筆獎金。而他的同夥就會被按照最重的罪來判決，並且為了加重懲罰，還要對他施以罰款，作為對告發者的獎賞。當然，如果這兩個囚犯互相背叛的話，兩個人都會被按照最重的罪來判決，誰也不會得到獎賞。

----那麼，這兩個囚犯該怎麼辦呢？是選擇互相合作還是互相背叛？從表面上看，他們應該互相合作，保持沉默，因為這樣他們倆都能得到最好的結果：自由。但他們不得不仔細考慮對方可能採取什麼選擇。A犯不是個傻子，他馬上意識到，他根本無法相信他的同夥不會向警方提供對他不利的證據，然後帶著一筆豐厚的獎賞出獄而去，讓他獨自坐牢。這種想法的誘惑力實在太大了。但他也意識到，他的同夥也不是傻子，也會這樣來設想他。所以A犯的結論是，唯一理性的選擇就是背叛同夥，把一切都告訴警方，因為如果他的同夥笨得只會保持沉默，那麼他就會是那個帶獎出獄的幸運者了。而如果他的同夥也根據這個邏輯向警方交代了，那麼，A犯反正也得服刑，起碼他不必在這之上再被罰款。所以其結果就是，這兩個囚犯按照不顧一切的邏輯得到了最糟糕的報應：坐牢。

假設豬圈裡有兩頭豬同在一個食槽里進食，一頭大豬，一頭小豬。我們假設它們都是有著認識和實現自身利益的充分理性的「智豬」，豬圈兩頭距離很遠，一頭安裝了一隻控制飼料供應的踏板，另一頭是飼料的出口和食槽。豬每踩一下踏板，另一頭就會有相當於10份的飼料進槽，但是踩踏板以及跑到食槽所需要付出的「勞動」，加起來要消耗相當於2份的飼料。兩頭豬可以選擇的策略有兩個：自己去踩踏板或等待另一頭豬去踩踏板。如果某一頭豬做出自己去踩踏板的選擇，不僅要付出勞動，消耗掉2份飼料，而且由於踏板遠離飼料，它將比另一頭豬後到食槽，從而減少吃到飼料的數量。我們假定：若大豬先到（即小豬踩踏板），大豬將吃到9份的飼料，小豬只能吃到1份的飼料，最後雙方得益為【9，-1】；若小豬先到（即大豬踩踏板），大豬和小豬將分別吃到6份和4份的飼料。最後雙方得益為【4，4】；若兩頭豬同時踩踏板，同時跑向食槽，大豬吃到7份的飼料，小豬吃到3份的飼料，即雙方得益為【5，1】；若兩頭豬都選擇等待，那就都吃不到飼料，即雙方得益均為0。智豬博弈的收益矩陣可以用下表所示、表中的數字表示不同選擇下每頭豬所能吃到的飼料數量減去前去踩踏板的成本之後的凈收益水平。大豬行動大豬等待小豬行動 5, 1 9, -1小豬等待 4, 4 0, 0智豬博弈的收益矩陣那麼這個博弈的均衡解是什麼呢?這個博弈的均衡解是大豬選擇去踩踏板，小豬選擇等待，這時，大豬和小豬的凈收益水平均為4個單位。這是一個「多勞不多得，少勞不少得」的均衡。在找出上述智豬博弈的均衡解時，我們實際上是按照「重複剔除嚴格劣勢策略」的邏輯思路進行的。這一思路可以歸納如下：首先找出某參與人的嚴格劣勢策略，將它剔除，重新構造一個不包括已剔除策略的新博弈；然後，繼續剔除這個新的博弈中某一參與人的嚴格劣勢策略；重複進行這一過程，直到剩下唯一的策略組合為止。剩下這個唯一的策略組合，就是這個博弈的均衡解，稱為「重複剔除的佔有策略均衡」。在智豬博弈收益矩陣中可以看出：小豬踩踏板其能得到l份甚至損失1份，不踩踏板反而能得到4份。對小豬而言，無論大豬是否踩動踏板，小豬採取「搭便車」策略，也就是舒舒服服地等在食槽邊，都是最好的選擇。大豬行動大豬等待小豬行動 5, 1 9, -1小豬等待 4, 4 0, 0剔除後的智豬博弈的收益矩陣由於小豬有「等待」這個優勢策略，大豬只剩下了兩個選擇：等待就吃不到；踩踏板得到4份。所以「等待」就變成了大豬的劣勢策略，當大豬知道小豬是不會去踩動踏板的，自己親自去踩踏板總比不踩強，只好為自己的4份飼料不知疲倦地奔忙於踏板和食槽之間。也就是說，無論大豬選擇什麼策略，選擇踩踏板對小豬都是一個嚴格劣勢策略，我們首先加以剔除。在剔除小豬踩踏板這一選擇後的新博弈中，小豬只有等待一個選擇，而大豬則有兩個可供選擇的策略。在大豬這兩個可供選擇的策略中，選擇等待是一個嚴格劣勢策略，我們再剔除新博弈中大豬的嚴格劣勢策略等待。剩下的新博弈中只有小豬等待、大豬踩踏板這一個可供選擇的策略，這就是智豬博弈的最後均衡解，達到重複剔除的優勢策略均衡。智豬博弈與囚徒困境的不同之處在於：囚徒困境中的犯罪嫌疑人都有自己的嚴格優勢策略；而智豬博弈中，只有小豬有嚴格優勢策略，而大豬沒有。在一場博弈中，如果每個參與人都有嚴格優勢策略。那麼嚴格優勢策略均衡是合乎邏輯的。但是在絕大多數博弈中。這種嚴格優勢策略均衡並不存在。而只存在重複剔除的優勢策略均衡。所以，智豬博弈聽起來似乎有些滑稽，但是它卻是一個根據優勢策略的邏輯找出均衡的博弈模型。