什麼是博弈論:從「囚徒困境「說起

一天,警察接到報案,一位富翁被殺死在自己的別墅中,家中財務被洗劫一空。經過多方調查,警方最終將嫌疑人鎖定在捷克和亞當身上,因為事發當晚有人看到他們兩個神色慌張地被害人家中跑了出來。警方到這兩個人家搜查,結果發現了一部分被害人家中失竊財務,於是將二人作為謀殺和盜竊嫌疑人拘留。

但是到了拘留所裡面,兩根人都矢口否認自己殺過人,他們辯稱自己只是路過那裡,想進去偷點東西,結果進去了時候發現主人已經被殺死了,於是他們便拿點東西就走了,這樣的解釋不能讓人信服,再說,誰都知道在判刑方面殺人要比盜竊嚴重的多。警察決定經兩個人隔離審訊。

隔離審訊的時候,警察告訴傑克:「儘管你們不承認,但是我知道人就是你兩個人殺的,事情早晚會水落石出的。現在我給你一個坦白的機會,如果你坦白了,亞當拒不承認。那你就是主動自首,同時協助警方破案,你將立即釋放,亞當要坐10年牢;如果你們都坦白了,每個人做8年牢;都不坦白的話,可能以入室盜竊罪判你們每人1年,如何選擇你們自己想一想吧。」同樣的話,警察也說給了亞當。

一般人可能認為傑克和亞當都會選擇不坦白,這樣他們只能以入室盜竊的罪名被判刑,每人只需坐1年牢。這對於兩人來說是最好的一種結局。可結果會是這樣的嗎?答案是否定的,兩人都選擇了招供,結果每人各被判了8年。

事情為什麼會這樣呢?傑克和亞當為什麼會做出這樣「不理智」的選擇呢?其實這種結果正是兩人的理智造成的。

當警察把坦白與否的後果告訴傑克的時候,傑克心中就會開始盤算坦白對自己有利,還是不坦白對自己有利。傑克會想,如果選擇坦白,要麼當即釋放,要麼同亞當一起坐8年牢;要是選擇不坦白,雖然可能只坐1年牢,但也可能坐10年牢。雖然(1,1)對兩人而言是最好的一種結局,但是由於是被分開審訊,信息不通,所以誰也沒法保證對方是否會選擇坦白。選擇坦白的結局是8年或者0年,選擇不坦白的結局是10年或者1年,在不知道對方選擇的情況下,選擇坦白對自己來說是一種優勢策略。於是,傑克會選擇坦白。同時,亞當也會這樣想。最終的結局便是兩個人都選擇坦白,每人都要坐8年牢。

上面這個案例就是著名的「囚徒困境」模式,是博弈論中最出名的一個模式。為什麼傑克和亞當每個人都選擇了對自己最有利的策略,最後得到的卻是最差的結果呢?這其中便蘊含著博弈論的道理。

博弈論是指雙方或者多方在競爭、合作、衝突等情況下,充分了解各方信息,並依此選擇一種能為本方爭取最大利益的最優決策的理論。

「囚徒困境」中傑克和亞當便是參與博弈的雙方,也稱為博弈參與者。兩人之所以陷人困境,是因為他們沒有選擇對兩人來說最優的決策,也就是同時不坦白。而根本原因則是兩人被隔離審訊,無法掌握對方的信息。所以,看似每個人都做出了對自己最有利的策略,結果卻是兩敗俱傷。


推薦閱讀:

【周末薦游】王權(Reigns)與博弈論
中年危機是不是因為窮?
從1-100,在評論里留下一個數,最接近平均數的三分之二的人有紅包
天然乳膠報盤活躍指數跌至低點 多空博弈後市未知
什麼是博弈論

TAG:博弈論 | 囚徒困境 | 困境 |