這種情況還算囚徒困境嗎?
這種情況還算囚徒困境嗎?當警方抓獲兩名竊賊,又無旁證的情況下,將兩人分別羈押,然後宣布政策:都招供,則都判刑5年;都不招供,只好都無罪釋放;一個招供而另一個不招供,招供者坦白從寬,只判3年,不招供者抗拒從嚴,要判8年。
不算。
假定對方抵賴,我的最優選擇是抵賴。
假定對方招供,我的最優選擇是招供。換而言之,我最好的行動策略是:和對方做出相同的選擇。
囚徒困境的要點在於,帕累托改進的結果不是納什均衡點。但是這個地方的納什均衡點有兩個,並且其中一個是帕累托最優點,即,是對於所有點的帕累托改進。
如果沒有理解錯的話,- 納什均衡點的意思是:如果已知我們落在這個點上,那麼改變行動策略並不會讓我變得更好。即,這個點本身有穩定性。
- 帕累托改進的意思是:這個改進沒有損害任何人的利益。
很顯然,如果一個點是帕累托最優點,即,是其它所有點的帕累托改進,那麼它也必然是一個納什均衡點。而原始囚徒困境中,雖然(抵賴,抵賴)是(招供,招供)的帕累托改進,但卻不是(招供,抵賴)和(抵賴,招供)的帕累托改進。並且,在確定對方抵賴的情況下,自己選擇招供總是一個更好的選擇。因此,原始囚徒困境中,(抵賴,抵賴)並不是一個納什均衡點,因為行動者單方面將自己的行動改為招供之後,可以得到更好的結果。
囚徒困境的特點是:有一個帕累托無效的佔優策略均衡。
而題主的這個博弈的特點是:有兩個純策略納什均衡,每個人的最優策略是和別人做一樣的選擇。這種博弈叫做battle of sex。最典型的battle of sex是一男一女約會,有兩個可能的約會地點,雙方的最優策略都是和對方去一樣的地方。
還有一種博弈也是有兩個純策略納什均衡,但最優策略是和對方做不一樣的選擇,這叫chicken game。典型例子是,兩個不良青年開車對撞,誰躲開誰是chicken。對方如果躲開,那我的最優策略當然是不躲開。如果對方不躲開,那我如果撞上去就掛掉了當然不行,而如果躲開儘管示弱了但比撞死強,所以最優策略是躲開。
以下。
背叛 不是背判
不算。
兩個竊賊在追求最大利益的時候達成了一致。兩個人都抵賴就可以獲得最好的結果——無罪釋放。
既然存在最優解,那就稱不上困境了。而囚徒困境是在一方追求最大利益的同時,會因為對方行為的不確定性附上極大的風險——在追求無罪的情況下有可能因為對方的選擇而遭受更多的刑罰。
這個選擇的風險則是產生困境的根本原因,因為這份風險,所以無法確定對方會做出什麼選擇,所以無法作出自己的選擇,這就是囚徒困境。而本題沒有這份風險,本題存在唯一兩人都能獲得最大利益的選項,所以雙方都可以確定對方會作出什麼選擇(這裡假定囚徒選擇的價值標準是刑期的長短),從而達成一致的選擇。
本題最優選擇只有抵賴,而非「和對方做出相同的結果」。鄙人剛嘗試在知乎回答問題,最先的回答有點太輕浮,不分場合胡亂髮聲,
在此特向題主和其他關注此問題回答此問題的各位道個歉。 下面是在過後反思學習得出的一點小感想,希望可以對各位稍稍有點用。 根據題主的設定我們不難得出下面四種情況: ① A B 都招供,則都判刑5年;即雙方都沒有獲益. ② A 招供而 B 不招供,A 坦白從寬,只判3年,B 抗拒從嚴,要判8年;即 A 獲益 B 損失. ③ B 招供而 A 不招供,B 坦白從寬,只判3年,A 抗拒從嚴,要判8年;即 B 獲益 A 損失. ④ A B 都不招供,A B 都無罪釋放;即 A B 都獲益. 不過題主對問題中的
竊賊 沒有給出個具體的設定,於是我們就不好妄談 竊賊 的選擇。 但是他們又要做出選擇,並都是和利益相掛鉤的。如此鄙人大膽的引用經濟學中
「理性人」 的設定,即 【每一個從事經濟活動的人都是利己的。也可以說,每一個從事經濟活動的人所採取的經濟行為都是力圖以自己的最小經濟代價去獲得自己的最大經濟利益。】 那麼在這個設定下,我們就不難得出合理的解讀。 在咱們這個社會中(判刑5年)和(判8年)當然是有個量上的差距,但是和(無罪釋放)相比卻又完全不是一個級別的,那是一個質的改變就像5萬RMB 8萬RMB 和 100萬RMB 的差距一樣。那麼我們不難得出 兩個「合乎理性的竊賊」 會做出什麼樣的選擇,並必定是那樣的選擇。即第四種,也就是 都不招供,都無罪釋放 。 綜上所述,我們就可以得出 這種情況 不算 囚徒困境。
你這政策分明就是讓人家都招供啊。。。。。。。
丫知道什麼叫釣魚執法么?擺明了不算,囚徒知道不招供的能無罪釋放,招供判3年(對方不招供),這買賣肯定選擇前者的,所以就沒有博弈的必要了
首先,這不是一個好問題(以至於聰明的答主如羅心澄都上了圈套,回答了「是」還是「不是」)。題主描述的是囚徒困境的一個變形,但它沒有唯一的納什均衡。這類問題,最好說在這種情形下,有沒有納什均衡?如果有,是唯一的還是不唯一的。
羅心澄提到的跟對方做同樣的選擇,是這種情況下的兩種「純策略納什均衡」(pure strategy Nash equilibria)。它還有一個「混合策略納什均衡」(mixed strategies Nash equilibrium),即雙方根據判刑年數,按照一個概率選擇招和不招。推薦閱讀: