如何解釋聖彼得堡悖論?
擲硬幣,若第一次擲出正面,你就賺1元。若第一次擲出反面,那就要再擲一次,若第二次擲的是正面,你便賺2元。若第二次擲出反面,那就要擲第三次,若第三次擲的是正面,你便賺2*2元……如此類推,即可能擲一次遊戲便結束,也可能反覆擲沒完沒了。問題是,你最多肯付多少錢參加這個遊戲?
期望值為:
數學期望是正無窮這點,沒有問題。也就是說無論你花上多少錢去玩這個遊戲,你的收益的期望都將為正。但你願意花多少錢玩這個遊戲呢?我想大部分人都不會願意去花一個很高的價錢(比如450塊?)去玩這個遊戲,因為這個遊戲的風險很大。大家憑著經驗就知道,連續擲出反面這種事,要考慮到歷史的行程。
這也不是什麼悖論,如果這裡面有什麼讓你覺得不舒服的地方,就在於它假設了人們在做決策的時候,僅僅考慮數學期望的大小。
但這個假設是不對的,人們在做這個選擇的時候,更多的是在考慮風險。單憑數學期望是無法描述風險的。聖彼得堡悖論(n為硬幣投擲次數)
設定擲出正面(或反面)為成功。遊戲者如果第一次投擲成功,得獎金2元,遊戲結束;第一次若不成功,繼續投擲,第二次成功得獎金4元,遊戲結束;這樣,遊戲者如果投擲不成功就反覆繼續投擲,直到成功,遊戲結束。如果第n次投擲成功,得獎金2的n次方,遊戲結束。
按照概率期望值的計算方法,將每一個可能結果的得獎值乘以該結果發生的概率即可得到該結果獎值的期望值。遊戲的期望值即為所有可能結果的期望值之和。隨著n的增大,以後的結果雖然概率很小,但是其獎值越來越大,每一個結果的期望值均為1,所有可能結果的得獎期望值之和,即遊戲的期望值,將為「無窮大」。
僅僅考慮玩家收益的期望值的話,即假如玩家希望實現自己的收益最大化,只要能夠參加遊戲,付出多少錢都是可以接受的。
按照概率的理論,多次試驗的結果將會接近於其數學期望。但是實際的投擲結果和計算都表明,多次投擲的結果,其平均值最多也就是幾十元。正如耶恩·哈金(Ian Hacking)於1980年所說:「沒有人願意花25元去參加一次這樣的遊戲。」[1]這就出現了計算的期望值與實際情況的「矛盾」,問題在哪裡? 實際在遊戲過程中,遊戲的收費應該是多少?
聖彼得堡悖論的提出已有200多年了,所提出的消解方法大致可以歸納為以下幾種觀點:
- 邊際效用遞減論
- 風險厭惡論
- 效用上限論
- 結果有限論
結果呢?沒個卵用。
所以說,轉變我們的觀念,聖彼得堡悖論便不再是悖論。期望在硬幣投擲次數n不設上限的時候為無窮大,可是樣本均值也在隨著實驗次數N的增加而趨向無窮大啊。為什麼因為樣本均值會向總體均值收斂就認為這二者之間的差距一定要很小呢?再大也不是無窮大,只要最終收斂不就好了嗎?因此,只要認識到我們思考方式中的缺陷或矛盾,聖彼得堡悖論便不再是悖論。[1] Martin, Robert (2004). "The St. Petersburg Paradox". In Edward N. Zalta. The Stanford Encyclopedia of Philosophy (Fall 2004 ed.). Stanford, California: Stanford University. ISSN1095-5054. Retrieved 2006-05-30.————————————————————2015.09.27:一點隨便的想法我們要認識到,悖論問題的實質是人類自身思維的矛盾性。從廣義上講,悖論不僅包括人們思維成果之間的矛盾,也包括思維成果與現實世界的明顯的矛盾性。所以,悖論作為人類思維繫統的一種矛盾形式,它的消解必須從人們思維繫統自身的矛盾性和不完善性著手,需要人類戰勝和超越自己。歷史上隨著一次一次的悖論的消解,更完備的公理系統被提出,人類的思維和科學系統得到完善,科學得到進一步的發展;聖彼得堡悖論也是如此。以上四種消解方法均避開了問題本質,沒有觸及人們的思維繫統,但是這些努力使我們認識到僅從實際出發是不能解決問題的,而最合理的解釋就是——保留期望值的定義,調整我們的思維。當我們這樣做的時候,聖彼得堡悖論就不再是一個悖論了!
聖彼得堡悖論的根源在於樣本均值與總體均值的差異,以及我們對於「無窮大」的理解。根據伯努利大數定律,當樣本容量N趨近於無窮時,樣本均值依概率收斂於其期望值。但對於這裡的「無窮」,我們平時的「大小」概念已經不能適用了。涉及無窮大概念比較的時候,就需要用相應的比較方法。聖彼得堡遊戲的結果集合是一個無窮集合,而實際實驗的樣本是一個有窮集合,它們是不能用現有的辦法比較的。
因此,這一悖論的出現並非是由於我們的計算方法的缺陷。我們需要承認它的期望值是無窮大;而實際上它的均值又不可能是無窮大,由於試驗次數沒有辦法達到真正意義上的「無窮大」,它們之間的差異是必然存在的。
用電腦進行模擬試驗的結果說明,實際試驗的平均值——樣本均值是隨著實驗次數的增加而變化的。在大量實驗以後,其實驗均值X可以近似表示為,可見當實驗次數趨向無窮大的時候,樣本均值也趨向無窮大。比如100萬、即次實驗的平均值等於,即樣本均值為20元左右;要樣本均值達到1000元,實驗次數就要達到次,這時候有可能出現的最高投擲次數約為1000次左右,相應的最高賠付金額為,已經達到了天文數字了。在實驗次數趨向無窮大的時候,收益趨向於無窮大的速度慢多了。
- Samuelson, Paul (January 1960). "The St. Petersburg Paradox as a Divergent Double Limit". International Economic Review (Blackwell Publishing) 1 (1): 31–37. doi:10.2307/2525406. JSTOR2525406.
- Peters, Ole (2011a). "The time resolution of the St Petersburg paradox" (PDF). Philosophical Transactions of the Royal Society369: 4913–4931.doi:10.1098/rsta.2011.0065.
看經濟學課本看到這個問題…說賭博店如果讓你付10億元參加這個賭博,恐怕沒人會參加…很疑惑為何要用效用來解釋= =…我很自然地是這樣想的:
我覺得可以考慮一下n值的期望…假設第n次拋出正面就不再繼續拋了。
那麼n的期望是,E(n)=∑(n=1,∞)n*(1/2^n)
利用錯位相減,可得到這等於部分和的極限:= lim(n→∞) [1-1/2^n-n/2^(n+1)] = 2也就是說,我們期望(或平均)拋兩次就出正面GG了…
進一步地,假設我們拋硬幣無論如何都拋n次,拋完n次賭博店就歇業,10億塊錢也不還了;獎勵規則還是一樣,只看第一次出正面時n等於幾…那麼在這有限的n次里,賭徒的回報期望是:
(如題中所討論的,1+1+1+…)=n
而其反面,也就是這n次中一次正面也沒得,然後店家歇業不給錢了的情況,期望是:
10億*(1/2^n)【n次全是反面】
所以我們參不參加賭博取決於兩者的大小對比,如果 n &> 10億*(1/2^n),理論上我們就願意參加。
可這又跟n有關…而n大概(期望)是多少呢?…2
也就是說,8塊錢以內,大概還是願意賭的…這個數看起來就比較合理了= =
沒有參考資料,不知道別人有沒有那麼說的…所以,那個「啥啥啥」(←這個不知道該怎麼說 )概不負責這個問題利用無限來顯得有點玄乎,其實本質上和下面問題一樣:
如果有億分之一的概率獲得一億億元,一次遊戲值多少錢?
結果就是如果錢的數量與價值完全成正比,值得付出至多1億元。而在題主的問題中,可以付出任意有限數量。
有人說模擬出來均值20多,那如果模擬我這個問題,均值還可能是0呢。
總之最關鍵的一點就是,期望值原理的前提條件是數量與價值成正比,而這一條件在巨額情況下一般不能滿足。
另外反對另一個答案,用百度百科上的東西把本來就容易讓人玄乎的東西攪得更玄乎,而沒有說出問題的關鍵。每張彩票免費 每張彩票有一億億億億億分之一的概率中獎 獎金為一億億億億億億 這種彩票值得買嗎?答案是不值得 雖然數學期望是每張彩票能賺一億 但是實際是你投入一億張都不可能中 這就是聖彼得堡悖論的本質 數學期望肯定賺 但是風險太大 實際上根本沒法中獎
個人認為其實這根本就不是一個悖論。這個實驗的期望值確實是無窮大,但是無窮大的期望是建立在無窮大的實驗次數上的。通過計算機的模擬,前面(EDDE)已經給出答案了:
【在大量實驗以後,其實驗均值X可以近似表示為,可見當實驗次數趨向無窮大的時候,樣本均值也趨向無窮大。比如100萬、即次實驗的平均值等於,即樣本均值為20元左右;要樣本均值達到1000元,實驗次數就要達到次,這時候有可能出現的最高投擲次數約為1000次左右,相應的最高賠付金額為】
站在玩這個遊戲的人角度上說,如果需要花費一億元,讓你參加這個遊戲,你需要重複玩N次以上,在概率上你才是合適的,其中N為方程式 的解,這個時候N約等於 ,是個天文數字。所以傻子才會拿一個億玩這個遊戲。
那麼站在遊戲提供者的角度上來說,你就需要考慮在你的賭場經營期限內,這個遊戲會被玩多少次。按上面的公式,如果會有100萬人來玩這個遊戲,你把獎金定在20元以下都會盈利的。
最後這裡引出了一個結論,就是我們不能完全按照期望來做決策。我們還需要考慮期望和實驗次數的關係,只有當實驗次數和數學期望無關時,我們才能單純的按照數學期望來做決策。
可否把遊戲換一種玩法,闖關遊戲,選擇一面後,開始拋擲,勝了,自由選擇拿錢退出,遊戲結束。或闖下一關,下一關勝了再選擇,敗了則前面所有歸零,遊戲結束。
還得看能玩幾次,結合個人的效用函數。
這個悖論問題出在把前後每一次投擲的結果的期望值相加,這等於說每次投擲的結果是在一個空間里的。然而並不是,當你第一次投擲成功後,你獲得2元,這個時候後面(n-1)次機會便不存在了,期望值為二乘二分之一;而假設你運氣很好,第n次投擲成功,你獲得2的n次元,這時候前面(n-1)次機會便不存在了,你所摸得見看的著的只有這第n次,期望值為n乘n分之一,同樣是1。所以期望值永遠是1,而不是1+1+1+……內在控制因素是概率的實現性這樣就很容易理解為什麼人們不會花大價錢來玩這個遊戲。
推薦閱讀:
※關於人是鐵飯是鋼這句俗語該怎麼理解?
※該三段論的邏輯正確嗎?
※小數點後可以有無數位,為什麼兩個物體仍可以相互接觸?
※誰能用通俗的語言解釋一下 反證主義的局限性是什麼?拉卡托斯又是怎麼改進波普爾的偽證主義的?
※我20出頭該叫一個30多歲的男人哥還是叔?如果叫哥那他也該叫我爸哥還是叔?都叫哥豈不是我爸是我哥?