盒子悖論,怎麼解?

你參加一個節目,面前有兩個盒子,裡面分別裝了一些錢,已知錢是節目組按照如下簡單規則放置的:投一枚硬幣,正面就繼續投,直到投出反面為止,總共投了k次,往其中一個盒子裝3^(k-1) (3的k-1次方)元錢,另一個盒子裝3^k元錢。

現在,你打開了其中一個盒子,發現裡面有3^n次方元錢,此時,主持人允許你放棄這個盒子,去拿另一個盒子的錢,問:是否要換盒子?

我的想法如下:

首先,如果我打開盒子,發現裡面有1元錢(3^0),那另一個盒子里肯定是3元錢,必換!

如果我打開盒子,發現盒子裡面有3^n (n&>0)元錢, 那麼另一個盒子里可能有3^(n-1)元錢(對應投了n次硬幣),也可能有3^(n+1)次方元錢(對應投了n+1次硬幣),顯然,前者發生的概率是後者的2倍,即節目組有2/3概率投了n次,1/3概率投了n+1次,那麼,另一個盒子里錢數的期望就是:

(2/3)*3^(n-1)+(1/3)*3^(n+1) = (11/9)*3^n 比現在盒子里的3^n塊錢要多,也要換盒子。

那麼問題來了,由以上推理,無論我們打開第一個盒子看到了多少錢,換另一個盒子始終是對我們有利的,那為啥我們還要打開第一個盒子呢?直接去打開「另一個」盒子不就好了?


問題出在條件最大期望這個策略失效上。考慮一下我們為什麼使用最大期望,是因為我們希望讓總的獲利期望最大化,原理在於:如果每種我們可以控制的情況都最大化了,那麼總的期望也是最大化的,這應用了期望與條件期望的關係。

但是,這個問題里的總的期望值不收斂,不同策略的期望都是無窮大,那麼最大化條件就失效了:雖然每種條件下的條件期望有大小之分,但是求和之後都是無窮大,也就沒法比較大小了。

也就是說,總的期望值收斂是應用條件期望最大化策略的前提,因為這個條件通常都是滿足的,所以我們往往忽視了這個條件,而缺少這個條件的時候是無法推出條件期望最大化的優化策略的。實際上很可能在條件收斂的情況下也是不正確的(因為期望的計算沒有規定求和順序),需要絕對收斂。

所以題目中的策略的確使條件期望最大化了,但是悖論產生的根源在於條件期望最大化本身沒有意義,因為不是推不出總期望最大化。

我們可以反過來看一下收斂的情況,如果錢數是n和n+1,那麼總期望是收斂的,基於條件期望最大化,我們在1的情況下換,其他情況不換,可以驗證這的確會讓我們獲得優勢,看的作用就是在遇到1的時候換。這時候條件期望最大化的策略是有效的。


我拋磚引玉一下,這是個很有趣的問題。我們先按照題主的描述編程序看一看效果。如圖

程序隨機投擲100000硬幣直至出現反面,並投擲記錄次數n,隨機在兩個盒子中放入 3^{n}3^{n+1} 兩個數。

之後,我們把所有盒子中出現 3^{m} 的值挑出來,統計另一個盒子的期望值,結果果真都是 frac{11}{9} cdot 3^m 。如圖中紅色是第一次見到的數,藍色是另一個盒子中的數。

所以實驗來看確實是,打開第一個盒子無論你見到的是什麼數,另一個數的期望值都更高

這看上去就很扯了,你隨機選擇一個盒子打開看一下,然後根本不管看到的是什麼就選擇下一個盒子,這個完全是唯心主義的動作增加了你遊戲得到錢的期望值?

或者用更極端的方式,用硬幣隨便投擲,正面選第一個反面選第二個。這時按照硬筆選盒子的期望值比不按照硬幣選的期望值要低?

我認為,這個問題的悖論點在於這個遊戲沒有一個有限的期望值。這個遊戲的期望值是

xi_{game} = frac{1}{2}sum_{n=1}^{infty}{frac{3^{n}+3^{n-1}}{2^{n}}}
ightarrowinfty

這也可以從統計圖上看出來,每次投擲1000個,進行1000次遊戲,下面每次遊戲的平均值的分布是很廣的。注意縱坐標可是對數坐標。

所以實際上按照期望值最大選擇策略是沒有意義的,因為按照期望值來說,你只要完了一次這個遊戲,那麼無論你選擇哪一個盒子,你的財務期望值都是無窮的!再上增加2/9的財富是完全沒有意義的!

但是當你打開確定了一個值之後,這個遊戲就變成了另一個遊戲,這時候如果你肯定比你手裡獎金更高的盒子可能存在的話,你選擇另一個盒子的期望值就比手頭的這個盒子要高了。

如果節目組準備獎金的過程中的n值有上限,則你的換箱子策略總會在你拿到最大值而不自知的情況下將你的收益減小。如果n沒有上限的話則這個策略也是無意義的,因為不同策略的期望值都是無窮的所以一個比另一個大2/9沒有意義。因為你無法通過有限次的遊戲統計結果判定哪種策略更好。


《Introduction to Probability》Dimitri P. Bertsekas, John N. Tsitsiklis


結論沒問題。因為整個遊戲的期望是無窮大。

想一個簡單點的情況:

按照期望無窮的方式,隨機取兩個正數,放在兩個盒子里,你的目標是取到最大數。這時候你打開一個盒子發現是a,而另一個沒打開的盒子的期望是無窮大。這時候當然無腦換了。

這個反直覺的問題在於,你打開任意一個盒子之前,兩個盒子給你的收益都是無窮大。當你打開了一個,這個盒子給你的收益一定會坍縮成了有限的數,那麼必然選擇無腦換另一個。

(備註:這裡「期望無窮的方式」怎麼取,可以考慮均勻分布X~U(0,1),然後Y=1/X。或者考慮在正數上的標準柯西分布。我一開始行文這裡是說的「隨機取兩個正數」,這個想當然了,是做不到的,感謝評論 @孫鵬 和 @項思遠 指正)

再給一個簡單點的情況:

兩個盒子,主持人告訴你,按照如上期望無窮的方式,Y=1/U(0,1),隨機取一個正數k,其中一個盒子裡面數是k,另一個是10k,但你不知道k是多少。你打開一個盒子發現是a。這時候另一個盒子可能是a/10,可能是10a。根據混合型變數的貝葉斯公式(我實在懶得算了,應該結論是對的,有空我去算一下),計算期望,此時換盒子還是賺的。這時候還是應該無腦換。

問題還是出在期望無窮大。假如k是(0,1)裡面均勻取正數,那麼抽到a小於1的人會換,但是抽到大於1的人是絕對不會換的。這樣下來

每個人願意換的人賺到的錢之和=每個不願意換的人,假如換的時候虧掉的錢數之和

這個等式成立需要期望有限。如果是無限的情況,等式左邊每個人都賺到,那麼「最後一個」人換盒子會血虧到死。但是這樣「最後的人」不存在,所以可以保證每個人換盒子都是賺的。


問題出在無窮大上。只要參加這個節目,無論選擇無腦換還是無腦不換策略,獎金的期望都是無窮大,無窮大乘以11/9還是無窮大,並不能增加期望。

如果投硬幣遊戲是有限次的,例如100次(節目組需要準備3^100宇宙級數字的獎金),那麼無腦換策略會在打開第一個盒子看到3^100元獎金時,必然換成另一個盒子的3^99元。這個損失如此之大,抵消了看到其他獎金數時無腦換增加的獎金的期望。


應該把題目改成「佯謬」而不是「悖論」。目前沒有看到和已知的真命題矛盾的命題。


我來說一下問題出在了哪裡。

假設我們打開的是A箱子,那麼你希望通過計算E(B-A)來判斷打開A箱子更好還是打開B箱子更好。正常情況,如果E(B-A)&>0,那麼打開B箱子更好,反之則是打開A箱子更好。

然而問題出在這個期望值不收斂,因為這個數列中有正項也有負項——B里的硬幣有可能比A多,也可能比A少;交錯數列求和與求和順序是相關的,然而在計算概率時,我們無法選擇某種特定的求和方式,只有當收斂極限與求和順序無關時,也就是數列絕對收斂時我們才能定義期望值。

而題中,你選擇了以(1,3),(3,9),(3,1),(9,27),(9,3)……的順序進行求和,因此得出換箱子比不換箱子更好的結論。但這只是一個假象,只要我們更改求和順序,比如把順序改為(1,3),(3,1),(3,9),(9,3),(9,27),(27,9)……就又會得到兩種策略沒有區別的結論。當然,如果按照(3,1),(9,3),(1,3),(27,9),(9,27)……的順序求和,又會得出不改箱子其實才是最好的這樣一個結論

總而言之,你的計算過程其實是完全正確的,在A箱子中的硬幣數量確定時B箱子中的硬幣數量期望值的確大於A箱子中的硬幣數量。但是這並不能說明選擇B箱子比選擇A箱子更好,這一步出現了邏輯漏洞。

另外,明確一點,遊戲本身的收益期望值不收斂不是直接原因

舉一個最簡單的反例,一開始的規則還是不變,但是放硬幣時,主持人選擇在一個盒子里放3^n枚硬幣,而在另一個盒子里放3^n+1枚硬幣。

很明顯,當我們打開一個盒子時,只需要判斷這個盒子里的硬幣是不是3的倍數就行了,這個策略一定是最優的——因為當有兩個人同時玩這個遊戲時,隨機選擇盒子的人與選擇不是3倍數的盒子的人相比,後者的收益永遠大於前者。雖然E(B)和E(A)分別發散,但是E(B-A)=1是收斂的,因此我們可以比較兩種策略。


許多答主提到了最大化收益期望不是一個良好的策略。我們簡單解釋一下,當收益帶來的效用期望有限時,題述的悖論不會存在。

假設兩個盒子中的金額分別為 X_1X_2 ,其中第一個盒子指我們最初打開的盒子。假設當獲得 x 的金額時,我們的效用為 u(x) ,其中 u 嚴格遞增。問題便轉化為尋找一個策略 f: {0,1,dots} 	o {1,2}, 使得效用期望

U(f) = sum_{k=0}^{infty} u(x) P(X_{f(3^k)} = x)

最大。這裡 f(x) 指第一個盒子中金額為 x 時,我們選取的盒子編號。我們首先有兩個無腦策略,永遠選第一個盒子,即 f_1equiv 1 ,和永遠更換盒子,即 f_2 equiv 2 。容易算出

P(X_1 = 3^k) = P(X_2 = 3^k) = egin{cases} 1/4  k = 0\ 1/2^{k+1} + 1/2^{k+2} = 3/2^{k+2}  k geq 1. end{cases}

因此,

U(f_1) = U(f_2) = (1/4)u(1) + sum_{k=1}^{infty} u(3^k) (3/2^{k+2}).

兩個策略等價。

現在像題述那樣,考慮兩個策略的效用之差。具體地說,我們希望比較 X_1 = 3^k 時,兩種策略效用的條件期望。它們的差值是

Delta(3^k) = egin{cases} u(1) - u(3)  k = 0,\ (1/3)[u(3^k) - u(3^{k+1})] + (2/3)[u(3^k) - u(3^{k-1})]  k geq 1. end{cases}

如題主所說,如果 u(x) = x ,則 Delta(x) < 0, forall x ,意味著我們似乎總該選擇第二種策略。但是,如果我們假設 U(f_1) < infty ,情況就大不一樣了。此時, U(f_1) - U(f_2) = 0. 我們可以把上式展開後重組,得出下式等於0:

U(f_1) - U(f_2) = sum_{k=0}^{infty} Delta(3^k) P(X_1 = 3^k).

由於 Delta(1) = u(1) - u(3) < 0 ,必然有至少一個 k 使得 Delta(3^k) > 0也就是說,在效用期望有限時,在打開第一個盒子後,至少存在一種情況,使得我們應當堅持最初的選擇。當然,題述的線性效用並不能滿足這一條件,那麼出現在所有條件下都應該更換盒子的情況也就多少情有可原了。

需要注意,效用期望有限在現實中並非不合理。一般來說,邊際效用遞減。當人們已經有很多錢時,單位的額外財富能帶給他們的快樂就會相應地減少。因此,人們可能會做出規避風險的行為,而不是一味地追求最大化平均收益。

另外一個思路是假設自己在和他人對弈。當我們選取第一個盒子時,對手自動選取另一個,而我們希望獲得比對手更多的金額。此時一個合理的方案是在給定 X_1 時最大化以下函數的條件期望:

Delta(i|X_1) = egin{cases} 1  X_i > X_{-i}, \ 0  X_i < X_{-i}, \ 1/2  mbox{o/w} end{cases} = 1/2 + 1/2 	imes 1_{(0,infty)}(X_i - X_{-i}),

其中 X_{-1} = X_2, X_{-2} = X_1. 這一策略等價於最大化」獲勝「(選取的盒子內有更大金額)的幾率,即比較 P(X_1 > X_2|X_1 = x)P(X_2 > X_1|X_1 = x) 。如題主述

P(X_1 > X_2| X_1 = 3^k) = egin{cases} 0  k = 0,\ 2/3  k geq 1. end{cases}

另一方面,

P(X_1 = 3^k) = egin{cases} 1/4  k = 0\ 3/2^{k+2}  k geq 1. end{cases}

將條件概率平均後得到符合直覺的結論

P(X_1 > X_2) = sum_{k=0}^{infty} P(X_1>X_2|X_1 = 3^k) P(X_1 = 3^k) = 1/2.

即在不打開任何一個盒子時,兩個盒子在獲勝幾率上等價。另一方面,根據條件概率,如果打開第一個盒子後發現裡面只有一元,則應該更改選擇;如果發現第一個盒子里的金額大於1,則不應該更改選擇。這樣的策略可以將自己總的獲勝幾率提升至 3/4 。而無腦地更換盒子並不能提高獲勝概率。


這問題就是把賭徒悖論(每次輸就加倍下注的「必勝」策略)包裝了一下,讓你認不出來罷了。


這讓我想到另一個悖論。

一個人一直拋硬幣,直到第k次出現反面時停止,並給你2^k元。顯然這個活動的收益期望值是無限,但是付無限的錢參加這樣一個活動是不理性的。

所以這類問題我們應該用utility function而不是期望值,因為窮人的一塊和富人的一塊是不一樣的。


根本原因就是因為期望是無窮的。

題主也說了「即使知道是無窮的,也沒法理解這個問題」。那我從我看這個問題想到的另一個問題說起好了。

假設我有一枚硬幣,1/2概率 正,1/2概率 反。我採取如下賭博策略:

  1. 你賭1元錢拋硬幣。如果硬幣為正,贏,得到這一盤本金的兩倍即1*2=2元,凈賺1元,退出賭局;如果硬幣為反,輸,失去這1元;
  2. 如果上一步輸掉,賭2元繼續拋硬幣。如果正,贏,得這一盤本金兩倍即2*2=4元,凈賺4-1-2=1元,退出賭局;如果反,輸,失去這2元(累計輸掉了1+2=3元);
  3. 重複這一過程(如果贏立即退出賭局,如果輸double賭注賭下一局)。

可以證明,在這個策略下我永遠可以賺錢

但是答主我告訴你上面這個策略穩賺,你肯定不會在現實世界這麼賭。因為這個策略穩賺的前提是需要你有無限的資產(因為你可能一直輸一直輸,而賭徒總有錢double賭注開始下一局)。而我們也可以證明在退出賭局的前一局(即賭徒最後輸的一局)中,賭徒的期望收益是負無窮的

----- 既然我們已經有無窮的資產了,我們為什麼還要賭錢呢? -----

同樣,題目里的節目組需要準備無窮的儲備金來準備這個節目。這個節目組是不存在的,所以才能算出來這樣一個奇怪的結果。你可以類比上面這個問題:

即便有必勝的賭徒策略,任何人在現實生活也不會這麼賭。因為不存在一個資產無窮的賭徒。

而在這個問題中,即使我有無腦換的策略,我在現實生活中也不會無腦換。因為不存在一個資產無窮的節目組。

【當然這樣類比不是太嚴謹,只是換個問題幫助題主理解無窮的存在在概率論中產生的一些奇怪的結論。】

【另外下面很多看不出來為什麼題主在題目里寫「前者發生的概率是後者的2倍(節目組有2/3概率投了n次,1/3概率投了n+1次)」的答主,建議你們可以用貝葉斯公式自己手算一下……】


本質原因是因為無窮,並且回報增長的比概率下降的快。策略上如果真有這個節目,換確實更好。

一個簡單的理解辦法就是你把問題改一下,給n設個上限,你就會發現不換的情況里,當你看到3^(n+1)的時候,回報巨高而且是必勝策略。在n是無窮的情況下,你把每個n的情況都列出來,一種永遠不換,一種永遠換,把所有n的收益加在一起,你會發現是一樣的。這個詳細的就算就行了,我就不詳細寫了。兩邊的收益期望是多少?都是無窮。

再做一個類比,一個正整數序列,從1到無窮,你做一個mapping,左邊永遠比右邊小1。這樣左邊序列是不是每次比起來都比右邊小?但是加起來兩邊是一樣的。

對了,答主還問了為什麼要打開信封再換這件事。對這個我有個想法。你拿到一個信封但不打開,策略告訴你要換。換完了之後呢?不還是一樣要換么。所以打開信封,你打開的就是這個循環。


我不是學數學的,如果不對求輕噴

投擲硬幣並且放錢事件與選盒子事件是獨立的,進行選盒子時投擲硬幣過程已然結束,不應該在選盒子時考慮放錢的概率。

換一個說法,如果節目流程調整一下:有兩個盒子,打開一個盒子發現裡面有27塊,此時再投擲硬幣,若為正面則給你81塊(n=4),若為反面則給9元(n=3,n-1=2),此時另一個盒子的期望是45元,當然我們都會投擲這枚硬幣並且選擇另一個盒子。這是因為投擲過程在選盒子後面,此時才應考慮其概率和期望。

當按題主所說的方式進行節目,應單純考慮就是兩個盒子,一個錢多一個錢少,你選錢多的那個幾率就是50%,換不換盒子沒意義


算期望的話,因為 (3^(k-1) + 3^(k+1))/2 = (3^(k-1))(1+9)/2 &> (3^(k-1))3 = 3^k,所以當然會得到奇怪的結論。然而我們換一個角度來想,我們只是要一個大的,所以題目的答案跟「兩個盒子相差一塊錢」不應該有區別。所以我們應該去計算「盒子裡面的錢更大」的概率,得到50%,沒毛病(逃


個人覺得題主考慮的兩個問題不在一個大前提下,是不能在一起比較的

如果將兩個盒子中的錢數看做隨機事件,在兩個盒子都沒有打開時,按通常期望的計算方法,兩個盒子中錢數的期望都是無窮大,這時數學上是無法定義期望的,也無法按期望的大小來比較打開那個盒子更有利。但從盒子中錢數的隨機分布來看,兩個盒子是相同的,無論打開哪一個都不會更有利。

一旦你打開了一個盒子,你對盒子中的錢數這件事就知道了更多的信息。比如,一旦你打開了一個盒子,你對另一個盒子中的錢數能給出一個範圍,但之前這一點你是做不到的。這個時候讓你選擇開不開另一個盒子,你當然可以根據已有的信息做出更有利於自己的選擇。因為此時,開和不開另一個盒子已經不是對等的了,而導致兩件事不再對等的原因就是你打開了一個盒子,獲取了更對的信息,對未知事件有了更進一步的判斷。

更簡單地說就是,打開一個盒子使得概率空間發生了變化,那麼在兩個不同概率空間中的事件是不能放在一起比較的


概率算錯了。請注意條件概率的定義。套公式,容易陷進坑裡。

在不為1的情況下,當你知道盒子里是3^n的時候,隱含了兩個信息。

1、前n-1次都是正面。

2、注意:如果第n次是正面,那麼第n+1次必定是反面。

換句話說,只有兩種情況,第n次為正,或第n次為負,不用考慮第n+1次和n-1次,也就是另一個盒子的大小概率均是1/2。

而題主錯誤在於並沒有考慮清楚條件概率,「出現3^n+1」的情況並非完全被包含在「出現3^n」的情況之中,兩者的交集只有一種情況。

但是算出了概率,再算期望,會發現換盒子比不換的期望高,這個問題 @燒茄子 已經說的很明白了,原因就是盒子里的錢是3^n,非線性函數。

問題等價於:投一次硬幣,猜正反面,正面則賺2*3^n,輸則虧2*3^n-1,求策略。


啊!蟹妖(???????)

好喜歡這個問題!!!

頻率派放開這個題,讓我大不列顛倫敦神甫牧師貝葉斯來─=≡Σ(((つ??ω??)つ

基於你打開了盒子(有抽樣信息),並且能概括出盒子狀態的先驗分布(有先驗信息),我們認為這是一個貝葉斯決策問題???(●˙?˙●)???

然後套進去算後驗風險最小咯o(*////▽////*)q

但我現在沒有空算Σ( ° △ °|||)︴

有興趣的讀者先自己算一下,然後就能給出決策集啦(???????)


按照扔硬幣的題設,你扔了n次,會有3^(n-1)或3^n。對固定的n,最大期望是3^n。

如果打開3^n,不需要換;打開3^(n-1)則換。

但是按照你後面的分析,扔硬幣這個題設毫無意義。題設變成了:盒子里有3^(n-1)或3^n,打開一個是3^k,另一個3^(k-1)或3^(k+1),幾率各半。這種情況下換,1/2的幾率獲得現收入的1/3,1/2的幾率獲得現收入的3倍。對於玩家已知的n,並不存在期望無窮大。是盈利遠大於虧損時,虧損和盈利幾率相等的賭徒問題。

——————

3^(k-1)和3^(k+1)的出現概率比不是1:1,是2:1。

看到手上的數是3^k,則可能扔了k次或(k+1)次,二者出現的概率比為(1/2)^k:(1/2)^(k+1)=2:1。

則換後期望是2/3.3(k-1)+1/3.3^(k+1)=11/9.3^k>3^k。


我覺得這個演算法是有問題的。

我們已知盒子裡面有3^n塊錢

因此肯定已經擲了n次(如果只有n-1次,那麼最大的金額就是3^(n-1)),同樣第n+1次沒有成功,那麼另一個盒子有多少錢呢?這裡枚舉一下:O表示成功,X表示失敗(或不存在)

n:X 3^(n-1)

n:O n+1:X 3^(n+1)

由於第n次投擲成功的獨立事件概率是50%,因此盒子B超過盒子A的概率也是50%。

當你打開了一個盒子A,盒子B的概率就變了。

正如,發牌員發牌,一個人拿牌之前知道和不知道之前的其他人手裡的牌,概率是不一樣的


打開盒子意義就是獲取信息,因為你做出換盒子的選擇是根據後驗概率計算了另一個盒子金錢的期望(你不打開盒子的話期望根本就不存在,因為不收斂)。

一次獨立的遊戲中,打開盒子後你的後驗信念告訴你要選另一個,只不過在你設定的遊戲規則里每一次都會告訴你要換。如果你只是單純選擇了一個盒子,但沒有打開(沒有獲得更多的信息),這時你是無法選擇是否交換的。

至於如何構建,我覺得類似於無窮旅館用同階無窮大,每個正整數住了一個人,現在讓所有人移到兩倍房間號那裡,能住兩倍的人,但實際上還是只住了正整數個人。同樣現在對於每一個有限的事件,讓你的期望乘以11/9,能多拿11/9倍的錢,但總體來說這個策略期望得到的還是與隨機策咯期望得到的錢同階。


  先說結論。總的來說,在給定了決定隨機變數k的方法以及盒子與k和k-1的指數對應關係之後,打開一個盒子查看結果後,如果不是保底的1元的話,是否選擇更換與指數底數的大小有關,打開箱子的意義在於避免1元慘劇(這與底數無關),沒有悖論。

  下面就這個問題進行完整的分析。在這種問題下(比如經典的三門問題與此類似),應該討論後驗概率。下面,定義隨機變數 K 為「節目組總的投幣次數」。不失一般的,假設你上台後只會打開某一個(比如左邊的)盒子(因為錢是隨機裝的所以沒問題),定義隨機變數 X 為「左邊的盒子裝的錢多則為0,否則為1」。顯然有 Kin Z^+Xin {0,1}KX 獨立。簡單的邊沿分布為 P{K=n}=0.5^nP{X=i}=0.5, iin {0,1} (這是因為錢是隨機放的)。我們的實驗觀測量也是一個隨機變數 N ,定義為「打開的盒子中裝的錢以三為底的對數」,顯然有 Nin {0,1,2,...} 。現在我們開始計算,要求解的問題是:「在已知 N=n 的條件下,我打開的盒子裝的錢比較少的概率有多大」,也就是求 P{X=1|N=n} ,這是一個標準的條件概率。要求條件概率,先求聯合概率。計算 KXN 聯合概率分布如下:

P{X=0,N=n}={egin{align}{P{K=n,X=0}=P{K=n}P{X=0}=0.5^n*0.5=0.5^{n+1}, n>0\ 0,n=0}end{align}

P{X=1,N=n}=P{K=n+1,X=1}=P{K=n+1}P{X=0}=0.5^{n+1}*0.5=0.5^{n+2}

容易驗證, sum_{x,n}{P{X=x,N=n}}=1 。下面求條件概率,有

P{X=x| N=n}=P{X=x, N=n}/{sum_{x}P{X=x, N=n}}

P{X=1| N=n}=P{X=1, N=n}/{sum_{x}P{X=x, N=n}}=(0.5^{n+2})/(0.5^{n+2}+P{X=0| N=n})

即有

P{X=1| N=n}={egin{align}0.5^{n+2 }/(0.5^{n+2}+0.5^{n+1})=1/3, n>0\0.5^2/(0.5^2+0)=1, n=0end{align}

同樣地,

P{X=0| N=n}={egin{align}0.5^{n+1 }/(0.5^{n+2}+0.5^{n+1})=2/3, n>0\0/(0.5^2+0)=0, n=0end{align}

這裡的結論是在某個盒子錢數已知的情況下,已知一個盒子中錢數所對應的指數,則另一個盒子的錢是否比它多的概率(在這裡是條件概率)就確定了,與錢的底數(題目中是3)無關

  但是實際上,決定是否要換盒子的就是這個底數。不妨設底數為 alpha>0 ,則兩個盒子的錢數分別是 alpha^{k-1}alpha^{k} 。前面分析可知,假如你開的寶箱是保底的1元(即 K=1,X=1 ,要注意這個情況的發生概率高達25%),那麼肯定要換;否則,這個盒子的錢數是 alpha^{n} ,而另一個盒子的錢數的條件期望為

alpha^{n+1}P{X=1|N=n}+alpha^{n-1}P{X=0|N=n}=alpha^{n}*(2/alpha+alpha)/3

可見只要 (2/alpha+alpha)/3>1 即應選擇換,即 alpha>2或alpha<1 。因此結論就是,在這種遊戲里,開到保底無腦換,否則只要錢的底數滿足條件 alpha>2或alpha<1 也要換,題目給出的 alpha=3 正是這種情況;否則,比如令 alpha=1.5 ,那就不用換了。

  整體的邏輯用語言表達的話是這樣的,如果開箱開到保底1元的話,你就知道節目組只拋了1次硬幣,並且你開到了錢數少的那個,這樣的概率是25%,那就只能哀嘆自己命苦然後換箱子;否則,你既不能完全知道節目組拋了幾次硬幣(n或者n+1),也不能知道自己到底選了多的還是少的箱子,但是冷靜分析之後你發現拋n次的概率是n+1次概率的兩倍,有三分之一的概率另一個箱子錢比這個多,三分之二的概率少,那麼就要看多多少了。譬如底數 alpha=100 ,那就是有三分之一的概率翻100倍,剩下三分之二機會虧99%,那肯定是搏一搏單車變摩托。打開箱子的意義就在於讓你知道自己是不是抽到了保底,在這種情況下不論底數是多少都要換


如果我打開盒子,發現盒子裡面有3^n (n&>0)元錢, 那麼另一個盒子里可能有3^(n-1)元錢(對應投了n次硬幣),也可能有3^(n+1)次方元錢(對應投了n+1次硬幣),顯然,前者發生的概率是後者的2倍,即節目組有2/3概率投了n次,1/3概率投了n+1次,……

我認為問題出在這段。(結果算出了一個不同的數學期望,並且並沒有解決問題)


如果第一個盒子里有 3^{n} (n&>0)元錢,那麼可以確定的是:

  1. 前(n-1)次必定是正面
  2. 如果有第(n+1)次,一定是反面

因此兩種情況的概率應該是:

  • 另一個盒子里有 3^{n-1} 元錢,即投了n次硬幣,即前n-1次是正面,第n次是反面。發生概率為: frac{1}{2} (第n次是反)
  • 3^{n+1} 次方元錢:投了(n+1)次硬幣,即前n次是正面,第(n+1)次是反面。發生概率為: frac{1}{2} (第n次是正)

所以另一個盒子里錢數的數學期望是:

frac{1}{2}	imes3^{n-1}+frac{1}{2}	imes3^{n+1}=frac{5}{3}	imes3^{n}

……(好像哪裡不對)


這個是雙信封問題啊,主流意見就是因為沒有上限,所以概率論其實在這裡並不適用了。所以也就不存在換不換了。

還有一個角度就是當你在比較 N-1. N N+1的期望時候,你已經犯了個錯誤,不可能同時存在這三種值,而且他們n n+1. N n-1兩個情況的概率並不能直接相加。


推薦閱讀:

完美的「洗」牌?
火腿三明治定理(ham sandwich theorem)

TAG:悖論 | 數學 | 邏輯 | 趣味數學 | 概率 |