[終結數學月經題系列1]星期二男孩問題
來自專欄 武同學的數學腦洞
所謂月經話題,是指論壇里每個月都會出現的久久沒有定論的話題性很強的問題。比如處女處男的問題、爆照的問題……在數學中也有一些月經話題。不論是在知乎、豆瓣、貼吧,還是在其他論壇,都有一些數學問題引發爭議。這些問題有的答案不唯一,有的答案看起來非常違反直覺。比如「星期二男孩問題」、「三門問題」、「紅眼島問題」等等。
我希望能夠在這個專欄中把常見的數學月經問題匯總,用最淺顯的語言,深入淺出地向讀者透徹地講述這些題的正確思路,以及為什麼錯誤的思路看起來如此具有迷惑性。
本篇文章的核心是「星期二男孩問題」。
請看如下四個問題:
1.鄰居有兩個孩子,已知年紀更大的是男孩,求另一個是男孩的概率。2.鄰居有兩個孩子,已知其中有一個是男孩,求另一個是男孩的概率。
3.鄰居有兩個孩子,已知年紀更大的是男孩且出生於星期二,求另一個是男孩的概率。4.鄰居有兩個孩子,已知其中有一個是男孩且出生於星期二,求另一個是男孩的概率。我們假定:嬰兒是男性或女性的概率都是二分之一,求神拜佛、喝葯、念經、信春哥,去男科醫院、黃道吉日生孩子等事情並不會改變將要生下來的孩子是哪個性別的概率;;
生於星期幾是等可能事件;
世界上只有兩種性別,沒有變性手術;
不存在雙胞胎或者多胞胎的可能。
總而言之,我們在理想情況討論這個問題。
咋一看,貌似四道題答案都是二分之一。畢竟兩個孩子的性別是獨立事件;孩子的性別與在星期幾齣生也毫無關係。
但數學有時候是反直覺的。只有第一題和第三題的答案是二分之一。
首先來看第一題:這道題是無需我多解釋的。這個問題等價於「已知生下的第一胎是男孩,那麼再生一胎還是男孩的概率是二分之一」。或者也等價於「已知第一次拋硬幣硬幣是正面,那麼第二次拋硬幣也是正面的概率是二分之一」。第一胎的性別與第二胎的性別的確是獨立事件。答案的確是二分之一。
但是第二題的答案是三分之一。我們考慮兩個孩子的四種組合,每個組合的概率都是相等的。即(男男、男女、女男、女女)。已知其中有一個男孩的情況下,我們需要排除掉(女女)的情況。那麼現在的樣本空間只有三種情況:(男男、男女、女男),且三種情況概率相等。於是另一個是男孩的概率只有三分之一。
感覺第一題和第二題沒有什麼本質區別,為什麼答案會不同?
我們再對問題簡化下:
第一題:某家有兩個孩子,已知第一個為男孩,問第二個是男孩的概率?1/2
第二題:某家有兩個孩子,已知至少有一個為男孩,問第二個是男孩的概率?1/3我首先從信息的觀點給出一個解釋:上面兩個問題中,提問的人所攜帶的信息是不同的!在第一題中,提問者可以說只用觀測年紀大的孩子的性別,當他觀測到老大是男孩的概率後,他不知道另一個孩子是男是女,他也不需要去觀測。於是他跑來問你,你對他說答案是二分之一,沒毛病。
第二個問題中,提問的人已經知道第二個孩子的性別信息了,這個觀察者知道所有兩個孩子的性別,於是告訴你:「有一個是男孩」。事實上,這個觀察者已經提前幫你刪除了(女女)的情況,所以最終的概率「坍縮」了。
如果你是數學系的讀者,肯定不滿足於上面的解釋。事實上,如果我用專業數學的術語解釋這道問題的話,讀者可能會減少一半。我試圖用最簡單的理論體系來解釋這個問題,當然我建議你繞過這部分:
概率——嚴格的來說,概率的本質是一個函數。那麼你們可以回想下高一上學期的內容:函數需要滿足什麼條件?三個條件:定義域,函數關係,值域。
首先這個函數的值域是[0,1]。我想這方面大家應該沒有什麼意見。這就是概率的取值範圍。概率是不能超過1的,也是不能小於0的。
定義域是樣本空間。什麼是樣本空間?樣本空間是一個集合,這個集合的元素是樣本點。什麼是樣本點?樣本點是一個隨機現象的最基本的可能的結果。什麼是隨機現象?並不總是出現相同結果的現象叫做隨機現象。好了,追本溯源到此為止。
最後,什麼是函數關係?這裡的函數關係就是那個字母P。我們說一個概率P(A),這裡的P就相當於f。也就是說,P(A)即f(A)。f(A)是不是看起來很像函數了?
好的,解釋完概率,剩下就好辦了。在第一個問題中,樣本空間是(男男,男女,女男,女女),所以分母是4。在第二個問題中,樣本空間是(男男,男女,女男),所以分母是2。
我已經給出了兩個角度的解釋,事實上還能從貝葉斯的角度來解釋這個問題,甚至從貝葉斯的角度來重新定義「概率」的本質是什麼。不過這三言兩語講不清,我以後有機會將新開一篇文章論述這個。
再來看後兩題:
3.鄰居有兩個孩子,已知年紀更大的是男孩且出生於星期二,求另一個是男孩的概率。
4.鄰居有兩個孩子,已知其中有一個是男孩且出生於星期二,求另一個是男孩的概率。第三題等價於「已知在星期二生了一個男孩,求再生一個孩子仍然是男孩的概率」。這道題的答案顯然是二分之一。
但是在第四題中,這個提問者對你說:有一個生於星期二的男孩。這句話有兩層意思:第一層意思是字面意思,即有一個生於星期二的男孩,第二層潛在的意思是,這個提問的人他已經觀察了所有兩個孩子的性別以及他們出生在星期幾,和第二題類似,他在作出這個描述的時候,事實上已經刪除了一些可能性(兩個孩子都是女孩或沒有一個孩子出生在星期二的情況)。此時,我們面對的已經不是所有可能性,而只是所有可能性中的一個部分,所以概率不是 50%,而是 13/27。(用數學語言來說,就是樣本空間減少了)
以下是計算過程:
為了方便描述,我們用 「1」, 「2」, 「3」, 「4」, 「5」, 「6」, 「7」 表示周一至周日出生,」b」, 「g」 表示那個孩子是男孩還是女孩,比如 「2b」 就表示某個孩子是周二出生並且是男孩,」3g」 則表示某個孩子是周三出生並且是女孩。然後我們窮舉一下周一至周日7天出生的兩個孩子的所有可能性,一共有 14 ×14 = 196 種可能。
我們再找出其中包含星期二出生的男孩的項,即包含 「2b」 的項,一共有 27 種,如下:
( 1b , 2b ), ( 1g , 2b ), ( 2b , 1b )
( 2b , 1g ), ( 2b , 2b ), ( 2b , 2g )
( 2b , 3b ), ( 2b , 3g ), ( 2b , 4b )
( 2b , 4g ), ( 2b , 5b ), ( 2b , 5g )
( 2b , 6b ), ( 2b , 6g ), ( 2b , 7b )
( 2b , 7g ), ( 2g , 2b ), ( 3b , 2b )
( 3g , 2b ), ( 4b , 2b ), ( 4g , 2b )
( 5b , 2b ), ( 5g , 2b ), ( 6b , 2b )
( 6g , 2b ), ( 7b , 2b ), ( 7g , 2b )
這27種可能里另一個孩子也是男孩的情況是13種。
也就是說,已知一個孩子是星期二出生的男孩的情況下,另一個孩子也是男孩的可能性是 13/27 ,小於二分之一(但是接近二分之一)。
概率又一次發生了坍縮。
正比如我們評價一個歷史人物要在當時的社會背景,不能用現在的價值觀去評判一個歷史人物。同樣的,在概率論中,提問者他所已知的信息是很重要的基礎,不同的表述可能帶來樣本空間的改變。比如「年紀大的是出生於星期二的男孩」,這句話並沒有帶來另一個孩子的任何信息。而「其中有一個是出生於星期二的男孩」,這句話表明提問的人已經觀察過兩個孩子的性別和出生日期,並且幫你刪除掉兩個都是女孩或者兩個都不是出生於星期二的情況。
本文章將不斷修改、更新,根據評論區的答覆和疑問來完善我的文章,試圖讓儘可能多的朋友對這個問題認識透徹。
剩下的其他月經問題我將在後續隨緣推出。
武辰:[終結數學月經題系列2]三門問題歡迎關注此專欄,也歡迎打賞,一分錢也是鼓勵~
推薦閱讀:
※矩陣分解及其意義
※集成學習
※為什麼說「概率」帶來一場現代革命?
※隨機、賭徒謬誤、小數定律,概率論中最簡單的智慧!
※論風險:概率論還是決定論