數學題:我一個老朋友有且只有兩個孩子,有一次我打電話過去,是他一個孩子接的,而且是個女孩,那麼他有兩個女兒的概率是多少?
非常贊同陳浩同學的分析。
這裡有點補充。
這個問題確實缺乏前提條件的假設。實際上大家都自覺不自覺的應用了如下假設。
1)假設人的性別只有男和女兩種。在生物學中實際上存在雙性人和性別不明者等等特殊情況(不過數量非常稀少)。2)假設生男生女的概率各佔50%。實際上,在某些國家和地區,由於性別歧視等原因導致殺女嬰以及針對女性胎兒的選擇性墮胎等現象,從而導致男多女少。
3)假設一個孩子的性別和其它孩子的性別沒有任何相關性。這一點貌似和現實情況一致。對於不了解貝葉斯方法的非數學專業人士來說,有沒有更好理解的計算方法呢?嘗試如下。
首先,根據上述三條假設條件我們可以計算得知,下述四種情況的概率各佔1/4。
A)老大女,老二女。 B)老大女,老二男。 C)老大男,老二女。 D)老大男,老二男。 其次,既然該家庭有女孩接電話了,那麼我們可以排除D的可能。 然後,我們依舊要假設前提條件:不考慮孩子不在家的情況。如果男孩女孩隨機接電話。我們可以看到A類家庭和B、C類家庭女孩接電話的概率是不相同的。A是1,而B和C都是1/2。由此不難推導出有兩個女兒的家庭占女孩接電話的家庭數的1/2(=1/(1+0.5+0.5))。
如果女孩優先接電話。我們看到A、B、C類家庭女孩接電話的概率是相等的。由此不難推導出有兩個女兒的家庭占女孩接電話的家庭數的1/3。
如果男孩優先接電話。我們可以類似的推導出該家庭有兩個女孩的概率是100%。
為什麼會有多種概率的可能呢?接電話的方式為什麼會影響概率呢?這個問題曾經困擾了我一段時間——也許它也曾經困擾過你。 最後我的結論是:實際上該家庭兩個孩子的性別在我們做出猜測之前已經是確定的了,所謂的概率其實指的是我們猜中的概率, 而我們了解到的關於該家庭的信息的程度決定了我們猜中的概率。以上支持1/3的都犯了明顯的計算錯誤,而支持1/2的也的確沒有說服力。
這是一個已經解決的悖論,維基上有詳細的介紹[1],非常推薦大家仔細閱讀一下。維基的意思我就不說了,下面著重說1/3的計算錯在哪裡,以及1/2為何沒有說服力。一種1/3的典型代表是@魏清玥
自以為列出所有可能,數出1/3。但是可能的情況不是{男男,男女,女男,女女}4個,而是8個,分別是;
老大女,老二女,老大接電話(女)老大女,老二女,老二接電話(女)老大男,老二女,老大接電話(男)老大男,老二女,老二接電話(女)老大女,老二男,老大接電話(女)老大女,老二男,老二接電話(男)老大男,老二男,老大接電話(男)老大男,老二男,老二接電話(男)排除男孩接電話的情況,現在您再數數,是不是2/4=1/2?另一種1/3的典型代表是 @茉茉。
@茉茉 認為,接電話的是女孩 這個條件,等同於 至少一個是女孩。這是非常錯誤的。一般情況下,接電話的是女孩 可以推出 至少一個是女孩;但是請注意,至少一個是女孩 不能推出 接電話的是女孩。也就是說 至少一個是女孩 是一個更弱的條件,範圍更大。擅自代替,導致擴大條件的範圍,進而導致計算條件概率時,得到1/3這樣一個更小的結果。我想這裡,條件等價的重要性大家都很清楚,但是我仍以一個例子說明:接電話的是女孩可以推出至少一個是人,但是後者不能反推前者。按@茉茉 的意思,不強調等價,就可以以至少一個是人為條件,得到1/4這樣一個更小的結果,豈不荒謬?維基[1]認為,需要明確該家庭接電話的方式,才能得到答案。
兩個極端情況是:如果倆孩子隨機接電話,則答案是1/2;如果女孩優先接,則答案是1/3。
這是因為,不同的接電話的方式,決定了接電話的是女孩這一條件的強弱。接電話的是女孩,等價於 至少一個是女孩 並且 女孩優先接電話。因此沒有 女孩優先接電話 或其他類似假設,@茉茉 就在擴大條件,其答案就是不能成立的。而這個假設,又是非常不正常的……@茉茉認為維基[1]的做法多此一舉,認為題目不明確也不能自己加條件,而且照樣可回答。
我目前沒有理解她是什麼意思,難道題目不明確了,就可以隨便擴大或縮小條件的範圍了么?題目條件不明確,好像「一隻狗是黑的,問它是什麼種類」,不知不做其他假設如何回答?況且無論如何,直接用不等價的條件代替題設的條件,都不是「認真紮實」的做法啊。我要求她嚴格證明,使用 至少一個是女孩 這一條件,如何能因題設的不明確而變得合法,目前為止她都在迴避。1/2的典型代表是 @吳健。
@吳健 使用獨立事件的思路,快速得到1/2的結果。但是要得到 獨立事件 這一結論,你們也必須假設:倆孩子隨機接的電話。當然這是一個很自然的假設……但是數學不是想當然。說服對方的過程中,所有1/2的支持者都在排斥貝葉斯方法,這是非常錯誤的。
對這個問題,貝葉斯永遠是最嚴謹的解法。如果你認為自己是對的,就要敢於用其他方法去檢驗。本題中,應該用貝葉斯得到1/2的結果,然後你就會看到需要假設隨機接電話,才能做出獨立事件的結論。1/3的同學都嫻熟使用著貝葉斯方法,只是把條件概率中的條件搞錯了。你一味排斥其方法,不自己算一遍,怎麼可能有說服力……有了這次獨立事件的經驗後,做其他題目你可以直接按獨立事件來做,但是獨立事件永遠是一個trick,而不是嚴謹地解題。[1] http://en.wikipedia.org/wiki/Boy_or_Girl_paradox
附,接電話的是女孩的條件下,兩個都是女孩的概率:
P(兩個都是女孩 | 接電話的是女孩)=P(接電話的是女孩 | 兩個都是女孩)* P(兩個都是女孩)/ P(接電話的是女孩)=1 * 1/4 / P(接電話的是女孩)假設兩個孩子中隨機選出一個接電話,則P(接電話的是女孩)= P(接電話的是女孩|女女)* P(女女)+P(接電話的是女孩|男女)* P(男女) +P(接電話的是女孩|女男)* P(女男)+P(接電話的是女孩|男男)* P(男男) +P(接電話的是女孩|孩子數不為二)* P(孩子數不為二)=1 * 1/4 + 1/2 * 1/4 + 1/2 * 1/4 + 0 * 1/4
=1/2(以上第一個等號後第三行專為@茉茉 所加,此項為零,她若承認我便刪去這行)所以P(兩個都是女孩 | 接電話的是女孩)=0.25 / 0.5=1/2莊家命題:
莊家有兩個硬幣蓋住不讓你看,如果兩個硬幣都是向上,你就贏。情況1:莊家告訴你一個事實:至少有一枚向上,這時勝利概率為1/3,因為根據該條件會有3種情況:上下、下上、上上,3種情況概率相同,所以是1/3。[典型觀點1]情況2:莊家露出一枚硬幣,是向上的,另一枚仍然蓋住,這時勝利概率為1/2,因為蓋住的那枚有1/2機會向上。[典型觀點2]
命題分析:
原題的"有且只有兩個孩子"表述了一個事實:有兩個孩子,男女未知。原題的"是他一個孩子接的,而且是個女孩"這句表述了兩個事實:1.有一個是女孩2.女孩接電話結合起來,現在就存在3個事實:1.有兩個孩子2.有一個是女孩3.女孩接電話這3個事實出現了兩種相互正交(獨立)的隨機性:
Rdm1:生育出女孩的隨機性——性別的隨機性,選項有:男、女Rdm2:誰接電話的隨機性——不帶性別的人物隨機性,選項有:人物①、人物②用莊家命題來描述:Rdm1的隨機性是必然存在的,由拋硬幣時決定。Rdm2是否出現隨機性是不確定的,因為莊家可以採用存在隨機性的規則,也可以採用不存在隨機性的規則: 規則1:存在隨機性的規則,莊家隨機露出手上的任意一枚硬幣 規則2:具有確定性的規則,莊家優先露出向上的硬幣,不存在隨機性題目中沒有明確Rdm2中採用哪種規則,這是第4個事實。這個事實告訴答題者:不要理會莊家露出硬幣時採用什麼規則,你應該把"不知道莊家的選擇規則"作為已知條件進行解題,任何一種對這個未知條件的猜測都是離題了。把"不知道莊家的選擇規則"作為一個已知條件明確到題目中,莊家命題就可以等效成:當我們去到莊家面前的時候,只看到莊家面前有1枚向上的硬幣,莊家手中蓋著一枚硬幣,這時莊家問你:兩枚硬幣都向上的概率是多少?這時我會說:答案是1/2
分析典型觀點1:
在莊家命題的情況1中,得出1/3結論的依據是從"至少一枚硬幣向上"推導出上下、下上、上上這3種可能出現的情況。然而,上下和下上之所以被區分是因為考慮到排列的順序,如果我們明確這兩枚硬幣的編號:硬幣①和硬幣②,那麼確切的表達方式應為上①下②、下①上②;問題是,列舉"上上"時並沒有遵循和上下、下上一樣的列舉原則,因為列舉上上時沒有考慮排列的順序,這是矛盾的地方。如果列舉是按照統一的原則來進行,那麼列舉出來的情況應該是:上①下②、下①上②、上①上②、上②上①,4種情況出現概率相同,有一半機會出現上上的情況。:-)分析典型觀點2:持有典型觀點2的分兩種類型:typ1.承認莊家是用隨機規則選擇硬幣的,並用利用了這個條件幫助解題typ2.忽略莊家用什麼規則進行選擇,解題時不考慮該因素無論哪種typ,答案都是1/2,但typ1的思路我並非完全贊同,主要分歧在於是否"離題"。 贊同typ2的觀點,只是很多tpy2的支持者沒有挑明"為什麼應該忽略莊家選擇規則"的理由。:-)
說1/3的人,無非是用了古典概型,古典概型的要求每個基本事件發生的概率相等。而這個題中(如果認為自然狀態下男女都是1/2的概率) 兩個孩子的性別分別可以是(按出生先後排序)
男男 女女 男女 女男 每種是1/4概率
已知一個女孩接電話了
女孩接電話這個事件,排除了男男這種情況
但是注意接電話這個事件對 男女 女男 這兩個事件是有影響的,因為在這兩種情況下,女孩接電話的概率都為1/2,而女女的情況下女孩接電話的概率為1 所以到這,不能運用古典概型的演算法了,應該是1/(1/2+1/2+1)=1/2
而不是1/(1+1+1)=1/3先講個故事:陳浩 與 @茉茉 打賭朋友兩個孩子是同性還是異性,兩人一算同性(女女、男男)異性(男女、女男)的概率都是1/2.(這點應該都認同)
兩人打電話去朋友家,接電話的是個女孩。
陳浩一算,同性、異性概率仍然都是1/2;茉茉一算,男男已經被排除了,只有女女、女男、男女,因此同性概率是1/3.
乍一看都有道理,但反證:假設接電話的是男孩,茉茉的方法得出同性概率也是1/3.總結起來,與兩人在之前得出的1/2矛盾。
關鍵在於「對兩個孩子同時觀察,兩個孩子是對稱的。」換句話說,「觀察到一個孩子是女孩」不等於「知道至少有一個女孩」。
誤會的地方在:觀察到一個女孩不但排除了男男,還排除了一部分 男女、女男。詳細推導:
女女中女孩接電話概率 1 ,所以女女且女孩接的概率 1/4.為A
男女中女孩接電話概率1/2,所以男女且女孩接的概率 1/8.為B女男中女孩接電話概率1/2,所以女男且女孩接的概率 1/8.為C男男中女孩接電話概率 1 ,所以男男且女孩接的概率 0.兩個孩子且女孩接電話由ABC構成,其中女女占(1/4)/(1/2)=1/2.
直觀也很好理解,都觀察到一個女孩了,賭男女或者女男的勝率肯定減小嘛。
這道題的物理意義,是玻色子的全同效應。「同時觀察兩個孩子」的作用很重要,不能忽略(不再是獨立事件,以獨立事件得出1/2的都是撞對了)。
廣告1:陳浩挖坑,茉茉跳進去了。廣告2:老虎打盹,也不可以放過,不然就是承認自己是紙老虎。廣告3:跳出火坑,是多麼不簡單的一件事啊。寫在前面的前面Wow!茉茉首先要佩服 陳浩 先森的震懾力,竟然讓茉茉跳進了火坑差點超過12小時。這還不是關鍵,關鍵在,茉茉在找他的破綻的時候又說了一大堆的荒誕言論,荒誕程度離扼腕已經不遠了。對不起了,廣大的友們。如果你們有意想嘲笑茉茉,可以去看看編輯歷史。真的真的,很抱歉,很慚愧。好了,言歸正傳,讓我們來研究下 陳浩 先森的答案。附,接電話的是女孩的條件下,兩個都是女孩的概率:
P(兩個都是女孩 | 接電話的是女孩)=P(接電話的是女孩 | 兩個都是女孩)* P(兩個都是女孩)/ P(接電話的是女孩)=1 * 1/4 / P(接電話的是女孩)假設兩個孩子中隨機選出一個接電話,則P(接電話的是女孩)= P(接電話的是女孩|女女)* P(女女)+P(接電話的是女孩|男女)* P(男女) +P(接電話的是女孩|女男)* P(女男)+P(接電話的是女孩|男男)* P(男男)=1 * 1/4 + 1/2 * 1/4 + 1/2 * 1/4 + 0 * 1/4=1/2所以P(兩個都是女孩 | 接電話的是女孩)=0.25 / 0.5=1/2這三段里,如果中間那段無懈可擊,這將會是多麼完美的回答啊!然而,事情總不會像我們大家希望的那樣存在,這又是多麼的令人遺憾!為什麼呢?請仔細看這段:
P(接電話的是女孩)
= P(接電話的是女孩|女女)* P(女女)+P(接電話的是女孩|男女)* P(男女) +P(接電話的是女孩|女男)* P(女男)+P(接電話的是女孩|男男)* P(男男)=1 * 1/4 + 1/2 * 1/4 + 1/2 * 1/4 + 0 * 1/4=1/2第一個等號左邊與後邊是否真的等價呢,或者說,第一個等號是否成立呢?
答案是,NO!先說這個等號後邊:P(接電話的是女孩|女女)* P(女女)+P(接電話的是女孩|男女)* P(男女)+
P(接電話的是女孩|女男)* P(女男)+P(接電話的是女孩|男男)* P(男男)
這兩行計算的實質是什麼?是 P(接電話的是女孩|家裡有兩個孩子)。
而 陳浩 需要的那個子項是什麼?是 P(接電話的是女孩)。再說這個等號的左邊, P(接電話的是女孩),這個概率到底是多少呢?對不起,在缺少其他條件的時候,你說多少都可以,因為沒人知道它到底是多少。
有人說,我們這題里的大前提就是兩個孩子啊,難道有什麼不對嗎?
茉茉:親愛的們,我們在把實際問題變換到數學語言里,自然是不能放過任何一條信息,比如「家裡有兩個孩子」。但是,一旦我們完成了這項工作以後,我們就要一是一、二是二,嚴格按照我們運用的理論去詮釋了,比如這裡,以 陳浩 的思路,他一定要把這個問題這樣用數學語言來詮釋,他一定堅持他要計算P(接電話的是女孩)。但么,就請真的去計算P(接電話的是女孩)吧,而不要用P(接電話的是女孩|家裡有兩個孩子)來濫竽充數了。因為這是兩個完全不一樣的東西。
所以,當問題這樣被他遮蓋了本來的面目以後,他就人為縮小了「接電話的是女孩」這個事件空間,當他把這項帶入公式里的分母時,當然得到的最終結果就比正確結果大了,這就是為什麼他的答案1/2要比茉茉的答案1/3大。
那麼 陳浩 算了半天算的是什麼呢?對不起,茉茉不知道。對這種張冠李戴後產生的結果,茉茉一時還解釋不了。
親愛的友們,陳浩真的會繼續抓著我的「小辮子」不放,會繼續質問我為什麼沒有說清楚我在進行計算的時候怎麼可以把P(接電話的是女孩)直接用 P(兩個孩子里至少有一個女孩)來代替哦!茉茉到底有沒有「小辮子」被陳浩抓住了呢?
嚴格意義上說,是有的。就是因為茉茉沒有嚴正說明,其實幾乎在所有問題里,在題目涉及了的事件沒有被準確定義其發生情況時,我們都會「默認」,這個「不明事件」的發生是隨機的。有關這點共識,至今我還沒有發現提出異議者。所以當 陳浩 這樣在這個問題上做文章的時候,我的第一反應就是迴避。因為我不認為這是一個需要花費大量時間去探討的問題。
那麼,可憐的茉茉到底有沒有像陳浩所說,「擅自代替,導致擴大條件的範圍」呢?另外,陳浩算的也是「接電話」這個事件為隨機選擇時候的概率,為什麼他會有張冠李戴的錯誤,茉茉卻沒有呢?下面這段話同時回答了這兩個問題。
這就又回到這個問題最初的狀態了:怎樣把實際問題儘可能轉化為數學語言。茉茉的思路是,「家裡有女孩接電話」與「家裡有女孩」在傳達信息這點上是quasi等價的。這個quasi之所以只是quasi,是因為我們默認,我們對這句話的分析,重點不在「接電話」上,所以,「接電話」這個信息不在我們考慮範疇里;但我們又不能說這兩個說法毫無差別,所以不能說是完全等價的。對實際問題進行統計分析時,我們要做的第一步,永遠都是甄選我們需要的可以加以利用的信息或者數據,比如這裡,根據題目要求的概率,家裡另外那個孩子也是女孩的概率,那麼「家裡有女孩接電話」這句話的可利用信息就是「家裡有女孩」,至於是「接電話」,還是「開門」,還是別的什麼,這些都對求家裡另外那個孩子也是女孩的概率沒有任何可以影響到的地方,所以,茉茉選擇的思路是:把「家裡有女孩接電話」簡化成「家裡有女孩」。
但是,只有「家裡有女孩」這句話,我們還是沒法繼續求解,所以,必須找到與之對應的數學語言:「家裡至少有一個女孩」。而這兩個命題,是完全等價的。於是,茉茉下面的答案是這樣說的:現定義事件X為:孩子中女孩的個數。
我們要求的概率便是:P( X = 2 | X &> = 1 ) 。至此,茉茉找到了 陳浩 的問題所在,並且在過程中讓自己的思路更加清晰了。所以,謝謝陳浩和其擁護者對我提出的所有質疑。
寫在前面
本以為這道題目回答到此已經沒什麼好再說的了。但我承認,當我看見不負責任的答案和各種毫無意義的評論,還是忍不住要寫下這個必須置頂的總結語。
- 答案到底是1/2 還是1/3 從來都不該是被糾結所在,關鍵是,針對什麼樣的問題,就該找什麼樣的方法去解決。
- 研究自然科學最最關鍵的是要有紮實的求真過程,無論是演繹證明還是計算,你的每一步都應該做到無懈可擊,只要有任何一絲你覺得不很確定的地方,就該再回過頭去重新考慮。
- 自然科學更加講求精準。到目前為止,我接觸過的無論是書本上還是現實中的問題,還沒有一例存在不同的結果,哪怕求解過程不同。所以,如果誰堅信這道題設沒有任何問題的問題是個「悖論」題,那我也只能攤手了。讓最虔誠的基督徒去承認達爾文,是在做無用功。
- 因為從昨天到現在看到了很多莫名其妙的現象,我想有必要還是要提一下跟這道題毫無關係的,有關對各種title的態度。在我看來,title從來都只是一個身份符號,而不是戴這個title的人言論正確無誤的保證書。每個人都有不懂的時候、錯誤的時候、包括一些在各種學術論壇上被發表的論文或post上,也還是常常能找到一些並不很準確的東西。這些都不是問題,若發現這些,反而是對當事人諾大的幫助。我遇見過的好教授,課堂上最喜歡的事情,都是學生提出他們板書里或計算錯誤、或不準確的小漏洞,難道我們在這個時候該想:他是教授,肯定不會錯的?
- 再回到這題。其實這題有一個很簡單的解釋,現寫下來:一個家庭有兩個孩子的全部事件有4個,分別是:男男、男女、女男、女女。其中有效事件3個,分別是:男女、女男、女女。在這三個有效事件里,符合題設問題的只有女女這一個,所以,女女這個事件發生的概率便是3個有效事件裡面的1個,即:1/3。我之所以特彆強調這題跟「兄弟姐妹」無關,是因為這個先後順序與題目要求的概率毫無聯繫,非要扯上什麼聯繫,那也只有,「男女」、「女男」是兩個不同的事件。就像袋子里有足夠多的黑球和白球,每次取出兩個,「黑白」與「白黑」這兩個取法也是兩個互不影響而獨立存在的事件;但如果我說每次我都同時取一對球出來,那這個時候顯然「黑白」與「白黑」就是等同的事件了,這個可以理解為取有雙球形狀的物體,這物體因兩球顏色不同有三種形態:「全黑」、「全白」、「半黑半白」,這樣取物體的全部事件也就只有三個。這個簡單的例子是寫給那些質疑「雙胞胎」的友們的,先不提就算真的是雙胞胎也還可以區分前後,如果那麼喜歡用「雙胞胎」來考慮問題,這題目完全可以特意為你們改成:「雙胞胎之家有兩對雙胞胎,已知其中一對都是女孩,問另外一對也都是女孩的概率是多少」,答案與本題顯然一樣;再複雜一些:「雙胞胎之家有兩對雙胞胎,已知其中一對里有一個是女孩,問另外一對里也有一個是女孩的概率是多少」,這個概率明顯要大多了,有興趣可以自己算下。
- 再回到我提供的答案。之所以沒有用上面的三言兩語去回答這個問題,是因為,在不清楚看客們有何種程度的基礎時,我喜歡把最為基本的解決方法呈現出來,儘管有時會顯得冗繁與笨重。比如這裡,上面那個「有效事件」的提法,其實說的就是貝葉斯統計里的條件概率,因為某條件的存在,導致可發生的事件里有「有效」與「無效」兩種;失去了條件約束,所有可能發生的事件就都是「有效」事件,比如這題很多友們一直在堅持的1/2,就是這種情況下的結果。如果大家喜歡1/2,可以把題目改成:「已知朋友育有二童,此次接電話者為一女童,問下次來電時接電話者依舊是女童的概率。」,這個概率就跟「拋硬幣」、跟「生男生女」一樣是無可厚非的1/2了。
- 最後寫給一些質疑我「外行」、「抄課本」的人:無論你們是以何種心態對我有此般「敵意」(在我看來不分青紅皂白就給人亂扣帽子的行為就是充滿敵意),也無論你們是多麼熱愛你們的1/2,在此我不得不大聲說一句,一直支撐著你們堅持自己觀點的無非就是出於:1.不喜歡我這個人,這個我可以理解;2.只支持你們圈裡的人,這個我也可以理解;3.看見公式就反感,覺得這樣解決問題就是為了炫耀自己會,這個我也可以理解;4.因為所屬領域不一樣,導致混淆了概念,一聽到與「生男生女」或「拋硬幣」相關的問題,就立刻條件反射出來一個1/2,這個我更能理解了。因為:1.我沒想讓你們都喜歡我;2.友情超過承認科學事實不是我的態度,但不能阻止那是你們的態度;3.且不說這有什麼可炫耀的,就算是在炫耀,那也得有資格才行。而這個資格就是:能做到無懈可擊;4.這更不是你們的問題了,我一直以為我們大學之前的數學根本就不叫數學,充其量就是個算術,所以才會有這樣概念不清的現象。然而,對不起各位了,我對各位言語上的敵意的回應,就是:我要讓你們自己親眼看見、讓你們親自打破對1/2的盲目崇拜!——
- http://www.zhihu.com/question/19647377 這個問題我也參與回答了,因為這兩個問題本質是一樣的,所以答題過程也大同小異。不同的是,在那裡,我受到了一位友的啟發,用R把這個問題寫了幾句編碼,為了把實際生活中的情況展示出來給大家看。那段編碼做的只是,隨機抽取有十個孩子的家庭,記錄下十個孩子里有九個是男孩的次數,並記錄下另外那個孩子也是男孩的次數,全過程自動重複進行多遍(至少以萬為數量級),並在最後計算十個孩子全是男孩的情況所佔比例,程序最後一行給出的是這個比例應該有的理論值1/(n+1)。請在按照我的提示運行之前,先在這裡選擇適合自己操作系統的版本下載R這個統計軟體:http://cran.r-project.org/
- 本題是我來知乎這麼久第一次最認真也最完整地回答問題,感謝所有對我提出過任何質疑的友們,你們的存在、你們的質疑的存在,讓此刻的我為自己驕傲,起碼是這一刻。所以,請恕我不再回答任何評論。如果認真讀完我每一個字後、看見程序演示後依然堅持自己,那就不是我能做的了,因為我花這麼多時間圍繞這個問題寫下這麼多東西,無非就是想說出真相是什麼,至於看見真相後你們作何反應,我無法左右,也不想左右。
下面是最早給出的回答:
為了減少對題目理解上的分歧,請先讓我舉個簡單的例子說明一下這個問題涉及到的兩個不同概念。
假設一個餐館只提供包子和餃子。請考慮以下兩個問題:
問題1:已知來吃飯的客人里,有9個客人都點了包子,那麼,第10個客人也點包子的概率是多少?
問題2:已知來餐館吃飯的10位客人里有9個客人點了包子,那麼,剩下那個客人也點包子的概率是多少?
請先考慮下這兩個問題的不同在哪裡,再看下面的答案,會有幫助。
--------------------------------------------------------------------------------------------------------------------
這是一個典型的可以用貝葉斯定理解釋的例子。有關貝葉斯定理請參考[1]。
很多時候,我們想知道在某一事件確定發生的前提下,我們關心的事件發生的概率是多少。比如這裡,在接電話的是女兒這個前提下,好友兩個孩子同為女孩的概率。現定義事件X為:孩子中女孩的個數。
我們要求的概率便是:P( X = 2 | X &> = 1 ) 。根據貝葉斯定理,計算如下:P( X = 2 | X &> = 1 )
= P( X &> = 1 | X = 2 ) * P( X = 2 ) / P( X &> = 1 )= 1 * (1/4) / (3/4)= 1/3其中,
P( X = 2 ) 為兩個孩子同為女孩的概率:1/4,符合二項分布[2];P( X &> = 1 ) 為其中至少有一個孩子是女孩的概率:3/4 [3];P( X &> = 1 | X = 2 ) 為兩個孩子都是女孩的前提下至少有一個孩子是女孩的概率:1。附上貝葉斯定理:
P( A | B) = [ P( B | A ) * P( A ) ] / P( B )[1] http://zh.wikipedia.org/wiki/%E8%B4%9D%E5%8F%B6%E6%96%AF%E5%AE%9A%E7%90%86
[2] http://zh.wikipedia.org/wiki/%E4%BA%8C%E9%A0%85%E5%88%86%E4%BD%88
[3] P( X &> = 1 ) = P( X = 1 ) + P( X = 2 ) = 2! / 1! * 0.5^2 + 0.5^2 = 1/2 + 1/4 = 3/4
[4] 題目解完最後多羅嗦一句。我們在對數據用統計的方法進行分析時,有時會遺失本可以加以利用的數據呈現出的信息,所以心細、考慮周全相當重要。但更加忌諱的是,在數據沒有呈現出任何錶征時主觀添加額外信息。就拿這題來說,「接電話的是個女孩」和「朋友有兩個孩子」這兩條信息提供的只是:孩子總數為2、其中至少有一個是女孩。如果題目里提到諸如「電話鈴一響,女孩就跑去接電話」這樣的條件,那麼我們最後得到的又會是另外的結果。可是,本題沒有這麼說,不是因為本題題設不完整,而是這道題目他本身就是這樣的。觀點好多,基本上大家都是對先驗概率的假定有分歧。
我想多數人都同意在不知道更多信息下,選用一種概率分布。因為如果像 陳浩 糾結於孩子接電話的概率,這樣就沒完了,還得考察生男生女的概率,男女的存活率。我承認做這種更詳盡的考察,會使概率的估計更准,很多使用貝葉斯方法的案例(垃圾郵件、找失蹤核潛艇),都會儘可能細分情況。各種觀點:
- 1/2的觀點,假定不接電話孩子的男女概率各半
- 1/2的觀點,假設 1.老大男女概率各半 2.老二男女各半 3老大老二接電話的概率相等。 老大女,老二女,老大接電話(女) 老大女,老二女,老二接電話(女) 老大男,老二女,老大接電話(男) 老大男,老二女,老二接電話(女) 老大女,老二男,老大接電話(女) 老大女,老二男,老二接電話(男) 老大男,老二男,老大接電話(男) 老大男,老二男,老二接電話(男)
- 1/3的觀點,1.老大男女概率各半 2.老二男女各半 3.女孩接電話等價於至少有一個女孩。 老大女,老二女 老大男,老二女 老大女,老二男 老大男,老二男
我認為第一種觀點最好,也最簡潔明快。
第二種觀點對這個題目還是可以的,但是如果把題目改為,在女澡堂碰到一個女孩子,或者有一個女孩考了全級第一,這種方法就很難用了,總不能考察在女澡堂碰到男孩子的概率或在女澡堂碰到兩個女孩子的概率。我覺得還是使用第一種觀點的概率空間更合適。第三種觀點,是把概率空間劃分的不合理,結果一個女孩接電話找不到合適的事件對應,結果找了個太大的事件,至少一個女孩,對應上了。類似的一個錯誤:5個白球,5個紅球,從中取4個,前3次都取到白球的概率?錯誤方法,不計順序,將前3次取到白球等價於至少有3個白球。這個問題我也糾結了很久,看歷史修改就知道了。
這是道很有名的悖論題,每一個字的差別都會導致截然不同的結果.概率課教科書上有字眼相近的例題 但例題的答案與此題的正確答案毫無關係.我相信贊成1/3此答案的人,多數是這種記住教科書答案的學生.題目問的不是"人群中,所有雙女戶佔有女戶的比例",如果題目是這樣,那答案是1/3,只需要很簡單的計算就可以得到題目問的是, "我朋友家,他的雙女幾率",我們要計算的是我朋友家這個個案,社會全體的概率值不能簡單抄過來.本題可以很簡單的轉換為 "接電話的是個女孩,她的兄弟姐妹為女性的幾率為多少", 審題錯誤,會導致後面所有的推導過程完全錯誤. 你可以說"我的每個公式都是對的",但是我要說"你看錯題了"因為接電話的是個女孩,所以她為"姐妹之一"的可能性等於"兄妹之妹"與"姐弟之姐"的總和, 也就是說"她既可能是姐妹之姐,也可能是姐妹之妹",僅僅列舉"兄妹,姐弟,姐妹"三種情況 就推斷1/3,導致了本題的錯解這個可以用多次重複實驗驗證的. 對於每次實驗, 首先隨機生成兩個孩子的性別 然後隨機讓一個孩子接電話. 如果觀察到接電話的孩子是女的, 就進行統計. 最後在統計到的性別對中, 兩個都是女孩的性別對的數目所佔的比例就是近似的概率.
以下程序的執行結果是: 0.501501777369
import random
t = 1000000
cnt = 0
tot = 0
for i in xrange(t):
d1, d2 = random.randint(0, 1), random.randint(0, 1)
response = random.choice((d1, d2))
if response == 1:
tot += 1
cnt += (d1 == 1 and d2 == 1)print cnt / float(tot)
所有的這種引發大討論的「概率論」問題都是「語義」問題。
我只想說 我做了程序模擬 是1/2 程序是基於這樣一個思維情境:假設有4n(n非常大)家 那麼我們基本可以說這4n家裡 男男 女女 各有 有n家 剩下的一男一女有2n家 如果接電話是完全隨機的話 那麼可以說 n個男男家沒有女人接 n個女女家有n個女女接 一男一女家有n家是女女 n家是男男接 沒有問題么 由此我們看到 女生接電話的只有2n家 而女女只有n家 所以 n/2n得到1/2 你的簡單解法 即四樣本 男女 女男 男男 女女 去掉男男 得1/3的問題在於 默認了 男女 女男家 一定會是女生接電話 其實 男女女男家也有可能是男生接電話 所以 男女 女男和 女女的可能性在這裡 並不相同 這裡邊不需要扯進大小關係1/2
先驗概率。
2個男孩的概率 1/4, 且接電話是女孩的概率 0
1男1女的概率 1/2,接電話是女兒的概率是1/2。相乘得到1/42個女孩的概率是1/4,且接電話是女兒的概率是1/4因此,在得知接電話是女兒的情況下,有兩個女孩的概率是1/2;這個題目與「我一個老朋友有且只有兩個孩子,其中一個是女孩,那麼他有兩個女兒的概率是多少」的區別在於描述人所知道的信息。
問題地址:求概率帝解答:一個人有兩個小孩,其中有一個是生於星期二的男孩兒,問另一個是男孩兒的概率是多少?做出「一個人有兩個小孩,其中一個是女孩」這個描述的人,他已經知道所有孩子的性別,他在做出這個描述的時候,事實上已經刪除了一些可能性(即兩個孩子都是男孩)所以我們此時面對的已不是所有可能性,而是所有可能性的一部分,所以概率不是50%,而是三分之一。
老大女,老二女(符合)老大男,老二女(不符合)老大女,老二男(不符合)老大男,老二男(排除)回過頭來看這個題目,做出「有一次我打電話過去,是他一個孩子接的,而且是個女孩」的描述,說明他不清楚朋友家孩子的性別情況,列舉一下老大女,老二女,老大接電話(女)老大女,老二女,老二接電話(女)老大男,老二女,老大接電話(男)老大男,老二女,老二接電話(女)老大女,老二男,老大接電話(女)老大女,老二男,老二接電話(男)老大男,老二男,老大接電話(男)老大男,老二男,老二接電話(男)答案應該很明顯了。
那個接電話的女孩,有50%的可能性是妹妹,另外一個是姐姐的可能性是50%,因此,接電話的妹妹和不接電話的姐姐的組合的可能性是25%;接電話的女孩有50%的可能性是姐姐,另一個是妹妹的可能性是妹妹,因此接電話的姐姐和未接電話的妹妹的組合的可能性是25%;因此兩個女孩的可能性是50%。樣本空間應該是:未接電話哥+接電話妹,接電話姐+未接電話弟,未接電話姐+接電話妹,接電話姐+未接電話妹,既然考慮長幼之分及是否接電話,就不能把後兩項簡單的算作一種女女組合,應做區分。女女組合其實是兩種情況,第一種是姐姐接了電話,第二種是妹妹接的電話。
唉?!既然兩個孩子都已生下來了,兩人的性別組合已經是既成事實了,那麼「兩人都是女孩」,或等價地「尚不清楚的另一人也是女孩」的可能性就已經不能再以概率而論了吧?我世界觀有點崩壞了……
也許鄙人天生愚鈍,但是這個問題難道不是說兩個孩子,一個是女孩,另外一個是女孩的概率是多少?這樣不就是50%么?新人發言,有誤請指出!!
二分之一。因為一共兩個孩子,且已知其中一個是女孩。那麼另一個不是男的就是女的。所以!
公式:朋友有兩個孩子,都是女兒的概率為1/4(事件A)朋友有兩個孩子,至少有一個是女孩的概率為3/4(事件B)此時兩個孩子都是女孩必滿足至少有一個是女孩,即事件A,B同時發生的概率為事件A的概率,即P(AB)=P(A)根據條件概率公式:P(A/B)=P(AB)/P(B),P(A/B)=P(A)/P(B)=(1/4)/(3/4)=1/3推導:兩個孩子可能出現:{男+男,男+女,女+男,女+女}現在已知有一個女的,即男+男被否定,女+女在整體中的比例為1/3不保證答案的正確性……
很顯然是二分之一,影響概率的唯一因素是另一個孩子的性別。還分什麼誰大誰小,那要不要區分誰結婚誰沒結婚呢?要不要區分誰那天出門是否踩到狗屎了?有關係嘛????
數學題:我一個老朋友有且只有兩個孩子,有一次我打電話過去,是他一個孩子接的,而且是個女孩,那麼他有兩個女兒的概率是多少?
根據題目的文字知道,朋友有兩個孩子,隨時時間的延續,電話打過去,一個女孩接了,這個事情已經發生,第二個是女孩的概率,因為第二個人是未知性別的人,而此時的性別只能是兩種情況(男、女)的一種,所以是女孩的概率只能是1/2。
推薦閱讀:
※賭博有贏家嗎?
※Stephen Wolfram:宇宙的本質是計算 這和量子力學衝突嗎?
TAG:概率 |