假設有塊硬幣質地不均勻,那麼,該如何求正面朝上的概率呢?

假設歷史上已經有很多名人做過這個實驗,其結果如下:
正面朝上的次數 反面朝上的次數
歐拉 5001 4999
蒲豐 5100 4900
高斯 5050 4950
拉普拉斯 4998 5002
希爾伯特 5040 4960
龐加萊 5200 4800
我 5000 5000

顯然,這不是一個古典概型,那麼我該如何得到該硬幣正面朝上的概率呢?
另外補充一下:我已知正面要「重」一些,出現正面的概率肯定要大些,只是不知道具體是多少而已,想計算出來


這種估參數的問題在先驗概率(prior)分布假設可變的前提下什麼答案都有可能。如果你假設先驗概率是均勻的,那麼就用MLE(最大似然),在這個問題的情形下最大似然給出的結果就是概率等於頻率。如果你有一個不均勻的先驗分布(比如這道題來說,均值 0.5 方差 0.0001 的高斯分布可能更符合實際情況),那麼就用MAP(最大後驗)把先驗分布帶進去求解就行了。


對於「拋一次硬幣出正面概率為1/2」這個原假設,我們可以做常規的假設檢驗,如果有證據表明硬幣不均勻我們就拒絕原假設。其實就是算如果正面概率真的是1/2那麼出現和現有觀測一樣或者更極端情況的概率有多大(p值)。這個可以根據二項分布概率加和精確計算,如果樣本很大可以用中心極限定理。
但題主是想要直接估計正面概率。而我們知道拋硬幣是個二項分布問題,按照頻率學派的最大似然,x/n就是正面概率的估計(也符合直觀感受)。其實,最大似然估計已經是挺好的了而且有很多好的性質,但是當樣本量小的時候最大似然估計方差略大,或者像題主說的有「正面的概率稍大」這種先驗信息的時候,可以像前面同學說的用貝葉斯估計。比如先驗概率服從一個beta(a,b)分布(相當於先驗地知道正面概率為a/(a+b), 比如題主認為大於1/2就讓a&>b),那麼正面概率的貝葉斯估計就是(a+x)/(a+b+n). a, b參數的大小代表先驗信息的可靠程度(但都必須大於零),越大則估計越偏向先驗信息,越小就越偏向實際觀測。貝葉斯估計在小樣本的時候更穩定一些,但隨著樣本量增大最大似然估計和貝葉斯估計趨同。
題主如果真的拋過上萬次硬幣且結果對半分的話,無論以什麼方法分析都基本可以確信它是均勻的了:)
參考(第二個是一個小小的模擬程序,演示貝葉斯估計):https://en.m.wikipedia.org/wiki/Binomial_distribution
http://www.math.uah.edu/stat/apps/BetaCoinExperiment.html
https://en.m.wikipedia.org/wiki/Beta_distribution


正面重的話,應該是背面朝上的次數多一些


推薦閱讀:

鄉鎮衛生院是法人單位還是產業活動單位?
Excel 做折線圖,有的數值比其他大好幾個數量級,結果顯示時其他的變化都不明顯,請問如何調整?
海賊王里一共多少種笑聲?
中國的自殺率到底是多少?
如何理解置信度?

TAG:趣味數學 | 統計 | 概率論 |