讀書筆記-二項分布和Beta分布
參考: 二項分布和Beta分布 - CSDN博客
伯努利試驗:相互獨立,結果非0即1。例如仍硬幣。如果一個改造了的硬幣出正面的概率為0.6,也算伯努利試驗。
二項分布:如果事件發生的概率是P,則不發生的概率q=1-p,N次獨立重複試驗中發生K次的概率是:
P(K)= C(n,k) * p^k * (1-p)^(n-k),其中C(n, k) =n!/(k!(n-k)!)
關於上式的理解就是,p^k是按特定順序成功k次的概率,(1-p)^(n-k)是按特定順序失敗n-k次的概率,p^k * (1-p)^(n-k)是「按特定順序成功k次且失敗n-k次」的概率,而C(n,k)則是出現「按特定順序成功k次且失敗n-k次」這種情況的總的組合數目(換句話說就是所有的順序的組合),乘起來,就是「成功k次且失敗n-k次」的總概率。
二項分布是說,已知某件事情發生的概率是p,那麼做n次試驗,事情發生的次數就服從於二項分布。二項分布的極限就是正態分布。
下面是擲10次硬幣,得到的二項分布
n = 10
k = np.arange(n+1)
pcoin = stats.binom.pmf(k, n, 0.5)
#結果是 [ 0.00097656, 0.00976563, 0.04394531, 0.1171875 , 0.20507813, 0.24609375, 0.20507813, 0.1171875 , 0.04394531, 0.00976563, 0.00097656])
下面是投擲6次骰子,出現6點的概率分布。
n = 6
k = np.arange(n+1)
pdice = stats.binom.pmf(k, n, 1.0/6)
#結果是 [ 3.34897977e-01, 4.01877572e-01, 2.00938786e-01, 5.35836763e-02, 8.03755144e-03, 6.43004115e-04, 2.14334705e-05])
Beta分布
例如有某種特殊的硬幣,我們事先完全無法確定它出現正面的概率。然後拋10次硬幣,出現5次正面,於是我們認為硬幣出現正面的概率最可能是0.5。
但是即使硬幣出現正面的概率為0.4,也會出現拋10次出現5次正面的情況。
因此我們並不能完全確定硬幣出現正面的概率就是0.5,所以也是一個隨機變數,它符合Beta分布。
Beta分布是一個連續分布,由於它描述概率的分布,因此其取值範圍為0到1。 Beta分布有和兩個參數,其中為成功次數加1,為失敗次數加1。
下面的代碼,用擲硬幣為例,來描述Beta分布。
import pylab as pl
import numpy as np from scipy import statsn = 10 #擲硬幣10次
k = 5 #正面5次
p = np.linspace(0, 1, 100) #獲取一個數組,有100個元素,從0到0.989898,構成等差數列。表示概率從0~1,離散成100份。
pbeta = stats.beta.pdf(p, k+1, n-k+1) #獲取Beta分布(pdf是用來獲取分布的函數,+1的目的,是為了避免k=0的特殊情況導致計算出現nan值)
plot(p, pbeta, label="k=5", lw=2) #畫出來一個類似正態分布的曲線,中值在0.5處。
k = 4 #正面4次
pbeta = stats.beta.pdf(p, k+1, n-k+1)
plot(p, pbeta, label="k=4", lw=2) #畫出來一個類似正態分布的曲線,中值在0.4處。
xlabel("$p$")
legend(loc="best")
n = 20 #擲硬幣20次
k = 8 #正面8次
p = np.linspace(0, 1, 100)
pbeta = stats.beta.pdf(p, k+1, n-k+1)
plot(p, pbeta, label="n=20", lw=2) #畫出來的曲線,中值也在0.4處,但更高更尖銳,就像方差更小的正態分布圖形。
推薦閱讀:
※看完《艱難愛情》你有什麼感悟?
※《管錐編》讀書筆記
※為什麼說余華寫的是一種現實?
※論力量訓練原理在閱讀中的應用
※沒希望的事情還值得堅持嗎
TAG:閱讀 |