讀書筆記-如何通俗理解beta分布
參考:小傑:如何通俗理解beta分布? 小傑的回答
參考:貝塔分布_百度百科
用一句話來說,beta分布可以看作一個概率的概率分布。
舉一個簡單的例子,棒球擊球率(batting average),就是用一個運動員擊中的球數除以擊球的總數,我們一般認為0.266是正常水平的擊球率,而如果擊球率高達0.3就被認為是非常優秀的。
假設一個棒球手,已經成功alpha次,失敗beta次,他到目前為止的成功率就是alpha/(alpha+beta)。
比方說,alpha=81,beta=219。
他下次擊球的成功概率,就服從beta分布,即Beta(81,219)的分布,這是一個類似正態分布的曲線,從0~1,峰值在 81/(81+219)。
如果下次,他又擊中1球,則分布變為Beta(81+1,219+1)。
如果接下來,他打了300次,其中擊中了100次,200次沒擊中,那麼分布變為Beta(81+100,219+200),從圖上看,曲線變尖了,且靠右了,說明這個人成功率上升了,評價變好了。
綜上,Beta分布,就是從一個人過去成功率,來得到一個成功概率的概率分布,來推斷他下一次成功率為某個特定值的概率分布。
我對此的理解就是:
拋一個硬幣,有0.5的正面概率,這個是我們所知道的;拋一個特製硬幣,據說存在一個固定值X,有X的概率是正面的,但這個X我們不知道,只能慢慢的去猜。
先拋上n次,正面a次,反面n-a次。這樣,我們可以初步估計,正面的概率大概率應該是a/n。概率的概率分布是Beta(a,n-a)。
然後再不停的拋,每拋一次,概率的概率分布Beta()都會被修正。
當拋次數n趨向於無窮的時候,概率的概率分布Beta()圖形會越來越穩定,這樣就會得到這個硬幣的固定值X。
在百度百科上,Beta分布的公式是:
這個理解起來很方便。alpha是已經成功的次數,beta是已經失敗的次數,變數x表示成功概率,1-x表示失敗的概率,f表示概率的概率分布。分子中,x^(alpha-1)表示成功alpha次的總概率,(1-x)^(beta-1)表示失敗beta次的總概率,x^(alpha-1)(1-x)^(beta-1)表示出現了「正好成功alpha次並失敗beta次」這種情況的總概率;分母則是,把從0到1的每種可能的概率u都積分了,表示所有的概率的概率之和。分子/分母,表示的是,給定「正好成功alpha次並失敗beta次」的情況,概率為x的概率/概率為所有值的總概率,從而得到概率為x的概率密度函數。
推薦閱讀: