怎麼來理解伽瑪(gamma)分布?
參數有點多,又有積分,公式上看起來挺複雜的,地位上為什麼這麼重要,有哪些實用的方面,怎樣可以方便理解?
其實你只要記住了Gamma function
做積分變換,可得,從而
那麼Gamma distribution 就很好記了。
並且伽馬分布與一大坨分布有著曖昧的關係,比如:
Erlang distribution、Chi-squared distribution、Exponential distribution、Beta distribution、Normal distribution
Gamma分布即為多個獨立且相同分布(iid)的指數分布變數的和的分布。
(最新修改,希望能夠行文布局更有邏輯)
——————泊松過程——————
指數分布和泊松分布的關係十分密切,是統計學中應用極大的兩種分布。
其中泊松過程是一個顯著應用。
泊松過程是一個計數過程,通常用於模擬一個(非連續)事件在連續時間中發生的次數。
為一個泊松過程,則其滿足三個性質:
①(t=0時什麼都沒發生)
②(增量)之間互相獨立:
擴展補充:與互相獨立,且在計數過程中
這是因為
③
即
根據增量獨立性,易知其成立。
——————泊松→指數——————
假設為第次事件與第次事件的間隔時間。
所以
所以
即泊松過程的事件間隔時間為指數分布。
——————指數→Gamma—————
再令,即從頭開始到第次事件的發生的時間,該隨機變數分布即為Gamma分布。
即。
Gamma分布即為多個獨立且相同分布(iid)的指數分布變數的和的分布。
——————證明——————
假設且互相獨立
①Moment Generating Function(MGF):
MGF的定義為
則
其性質為
下證:
則
為Gamma分布的MGF。
MGF:Moment-generating function
②數學歸納法:
已知
所以當時成立。
假設時成立
當時,
其中
為的pdf。證畢。
推薦一本書
Random Phenomena: Fundamentals of Probability and Statistics for Engineers
在我讀本科的時候,這本書的作者正好來我們學校交流,我上了他開的暑期課,感覺收穫挺多的。
這本書里關於各種分布背後的來源/應用,我覺得是講得不錯的。拿題主問的Gamma分布來說, @T Yuan的回答給出了和泊松過程、指數分布的關係,以及詳細的數學推導,這裡不再重複。書上(9.1.2節)給了幾個例子幫助直覺上的理解,其中一個是:
冗餘系統(standby redundant system)
假設有一個系統有個部件,但實際需要的只有一個(其餘的是備用)。當一個部件失效時,另一個自動接管。因此,只有當所有個部件都失效時,系統才會崩潰。在一定假設下,Gamma分布可以用來描述這樣一個系統的壽命。
需要理解?alpha (一般為整數)代表一件事發生的次數;beta代表它發生一次的概率(或者叫速率)。那麼gamma 分布就代表這麼一件事發生alpha 次所需要時間的分布。
例如alpha=1 就是指數分布
從熵最大化的角度來看,如果一個事物既滿足算術平均值是固定值,又滿足幾何平均值是固定值的,這種分布最可能的分布為分布。
也就是說,分布可以用來模擬我們經常用來作為思想實驗的事物,總數是不變的同時,其增長率也是固定的。這種事物是不存在的,但是我們可以給出他存在的概率。這種思考問題的方式確實真實存在,例如我們經常講人民幣每年升值20%,均衡匯率為6.5。例如風速,我們也可以認為其總量是不變的,同時增速也是固定的。但是我們必須要注意,因為分布更多的用來描述匯率、速率這樣的變數,所以他是沒有量綱的量,也就是說與正態分布最大的不同,2X就是2倍風速的意思,不能是改變單位的意思。
伽瑪分布一般和指數分布一起理解:
1、從意義來看:指數分布解決的問題是「要等到一個隨機事件發生,需要經歷多久時間」,伽瑪分布解決的問題是「要等到n個隨機事件都發生,需要經歷多久時間」。
所以,伽瑪分布可以看作是n個指數分布的獨立隨機變數的加總,即,n個Exponential(λ)random variables---&>Gamma(n,λ)
2、從公式來看:
X~Gamma(α,λ),概率公式如下
alpha代表上述的n, 當alpha=1時,就變成了指數分布:
3、從統計指標來看:
這就是 n(alpha)倍的指數分布的期望啊!
這樣就好記多了吧?
------------------------------------------------------
補充一下:
如果想更好地理解,還可以加入泊松分布,泊松分布解決的是「在特定時間裡發生n個事件的機率」。所以可以腦洞大開地想:伽瑪分布=指數分布*泊松分布。看看pdf的表達式,自己換一個寫法就會發現伽瑪把exponential和poisson的公式揉到一起了。
推薦閱讀:
※牛頓為什麼用拉丁文寫《自然哲學的數學原理》?
※牛頓過後數學方面還有什麼突破性的進展嗎?
※為什麼一次函數、二次函數、三次函數的圖像都是對稱的,而四次函數則不一定?
※超幾何分布和二項分布的數學期望為何相同?