概率論中各種分布的內在聯繫?
01-16
我在概率論中一直有一個疑惑。各種分布都有著千絲萬縷的聯繫,二項分布極限一下變成泊松分布,泊松分布二項分布加上一下條件就變成了正態分布。就如這篇文章所說。感覺這些分布都只是某個更深層次原因的一些不同的外在表象。就像在知乎上的這個問題中David Yin在4樓的回答,但是講得太飄了。可否把真正聯繫它們內在的那個東西講一下。還有就是能把指數簇分布也深入的講解一下。
非常簡要初級地介紹一下二項分布, 泊松分布, 正態分布, 指數分布, Laplace分布, Gamma分布之間的聯繫.
以動差生成函數(MGF, Moment-generating function)為主要工具展開介紹.
當且僅當1. 二項分布 泊松分布
即得到當時, 二項分布逼近泊松分布
2. 二項分布 正態分布
由中央極限定理(Central limit theorem)可得兩者聯繫, 這裡使用MGF另外介紹.均為常數
使用當當時即得到當時
3. 泊松分布 正態分布
使用當
當時即得到當時, 為泊松分布的正態近似
4. 泊松分布 指數分布
(泊松過程,Poisson process)為某事件在時間段內發生的總次數
令為該事件第一次發生的時間
即
5. 指數分布 Laplace分布
即得到, .
6. 指數分布 Gamma分布
即得到多個指數分布的和為Gamma分布
在這個框架下面有一套比較成熟的有關三角級數弱收斂的理論,叫Stein-Chen theory。
Probability Surveys這是一個一個深入淺出的介紹的介紹,適合初次接觸的人了解這方面的理論。
(一)基於離散次數的隨機試驗(Bernoulli trial)
- Bernoulli distribution(伯努利分布,0-1分布)描述的是一種隨機試驗(結果只有成功或失敗,可能性是固定的p)發生的概率;
- Binomial distribution(二項分布)Y~B(N,p) 描述的是N次獨立重複隨機試驗(Bernoulli trial)成功次數的概率;
- Geometric distribution(幾何分布)Ni~G(p)描述的是Bernoulli trial第i-1次成功到第i次成功所需的試驗次數(描述的事件是無記憶的);
- Negative binomial distribution(負二項分布)Wk~NB(k,p)描述的是Bernoulli trial第k次成功所需的試驗次數(Wk = N1+N2+...+Nk);
- Poisson distribution(泊松分布)X~P(ν,T)描述的是,單位時間(0,T)(或空間)內隨機事件發生的次數,是二項分布N→∞,p→0,Np = νT (= λ)的極限[TR = 1/ν = T/Np,為平均重現期];(像不像前面的什麼分布,你懂得)
- Exponential distribution(指數分布ED)Ti~E(ν) 描述的是,隨機事件第i-1次發生到第i次發生所需的時間(描述的事件是無記憶的);(像不像前面的什麼分布,你懂得)
- Gamma distribution(伽馬分布)Wk~Γ(k,ν) 描述的是,隨機事件第k次發生的時間(Wk = T1+T2+...+Tk);(像什麼我不用說了吧,連符號都懶得換了)
- Normal distribution(正態分布)
- Lognormal distribution (對數正態分布)
- Extreme value distributions (極值分布)
(四)其他
- Hypergeometric geometric distribution(超幾何分布)X~NG(N,n,M)描述的是,N個物件中有M個獎品,從中不放回地抽出n次,中獎的的次數;
- Zeta distribution
- Uniform distribution (均勻分布)
- Beta distribution
- Weibull distribution
- Rayleigh distribution
- Cauchy distribution
- Pareto distribution
- Laplace distribution
- Logistic distribution
- ......
雖然被邀請...然並不能看懂大部分答案...順便問問有沒有人能告訴我Fisher distribution和t分布的區別,適用於什麼地方...助教不明白只告訴我按答案怎麼做。
推薦閱讀:
※數學學的好的人是不是長得都很醜?
※什麼是 AdS / CFT ?
※1,2,3,6,7,( ),( )空格里填什麼?
※說數學是「自洽」的是什麼意思?
※如何證明二維離散傅里葉變換的旋轉不變性?