標籤:

正態分布里為什麼會出現自然底數e和圓周率pi呢?


我認為這要從正態分布的起源說起。

首先,我們只需要弄清楚為什麼e會出現就行了,因為pi的出現只是由於歸一化條件罷了。

正態分布的發現起源於對觀測誤差的建模, 下面同統計學的思想來簡單說明一下,從這個過程就能知道為什麼e會出現在正態分布的密度裡面了。

假設mu為真實的值,x_i為觀測得到的值,由於觀測具有隨機性,我們將觀測偏離真實值的的大小x_i-mu用一個概率密度函數p(x_i-mu)來刻畫。對於這個p(x), 我們只需限定其關於x=0對稱,p(x)>0恆成立,且具有連續導數;除此之外,進一步假定,樣本均值frac{sum_{i=1}^nx_i}{n}=hat{mu}mu的極大似然估計;那麼我們就可以斷定,這個p(x)就是我們所熟知的高斯核。注意我們這裡提出的對p(x)的對稱性,嚴格正性,光滑性的限制是建立在對於觀測誤差的一些合理假設上的;樣本均值的極大似然性假設則是統計學的思想,即樣本均值是對於mu的一個比較合理的估計。

現我們有獨立同分布的觀測x_1,x_2,...,x_n,則似然函數可以寫成Pi_{i=1}^np(x_i-mu)。記(	ext{ln}p(x))^prime=g(x),由樣本均值的極大似然性, 我們有sum_{i=1}^ng(x_i-hat{mu})=0

n=2時,利用g(x_1-hat{mu})+g(x_2-hat{mu})=0以及x_1-hat{mu}=-(x_2-hat{mu})得到g(-x)=-g(x)

n=3時,同上並利用g(x)為奇函數的性質,得到g(x)+g(y)=g(x+y),這是熟知的柯西方程,所以有解g(x)=ax.

再利用(	ext{ln}p(x))^prime=g(x)以及歸一化條件便可得到p(x)的解析形式了。

再回過頭來看這個簡證,其實e也不是必然會出現,因為取對數似然函數的時候完全可以取任意正數作為底,本質上只是利用了對數將乘法變為加法的初等性質而已。

這也是高斯發現正態分布的過程。

-----------補充----------

其實歷史上還有很多對正態分布的刻畫的推導,如中心極限,最大熵,stein方法,旋轉不變形等等,個人認為這裡利用誤差的分布來說明應該是最初等以及原始的了吧。


正態分布是二項分布的極限分布,由於二項分布中有階乘,將階乘轉化需要用Stirling公式:lim_{n 
ightarrow +infty}{ } frac{n!}{sqrt{2pi n} (frac{n}{e})^{n}  } =1

這樣看epi就自然會出現在正態分布中。


出現e:正態分布是熱方程的基本解。

出現π:為了概率論全區域積分為1。


推薦閱讀:

真正的數學建模高手是什麼境界...?
數學中國論壇的美賽輔助報名靠譜嗎?
微軟的計算器為什麼輸入 ln 2 是先輸入 2 再輸入 ln?
物理系適合的張量教材還有變分法教材?
學習經濟學應該掌握哪些數學工具或是學習哪些數學理論?

TAG:數學 |