如何推導正態分布的概率密度函數?

(1)如何推導正態分布的概率密度函數f(x)=frac{1}{sqrt{2pi } sigma}e^{-frac{(x-mu )^{2} }{2sigma ^{2} } }
(2)正態分布與二項分布有什麼關係


謝邀。我回答這個也過癮一下,畢竟這類數學很又也沒有寫了。

如果一個概率密度函數的期望值和誤差是已知的,那正態分佈函數是滿足這些條件的最大熵值(maximum entropy)解。一個概率密度函數p(mathbf{x})的熵值為S[ p(mathbf(x) ] = - int dmathbf{x} p(mathbf{x}) log p(mathbf{x})

p(mathbf{x})不是任意的,它要滿足一定條件。第一個條件就是要歸一:int dmathbf{x} cdot p(mathbf{x}) = 1。如果只滿足這個,那p(mathbf{x})是平均分佈。

但如果已知期望值為mu和誤差為sigma,即
int dmathbf{x} mathbf{x} p(mathbf{x}) = mathbf{mu}
int dmathbf{x} (mathbf{x}-mathbf{mu})^2 p(mathbf{x}) = int dmathbf{x}  mathbf{x}^2 p(mathbf{x}) - mathbf{mu}^2 = sigma^2

我們要尋找最大熵值解,即我們要求最大的S而滿足以上的條件,那我們要用Langrangian multipliers:
S[ p(mathbf{x}); lambda_1, lambda_2, lambda_3] = - int dmathbf{x} p(mathbf{x}) log p(mathbf{x}) + lambda_1 left( int dmathbf{x}  p(mathbf{x}) - 1 
ight) + mathbf{lambda_2} cdot left( int dmathbf{x} mathbf{x} p(mathbf{x}) - mathbf{mu} 
ight) + lambda_3 left( int dmathbf{x} left(mathbf{x}^2 p(mathbf{x})
ight) - mathbf{mu}^2 - sigma^2 
ight)

用Euler-Langrange方程,知道最大熵值解必滿足
0 = frac{delta S}{delta p(mathbf{x})} = - log p(mathbf{x}) - 1 + lambda_1 + mathbf{lambda_2} cdot mathbf{x} + lambda_3 x^2
p(mathbf{x}) = exp left(- 1 + lambda_1 + mathbf{lambda_2} cdot mathbf{x} + lambda_3 x^2 
ight)

然後就是代數了,把這p(mathbf{x})代進那三個條件中便可求得lambda_1, mathbf{lambda_2}lambda_3,然後常見的正態分佈便呼之欲出。量子場論中的平均場解(mean-field solution)也是用類似方法求的。


2017.11.25修改:發現之前的鏈接已經失效,換成了自己之前evernote里存的鏈接

------------------------------------

善科文庫(正態分布的前世今生(上))

善科文庫(正態分布的前世今生(下))

這兩篇文章說的非常清楚了,從各種角度對正態分布的由來做了闡述和推導,由此也確實可以看到為何正態是如此的重要。

你的第二個問題在開篇就有了解答,正態分布是二項分布的極限分布


推薦閱讀:

一堆密堆積的球之間的間隙在一起看起來是什麼樣子的?
為什麼物理學定律可以由數學公式寫成?
假設水的密度不隨空間的變化而變動,要充滿整個宇宙,需要多少體積的水?
在爐石傳說中,當你處於天梯的 20~5 級時勝率保持為多少則可使自己的獲取星數期望為零?

TAG:數學 | 概率 | 正態分布 | 概率論 |