標籤:

正態分布推導過程

引言

在接觸正態分布函數時,一方面是為了加深理解,一方面是好奇於公式誕生的過程,於是在網路上尋找其推導過程。講述正態分布的起源、發展、應用的文章很多,講述易於理解的有具體推導過程的文章卻較少。

本文基於《正態分布函數公式推導》進行重寫,略去了大部分文字內容,補全小部分具體步驟。希望對於想了解該函數具體推導過程的讀者有所幫助。文中多有錯漏之處,還望指正。

目標函數

在概率論中遇到的正態分布概率密度函數是:

其中u表示平均值,σ2表示方差,此公式的來源是建立於以下的基本假設之上。

基本假設

假設在一個平面直角坐標繫上朝原點扔飛鏢,投擲的結果會產生隨機誤差,如圖所示:

飛鏢出現在位於x的垂直線上的概率記為p(x).

飛鏢出現在位於y的水平線上的概率記為p(y).

飛鏢出現在虛線交匯處的概率記為g(r).

出現在交匯處概率顯然為上述兩者的乘積,因此有g(r) = p(x)p(y).

[假設1:誤差與坐標系的方向無關]

[假設2:大誤差的可能性小於小誤差的可能性]

函數原型

根據假設1可知,因為概率與坐標系的方向無關,所以距離原點為r的區域其概率都等於g(r).即飛鏢出現在距離原點半徑為r的圓上的概率為g(r).

根據三角函數可知:x = r·cosθ,y = r·sinθ,g(r) = p(r·cosθ)·p(r·sinθ)

[函數乘積的求導:兩個可導函數乘積的導數等於第一個函數的導數乘以第二個函數,加上第一個函數乘以第二個函數的導數.]

方程兩邊對θ求導(鏈式法則):

因為g(r)與θ的變化無關,所以其對θ的導數為0:

對等式進行整理後得.

用分離變數法解微分方程,因為x,y是獨立的,該微分方程對於任意x,y都成立,其定義的比值是一個常數,設為C.

因為函數的導數中含有函數本身,所以函數是以e為底的冪函數.

根據假設2,當x增大時出現的概率應該減小,所以常數C必須是負值,令k = -C.

確定常數A

因為函數p是概率分布,所以曲線下方的總面積必須為1,根據該條件進行積分確定常數A.

因為函數p關於y軸對稱.

同理,對y而言有.

故兩者的乘積為.

寫成重積分的形式.

轉換為極坐標形式.

積分函數對應的原函數如下.

對函數進行積分,結果如下.

因此,A的值如下.

函數p可重寫為.

積分函數可重寫為.

確定常數k

概率分布中主要參數就是平均值和方差,從這兩個參數出發來確定k值.

當樣本是離散的時候,通過累加後除以樣本數求平均值,通過樣本減去平均值的平方的累加後除以樣本數求方差.

當樣本是連續的時候,可以通過積分的方式來求平均值和方差.

因為函數xp(x)是奇函數,所以平均值u=0.

因為函數p(x)關於y軸對稱,所以方差可寫為如下形式.

代入原方程中,可得.

最終形式

當平均值為u,標準差為σ時,正態分布函數如下.

當平均值為0,標準差為1時,標準正態分布函數如下.

參考文獻

The Normal Distribution: A derivation from basic principles, Dan Teague, North Carolina School of Science and Mathematics

正態分布函數公式推導_延年松鶴_新浪博客


Tieven

2018.12.19

tieven.it@gmail.com


推薦閱讀:

TAG:概率 | 數學 |