引言
在接觸正態分布函數時,一方面是為了加深理解,一方面是好奇於公式誕生的過程,於是在網路上尋找其推導過程。講述正態分布的起源、發展、應用的文章很多,講述易於理解的有具體推導過程的文章卻較少。
本文基於《正態分布函數公式推導》進行重寫,略去了大部分文字內容,補全小部分具體步驟。希望對於想了解該函數具體推導過程的讀者有所幫助。文中多有錯漏之處,還望指正。
目標函數
在概率論中遇到的正態分布概率密度函數是:
其中u表示平均值,σ2表示方差,此公式的來源是建立於以下的基本假設之上。
基本假設
假設在一個平面直角坐標繫上朝原點扔飛鏢,投擲的結果會產生隨機誤差,如圖所示:
飛鏢出現在位於x的垂直線上的概率記為p(x).
飛鏢出現在位於y的水平線上的概率記為p(y).
飛鏢出現在虛線交匯處的概率記為g(r).
出現在交匯處概率顯然為上述兩者的乘積,因此有g(r) = p(x)p(y).
[假設1:誤差與坐標系的方向無關]
[假設2:大誤差的可能性小於小誤差的可能性]
函數原型
根據假設1可知,因為概率與坐標系的方向無關,所以距離原點為r的區域其概率都等於g(r).即飛鏢出現在距離原點半徑為r的圓上的概率為g(r).
根據三角函數可知:x = r·cosθ,y = r·sinθ,g(r) = p(r·cosθ)·p(r·sinθ)
[函數乘積的求導:兩個可導函數乘積的導數等於第一個函數的導數乘以第二個函數,加上第一個函數乘以第二個函數的導數.]
方程兩邊對θ求導(鏈式法則):
因為g(r)與θ的變化無關,所以其對θ的導數為0:
對等式進行整理後得.
用分離變數法解微分方程,因為x,y是獨立的,該微分方程對於任意x,y都成立,其定義的比值是一個常數,設為C.
因為函數的導數中含有函數本身,所以函數是以e為底的冪函數.
根據假設2,當x增大時出現的概率應該減小,所以常數C必須是負值,令k = -C.
確定常數A
因為函數p是概率分布,所以曲線下方的總面積必須為1,根據該條件進行積分確定常數A.
因為函數p關於y軸對稱.
同理,對y而言有.
故兩者的乘積為.
寫成重積分的形式.
轉換為極坐標形式.
積分函數對應的原函數如下.
對函數進行積分,結果如下.
因此,A的值如下.
函數p可重寫為.
積分函數可重寫為.
確定常數k
概率分布中主要參數就是平均值和方差,從這兩個參數出發來確定k值.
當樣本是離散的時候,通過累加後除以樣本數求平均值,通過樣本減去平均值的平方的累加後除以樣本數求方差.
當樣本是連續的時候,可以通過積分的方式來求平均值和方差.
因為函數xp(x)是奇函數,所以平均值u=0.
因為函數p(x)關於y軸對稱,所以方差可寫為如下形式.
代入原方程中,可得.
最終形式
當平均值為u,標準差為σ時,正態分布函數如下.
當平均值為0,標準差為1時,標準正態分布函數如下.
參考文獻
The Normal Distribution: A derivation from basic principles, Dan Teague, North Carolina School of Science and Mathematics
正態分布函數公式推導_延年松鶴_新浪博客
Tieven
2018.12.19
tieven.it@gmail.com
TAG:概率 | 數學 |