估計量(estimator)服從正態分布是什麼意思?

對服從正態分布的表述不是很理解,求解讀


是這樣的。問題在於區別estimate,estimator和estimation這三個詞上。

統計推斷的一個主要任務就是用抽樣去估計總體分布的參數。比如,我們想要推測正態總體 N(mu, sigma^2) ,其中總體參數 musigma^2 是未知的,所以我們從中進行抽 n 次樣 X_1, dots, X_n ,用這些抽樣去估計未知的參數 musigma^2

具體怎麼估計呢?不同的估計方法使得我們可以構造不同的「函數」g(.) ,使得我們用 g(X_1, dots, X_n) 來表示某個參數 	heta (也就是這裡的 mu 或者 sigma^2 )。我們稱這一坨 g(X_1, dots, X_n) 為參數 	heta 的統計量(estimator)。注意,這裡的樣本 X_1, dots, X_n 本質上是隨機變數,所以統計量 g(X_1, dots, X_n) 也是隨機變數,所以統計量天然會有一個對應的概率分布。這是因為隨機變數和概率分布在理論上是嚴格一一對應的。

當樣本抽出來後,我們知道具體的小 x_i in mathbb{R} 值,即 X_1 = x_1, dots, X_n = x_n ,此時代入統計量,就得到了參數 	heta 基於這些抽樣值的估計(estimate) g(x_1, dots, x_n) 。這裡小 x_i 和大 X_i 的區別就在於前者是具體的、不帶隨機性的實數,後者是帶有具體概率結構的隨機變數。整個尋找具體的「函數」 g(.) 的過程,稱為estimation。

分清楚上述概念後,我們知道estimator hat{	heta} = g(X_1, dots, X_n) 是一個隨機變數,它的分布和估計方法顯然有關係,也就是和「函數」 g(.) 顯然有關係。一般來說,找這個具體的分布是很難很難的,但如果是使用極大似然估計(ML estimation),就會使得估計量estimator具有漸進正態性。也就是說,當 n 越來愈大,估計量的分布就越接近正態。


估計量是樣本集的函數,樣本是隨機變數,所以估計量也是隨機變數。隨機變數自然就可以服從某某分布啦。


謝邀。

一個隨機變數服從正太分布意味著它具有概率密度函數N(u,D)其中u是均值,D是協方差矩陣。我這裡不方便打公式 可以百度或維基看公式。

要理解正態分布的普遍性和重要性,我們必須了解中心極限定理。它基本上是在說,不太奇怪的隨機變數的和滿足高斯分布。


「來跟我玩吧,」小王子提議說,「我很難過……」

「我不能跟你玩,」狐狸說,「我沒有經過馴化。」

——聖埃克蘇佩里,《小王子》

---------------------------------------------------

謝邀。

某某變數『服從正態分布』,意思就是可以用正態分布來描述該變數。

某種程度上,可以把『服從』當成『(已被)馴化』理解。當我們能用某個已知的分布模型描述一個變數的時候,則可以設想成該變數已被『馴化』,對該變數進行分析就不需要重新建模,而可以直接套用對該分布的既有知識去解決問題,省略了好多煩心事。

正態分布就屬於統計學裡面最重要的一種分布模型。它體態優美、參數簡明(均值μ決定對稱中心,標準差σ決定分布形狀)、概率計算簡單方便,雖然其概率密度函數看起來有點嚇人——

相信學過統計學的人,一看見『某某變數服從正態分布』這樣的描述,腦海里立刻會浮現出那知名的兩頭低中間高的『鐘形曲線(bell-shaped curve)』,同時覺得問題已經解決了大半。

圖片來源:維基百科_Normal distribution


第一個答案已經寫得很清楚了,至於為什麼MLE會服從正態分布見中心極限定理


簡單地說,估計量是(一個)統計量,這個統計量服從正態分布,就這樣。


推薦閱讀:

IFRS 9 對中國銀行業會帶來哪些改變?
如果新股一直沒人賣會發生什麼?

TAG:極客Geek | 數學 | 統計學 | 金融 |