標籤:

平均值為什麼被叫做期望值?


平均值是對樣本的一個統計量(statistic),是可算的。

期望值是對隨機變數在某個度量中的描述量,是理想化的,被估計的。

大數定理(有很多版本,條件不同,收斂不同):

如果是隨機獨立一致樣本(i.i.d),當樣本足夠大的時候,平均值向期望值收斂。

討論:

如果對樣本i.i.d.有把握,平均值可以作為隨機變數期望值的估計。

期望值是first moment,這種估計法也叫矩法(methods of moments)。在對隨機變數分部不清楚的時候methods of moments很好用,但沒有MLE(maximum likelihood estimator)收斂得快。

正態分布的first two moments正好和MLE一樣。

當樣本相關性不小的時候,平均值估計出的期望值會有很高的偏差(bias),往往需要修正。

期望估計往往是第一步,對樣本背後變數的真實分部的估計要更複雜。期望值的收斂是一個數的收斂,分部的收斂是函數收斂。正確的函數估計有很多用處,比如做假設檢驗(hypothesis testing)。又比如在保險行業,應對的都是小概率事件。他們對分部在尾部的收斂要求非常高。

ps:統計中文不好,請多包含。

感謝 @七月@niaocu 指正


謝。

這個問題的產生還是因為概念不清晰。

說正題前先提一下:像有一位知友說的那樣,平均值有很多種。不過我猜題主想問的是 arithmetic mean,所以其他我們先不說。

在建議題主重新去看期望的定義之前,不如先思考下這三個問題:

什麼是期望?所謂期望,它是什麼東西的期望?期望可以傳達怎樣的信息?

第一個問號:

期望是一個考量某一隨機變量 X 的概率分布密度函數重心的概念。換句話說,它是 X 在「中間位置」能取到的值。

第二個問號:

期望說的是一個隨機變量的期望,但因為根據期望的定義、我們通常通過隨機變量的概率分布密度函數來考察期望,所以我們有時候也會說「一個概率分布的期望」或者更簡單的「一個分布的期望」。

第三個問號:

既然期望是一個有關隨機變量概率分布的重心的概念,那麼它傳達給我們的信息就是一組數據中最中央那個位置的值(請注意由於隨機變量也可以是多維的,這裡的表述沒有使用「數」)。若以圖形描述,密度函數的峰值對應的就是這個分布的期望。

這時候再回到期望的兩個定義:離散和連續兩種情況分別對應的是 x·f(x) 的極限和積分。想想為什麼是這樣的定義;為什麼是 x·f(x),為什麼是極限或者積分。

我想,上面的這些對讓題主理清概念的幫助要比直接說 A 是何 B 是何更有意義些。


推薦閱讀:

智商和學習成績之間的關係,有沒有相關的數據模型?
為什麼有的孩子「一誇就落後,一批評就進步」?
怎樣判斷一個分布的正態性?
試驗設計Design of Experiment的精髓是什麼?若能結合實例來說明更好。

TAG:數學 | 統計學 |