隨機變數的期望E(x)與X的平均值之間的區別與聯繫?
請問這兩者之間有什麼區別和聯繫,我發現英文教材上算標準差的公式兩者貌似混用了
二者的精神是相同的。一般對於隨機變數說期望,對於一組樣本說均值,但也有混用的時候。
期望是確定的,均值是一個隨機變數。
這段文字里出現的是E(x)和mu,E(x)是指x的期望(Expectation),也就是一階矩,而mu表示均值(mean)。可以認為mu是E(x)的別名。兩者實際表示的意義相同。
而題主所說的平均值(average)和均值(mean)是兩個概念。均值是針對一個隨機變數而言的,通過其分布計算得出,而平均值則是針對一組樣本而言的,且計算方式不止一種(算術平均值、幾何平均值等),但一般默認為算術平均值。
通常是因為實際生活中有時候我們不知道每一個x的分布是什麼,故而能通過抽樣實驗獲取一堆x的樣本,來估計x的分布。題主所說的平均值一般是指,計算公式為:。是對mu(mean)的一個無偏估計。我懷疑你這裡的mean of X 就是指expectation of X, 也就是 E(x),只是不同的叫法。如果是average value of independent identical distributed variables, 那參見law of large numbers.我感覺理解期望還是得要從measure theory學起,然後就知道E(X)是X在概率空間的積分。好像有的書會用limit of average value來定義E,我是很不喜歡的……畢竟E是probability space 和 variable 決定的,而average value 不過是表象,用後者定義前者就顛倒因果了。只能說本質決定表象,表象收斂於本質,怎麼能說本質是表象的極限呢……(我似乎是貝葉斯邪教的信徒?)我都不記得本科在沒學過measure theory的情況下是怎麼定義E的了……難以想像……
均值(mean),是統計學概念,是在你有一定量的數據後,加權平均後計算出的數值。
期望(expected),是概率論概念,是在你對隨機變數的概率進行估計後,求出的預期數值。均值有權重,期望有概率,在日常生活中,很多時候我們可以粗略地把他們看成同一個概念。
舉個例子:你要統計你們班男生的身高,假設你們班有10個男生,以下是你收集到的數據:
170,172,175,176,172,176,176,175,172,176那麼,均值=(170+172+175+176+172+176+176+175+172+176)/10=174cm同時,我們可以看到,170出現了1次,175出現了2次,172出現了3次,176出現了4次,數據總量是10個,那麼170所佔的權重就是1/10,175所佔的權重就是2/10,172所佔的權重就是3/10,176所佔的權重就是4/10,我們計算這組數據的加權平均值:加權平均值=170X(1/10)+175X(2/10)+172X(3/10)+176X(4/10)=174cm可以看到,均值和加權平均值的計算結果一致,因為均值計算是加權均值計算的一種特殊形式,理論上所有的均值計算都是加權計算,只是表現形式不同。在計算均值時,我們把十個數值都賦予了相等的權重,每個數值的權重都是1/10,然而這裡面有重複的數據,更簡便直觀的方法是將那些重複數據所佔的權重計算出來,然後加權計算。10個男生的身高數據,並不是不一樣的數值,而是只有四個數值,他們出現的次數佔比,我們可以看成是概率。170出現的概率:1/10175出現的概率:2/10172出現的概率:3/10
176出現的概率:4/10我們可以計算出這組數據的期望:期望=170X(1/10)+175X(2/10)+172X(3/10)+176X(4/10)=174cm均值和期望的計算結果一致,所以我們可以近似地把他們看成是同一概念。
至於方差(variance)和標準差(standard deviation)
方差,它的英文是variance,這個辭彙是vary的名詞變化形式,是「變化」的意思,指一組數據的離散程度,中文翻譯為方差。比如上面那組身高的數據,我們可以計算一下方差:variance=(170-174)(170-174)X(1/10)+(175-174)(175-174)X(2/10)+(172-174)(172-174)X(3/10)+(176-174)(176-174)X(4/10)=16X0.1+1X0.2+4X0.3+4X0.4=4.6
這組數據的方差就是4.6。標準差,它的英文是standard deviation,直譯就是標準偏離程度,這是一個標準化的量,只有正數,沒有負數,就跟+1和-1距離原點的標準距離是1一樣,這個1是個標準量。
標準差=標準差==2.14cm均值和方差,是學習推斷性統計學的入門內容,同時也是金融學的基礎內容,用英文原版教材學習統計學,是一個非常好的開始,因為很多概念的表述,英文比中文要準確的多,祝題主學習順利!簡單的說,期望是對未來的預期,均值是對過去的總結。
按照我個人的理解是這樣的:隨機變數的期望E(X)和X的加權算術平均值之間是一般和個別的關係。(這裡計算期望值我們一般指的是離散型隨機變數,連續型變數一般用概率密度曲線來理解)。 X的期望值實質上是加權算數平均數的一種推廣。一般我們說的平均數是指具體數據的平均指標,而期望值說的是隨機變數的期望指標。(我覺得這裡可以把具體數據理解成隨機變數的一個子集。)
從定義上看,離散型隨機變數X的期望值是,在X的一切可能值得完備組中,各可能值xi 與其對應概率pi 的乘積之和稱之為該隨機變數X的期望值,記作E(X)或者。
即,若X取無窮個值:x1, x2 ,x3…
xn ,…對應的概率是p1,p2, p3,…pn
,…,則期望值為:
E(X)=x1p1+x2p2+…xnpn+…
舉一個例子,擲骰(tou)子(才知道這個字讀作tou),它的期望值就是
E(X)=1x1/6+2x1/6+3x1/6+4x1/6+5x1/6+6x1/6=3.5
也就是說,各可能點數的均值是3.5.
但是你在一次實驗中,擲骰子6次,這6次的值可能是:2,4,4,5,3,1
它的均值=(2x1+4x1+4x1+5x1+3x1+1x1)/6=3.167
也就是抽象值和實際值的關係。不知道沒有沒說清楚或者有什麼錯誤的地方,我也是大學學的統計學,現在都忘了,如果有什麼錯誤可以一起討論。
以上。
期望:
均值的極限:
這兩個數在什麼情況下相等的定律叫作大數律。注意前者是一個非隨機數,後者的每一項都是隨機數,所以取極限的定義有幾種微妙的差別。
我傾向認為原作者mean的意思是後者,根據大數律才等於前者。你知道扔一枚硬幣是正面的概率是1/2(期望),但是你也知道接下來讓你扔兩次,並不一定只出現一次正面(均值)
其實期望值就是平均值,不過你可以這麼理解:平均值是一系列數值的總和除以數值的個數,是針對一系列的散點操作的;而期望值一方面可以操作散點,也可以求連續型函數的「平均值」,做法就是求積分再除以定義域長度。所以,期望值是比「普通的平均值」高一個維度的「平均值」。
忘了看題主問的是「隨機變數」了,「普通平均值」是不能處理「概率」問題的,所以我們需要一個延伸,於是有了「加權平均值」。對,中學學的加權平均值就是期望值。
統計中,期望值往往是一個理想的值,可望而不可即的,期望值這個概念往往是要站在上帝視角來思考的。如果你要近似得到期望值只能靠大量樣本,越多越好,越多越接近。比如我想知道全國中學生平均身高,上帝可以知道所有人,但我沒法測到所有人,只能靠去找儘可能多的人測出數據,以接近上帝手中的那個值。
上帝手中的那個叫總體均值,我測得叫樣本均值。樣本均值的期望值等於總體均值,即E(x?)=μ,意思是我測得的值應該收斂於上帝那個值,由於我沒法測所有人,因此無法相等,只有在理想當中才相等。換一種說法,樣本均值可作為總體均值的估計值。書上這裡因為是finite,那麼你就是上帝,因為你能看到所有樣本,所以這時可以理所應當說E(X)=μ。隨機變數 X 是一個函數,所以要說平均值有定義,那就是E(X)。
推薦閱讀:
※事件的隨機性能用混沌理論或量子理論來解釋么?
※最大似然準則在什麼情況下不是最優演算法?
※乘客等車時間是否服從正態分布?若服從正態分布為什麼?
※有一個正整數N可以分解成若干個正整數之和,問如何分解能使這些數的乘積最大?求詳細解釋。
※如何生成總和固定的若干個隨機數?