為什麼均值不是對任何隨機變數都存在?
隨機變數就是可測函數,期望就是積分。存在不可積(積分不收斂)的可測函數不是很正常么?
數學界有一種膜法,叫做pathological~
然後我記得這個事兒在cross validated (統計的stackexchange) 上有一個基於Huygens" principle的很形象的物理解釋,鏈接在這裡mathematical statistics
例如:Cauchy distribution
p(X=2^n)=1/(2^n),n為正整數。E(X)=???
其他答主說了哪些隨機變數會不存在均值。我來不嚴格地補充一下,如果沒有均值,那麼它的「均值」到底長什麼樣。考慮任意一個隨機變數 ,和一個由 夠成的 i.i.d 隨機變數序列,記作 。求均值的過程可以不嚴格地看作 。在現實操作中,比如 matlab 裡頭獨立地取 10,000 個符合相同高斯分布的樣本,加和平均,往往已經能很好地落(收斂)在一個確定的數字(均值)附近,如果樣本數量取更大,你會發覺加和平均會落在同樣的那麼一個數字(均值)附近,而且更近,也就是加和平均的不確定性(方差)更小。
以概率 1 收斂的角度看,均值存在的條件是
用人話說,如果你的實驗能有無窮多個獨立同分布的樣本,他們的加權平均一定一定(概率 1)是 。注意 是一個確定的數。
不少答主提到了柯西分布,那麼我們就繼續到 matlab 上做關於柯西分布的實驗。你會發覺,無論你 取多大,樣本的加和平均死活沒有向某個數趨近的意思。這不是收斂慢的問題,如果你對 多做幾次實驗,計算實驗結果的方差, 再對 多做幾次實驗,計算實驗結果的方差,你會發覺 的大小是不會影響方差的值的。
記柯西隨機變數為 ,那麼同樣從依概率 1 收斂的角度看,
用人話說,符合柯西分布的隨機變數的「均值」不再是個確定的數,而是另一個隨機變數,而且這麼個隨機「均值」依舊符合柯西分布 XD.
當然還存在某些隨機變數,均值在 ,這是另一種不同的均值不存在的方式。手頭暫時沒有例子,見諒:)
以下內容是一開始寫的廢話,感覺表述不清,但不捨得刪。。。
如果我們把樣本的加和平均看作另一個隨機變數 , 是該實驗中,獨立同分布樣本的數量。根據中心極限定理,隨著 增大, 的 pdf (概率密度分布)會越來越「像」(依分布收斂)一個高斯隨機變數的 pdf,均值和 的均值 一樣,方差會隨 增大而變小,這裡唯一需要的前提條件就是 的均值存在。那麼當 無窮大的時候, 的 pdf 就是一個被壓得無窮窄的高斯 pdf,均值為 ,方差為 。 。
換句話說, 已經變成了一個常數隨機變數,因為它的概率密度全部集中在 ,其他地方的概率密度皆為 。
比如說,對於連續型隨機變數,均值定義為自變數與密度函數乘積的廣義積分,而且要求該積分絕對收斂,正是積分收斂的不確定性,就可以產生很多不存在均值的隨機變數。如樓上提到的隨機變數和柯西分布。
推薦閱讀:
※如果哥德巴赫猜想被證明,那麼這個結論可不可能有初等的應用?
※電腦特效未來會取代道具、特效化妝產業嗎?
※有沒有具體的例子來測試一個人的空間想像能力?
※是否存在無窮多組勾股數,使得較小的兩個相鄰?