為什麼均值不是對任何隨機變數都存在?


隨機變數就是可測函數,期望就是積分。存在不可積(積分不收斂)的可測函數不是很正常么?


數學界有一種膜法,叫做pathological~

然後我記得這個事兒在cross validated (統計的stackexchange) 上有一個基於Huygens" principle的很形象的物理解釋,鏈接在這裡mathematical statistics


例如:Cauchy distribution


p(X=2^n)=1/(2^n),n為正整數。

E(X)=???


其他答主說了哪些隨機變數會不存在均值。我來不嚴格地補充一下,如果沒有均值,那麼它的「均值」到底長什麼樣。考慮任意一個隨機變數 X ,和一個由 X 夠成的 i.i.d 隨機變數序列,記作X_1,dots,X_n 。求均值的過程可以不嚴格地看作 lim_{n	oinfty} frac{1}{n}sum^n_{i=1}X_i 。在現實操作中,比如 matlab 裡頭獨立地取 10,000 個符合相同高斯分布的樣本,加和平均,往往已經能很好地落(收斂)在一個確定的數字(均值)附近,如果樣本數量取更大,你會發覺加和平均會落在同樣的那麼一個數字(均值)附近,而且更近,也就是加和平均的不確定性(方差)更小。

以概率 1 收斂的角度看,均值存在的條件是

exists mu, lim_{n	oinfty}frac{1}{n}sum^n_{i=1}X_i stackrel{p.}{=} mu_X

用人話說,如果你的實驗能有無窮多個獨立同分布的樣本,他們的加權平均一定一定(概率 1)是 mu_X 。注意 mu_X 是一個確定的數。

不少答主提到了柯西分布,那麼我們就繼續到 matlab 上做關於柯西分布的實驗。你會發覺,無論你 n 取多大,樣本的加和平均死活沒有向某個數趨近的意思。這不是收斂慢的問題,如果你對 n=100 多做幾次實驗,計算實驗結果的方差, 再對n = 1000000 多做幾次實驗,計算實驗結果的方差,你會發覺 n 的大小是不會影響方差的值的。

記柯西隨機變數為 C ,那麼同樣從依概率 1 收斂的角度看,

lim_{n	oinfty}frac{1}{n}sum^n_{i=1}C_i stackrel{p.}{=} C

用人話說,符合柯西分布的隨機變數的「均值」不再是個確定的數,而是另一個隨機變數,而且這麼個隨機「均值」依舊符合柯西分布 XD.

當然還存在某些隨機變數,均值在 infty ,這是另一種不同的均值不存在的方式。手頭暫時沒有例子,見諒:)


以下內容是一開始寫的廢話,感覺表述不清,但不捨得刪。。。

如果我們把樣本的加和平均看作另一個隨機變數 M_nn 是該實驗中,獨立同分布樣本的數量。根據中心極限定理,隨著 n 增大, M_n 的 pdf (概率密度分布)會越來越「像」(依分布收斂)一個高斯隨機變數的 pdf,均值和 X 的均值 mu_X 一樣,方差會隨 n 增大而變小,這裡唯一需要的前提條件就是 X 的均值存在。那麼當 n 無窮大的時候, M_infty 的 pdf 就是一個被壓得無窮窄的高斯 pdf,均值為 mu_X ,方差為 0M_infty sim mathcal N(mu_X, 0)=delta(m-mu_X)

換句話說, M_infty 已經變成了一個常數隨機變數,因為它的概率密度全部集中在 mu_X ,其他地方的概率密度皆為 0


比如說,對於連續型隨機變數,均值定義為自變數與密度函數乘積的廣義積分,而且要求該積分絕對收斂,正是積分收斂的不確定性,就可以產生很多不存在均值的隨機變數。如樓上提到的隨機變數和柯西分布。


推薦閱讀:

如果哥德巴赫猜想被證明,那麼這個結論可不可能有初等的應用?
電腦特效未來會取代道具、特效化妝產業嗎?
有沒有具體的例子來測試一個人的空間想像能力?
是否存在無窮多組勾股數,使得較小的兩個相鄰?

TAG:數學 | 概率 | 概率論與數理統計 |