排序後的正態分布數列相鄰兩個數的差有什麼特點?也符合正態分布嗎?

有一個隨機數列,其中每一個元素相互獨立且符從相同的正態分布,然後先將其排序,計算相鄰兩個數的差,請問這些差值是否也符合正態分布,有什麼特點?


這個問題實際上是研究順序統計量的間隔分布(Distributions of Spacings of Order Statistics).

X_1,...,X_n獨立隨機遍歷且服從高斯分布N(mu,sigma ^2).X_{(1)}leq X_{(2)}leq...X_{(n)}是其順序統計量.令D_i:=X_{(i+1)}-X_{(i)},表示相鄰順序統計量的間隔,題主的問題就是求D_i的分布。

顯然,P(D_igeq 0)=1,該分布不可能是高斯分布。

我查了一下,已經有人研究過該問題,並給出D_i分布為:

F_{D_i}(c)=P(D_i leq c)=1-int_{-infty }^{+infty } idbinom{n}{i}f(x)F^{i-1}(x)[1-F(x+c)]^{n-i}dx

其中fF是已知高斯分布的概率密度和概率分布函數。

證明的過程就看這篇論文吧

https://www.researchgate.net/publication/235616444_DISTRIBUTIONS_OF_SPACINGS_OF_ORDER_STATISTICS_AND_THEIR_RATIOS


不可能,排序後相鄰差一定不小於0或者一定不大於0,這不是一個正態分布應有的特點。


覺得這個問題有些意思。

不過題目的闡述有些問題,因為真的正態分布的數列是可以取到正負無限大的值。這種情況下 排序 沒有意義。

但是可以這麼理解:一個隨機變數服從 (mu,sigma)的正態分布,其產生n個隨機數後升序排序再相減產生新的一組正數,當n趨近於無窮時這組數趨近於什麼分布?

我也暫時不知道答案,用matlab試了一下,發現內置的隨機數生成機制並不夠好,鋸齒現象略嚴重,但湊合看吧。

常見分布的可能選項有:

1.伽馬分布

2.泊松分布

3.指數分布

個人覺得泊松分布的可能性比較大。希望有機會有人提供答案。(我相信這個問題應該有人研究過,畢竟和正態分布關係如此緊密)

(看完劉璐的答案不禁感嘆數學一旦更深入了美感度大不如前啊...)

sigma = 10000000;
mu = 0;
num = 100000000;
bins = 256;
a = normrnd(mu, sigma, 1, 10000);
sorted_a = sort(a);
hist(diff(sorted_a), bins)


推薦閱讀:

現代幾何的方法在概率論研究上有什麼應用?
概率論和實變函數(測度論)有什麼聯繫?
三國殺中甄姬洛神的期望值是幾張牌?
4個攻城車對陣一個大螺絲,都不動,求獲勝概率?
大數定理的歷史是怎麼樣的?

TAG:數學 | 正態分布 | 概率論 | 順序統計量 |