概率分布中是否存在從負無窮到正無窮上的均勻分布?

從我的直觀上看,「在實數軸上隨機取一點」這樣一個隨機試驗是存在的。那這個試驗的隨機變數一定滿足某種概率分布。由於隨機變數的每個取值都是平權的,直觀上看滿足從負無窮到正無窮的均勻分布。

但從分析上看,區間(a,b)上的均勻分布的密度函數是
f(x)=frac{1}{b-a} ,xin (a,b)
f(x)=0,其他
可以觀察到密度函數在區間(a,b)上處處相等。
那麼很顯然的假設負無窮到正無窮上均勻分布的密度函數f(x)在負無窮到正無窮上處處相等。不妨設為C。
那麼根據密度函數的性質
int_{-infty }^{+infty } Cdx=1
問題就在於求滿足上述積分式子的C了。
根據廣義積分推:
1=int_{-infty }^{+infty } Cdx=lim_{a 
ightarrow -infty ,b
ightarrow +infty}{int_{a }^{b } Cdx} =lim_{a 
ightarrow -infty ,b
ightarrow +infty}C(b-a)
顯然不存在一個常數C滿足上式子。那麼這個分布不存在了?

我的直觀和分析產生了矛盾,這個分布到底存在嗎?題主的直觀和分析過程哪裡出了問題?請大神解釋。


從概率論角度看,「直線上的隨機取樣」是不存在的,也就是說LZ開頭所說的「直觀」是錯的。很多類似的同樣「直觀」的抽樣過程甚至現在還是難題。一個著名的例子是「隨機選取(0,1)的子集,其為可測集的概率是多少」,甚至有人聲稱可以證明這個「概率」本身就不能被定義。

一個容易犯的想當然的錯誤是:雖然我不能直接從直線上均勻抽樣,但是可以設置一列抽樣實驗E_n,其中E_n表示在[-n, n]上均勻抽樣。那麼隨著n增大,這個抽樣過程「逼近」在實直線上的抽樣。這種所謂「逼近」的問題在於,對於任意n,抽樣實驗E_n的樣本空間跟實直線相比都是零測集。換言之,這就等於在目標為「從某population中抽樣」時,希望用一列「從該population的零測子集中抽樣」的做法來逼近目標……我不能斷言這樣做出來一定「不對」,但我也沒見過任何例子里這樣的「逼近」可以被justify。

另外,Bayes理論里的直線上的均勻prior在其特定語境下行得通,並不代表該prior本身是一個合法的分布。


有一個[0,infty) 上的例子,Poisson 過程。它的分布點類似於有限區間上的均勻分布一樣,「隨機地」落在[0,infty) 上。當然這個和均勻分布的那種均勻意味不完全一樣,完全取決於怎麼看待隨機。


現有體系應該是不允許。


當粒子的動量為確定值的時候坐標的分布就是負無窮到正無窮的均勻分布。

當粒子的坐標為確定值的時候動量的分布就是負無窮到正無窮的均勻分布。


上面似乎好多人提物理裡面有類似的不嚴格用法,我想說統計裡面應該也有,用貝葉斯方法時候的improper prior就有
P( heta)=1, heta in R
這樣的,但是不會細想,直接乘以likelihood就去找posterior去了。


suppose you have a sequence variables

$X_n sim N(0,frac{1}{n}$

then the limiting distribution sort of looks like a uniform distribution on the real line


題主錯在直接跳到正負無窮這步跳的太快。

直接以正負無窮出發而跳過極限這一步是不嚴謹的。因為無窮是一個抽象概念,對極限的簡單描述。

任何對涉及無窮的命題,需要化成任意。。。存在。。。闡述才有討論價值。

其實這個問題可以改成,對於任意大的實數a和任意小的實數b,是否一直存在實數概率密度C滿足ab區間上的均勻概率分布?

答案是顯然的。

我們完全可以像構造無窮概念一樣,構造一個無窮均勻分布函數C,它滿足實數區間可積,滿足線性運算。這和現有數學體系不衝突。
衝擊函數delta (x),衝擊函數的定義是在一個任意小的區間內積分為1的函數。幾乎和題主的無限區間的均勻概率分布正好反著。
信號系統裡面幾乎無處不用。


1. 「在實數軸上隨機取一點」這樣一個隨機試驗是存在的,正確。
2. 這個試驗的隨機變數一定滿足某種概率分布,不完全正確。

我猜題主心中定義的概率P一定是這樣的:隨機數取到區間(0,1]的概率是0。為什麼呢,因為如果是大於0的一個常數epsilon ,那隨機數取到(0,n]的概率就是nepsilon , 當n足夠大,概率就超過1了,顯然矛盾。故隨機數取到區間(0,1]的概率是0。
下面說明這樣定義的概率是在advanced probability theory裡面不是良定義的。在這裡很重要的一個概念是概率三元組(Probability Triple),即(Omega ,F, P)。其中Omega 是樣本空間,F是事件域。而我們所說的概率P,定義是一種測度(measure),而測度必須滿足可數可加性(題主可以維基一下什麼是可數可加性countably additive),且P(Omega )=1。而依照剛才對P的定義,是不滿足的。證明很簡單,設U_{i}=(i,i+1], 於是cup_{iin Z} U_{i}=R,則P(隨機數取值在R里)=1。而每一個區間概率都是0,所以矛盾。綜上,這樣定義的概率P不是良定義的,因為不滿足可數可加性。

事實上,這個隨機變數有沒有可能有一種良定義的概率測度呢,答案我還不能肯定。所以2.不完全正確。

Reference: Probability with Martingale. David Williams, Cambridge University Press.


f(x)的極限是零,不代表f(x)是零
======================================================
上面是題主改題之前的回答,既然題主把題改了,那我也修改一下:
這個C的定義是不對的,題主並沒有搞清楚極限實際上是一個變化趨近的含義。(樓主的第一個積分式實際上結果不是1,是無窮,除非C是0)
第一個帶積分的式子,其實良好的定義是:
C^,(x,a,b)=frac{1}{|a-b|},而題主的C=lim_{a 
ightarrow 0 ~ b 
ightarrow 0}{C^,}
看到了么?C只是和x無關(在數軸上面的常數),而不是對a,b的常數。
如果按照這個定義,那麼錯誤就是顯然的,題主在後面的計算中擅自交換了積分號和極限號,這是個典型的常見錯誤。
======================================================
題主再改題我就不管答了,如果題主還有啥不yao明gai白ti的,自行套用一邊epsilon -delta 語言,應該能很快發現錯誤。
順便說一句,高數之所以上來教epsilon -delta ,我認為很大程度上是在不引入過多概念的情況下讓讀者有一個比較好的工具來判斷/解決極限方面的問題。
留圖為證(人懶就不清除圖中其他的雜物了):


Also I haven"t learnt probability theory.... so.... don"t trust what I"ve said following....

Basically speaking, the Dirac delta naturally comes from complex analysis: besides the Schwarz"s method of defining distributions like Dirac delta, there is a parallel way using Laurent series.
To get some sense of this, just notice that formally we have,
delta(z_1-z_2)=sum_{nin mathbb Z }frac{z_1^{n}}{z_2^{n+1}}=sum_{nin mathbb N }frac{z_2^{n}}{z_1^{n+1}}+sum_{nin mathbb N }frac{z_1^{n}}{z_2^{n+1}}=frac{1}{z_1-z_2}-frac{-1}{z_2-z_1}
where the first equality is a rewrite of the usual form, and certainly diverges for all z; the last should be understood as always unfolding f(cdot ,cdot) in the second variables.
Now the interesting thing is that for a same meromorphic f (here frac{1}{z_1-z_2}), the difference of its Laurent series in regions with no intersection gives rise to a distribution.
This is the basic idea of the second method and in some degree it shows the Dirac delta is "complex".

On the other side, the uniform distribution are kind of different things (at least for me....).
I have said I have infinitesimal amount of knowledge of probability theory.... but I know there is a link between measure theory and commutative C* algebra and I know positive amount of the latter.

So.... let"s consider the function space [1] C^0(X) of complex-valued (this "complex" doesn"t matter, just for convenience) continuous functions on X that Vanish at infinity, where X is locally compact Hausdorff (if you haven"t learnt these, just think X is real line).
Now its easy to imagine that C^0(X), as an algebra over mathbb C, has multiplicative unit element if and only if X is compact. The unit is nothing but the desired uniform distribution.
Unfortunately, the real line is non-compact.
Usually we have two method for this problem.
One is that embedding C^0(X) into some larger space with unit [2]. Geometrically, this is Alexandroff extension of X. But this method doesn"t work perfectly in most cases and gives no further intuition of our uniform distribution (Personally I think the reason is that in this case the embedding map lack some kind of naturality, but I haven"t thought too much. Can someone clarify this?).
The other is Approximate identity. This is more useful and examples like "箱歸一化" mentioned above.

[1]http://en.wikipedia.org/wiki/C*-algebra#Commutative_C.2A-algebras
[2]Rng (algebra)


睡前答一下,考研水平,僅供參考——————╮( ̄▽ ̄)╭———————————————————— 樓主說,直觀上看,「在實數軸上隨機取一點」這樣一個隨機試驗是存在的。那這個試驗的隨機變數一定滿足某種概率分布。由於隨機變數的每個取值都是平權的,直觀上看滿足從負無窮到正無窮的均勻分布。 首先,這種隨機實驗是存在的,但取得一點的概率為0!!我認為這就可能是直觀上錯誤的根本原因,然後lz說平權,也就是等概率,那麼無限個等概率的0求和還是零,這裡要區分趨近於0和等於0。 還有,均勻分布的概念中沒有無窮大無窮小,lz不能用是否存在從負無窮到正無窮這種來描述~~睡覺了困啊


全直線勒貝格測度無窮,不能構成概率空間……


量子力學中最簡單的單色平面波


「在實數軸上隨機取一點這樣一個隨機試驗是存在的」 樓主的這個假設是沒有經過證明的(其實是錯誤的),因為每一個樣本點被抽到的概率都是0,所以你沒法從總體中抽出一個樣本。在一個錯誤假設上的任何推理自然都不成立。

有興趣的同學可以看一個更有意思的例子,聖彼得堡悖論:St. Petersburg paradox

1730年代,數學家丹尼爾·伯努利(Daniel Bernoulli)的堂兄尼古拉一世·伯努利,在致法國數學家皮耶·黑蒙·德蒙馬特的信件中,提出一個問題:擲硬幣,若第一次擲出正面,你就賺1元。若第一次擲出反面,那就要再擲一次,若第二次擲的是正面,你便賺2元。若第二次擲出反面,那就要擲第三次,若第三次擲的是正面,你便賺2*2元……如此類推,即可能擲一次遊戲便結束,也可能反覆擲沒完沒了。問題是,你最多肯付多少錢參加這個遊戲?

經過計算,會發現這個遊戲的期望受益是無窮大,但我們顯然不會付無窮多的錢來玩這個看起來不怎麼賺錢的遊戲。那問題出在哪裡呢?其實關鍵就在於,當樣本的收益趨向無窮大的時候,它被取到的概率無限接近0,所以我們不可能從這個遊戲中獲得無窮大的收益,這點和樓主的問題很相似。


題主這個例子不就是 uninformative priors 里的 improper prior 的幾個典型例子之一嘛。

Examples of improper priors include:

  • Beta(0,0), the beta distribution for α=0, β=0.
  • The uniform distribution on an infinite interval (i.e., a half-line or the entire real line).
  • The logarithmic prior on the positive reals

Σprior or ∫prior 並不必限制為finite,不影響posterior的計算,可是這種prior不一定是proper喲,improper prior會導致Bayes risk無法被定義。


題主 你的C是無窮小啊


我覺得不存在,樣本空間無限大的均勻分布,有什麼意義,甚至我覺得你所謂的那個實驗理論也是做不起來。


推薦閱讀:

MATLAB 有哪些好用的第三方工具箱 (Toolbox)?
如何規範確定一條多項式曲線的階數?
如何理解矩陣特徵值?
數理邏輯=﹥ ,|-這兩個符號有什麼區別?
柯潔與 AlphaGo 三場皆負,對圍棋今後的發展會有哪些影響?

TAG:數學 | 統計學 | 概率論 |