標籤:

怎樣通俗地理解分布函數?

初學概率,感覺對「分布函數」理解得不好。應該怎樣理解「分布函數」是什麼意思呢?


看到@長澤雅美關注此題,進來逛逛,發現@慧航老師簡直太凶了。

這樣的題應該有個嗨皮一點的回答。我在這給出一個一元隨機變數的分布函數的直觀的解釋。

想像現在有這麼一個無蓋盒子,以及一把質量為1千克的沙子。盒子是透明玻璃做的,它的長相當長(無限長)寬卻極短(和1顆沙子的直徑一樣長)。

現在我們將這把沙子全放進盒子里。盒子寬只有一顆沙子那麼長,因此全部沙子倒進去後你從外部看到的應該是一個二維圖案(要記得我們盒子是透明的)。把盒子的無限長的那條邊看做數軸。這個二維圖案就是傳說中的概率密度函數(簡稱p.d.f.)的圖像啦。

任取數軸上一點,計算從負無窮到這一點的沙子總質量。將這個點映射到這個質量的函數就是傳說中的分布函數了…


其實我覺得題主大概是要直觀地理解什麼是分布函數吧。

分布函數就是變數小於等於某個特定值a的概率(或者頻率,如果是用數據統計出來的話),也即F(a)=P{X le a}

還不好理解?

假設現在有全世界所有人的身高的分布函數,而你的身高是175cm,那麼分布函數在175cm處的取值就是所有比你矮或者和你一樣高的人佔全世界所有人的比例。姚明的身高是226cm,那麼分布函數在226cm處的取值就是所有比姚明矮或者和姚明一樣高的人佔全世界所有人的比例。


function是可以通俗地理解的,但是你不要想通俗地理解distribution,因為distribution(也就是廣義函數)本身就不是一個通俗的東西,別說普通人,只要沒有泛函基礎的人,看定義都看不懂

(其實我覺得每個人理解distribution的時候,都是腦補一個function加上幾個特殊例子)


謝題主邀。

題主有時間逛知乎,不如踏踏實實看課本。昨天晚上那麼短時間內兩次邀請也是醉了。

分布函數c.d.f描述了一個隨機變數的所有特徵,當然其等價的變換形式(比如特徵函數)也是完全刻畫一個隨機變數特徵的工具。

我覺著分布函數的定義很通俗,多看多做題就理解了。


看到慧航老師的答案,想起了一個定理:

對於一個隨機變數:X:((0,1), mathcal{B}, P) 	o mathbb{R},可得一個分布函數F : mathbb{R} 	o [0,1],通過:

F(x) = P(X^{-1}[(-infty,x]])

F滿足:(1) lim_{x 	o +infty}F(x) =1,lim_{x 	o -infty}F(x) =0.

(2)x < y implies F(x) leq F(y)(3)lim_{h 	o 0^+}F(x+h) = F(x) 這三條都可由測度的可列可加性而得。

定理1:對於一個滿足上述條件1,2, 3的函數F,存在一個樣本空間為(0,1)的隨機變數X滿足定義:F(x) = P(X^{-1}[(-infty,x]])

X(omega) = inf F^{-1}(omega)

因為inf F^{-1}(omega) leq x implies F(x) geq omega (條件2), 所以P(X leq x) = P(omega  leq F(x) ) = F(x)

定理2:如果XY都和F一致,則X = Y up to null sets。

我們令集合A滿足性質P為對於任意epsilon,存在開集合X和閉集合Y,滿足X subseteq A_i subseteq Y P(Y setminus X) < epsilon

證明主要利用的是如果{A_i}_{i in mathbb N}中所有集合滿足性質P,則igcup_{i in mathbb N}A_iigcap_{i in mathbb N}A_i也滿足性質P


把數學定義翻譯成漢語就好了,分布函數是一個概率,是隨機變數X存在於區間負無窮至x上的概率。


你該問常見的隨機變數如何理解。
隨機變數是幹什麼用的?
如果我問你一輩子會遇到幾次艷遇,你會說不一定。那用一個字母表示,用Y如何?
Y可能是0,1,2,等等。無法確定是幾。是隨機變數。Y的分布就是Y取每個值的概率(這個是離散的)。利用統計手段或概率理論,有人確定這個Y服從泊松分布。但也不一定,你可以設法研究研究,Y等於每個值得概率是多少。如果得到的結果與已有的任何分布計算結果都不一樣,那你就發現了一種新的離散型分布。
連續性的例子自己想想。

來源link:主題:常見的概率分布如何理解? | COS論壇 | 統計之都


學渣一枚,看了以上幾位大神的解釋並沒有弄懂,建議看看2018宇哥概率論強化第二講19分鐘開始對分布函數的解釋,我認為那才是適合我們這種學渣的通俗解釋


累計函數知道嗎?就是圖像處理中的均衡直方圖。


推薦閱讀:

為什麼P(A|B) = P(A)可以推出事件A和B相互獨立?
概率密度函數在某一點的值有什麼意義?
先驗分布、後驗分布、似然估計這幾個概念是什麼意思,它們之間的關係是什麼?
農場有100隻雞圍成一圈,每隻雞把旁邊的雞啄了一下,雞啄左邊右邊是隨機,不被啄的雞的數量的期望是多少?

TAG:數學 | 概率論 |