如何理解條件概率?

我知道貝葉斯公式,但是理解不了什麼叫「概率相除」,也看過了阮一峰寫的貝葉斯(貝葉斯推斷及其互聯網應用(一):定理簡介),也看了很多,我知道P(AB)表示B發生的情況下,A 發生的概率,但是還是不知道到底什麼是條件概率


首先確保你知道什麼是概率,如果不懂,看我之前的這個回答:

猴子:概率(Probability)的本質是什麼?

1 什麼是相關事件?

「相關」 的……意思是 受過去事件影響的…,現實生活中有很多事件是相關事件。

這裡說一個相關事件的經典案例。

雷軍在創業之初,用了兩年半的時間,把手機從零做到了中國出貨量第一,全球出貨量第三。然而在過去的兩年,小米也遇到了坎坷。2016年的時候,小米手機全球出貨量跌出了前5名。

當時有評論說:世界上沒有任何一家手機公司銷售下滑後,能夠成功逆襲,小米前途堪憂啊。

雷軍經過了一些列的調整,小米在2017年第二季度業績實現了逆轉,走出了低谷,重回全球第5的位置。

在中國企業家論壇30多位理事拜訪小米總部時,雷軍把他對小米調整的思考做了一個分享。

雷軍說:我們一直專註線上,但錯過了縣鄉市場的線下換機潮。小米整個商業模式就是為了高品質、高性價比。高性價比是效率革命,要提高效率在當時的市場情況下只有電商能夠完成小米要的效率。所以我們在過去幾年裡面專註於電商。 但是有一個天大的缺陷,電商只佔商品零售總額的10%,小米就算線上市場100%都是自己的,也只佔整個零售市場10%。

意識到這一點之後,雷軍做了一系列戰略調整,就是建立了線下零售店鋪~小米之家。再次重整旗鼓。

這裡雷軍說的事情A(小米手機銷量),與事件B(電商只佔商品零售總額的10%),就是相關事件。

2 什麼是條件概率?

相關事件的概率也叫叫條件概率,什麼是條件概率呢?

就是說事件A(雷軍賣手機)在另外一個事件B(電商只佔商品零售總額的10)已經發生條件下的發生概率。

所以,到今天為止90%的人買東西還是在線下買,也就是說就算線上100%是你的,即使你全部佔有也只有10%的市場。

講到條件概率不得不提到下面有名的紅球藍球實驗

布袋裡有 2顆藍色球和 3顆紅色球。每次隨機沖布袋裡拿一顆,記住拿完子彈就不放回布袋了。連續2次拿到 藍球的概率是多少?

在計算概率之前,我們需要弄清楚,第1次拿球和第2次拿球是相關事件還是獨立事情。

1)第1次隨機拿一顆,拿到藍色的概率是多少?可能性是 五分之二

2)但拿掉一顆之後情形便不同了,所以拿第二個的時候:

如果第一次拿的是紅的(對應圖中的紅色箭頭),剩下的球裡面是2顆籃球,2顆紅球。所以第二次拿到藍球的可能性是四分之二

如果第一次拿到是藍的(對應圖中的藍色箭頭),剩下的球裡面是1顆籃球,3顆紅球,所以第二次拿到藍球的可能性是四分之一

你看,這是一個相關事件,因為第1次拿球的結果,會影響第2次拿球的概率,他們是互相影響的。

相關事件的概率也叫「條件概率」。條件概率是指事件A在另外一個事件B已經發生條件下的發生概率。

3 如何用決策樹表示條件概率

我們通常用決策樹來輔助計算。下圖我們用決策樹來表示剛才的例子。

我們先看第1張圖:拿第1顆球的可能情況:

有 2/5 的概率會拿到藍球,3/5 的概率會拿到紅球

我們再來看第2張圖:拿第二顆球時的情形。

若先拿的是藍色,第二顆是藍色的概率是 1/4,第二顆是紅色的概率是 3/4。

若先拿的是紅色,第二顆是藍色的概率是 2/4,第二顆是紅色的概率是 2/4。

現在我們可以嘗試解答像這樣的問題了:「拿到2顆藍球的概率是多少?"

我們把第2張圖裡第1次拿到籃球的概率2/5,乘以第2次拿到藍球的概率1/4相乘就可以了。

好了,我們通過決策樹已經計算出了條件概率,下面圖片我們進一步看條件概率在數學上的表示就立馬明白了。

P(A) 的意思是 「事件 A 的概率」。

在以上的例子,事件 A 是 「第一次拿到藍球的概率」是 2/5,所以這裡P(A) = 2/5

事件 B 是 「第二次拿到藍求的概率」是1/4,這裡用p(B|A)來表示。

這裡的豎桿"|"來"在事件 A 發生的條件下,事件 B 發生的概率"。換句話說,事件 A 已經發生了,現在事件 B 發生的可能性是多少。

P(B|A) 也叫在A 發生的情況下 B 發生的 "條件概率"。

我知道你一看數學公式就難受。

我也是,因為數學公是抽象出來,為了代表所有情況。但是在求條件概率的時候我們可以畫出決策樹就一目了然了。

誰以後敢拿出條件概率這個公式來嚇唬你,你現在已經不害怕了,直接給他畫出決策樹,立馬求出條件概率。

自從有了決策樹這個神器,估計你周圍又會多出很多崇拜你的眼神,想想就爽呢。

4 如何在生活中應用決策樹?

什麼是決策樹?

決策樹,就是一種把決策節點畫成樹的輔助決策工具,一種尋找最優方案的畫圖法。

畫決策樹有三步:

第一步,寫出你想要實現的目標。

第二步,在目標的右側寫出實現這個目標的所有方案。

第三步,評估每個方案的結果,以及這些結果實現的概率。

其實,我們工作和生活中也經常用到決策樹。例如下面圖中的例子。

假設你想提高收入,這是一個目標。接下來,你想到了三個提高收入的辦法:一個是創業,一個是兼職,第三個是在原公司努力工作,等待升職加薪。該選哪一個呢?接下來就要評估這三個方案實現的可能性。具體的評估過程就不細說了,因為每個人的狀況不一樣,要結合實際評估,最後選擇最合適的方案。

當然,在評估可能性的時候,一定要想辦法減少主觀判斷的偏差,一個重要的方法就是外部視角。

比如在評估自己創業成功率的時候,不要先從自己的優勢入手開始評估,這樣很容易高估自己。如果從外部視角入手,把社會整體的創業成功率作為條件概率,然後進行調整,這樣得出的結論更可靠。

其實條件概率經常出現在我們的生活中,但是很多人其他忽視了它的存在。可以看之前的這篇文章:

猴子:如何更好地理解「選擇比努力更重要」?


通俗的解釋一下:

  • 什麼叫概率相除,我的理解是為了重新歸一化。什麼是歸一化,舉例來說,考慮標準正態分布。因為它是定義在整個實數上的,但是我們通常並不需要這麼大的範圍。現在我們把要把它定義在三個標準誤差之內,直接截斷行不行,當然不行,因為不能歸一化,而概率是要求歸一化的。所以我們要讓它歸一化,所以定義新的密度函數f_1(x)=frac{f(x)}{F(3)-F(-3)},容易驗證int_{-3}^3f_1(x)dx=1,這才是概率啊。當我們在概率空間的一個子空間定義概率時,要對原來的測度重新進行歸一化,以保證滿足概率的定義。
  • 什麼是條件概率,其實就是子空間上的概率。就像上面舉得例子,把原來定義在R上的概率定義到它的子集[-3,3]上面去了,用條件概率表達就是f(x|xin[-3,3])通常情況下的條件概率是分類的結果。 比如考慮人患艾滋病的概率,現在你可以把人群分的細一些,比如(男性,女性),它們都有自己的發生概率。當考慮一個完全的分類結果時候,你就得到了全概率公式。在 這裡你會得到:患病概率 = 男性患病概率 * 男性人口比例 + 女性患病概率 * 女性人口比例。用概率公式寫出來就是P(S)=P(S|M)P(M)+P(S|W)P(W).


一切概率,都是條件概率。

例如p(x)實際是p(x|a)

a代表全局空間,x|a就是x在a中的「比例」。

p(x)等於p(x and a)/p(a)。

p(a)為1,p(x and a)等於p(x)。

所以p(x)等於p(x)。

結論:p(x)也是條件概率,是全局條件a情況下x的概率,也就是「比例」。

條件概率就是「條件到結果,結果在條件中的比例」。

如果你是人,那麼你是男人(50%)

如果你是男人,那麼你是人(100%)

傳統條件式邏輯推理,建立在100%的必然性上(從小到大)。概率的本質就是傳統條件推理的「顛倒」(從大到小)。


不謝邀,首先舉個栗子:

今天有25%的可能性下雨,即

P(rain)=25%;

75%的可能性晴天,即

P(sunny)=75%;

如果下雨,我有75%的可能性穿外套即

P(coat|rain)=75%;

25%的可能性穿T恤

P(T-shirt|rain)=25%;

那麼今天下雨且我穿外套的概率是:

P(rain,coat) = P(rain)*P(coat|rain) = 25%*75%;

將具體栗子抽象為x,y,有:

P(x,y) = P(x)*P(y|x);

得出:

P(y,x) = P(y)*P(x|y);

P(x,y)=P(y,x);即:

P(x)*P(y|x) = P(y)*P(x|y);由此得:

P(y|x) = P(y)*P(x|y)/P(x)

令y=A, x=B,有:

P(A|B) = P(A)*P(B|A)/P(B).

證畢,如有錯誤請批評指正

以上。


題主想要的應該是這一句話。


概率相除是這麼得來的


在B中找到A與B交集的概率


首先假設有n+m個影響因素,即概率分布函數是n+m維的,對其中的n個變數進行無窮積分,則用它去除原概率分布函數,得出的便是以另外m個變數的為條件的條件概率分布函數。


推薦閱讀:

如何徒手生成一組隨機數?
概率論是否是分析的一個分支?
將n個數(1.2.3.4……n),隨機排序做成離散圖,波峰數和波谷數的和的數學期望是多少?
隨機變數的期望E(x)與X的平均值之間的區別與聯繫?
事件的隨機性能用混沌理論或量子理論來解釋么?

TAG:數學 | 概率 | 概率論 |