如何理解條件概率?
我知道貝葉斯公式,但是理解不了什麼叫「概率相除」,也看過了阮一峰寫的貝葉斯(貝葉斯推斷及其互聯網應用(一):定理簡介),也看了很多,我知道P(AB)表示B發生的情況下,A 發生的概率,但是還是不知道到底什麼是條件概率
首先確保你知道什麼是概率,如果不懂,看我之前的這個回答:
猴子:概率(Probability)的本質是什麼?
1 什麼是相關事件?
「相關」 的……意思是 受過去事件影響的…,現實生活中有很多事件是相關事件。
這裡說一個相關事件的經典案例。
雷軍在創業之初,用了兩年半的時間,把手機從零做到了中國出貨量第一,全球出貨量第三。然而在過去的兩年,小米也遇到了坎坷。2016年的時候,小米手機全球出貨量跌出了前5名。
當時有評論說:世界上沒有任何一家手機公司銷售下滑後,能夠成功逆襲,小米前途堪憂啊。
雷軍經過了一些列的調整,小米在2017年第二季度業績實現了逆轉,走出了低谷,重回全球第5的位置。
在中國企業家論壇30多位理事拜訪小米總部時,雷軍把他對小米調整的思考做了一個分享。
雷軍說:我們一直專註線上,但錯過了縣鄉市場的線下換機潮。小米整個商業模式就是為了高品質、高性價比。高性價比是效率革命,要提高效率在當時的市場情況下只有電商能夠完成小米要的效率。所以我們在過去幾年裡面專註於電商。 但是有一個天大的缺陷,電商只佔商品零售總額的10%,小米就算線上市場100%都是自己的,也只佔整個零售市場10%。
意識到這一點之後,雷軍做了一系列戰略調整,就是建立了線下零售店鋪~小米之家。再次重整旗鼓。
這裡雷軍說的事情A(小米手機銷量),與事件B(電商只佔商品零售總額的10%),就是相關事件。
2 什麼是條件概率?
相關事件的概率也叫叫條件概率,什麼是條件概率呢?
就是說事件A(雷軍賣手機)在另外一個事件B(電商只佔商品零售總額的10)已經發生條件下的發生概率。
所以,到今天為止90%的人買東西還是在線下買,也就是說就算線上100%是你的,即使你全部佔有也只有10%的市場。
講到條件概率不得不提到下面有名的紅球藍球實驗。
布袋裡有 2顆藍色球和 3顆紅色球。每次隨機沖布袋裡拿一顆,記住拿完子彈就不放回布袋了。連續2次拿到 藍球的概率是多少?
在計算概率之前,我們需要弄清楚,第1次拿球和第2次拿球是相關事件還是獨立事情。
1)第1次隨機拿一顆,拿到藍色的概率是多少?可能性是 五分之二
2)但拿掉一顆之後情形便不同了,所以拿第二個的時候:
如果第一次拿的是紅的(對應圖中的紅色箭頭),剩下的球裡面是2顆籃球,2顆紅球。所以第二次拿到藍球的可能性是四分之二
如果第一次拿到是藍的(對應圖中的藍色箭頭),剩下的球裡面是1顆籃球,3顆紅球,所以第二次拿到藍球的可能性是四分之一
你看,這是一個相關事件,因為第1次拿球的結果,會影響第2次拿球的概率,他們是互相影響的。
相關事件的概率也叫「條件概率」。條件概率是指事件A在另外一個事件B已經發生條件下的發生概率。
3 如何用決策樹表示條件概率
我們通常用決策樹來輔助計算。下圖我們用決策樹來表示剛才的例子。
我們先看第1張圖:拿第1顆球的可能情況:
有 2/5 的概率會拿到藍球,3/5 的概率會拿到紅球
我們再來看第2張圖:拿第二顆球時的情形。
若先拿的是藍色,第二顆是藍色的概率是 1/4,第二顆是紅色的概率是 3/4。
若先拿的是紅色,第二顆是藍色的概率是 2/4,第二顆是紅色的概率是 2/4。
現在我們可以嘗試解答像這樣的問題了:「拿到2顆藍球的概率是多少?"
我們把第2張圖裡第1次拿到籃球的概率2/5,乘以第2次拿到藍球的概率1/4相乘就可以了。
好了,我們通過決策樹已經計算出了條件概率,下面圖片我們進一步看條件概率在數學上的表示就立馬明白了。
P(A) 的意思是 「事件 A 的概率」。
在以上的例子,事件 A 是 「第一次拿到藍球的概率」是 2/5,所以這裡P(A) = 2/5
事件 B 是 「第二次拿到藍求的概率」是1/4,這裡用p(B|A)來表示。
這裡的豎桿"|"來"在事件 A 發生的條件下,事件 B 發生的概率"。換句話說,事件 A 已經發生了,現在事件 B 發生的可能性是多少。
P(B|A) 也叫在A 發生的情況下 B 發生的 "條件概率"。
我知道你一看數學公式就難受。
我也是,因為數學公是抽象出來,為了代表所有情況。但是在求條件概率的時候我們可以畫出決策樹就一目了然了。
誰以後敢拿出條件概率這個公式來嚇唬你,你現在已經不害怕了,直接給他畫出決策樹,立馬求出條件概率。
自從有了決策樹這個神器,估計你周圍又會多出很多崇拜你的眼神,想想就爽呢。
4 如何在生活中應用決策樹?
什麼是決策樹?
決策樹,就是一種把決策節點畫成樹的輔助決策工具,一種尋找最優方案的畫圖法。
畫決策樹有三步:
第一步,寫出你想要實現的目標。
第二步,在目標的右側寫出實現這個目標的所有方案。第三步,評估每個方案的結果,以及這些結果實現的概率。
其實,我們工作和生活中也經常用到決策樹。例如下面圖中的例子。
假設你想提高收入,這是一個目標。接下來,你想到了三個提高收入的辦法:一個是創業,一個是兼職,第三個是在原公司努力工作,等待升職加薪。該選哪一個呢?接下來就要評估這三個方案實現的可能性。具體的評估過程就不細說了,因為每個人的狀況不一樣,要結合實際評估,最後選擇最合適的方案。
當然,在評估可能性的時候,一定要想辦法減少主觀判斷的偏差,一個重要的方法就是外部視角。
比如在評估自己創業成功率的時候,不要先從自己的優勢入手開始評估,這樣很容易高估自己。如果從外部視角入手,把社會整體的創業成功率作為條件概率,然後進行調整,這樣得出的結論更可靠。
其實條件概率經常出現在我們的生活中,但是很多人其他忽視了它的存在。可以看之前的這篇文章:
猴子:如何更好地理解「選擇比努力更重要」?
通俗的解釋一下:
- 什麼叫概率相除,我的理解是為了重新歸一化。什麼是歸一化,舉例來說,考慮標準正態分布。因為它是定義在整個實數上的,但是我們通常並不需要這麼大的範圍。現在我們把要把它定義在三個標準誤差之內,直接截斷行不行,當然不行,因為不能歸一化,而概率是要求歸一化的。所以我們要讓它歸一化,所以定義新的密度函數,容易驗證,這才是概率啊。當我們在概率空間的一個子空間定義概率時,要對原來的測度重新進行歸一化,以保證滿足概率的定義。
- 什麼是條件概率,其實就是子空間上的概率。就像上面舉得例子,把原來定義在上的概率定義到它的子集上面去了,用條件概率表達就是。通常情況下的條件概率是分類的結果。 比如考慮人患艾滋病的概率,現在你可以把人群分的細一些,比如(男性,女性),它們都有自己的發生概率。當考慮一個完全的分類結果時候,你就得到了全概率公式。在 這裡你會得到:患病概率 = 男性患病概率 * 男性人口比例 + 女性患病概率 * 女性人口比例。用概率公式寫出來就是.
一切概率,都是條件概率。
例如p(x)實際是p(x|a)a代表全局空間,x|a就是x在a中的「比例」。p(x)等於p(x and a)/p(a)。
p(a)為1,p(x and a)等於p(x)。
所以p(x)等於p(x)。
結論:p(x)也是條件概率,是全局條件a情況下x的概率,也就是「比例」。
條件概率就是「條件到結果,結果在條件中的比例」。
如果你是人,那麼你是男人(50%)
如果你是男人,那麼你是人(100%)傳統條件式邏輯推理,建立在100%的必然性上(從小到大)。概率的本質就是傳統條件推理的「顛倒」(從大到小)。不謝邀,首先舉個栗子:
今天有25%的可能性下雨,即
P(rain)=25%;
75%的可能性晴天,即
P(sunny)=75%;
如果下雨,我有75%的可能性穿外套即
P(coat|rain)=75%;
25%的可能性穿T恤
P(T-shirt|rain)=25%;
那麼今天下雨且我穿外套的概率是:
P(rain,coat) = P(rain)*P(coat|rain) = 25%*75%;
將具體栗子抽象為x,y,有:
P(x,y) = P(x)*P(y|x);
得出:
P(y,x) = P(y)*P(x|y);
P(x,y)=P(y,x);即:
P(x)*P(y|x) = P(y)*P(x|y);由此得:
P(y|x) = P(y)*P(x|y)/P(x)
令y=A, x=B,有:
P(A|B) = P(A)*P(B|A)/P(B).
證畢,如有錯誤請批評指正
以上。
題主想要的應該是這一句話。
概率相除是這麼得來的
在B中找到A與B交集的概率
首先假設有n+m個影響因素,即概率分布函數是n+m維的,對其中的n個變數進行無窮積分,則用它去除原概率分布函數,得出的便是以另外m個變數的為條件的條件概率分布函數。
推薦閱讀:
※如何徒手生成一組隨機數?
※概率論是否是分析的一個分支?
※將n個數(1.2.3.4……n),隨機排序做成離散圖,波峰數和波谷數的和的數學期望是多少?
※隨機變數的期望E(x)與X的平均值之間的區別與聯繫?
※事件的隨機性能用混沌理論或量子理論來解釋么?