概率與似然

先驗概率,條件概率與後驗概率

先驗概率是基於背景常識或者歷史數據的統計得出的預判概率,一般只包含一個變數,例如P(X)P(Y)

條件概率是表示一個事件發生後另一個事件發生的概率,例如P(Y|X)代表X事件發生後Y事件發生的概率。

後驗概率是由果求因,也就是在知道結果的情況下求原因的概率,例如Y事件是X引起的,那麼P(X|Y)就是後驗概率,也可以說它是事件發生後的反向條件概率。

似然函數

在數理統計學中,似然函數是一種關於統計模型中的參數的函數,表示模型參數中的似然性。似然函數可以理解為條件概率的逆反。

在已知某個參數alpha時,事件A會發生的條件概率可以寫作P(A;alpha),也就是P(A|alpha)。我們也可以構造似然性的方法來表示事件A發生後估計參數alpha的可能性,也就表示為L(alpha|A),其中L(alpha|A)=P(A|alpha)

這裡Wikipedia的解釋比較全面詳細,可以參見似然函數。

最大似然估計(MLE)與最大後驗概率(MAP)

最大似然估計是似然函數最初也是最自然的應用。似然函數取得最大值表示相應的參數能夠使得統計模型最為合理。從這樣一個想法出發,最大似然估計的做法是:首先選取似然函數(一般是概率密度函數或概率質量函數),整理之後求最大值。實際應用中一般會取似然函數的對數作為求最大值的函數,這樣求出的最大值和直接求最大值得到的結果是相同的。似然函數的最大值不一定唯一,也不一定存在。

這裡簡單的說一下最大後驗概率(MAP),如下面的公式

P(alpha|X)=frac{P(X|alpha)P(alpha)}{P(X)}

其中等式左邊P(alpha|X)表示的就是後驗概率,優化目標即為argmax_{alpha}P(alpha|X),即給定了觀測值X以後使模型參數alpha出現的概率最大。等式右邊的分子式P(X|alpha)即為似然函數L(alpha|X),MAP考慮了模型參數alpha出現的先驗概率P(alpha)。即就算似然概率P(X|alpha)很大,但是alpha出現的可能性很小,也更傾向於不考慮模型參數為alpha

生成式模型與判別式模型

最後簡單說一下生成式模型與判別式模型。

判別式模型學習的目標是條件概率P(Y|X)或者是決策函數Y=f(X),其實這兩者本質上是相同的。例如KNN,Decision Tree,SVM,CRF等模型都是判別式模型。

生成式模型學習的是聯合概率分布P(X,Y),從而求得條件概率分布P(Y|X)。例如NB,HMM等模型都是生成式模型。

參考

  • 似然函數

  • 最大似然估計 (MLE) 最大後驗概率(MAP)

  • 《統計學習方法》李航

推薦閱讀:

你可能就是那個幸運兒!
討論一手棄牌?
關於概率、隨機、技能的辨析
世上的充分條件很少,該具備的必要條件很多

TAG:概率 | 机器学习 | 贝叶斯理论 |