樸素貝葉斯
02-28
通過給定輸入x,通過學習到的模型計算出後驗概率分布 ,將概率最大的類 作為x的類標記。
聯合概率分布
訓練數據集 是由輸入空間上的隨即向量 和輸出空間上的隨機變數 的聯合概率分布 獨立同分布產生的,而樸素貝葉斯法就是通過訓練集來學習聯合概率分布 。(不要把XY當成有因果關係)
具體的,通過學習先驗概率分布 和條件概率分布 來得到聯合概率分布。
條件獨立性假設
樸素貝葉斯法對條件概率分布做了「條件獨立性」的假設,這個假設也正是樸素(naive)的由來。它假設了 是條件獨立的,也就是:
條件獨立性假設就是說特徵向量的各分量獨立。
樸素貝葉斯分類器
由於 是一個完備事件組,所以根據貝葉斯定理有:
貝葉斯分類器可以表示為:
arg表示返回使後式(max函數)最大的參數
其中,利用對訓練樣本的極大似然估計有,
其中 表示第 組數據的第 個分量, 表示第 組輸入的輸出類,N表示所有的訓練樣本, 表示第 個分量可能取的值(集合為 ,一共 種可能)
貝葉斯估計
上面採用的是極大似然估計,這樣會在樣本不全的條件下出現估計的概率值為0的情況,為了避免這種情況,也可採取貝葉斯估計。
既然都看到這兒了,少年點個贊可好?感謝!
done 2017年11月30日20:42:07
推薦閱讀: