標籤:

2.3 一些常見的離散分布

2.3 一些常見的離散分布

來自專欄 機器學習 一種概率視角 學習筆記

2.1 二項式與伯努利分布

假如投一枚硬幣 n 次。令 Xin{0,ldots,n} 為頭像朝上的數量。如果頭像朝上的概率是 	heta ,則稱 X 服從二項式分布,寫作 Xsim Bin(n,	heta) 。概率質量函數為:

Bin(kmid n,	heta)	riangleqinom{n}{k}	heta^k(1-	heta)^{n-k}	ag{2.28}

其中

inom{n}{k}	riangleqfrac{n!}{(n-k)!k!}	ag{2.29}

是從 n 中選 k 個項的方法的數量。這個分布有如下的均值和方差:

mean=	heta,quad var=n	heta(1-	heta)	ag{2.30}

假如只投擲硬幣1次。令 Xin{0,1} 為二元隨機變數。頭像朝上的概率為 	heta 。則稱 X 服從伯努利分布。寫作 Xsim Ber(	heta) ,概率質量函數定義為:

Ber(xmid 	heta)=	heta^{I(x=1)}(1-	heta)^{I(x=0)}	ag{2.31}

換句話說:

Ber(xmid 	heta)= egin{cases} 	heta& 	ext{if x=1}\ 1-	heta& 	ext{if x=0} end{cases}	ag{2.32}

2.3.2 多項式與多伯努利分布

假如投一個 K 面的骰子,可用多項式分布。令 mathrm x=(x_1,ldots,x_K) 為隨機變數, x_jj 面骰子朝上的次數。則 mathrm x 有如下概率質量函數:

Mu(mathrm xmid n,	heta)	riangleqinom{n}{x_1,ldots ,x_K}prod_{j=1}^{K}	heta_j^{x_j}	ag{2.33}

其中 	heta_jj 面朝上的概率,並且

inom{n}{x_1,ldots,x_K}	riangleqfrac{n!}{x_1!x_2!dots x_K!}	ag{2.34}

是多項式係數。如果設 n=1 ,並使用 one-hot 編碼, mathrm x =[I(x=1),ldots,I(x=K)] ,則概率密度為:

Mu(mathrm xmid 1,	heta)=prod_{j=1}^K	heta_j^{I(x_j=1)}	ag{2.35}

這也被稱為離散分布,或多伯努利分布。使用如下符號表示:

Cat(xmid 	heta)	riangleq Mu(mathrm xmid 1,	heta)	ag{2.36}

2.3.3 泊松分布

Xin {0,1,2,ldots} 服從參數為 lambdagt0 的泊松分布,記為 Xsim Poi(lambda) ,概率質量函數為

Poi(xmid lambda)=e^{-1}frac{lambda^x}{x!}	ag{2.39}

泊松分布常被用做計數罕見事件的模型。

2.3.4 經驗分布

對於給定數據集 D={x_1,ldots,x_N} ,定義經驗分布為:

p_{emp}(A)	riangleqfrac{1}{N}sum^N_{i=1}delta_{x_i}(A)	ag{2.40}

其中 delta_x(A) 為狄拉克度量,定義為:

delta_x(A)=egin{cases} 	heta& 	ext{if }x
otin A\ 1& 	ext{if }xin A end{cases}	ag{2.41}

一般來說,可以用權重與每個採樣關聯起來:

p(x)=sum^N_{i=1}w_idelta_{x_i}(x)	ag{2.42}

其中需要滿足 0leq w_ileq 1sum^N_{i=1}w_i=1


推薦閱讀:

被眼睛欺騙?這正是你比機器高明的地方!深度學習如何處理認知錯覺
一起來學西瓜書! 第二章 模型評估與選擇
李宏毅機器學習筆記(一)前言

TAG:機器學習 |