Convex Formulation for Learning from Positive and Unlabeled Data
03-31
PU Learning的風險公式如下:
相對應的經驗風險為
如果 ,上式就可以用凸優化來求解。
如果 是一個線性模型:
,
其中, 是一組基函數。那麼,
接下來挑選一個損失函數,這裡以square loss為例。
那麼, .
square loss的一個好處是它能夠給出解析解。為了簡便,這裡省略偏置 ,那麼,通過核方法,經驗風險的矩陣表示如下:
上式最小化,令為0,可得
square loss的一個缺點在於如果 ,也會有損失。但如果正類被預測為大於1的值,是不應該有損失的。
推薦閱讀:
※機器學習篇-評估機器學習的模型
※【機器學習Machine Learning】資料大全
※Cousera deeplearning.ai筆記 — 深度神經網路(Deep neural network)
※製作假新聞?AI送你去喝茶!
※數據集列歸一化與聚類示例
TAG:機器學習 |