機器學習基石-- Learning to Answer Yes/No
01-28
判斷一個人能否申請成功信用卡,
符號標記
A takes D and H to get g
- A: 機器學習演算法
- D: 訓練數據 (x1,y1),··· ,(xN,yN) (銀行里的歷史記錄)
- H: 假設的集合
- f: 理想化的公式,可以準確判斷是否批准信用卡 (unkown)
- g: 學習到的公式
將數據向量化
- 申請者向量:
- 權重向量(未知):
- 批准申請:
(threshod 未知)
- 拒絕申請:
- 將 threshold 放進 W , 1 放進 X,可以簡化成為兩個 vector 的內積
二維平面的實際例子
如果是在二維平面內
,H(X) 是二維平面內的一條直線,我們的目的是要找到一條線將二維平面內的 X O 進行合理的劃分。
尋找理想的 h(x)
- 首先任意選定平面的一條直線。
- 遍歷平面內的點,如果沒有發現切分失敗點,切分成功。如果發現了一個沒有被正確劃分的點,進行旋轉。
下圖的這個題目也很有意思
答案是 3,可以理解為每一次調整過後,錯誤傾向越小,距離正確的分類越近,或者已經修復。
線性可分的前提下,PLA 一定可以停止嗎?
推薦閱讀:
※【機器學習】Cross-Validation(交叉驗證)詳解
※如何流程挖掘/模擬?
※Deep Matrix factorization Models for Recommender System
※2017摩拜杯演算法挑戰賽 第三名團隊解決方案
※誰來用最通俗易懂的語言跟我講一下k平均演算法(k means clustering)??