機器學習基石-- Learning to Answer Yes/No

判斷一個人能否申請成功信用卡,

符號標記

A takes D and H to get g

  • A: 機器學習演算法
  • D: 訓練數據 (x1,y1),··· ,(xN,yN) (銀行里的歷史記錄)
  • H: 假設的集合
  • f: 理想化的公式,可以準確判斷是否批准信用卡 (unkown)
  • g: 學習到的公式

將數據向量化

  • 申請者向量:

  • 權重向量(未知):

  • 批准申請:

(threshod 未知)

  • 拒絕申請:

    • 將 threshold 放進 W , 1 放進 X,可以簡化成為兩個 vector 的內積

    二維平面的實際例子

    如果是在二維平面內

    ,H(X) 是二維平面內的一條直線,我們的目的是要找到一條線將二維平面內的 X O 進行合理的劃分。

    尋找理想的 h(x)

    1. 首先任意選定平面的一條直線。
    2. 遍歷平面內的點,如果沒有發現切分失敗點,切分成功。如果發現了一個沒有被正確劃分的點,進行旋轉。

    下圖的這個題目也很有意思

    答案是 3,可以理解為每一次調整過後,錯誤傾向越小,距離正確的分類越近,或者已經修復。

    線性可分的前提下,PLA 一定可以停止嗎?


    推薦閱讀:

    【機器學習】Cross-Validation(交叉驗證)詳解
    如何流程挖掘/模擬?
    Deep Matrix factorization Models for Recommender System
    2017摩拜杯演算法挑戰賽 第三名團隊解決方案
    誰來用最通俗易懂的語言跟我講一下k平均演算法(k means clustering)??

    TAG:机器学习 | 数据挖掘 |