標籤:

機器學習基石筆記1:基礎概念

ML的組件

  • 輸入: xin X
  • 輸出: yin Y
  • 目標函數 f: X
ightarrow Y (生成訓練樣本的函數)
  • 數據,即訓練樣本, D =left{ (x_1,y_1),(x_2,y_2)...(x_n,y_n) 
ight}
  • 假設函數 g: X
ightarrow Y (能夠學習到的函數),g與f越接近越好
  • gin H = left{ h_1,h_2...h_n 
ight} ,H稱為假設函數集,包含了好與不好的各種h(假設)

ML流程圖

  • 機器學習演算法一般用A表示
  • 假設空間或者叫做假設集合一般用H表示,它是包含各種各樣的假設,其中包括好的假設和壞的假設,A從H這個集合中挑選出它認為最好的假設作為g

ML vs DM & ML vs AI & ML vs Statistic

  • 簡單的說就是相輔相成,密不可分,工具與結果的關係
  • 別煩了,現在沒啥好說的,等深入理解了ml自然就知道了

輸出空間的分類

  • 二元分類
  • 多元分類 主要應用模式識別
  • 回歸分析 輸出空間為整個或範圍的實數集
  • 結構學習

訓練集的標記的分類

  • 監督學習 知道數據輸入的同時還知道數據的標記
  • 無監督學習 訓練集沒有標記 一般用於聚類
  • 半監督學習 通過少量有標記的訓練點和大量無標記的訓練點達到學習的目的
  • 強化學習 (輸入 輸出 評分)

獲取數據的分類

  • 批量學習
  • 在線學習
  • 主動學習

//待添加 todo

題圖:2017年11月1日14:52:10


上一篇 《0 起筆語》

下一篇 《2 感知器學習演算法(PLA)》


推薦閱讀:

Paper Reading | 讓深度學習更高效運行的兩個視角
Cousera deeplearning.ai筆記 — 深度神經網路(Deep neural network)
有關NLP的比賽
機器學習基石筆記4:機器學習可行性論證 上
讓我們一起來學習CNTK吧

TAG:機器學習 |