李宏毅ML課程[1]Learning Map

01-25

下面ppt均來自李宏毅老師上課講義~主要是記錄自己在學習李老師課程的一些自己的筆記~

首先介紹一下本文要學習的東西~如下圖。

根據上圖，包括監督學習，非監督學習，半監督學習，遷移學習，增強學習等內容，每一個模塊中又有不同內容。

比如其中監督學習不包括線性模型，非線性模型等等

Regression

回歸模型的特性，是目標函數的輸出是一個標量。

比如：輸入是今天上午的PM2.5，以及昨天的PM2.5，要求輸出明天上午的PM值（一個標量）

如下圖表示：

那麼訓練數據表示格式如下：

然後通過訓練演算法，學習得到一個模型。

其中包括二分類問題，如下：

也包括多分類問題：

其中二分類典型的應用是，刷選垃圾郵件。如下：

每來一個郵件，進行判斷是否是垃圾郵件（二分類問題）

其中多分類問題的一個應用是判斷文檔的主題，如下：

來了一篇文章，我們判斷是政治類，經濟類或者是體育類，還是其它類別~

當然這些問題也可以用深度學習來解決。

其中，我們用CNN來作為學習分類器，判斷最終的所屬類別。

下面1簡單介紹一下幾種不同類別的學習。

半監督學習是通過一部分標記數據以及一部分未標註數據學習得到一個模型。

想要訓練出一個模型，判斷圖片動物的種類是狗還是貓。

通過一部分狗貓的訓練數據，加上一些不相關的標註或者未標註的數據進行訓練，得到一個模型。

Unsupervised Learning

通過全是未標註的數據學習到一個模型。

結構化學習並不能簡單的看做是一個多分類問題，比如：

（1）一段聲音，我們需要得到最可能的一句話。這個時候，我們無法窮舉所有的句子，然後挑選概率最大的句子。因為句子個數是無窮多的

（2）機器翻譯例子中，有一個源語言，要得到一個目標語言，也是無法之間使用多分類模型的，因為句子的個數是無窮的。

（3）第三個例子，人臉識別，判斷某個區域是否為人臉，也是無法之間用多分類模型進行預測，因為區域的個數也是無窮多個的。

其中監督學習與強化學習的區別是：

在監督學習下:

在當前某個狀態下，期望下一步動作，就是5-5

或者在當前某個狀態下，期待下一步動作，就是3-3

也就是說，監督學習訓練數據中，有著完整的輸入，輸出。

而強化學習是通過不停的比賽，強調如何基於環境而行動，以取得最大化的預期利益。中間過程有可能某個下子狀態是不利的，但是沒有關係

參考自李宏毅老師上課講義