標籤:

有監督學習、無監督學習以及強化學習

定義

有監督學習是機器學習任務的一種。它從有標記的訓練數據中推導出預測函數。有標記的訓練數據是指每個訓練實例都包括輸入和期望的輸出。一句話:給定數據,預測標籤

無監督學習是機器學習任務的一種。它從無標記的訓練數據中推斷結論。最典型的無監督學習就是聚類分析,它可以在探索性數據分析階段用於發現隱藏的模式或者對數據進行分組。一句話:給定數據,尋找隱藏的結構

強化學習是機器學習的另一個領域。它關注的是軟體代理如何在一個環境中採取行動以便最大化某種累積的回報。一句話:給定數據,學習如何選擇一系列行動,以最大化長期收益

比喻

例如學英語。有監督學習是先讀幾篇中英文對照的文章,從而學會閱讀純英語文章。無監督學習是直接閱讀大量純英文文章,當數量達到一定程度,雖然不能完全理解文章,但也會發現一些片語的固定搭配,句式等等。

舉例

  • 有監督學習:學認字

  • 無監督學習:自動聚類

  • 增強學習:學下棋

特點

有監督學習

  • 有標籤

  • 直接反饋

  • 預測未來結果

無監督學習

  • 無標籤

  • 無反饋

  • 尋找隱藏的結構

強化學習

  • 決策流程

  • 激勵系統

  • 學習一系列的行動

在這三大分支中,有監督學習是機器學習中最大和最重要的分支。

下一級概念

有監督學習

  • 分類

  • 回歸

無監督學習

  • 聚類

  • 降維

強化學習

  • 馬爾可夫決策過程

  • 動態規劃

參考引用

Supervised Learning

Unsupervised Learning

Reinforcement Learning

Machine Learning-by Larisa


推薦閱讀:

初試微軟Azure Machine Learning:建立簡易CAD/CNY匯率預測模型
Siamese network 孿生神經網路--一個簡單神奇的結構
AlphaGo之父談人工智慧:超越人類認知的極限
超級推薦!Mathematics for Machine Learning

TAG:機器學習 |