李宏毅機器學習筆記（一）前言

04-25

這門課可以學到什麼呢？

大部分人預期可以學到人工智慧的一些東西。最近人工智慧似乎變得很火，到處都在提。可是人工智慧並不是什麼新詞，它在1950年代就出現了。它意味著什麼呢？意味著人類長遠以來的一個目標，希望機器變得和人一樣聰明。在很多科幻小說和影視作品中，早已出現了它的身影。

可是人們卻太清楚怎麼做這件事，不太清楚如何讓機器擁有智慧。直到大概1980年代以後，有了機器學習。顧名思義，機器學習就是讓機器擁有學習的能力。那麼，機器學習和人工智慧有什麼關係呢？人工智慧是我們需要達成的目標，而機器學習達成目標使用的手段。深度學習就是機器學習的其中一種方法。

那麼在有機器學習、深度學習之前，我們如何做人工智慧這件事呢？

生物學的知識告訴我們，生物的行為取決於先天的本能或後天學習的結果。

在此之前，我們就是讓機器很強的先天本能，讓它可以處理各種複雜的任務，似乎讓其看起來很聰明很智能。但這些本能是由人類的規則確定下來的，它永遠沒有辦法超過其創造者。

它沒有freestyle！

就像下面這個樣子，

我們的目的是研究真正的機器學習。

那麼，什麼是機器學習呢？

簡單地說，假如你寫了一個程序讓機器變得很聰明，使其具有學習能力。接下來，你就像教一個嬰兒一樣告訴它（假如是語音識別）『

這段聲音就是「Hi」。

這段聲音就是「How are you」。

這段聲音就是「Good bye」。以及很多其他的聲音，以類似的形式給它。

接下來，它就學會了。你給它一段語音（它之前可能從未聽過），它就告訴你內容是什麼。

整個過程如下：

類似的，也可以進行圖像識別

機器學習可以看成是從數據中找到一個函數的過程

舉個例子：

假如我們要進行圖像識別，看到了貓的圖片就輸出「cat」

我們已經有了一系列的函數（可能來自於專家的研究成果），我們稱之為模型（Model）。

其中有一個函數f1，它的情況如下：

還有一個函數f2，它的表現情況如下：

然後，我們有一大堆圖片，這些數據稱之為訓練集（Training Data），

可以看到，對於每張圖片，都有標準答案。

對比f1和f2，我們可以看出f1表現得更好。可是，我們可能有成千上萬，無窮無盡的函數，那麼就得讓機器自己挑出表現得最好的函數。找到了最好的函數之後，我們就可以用它來測試，看它是否有舉一反三的能力。

其實機器學習很簡單，可以分為三步：

以上。