李宏毅機器學習筆記(一)前言
這門課可以學到什麼呢?
大部分人預期可以學到人工智慧的一些東西。最近人工智慧似乎變得很火,到處都在提。可是人工智慧並不是什麼新詞,它在1950年代就出現了。它意味著什麼呢?意味著人類長遠以來的一個目標,希望機器變得和人一樣聰明。在很多科幻小說和影視作品中,早已出現了它的身影。可是人們卻太清楚怎麼做這件事,不太清楚如何讓機器擁有智慧。直到大概1980年代以後,有了機器學習。顧名思義,機器學習就是讓機器擁有學習的能力。那麼,機器學習和人工智慧有什麼關係呢?人工智慧是我們需要達成的目標,而機器學習達成目標使用的手段。深度學習就是機器學習的其中一種方法。
那麼在有機器學習、深度學習之前,我們如何做人工智慧這件事呢?
生物學的知識告訴我們,生物的行為取決於先天的本能或後天學習的結果。
在此之前,我們就是讓機器很強的先天本能,讓它可以處理各種複雜的任務,似乎讓其看起來很聰明很智能。但這些本能是由人類的規則確定下來的,它永遠沒有辦法超過其創造者。
它沒有freestyle!
就像下面這個樣子,
我們的目的是研究真正的機器學習。
那麼,什麼是機器學習呢?
簡單地說,假如你寫了一個程序讓機器變得很聰明,使其具有學習能力。接下來,你就像教一個嬰兒一樣告訴它(假如是語音識別)『這段聲音就是「Hi」。
這段聲音就是「How are you」。
這段聲音就是「Good bye」。以及很多其他的聲音,以類似的形式給它。
接下來,它就學會了。你給它一段語音(它之前可能從未聽過),它就告訴你內容是什麼。
整個過程如下:
類似的,也可以進行圖像識別
機器學習可以看成是從數據中找到一個函數的過程
舉個例子:
假如我們要進行圖像識別,看到了貓的圖片就輸出「cat」
我們已經有了一系列的函數(可能來自於專家的研究成果),我們稱之為模型(Model)。
其中有一個函數f1,它的情況如下:
還有一個函數f2,它的表現情況如下:
然後,我們有一大堆圖片,這些數據稱之為訓練集(Training Data),
可以看到,對於每張圖片,都有標準答案。
對比f1和f2,我們可以看出f1表現得更好。可是,我們可能有成千上萬,無窮無盡的函數,那麼就得讓機器自己挑出表現得最好的函數。找到了最好的函數之後,我們就可以用它來測試,看它是否有舉一反三的能力。
其實機器學習很簡單,可以分為三步:
以上。
推薦閱讀:
※為什麼我們需要傳統方法?
※基於不平衡樣本的推薦演算法研究
※iForest (Isolation Forest)孤立森林 異常檢測 入門篇
※機器學習演算法系列--生成模型與判別模型
※「伊人」何處,宛在雲中央:用 Datalab 在雲上部署互動式編程環境
TAG:機器學習 |