還糾結選機器學習還是深度學習?看完你就有數了

新手常見問題:「機器學習」還是「深度學習」,哪個更適合我呢?

文/ Christine Taylor

譯/ 李大狗

編輯/ 熄燈了

大哥你好,我是來學「人工智慧」的。但是,啥是「深度學習」?啥是「機器學習」?「深度學習」和「機器學習」有啥關係?我究竟該學「深度學習」還是「機器學習」?

在入門時,很多人都會被這幾個問題繞暈了。但相信我,看完這篇文章,所有的這些疑惑都會被解決!

首先,我們來搞懂「人工智慧」、「機器學習」和「深度學習」這三個概念和概念之間的聯繫。

一、什麼是人工智慧?

人工智慧是通過軟體和硬體來「模擬」和「模仿」智能人類行為的研究。大家記得《終結者》里的天網和T-800嗎?它們就是「人工智慧」哦!

二、什麼是機器學習?

機器學習是AI的一個子領域,它通過演算法將AI概念應用於計算系統。計算機識別數據模式並根據數據模式採取行動,隨著時間的推移學習提高其準確性而無需明確的編程。機器學習的背後是預測編碼,聚類和視覺熱圖等分析方法。我們打開某寶、某東時的購物推薦就是機器學習的一個應用啦~

三、什麼是深度學習?

深度學習是機器學習的子領域,是人工神經網路的另一個名字。深度學習網路模仿人類大腦感知與組織的方式,根據數據輸入做出決策。AlphaGo就是我們最耳熟能詳的深度學習的應用!此外,雖然現在「天網」還沒出現,但是「天網」的基礎,深度學習已經出現啦!

簡而言之,機器學習是人工智慧的一部分,深度學習是機器學習的一部分,這就是三者的關係。

「機器學習」vs. 「深度學習」,我應該學哪個

剛才說了,深度學習是機器學習的一部分,它們的關係就像「扳手」和「整套工具」 的關係。因此,如果你想搞個應用,你更應該先學機器學習,了解一下整套工具。而是否要學習深度學習(扳手)要仔細考慮考慮——畢竟,深度學習是一個在發展中的技術,並且用花掉你大把的錢!(買顯卡……)

話說回來,深度學習雖然仍在發展中,但已經有很多深度學習的產品已經進入市場了,假以時日,深度學習的應用將會變得更加廣泛,這個扳手的作用將會越來越大。

深度剖析

現在,讓我們分別來了解一下「機器學習」和「深度學習」的知識和它們的應用案例吧!

一、機器學習詳解

機器學習通過演算法分析數據,從結果中進行學習,然後將「學習後的演算法」用來做出決策或進行預測,例子有我們熟悉的聚類、貝葉斯網路和視覺數據映射等等。

機器學習可以分成兩種類型——「有監督學習」和「無監督學習」

監督式學習依賴於人為生成的「數據種子集」。這些「數據種子集」調教程序它該如何「看待」數據。

  • 舉個監督室學習的例子,我有一套電子郵件數據,我給每一封郵件都打上「垃圾郵件」或「非垃圾郵件」的標籤,那麼,這套數據便是「數據種子集」,程序可以利用這套數據種子集進行訓練,從而得到一個判斷垃圾郵件的模型。

無監督學習是這樣的——觀察數據中的模式,將它們和其他的數據比較或進行搜索查詢。隨著數據集的增長、更多模式的浮現,機器學習演算法不斷「自我優化」。無監督學習的例子有聚類、概念搜索和接近重複數據刪除等等。

  • 再以郵件為例,我有一套電子郵件數據,但是我並沒有人為的給它「打標籤」,而是直接進行聚類,程序會自動的分出「垃圾郵件」和「非垃圾郵件」。

機器學習的「基礎設施」差異很大。單一系統可以處理有限的數據,而大型系統則包含數十台伺服器和大規模並行處理(MPP)架構,用於跨多個數據源的海量數據。

二、深度學習詳解

深度學習,又叫人工神經網路,和其它所有機器學習一樣都是基於演算法。然而它並非像「數據分類」一樣根據任務選擇的演算法,而是模仿人類大腦結構與運算過程——識別非結構化輸入的數據,輸出精確地行為和決策。

機器學習可以是監督的也可以是非監督的,這意味著大型神經網路可以接受「標籤化輸入」,但並不需要。當一個神經網路處理輸入時,它通過輸入數據和輸出數據創造層,這種級別的深度學習讓神經網路從原始數據中「自動抽取特徵」而無需人工來貼標籤。

神經網路由大量被稱為神經元的簡單處理器構成,處理器用數學公式模仿人類大腦中的神經元。這些人造神經元就是神經網路最基礎的「部件」。

簡而言之,每一個神經元接受兩個或更多的輸入,處理它們,然後輸出一個結果。一些神經元從額外的感測器接收輸入,然後其他神經元被其他已激活的神經元激活。神經元可能激活其它的神經元,或者通過觸發的行動影響外部環境。所有的行為都是在「自動生成」的隱藏層中發生的,每個連續的圖層都會輸入前一層的輸出。

在實際項目中,神經網路大量攝取非結構化數據——聲音、文字、影像和圖片。神經網路將數據分離為數據塊,然後將它發送到獨立的神經元和網路層中去處理。一旦這些離散的處理都完成了,神經網路就產生最後的輸出,我們就大功告成了!

人工神經網路,或者說深度學習有什麼優點?它的一大優點在於「可擴展性」。神經網路的性能取決於它可以吸收、訓練和處理多少數據。所以,更多的數據意味著更好的結果——這是和「其它機器學習演算法」的另一個區別,其它機器學習演算法的效果通常穩定在一個明確的水平。深度學習僅通過資源衡量它的性能,層數更深,則輸出更為廣泛,性能也更為強勁。

所以,儘管深度學習不快也不容易,但是通過更低的價格能得到更好的計算能力這一點,還是讓各大公司「買買買」。

機器學習和深度學習的流行應用場景

機器學習已經在市場上「無孔不入」了,而深度學習還處於「初級階段」,商業化程度有限。

在某些應用案例中,二者可以說十分相似,區別在於神經網路可以增長到接近無限的學習和輸出規模;機器學習更受約束,適合具體的實際計算任務。

注意啦,「機器學習」和「深度學習」並非相斥而是互補的關係。

機器學習和深度學習的未來

你不會走在大街上就碰見「深度學習」,它們需要大量的標記數據進行監督學習,或大量的非結構化數據進行無監督學習。因此,苦逼的技術人員需要花費大量的時間標記和向神經網路輸入數據,或者需要輸入數以百萬計的非結構化對象來實現無監督學習。

在現代這個IT社會,缺乏數據不再是問題——挑戰是標記足夠的數據,或者將足夠的未標記數據導入神經網路。儘管處理能力不斷增加,價格也有所下降,但密集計算仍然需要對系統和支持進行大量的投資。

儘管如此,深度學習在許多不同的業務垂直領域都有很好的案例。像谷歌和Facebook這樣的深度學習大佬正在使用深度學習開發炫酷的應用程序,而其他的開發者們則在「跟著大佬走」。

不管怎樣,機器學習和深度學習是時代的大勢所趨。就像整個世界因為互聯網而變成了另一種樣子,機器學習也會重塑這個世界。在這個過程中,越來越多的人會認識到機器學習的價值,機器學習也會變得越來越容易上手。說不定有一天,小學生也要開始學習機器學習了。


弱弱來個安利

機器學習工程師 | Udacity?

cn.udacity.com圖標深度學習 | Udacity?

cn.udacity.com圖標

推薦閱讀:

DBC「留學生春招計劃 」——現在就加入,Offer搶先拿
Portfolio Critique #8 - Facebook by Sunny
想在年後的求職中更有競爭力,這個寒假應該該準備些什麼?
【贏在校園】求職意向怎麼寫

TAG:深度學習DeepLearning | 機器學習 | 求職 |