機器學習是什麼意思?

什麼是機器學習

機器學習是近20多年興起的一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、演算法複雜度理論等多門學科。是一門研究在非特定編程條件下讓計算機採取行動的學科。

機器學習是什麼意思

最近二十年,機器學習為我們帶來了自動駕駛汽車、實用的語音識別、高效的網路搜索,讓我們對人類基因的解讀能力大大提高。當今機器學習技術已經非常普遍,我們很可能在毫無察覺情況下每天使用幾十次。許多研究者還認為機器學習是人工智慧(AI)取得進展的最有效途徑。

機器學習是什麼意思

機器學習演算法是一類從數據中自動分析獲得規律,並利用規律對未知數據進行預測的演算法。因為學習演算法中涉及了大量的統計學理論,機器學習與統計推斷學聯繫尤為密切,也被稱為統計學習理論。演算法設計方面,機器學習理論關注可以實現的,行之有效的學習演算法。

開始機器學習需要的知識儲備

1、語文能力最少達到初中水平。

2、英語能力最少要達到高中優秀水平,有一定的英文閱讀基礎。

3、數學最少達到高中水平,微積分一定得學過。

* 盡量有以下的工程基礎(這樣可以邊學邊練,體會更深,但是不會也沒有關係的)

(1)面向過程編程範式(2)常見數據結構(3)常見演算法思想及演算法分析能力

機器學習入門資源

既然是初學者,就要從簡單入手。而大學本科的概率論和線性代數對於基本的入手已經足夠了!

機器學習是什麼意思

課程全面,內容由淺入深。更加重要的是這門課程每次課都有課堂作業,作業不需要你寫出來所有的代碼,但是關鍵代碼要你寫出來,而且還會教你如何調試代碼,可以把視頻下載下來(很多網盤裡都有下載好的視頻),然後慢慢的去啃。作業也是,可能你自己不能一口氣寫出來,沒關係,在自己做了大量嘗試後,去Github上面下載一些別人寫好的代碼看一看,找找自己的問題到底出在了哪裡。

總之,一定要耐著性子過一遍甚至是幾遍這個課程。

書籍:國內的可以看李航的《統計學習方法》,綜合了老外的基本ML經典,寫得淺顯易懂,書也比較薄,好讀,學習曲線不會太陡。

還有周志華老師的西瓜書《機器學習》

為了使儘可能多的讀者通過本書對機器學習有所了解, 作者試圖儘可能少地使用數學知識. 然而, 少量的概率、統計、代數、優化、邏輯知識似乎不可避免. 因此, 本書更適合大學三年級以上的理工科本科生和研究生, 以及具有類似背景的對機器學 習感興趣的人士. 為方便讀者, 本書附錄給出了一些相關數學基礎知識簡介.

國外的建議先看《pattern classification》,書很老,但是將經典方法背後的思想講得非常透徹,適合入門,較其他的簡單一些。寫得很詳細。如果英文水平有限,那可以看一些中文書籍入門。

入門之後,對常用演算法有了基本了解之後,就可以多學一些原理性知識了,比如統計理論、矩陣理論、信號處理、分散式計算等等。

?Machine Learning in action,(這裡面的完成語言為Python)這是英文版本的。當然如果你覺得英文對你是一個完全過不去的坎,(雖然建議做技術的人都必須至少要看得懂英文)現在有中文版本,叫「機器學習實踐」。

這本書用盡量少的公式把機器學習的基本演算法都過了一遍,而且還講得很清楚,更為重要的是他將公式和代碼結合了起來。因此,你的機器學習並沒有那麼的抽象了,你知道演算法里的公式如何的轉化為代碼。

機器學習的工具

為了快速實現機器學習模型,我們推薦使用現成的建模工具。這樣的話,你會在短時間內練習整個機器學習的工作流程,而無需在任何一個步驟花費太多時間。這會給你非常有價值的「大局直覺」(Big Picture Intuition)。

Python:Scikit-Learn Scikit-learn 和 Sklearn 是通用機器學習中 Python 的黃金標準庫,它具有常規演算法的實現。

R:Caret Caret 為 R 語言中的模型包提供一個統一的界面。它還包括了預處理、數據拆分、模型評估的功能,使其成為一個完整的端到端解決方案。

菜鳥文章推薦

《為期一周的機器學習研究》作者:Per Harald Borgen

文章述了他如何通過五天的努力開啟機器學習之旅。文章在給予那些對機器學習有興趣的人一些入門指南,這個指南來自作者為期一周的學習經驗。

《從0到1:我是如何在一年內無師自通機器學習的?》作者:Jasper.T

《為期一周的機器學習研究》的後續,Per Harald Borgen和我們分享他如何在一年內掌握機器學習知識的經歷,並在工作中完成了第一個機器學習項目,包括使用各種各樣的機器學習和自然語言處理技術,使 Xeneta 的潛在客戶達到合格標準。

在 Per Harald Borgen看來,他並不認為只有獲得博士或碩士學位的人才能在機器學習方面更加專業。「研究機器學習並不需要你數學學得很好,也不需要你一定要取得什麼樣的學位。」

如果你對機器學習抱有好奇又心存敬畏,不妨看看這篇文章。

《Cheat Sheet of Machine Learning and Python (and Math) Cheat Sheets》作者: Robbie Allen

「值得收藏的27個機器學習的小炒」簡明地列出了給定主題的關鍵知識點,適合初學者查漏補缺。

前輩說

「機器學習入門最佳的方法其實就是理論和代碼一起學習。一邊看相應的理論推導,一邊看並且實踐經典代碼。所以,為了更快入門,我推薦你最好能夠懂點MATLAB或者是Python語言。」

「盡量避免在一個話題上拖太久的時間。即便是對於機器學習教授來說,有些概念也很不好解釋。但是當你在實踐中開始應用時,你會很快就懂得概念的真實含義。」

「入門學習,視頻比教科書更有效。教科書是很好的參考工具,但它很難堅持。我們強烈推薦視頻講座的形式。」

「如果你希望了解機器學習,那你就需要徹底地理解統計學(特別是概率)、線性代數和一些微積分。」

「從理論到實際,或從實際到理論。」


推薦閱讀:

SRCNN 論文閱讀
《機器學習基石》課程學習總結(一)
2018AI學習清單丨150個最好的機器學習和Python教程
深度學習基礎:Autoencoders
關於機器學習、數據科學面試的準備

TAG:人工智慧 | 機器學習 |