機器學習入門資源大全

機器學習入門資源大全

來自專欄 IT乾貨分享206 人贊了文章

哈哈~沒錯,時隔半年我又回歸啦!其實中間收到很多私信向我提問,問我要各種資源的,為了不辜負大家對我哪怕一絲絲的信任,我又來繼續更新啦!

「機器學習」現在真的太受歡迎了,但很多人想學又不知道在哪找資源,所以這次為大家整理了關於「機器學習」的各種用得到的工具、資源,希望可以幫到大家( ? ?ω?? )?

一、機器學習學習路線

就算是整理資源我也回先弄清楚寫作的先後順序,學習也是一樣啊,入門機器學習要先學會微積分、線性代數,懂一些編程基礎,才能進行下一步的學習。先來看看具體的學習內容:

《全棧數據之門》

是不是眼花繚亂?看起來有點複雜,如果直接從演算法工程師的角度出發的話,可以這樣劃分:

這樣就比較清楚了。了解完機器學習具體要學哪些內容以後找資源也有了具體的方向。那就還是繼續按照我的方式來總結一篇機器學習的學習資源吧,會從以下幾個方面整理:

  • 1)書籍:機器學習還是涉及很多數學基礎和理論知識的,啃書是必不可少的啦;
  • 2)視頻:看書有些地方看不到,那就聽聽大牛們的課吧;
  • 3)在線學習網站:機器學習還是比較複雜,有些網站提供比較系統的學習路徑;
  • 4)博客及社區:一些大牛們的經驗總結真的可以利用起來,還有中文社區可以交流討論,感興趣的可以看看;
  • 5)其他:其他與機器學習相關的一些整理。

如果還是未入門階段的小夥伴,還可以看看這些文章:

機器學習溫和指南

有趣的機器學習:最簡明入門指南

一個故事說明什麼是機器學習

二、學習資源

1、書籍

  • 《數學之美》:入門讀起來很不錯。
  • 李航的《統計學習方法》:詳細介紹支持向量機、Boosting、最大熵、條件隨機場等十個統計學習方法。
  • 《Pattern Recognition and Machine Learning》:必讀書籍之一,很有用但是相當難啃。
  • 周志華的《機器學習》:認真讀每一章都會有收穫。
  • 陳希孺《概率論與數理統計》。大師的良心之作,應該是至今為止評價最好的一本概率論教材了。
  • Adrian Banner的《普林斯頓微積分讀本》。深入淺出,非常注重基礎知識的積累,講解也很生動,讀起來不會覺得乏味。

2、視頻

  • 吳恩達公開課 :經典中的經典!
  • 計算機中的數學 :《計算機中的數學》系列視頻,8位老師10講內容,介紹微積分和線性代數基本概念在計算機學科中的各種有趣應用。
  • Machine Learning :斯坦福的機器學習課程。從Stanford CS229 course下載講義和筆記。主要講解了線性代數的知識。
  • 網易公開課 :很多關於機器學習的課程,國內做得很不錯的公開課,翻譯了一些國外出名的公開課教程,與國外公開課平台coursera有合作。
  • YouTube上的,內容很全面,偏概率統計模型,每一小集只有幾分鐘。
  • 李宏毅機器學習(2017) ,也是必看啊。

Ps.李宏毅機器學習課程 ,完整的學習順序

  • Learning from Data,內容更適合進階。

3、在線學習網站

國內

  • 極客學院 :以視頻的形式講解,每節課的時長一般十五到二十分鐘。一些源碼可以下載,後面還可以跟著老師做一些項目。
  • 網易雲課堂 :裡面有很多教學視頻,機器學習的課比較全,老師講解得也很詳細。聽說很多人都是懷著對網易雲音樂的情懷去的ヽ(′?ω?`)?
  • 實驗樓 :給你提供技術文檔和虛擬的實驗環境,你要跟著步驟一步步來學,步驟很詳細。還有系統的學習路徑,所以很適合機器學習的新手。像這種動手學的一般更容易學進去。
  • 慕課網 :每節課講的時間不長,可以自己選課程,有基礎有項目,內容很豐富。
  • 小象學院 :裡面有許多公開課,直播為主。每個老師講的內容不一樣,適合有一點機器學習基礎的小夥伴。
  • 優達學城 :分了機器學習入門課和進階課,有老師來自矽谷,課程比較專業。
  • 百度機器學習 BML

國外

  • Coursera
  • codecademy
  • edX
  • openlearning

4、博客及社區

博客

  • 王海峰 :信息檢索,自然語言處理,機器翻譯方面的專家,ACL的副主席,百度高級科學家。
  • 周志華:機器學習和數據挖掘方面國內的領軍人物,更可貴的是他的很多文章都有源碼公布。
  • 火光搖曳Flickering: 一群騰訊工程師分享的博客,內容涉及概率統計、數據挖掘、機器學習、自然語言處理、並行計算等等,文章質量很高。
  • Netflix:Netflix技術博客,很多乾貨。
  • Free Mind :由 pluskid 所維護的 blog,主要記錄一些機器學習、程序設計以及各種技術和非技術的相關內容,寫得很不錯。
  • The Open Source Data Science Masters:裡面包含學ML/DM所需要的一些知識鏈接,且有些給出了視頻教程,網頁資料,電子書,開源code等。

社區

  • 博客園 - 開發者的網上家園
  • matlab中文論壇
  • CSDN論壇-IT技術交流平台
  • V2EX
  • 果殼 - 機器學習小組

6、其它

相關網站

  • 我愛自然語言處理
  • 機器學習 - 伯樂在線I Love Natural Language Processing?

    www.52nlp.cn圖標機器學習 - 伯樂在線

學習筆記

  • tornadomeet 機器學習 筆記 (2013)
  • Deep Learning(深度學習)學習筆記整理系列之(一)

數學概念

  • 機器學習中的數學(1)-回歸(regression)、梯度下降(gradient descent)
  • 機器學習中的數學(2)-線性回歸,偏差、方差權衡
  • 和3D相關的一些數學概念和公式
  • 梯度下降(Gradient Descent)小結
  • 機器學習中的演算法(1)-決策樹模型組合之隨機森林與GBDT
  • 線性代數(一) Linear Algebra I(視頻):台灣國立交通大學莊重特聘教授主講的線性代數課程,從泛函的角度來講解線性代數(同時兼顧了矩陣角度),會幫你建立一種更加高屋建瓴的線性代數觀念。
  • 葉丙成的概率課(視頻):這是一個幾率的入門課程,著重的是教授幾率基本概念。
  • 國防科技大學的高等數學課(視頻):如果你想複習或者重新學高等數學,或者有的地方書上講得看不懂,可以看看這個。

編程語言學習

  • C 語言入門教程
  • Scala 開發教程
  • OpenGL
  • Python3 簡明教程
  • R 語言基礎入門

編程庫資源

  • 機器學習開源軟體網:收錄了各種機器學習的各種編程語言學術與商業的開源軟體。
  • libsvm:台灣大學的林教授的傑作。
  • Orange:基於c++和python介面的機器學習軟體,界面漂亮,調用方便,可以同時學習C++和python,還有可視化的功能。
  • WEKA :基於java的機器學習演算法最全面最易用的開源軟體。
  • Mallet:基於JAVA實現的機器學習庫,主要用於自然語言處理方面,特色是馬爾可夫模型和隨機域做得好,可和WEKA互補。

嗯,這次整理就到這裡了,如果大家還有什麼更好的私藏好貨也可以告訴我哦,我可以更新上來,嘻嘻~

就醬,溜啦溜啦……


推薦閱讀:

【讀論文】機器閱讀的最新進展與爭議
xgboost參數調優指南
L-BFGS演算法剖析
台大林軒田機器學習課第卅二講筆記:結束曲
CVPR不堪重負一度掛掉,最受關注的CV頂會都說了什麼?

TAG:數據挖掘 | 機器學習 | 編程 |