之前的文章《如何零基礎入門數據分析》里提到過,不同群體學習機器學習的目的是有不同的,因此學習方法也不一樣。數據分析師而言,對機器學習的應用大體分為兩類:1) 能調包就行;2) 不僅能調包,還需要比較深入的理解其中的原理。對於第一類,需要了解各類演算法的優劣勢和使用場景,並直接應用,datacamp是個很好的應用學習平台(戳這裡!了解Datacamp)。而對於第二類學習,則要花費一定的時間和精力了,需要一定的數理基礎和代碼功底。
如果你既希望能夠理解如何使用經典的機器學習模型,又希望能夠一定程度上理解其中的原理,甚至手動編寫模型;並且你還希望用Python來學習這些,本文強烈推薦華盛頓大學的機器學習系列課
Machine Learning | Coursera?www.coursera.org
學習這門課之前你需要:
- 有熟練的Python編程技巧:基本編程思維和能力,熟練使用numpy、pandas庫;最好在學習之前已經有sklearn的使用經驗
- 了解微積分、線性代數、統計學與概率論
- 可以接受英文授課(有字幕)
學過這門課之後你能夠:
- 了解基本的回歸模型:線性回歸、LASSO和嶺回歸等
- 了解基本的分類器:LR+正則化、樹分類(集成分類器)
- 了解一些非監督學習方法:相似性、聚類等
- 了解機器學習在房價預測、文本聚類和圖像等相關領域的應用
這門機器學習課是系列課程,總共包括4門:案例研究、回歸、分類和非監督。其中第一門為案例分析,介紹機器學習方法的應用場景;二三四門都是具體講一類機器學習方法,教學方法相似:首先從理論上理解機器學習演算法,然後進入實際應用部分,學完每章節後可以理解該演算法,大部分可以用python自己編寫
以具體的一章節:回歸課程中的多元回歸為例來講講這門課的授課形式,其餘章節的形式基本相同。
1)介紹模型的應用場景和模型的基本表達形式
TAG:Python | 計算機科學 | 科技 |