嚴格的評選標準,造就了這張分享量過千的在線機器學習課程榜單

本文作者 David Venturi 是技術博客 freeCodeCamp 的知名主筆之一。

一年半前,我退出了加拿大最好的計算機科學專業。之後我通過線上學習資源開始了自己的數據科學碩士學位項目。我意識到能通過 edX、Coursera 和 Udacity 學到所需要的一切,而且能學得更快更高效,開銷也更少。

現在我的學習就快完成了。我已經學習了很多數據科學相關課程,並部分旁聽了很多其他課程。我知道現在有很多機會,也知道成為數據分析師或數據科學家所需的技能。因此我著手創建了一份指南,推薦了數據科學每個學科中的最佳課程。

在這個系列的第一條指南中,我為數據科學初學者們推薦了一些編程課。接著是統計學和概率論課程。然後是數據科學引介,還有數據可視化的學習。

現在到了機器學習環節

為了寫這份指南,我花了十幾個小時確認 2017 年 5 月之前所有上線的機器學習課程,從他們的教學大綱和預覽中提取關鍵信息,收集課程評分。

為了完成這項任務,我求助於開源課程中心(Class Central)的社區論壇,翻閱了它包含成千上萬課程排名和評價的資料庫。

Class Central的主頁

從2011年起,Class Central 的創始人 Dhawal Shah 就開始密切關注線上學習課程,比所有人都要早。Dhawal 本人也曾親自幫助我整理資源清單。

課程挑選標準

每門課程必須滿足以下三個標準:

  • 它必須包括很大一部分機器學習的內容。如果機器學習是第一主題就更理想了。請注意:僅針對深度學習的課程被排除在外了。後面再解釋原因。

  • 按需或每幾個月就開設課程。

  • 它必須是一個互動的在線課程,所以沒有書或者不是僅僅閱讀就可以了。雖然學習的方式有很多種,但這份指南關注的是課程。那些僅僅有視頻(即沒有問答題,課後作業等內容)的課程也被排除了。

我們相信已經收集了所有滿足以上條件且值得注意的課程。因為 Udemy 上差不多有幾百個課程,我們選擇只考慮那些觀看最多和評分最高的課程。

當然本文很可能也有遺漏。所以如果你發現了一門好課程,請在評論區留言。

課程評分標準

我們根據以下三個因素對課程大綱做出了主觀判定:

  • 對機器學習工作流的解釋。此課程是否概述了運行一次成功的機器學習程序的必須步驟?下一部分解釋了一個典型工作流所包含的內容。

  • 涵蓋機器學習技術和演算法。課程是否涵蓋了很多種技術(如回歸,分類,聚類等)和演算法(如分類中的:樸素貝葉斯,決策樹,支持向量機等),或是只有少數幾個?我們更傾向於涵蓋更多而又不會省略太多細節的課程。

  • 常見的數據科學和機器學習工具的使用。課程是否教授了主流編程語言的使用,如Python, R語言,或 Scala ?還有這些語言中的主流庫?這些內容並不是必要的,但卻有幫助,因此這樣的課程會得到略微的青睞。

什麼是機器學習?工作流又是什麼?

Arthur Samuel 1959 年的定義被公認為最早的:機器學習是計算機科學的分支領域,它能使「電腦無需明確的編程就能獲得學習能力。」在實踐中,這意味著開發能根據數據作出預測的計算機程序。正如人類能從經驗中學習一樣,計算機也可以,對它們來說數據就等同於經驗。

機器學習工作流是指執行一個機器學習程序所需的流程。雖說每個程序都有區別,大多數工作流都包括一些共同的任務:問題評估,數據探索,數據處理,模型訓練/測試/部署,等等。下面的圖例展示了這些步驟的可視化解釋:

理想的課程介紹了整個過程,並提通過交互性實例,任務或問答讓學生親自去實踐每一項任務。

這些課程涵蓋了深度學習嗎?

首先,讓我們定義一下深度學習。這裡有一個簡明的描述:

深度學習是機器學習的一個分支,其核心是一種受人腦結構和功能啟發的演算法,叫做人工神經網路。—— Jason Brownlee,來自 Machine Learning Mastery

可以想見,某些機器學習課程包含了深度學習的部分。然而我選擇剔除那些僅有深度學習的課程。如果你對深度學習特別感興趣,我們推薦你看考以下的文章:

  • 12個免費在線課程讓你深入深度學習(goo.gl/4SIA2b)

這個清單中,我們最推薦的三個課程如下:

  • 用TensotFlow 進行深度學習的創意應用(Creative Applications of Deep Learning with TensorFlow),授課:Kadenze。地址:goo.gl/RphGWV

  • 機器學習神經網路(Neural Networks for Machine Learning),由多倫多大學的 Geoffrey Hinton 授課,發佈於 Coursera。地址:goo.gl/ij93jR

  • 深度學習 AZ:動手實踐人工神經網路(Deep Learning A-Z: Hands-On Artificial Neural Networks),由 Kirill Eremenko, Hadelin de Ponteves ,以及 SuperDataScience 團隊授課,發佈於Udemy。地址:goo.gl/TEzK6h

建議預備知識

下面列出了幾門課程要求學生有編程、微積分、線性代數和統計學背景。這些預備知識要求是合理的,因為機器學習是一門高級學科。

缺乏某些必須技能?不用擔心!我們在這篇數據科學職業指南的前兩篇文章(編程goo.gl/rjXJZs,統計學goo.gl/KoYPc2)或許能幫助你掌握一些背景知識。幾門高評分的課程同樣提供了概略性的微積分和線性代數補習課,並為不太熟悉的學生突出了與機器學習最相關的部分。

最佳機器學習課程

  • 機器學習(Machine Learning),Coursera,斯坦福大學。地址:goo.gl/ZBMsNx

斯坦福大學在Coursera上的機器學習課程位列榜首,這是綜合了評分,評價和教學大綱契合度以後的結果。由吳恩達授課,他是谷歌大腦創始人和前百度首席科學家。這門課程也激發了 Coursera 的創立。有著 422 條評論,它得到了 4.7 星的加權平均得分。

該課程於 2011 年上線,涵蓋了機器學習工作流的所有方面。雖然授課範圍比原始的斯坦福課程要窄一些,但仍舊包含了很多的技術和演算法。預估的學習時間為 11 周,有兩周時間專攻神經網路和深度學習上。有免費和付費兩種途徑。

吳恩達是一位有活力十足又溫和的導師,有著豐富的經驗。他鼓勵學習者的信心,尤其是在對常見的陷阱提出實踐性實施建議時。這門課程並沒有涉及太多深入的數學問題,不論有沒有技術背景,觀看者都能享受到學習的過程。同時也有線性代數補習課,吳恩達還重點強調了微積分里與機器學習最相關的知識。

經過一次次的課後選擇思考題和項目作業,學生會自然而然的取得進步。這些作業(這門課里有 8 個)可以在 MATLAB 或 Octave 上完成,後者其實是 MATLAB 的開源版。對於課程選用的語言,吳恩達這樣解釋道:

過去,我試圖用很多不同的編程語言去教授機器學習課程,包括 C++, Java, Python, NumPy, 以及 Octave 等。經過將近十年的機器學習教學,我發現如果用 Octave 作為編程環境你會學起來會快很多。

雖然在 2017 年, Python 和 R 語言是更具吸引力的選擇,因為這兩門語言越來越流行,但評論者們認為這並不能阻止你學習這門課程。

幾個有名的評論者認為:

憑藉其在 MOOC 領域經久不衰的名聲,斯坦福的機器學習課程真的是對這個主題最權威的介紹。這門課程廣泛的所有涵蓋了機器學習的重要領域。...吳恩達教授用一個調動積極性的討論和實例引出每一個章節。

他是一位極具天賦的教師,能用非常直觀和清楚的方式解釋複雜問題,包括所有概念背後的數學原理。非常推薦。

我認為這門課程的唯一問題在於它給其他課程劃定了過高的標準。

一門天才教授講授的新常青藤大學課程

  • 機器學習(Machine Learning,edX,哥倫比亞大學)。地址:goo.gl/lzIYRu

哥倫比亞大學的機器學習課程相對較新,同時也是他們在 edX 上的 MicroMasters 學位的一部分。雖然上線時間短,還沒有很多評價,但它現有的評價都異常高。John Paisley 教授被稱作是極具天賦,清晰和聰明的。在 10 條評價中有著 4.8 星的加權平均得分。

這門課程也涵蓋了機器學習工作流的所有方面,而且比上面的斯坦福課程介紹的演算法更多。哥倫比亞的這門是更高階的課程,評論者們認為具備了推薦的先修知識(微積分、線性代數、統計學、概率論和編程)就不會感到吃力。

課程通過練習題,項目作業和一個最終考試的模式幫助學生取得進步。學生能使用 Python、Octave 或 MATLAB 完成任務。課程的總計預估時間是 12 周,每周 8 到 10 個小時。課程免費,也提供認證證書的購買。

下面是一些之前提到的精彩評論:

在我多年的學生生涯中,我遇到過沒有天賦的教授,有天賦但不知道如何清楚講授知識的教授,以及又有天賦又能把知識講清楚的教授。Paisley 博士就是我說的第三種。這是一門非常棒的課程。

導師的語言非常明確,對我來說這是此課程最棒的地方之一。講授課程的質量很高,課件也很棒。

Paisley 博士和他的導師就是…….邁克爾·喬丹的學生,是機器學習之父。(Paisley 博士)是哥倫比亞大學最棒的機器學習教授,因為他能把東西講的非常清晰。這個學期多大 240 個學生選擇了這門課程,是哥倫比亞大學裡教授機器學習的老師中最多的。

來自行業專家的 Python 和 R 語言實踐課程

  • 機器學習 AZ(Machine Learning A-Z):動手實踐 Python 和 R 語言數據科學(由 Kirill Eremenko, Hadelin de Ponteves 和 SuperDataScience 團隊教授,發佈於 Udemy 平台)。地址:goo.gl/dCu4lJ

Udemy平台的機器學習 AZ 是一門讓人印象深刻的精美課程,它提供了 Python 和 R 的教學,這是罕見的。課程有 4.5 星加權平均評級,超過 3,071 人評論,也是評論最多的課程。

40.5 小時的點播視頻涵蓋了整個機器學習工作流以及一些幾乎荒謬好笑的演算法(以一種很好的方式)。該課程的教授方式更加應用化,和上述兩門課程相比,數學理論要少些。每部分都是從 Eremenko 主持的「直覺」視頻開始,這個視頻總結了講授概念的基本理論。接下來, de Ponteves 分別在 Python 和 R 視頻中講述實現。作為『彩蛋』,課程包含了供學生下載和在項目使用的 Python 和 R 代碼模板。有小測驗和家庭作業,雖然這些不是這門課程的長處。

Eremenko 和 SuperDataScience 團隊因『使複雜簡單化』的能力備受尊崇。此外,課程所需預備知識『僅僅是一些高中數學』,所以,對於斯坦福大學和哥倫比亞大學課程感到吃力的人來說,這個課程可能是一個更好的選擇。

一些突出的點評:

該課程製作專業,音質優良,解釋清晰簡明...對得起你投入的金錢和時間)。

這很驚人,能同時用兩種不同編程語言上這門課。

Kirill 絕對是 Udemy 平台最好的講師之一(如果不是在網路平台上),我推薦你上他的任何課程。這個課程信息量太大了!

競爭排名

我們的NO.1 課程,在5星評級系統里,加權平均評級為4.7星,超過422條評論。我們看看另一個替代選擇,按降級排序。注意,本指南中不包含深入學習課程 - 您可以在這裡(medium.freecodecamp.com)找到這些課程。

  • The Analytics Edge (MIT /edX)。地址:goo.gl/97TwZc

總的說來,這門課更專註分析技術,儘管也涵蓋了幾個機器學習主題。充分利用真實世界的熟悉例子來講述 R。這很有挑戰性。每周十到十五小時,十二周以上。提供可購買的認證證書。214條評論,加權平均評級為4.9星。

  • Python數據科學與機器學習訓練營(Jose Portilla / Udemy)。地址:goo.gl/q4XBUz

有大量機器學習內容,涵蓋了整個數據科學過程。有更多關於 Python 的詳細介紹。這門課程很吸引人,雖然不是很符合我們這份指南的評選標準。 21.5 小時點播視頻,花費取決於 Udemy 的折扣力度;Udemy 折扣很頻繁。3316 條評論,4.6 星評級。

  • 數據科學與帶有R的機器學習訓練營(Data Science and Machine Learning Bootcamp with R,Jose Portilla/Udemy)。地址:goo.gl/W9upNt

對於上述 Portilla 的評論也適用於此,除了 R. 17.5 小時點播視頻。花費取決於 Udemy 的折扣力度;Udemy 折扣很頻繁。1317 評論,4.6 星。

  • 機器學習系列(Machine Learning Series,Lazy Programmer Inc./Udemy)。地址:goo.gl/aOIOY0

Lazy Programmer由數據科學家/大數據工程師/全棧軟體工程師教授,他們履歷傲人,目前在Udemy,Lazy Programmer有一系列以機器學習為重點的16門課程。總共有5000多個課程,所有的課程幾乎都有4.6星。每門課程介紹中,都有一個課程訂購,很實用。用的是 Python。花費取決於Udemy的折扣力度;

  • 機器學習(Machine Learning,Georgia Tech/Udacity)。地址:goo.gl/qq1A7E

彙編了三門單獨的課程:監督,無監督和強化學習。一部分是Udacity的機器學習工程師 Nanodegree 和 Georgia Tech 在線碩士學位(OMS)的內容。視頻很小,是 Udacity 的風格(友好的教授、免費、有 4.56 星加權平均評級/9 條評論)。

  • 在 Azure HDInsight 中實現 Spark 的預測分析(Implementing Predictive Analytics with Spark in Azure HDInsight,Microsoft / edX)。地址:goo.gl/3csq6m

介紹機器學習的核心概念和各種演算法。利用幾個大型數據友好的工具,包括 Apache Spark、Scala 和 Hadoop。使用 Python 和 R,每周需要四小時,六周以上。免費提供可購買的認證證書。它有 4.5 個星級加權平均評分/6 條評論。

  • 數據科學與用 Python 進行機器學習—親自動手!(Data Science and Machine Learning with Python — Hands On!)。地址:goo.gl/TS9sWa

使用 Python。Kane 在亞馬遜和 IMDb 有九年經驗。九個小時的點播視頻。花費取決於 Udemy 的折扣力度;Udemy 折扣很頻繁。它有 4.5 星加權平均評級/4139 條評論。

  • Scala和Spark的大數據和機器學習(Scala and Spark for Big Data and Machine Learning ,Jose Portilla / Udemy)。地址:goo.gl/B5X0x1

關注『大數據』,特別是在 Scala 和 Spark 中的實現。十個小時的點播視頻。花費取決於 Udemy 的折扣力度;Udemy 折扣很頻繁。它有 4.5 星級加權平均評級/607 條評論。

  • 機器學習工程師的納米學位(Machine Learning Engineer Nanodegree ,Udacity)。地址:goo.gl/y16eIl

Udacity 的旗艦機器學習計劃,有一流的項目審查系統和職業幫助。該計劃彙編了一些免費的單個 Udacity 課程,由 Kaggle 共同創建。時間表估計有六個月。目前每月需花費 $ 199美元,在 12 個月內畢業的學生可享受 50% 的學費退款。它有 4.5 星級加權平均評級/2 條評論。

  • 數據學習(入門機器學習)Learning From Data (Introductory Machine Learning) ,California Institute of Technology/edX)。地址:goo.gl/i7zLER

目前,EDX的註冊已關閉,但課程可通過CalTech獨立平台獲得(見下文)。它有4.49星加權平均評級/42條評論。

  • 從數據學習(介紹機器學習)(Learning From Data (Introductory Machine Learning) ,Yaser Abu-Mostafa / California Institute of Technology) 。地址:goo.gl/Yh3Fc1

『一個真正的加州理工學院課程,而不是注水版本』。評論表明,它很適合理解機器學習理論。Yaser Abu-Mostafa 教授在學生中很受歡迎,撰寫了本課程依據的教科書。講座的錄播視頻上傳到 YouTube(附帶講座的幻燈片)。安排的家庭作業在 PDF 文件里。課程體驗不如排在前三名課程。它有 4.43 星加權平均評級/7條評論。

  • 挖掘大量數據集(Mining Massive Datasets ,Stanford University)。地址:goo.gl/FrWqWq

機器學習的重點是『大數據』。介紹了現代分散式文件系統和 MapReduce。每周需十小時,七周以上。免費。它有4.4星加權平均評級/30個評論。

  • AWS 機器學習:使用 Python 的完整指南 (AWS Machine Learning: A Complete Guide With Python ,Chandra Lingam / Udemy)。地址:goo.gl/LxsPOh

專註基於雲的機器學習,特別是 Amazon Web Services 。用 Python,九個小時的點播視頻。花費取決於 Udemy 的折扣力度;Udemy 折扣很頻繁。它有4.4星級加權平均評級/62條評論。

  • Python 機器學習和面部檢測入門(Introduction to Machine Learning & Face Detection in Python ,Holczer Balazs/Udemy)。地址:goo.gl/cGjHb1

使用 Python,八小時點播視頻。花費取決於 Udemy 的折扣力度;Udemy 折扣很頻繁。它有 4.4 星級的加權平均評級/162 條評論。

  • 統計學習:統計學習(StatLearning: Statistical Learning,Stanford University)。地址:goo.gl/gNcT3Q

基於優秀的教科書,『統計學習導論,R 語言版』( An Introduction to Statistical Learning, with Applications in R),這本書的作者親自教學。評論者表示,MOOC不如課本,比如練習不足、視頻一般。每周需要五小時,九周以上。免費。它有 4.35 星加權平均評級/84 條評論。

  • 機器學習專業化(Machine Learning Specialization ,University of Washington/Coursera)。地址:goo.gl/ADXbG0

偉大的課程,但最後兩個課程(包括頂點課程)被取消。評論者注意到,與其他頂級機器學習課程(例如斯坦福大學或加州理工學院)相比,該系列更易於消化(閱讀:沒有過硬技術背景的人更容易理解)。請注意,該系列並不完整,木有推薦系統、深度學習和總結部分。可免費/付費學習。它有 4.31 星加權平均評級/80 條評論。

  • From 0 to 1: Machine Learning, NLP & Python-Cut to the Chase ,Loony Corn / Udemy)。地址:goo.gl/PFJrao

『腳踏實地,害羞但自信地呈現了機器學習技術』。由一個具有數十年行業經驗的四人團隊教授。用Python,花費取決於Udemy的折扣力度;Udemy折扣很頻繁。它有4.2星加權平均評級/494條評論。

  • 機器學習原理(Principles of Machine Learning ,Microsoft / edX)。地址:goo.gl/CD1yWt

使用 R,Python 以及 Microsoft Azure 機器學習;該課程是微軟數據科學專業課程計劃的一部分。每周需要三至四小時,六周以上。可購買認證證書。它有4.09星加權平均評級/11評論。

  • 大數據:統計推理和機器學習(Big Data: Statistical Inference and Machine Learning ,Queensland University of Technology/FutureLearn)。地址:goo.gl/kjCs1I

一個很棒,簡短的機器學習探索課程,重點是大數據。涵蓋了一些工具,如 R、H2O Flow和 WEKA。只需三周,但一個點評指出,每周六小時更合適。可免費/付費學習。它有 4 星加權平均評級/4 條評論。

  • 基因組數據科學與聚類(Genomic Data Science and Clustering ,加州大學聖地亞哥分校/ Coursera)。地址:goo.gl/NveZKJ

為計算機科學與生物學交叉領域感興趣的人開設的課程,展示了這一交叉領域如何成為現代科學的重要前沿。關注聚類和降維。該課程是 UCSD 的生物信息學專業的一部分。可免費/付費學習。它有4星加權平均評級,超過3評論。

  • 機器學習簡介(Intro to Machine Learning,Udacity)。地址:goo.gl/sb58Ps

主題寬度和實踐工具(Python)優先深度和理論。Sebastian Thrun 和 Katie Malone 導師讓課程很有趣。包括短視頻和測驗,之後是每節課都有一個小項目。目前是Udacity數據分析師納米學位的一部分。需要大約十周時間。免費。它有3.95星加權平均評級/19評論。

  • 用於數據分析的機器學習(Machine Learning for Data Analysis,衛斯理大學/Coursera)。地址:goo.gl/eGKpHW

簡單介紹了機器學習和幾種精選演算法。包括決策樹、隨機森林、套索回歸、k-均值聚類。衛斯理大學的數據分析與解釋(Data Analysis and Interpretation)專項課程的一部分。預計 4 周的學習時間。有免費和付費的項目。平均分 3.6 星 / 5 個評論。

  • 用 Python 實現數據科學編程(Programming with Python for Data Science,Microsoft/edX)。地址:goo.gl/Ubm97Z

由微軟及其合作夥伴 Coding Dojo 共同製作。使用 Python 編程。每周 8 小時,總計 6 周。有免費和付費的項目。平均分 3.46 星 / 37 個評論。

  • 交易中的機器學習(Machine Learning for Trading,喬治亞理工學院/Udacity)。地址:goo.gl/bfVG9i

專註於將概率機器學習方法應用於交易決策。使用 Python 編程。Udacity 的微學位(Machine Learning Engineer Nanodegree)和喬治亞理工學院的在線碩士學位(Online Master』s Degree/OMS)所需修讀課程的一部分。預計 4 個月的學習時間。免費。平均分 3.29 星 / 14 個評論。

  • 實用機器學習(Practical Machine Learning,約翰霍普金斯大學/Coursera)。地址:goo.gl/s0Gm3k

一些機器學習演算法方面簡短而實用的介紹。幾個 1、2 星的評分表達了種種擔憂。JHU 的數據科學(Data Science)專項課程的一部分。每周 4-9小時,總計 4 周。有免費和付費的項目。平均分 3.11 星 / 37 個評論。

  • 用於數據科學與分析的機器學習(achine Learning for Data Science and Analytics,哥倫比亞大學/edX)。地址:goo.gl/DTfFjn

介紹了各種機器學習專題。一些非常負面的評分集中在內容選擇、缺少編程作業、呈現形式平淡這幾個方面。每周 7-10 小時,總計 5 周。有免費和付費的項目。平均分 2.74 星 / 36 個評論。

  • 推薦系統專項課程(Recommender Systems Specialization,明尼蘇達大學/Coursera)。地址:goo.gl/FLRWKe

強烈關注於機器學習的一個特定類型——推薦系統。包含 4 門課的專項課程以及一個頂點項目(是個案例研究)。使用 Lenskit(推薦系統的一個開源工具包)教學。有免費和付費的項目。平均分 2 星 / 2 個評論。

  • 大數據機器學習(Machine Learning With Big Data,加利福尼亞大學聖地亞哥分校/Coursera)。地址:goo.gl/1GmpcW

評論認為其教學與評估做得非常糟糕。一些學生髮現自己只花了幾個小時就完成了整個課程。UCSD 的大數據(Big Data)專項課程的一部分。有免費和付費的項目。平均分 1.86 星 / 14 個評論。

  • 實用預測分析:模型與方法,華盛頓大學/ Coursera)。地址:goo.gl/PvM1gP

機器學習核心概念的簡介。一位評論者指出,該課程缺乏測驗且作業沒有挑戰性。UW 的大規模數據科學(Data Science at Scale)專項課程的一部分。每周 6 至 8 小時,總計4 周。有免費和付費的項目。平均分 1.75 星 / 4 個評論。

下列課程評論較少(截至 2017 年 5 月)

  • 適於音樂家和藝術家的機器學習(Machine Learning for Musicians and Artists,倫敦大學金史密斯學院/Kadenze)。地址:goo.gl/EII6Kb

獨一無二的課程。學生學習演算法、軟體工具和機器學習,這些內容是將身體語言、音樂音頻等實時數據賦予意義的最佳實踐。 7 節課。Audit 免費,Premium 每月 10 美元。有一個 5 星評分。

  • 用 Python 編寫應用型機器學習(Applied Machine Learning in Python,密歇根大學/Coursera)。地址:goo.gl/9kAlVx

教學生使用 Python 和 scikit 來學習工具包。使用 Python 編寫應用型數據科學(Applied Data Science with Python)專項課程的一部分。課程將於 2017.5.29 開始。有免費和付費的項目。

  • 應用型機器學習(Applied Machine Learning,Microsoft/edX)。地址:goo.gl/7Xr0EJ

教學生使用各種工具,包括 Python、R 和微軟的 Azure 機器學習(註:微軟為該課程的製作方)。還有實操實驗室對課程內容進行強化。每周 3-4 小時,總計6 周。免費,可付費購買結業證書。

  • 用於數據科學的機器學習(Machine Learning for Data Science,加利福尼亞大學聖地亞哥分校/edX)。地址:goo.gl/90oMKi

2018.1 才可註冊該課程。編程實例和作業是用 Python 變編寫的,使用 Jupyter筆記本。每周 8 小時,總計 10 周。免費,可付費購買結業證書。

  • 分析建模導論(Introduction to Analytics Modeling,喬治亞理工學院/edX)。地址:goo.gl/BVuwCU

主要編程工具為 R 語言。每周 5-10 小時,總計 10 周。免費,可付費購買結業證書。

  • 預測分析:從大數據中獲得洞見(Predictive Analytics: Gaining Insights from Big Data,昆士蘭科技大學/FutureLearn)。地址:goo.gl/9SCrLH

幾種演算法的簡介。使用惠普的垂直分析平台(Vertica Analytics platform)作為應用工具。課程開始日期待定。每周 2 小時,總計 4 周。免費,可付費購買結業證書。

  • 機器學習介紹(Introducción al Machine Learning,西班牙電信大學/Miríada X)。地址:goo.gl/rI8Nav

西班牙語教學。介紹了機器學習中的監督和無監督學習。總計 4 周,合約 20 小時。

  • 機器學習路徑步驟(Machine Learning Path Step ,Dataquest)。地址:goo.gl/sGWlmy

使用 Python 和 Dataquest 的互動式瀏覽器內置平台進行教學。多個引導項目及一個「額外」項目——你可以使用自己的數據來建立自己的機器學習系統。需要訂閱。

以下六個課程由 DataCamp 提供。DataCamp 充分利用了視頻和文本素材進行混合式教學,使用瀏覽器內置的編碼器並結合了大量實例。訂閱方可訪問每門課程。

  • 機器學習導論(Introduction to Machine Learning,DataCamp)

涵蓋了分類、回歸和聚類演算法。使用 R 語言。15 個視頻和 81 個練習,預計學習時間為 6 小時。

  • 使用 scikit-learn 進行監督學習(Supervised Learning with scikit-learn,DataCamp)

使用 Python 和 scikit-learn。涵蓋分類和回歸演算法。17 個視頻和 54 個練習,預計學習時間為 4 小時。

  • 用 R 語言進行無監督學習(Unsupervised Learning in R,DataCamp)

提供了有關聚類和降維的一個基本介紹,R 語言。16 個視頻和 49 個練習,預計學習時間為 4 小時。

  • 機器學習工具包(Machine Learning Toolbox,DataCamp)

教授機器學習中的「大膽想法」。使用 R 語言。 24 個視頻和 88 個練習,預計學習時間為 4 小時。

  • 與專家一起進行機器學習:學校預算(Machine Learning with the Experts: School Budgets,DataCamp)

來自 DrivenData 上一個機器學習競賽的案例研究。內容涉及建立一個模型來自動分類學校預算項目。需要先修 DataCamp 的『使用 scikit-learn 進行監督學習(Supervised Learning with scikit-learn)』課程。15 個視頻和 51 個練習,預計學習時間為 4 小時。

  • 用 Python 進行無監督學習(Unsupervised Learning in Python,DataCamp)

涵蓋了各種無監督學習演算法(Python)、scikit-learn 和 sciPy。課程最後需要學生建立一個推薦系統來推薦流行音樂藝術家。13 個視頻和 52 個練習,預計學習時間為 4 小時。

  • 機器學習(Machine Learning,Tom Mitchell/卡內基梅隆大學 CMU)。地址:goo.gl/mQd616

卡內基梅隆大學的研究生入門機器學習課程。是其第二個研究生水平課程「統計機器學習(Statistical Machine Learning)」的先修課程。課程內容結合了實際問題、家庭作業和一個在線提交的期中考試(均附答案)。該課程還有一個 2011 年的版本。CMU 是研究機器學習最好的研究生院校之一,並有一整棟大樓用來研究機器學習。免費。

  • 統計學機器學習(Statistical Machine Learning)(Larry Wasserman/卡內基梅隆大學 CMU)。地址:goo.gl/ibl9bH

可能是本指南中最高級的課程。卡耐基梅隆大學機器學習課程的後續課程。課程內容結合了實際問題、家庭作業和一個在線提交的期中考試(均附答案)。免費。

CMU是研究機器學習最好的研究生院校之一。機器學習和統計學機器學習已經上線。免費。

  • 本科機器學習(Undergraduate Machine Learning,Nando de Freitas/不列顛哥倫比亞大學)。地址:goo.gl/lPkpBz

一門本科版的機器學習課程。YouTube 上有該課程的視頻,其課程網站上有相關的幻燈片和課程作業(不過沒有答案)。de Freitas 現在是牛津大學的全職教授,各大論壇都讚揚了他的教學能力。研究生版見下文。

  • 機器學習(Machine Learning,Nando de Freitas/不列顛哥倫比亞大學)。地址:goo.gl/KBKFA1

一門研究生版的機器學習課程。該課程的水準與 de Freitas 的本科版課程(見上文)一致。

小結

此篇是 6 個系列中的第五章,涵蓋了助你邁入數據科學領域的最好的在線課程。我們在第一個系列中提到了編程,第二個系列涉及數據和概率統計,第三個系列涵蓋了數據科學方面的介紹,而第四個系列講了數據可視化。

最後一篇文章是對這些文章的總結,外加涉及其它重點課題——如數據管理(data wrangling)、資料庫,甚至軟體工程——的最好在線課程。

如果你正在尋找一個完整的數據科學在線課程列表,你可以在 Class Central 的數據科學與大數據(Data Science and Big Data)主題頁上找到它們:

Data Science and Big Data | Free Online Courses & MOOCs | Class Central

選自Medium 機器之心編譯


推薦閱讀:

如何在theano中獲取tensor的boolean值?
人工智慧應用到化學領域,可惜老白沒能等到這一天。
技術上講,王樹森和吳佳俊誰更牛逼?
巡洋艦深度學習特訓營
word2vec 相比之前的 Word Embedding 方法好在什麼地方?

TAG:机器学习 | 人工智能 |