有哪些比較好的機器學習,深度學習的網路資源可利用?

研究完畢,已然畢業。對於那些上來就列上百個書單,論文的。謝謝你。因為你們讓我知道了什麼叫做幫倒忙。一路走來還是自己的實踐最重要,不一一點名感謝了,那些話少,但是建議題主去實踐,看官方文檔的,真心謝謝你們,這個很重要。


一、Stanford University(7門)

1. 機器學習(Machine Learning)

Stanford University via Coursera

開課時間:3rd Apr, 2017

地址:Reviews for Machine Learning from Coursera | Class Central

2. 人工智慧導論(Intro to Artificial Intelligence)

Stanford University via Udacity

開課時間:完全自主

地址:Reviews for Intro to Artificial Intelligence from Udacity | Class Central

3. 機器人學的人工智慧(CS 8802, Artificial Intelligence for Robotics: Programming a Robotic Car)

Stanford University via Udacity

開課時間:完全自主

地址:Reviews for CS 8802, Artificial Intelligence for Robotics: Programming a Robotic Car from Udacity | Class Central

4. 機器學習導論(Intro to Machine Learning)

Stanford University via Udacity

開課時間:完全自主

地址:Reviews for Intro to Machine Learning from Udacity | Class Central

5. 機器人學的人工智慧(Artificial Intelligence for Robotics)

Stanford University via Udacity

開課時間:完全自主

地址:Reviews for Artificial Intelligence for Robotics from Udacity | Class Central

6. 概率圖模型1:表示(Probabilistic Graphical Models 1: Representation)

Stanford University via Coursera

開課時間:24th Apr, 2017

地址:Reviews for Probabilistic Graphical Models 1: Representation from Coursera | Class Central

7. 概率圖模型2:推理(Probabilistic Graphical Models 2: Inference)

Stanford University via Coursera

開課時間:10th Apr, 2017

地址:Reviews for Probabilistic Graphical Models 2: Inference from Coursera | Class Central

二、University of California(2門)

1. 大數據導論(Introduction to Big Data)

University of California, San Diego via Coursera

開課時間:3rd Apr, 2017

地址:Reviews for Introduction to Big Data from Coursera | Class Central

2. 大數據機器學習(Machine Learning With Big Data)

University of California, San Diego via Coursera

開課時間:10th Apr, 2017

地址:Reviews for Machine Learning With Big Data from Coursera | Class Central

三、Johns Hopkins University(2門)

1. 收集與清洗數據(Getting and Cleaning Data)

Johns Hopkins University via Coursera

開課時間:3rd Apr, 2017

地址:Reviews for Getting and Cleaning Data from Coursera | Class Central

2. 實踐機器學習(Practical Machine Learning)

Johns Hopkins University via Coursera

開課時間:3rd Apr, 2017

地址:Reviews for Practical Machine Learning from Coursera | Class Central

四、Google(3門)

1. 谷歌雲平台基礎:核心架構(Google Cloud Platform Fundamentals: Core Infrastructure)

Google via Coursera

開課時間:3rd Apr, 2017

地址:Reviews for Google Cloud Platform Fundamentals: Core Infrastructure from Coursera | Class Central

2. 谷歌雲平台大數據與機器學習基礎(Google Cloud Platform Big Data and Machine Learning Fundamentals)

Google Cloud via Coursera

開課時間:3rd Apr, 2017

地址:Reviews for Google Cloud Platform Big Data and Machine Learning Fundamentals from Coursera | Class Central

3. 深度學習(Deep Learning)

Google via Udacity

開課時間:完全自主

地址:Reviews for Deep Learning from Udacity | Class Central

五、Brown University(4門)

1. 機器學習:無監督學習(Machine Learning: Unsupervised Learning)

Brown University via Udacity

開課時間:完全自主

地址:Reviews for Machine Learning: Unsupervised Learning from Udacity | Class Central

2. 機器學習:監督學習(Machine Learning: Supervised Learning)

Brown University via Udacity

開課時間:完全自主

地址:Reviews for Machine Learning 1—Supervised Learning from Udacity | Class Central

3. 強化學習(Reinforcement Learning)

Brown University via Udacity

開課時間:完全自主

地址:Reviews for Reinforcement Learning from Udacity | Class Central

4. 機器學習(Machine Learning)

Brown University via Udacity

開課時間:完全自主

地址:Reviews for Machine Learning from Udacity | Class Central

六、Microsoft(3門)

1. 開發智能Apps 和 Bots(Developing Intelligent Apps and Bots)

Microsoft via edX

開課時間:完全自主

地址:Reviews for Developing Intelligent Apps and Bots from edX | Class Central

2. 機器學習原則(Principles of Machine Learning)

Microsoft via edX

開課時間:完全自主

地址:Reviews for Principles of Machine Learning from edX | Class Central

3. 應用機器學習(Applied Machine Learning)

Microsoft via edX

開課時間:完全自主

地址:Reviews for Applied Machine Learning from edX | Class Central

七、University of Washington(5門)

1. 機器學習基礎:專題研究(Machine Learning Foundations: A Case Study Approach)

University of Washington via Coursera

開課時間:3rd Apr, 2017

地址:Reviews for Machine Learning Foundations: A Case Study Approach from Coursera | Class Central

2. 機器學習:回歸分析(Machine Learning: Regression)

University of Washington via Coursera

開課時間:3rd Apr, 2017

地址:Reviews for Machine Learning: Regression from Coursera | Class Central

3. 機器學習:分類(Machine Learning: Classification)

University of Washington via Coursera

開課時間:3rd Apr, 2017

地址:Reviews for Machine Learning: Classification from Coursera | Class Central

4. 機器學習:聚類檢索(Machine Learning: Clustering Retrieval)

University of Washington via Coursera

開課時間:3rd Apr, 2017

地址:Reviews for Machine Learning: Clustering amp; Retrieval from Coursera | Class Central

5. 計算神經科學(Computational Neuroscience)

University of Washington via Coursera

開課時間:10th Apr, 2017

地址:https://Reviews for Computational Neuroscience from Coursera | Class Central

八、Wesleyan University(1門)

1. 數據分析的機器學習(Machine Learning for Data Analysis)

Wesleyan University via Coursera

開課時間:3rd Apr, 2017

地址:Reviews for Machine Learning for Data Analysis from Coursera | Class Central

九、University of Toronto(1門)

1. 機器學習的神經網路(Neural Networks for Machine Learning)

University of Toronto via Coursera

開課時間:17th Apr, 2017

地址:Reviews for Neural Networks for Machine Learning from Coursera | Class Central

十、University of Michigan(1門)

1. Python機器學習應用(Applied Machine Learning in Python)

University of Michigan via Coursera

開課時間:24th Apr, 2017

地址:Reviews for Applied Machine Learning in Python from Coursera | Class Central

十一、Georgia Institute of Technology(4門)

1. 基於知識的AI:認知系統(Knowledge-Based AI: Cognitive Systems)

Georgia Institute of Technology via Udacity

開課時間:完全自主

地址:Reviews for Knowledge-Based AI: Cognitive Systems from Udacity | Class Central

2. 計算機視覺導論(Introduction to Computer Vision)

Georgia Institute of Technology via Udacity

開課時間:完全自主

地址:Reviews for Introduction to Computer Vision from Udacity | Class Central

3. 高性能計算(High Performance Computing)

Georgia Institute of Technology via Udacity

開課時間:完全自主

地址:Reviews for High Performance Computing from Udacity | Class Central

4. 貿易上的機器學習(Machine Learning for Trading)

Georgia Institute of Technology via Udacity

開課時間:完全自主

地址:https://Reviews for Machine Learning for Trading from Udacity | Class Central

十二、Columbia University(1門)

1. 數據科學與分析的機器學習(Machine Learning for Data Science and Analytics)

Columbia University via edX

開課時間:完全自主

地址:Reviews for Machine Learning for Data Science and Analytics from edX | Class Central

十三、fast.ai(1門)

1. 編程實踐深度學習:第一部分(Practical Deep Learning For Coders, Part 1)

fast.ai via Independent)

開課時間:完全自主

地址:Reviews for Practical Deep Learning For Coders, Part 1 from fast.ai | Class Central

十四、Massachusetts Institute of Technology(2門)

1. 深度學習導論(6.S191: Introduction to Deep Learning)

Massachusetts Institute of Technology via Independent

開課時間:完全自主

地址:Reviews for 6.S191: Introduction to Deep Learning from Massachusetts Institute of Technology | Class Central

2. 深度學習:無人駕駛(6.S094: Deep Learning for Self-Driving Cars)

Massachusetts Institute of Technology via Independent

開課時間:完全自主

地址:Reviews for 6.S094: Deep Learning for Self-Driving Cars from Massachusetts Institute of Technology | Class Central

十五、University of Oxford(1門)

1. 深度學習:自然語言處理(Deep Learning for Natural Language Processing)

University of Oxford via Independent

開課時間:完全自主

地址:Reviews for Deep Learning for Natural Language Processing from University of Oxford | Class Central


機器學習是計算機科學的一個子領域,在人工智慧領域,機器學習逐漸發展成模式識別和計算科學理論的研究。從2016年起,機器學習到達了不合理的火熱巔峰。但是,有效的機器學習是困難的,因為機器學習本身就是一個交叉學科,沒有科學的方法及一定的積累很難入門。

本文通過系統的分析上百篇翻譯博客,製成了機器學習必備手冊,本手冊一定會幫助你走向你自己的「人生巔峰」。手冊包含如何入門機器學習,機器學習流行演算法,機器學習實戰等等。

一.機器學習入門篇:

1.讓你少走彎路:這有一份開展機器學習的簡短指南

摘要:本文分享了一份簡單的關於開展機器學習的心得體會,目的是給初學者提供基本的指導,主要講解了建立系統、選擇合適的評價指標、數據處理、系統優化等內容,幫助初學者少走一些彎路。

2. 機器學習的入門「秘籍」

摘要:機器學習已經成為當下最火熱的技術之一,對於初學者來說,如何快速入門機器學習是至關重要的。本文屬於入門級寶典,高手請繞道!

3. 會玩超級瑪麗,機器學習能有多難?

摘要:小白也能看懂機器學習?這篇文章用超級瑪麗的原理教會你,到底什麼是機器學習,讓尖端科技不再艱深難懂。

4. 機器學習能為你的業務做什麼?有些事情你肯定猜不到!(機器學習入門第一篇)

摘要:機器學習是一項令人難以置信的技術,你需要了解很多很多的基礎知識,以使得業務功能儘可能的不受複雜演算法的影響,讓你能夠提出正確的問題、了解機器學習模型開發過程、成立一個團隊以促進學科間的不斷合作,而不是把數據科學視為一個產生奇蹟的黑匣子。

5. 關於機器學習演算法 你需要了解的東西(機器學習入門第二篇)

摘要:對學習演算法進行分類是基於構建模型時所需的數據:數據是否需要包括輸入和輸出或僅僅是輸入,需要多少個數據點以及何時收集數據。根據上述分類原則,可以分為4個主要的類別:監督學習、無監督學習、半監督學習和強化學習。

6. 如何開發機器學習模型?(機器學習入門第三篇)

摘要:創建一個優秀的機器學習模型跟創建其他產品是一樣的:首先從構思開始,把要解決的問題和一些潛在的解決方案放在一起考慮。一旦有了明確的方向,就可以對解決方案進行原型化,然後對它進行測試以確定是否滿足需求,不妨看看本文是如何一步一步實現的。

7.如何高效運作機器學習團隊(機器學習入門第四篇)

摘要: 一個「傳統」的產品團隊由設計師、工程師和產品經理組成,而數據分析師有時也會包含在其中,但大多數情況下是多個團隊共享這個稀缺資源。在機器學習團隊中又會有哪些角色和組織結構呢,本文為你揭曉。

8.機器學習會產生哪些用戶體驗問題?(機器學習入門第五篇)

摘要:許多機器學習演算法都是黑匣子:輸入大量的數據,然後獲得一個以某種神秘方式工作的模型。這使得很難向用戶解釋機器學習的結果。在許多演算法中,還存在著交互效應,這使得模型更加難以解釋了。你可以把這個看成是特徵之間的複合效應,特徵之間以多種奇怪而又複雜並且不為人類所理解的方式結合在一起,整體效應大於各個部分效應。

9. 簡單自學機器學習理論——引言 (Part I)

摘要:本篇文章是"機器學習理論"三部曲中的第一部分,主要介紹學習機器學習的動機及基本理論知識,詳細介紹機器學習所學習的問題、泛化誤差以及學習問題是否可解的公式化表示,為初步研究機器學習的人員介紹了機器學習的基本處理過程。

10. 簡單自學機器學習理論—— 泛化界限 (Part II )

摘要:本篇文章是"機器學習理論"三部曲中的第二部分,主要介紹獨立同分布、大數法則及hoeffding不等式等基本數學知識,詳細推導了泛化界限及其分解。

11. 簡單自學機器學習理論——正則化和偏置方差的權衡 (Part III )

摘要:本篇文章是"機器學習理論"三部曲中的第三部分,主要介紹方差分解以及目標函數的正則化,通過模擬可以看到,引入正則化項限定了學習問題的解決方案範圍。

12. 入門級攻略:機器學習 VS. 深度學習

摘要:本文以淺顯易懂的語言介紹了機器學習和深度學習的定義及應用,以及在源數據要求,硬體支持,特徵工程、問題解決方式、執行時間及可解釋性等方面的區別,對於新手入門有很大啟示意義。

13. 增強學習小白?本文帶你入門了解增強學習

摘要:入門一件新事物總是會有些無從下手的,看了本文希望可以給大家一些幫助和了解。

14.這10本由淺入深的好書,或讓你成為機器學習領域的專家

摘要:機器學習是個跨領域的學科,而且在實際應用中有巨大作用,但是沒有一本書能讓你成為機器學習的專家。在這篇文章中,我挑選了10本書,這些書有不同的風格,主題也不盡相同,出版時間也不一樣。因此,無論你是新手還是領域專家,定能找到適合你的。

15.想知道機器學習掌握的怎麼樣了嗎?這有一份自測題(附答案和解析)

摘要:人類對於自動化和智能化的追求一直推動著技術的進步,而機器學習這類型的技術對各個領域都起到了巨大的作用。隨著時間的推移我們將看到機器學習無處不在從移動個人助理到電子商務網站的推薦系統。即使作為一個外行你也不能忽視機器學習對你生活的影響。本次測試時面向對機器學習有一定了解的人。

16. 送機器學習電子書——(TensorFlow)RNN入門

摘要:本文作者正在寫自己的新書Machine Learning with TensorFlow,這篇博文只是他新書的一小部分,作者用簡單的語言介紹了RNN,不用一個小例子介紹了如何使用Tensorflow中內置的RNN模型進行預測。

17. 適合入門的8個趣味機器學習項目

摘要:還在為找不到機器學習入門練手項目而感到無奈嗎?本指南中,將給大家帶來8個適合初學者學習的有趣的機器學習項目,簡單易學,相信會增添大家學習機器學習的信心。

18. 機器學習快速入門:你必須知道的三大演算法

摘要:每天霸佔新聞頭條的「機器學習」,想入門,先看懂這三大演算法。

二.機器學習演算法篇:

1.快速選擇合適的機器學習演算法

摘要:機器學習初學者可以通過本文了解如何快速找到合適的機器學習演算法。

2.多重角度解讀:貝葉斯推理是怎麼工作的

摘要:本文首先介紹了貝葉斯的起源,並利用簡單的例子生動形象地講解了貝葉斯定理是如何工作的,解釋了其基本原理以及公式的物理含義。

3.簡單通俗易懂:一個小例子完美解釋Naive Bayes(樸素貝葉斯)分類器

摘要:Naive Bayes分類器的解釋有很多,但是基於一個小例子來解釋的不多,本文就是基於一個簡單通俗易懂的小例子來解釋Naive Bayes分類器。

4.「學」、「習」二合一:監督學習——支持向量機(SVM)入門

摘要:SVM是機器學習中有監督學習的一種,通常用來進行模式識別、分類、以及回歸分析。本文用一個小例子簡介SVM,言簡意賅,通俗易懂。

5.機器學習利器——決策樹和隨機森林

摘要: 機器學習是當下最火的領域,本文通過一個小例子介紹了其核心演算法:決策樹和隨機森林。

6.基於圖的機器演算法 (一)

摘要:基於圖的機器演算法學習是一個強大的工具。結合運用模塊特性,能夠在集合檢測中發揮更大作用。

7.基於圖的機器演算法 (二)

摘要:基於圖的機器演算法學習是一個強大的工具。結合運用模塊特性,能夠在集合檢測中發揮更大作用。本文是基於圖的機器演算法系列文的第二篇。

8.簡單易學!一步步帶你理解機器學習演算法——馬爾可夫鏈蒙特卡羅(MCMC)

摘要:對於簡單的分布,很多的編程語言都能實現。但對於複雜的分布,是不容易直接抽樣的。馬爾可夫鏈蒙特卡羅演算法解決了不能通過簡單抽樣演算法進行抽樣的問題,是一種實用性很強的抽樣演算法。本文將簡明清晰地講解馬爾可夫鏈蒙特卡羅演算法,帶你理解它。

9.進階隱式矩陣分解——探討如何實現更快的演算法

摘要:本文重點是圍繞Conjugate Gradient(共軛梯度)方法來探討更優的矩陣分解演算法。

10.純乾貨|機器學習中梯度下降法的分類及對比分析(附源碼)

摘要:本文詳細介紹了基於使用數據量的多少,時間複雜度以及演算法準確率的不同類型的梯度下降法,並詳細說明了3種梯度下降法的比較。

11.深度學習網路大殺器之Dropout(I)——深入解析Dropout

摘要:本文詳細介紹了深度學習中dropout技巧的思想,分析了Dropout以及Inverted Dropout兩個版本,另外將單個神經元與伯努利隨機變數相聯繫讓人耳目一新。

12.深度學習網路大殺器之Dropout(II)——將丟棄學習視為集成學習之我見

摘要:本文分析了可以將丟棄學習當作是集成學習。在集成學習中,可以將一個網路劃分成若干個子網路,並且單獨訓練每個子網路。在訓練學習後,將每個子網路的輸出進行平均得到集成輸出。另外,展示了丟棄學習可以看成是在每次迭代中不同隱藏節點集合的集成學習表現,同時也展示了丟棄學習有著與L2正則化一樣的效果。

13.神經網路常用激活函數對比:sigmoid VS sofmax(附python源碼)

摘要:本文介紹了神經網路中的兩種常用激活函數——softmax與sigmoid函數,簡單介紹了其基本原理、性質及其使用,並用python進行了實例化演示,在文章的最後總結了兩種激活函數的區別。

14.新穎訓練方法——用迭代投影演算法訓練神經網路

摘要:本文介紹了一種利用迭代投影演算法對神經網路進行訓練的方法,首先介紹了交替投影的基礎知識,說明投影方法是尋找非凸優化問題解決方案的一種有效方法;之後介紹了差異圖的基礎知識,將差異圖與一些其他演算法相結合使得差分映射演算法能夠收斂於一個好的解決方案;當投影的情況變多時,介紹了分治演算法,最後將迭代投影演算法應用到神經網路訓練中,給出的例子實驗結果表明效果不錯。

15.車輛追蹤演算法大PK:SVM+HOG vs. YOLO

摘要:本文通過SVM+HOG演算法,YOLO演算法實現車輛檢測和跟蹤準確性和速度的對比,得出YOLO演算法更具優勢的結論。

16.什麼是視頻向量化?本文帶你了解基於DeepWalk的視頻推薦

摘要:本文簡要講述了視頻向量化,對DeepWalk的演算法進行簡單的解釋。

17.比PCA降維更高級——(R/Python)t-SNE聚類演算法實踐指南

摘要: 本文介紹t-SNE聚類演算法,分析其基本原理。並從精度上與PCA等其它降維演算法進行比較分析,結果表明t-SNE演算法更優越,本文最後給出了R、Python實現的示例以及常見問題。t-SNE演算法用於自然語音處理、圖像處理等領域很有研究前景。

18.隨機森林 VS 梯度提升機——模型融合之我見

摘要:本文節選自Quora社區上「When would one use Random Forests over Gradient Boosted Machines (GBMs)?」問題的回答,幾位博主就隨機森林(Random Forests)與梯度提升機(Gradient Boosted Machines, GBMs)的適合場景以及優缺點展開了討論。

三.機器學習常用庫:

1.倚天遇到屠龍:LightGBM VS xgboost誰才是最強的梯度提升庫?

摘要:很多人把XGBoost比作屠龍刀,LightGBM比作倚天劍,那麼當倚天遇到屠龍,誰更強呢?

2.即學即用:Pandas入門與時間序列分析

摘要:這篇文章是Alexander Hendorf 在PyData Florence 2017上做的報告。報告前半部分主要為初學者介紹Pandas的基本功能,如數據輸入/輸出、可視化、聚合與選擇與訪問,後半部分主要介紹如何使用Pandas進行時間序列分析,源代碼親測可用。

3.俄羅斯最大搜索引擎Yandex開源了一款梯度提升機器學習庫CatBoost

摘要:俄羅斯搜索巨頭Yandex宣布,將向開源社區提交一款梯度提升機器學習庫CatBoost。它能夠在數據稀疏的情況下「教」機器學習。特別是在沒有像視頻、文本、圖像這類感官型數據的時候,CatBoost也能根據事務型數據或歷史數據進行操作。

4.Netflix開源面向稀疏數據優化的輕量級神經網路庫Vectorflow

摘要:在Netflix公司,我們的機器學習科學家在多個不同的領域處理著各種各樣的問題:從根據你的愛好來定製電視和推薦電影,到優化編碼演算法。我們有一小部分問題涉及到處理極其稀疏的數據;手頭問題的總維度數很容易就能達到數千萬個特徵,即使每次要看的可能只是少數的非零項。

5.Python高性能計算庫——Numba

摘要:在計算能力為王的時代,具有高性能計算的庫正在被廣泛大家應用於處理大數據。例如:Numpy,本文介紹了一個新的Python庫——Numba, 在計算性能方面,它比Numpy表現的更好。

6.第二熱門語言:從入門到精通,Python數據分析庫大全

摘要:本文介紹了一些常見的用於數據分析任務的Python庫,如Numpy、Pandas、Matplotlib、Scikit-learn以及BeautifulSoup等,這些工具庫功能強大,便於上手。有了這些幫助,數據分析會變得分外簡單。

7.新工具——TensorLayer:管理深度學習項目的複雜性

摘要:本文介紹了一種新基於TensorFlow的python庫——TensorLayer,它能夠有效的幫助開發者管理好自己的深度學習網路。並且它還提供了很多功能強悍的API,幫助開發者更好的完成任務。

8.Pandas並非完美無缺

摘要:我們一直使用Pandas,但是卻不知道關於Pandas的細節。Pandas開發者深度復盤Pandas,指出了十大關鍵性問題,並通過介紹了如何使用Apache Arrow來解決這些問題。

9. 關於Numba你可能不了解的七個方面

摘要:目前Numba正被開始流行使用來加速Python程序,本文講解了七個大家可能不了解的方面,希望對大家有所幫助。

四.機器學習實戰篇:

1.57行價值八千萬美元的車牌識別代碼

摘要:為了防止被竊車輛進入黑市銷售,警方使用了一個名為VicRoads的基於網路的服務,該服務用於檢查車輛的登記狀態。該警局還投資研發了一個固定式汽車牌照掃描器:一個固定的三腳架攝像頭,可掃描過往的車輛,並自動識別被竊車輛。

2.如何利用機器學習預測房價?

摘要:本文作者利用自己過去三個月里所學到的東西,來預測所在城市的房價。所用到的技術有網路爬取技術、文本自然語言處理,圖像上的深度學習模型以及梯度增強技術等。

3.機器學習中的技術債務

摘要:許多人遇到技術債務時都會眉頭緊鎖,但一般來說,技術債務並不是一件壞事。例如,當我們需要在最後期限之前發布版本的時候,技術債務就是一個可以利用起來的合理手段。但是技術債務存在與金融債務一樣的問題,那就是到了要償還債務的時候,我們所付出的要比開始時付出得多。這是因為技術債務具有複合效應。

4.DIY圖像壓縮——機器學習實戰之K-means 聚類圖像壓縮:色彩量化

摘要:本文以圖像壓縮為例,介紹了機器學習的實際應用之一。

5.如何將機器學慣用在基於規則的驗證上

摘要:這篇文章介紹了一些高級問題,比如:智能自治系統的驗證有多少可以用機器學習來實現?大多數的需求是否仍然是基於規則的,如果是這樣,那麼它們如何跟機器學習相結合? 機器學習和規則之間的不穩定介面如何影響基於機器學習的系統?

6.Certigrad——隨機計算圖優化系統

摘要:Certigrad是一種概念證明,它是用於開發機器學習系統的一個新途徑。

7.使用神經網路和遺傳演算法玩轉 Flappy Bird

摘要:本文展示了針對Flappy Bird遊戲設計的機器學習演算法。本實驗的目標是使用神經網路和遺傳演算法編寫一個人工智慧遊戲控制器,打出遊戲最高分,不服的來挑戰!

8.教機器寫代碼:增強拓撲進化網路(NEAT)

摘要:NEAT的意思是「增強拓撲進化網路」,它描述了在進化過程中受遺傳修飾啟發的自學習機器的演算法概念,不妨看看它是如何教機器寫代碼的。

9. 機器學習中,使用Scikit-Learn簡單處理文本數據

摘要:機器學習中,我們總是要先將源數據處理成符合模型演算法輸入的形式,比如將文字、聲音、圖像轉化成矩陣。對於文本數據首先要進行分詞(tokenization),移除停止詞(stop words),然後將詞語轉化成矩陣形式,然後再輸入機器學習模型中,這個過程稱為特徵提取(feature extraction)或者向量化(vectorization)。

五.機器學習雜談篇:

1.關於機器學習你必須了解的十個真相

摘要:作者從非專業人士的角度對人工智慧常見的誤解進行了解釋說明。

2.誰更勝一籌?——隨機搜索 V.S. 網格搜索

摘要:隨機法和網格法都是常用的、有效的結構優化方法。那麼它們兩者當中誰更勝一籌呢?在本文中,作者通過有趣的地形搜索實驗,找到了答案。

3.沒有任何公式——直觀的理解變分自動編碼器VAE

摘要:本文簡單介紹了變分自動編碼器VAE的基本原理,從經典神經網路的貝葉斯計算概率方法慢慢轉變到變分自動編碼器神經網路中的優化問題,使用KL散度度量誤差,給大家提供一個VAE的基本框架。全篇沒有公式,通俗易懂。

4.增強避障系統設計淺析:站在機器學習的角度,剖析學習型避障小車的設計思路

摘要:FF91於12017年1月4日在美國拉斯維加斯成功首發,拉開了互聯網生態電動汽車的序幕。自動泊車使得停車也成為了一種享受,新手司機再也不用擔心該如何見縫插針了。但是如果在車水馬龍的繁忙環境下,無人駕駛還能得心應手嗎?本文將站在機器學習的角度和大家分享學習型避障小車的設計思路。

5.AlphaGo在圍棋界成為最強王者後,我們該如何進行機器學習?

摘要:機器學習無疑是時下的科技熱點。無人駕駛,機器下棋,股市預測等領域,我們都能找到機器學習忙碌和高大的身影。那麼對於初學者來說,該如何下手?該怎麼學習呢?

6.分享Andrew Ng在深度學習暑期班中演講的機器學習項目

摘要:深度學習項目流程,帶你走出迷茫。

7.分散式機器學習平台比較

摘要:機器學習,特別是深度學習(DL),最近已經在語音識別、圖像識別、自然語言處理、推薦/搜索引擎等領域獲得了成功。這些技術在自主駕駛汽車、數字衛生系統、CRM、廣告、物聯網等方面都存在著非常有前景的應用。當然,資金驅動著這些技術以極快的速度向前發展,而且,最近我們已經看到了有很多機器學習平台正在建立起來。

8.機器學習和統計學的「愛恨情仇」可以結束了

摘要:機器學習和統計學在數據科學的領域裡,已經相愛相殺很多年。今天,就讓我們跟隨ML從業者和統計學家兩者組成團隊,解開兩者這幾十年的「愛恨情仇」。

9.2017上半年無監督特徵學習研究成果匯總

摘要:無監督學習是人工智慧時代核心技術,今天我們就來盤點一下2017上半年無監督學習出現了那些重要的研究成果。

10.有監督相似性學習:基於相似問題數據的對稱關係學習

摘要:本文簡單介紹基於相似問題數據的對稱關係學習,通過在Quora數據集和StackExchange語料庫上應用孿生卷積神經網路的結果表明,對稱網路能夠較大幅度地提高檢測精度。

11. 應用機器學習:傳道解惑指南

摘要:本文作者編輯了一份包括概念、定義、資源以及工具的知識合集,這對於在這個複雜領域從事工作的人來說非常有用。

本系列博客內容由北郵@愛可可-愛生活老師推薦,@阿里云云棲社區組織翻譯,翻譯小組袁虎負責整理。本系列長期更新,更多關於機器學習的優質好文,多多推薦!

原文鏈接

更多技術乾貨敬請關注云棲社區知乎機構號:阿里云云棲社區 - 知乎


放開讓我來!

首先題主要的是網路資源,也就是要求在互聯網上公開且免費的資料。然後題主明確點出不要列出來上百個刷單論文什麼的,說明題主希望系統而專註的入門或提升深度學習能力。

我覺得吧,資料太多真的就一個都看不下去了。Less is more.其實只需要有那麼一兩本書去幫你同時完成理論和工程的入門和提升就夠了,哪裡需要那麼麻煩的弄出來這麼多資料呢。

我也不知道題主是更喜歡視頻資料還是書籍資料。下面我就都推一下,總之下面的資料都是在互聯網上免費且公開的。當然想買紙質書籍的話也都能買到。

(已經看過我訂閱號里那篇文章的話就不用看啦,此處純搬運)

視頻資料方面

小夕就不多推薦啦,因為看視頻真的是很磨時間的學習方式。就提一下四門課及哪些人適合去聽聽:

1、coursera上Ng開設的機器學習。

https://www.coursera.org/learn/machine-learning/

如果在入門深度學習之前都沒有接觸過機器學習的話,那麼這門課是小夕建議十分有必要聽的~尤其是課程的好幾個大作業,Ng已經給你寫好的框架也要好好看,這對於摸清行業基本工程框架是十分有幫助的~可以說是理論與工程雙收的入門教程。當然,已經入門的就忽略吧。

2、斯坦福大學的公開課CS231n(深度學習與計算機視覺)。

http://cs231n.stanford.edu/

小夕是做自然語言處理(NLP)的,所以早就聽說了這門課但是一直也沒有去看。最近也是刷了幾節,感覺非視覺方向的小夥伴聽一聽也是有幫助的~不過個人覺得非視覺方向的,又不是有大把時間的,就不用太心心念這門課啦,這門課的更高效的替代品還是蠻多的。視覺方向的剛要入門的去刷就非常合適了。

3、斯坦福大學的公開課CS224d和CS224n(深度學習與自然語言處理)。

http://cs224d.stanford.edu/syllabus.html

CS224n: Natural Language Processing with Deep Learning

這兩門課都是斯坦福的深度學習與自然語言處理的結合的課程,開課老師是NLP領域的大牛Manning和Richard Socher。(感謝評論區糾正!)NLP方向的小夥伴要入門深度學習的話,看這門課是很合適的。CS224d比CS224n的內容要少的多(好像224d是夏季課程),所以時間有限的話可以聽224d,想系統學習深度學習在NLP領域的應用的話就CS224n。小夕刷完了完整的224d還有224n的一部分。畢竟詞向量這些概念的特性理解不透的話,CNN、RNN理解的再好也很容易瓶頸了。不過224d對CNN在NLP領域的應用講的不多,還是建議剛入門的初學者刷一刷,已經入門的就不用啦,太浪費時間。

4、coursera上Ng開設的Neural networks and deep learning。

https://www.coursera.org/specializations/deep-learning

這門課實在太太太火,小夕也是前幾天抽出時間來挑著看了些,主要集中在第二、三章節上。發現這門課第二章節的內容跟Ng的《machine learning yearning》好好好像啊,甚至插圖都沒有變太多 =.= 對於初學者來說,這門課的內容是以後進行工程所不可或缺的,十分建議這門課和《machine learning yearning》最少要挑一個看!尤其是bias-variant trade-off理論,沒有人比Ng講的更清楚了。

對視頻資料總結一下,如果是一個完全態的新手,那麼Ng的機器學習是十分有必要認真看的(是說認真看大作業的代碼!不僅僅是視頻!)。如果有機器學習基礎了,但是深度學習是個小白,神經網路也理解很少,數學也不怎麼樣,那麼Ng的Neural networks and deep learning刷了絕對大有收穫的~如果機器學習和深度學習的基礎都有了,但是缺乏某一應用領域的應用套路,那麼有時間可以刷CS231n或者cs224d,沒時間也無所謂的,繼續往下看啦~

紙質書籍方面

由於我們目標是深度學習的應用!而且精力有限!所以在書籍上的功夫一定要少而精。小夕力推兩本,這兩本也是小夕除了論文外,80%的知識來源~(算上論文也能佔40%啦)

1、《Deep learning》,中文叫《深度學習》,已經開售了(應該沒有人不知道吧)。

這本書的價值和權威性不用我啰嗦。但是!我要吐槽一下,我覺得這本書除了主流的深度學習模型講的很一般以外,其它大部分章節還是挺好的!如果你看這本書的第9、10章學習CNN、RNN的時候感覺亂糟糟的,要麼感覺太過啰嗦缺乏核心,要麼感覺「天吶怎麼一帶而過了」,那麼不要懷疑自己的智商,因為小夕也懷疑過自己的智商了 =.= 。這些章節主要就用來索引論文吧。(當然如果你覺得講的棒呆了,恭喜你跟作者心有靈犀)

但是,這本書的6、7、8章還是很棒的!第一部分寫數學基礎的那幾章也是言簡意賅,恰到好處。總之「深度前饋網路」、「正則化」、「優化」這幾章值得細細讀的~但是後面的章節,咳咳不要抱太大期望。

另外,不要以為看完這本書你就對深度學習無所不能了,實際上還差很遠吶。這本書的價值在於讓你低成本(高效率)的補上最近幾年的主要理論成果,免得自己面對數百篇重要論文無從下手。順便提供了一個論文索引。工程能力的get要看下面這本神書!

2、《Hands On MachineLearning with Scikit Learn and TensorFlow》。

這本書是小夕秘藏好久的書籍!遇到它時也是緣分啦,有一次在Google瞎搜,結果出來一個「safari books online」的神奇網站,寶寶用了多年Safari,都沒有發現它還有這種地方!於是點進去,

噫?果然是個神奇的地方!然後就習慣性的去找人工智慧、機器學習、深度學習等分類的書了。然後當時看到了相關主題的熱搜,當時的top1就是這本書!好奇之下點進去試讀,然後就中毒了。。。

不過不用擔心價格問題,這本書的電子版也是在互聯網上都能完整下載。

這本書真的是深度學習在工程應用上的神器!有很多工程tricks,比如工程上怎麼初始化啦、怎麼選擇激活函數啦、批量歸一化什麼時候用之類的很現實的問題基本都能在這裡找到答案!它又不同於《機器學習實戰》這種堆砌代碼的書籍,它的理論講解也很棒!整本書的組織也是循循善誘,代碼什麼的與理論和實驗融為一體,而且最重要的是它也會給出大量的參考論文!論文都會在當頁的下方給出,簡直發現新大陸不能更方便了!

哦對了,這本書的前半部分是統計機器學習,後半部分是深度學習。小夕只看了深度學習部分。對於還沒有用過統計機器學習模型如SVM解決過工程問題的同學來說,前半部分也是神器了!所以超級初學者上完Ng的機器學習後,來這本書的前半部分深入學習簡直不能更高效了。

對書籍資料總結一下,只要你要做深度學習了,理論書方面目前最佳還是《deep learning》。但是不要迷信部分章節的講解力,該啃參考論文就啃論文!大部分論文會比書上講的清晰很多(除了某些思維實在難以讓人理解的大牛的論文)。工程上的主力書,小夕只推《Hands On Machine Learning with Scikit Learn and TensorFlow》。超級新手順便把前半部分也挑著看一下,一般性初學者和工程經驗不太豐富的小夥伴好好看後半部分吧(尤其"training deep neural nets"那一章)。

其他資料

微信訂閱號「夕小瑤的賣萌屋」里的機器學習和深度學習知識是前面這些資料里都沒有的哦。


深度學習通俗易懂教程專欄超智能體 - 知乎專欄

閱讀列表:

  1. 深層神經網路:深層學習為何要「Deep」(上)(由於下篇寫的並不通俗,不推薦閱讀,用公開課代替)
  2. 反向傳播演算法實例:未編寫
  3. 深度學習總覽:公開課:深層神經網路設計理念
  4. 深度學習入門誤區:知乎Live(公開課涵蓋了Live的內容,若覺得作者辛苦也可參加。算了,還是不要參加了!)
  5. Tensorflow :TensorFlow整體把握
  6. 前饋神經網路(1):前饋神經網路--代碼LV1
  7. 前饋神經網路(2):前饋神經網路--代碼LV2
  8. 前饋神經網路(3):前饋神經網路--代碼LV3
  9. 循環神經網路(1):循環神經網路--介紹
  10. 循環神經網路(2):循環神經網路--實現LSTM
  11. 循環神經網路(3):循環神經網路--scan實現LSTM
  12. 循環神經網路(4):循環神經網路--雙向GRU
  13. 卷積神經網路(1):卷積神經網路--介紹


本文將機器之心關注過的可以作為機器學習和深度學習參考材料做了簡要的分類、總結和介紹。由於本文推薦文章多為基礎和入門為主,也包含一些由淺入深的教程,讀者在閱讀過程中可以根據自己現階段的知識儲備選擇自己需要學習的內容,希望對讀者們的機器學習和深度學習有所幫助。

文章介紹篇:

1. 基礎知識與概念理解:

  • 入門 | 智能時代每個人都應該了解:什麼是深度學習?

本文通過介紹人工智慧、深度學習和機器學習三者之間的關係來闡明深度學習及其重要性。傳統的機器學習智能處理一定量數據,而對於深度學習來說,數據越多,深度學習的技術表現越好。此外該文還介紹了深度學習的幾大框架以及優秀在線課程和書籍。

  • 深度 | 深度學習教程:從感知器到深層網路

在這篇教程中,將向你介紹深度學習背後一些關鍵性概念和演算法,從最簡單的組成單元開始,以此為基礎構造Java中機器學習的概念。

  • 乾貨 | 深度學習名詞表:57個專業術語加相關資料解析(附論文)

本文整理了一些深度學習領域的專業名詞及其簡單釋義,同時還附加了一些相關的論文或文章鏈接。本文編譯自 wildml,作者仍在繼續更新該表,編譯如有錯漏之處請指正。文章中的論文與 PPT 讀者可點擊閱讀原文下載。

  • 入門 | 初學者必讀:解讀14個深度學習關鍵詞

本文介紹了包括 LSTM、ANNS、生物神經元、反向傳播、多元感知機等 14 個深度學習關鍵概念,對初學者來說,搞清楚這些關鍵詞的含義對理解深度學習至關重要。

  • 基礎 | 初學者必讀:從迭代的五個層面理解機器學習

我們想展示簡單的迭代技術是如何在機器學習中具有美麗形式和深刻意義的。這篇文章是針對初學者寫的,但更有經驗的讀者也不妨一讀。

2. 數學基礎:

  • 資源 | 自學數據科學與機器學習?19個數學和統計學公開課推薦

對於沒有數學背景的人來說,機器學習的入門之路可能會舉步維艱。首先,你必須要搞明白哪些必須學,哪些沒有必要——其中可能包含了線性代數、微積分、概率學、統計學、離散數學、回歸、優化等許多主題。你需要多麼深入這些主題?自學的話很難單靠自己把這一切都把握好。

如果你正面臨著這樣的難題,不要驚慌,現在我已經把這項艱辛的工作幫你完成了。這份列表推薦了來自 Coursera、edX、Udemy 和 Udacity 的最受歡迎的數據科學數學基礎公開課。這份列表經過了精心的編排,讓你可以結構化地自學數據科學所需的數學概念。

  • 乾貨 | 機器學習需要哪些數學基礎?

當你嘗試著去理解一個像機器學習(ML)一樣的交叉學科的時候,主要問題是理解這些技術所需要的數學知識的量以及必要的水平。這個問題的答案是多維的,也會因個人的水平和興趣而不同。下面我會說明我所認為的要成為一個機器學習科學家/工程師所需要的最低的數學水平以及每個數學概念的重要性。

3. 應用與發展趨勢:

  • 業界 | 深度學習十大飆升趨勢

自 2012年起,深度學習的各個方面的真實發展速度可能會超過你的想像。

4. 概念理解與區分:

  • 業界 | 人工智慧、機器學習、深度學習,三者之間的同心圓關係

  • 一文讀懂機器學習、數據科學、人工智慧、深度學習和統計學之間的區別

在這篇文章中,數據科學家與分析師 Vincent Granville 明晰了數據科學家所具有的不同角色,以及數據科學與機器學習、深度學習、人工智慧、統計學、物聯網、運籌學和應用數學等相關領域的比較和重疊。

5. 入門演算法相關

  • 機器學習演算法集錦:從貝葉斯到深度學習及各自優缺點

在我們日常生活中所用到的推薦系統、智能圖片美化應用和聊天機器人等應用中,各種各樣的機器學習和數據處理演算法正盡職盡責地發揮著自己的功效。本文篩選並簡單介紹了一些最常見演算法類別,還為每一個類別列出了一些實際的演算法並簡單介紹了它們的優缺點。

  • 基礎 | 機器學習入門必備:如何用Python從頭實現感知器演算法

感知器演算法是最簡單的人工神經網路形式之一。感知器是一個單神經元的模型,可以用於兩個類別的分類問題,也能為以後開發更大的神經網路奠定基礎。在本教程中,你將了解到如何利用 Python 從頭開始實現感知器演算法。

  • 經驗之談:如何為你的機器學習問題選擇合適的演算法?

隨著機器學習越來越流行,也出現了越來越多能很好地處理任務的演算法。但是,你不可能預先知道哪個演算法對你的問題是最優的。如果你有足夠的時間,你可以嘗試所有的演算法來找出最優的演算法。本文介紹了如何依靠已有的方法(模型選擇和超參數調節)去指導你更好地去選擇演算法。

  • 盤點 | 機器學習入門演算法:從線性模型到神經網路

幾十年來,機器學習實際上已經變成了一門獨立的領域。由於現代計算能力的進步,我們最近才能夠真正大規模地利用機器學習。 本文側重於介紹了回歸與分類問題的演算法模型,主要包括線性模型、樹形模型以及神經網路演算法。

學習課程篇:(推薦收藏,規劃時間段進行學習)

  • 深度|大師領路:機器學習進階路上不可錯過的28個視頻

將視頻分為三類:機器學習、神經網路、深度學習。為方便起見,你可以使用我創建的列表按順序學習。特別推薦初學者根據順序學習,以更好地理解視頻。

  • 資源 | 深度學習資料大全:從基礎到各種網路模型

深度學習是發展迅速的一個計算機科學和數學交叉的領域。它是更寬泛的機器學習領域一個相對新的分支。機器學習的目的是教計算機完成基於給定數據的各種任務。本教程是為那些知道一些數學,又懂一些編程語言,並想研究深度學習的人準備的。

  • 資源 | 任何階段的學習者都適用的參考:機器學習領域書目全集

來自 Swinburne 科技大學的 Jason Brownlee 博士為我們帶來了最新一期的機器學習書目,內容覆蓋科普、各級教材以及不同編程語言的機器學習應用。


python是一門還算簡單的語言。

只說做數據分類問題的話,建議你看完python + numpy + keras的路線。這就可以開始跑實驗了。

keras的backend可以是tensorflow和theano,這個等你跑起來第一個實驗,有點信心了,可以再慢慢研究。


就算是對於有經驗的編程人員和數據科學家來說,深度學習其實也並不是特別容易入門。因此我們搜尋了一些關於機器學習和深度學習的教育資源,包括在線課程、書籍和視頻等。這些資源均由行業頂尖的教授、學者和專業人員設計和提供。

機器學習

深度學習技術常常和經典的機器學習方法相結合,如果你剛入門還不知道監督式學習和無監督式學習的區別,或者認為「梯度下降法」是Photoshop里的某個工具,那下面這些課程絕對有必要看看。

1. 吳恩達在斯坦福大學開設的課程(在線課程)

在吳恩達去百度出任首席科學家前一直在斯坦福大學教授機器學習,還是 Coursera 的聯合創始人。對於想對機器學習領域的重點慨念有個基礎的了解的人來說,吳恩達教授的機器學習入門課程絕對必看。 ( https://www.coursera.org/learn/machine-learning )

作為以上課程的補充,也可以看看吳恩達在斯坦福講授的 Stanford』s CS 229 – Machine Learning(http://cs229.stanford.edu/syllabus.html),裡面有相關的講義、習題集和Matlab 代碼示例等。

https://www.deeplearning.ai/

2. Sebastian Thrun的機器學習入門課程(在線課程)

Sebastian Thrun 很前就研究人工智慧技術和自動駕駛技術,2005年贏得首屆無人駕駛機器人挑戰賽。Sebastian 不僅主管斯坦福大學的人工智慧實驗室,也是谷歌自動駕駛汽車項目的開創者。

Sebastian的《機器學習入門》課程,(傳送門:https://cn.udacity.com/course/intro-to-machine-learning--ud120) 對機器學習進行了詳細介紹,並輔以大量的編程操作幫助你鞏固所學內容。

此外,Sebastian 在優達學城上還開設了一本《人工智慧入門》課程(傳送門: https://cn.udacity.com/course/intro-to-artificial-intelligence--cs271),講解人工智慧領域的基本原理以及相關應用比如機器人、計算機視覺和自然語言處理等。

深度學習

雖然早在上世紀60年代,人們就提出了神經網路概念,但是直到近幾年由於大數據和計算能力的爆發性發展,深度學習才為人們所熟知並開始流行。在了解機器學習的基礎知識後,你就可以開始探索深度學習這一人工智慧的新領域了。

1. Geoffrey Hinton 的機器學習神經網路(在線課程)

以「深度學習之父」聞名於世的 Geoffrey Hinton 是多倫多大學的教授和谷歌的科學家。2012年,Geoffrey Hinton 帶領的團隊在 Merck Drug Discovery Challenge 取得了驚人的成功,由此將「深度學習」帶入大眾的視野,引起了深度學習的火爆。(傳送門: http://blog.kaggle.com/2012/10/31/merck-competition-results-deep-nn-and-gpus-come-out-to-play/)

Geoffrey Hinton 在 Coursera 上開設有《機器學習神經網路》課程(傳送門: https://www.coursera.org/learn/neural-networks),但是不太適合初學者。如果懂編程,我們建議多看看 Jeremy Howard 開設的《實用深度學習》(見下文);如果是以非程序員的身份學習AI,可以看看吳恩達的機器學習課程(見上文)。

2. Jeremy Howard的深度學習課程(在線課程)

Jeremy Howard 曾是卡歌網的首席科學家,後來創辦了 Enlitic,將深度學慣用於醫療診斷。更重要的是,他成立了 Fast.ai,專門向深度學習工程師提供教育資源。

Fast.ai地址:

http://www.fast.ai/

Jeremy Howard 還在舊金山大學數據學院開設有深度學習的面對面課程。課程的第一部分是講解深度學習的基本概念(傳送門: https://www.usfca.edu/data-institute/certificates/deep-learning-part-one);課程第二部分涵蓋了深度學習的應用( 傳送門:

https://www.usfca.edu/data-institute/certificates/deep-learning-part-two ),在Fast.ai上也有這門課的內容。

3. Yoshua Bengio和Ian Goodfellow的著作(書籍)

加拿大蒙特利爾大學的教授 Yoshua Bengio 也是深度學習領域的前沿學者,所著論文在谷歌學術搜索中被引用達4萬次之多。他的學生 Ian Goodfellow 是生成對抗網路(Generative Adversarial Networks)的發明者。

兩人合著的書籍 Deep Learning 可在網上免費閱讀,內容包含線性代數中的應用數學記憶、概率論以及深度學習核心概念涉及到的數值計算等。

書籍地址: http://www.deeplearningbook.org/

不過這本書不太適合初學者,對於已有機器學習和深度學習相關經驗的人是不錯的選擇。

4. Michael Nielsen的神經網路深度學習著作(書籍)

每當問起編程人員關於深度學習的最喜歡的資源是什麼,Michael Nielsen 的 Neural Networks Deep Learning 一書總是被人反覆提及。書籍地址:

http://neuralnetworksanddeeplearning.com/chap1.html

Nielsen 的書專註於教會人怎樣用神經網路解決一個複雜的問題,比如教會計算機去識別手寫的數字。你可以以簡單的神經網路入手,隨著不斷學習新概念慢慢改進自己的代碼。

如果不太懂深度學習所必需的數學知識,或者不太擅長編程,Nielsen 的書很適合你。書里提到的習題代碼都是以 Python2.7 編寫,即便不常用這種語言,你也很容易看懂。

習題代碼鏈接:

https://github.com/mnielsen/neural-networks-and-deep-learning

如果你缺乏 Python 基礎,也可以先來看看這個:[Python入門] 01 基本法則 - 集智專欄

或是系統地學一點 Python 知識:深度學習所需的Python - 集智課堂

5. 使用TensorFlow的深度學習(在線課程)

在學完上面提到的資源後,想必你已經掌握了深度學習和神經網路的基礎概念,想利用一些工具將理論化為實踐。目前已經有很多深度學習框架和程序庫,谷歌的 TensorFlow 是其中最流行最好的一個。

谷歌首席科學家 Vincent Vanhoucke 在 Coursera 上開設有 Deep Learning by Google 課程,主要是幫你進一步了解機器學習和深度學習,如何用 TensorFlow 訓練邏輯分類、簡單的深度網路、卷積和循環神經網路。

TensorFlow 上分別有入門和進階教程:入門教程(https://www.tensorflow.org/tutorials/mnist/beginners/);進階教程(https://www.tensorflow.org/tutorials/mnist/pros/)

6. 哈佛大學深度自然語言處理課程(視頻和講座)

如果你對自然語言處理感興趣,可以學習哈佛大學深度學習專家 Phil Blunsom 和 Chris Dyer 開設的 Deep Natural Language Processing 課程和講座(https://github.com/oxford-cs-deepnlp-2017/lectures),涵蓋自然語言處理的多種話題比如分析文本中的潛在維度、音頻文本轉錄、機器翻譯和問答系統。

7. 斯坦福大學CS224N:採用深度學習技術的自然語言處理(視頻和講座)

斯坦福大學自然語言處理研究小組發起人 Christopher Manning 和 Salesforce 的首席科學家 Richard Socher 共同講授了 Natural Language Processing With Deep Learning 課程,涵蓋詞向量、前饋模型、循環神經網路、遞歸神經網路、卷積神經網路在自然語言處理方面的應用,比如機器翻譯和問答系統。

8. David Silver的增強學習課程(視頻)

David Silver 是 Google DeepMind 增強學習小組的領導者,曾在倫敦大學學院舉辦過「增強學習」的講座,備受好評

講座視頻地址:

https://www.youtube.com/watch?v=2pWv7GOvuf0list=PL7-jPKtc4r78-wCZcQn5IqyuWhBZ8fOxT

在 course website 上有講座的講義和作業http://www0.cs.ucl.ac.uk/staff/d.silver/web/Teaching.html

9. 研究論文

人工智慧和深度學習領域每天都有大量的研究論文發表:

Google (https://scholar.google.com/)

ArXiv (https://arxiv.org/)

Research ( https://www.researchgate.net/)

這仨站上有豐富的資源,您沒事兒多瞅瞅。

如果不知道先從哪篇論文讀起,這裡有一份論文列表,上面列有需要讀的基礎研究論文(http://deeplearning.net/reading-list/)。

Andrej Karpathy 研發了一款有用的小工具叫 ArXiv Sanity(http://www.arxiv-sanity.com/),會不時推薦相關的研究。

如果不想錯過新論文,你可以訂閱ArXiv的兩個板塊內容:Computer Learning(https://arxiv.org/list/cs.LG/recent)和Machine Learning (https://arxiv.org/list/stat.ML/recent)。

上面列出的這些資源對於基本的深度學習和機器學習應該足夠了,每個人應該能找到適合自己學習層次和風格的內容。同時集智主站也提供一系列相關課程(如 深度學習的理論基礎 - 集智課堂 、自然語言處理-從零入門 - 集智課堂 等等,同時提供在線的編程環境,免去了搭建環境的麻煩,歡迎各位練手),祝大家學有所成!

拓展閱讀:

遍地開花的AI助手,代表著人機交互方式的未來

以彼之道,還施彼身——使用機器學習來揪出作弊的玩家

不是人工智慧,是智能機器

官方微博:@景略集智

微信公眾號:jizhi-im

商務合作: @軍師

投稿轉載:kexiyang@jizhi.im

集智QQ群:557373801


是時候放出我收集多時的資源了

SherlockLiao/Roadmap-of-DL-and-ML


tensorflow


課程資料:斯坦福大學CS231深度學習課程。課程的助教Andrej寫了一些筆記,其中有一節是關於python的。樓主會matlab的話學python肯定很快。

框架:(1)keras,這個應該是當前最簡單的深度學習庫,基於tensorflow(默認)或者theano,源碼給出了不少例子。

(2)tensorflow,偏底層,自己寫代碼可以了解網路具體的運行過程。畢竟是谷歌兒子,谷歌在圖像和自然語言處理都比較強,用戶很多。當前github贊數目最多(三萬多)的深度學習庫,用戶多,官方支持力度大,因此例子也很多。


先針對你的問題回答,你要研究的是深度信念網路(DBN),這個應該是以概率圖模型為基礎的,可以去看看Koller的書《概率圖模型-原理與技術》,有中文版,中科院王飛躍老師翻譯的,這本書有點厚,耐下心來慢慢啃,啃完是最好的,也可以只關注自己感興趣的部分,其次是深度學習部分,可以看看NIPS之前的Tutorial《Deep Learning》,Ian Goodfellow,Yoshua Bengio和Aron Courville的大作,現在已經出版,Amazon上有賣.

下面是跑題的部分,懶得刪了.

其次是機器學習的資料,私以為,首先要學好數學基礎,包括但不限於,線性代數(矩陣理論)、概率論與統計、資訊理論、優化理論等

1. 線性代數,目前發現的最好的公開課,Gilbert Strang 的Linear Algebra,沒有之一.

2. 概率與統計方面,我看的大部分都是陳希孺院士的作品.你可以循著這個名字去搜索就是了

以上兩個人的共同點是,他們都在一個領域耕耘了五十年以上,所以當你去看他們的課程或是作品,都會有種豁然開朗的感覺.

3. 然後還有一個比較重要的課程就是優化理論,這個沒啥好推薦的,因為我遇到一個比較好的優化老師,講的通俗易懂.哈哈

再然後就是一些很雜的數學知識,要慢慢去積累,基礎真的很重要.

下面推薦一些機器學習的課程與教材,

1. 吳恩達的課《Machine Learning》應該都聽說過,這個肯定毋庸置疑.

2. 國立台灣大學的《機器學習基石》也很好

3. 龍星計劃,Eric Xing講的部分也很好,其次,他也講過《概率圖模型》的課程,CMU的大牛.

4. 深度學習,cs231n,Stanford的Computer Vision課程,從KNN到線性分類器,再到神經網路,CNN,講的很清晰,說到了很多細節你以前可能不會去想或者想不出來的. 如果對NLP感興趣可以去看看cs224d

5. 神經網路入門教程,記得好像是某物理博士寫的,名字叫《Neural Network and DeepLearning》,講的很通俗易懂,且有python代碼示例.

6. 李航的《統計學習方法》,很實在.

最後就是應用方面,因為我用的Python比較多主要還是以Python為主.

1. 首先是要理解機器學習演算法的思想和步驟,然後自己嘗試去實現一個toy級別的代碼,你可能會用到numpy、pandas、matplotlib、jupyter,scikit-learn等,這些都不難,看官方文檔,或者google一下快速教程.

2. 其次是通用的機器學習框架,scikit-learn,做一點演算法探測模型比較什麼的比較方便.

3. 深度學習框架,現在真的很多,我選擇的原則是,越接近直覺,越簡單的介面越好,首推Keras,實現一些基本的深度學習模型都很簡單,就像搭積木一樣.

Keras是tensorflow和theano的前端部分,其他的深度學習框架也可以試著去用下,畢竟了解了原理之後,框架學習都比較簡單了,還可以對比下它們的優缺點,比如:Caffe、MXNET、Deeplearning4j等等

4. 推薦兩個概率編程的框架,概率圖模型框架pgmpy,小巧優雅,去看看他的Tutorial,很多用概率圖模型做的yuanweiji分類任務.pymc,主要

做貝葉斯模型的,這個不甚了解.但是也值得一學.

另外,github上的awesome系列,資料不要太多.

說了這麼多,最重要的還是

1. 打好基礎

2. 沉下心來去做

第一點有感於曾經看到的一句話「國內學生的數學真的很爛」,原話什麼不記得,大概就這個意思,看了MIT的線代課確實如此,基礎都不好,何談以後的深入研究,學起來會很痛苦的.

手機碼字略亂,有時間再補充更新.


1.確實python是一種相對簡單的語言,基本上懂其他一門語言的前提下,一個星期就能夠比較熟練的使用python的基本功能了。

這個是之前看過的一個《千行代碼入門python》的一個系列,感覺挺不錯的

xianhu/LearnPython

現在已經推出其他系列,都是不錯的python學習資料

2.現在Python的ML的開源項目也挺多的,題注可以參考一下:

最受歡迎的20個python機器學習開源項目:

Top 20 Python Machine Learning Open Source Projects, updated

另外下面是一個python寫的機器學習的一些演算法是github地址:

rushter/MLAlgorithms

3.深度學習框架的話tensorflow是主流框架,Keras對TF進行了封裝,建議直接裝一個Anoconda,比較方便。

如何用anoconda裝tensorflow官網上有:

Download and Setup

而且tensorflow現在已經有了比較齊全的官方文檔中文版:

TensorFlow官方文檔中文版_TensorFlow中文教程_TensorFlow開發中文手冊[PDF]下載-極客學院Wiki

還有一些tensorflow的tutorials:

Tensorflow初級入門:https://hackernoon.com/machine-learning-with-tensorflow-8873fdee2b68#.ry5byd73k

Tensorflow一些examples:aymericdamien/TensorFlow-Examples

TensorFlowKR/awesome_tensorflow_implementations

這個是一個叫周漠言的知乎朋友的tensorflow的視頻,通俗易懂可以稍微看看:#2 什麼是神經網路 機器學習 what is neural network in machine learning

Github上面挺多相關的開源項目的,題主可以自己去找找

4.另外題注說很多教程是圖片相關的,其實tensorflow也可以做文本、音頻等數據的classification,這個相關資源很多,可以自己找找。tensorflow的官方example中的包含一個ext classification 的例子,可以參考一下:tensorflow/tensorflow


看到好多回答列了一堆視頻鏈接或者課程鏈接,對於我來說都是收藏但沒時間看系列。

我覺得機器學習看看斯坦福的cs229的slide和note,深度學習看看斯坦福的cs231n的slide和note。好好看完這兩個基本就入門了,如果想專門研究某個演算法,看看esl或者prml相關章節,或者翻翻論文。

然後找個任務練手,自己選擇模型,動手實現,擼起袖子調參,遇到不懂的問題谷歌,等最後歷經千辛萬苦,準確率終於達到平均水平了,你就成為煉丹師中的一員了。

平時逛逛reddit machine learning和deep learning版塊。


工具:10種深度學習演算法的TensorFlow實現

簡介:

可以在項目地址中可以通過查看 command_line/ 目錄來學習這些使用 TensorFlow 的深度學習演算法的基本使用方法,同時項目文檔也可作為有效參考資料。要求是使用 TensorFlow 0.8 或更新版本。可用模型列表:卷積網路(Convolutional Network),循環神經網路(Recurrent Neural Network (LSTM),受限玻爾茲曼機(Restricted Boltzmann Machine),深度信念網路(Deep Belief Network),作為RBM堆疊的深度自編碼器(Deep Autoencoder as stack of RBMs),去噪自編碼器(Denoising Autoencoder),堆疊的去噪自編碼器(Stacked Denoising Autoencoder),作為去噪自編碼器堆疊的深度自編碼器(Deep Autoencoder as stack of Denoising Autoencoders),多層感知器(MultiLayer Perceptron), 邏輯回歸(Logistic Regression)。

  • Github 項目地址: https://github.com/blackecho/Deep-Learning-TensorFlow

  • 項目文檔:Deep Learning with Tensorflow Documentation


建議從動手開始,能夠跑代碼之後再同時進行理論學習,這樣不容易迷失在數學基礎中或海量論文中喪失耐性,學起來比較有動力。基於這個原因推薦這幾門課程,順序有先後:

1. 斯坦福 TensorFlow課程 CS20SI

有Slides和源碼,目標是掌握TensorFlow模型的搭建,上手快,對經典模型的結構掌握會很清楚,比TF官方文檔清晰 ( 笑

前半部分學習TF知識,後面搭建CNN、RNN開始涉及深度學習,知識點可以看相關博客,此時也可以開啟下面這門課程。

2. 斯坦福 Computer Vision Deep Learning入門課程 CS231n

有講義、視頻和編程作業,也有Numpy Jupyter的基本教程。講述基於深度學習的計算機視覺基本知識,在CS20SI這門課中所學的與圖像相關知識都能得到解惑(但與NLP相關如word embedding得需要看別的):

手寫代碼,不用框架,基本概念如BP掌握會很清晰。

另,知乎有該課程講義的中文翻譯,感謝他們~

3. 斯坦福 Machine Learning 課程 CS229

關於傳統機器學習知識,與前兩個課程相比對數學要求高一些。建議先花一點時間補一下微積分線代概率論,或者看該門課Tutorials有相關背景知識補充。


深度學習進階


推薦閱讀:

如何理解soft target這一做法?
神經網路的歷史?
卷積神經網路中用1*1 卷積有什麼作用或者好處呢?
如何看待指出 神經網路的訓練罪魁禍首是退化一文?
在神經網路中weight decay起到的做用是什麼?momentum呢?normalization呢?

TAG:機器學習 | 神經網路 | 深度學習DeepLearning |