機器學習領域有哪些適合新手學習的 GitHub 項目?

感覺 github上的項目到處都是 js, 求大神推薦適合 【 新手】學習的 機器學習領域的github項目。

C++ ,Python的都可以, 偏向python.


當然是這個項目了:PRMLT。包含機器學習經典教材PRML的幾乎所有演算法的matlab代碼,算PRML這本書半官方工具包,是github上星星和fork數排在前三的matlab項目。


根據Udemy的課程做的一個簡單的無人車AI程序,語言python,並對所涉及到的知識寫了中文的解釋,代碼中也帶有注釋~主要演算法是Deep Q-learning

Github Repo鏈接:

JianyangZhang/Self-Driving-Car-AI

探索環境

1分鐘後...

我怎麼感覺樓主要問的並不是這些工具、包、庫等…而是具體的使用機器學習的練手項目,比如手寫字元識別,三種花分類,預測房價,泰坦尼克號預測生還者和非生還者,神經網路人臉分類,電影推薦系統,伺服器異常檢測,kmeans圖像壓縮,名畫的作者判斷…


GitHub - knightjun/Google-ML-Recipes-Chs-sub-and-code: Google出品的機器學習入門視頻的中文字幕翻譯與示例代碼

Google最近出的一個面向新手的機器學習教程,目前出了兩集,我翻譯了一集,每集大概只有6-7分鐘,代碼簡潔,製作精良,也沒有涉及太多數學,唯一的門檻就是Python,不過答主已經沒問題了

學習最好的方式是參與其中,希望有人可以協同完成這個項目,可以是參與翻譯,也可以是push自己的示例代碼


我的建議是去學習一下Tianqi Chen同學的代碼,SVDFeature - SVDFeature 順手把推薦中的 latent factor model 和 additive tree 都了解了,還可以了解一下 ensemble method,多好多爽。一次性滿足你三個願望:1.掌握業界普遍使用的東西;2.按照 Tianqi 同學的意思,主要在於寫一個 solver 而不是某個具體的模型;讓你感受到一個趁手的 solver 才是建模的利器 3. ensemble 應該也挺好玩的,不過我不太懂,剛開始接觸。


Caffe/scipy


列舉一些我知道的項目

numpy scipy : python的數值計算 科學計算基礎工具。

pandas : Python數據分析

scikit-learn : Machine learning in Python, 常見的機器學習演算法基本都有實現。

scikit-image : Image processing in Python, 這個沒用過,圖像方面的可以看看。

xgboost : 梯度增強演算法庫,c++寫的,有python介面。

vowpal_wabbit: a fast out-of-core learning system sponsored by Microsoft Research and (previously) Yahoo! Research.

DMLC | Distributed (Deep) Machine Learning Common 的一系列項目


提供具體統計演算法的工具。其演算法可從數據中學習。

  • Apache Flink:快速、可靠的大規模數據處理引擎。官網
  • Apache Hadoop:在商用硬體集群上用來進行大規模數據存儲的開源軟體框架。官網
  • Apache Mahout:專註協同過濾、聚類和分類的可擴展演算法。官網
  • Apache Spark:開源數據分析集群計算框架。官網
  • DeepDive:從非結構化數據建立結構化信息並集成到已有資料庫的工具。官網
  • Deeplearning4j:分散式多線程深度學習開發庫。官網
  • H2O:用作大數據統計的分析引擎。官網
  • Weka:用作數據挖掘的演算法集合,包括從預處理到可視化的各個層次。官網

TLD單目標跟蹤演算法

c++和matlab版均有


最省事兒的,pytorch 或 tensorflow 的官方 tutorial / example


seathiefwang/FaceRecognition-tensorflow

這是我寫的一個項目,非常適合新手,裡面的步驟都有詳細的介紹。


適合入門的8個趣味機器學習項目 適合入門的8個趣味機器學習項目-博客-雲棲社區-阿里雲


對於神經網路的入門,可以參考mnist,10個數字的識別。

在github上有很多例子,可以參考tensorflow或者其他框架的tutorial。


可以試試Tensorflow


推薦閱讀:

女朋友因為我在github上給別的女生star而生氣合適嗎?
GitHub或者oschina上有哪些有趣且小巧的JAVA EE開源項目?
在github上什麼樣的開源python 項目會比較火?
GitHub 上有哪些值得關注的 JAVA/JAVAEE項目?

TAG:人工智慧 | 數據挖掘 | 編程 | 機器學習 | GitHub |