2017年機器學習開源項目TOP30

在2017年,我們比較了將近8800個開源的機器學習項目,並從中選出了前30名(0.3%的幾率)。

這是一個極具競爭力的排行,我精心挑選了2017年1月至12月發布的最好的開源機器學習庫、數據集和應用程序。Mybridge AI通過考量受歡迎程度、參與度和新近度來等指標來評估這些參選項目的質量。為了給你一個關於質量的參考,GitHub星的平均數量是3558顆。

開源項目對數據科學家來說非常有用。您可以通過閱讀源代碼進行學習,然後在已經存在的項目上構建自己的東西。現在讓我們輕鬆地學習過去一年你可能錯過的機器學習項目吧。

推薦相關學習書籍名單 :

A)神經網路

深度學習A-Z:動手的人工神經網路(Deep Learning A-Z: Hands-On Artificial Neural Networks)

[68,745條推薦,4.5/5星]

B)TensorFlow

用Python進行深度學習的TensorFlow完整指南(Complete Guide to TensorFlow for Deep Learning with Python)

[17,834條推薦,4.6/5星]

開源項目排行榜

第 1 名

FastText:快速文本表示/分類庫。

[在Github上有11786顆星] 由Facebook Research提供

[Muse: 基於快速文本的多語言無監督或監督詞嵌入。在Github上有695顆星]

第 2 名

Deep-photo-styletransfer:論文《深度照片風格轉移》(Deep Photo Style Transfer)的代碼和數據。

[在Github上有9747顆星星] 由康奈爾大學 Fujun Luan 博士提供

第 3 名

face recognition:最簡單的 Python 命令行面部識別 API。

[在Github上有8672個星] 由Adam Geitgey提供

第 4 名

Magenta:機器智能音樂與藝術生成器。

[在Github上有 8113顆星]

第 5 名

Sonnet:基於TensorFlow的神經網路庫。

[在Github上有5731顆星]。 由Deepmind公司的Malcolm Reynolds提供

第 6 名

deeplearn.js:一種用於web的硬體加速機器智能庫。

[在Github上有5462顆星]。 由Google Brain的Nikhil Thorat提供

第 7 名

Fast Style Transfer:TensorFlow的快速風格轉換。

[在Github上有4843顆星] 由MIT的Logan Engstrom提供

第 8 名

Pysc2:星際爭霸II學習環境。

[在Github上有3683顆星星] 由DeepMind的Timo Ewalds提供

第 9 名

AirSim:基於Unreal Engine的開源模擬器,用於微軟AI&Research自主車輛。

[在Github上有3861顆星]。 由Microsoft的Shital Shah提供

第 10 名

Facets: 機器學習數據集可視化工具。

[在Github上有3371顆星] 由Google Brain提供

第 11 名

Style2Paints:人工智慧圖像彩色化。

[在Github上有3310顆星]

第 12 名

Tensor2Tensor:用於廣義序列-序列模型的工具庫

[在Github上有3087顆星] 由Google Brain的Ryan Sepassi提供

第 13 名

CycleGAN and pix2pix in PyTorch:基於 PyTorch 的圖像-圖像轉換工具(例如horse2zebra,edges2cats等)。

[在Github上有2847顆星] 由伯克利的Jun-Yan Zhu博士提供

第 14 名

Faiss:用於密集向量高效相似性搜索和聚類的庫。

[在Github上有2629顆星]。 由Facebook Research提供

第 15 名

Fashion-mnist:一種類似於MNIST的時尚產品數據集。

[在Github上有2780顆星星] 由Zalando Tech的研究科學家Han Xiao提供

第 16 名

ParlAI:用於在各種公開可用的對話數據集上訓練和評估人工智慧模型的框架。

[在Github上有2578顆星]。 有Facebook研究院的Alexander Miller提供

第 17 名

Fairseq:Facebook人工智慧研究序列-序列的工具包。

[在Github上有2571顆星]

第 18 名

Pyro:使用Python和PyTorch進行深度通用概率編程。

[在Github上有的2387顆星] 由Uber Engineering提供

第 19 名

iGAN:由GAN支持的互動式圖像生成器。

[在Github上有2369顆星]

第 20 名

Deep-image-prior:使用神經網路進行圖像恢復,但無需學習神經網路。

[在Github上有2188顆星] 由Skoltech博士Dmitry Ulyanov提供

第 21 名

Face_classification:使用fer2013/imdb數據集與keras CNN模型和openCV進行實時人臉檢測和情感/性別分類。

[在Github上有1967星]

第 22 名

Speech-to-Text-WaveNet:使用DeepMind的WaveNet和tensorflow構成端到端的句級英語語音識別。

[在Github上有1961星] 由Kakao Brain的Namju Kim提供

第 23 名

StarGAN:用於多領域圖像-圖像轉換的統一生成對抗網路。

[在Github上有1954顆星] 由韓國大學的Yunjey Choi提供

第 24 名

Ml-agents:Unity機器學習代理。

[在Github上有的1658顆星] Deep Learning at Unity3D 的Unity Juliani提供

第 25 名

DeepVideoAnalytics:分散式可視化搜索和可視化數據分析平台。

[在Github上有1494顆星] 由康奈爾大學的Akshay Bhat博士提供

第 26 名

OpenNMT:Torch上的開源神經機器翻譯。

[在Github上有1490顆星]

第 27 名

Pix2pixHD:使用條件GANs合成和處理2048×1024解析度的圖像。

[在Github上有1283顆星] 由Nvidia的AI Research 科學家 Ming-Yu Liu提供

第 28 名

Horovod:TensorFlow的分散式訓練框架。

[在Github上有1188顆星] 由Uber Engineering提供

第 29 名

AI-Blocks: 一個強大而直觀的所見即所得的界面,能夠允許任何人創建機器學習模型。

[在Github上有899顆星]

第 30 名

Voice Conversion with Non-Parallel Data:基於Tensorflow的深度神經網路語音轉換(或語音風格轉換)。

[在Github上有845顆星] 由AI Kakao Brain的AI 研究院的Dabi Ahn提供

本文由阿里云云棲社區組織翻譯。

文章原標題《30 Amazing Machine Learning Projects for the Past Year (v.2018)》

作者:Mybridge

譯者:奧特曼,審校:袁虎。

文章為簡譯,更為詳細的內容,請查看原文

更多技術乾貨敬請關注云棲社區知乎機構號:阿里云云棲社區 - 知乎


推薦閱讀:

利用python進行數據分析之準備(一)
如何理解 Python 的 Descriptor?
Python爬蟲學習:妹子圖
第四章 文本和位元組序列

TAG:Python | 大数据 | GitHub |