Top10機器學習開源項目發布,歷時一個月評出 | 附GitHub地址

原作:Mybridge

問耕 補充整理

量子位 出品 | 公眾號 QbitAI

從將近250個機器學習開源項目中,綜合各種條件進行打分排序,最終Mybridge團隊評選出十大最新、最棒的機器學習開源項目。

這份Top10名單中包括對象檢測、換臉、預測等等最熱的AI明星、話題性研究和代碼。它們在GitHub上的平均標星數量是2500多顆。

希望這10大開源項目,對你有所幫助~

Rank 10

NPMT

作者:Posenhuang等(微軟研究院)

GitHub地址:github.com/posenhuang/N

Star:68

NPMT,基於短語的神經機器翻譯,這是一項來自微軟研究院團隊的研究。這個機器翻譯領域的新突破,沒有使用任何注意力機制。

這個方法通過Sleep-WAke網路(SWAN)明確地建模輸出序列中的短語結構。SWAN是一種基於分割的序列模型方法。

NPMT的源代碼基於Torch中的fairseq工具箱建立。fairseq是Facebook AI研究院開源的序列到序列工具箱,這個方法使用卷積神經網路來做語言翻譯,比循環神經網路提速9倍。

Rank 9

Deep-neuroevolution

作者:Uber AI實驗室

GitHub地址:github.com/uber-common/

Star:392

這是共享出行巨頭Uber開源的演算法,他們此前集中發布了5篇論文,支持一種正在興起的認識:通過用進化演算法來優化神經網路的神經進化(neuroevolution)也是為強化學習(RL)訓練深度神經網路的一種有效方法。

量子位也有過詳細報道《深度神經進化大有可為?Uber詳解如何用它優化強化學習 | 5篇論文》

而這次GitHub中公布的代碼,包括以下演算法的分散式實現:

1、Deep Neuroevolution: Genetic Algorithms Are a Competitive Alternative for Training Deep Neural Networks for Reinforcement Learning

論文地址:arxiv.org/abs/1712.0656

2、Improving Exploration in Evolution Strategies for Deep Reinforcement Learning via a Population of Novelty-Seeking Agents

論文地址:arxiv.org/abs/1712.0656

這些代碼基於OpenAI此前公布的源代碼和論文。

Rank 8

Simple

作者:chrisstroemel

GitHub地址:github.com/chrisstroeme

Star:235

Simple是貝葉斯優化的更具可擴展性的替代方法。像貝葉斯優化一樣,它的樣本效率很高,能用儘可能少的樣本收斂到全局最優。

對於典型的優化工作負載,貝葉斯優化消耗的CPU時間以分鐘計,而Simple使用的CPU時間以毫秒計。如下圖所示:

Rank 7

DeepJ

作者:Henry Mao等(加州大學聖迭戈分校)

GitHub地址:github.com/calclavia/De

Star:313

DeepJ是一種端到端生成模型,能夠以特定的混合風格來實時創作鋼琴曲。這個演算法能夠生成可以調整參數的音樂,這種可調整的屬性,能為藝術家、電影製作人、作曲家等帶來實際的幫助。

使用這套代碼需要Python 3.5。

訪問下面的Demo地址,可玩、可感受,亦可當背景音聽。

Demo地址:deepj.ai/

Rank 6

Psychlab

作者:Charles Beattie等(DeepMind)

GitHub地址:github.com/deepmind/lab

Star:4774

Psychlab,DeepMind為AI開設的心理學實驗室。

其實就是個第一人稱視角3D遊戲世界,這個心理學實驗室當然也是個模擬環境,研究對象是其中的深度強化學習智能體(Agents)。Psychlab能夠實現傳統實驗室中的經典心理學實驗,讓這些本來用來研究人類心理的實驗,也可以用在AI智能體上。

智能體在這個實驗室里還能幹什麼呢?DeepMind自己在論文中展示了8種任務。詳情可以點擊這裡,查看量子位之前的詳細報道《嗯?DeepMind開了個心理學實驗室》。

Rank 5

Dm_control

作者:DeepMind

GitHub地址:github.com/deepmind/dm_

Star:882

火遍全球的AlphaGo讓我們知道了強化學習打遊戲究竟有多6,這麼強大的演算法什麼時候才能打破次元壁,走進現實、控制物理世界中的物體呢?

DeepMind已經開始往這方面努力。他們此前發布的控制套件「DeepMind Control Suite」,就為設計和比較用來控制物理世界的強化學習演算法開了個頭。

Control Suite設計了一組有著標準化結構、可解釋獎勵的連續控制任務,還為強化學習Agent提供一組性能測試指標。

Control Suite中的任務可以分為14個領域,也就是14類物理模型,上排從左到右分別是:

體操機器人Acrobot,(兩節鐘擺)、杯中小球、倒立擺、獵豹形機器人、手指、魚、單足跳躍機器人,下排從左到右分別是人形機器人、機械手、鐘擺、質點、形似兩節手臂的Reacher、游泳機器人、步行者。

Rank 4

Lime

作者:Marco Ribeiro等(華盛頓大學)

GitHub地址:github.com/marcotcr/lim

Star:3148

在這次的Top10項目中,這個算是「老資格」了。主要基於KDD2016上發表的論文:《「為什麼我應該相信你?」解釋任何分類器的預測》。

這個研究提出了局部可理解的與模型無關的解釋技術(Local Interpretable Model-Agnostic Explanations: LIME),一種用於解釋任何機器學習分類器的預測的技術,並在多種與信任相關的任務中評估了它的可用性。

下面這段視頻,是一個更直觀的解釋。

undefined_騰訊視頻v.qq.com圖標

Rank 3

Gradient-checkpointing

作者:OpenAI

GitHub地址:github.com/openai/gradi

Star:1107

GPU內存太小可能是神經網路訓練過程中最大的攔路虎。

不怕,用這個OpenAI推出的gradient-checkpointing工具程序包,對於前饋模型來說,僅僅需要增加20%的計算時間,就能讓GPU處理十倍大的模型。

這個工具包的開發者是OpenAI的研究科學家Tim Salimans和前Google Brain工程師的數據科學家Yaroslav Bulatov。

這個工具包使用了「用亞線性的存儲成本訓練神經網路」的技術,為簡單的前饋網路提供了等價的內存存儲,同時能為一般的神經網路節省內存,比如多層架構。

詳細內容,可見之前量子位的報道。

Rank 2

FaceSwap

作者:Hidde Jansen

GitHub地址:github.com/deepfakes/fa

Star:3629

最近Deepfakes在AI、AV兩屆掀起軒然大波。簡單的說,就是AI可以幫你給AV小片換臉,替換成任何你想看的明星。

量子位在兩篇報道中,對此都有介紹:《不可描述,技術進步》、《艾瑪不哭!AI引起的「換臉」問題,AI正在解決》。

而FaceSwap是一個基於deepfakes的非官方開源項目。

Rank 1

Detectron

作者:Facebook AI研究院

GitHub地址:github.com/facebookrese

Star:11248

這個應該是當之無愧的第一吧。

Detectron是Facebook的物體檢測平台,今年初宣布開源,它基於Caffe2,用Python寫成,這次開放的代碼中就包含了Mask R-CNN的實現。

除此之外,Detectron還包含了ICCV 2017最佳學生論文RetinaNet,Ross Girshick(RBG)此前的研究Faster R-CNN和RPN、Fast R-CNN、以及R-FCN的實現。

量子位在此前的報道中也有過詳細的介紹:《Mask R-CNN源代碼終於來了,還有它背後的物體檢測平台》。

據說好多人一直在苦等這個~

就醬~

歡迎大家關注我們的專欄:量子位 - 知乎專欄

誠摯招聘

量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回復「招聘」兩個字。

量子位 QbitAI · 頭條號簽約作者

?? ? 追蹤AI技術和產品新動態


推薦閱讀:

iForest (Isolation Forest)孤立森林 異常檢測 入門篇
學Python,這10道題你一定得會
Learning Explanatory Rules from Noisy Data 閱讀筆記1
技術宅如何進化為女裝大佬

TAG:機器學習 | 人工智慧 | 開源 |