Top10機器學習開源項目發布,歷時一個月評出 | 附GitHub地址
原作:Mybridge
問耕 補充整理量子位 出品 | 公眾號 QbitAI
從將近250個機器學習開源項目中,綜合各種條件進行打分排序,最終Mybridge團隊評選出十大最新、最棒的機器學習開源項目。
這份Top10名單中包括對象檢測、換臉、預測等等最熱的AI明星、話題性研究和代碼。它們在GitHub上的平均標星數量是2500多顆。
希望這10大開源項目,對你有所幫助~
Rank 10
NPMT
作者:Posenhuang等(微軟研究院)GitHub地址:https://github.com/posenhuang/NPMTStar:68
NPMT,基於短語的神經機器翻譯,這是一項來自微軟研究院團隊的研究。這個機器翻譯領域的新突破,沒有使用任何注意力機制。
這個方法通過Sleep-WAke網路(SWAN)明確地建模輸出序列中的短語結構。SWAN是一種基於分割的序列模型方法。
NPMT的源代碼基於Torch中的fairseq工具箱建立。fairseq是Facebook AI研究院開源的序列到序列工具箱,這個方法使用卷積神經網路來做語言翻譯,比循環神經網路提速9倍。
Rank 9
Deep-neuroevolution
作者:Uber AI實驗室GitHub地址:https://github.com/uber-common/deep-neuroevolutionStar:392
這是共享出行巨頭Uber開源的演算法,他們此前集中發布了5篇論文,支持一種正在興起的認識:通過用進化演算法來優化神經網路的神經進化(neuroevolution)也是為強化學習(RL)訓練深度神經網路的一種有效方法。
量子位也有過詳細報道《深度神經進化大有可為?Uber詳解如何用它優化強化學習 | 5篇論文》
而這次GitHub中公布的代碼,包括以下演算法的分散式實現:
1、Deep Neuroevolution: Genetic Algorithms Are a Competitive Alternative for Training Deep Neural Networks for Reinforcement Learning
論文地址:https://arxiv.org/abs/1712.06567
2、Improving Exploration in Evolution Strategies for Deep Reinforcement Learning via a Population of Novelty-Seeking Agents
論文地址:https://arxiv.org/abs/1712.06560
這些代碼基於OpenAI此前公布的源代碼和論文。
Rank 8
Simple
作者:chrisstroemel
GitHub地址:https://github.com/chrisstroemel/SimpleStar:235
Simple是貝葉斯優化的更具可擴展性的替代方法。像貝葉斯優化一樣,它的樣本效率很高,能用儘可能少的樣本收斂到全局最優。
對於典型的優化工作負載,貝葉斯優化消耗的CPU時間以分鐘計,而Simple使用的CPU時間以毫秒計。如下圖所示:
Rank 7
DeepJ
作者:Henry Mao等(加州大學聖迭戈分校)GitHub地址:https://github.com/calclavia/DeepJStar:313
DeepJ是一種端到端生成模型,能夠以特定的混合風格來實時創作鋼琴曲。這個演算法能夠生成可以調整參數的音樂,這種可調整的屬性,能為藝術家、電影製作人、作曲家等帶來實際的幫助。
使用這套代碼需要Python 3.5。
訪問下面的Demo地址,可玩、可感受,亦可當背景音聽。
Demo地址:https://deepj.ai/
Rank 6
Psychlab
作者:Charles Beattie等(DeepMind)GitHub地址:https://github.com/deepmind/lab/tree/master/game_scripts/levels/contributed/psychlabStar:4774
Psychlab,DeepMind為AI開設的心理學實驗室。
其實就是個第一人稱視角3D遊戲世界,這個心理學實驗室當然也是個模擬環境,研究對象是其中的深度強化學習智能體(Agents)。Psychlab能夠實現傳統實驗室中的經典心理學實驗,讓這些本來用來研究人類心理的實驗,也可以用在AI智能體上。
智能體在這個實驗室里還能幹什麼呢?DeepMind自己在論文中展示了8種任務。詳情可以點擊這裡,查看量子位之前的詳細報道《嗯?DeepMind開了個心理學實驗室》。
Rank 5
Dm_control
作者:DeepMindGitHub地址:https://github.com/deepmind/dm_controlStar:882
火遍全球的AlphaGo讓我們知道了強化學習打遊戲究竟有多6,這麼強大的演算法什麼時候才能打破次元壁,走進現實、控制物理世界中的物體呢?
DeepMind已經開始往這方面努力。他們此前發布的控制套件「DeepMind Control Suite」,就為設計和比較用來控制物理世界的強化學習演算法開了個頭。
Control Suite設計了一組有著標準化結構、可解釋獎勵的連續控制任務,還為強化學習Agent提供一組性能測試指標。
Control Suite中的任務可以分為14個領域,也就是14類物理模型,上排從左到右分別是:
體操機器人Acrobot,(兩節鐘擺)、杯中小球、倒立擺、獵豹形機器人、手指、魚、單足跳躍機器人,下排從左到右分別是人形機器人、機械手、鐘擺、質點、形似兩節手臂的Reacher、游泳機器人、步行者。
Rank 4
Lime
作者:Marco Ribeiro等(華盛頓大學)
GitHub地址:https://github.com/marcotcr/limeStar:3148
在這次的Top10項目中,這個算是「老資格」了。主要基於KDD2016上發表的論文:《「為什麼我應該相信你?」解釋任何分類器的預測》。
這個研究提出了局部可理解的與模型無關的解釋技術(Local Interpretable Model-Agnostic Explanations: LIME),一種用於解釋任何機器學習分類器的預測的技術,並在多種與信任相關的任務中評估了它的可用性。
下面這段視頻,是一個更直觀的解釋。
undefined_騰訊視頻Rank 3
Gradient-checkpointing
作者:OpenAIGitHub地址:https://github.com/openai/gradient-checkpointingStar:1107
GPU內存太小可能是神經網路訓練過程中最大的攔路虎。
不怕,用這個OpenAI推出的gradient-checkpointing工具程序包,對於前饋模型來說,僅僅需要增加20%的計算時間,就能讓GPU處理十倍大的模型。
這個工具包的開發者是OpenAI的研究科學家Tim Salimans和前Google Brain工程師的數據科學家Yaroslav Bulatov。
這個工具包使用了「用亞線性的存儲成本訓練神經網路」的技術,為簡單的前饋網路提供了等價的內存存儲,同時能為一般的神經網路節省內存,比如多層架構。
詳細內容,可見之前量子位的報道。
Rank 2
FaceSwap
作者:Hidde JansenGitHub地址:https://github.com/deepfakes/faceswapStar:3629
最近Deepfakes在AI、AV兩屆掀起軒然大波。簡單的說,就是AI可以幫你給AV小片換臉,替換成任何你想看的明星。
量子位在兩篇報道中,對此都有介紹:《不可描述,技術進步》、《艾瑪不哭!AI引起的「換臉」問題,AI正在解決》。
而FaceSwap是一個基於deepfakes的非官方開源項目。
Rank 1
Detectron
作者:Facebook AI研究院GitHub地址:https://github.com/facebookresearch/DetectronStar:11248
這個應該是當之無愧的第一吧。
Detectron是Facebook的物體檢測平台,今年初宣布開源,它基於Caffe2,用Python寫成,這次開放的代碼中就包含了Mask R-CNN的實現。
除此之外,Detectron還包含了ICCV 2017最佳學生論文RetinaNet,Ross Girshick(RBG)此前的研究Faster R-CNN和RPN、Fast R-CNN、以及R-FCN的實現。
量子位在此前的報道中也有過詳細的介紹:《Mask R-CNN源代碼終於來了,還有它背後的物體檢測平台》。
據說好多人一直在苦等這個~
就醬~
— 完 —
歡迎大家關注我們的專欄:量子位 - 知乎專欄
誠摯招聘
量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回復「招聘」兩個字。
量子位 QbitAI · 頭條號簽約作者
?? ? 追蹤AI技術和產品新動態
推薦閱讀:
※iForest (Isolation Forest)孤立森林 異常檢測 入門篇
※學Python,這10道題你一定得會
※Learning Explanatory Rules from Noisy Data 閱讀筆記1
※技術宅如何進化為女裝大佬