人工智慧都有哪些知名的開源項目?
人工智慧都有哪些知名的開源項目?
P.S. 希望是那種人工智慧生物模擬類的程序,比如,基於計算機圖形學模擬一個3D的人,然後這個人有各種感知系統,並且具有人的基本智能,這樣的開源項目有嗎?這樣描述下來貌似有種3D遊戲的感覺,不過,我想的東西應該要更純粹一些,不僅僅用於遊戲...
當前最知名的 AI 開源項目,要算 Google 的 TensorFlow 了。
不過題主描述的,應該是 AI 和 VR (虛擬現實)技術的綜合體,3D 的人的實現,基本要搞定基於 VR 的三維重建的, 雖然 AI 和 AR(增強現實)技術都是我豬廠看重的,但不得不說題主想要的,現在還差遠了——看、聽這類感知智能,硬體結合演算法,效果還是不錯的,但要有基本的人類智能,這就呵呵了(小孩都能夠基於常識學習、推理,機器還是依靠喂數據,不能舉一反三),更不用說超過遊戲了。
另外說到開源項目,MXNet 和 PaddlePaddle 還是不錯的,都是黃種人搞的。搞學術研究的話,也可以看看 PyTorch 。另外的另外,熊廠開源的自動駕駛平台 Apollo,應該是符合感知+智能+超越遊戲的預設的,不過不是直接模擬自然界存在的生物。
谷歌全新開源人工智慧系統TensorFlow
GitHub - jikexueyuanwiki/tensorflow-zh: 谷歌全新開源人工智慧系統TensorFlow官方文檔中文版
百度開源人工智慧系統:Warp-CTCGitHub - baidu-research/warp-ctc: Fast parallel CTC.
Python開發的人工智慧項目:1. Scikit-learn
www.github.com/scikit-learn/scikit-learn
Scikit-learn 是基於Scipy為機器學習建造的的一個Python模塊,他的特色就是多樣化的分類,回歸和聚類的演算法包括支持向量機,邏輯回歸,樸素貝葉斯分類器,隨機森林,Gradient Boosting,聚類演算法和DBSCAN。而且也設計出了Python numerical和scientific libraries Numpy and Scipy
2.Pylearn2
www.github.com/lisa-lab/pylearn2
Pylearn是一個讓機器學習研究簡單化的基於Theano的庫程序。
3.NuPIC
www.github.com/numenta/nupic
NuPIC是一個以HTM學習演算法為工具的機器智能平台。HTM是皮層的精確計算方法。HTM的核心是基於時間的持續學習演算法和儲存和撤銷的時空模式。NuPIC適合於各種各樣的問題,尤其是檢測異常和預測的流數據來源。
4. Nilearn
www.github.com/nilearn/nilearn
Nilearn 是一個能夠快速統計學習神經影像數據的Python模塊。它利用Python語言中的scikit-learn 工具箱和一些進行預測建模,分類,解碼,連通性分析的應用程序來進行多元的統計。
5.PyBrain
www.github.com/pybrain/pybrain
Pybrain是基於Python語言強化學習,人工智慧,神經網路庫的簡稱。 它的目標是提供靈活、容易使用並且強大的機器學習演算法和進行各種各樣的預定義的環境中測試來比較你的演算法。
6.Pattern
www.github.com/clips/pattern
Pattern 是Python語言下的一個網路挖掘模塊。它為數據挖掘,自然語言處理,網路分析和機器學習提供工具。它支持向量空間模型、聚類、支持向量機和感知機並且用KNN分類法進行分類。
7.Fuel
www.github.com/mila-udem/fuel
Fuel為你的機器學習模型提供數據。他有一個共享如MNIST, CIFAR-10 (圖片數據集), Google』s One Billion Words (文字)這類數據集的介面。你使用他來通過很多種的方式來替代自己的數據。
8.Bob
www.github.com/idiap/bob
Bob是一個免費的信號處理和機器學習的工具。它的工具箱是用Python和C++語言共同編寫的,它的設計目的是變得更加高效並且減少開發時間,它是由處理圖像工具,音頻和視頻處理、機器學習和模式識別的大量軟體包構成的。
9.Skdata
www.github.com/jaberg/skdata
Skdata是機器學習和統計的數據集的庫程序。這個模塊對於玩具問題,流行的計算機視覺和自然語言的數據集提供標準的Python語言的使用。
10.MILK
www.github.com/luispedro/milk
MILK是Python語言下的機器學習工具包。它主要是在很多可得到的分類比如SVMS,K-NN,隨機森林,決策樹中使用監督分類法。 它還執行特徵選擇。 這些分類器在許多方面相結合,可以形成不同的例如無監督學習、密切關係金傳播和由MILK支持的K-means聚類等分類系統。
11.IEPY
www.github.com/machinalis/iepy
IEPY是一個專註於關係抽取的開源性信息抽取工具。它主要針對的是需要對大型數據集進行信息提取的用戶和想要嘗試新的演算法的科學家。
12.Quepy
www.github.com/machinalis/quepy
Quepy是通過改變自然語言問題從而在資料庫查詢語言中進行查詢的一個Python框架。他可以簡單的被定義為在自然語言和資料庫查詢中不同類型的問題。所以,你不用編碼就可以建立你自己的一個用自然語言進入你的資料庫的系統。
現在Quepy提供對於Sparql和MQL查詢語言的支持。並且計劃將它延伸到其他的資料庫查詢語言。
13.Hebel
www.github.com/hannes-brt/hebel
Hebel是在Python語言中對於神經網路的深度學習的一個庫程序,它使用的是通過PyCUDA來進行GPU和CUDA的加速。它是最重要的神經網路模型的類型的工具而且能提供一些不同的活動函數的激活功能,例如動力,涅斯捷羅夫動力,信號丟失和停止法。
14.mlxtend
www.github.com/rasbt/mlxtend
它是一個由有用的工具和日常數據科學任務的擴展組成的一個庫程序。
15.nolearn
www.github.com/dnouri/nolearn
這個程序包容納了大量能對你完成機器學習任務有幫助的實用程序模塊。其中大量的模塊和scikit-learn一起工作,其它的通常更有用。
16.Ramp
www.github.com/kvh/ramp
Ramp是一個在Python語言下制定機器學習中加快原型設計的解決方案的庫程序。他是一個輕型的pandas-based機器學習中可插入的框架,它現存的Python語言下的機器學習和統計工具(比如scikit-learn,rpy2等)Ramp提供了一個簡單的聲明性語法探索功能從而能夠快速有效地實施演算法和轉換。
17.Feature Forge
www.github.com/machinalis/featureforge
這一系列工具通過與scikit-learn兼容的API,來創建和測試機器學習功能。
這個庫程序提供了一組工具,它會讓你在許多機器學習程序使用中很受用。當你使用scikit-learn這個工具時,你會感覺到受到了很大的幫助。(雖然這隻能在你有不同的演算法時起作用。)
18.REP
www.github.com/yandex/rep
REP是以一種和諧、可再生的方式為指揮數據移動驅動所提供的一種環境。
它有一個統一的分類器包裝來提供各種各樣的操作,例如TMVA, Sklearn, XGBoost, uBoost等等。並且它可以在一個群體以平行的方式訓練分類器。同時它也提供了一個互動式的情節。
19.Python 學習機器樣品
www.github.com/awslabs/machine-learning-samples
用亞馬遜的機器學習建造的簡單軟體收集。
20.Python-ELM
www.github.com/dclambert/Python-ELM
這是一個在Python語言下基於scikit-learn的極端學習機器的實現。
轉載自:20個頂尖的 Python 語言機器學習開源項目Avida by devosoft
GraphLab
GraphLab是一種新的面向機器學習的並行框架。GraphLab提供了一個完整的平台,讓機構可以使用可擴展的機器學習系統建立大數據以分析產品,該公司客戶包括Zillow、Adobe、Zynga、Pandora、Bosch、ExxonMobil等,它們從別的應用程序或者服務中抓取數據,通過推薦系統、欺詐監測系統、情感及社交網路分析系統等系統模式將大數據理念轉換為生產環境下可以使用的預測應用程序。( 詳情)項目主頁: http://graphlab.org/
Vowpal Wabbit
Vowpal Wabbit(Fast Online Learning)最初是由雅虎研究院建設的一個機器學習平台,目前該項目在微軟研究院。它是由John Langford啟動並主導的項目。 項目地址: http://hunch.net/~vw/scikits.learn
scikit-learn是一個開源的、構建在SciPy之上用於機器學習的 Python 模塊。它包括簡單而高效的工具,可用於數據挖掘和數據分析,適合於任何人,可在各種情況下重複使用、構建在 NumPy、SciPy和 matplotlib 之上,遵循BSD 協議。(詳情)項目地址: http://scikit-learn.org/stableTheano
Theano是一個python庫,用來定義、優化和模擬數學表達式計算,用於高效的解決多維數組的計算問題。它使得寫深度學習模型更加容易,同時也給出了一些關於在GPU上訓練它們的選項。( 詳情)項目地址: http://deeplearning.net/software/theano/Mahout
Mahout 是 Apache Software Foundation(ASF) 旗下的一個開源項目,提供一些可擴展的機器學習領域經典演算法的實現,旨在幫助開發人員更加方便快捷地創建智能應用程序。Mahout包含許多實現,包括聚類、分類、推薦過濾、頻繁子項挖掘。此外,通過使用 Apache Hadoop 庫,Mahout 可以有效地擴展到雲中。項目主頁: http://mahout.apache.org/pybrain
pybrain是Python的一個機器學習模塊,它的目標是為機器學習任務提供靈活、易應、強大的機器學習演算法。pybrain包括神經網路、強化學習(及二者結合)、無監督學習、進化演算法。以神經網路為核心,所有的訓練方法都以神經網路為一個實例。項目主頁: http://pybrain.org/OpenCV
OpenCV是一個基於(開源)發行的跨平台計算機視覺庫,可以運行在Linux、Windows和Mac OS操作系統上。它輕量級而且高效——由一系列 C 函數和少量 C++ 類構成,同時提供了Python、Ruby、MATLAB等語言的介面,實現了圖像處理和計算機視覺方面的很多通用演算法。( 詳情)項目主頁: http://opencv.org/Orange
Orange 是一個基於組件的數據挖掘和機器學習軟體套裝,它的功能即友好,又很強大,快速而又多功能的可視化編程前端,以便瀏覽數據分析和可視化,基綁定了 Python以進行腳本開發。它包含了完整的一系列的組件以進行數據預處理,並提供了數據帳目,過渡,建模,模式評估和勘探的功能。項目主頁: http://orange.biolab.si/NLTK
NLTK(natural language toolkit)是python的自然語言處理工具包。2001年推出,至今發展非常活躍。它的主要作用是為了教學,至今已經在20多個國家60多所高校使用,裡面包括了大量的詞料庫,以及自然語言處理方面的演算法實現:分詞, 詞根計算, 分類, 語義分析等。項目主頁: http://nltk.org/Nupic
Nupic是一個開源的人工智慧平台。該項目由Grok(原名 Numenta)公司開發,其中包括了公司的演算法和軟體架構。 NuPIC 的運作接近於人腦,「當模式變化的時候,它會忘掉舊模式,記憶新模式」。如人腦一樣,CLA 演算法能夠適應新的變化。( 詳情)項目主頁: http://numenta.org/nupic.html推薦閱讀: