學習機器學習有哪些好工具推薦?


Matlab的statistics Toolbox+眾多擴展包,opencv,Octave,Python的Scipy庫也不錯,Weka,R。

其實工具都是其次,關鍵還是思想。


竟然沒有人提scikit.learn !!!!!!!!!!

震驚過後好好說話吧,其實語言什麼的都不是主要的。

首先推薦一個大而全的網站 http://mloss.org,這個網站搜集了非常多的機器學習包,幾乎涵蓋了你聽過的所有語言。

如果你是用python的話,那麼numpy, scipy, matplotlib是基礎的,然後就是大名鼎鼎的scikit.learn了。最近pandas也很火,可以提供類似R中dataframe的數據結構,pandas的作者 最近出版了一本書 Python for Data Analysis。

如果你想追求速度,那麼可以考慮Cython和PyPy。

Anyhow,Python是一門很靈活的語言,很多基於C和C++的包也提供了python介面(比如shogun)


我是主推Python系的機器學習工具鏈的。主要的理由是:

1.現在的研究熱點大都用Python實現。

2.Python可以編譯到C(通過Cython),所以可以很好的保護源碼。相對於Java的混淆位元組碼來說,編譯到C之後的Python源碼幾乎不可能被分析。

3.Python是免費的,雖然用起來比matlab要麻煩。但是有開源社區的支持,包括最近公布的numbapro可以把Python JIT到CUDA/GPU平台運行。極大的簡化了性能優化的工作。

4.Python在Linux集群上可以跑,但是matlab貌似是不行的。


Matlab和C++,一原型,一產品。求破。


一站式解決方案

好評:scikit-learn, weka

差評:mahout,不解釋

平常做調研用的一些工具

推薦系統:svd-feature

分類/回歸問題:liblinear, libsvm

liblinear適用於大數據集,注重訓練效率,不支持kernel trick。


python 的有很多,比如:

Tensorflow,

Theano,

sklearn,

如果你想用好他們,你還要學一下 numpy, pandas 整理你的數據.


統計學出身的話,推薦R,免費開源,包數量多,社區強大。有本書叫mahine learning for hackers用的就是R。


opencv的ml庫,matlab 的一些包,開源的一些包


機器學習還是很注重演算法的速度,因此真正做機器學習研究和演算法的基本都用C 或C++。


謝@Mathematics邀~!

python,可以提供你所需要的一切工具。

科學運算有numpy/scipy

常用的機器學習演算法庫有scikit-learn,初學者可以跟著官網的演算法一個一個看,如果都看懂了就入門了。

想玩玩深度學習有theano。

想要追求效率,還可以把C++的庫編譯成Python的擴展。

綜上所屬,沒有什麼Python不能做的。但是具體要用到python的哪個部分,就看你想做什麼了。


Matlab, Weka, Libsvm,


python啊 提供了numpy,theano等很多庫,語言學起來簡單很容易入門


theano

deep learning首推


Weka 非常適合初學者的工具


上面說的都是一些應用起來比較方便的工具,並不適合所有的初學者。如果你的目的是應用現成的工具,那還可以。如是你需要進一步了解演算法,以後可能會定製適合自己的問題的演算法,那就要找一些簡單的開源軟體,看一下別人是什麼實現一個演算法的。


GitHub 上的一個搜集 machine learning 各種 framework, lib, software,還有 free books,可以參考參考:

https://github.com/josephmisiti/awesome-machine-learning

另外兩個專門搜集相關書目、各種 material 的項目:

Qix/dl.md at master · ty4z2008/Qix · GitHub

Qix/dl2.md at master · ty4z2008/Qix · GitHub

以上均可以作為參考,因為內容太多太多。慢慢品嘗吧。


matlab, weka(java實現), R, python(文本處理方面非常強大)


我還是推薦R,因為python的語法非常的靈活,反正我初看《ML in action》,numpy,scipy庫基本上看不懂。我後來用R語言把這本書中的問題都做了一遍,基本上書中的演算法我都明白了,如果想看理論推導,可以參考《統計建模與R語言》。我推薦使用R來學習機器學習,可以快速的理解概念,演算法。至於實現,演算法都會了,難道實現還困難么?


首先看你用什麼編程語言

一般是Python和R

Python有很多優秀的庫,比如numpy,scipy,pandas,scikit-learn,pybrain,mlpy啊等等

R也可以用caret

還有想weka,orange這樣的軟體可以用。


機器學習:R python spark

數據挖掘/數據分析:sas spss


推薦閱讀:

對於人工智慧的學習有哪些建議?
人工智慧10年後會替代50%的工作,那剩下的人類以何為生?
人工智慧在最近20年有可能大量代替老師的工作嗎?
機器學習成就人工智慧,還是人工智慧成就機器學習?
文化水平低可以學人工智慧嗎?

TAG:人工智慧 | 數據挖掘 | 機器學習 | 模式識別 |