學習機器學習有哪些好工具推薦?
01-06
Matlab的statistics Toolbox+眾多擴展包,opencv,Octave,Python的Scipy庫也不錯,Weka,R。
其實工具都是其次,關鍵還是思想。竟然沒有人提scikit.learn !!!!!!!!!!
震驚過後好好說話吧,其實語言什麼的都不是主要的。
首先推薦一個大而全的網站 http://mloss.org,這個網站搜集了非常多的機器學習包,幾乎涵蓋了你聽過的所有語言。
如果你是用python的話,那麼numpy, scipy, matplotlib是基礎的,然後就是大名鼎鼎的scikit.learn了。最近pandas也很火,可以提供類似R中dataframe的數據結構,pandas的作者 最近出版了一本書 Python for Data Analysis。
如果你想追求速度,那麼可以考慮Cython和PyPy。
Anyhow,Python是一門很靈活的語言,很多基於C和C++的包也提供了python介面(比如shogun)我是主推Python系的機器學習工具鏈的。主要的理由是:1.現在的研究熱點大都用Python實現。2.Python可以編譯到C(通過Cython),所以可以很好的保護源碼。相對於Java的混淆位元組碼來說,編譯到C之後的Python源碼幾乎不可能被分析。3.Python是免費的,雖然用起來比matlab要麻煩。但是有開源社區的支持,包括最近公布的numbapro可以把Python JIT到CUDA/GPU平台運行。極大的簡化了性能優化的工作。4.Python在Linux集群上可以跑,但是matlab貌似是不行的。
Matlab和C++,一原型,一產品。求破。
一站式解決方案
好評:scikit-learn, weka差評:mahout,不解釋平常做調研用的一些工具推薦系統:svd-feature分類/回歸問題:liblinear, libsvmliblinear適用於大數據集,注重訓練效率,不支持kernel trick。python 的有很多,比如:Tensorflow, Theano,
sklearn,
如果你想用好他們,你還要學一下 numpy, pandas 整理你的數據.統計學出身的話,推薦R,免費開源,包數量多,社區強大。有本書叫mahine learning for hackers用的就是R。
opencv的ml庫,matlab 的一些包,開源的一些包
機器學習還是很注重演算法的速度,因此真正做機器學習研究和演算法的基本都用C 或C++。
謝@Mathematics邀~!
python,可以提供你所需要的一切工具。
科學運算有numpy/scipy
常用的機器學習演算法庫有scikit-learn,初學者可以跟著官網的演算法一個一個看,如果都看懂了就入門了。想玩玩深度學習有theano。想要追求效率,還可以把C++的庫編譯成Python的擴展。
綜上所屬,沒有什麼Python不能做的。但是具體要用到python的哪個部分,就看你想做什麼了。Matlab, Weka, Libsvm,
python啊 提供了numpy,theano等很多庫,語言學起來簡單很容易入門
theanodeep learning首推
Weka 非常適合初學者的工具
上面說的都是一些應用起來比較方便的工具,並不適合所有的初學者。如果你的目的是應用現成的工具,那還可以。如是你需要進一步了解演算法,以後可能會定製適合自己的問題的演算法,那就要找一些簡單的開源軟體,看一下別人是什麼實現一個演算法的。
GitHub 上的一個搜集 machine learning 各種 framework, lib, software,還有 free books,可以參考參考:
https://github.com/josephmisiti/awesome-machine-learning另外兩個專門搜集相關書目、各種 material 的項目:
Qix/dl.md at master · ty4z2008/Qix · GitHubQix/dl2.md at master · ty4z2008/Qix · GitHub以上均可以作為參考,因為內容太多太多。慢慢品嘗吧。matlab, weka(java實現), R, python(文本處理方面非常強大)
我還是推薦R,因為python的語法非常的靈活,反正我初看《ML in action》,numpy,scipy庫基本上看不懂。我後來用R語言把這本書中的問題都做了一遍,基本上書中的演算法我都明白了,如果想看理論推導,可以參考《統計建模與R語言》。我推薦使用R來學習機器學習,可以快速的理解概念,演算法。至於實現,演算法都會了,難道實現還困難么?
首先看你用什麼編程語言一般是Python和RPython有很多優秀的庫,比如numpy,scipy,pandas,scikit-learn,pybrain,mlpy啊等等R也可以用caret還有想weka,orange這樣的軟體可以用。
機器學習:R python spark
數據挖掘/數據分析:sas spss
推薦閱讀:
※對於人工智慧的學習有哪些建議?
※人工智慧10年後會替代50%的工作,那剩下的人類以何為生?
※人工智慧在最近20年有可能大量代替老師的工作嗎?
※機器學習成就人工智慧,還是人工智慧成就機器學習?
※文化水平低可以學人工智慧嗎?