想參考一些用 Python 做機器學習或數據挖掘的例子和資源,如何獲取?
01-23
剛學完python,正好以後打算從事機器學習,數據挖掘方面的學習!請教大家有沒有用python做這方面的例子和資源啊?想熟悉一下!練練手!
可以下載機器學習包scikit-learn: machine learning in Python。包括了大部分機器學習的演算法及例子。
Kaggle Competition Past Solutions
--補充via評論區@None--
Solutions from past competitions這個網站收集了Kaggle很多比賽的很多代碼(包括很多Rank非常高的solution),其中有很多都是Python寫的----這大概是最好的Python做機器學習/數據挖掘實戰的例子了吧。
學會使用library可能還不夠,數據清洗、Feature Engineering等一樣非常重要。看看實戰吧~P.S. 這個站點「last update at 2014/06/27」...有點久遠,不過也夠了吧...
如果想實現複雜的演算法,核心部分還是需要用c++/c這種語言來寫, python適合寫跟application直接打交道的那一層。
Kaggle Blogs
《機器學習實戰》
sklearn,一直在更新,常用的演算法基本上比較全
pyML,兩年沒更新了,有一些sklearn中沒有的演算法
MDP,有少量演算法可用orange,做data mining的sage,matlab替代品,win下使用虛擬機在linux中運行.沒怎麼用過最主要的,學好numpy,和matplotlib,這兩個是基礎!!!看書從《機器學習實戰》開始,然後差不多可以入門英文的了
可以看集體智慧編程,網上有pdf
@顧默林提到的sklearn是真的利器,而且它的doc很完整,可以當做一份的機器學習大綱看了,其他的了解過的還有 pyML ,PyBrain ,matlab,opencv也有python的介面吧。
guiyi/CustomsDataMining
python上常用的就是sklearn、gensim之類的庫,可以去看看官方的一些小例子。另外,推薦可以去看看數析學院(http://datacademy.io),上面有一些不錯的python案例,都是國人精心翻譯的。
推薦閱讀:
※基於 Python 來編寫 Poc/Exp 該怎麼入門?
※零: 深度學習Theory&Code從0到1——先導篇之matplotlib 進階教程)
※一行Python代碼能做什麼?
※用 Python 怎樣實現一個九九乘法表?
※如何用python畫一朵花?