想參考一些用 Python 做機器學習或數據挖掘的例子和資源,如何獲取?

剛學完python,正好以後打算從事機器學習,數據挖掘方面的學習!請教大家有沒有用python做這方面的例子和資源啊?想熟悉一下!練練手!


可以下載機器學習包scikit-learn: machine learning in Python。包括了大部分機器學習的演算法及例子。


Kaggle Competition Past Solutions

--補充via評論區@None--

Solutions from past competitions

這個網站收集了Kaggle很多比賽的很多代碼(包括很多Rank非常高的solution),其中有很多都是Python寫的----這大概是最好的Python做機器學習/數據挖掘實戰的例子了吧。

學會使用library可能還不夠,數據清洗、Feature Engineering等一樣非常重要。看看實戰吧~

P.S. 這個站點「last update at 2014/06/27」...有點久遠,不過也夠了吧...


如果想實現複雜的演算法,核心部分還是需要用c++/c這種語言來寫, python適合寫跟application直接打交道的那一層。


Kaggle Blogs


《機器學習實戰》


sklearn,一直在更新,常用的演算法基本上比較全

pyML,兩年沒更新了,有一些sklearn中沒有的演算法

MDP,有少量演算法可用

orange,做data mining的

sage,matlab替代品,win下使用虛擬機在linux中運行.沒怎麼用過

最主要的,學好numpy,和matplotlib,這兩個是基礎!!!

看書從《機器學習實戰》開始,然後差不多可以入門英文的了


可以看集體智慧編程,網上有pdf


@顧默林提到的sklearn是真的利器,而且它的doc很完整,可以當做一份的機器學習大綱看了,其他的了解過的還有 pyML ,PyBrain ,matlab,opencv也有python的介面吧。


guiyi/CustomsDataMining


python上常用的就是sklearn、gensim之類的庫,可以去看看官方的一些小例子。另外,推薦可以去看看數析學院(http://datacademy.io),上面有一些不錯的python案例,都是國人精心翻譯的。


推薦閱讀:

基於 Python 來編寫 Poc/Exp 該怎麼入門?
零: 深度學習Theory&Code從0到1——先導篇之matplotlib 進階教程)
一行Python代碼能做什麼?
用 Python 怎樣實現一個九九乘法表?
如何用python畫一朵花?

TAG:Python | 數據挖掘 | 機器學習 | Web安全測試 | 漏洞挖掘 |