Python中文文本挖掘資料(轉貼怕自己忘記)
這些網址是我在學習python中文文本挖掘時覺得比較好的網站,記錄一下,後期也會不定期添加:
1.http://www.52nlp.cn/python-%E7%BD%91%E9%A1%B5%E7%88%AC%E8%99%AB-%E6%96%87%E6%9C%AC%E5%A4%84%E7%90%86-%E7%A7%91%E5%AD%A6%E8%AE%A1%E7%AE%97-%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0-%E6%95%B0%E6%8D%AE%E6%8C%96%E6%8E%98
非常全的網址,講了各個庫,還有github代碼地址
2.http://blog.csdn.net/abcjennifer/article/details/23615947
Rachel Zhang的文章,運用的各種演算法,可以測出準確率
3.http://www.ibm.com/developerworks/cn/data/library/bd-natural-language/
利用python、scikit和文本分析來實現行為分析
4.http://developer.51cto.com/art/201507/485276.htm
一個完整的介紹分詞,從導入數據集到最後結果
5.http://www.tuicool.com/articles/U3uiiu
一個簡單的例子,jieba分詞
6.http://scikit-learn.org/stable/modules/feature_extraction.html
官網上對文本分析的介紹
7.http://ju.outofmemory.cn/entry/74958
scikit文本特徵提取
8.http://blog.csdn.net/lsldd/article/details/41520953
一個博主寫的,簡單的分詞
9.http://zhuanlan.zhihu.com/textmining-experience/19630762
知乎上的文本分析專欄
10.http://www.clips.ua.ac.be/pages/pattern-en#sentiment
pattern包得用法
作者:Charlotte77
推薦閱讀:
※用R語言畫詞雲圖(文本挖掘應用之一)>step by step
※Tagxedo個性化詞雲的繪圖思路是什麼?
※學習文本挖掘,如何入門?
※文本分析上nltk和snownlp有什麼區別,哪個更適合,有什麼好的學習資源?
※文本情感分析有什麼好資料、網站、工具推薦呢?
TAG:文本挖掘 |