Python數據分析及可視化實例之詞雲(9)

系列文章總目錄:Python數據分析及可視化實例目錄


安裝步驟:

敲黑板~~~~中文顯示按此操作,英文可以無視:

1、準備好一個中文字體,如 simhei.ttf;

2、將其複製到wordcloud安裝根目錄中;

3、在 wordcloud.py 中修改 FONT_PATH 為相應字體。

當然,你也可以在實例化的時候手動制定路徑,上面方法一勞永逸。

# WordCloud類class WordCloud(object): def __init__(self, font_path=None, width_=400, height=200, margin=2, ranks_only=None, prefer_horizontal=.9, mask=None, scale=1, color_func=None, max_words=200, min_font_size=4, stopwords=None, random_state=None, background_color=black, max_font_size=None, font_step=1, mode="RGB", relative_scaling=.5, regexp=None, collocations=True, colormap=None, normalize_plurals=True).......# 關鍵參數含義width : int (default=400) 畫布寬度height : int (default=200) 畫布高度ranks_only : boolean (default=False) 是否只用詞頻排序而不是實際詞頻統計值,默認 Falseprefer_horizontal : float (default=0.90) 詞語水平出現的頻率,默認 0.9 (即垂直出現頻率為 0.1 )mask : nd-array or None (default=None) 如果參數為空,則使用二維遮罩繪製詞雲。如果 mask 非空,設置的寬高值將被忽略,遮罩形狀被 mask 取代。除全白(#FFFFFF)的部分將不會繪製,其餘部分會用於繪製詞雲。scale : float (default=1) 計算與繪製圖像間的比例。對於較大的詞雲圖像,使用比例而非較大的畫布會顯著提升繪圖速度,但是可能會造成詞語間的粗糙擬合。max_words : number (default=200) 詞語的最大數量stopwords : set of strings 停用詞max_font_size : int or None (default=None) 最大詞的最大字型大小;如果不指定,則為圖像高度。# 其他參數自行測試理解

舉個例子:

from collections import Counter # 統計詞頻from wordcloud import WordCloud, STOPWORDS #生成詞雲、通用詞import matplotlib.pyplot as plt # 在線顯示data = [open(紅樓夢.txt,r,encoding=utf-8).read()]# print(data[:10])wc = WordCounter(data) # 基於Counter自定義的子類(留作業:結巴分詞、停用詞)wordcloud = WordCloud(background_color="white",width_=600, height=400, margin=5).fit_words(dict_fre)plt.imshow(wordcloud)plt.axis("off")plt.show()

顯示效果

膠水語言博大精深,

本主只得一二為新人帶路:

Python數據分析及可視化實例目錄


最後,別只收藏不關注哈

推薦閱讀:

《R語言實戰》第4章 筆記
七周成為數據分析師—Excel實戰篇
什麼是數據化管理
技巧——新建日期表
2017上半年總結:數據分析轉行成功

TAG:Python | 数据分析 | 数据可视化 |