用詞雲圖分析一帶一路峰會哪3個詞說的最多
前言
n
最近幾日關注度最高的新聞莫過於一帶一路峰會相關的消息,會議結束後,一帶一路峰會聯合公告已經公布出來了。
本文通過詞雲分析,了解本次公告以及習大大在峰會開幕式上主要都講了哪些關鍵內容。n1 一帶一路峰會聯合公告詞雲圖
n
5月17日公布的一帶一路峰會聯合公告的詞雲分析結果圖,如下:
詞雲圖上,字體越大表示該詞語在文件中出現的次數越多。
n從上圖可以看出,出現次數最多的3個詞語為「合作」、「我們」以及「加強」 ,基本可以看出,本次峰會是一個新的起點,今後需要做的事情還很多,需要各方務實合作,哈。
n2 一帶一路峰會開幕式上習大大的講話詞雲圖
n
分析開幕式上習大大的講話內容,得到詞雲圖如下:
從上圖可看出,出現次數最多的幾個詞語為「一帶一路」、「合作」、「我們」以及「發展」等。
n3 用python製作詞雲圖
n
下面主要來介紹下用python製作這個詞雲圖的過程,主要分為如下幾個步驟:
n- 從txt文件讀取需要分析的文本內容
- 使用jieba分詞工具進行中文分詞
- 選取合適的顯示圖形
- 用wordcloud進行詞雲圖顯示
- 保存圖片
n
n
n
n
n
一帶一路峰會聯合公告詞雲圖實現的代碼如下:
n# -*- coding: utf-8 -*-n"""nCreated on Wed May 17 2017nn@author: lemonn"""nnimport jiebanfrom wordcloud import WordCloud, ImageColorGeneratornimport matplotlib.pyplot as pltnimport osnimport PIL.Image as Imagenimport numpy as npnnwith open(ydyl_gb.txt, rb) as f:n# 讀取一帶一路峰會聯合公報的內容n# with open(yidaiyilu.txt, rb) as f:n text = f.read()n f.close()nn# 首先使用 jieba 中文分詞工具進行分詞nwordlist = jieba.cut(text, cut_all=False) n# cut_all, True為全模式,False為精確模式nnwordlist_space_split = .join(wordlist)nnd = os.path.dirname(__file__)nalice_coloring = np.array(Image.open(os.path.join(d,colors.png)))nmy_wordcloud = WordCloud(background_color=#F0F8FF, max_words=100, mask=alice_coloring,n max_font_size=300, random_state=42).generate(wordlist_space_split)nnimage_colors = ImageColorGenerator(alice_coloring)nnplt.show(my_wordcloud.recolor(color_func=image_colors))nplt.imshow(my_wordcloud) # 以圖片的形式顯示詞雲nplt.axis(off) # 關閉坐標軸nplt.show()nnmy_wordcloud.to_file(os.path.join(d, ydyl_gb_colors_cloud.png))n
n
更多精彩內容請關注微信公眾號:
n
「Python數據之道」
推薦閱讀:
※【PowerPivot技巧】使用切片器實現數據透視表報告的交互排序
※巧克力死忠粉調查報告
※全棧數據工程師養成攻略
※建立有效儀錶板的6項黃金法則