用詞雲圖分析一帶一路峰會哪3個詞說的最多

前言

n

最近幾日關注度最高的新聞莫過於一帶一路峰會相關的消息,會議結束後,一帶一路峰會聯合公告已經公布出來了。

本文通過詞雲分析,了解本次公告以及習大大在峰會開幕式上主要都講了哪些關鍵內容。

n

1 一帶一路峰會聯合公告詞雲圖

n

5月17日公布的一帶一路峰會聯合公告的詞雲分析結果圖,如下:

詞雲圖上,字體越大表示該詞語在文件中出現的次數越多。

n

從上圖可以看出,出現次數最多的3個詞語為「合作」、「我們」以及「加強」 ,基本可以看出,本次峰會是一個新的起點,今後需要做的事情還很多,需要各方務實合作,哈。

n

2 一帶一路峰會開幕式上習大大的講話詞雲圖

n

分析開幕式上習大大的講話內容,得到詞雲圖如下:

從上圖可看出,出現次數最多的幾個詞語為「一帶一路」、「合作」、「我們」以及「發展」等。

n

3 用python製作詞雲圖

n

下面主要來介紹下用python製作這個詞雲圖的過程,主要分為如下幾個步驟:

n

  • 從txt文件讀取需要分析的文本內容
  • n

  • 使用jieba分詞工具進行中文分詞
  • n

  • 選取合適的顯示圖形
  • n

  • 用wordcloud進行詞雲圖顯示
  • n

  • 保存圖片
  • n

一帶一路峰會聯合公告詞雲圖實現的代碼如下:

n

# -*- coding: utf-8 -*-n"""nCreated on Wed May 17 2017nn@author: lemonn"""nnimport jiebanfrom wordcloud import WordCloud, ImageColorGeneratornimport matplotlib.pyplot as pltnimport osnimport PIL.Image as Imagenimport numpy as npnnwith open(ydyl_gb.txt, rb) as f:n# 讀取一帶一路峰會聯合公報的內容n# with open(yidaiyilu.txt, rb) as f:n text = f.read()n f.close()nn# 首先使用 jieba 中文分詞工具進行分詞nwordlist = jieba.cut(text, cut_all=False) n# cut_all, True為全模式,False為精確模式nnwordlist_space_split = .join(wordlist)nnd = os.path.dirname(__file__)nalice_coloring = np.array(Image.open(os.path.join(d,colors.png)))nmy_wordcloud = WordCloud(background_color=#F0F8FF, max_words=100, mask=alice_coloring,n max_font_size=300, random_state=42).generate(wordlist_space_split)nnimage_colors = ImageColorGenerator(alice_coloring)nnplt.show(my_wordcloud.recolor(color_func=image_colors))nplt.imshow(my_wordcloud) # 以圖片的形式顯示詞雲nplt.axis(off) # 關閉坐標軸nplt.show()nnmy_wordcloud.to_file(os.path.join(d, ydyl_gb_colors_cloud.png))n

n

更多精彩內容請關注微信公眾號:

n

「Python數據之道」

推薦閱讀:

【PowerPivot技巧】使用切片器實現數據透視表報告的交互排序
巧克力死忠粉調查報告
全棧數據工程師養成攻略
建立有效儀錶板的6項黃金法則

TAG:Python | 数据可视化 | 数据分析 |