如何生成關鍵詞雲圖?

如同這種的。


在現實生活中,很多人想做詞雲,也有了關鍵詞的數據但自己又不會做詞雲可怎麼辦,我給大家推薦幾款詞雲製作工具,讓你瞬間呈現美觀、酷炫的詞雲可視化。我們先來看看國外的詞雲製作工具

1、Wordle

  工具地址:http://www.wordle.net/

  Wordle是一個用於從文本生成詞雲圖而提供的遊戲工具。雲圖會更加突出話題並頻繁地出現在源文本,你可以調整不同的字體,布局和配色方案等樣式。做完詞雲圖,你可以列印出來或儲存。

2、WordItOut

  工具地址:http://worditout.com/

  WordItOut的操作簡單,進入網站後只需要輸入一段文本,然後就可以生成各種樣式的「雲」文字。用戶可以根據自己的需要對WordItOut進行再設計,比如顏色、字元、字體、背景、文字位置等,保存下載後,可以複製。

  但是WordItOut是不識別中文的,如果輸入中英混合的文本,保存後只顯示英文字體,對於不懂英文的同學是比較痛苦的。

3、Tagxedo

  工具地址:http://www.tagxedo.com/

  Tagxedo有幾大優點:強大的導入功能(可導入網頁、文字等)、自定義設置詞雲形狀(這個真心好)、可導入想要的字體、顏色主題多(各種選擇)等。最重要的是它支持中文哦,你可以根據自己的喜好進行設置字雲respin和respin,是一款很不錯的詞雲的製作工具。

4、Tagul

  工具地址:https://tagul.com/

  Tagul雲可以自定義字體、詞雲的形狀(有愛心、BUS、雪人、人像、UFO等),顏色等,做出來的詞雲圖很酷炫,為網站訪問者提供良好的用戶體驗。用戶可以在網站做好詞雲圖,然後印在衣服、杯子、滑鼠墊等地方,自己設計身邊的物件,感覺很有成就感,很實用的網站。

5、Tocloud

  工具地址:http://www.tocloud.com/

  ToCloud 是一個在線免費標籤雲生成器,你可以設置詞的長度和頻率。ToCloud也非常好用,它能提取短語,是一個比較好的標籤雲工具之一利用詞頻生成詞雲,你可以快速了解頁面優化了某些單詞。

現在,來兩款國內的數據產品,絕對國產,請接收。

1、圖悅

  工具地址:http://www.picdata.cn/

  這款國內的在線詞頻分析工具,在長文本自動分詞並製作詞雲方面還是很出眾的,而且也容易上手,還可以自定義定製圖形模板:標準、微信、地圖等,切換自如,用起來體驗很不錯。

  但是圖悅在導出excel詞頻有一些不足的地方,不介意的話可以忽略。

2、BDP個人版

  工具地址:https://me.bdp.cn/home.html

  這是一款數據可視化工具,除了詞雲,還有很多其他酷炫的圖表,如GIS地圖、漏斗圖、瀑布圖、桑基圖等,來了解它們的詞雲。工具很容易上手,直接把詞語這個數據拉到維度欄,再選擇詞雲就瞬間呈現詞雲圖表,BDP會自動算好詞頻,你可以設置顏色,快速實現詞雲可視化,特別簡單。

  不足之處,不是專門製作詞雲的工具,但是還有幾十種圖表供你使用,是一款比較好的數據分析工具。

  這麼多款,大家自行選擇吧,感興趣的話都可以試試,會有很多有意思的發現,原來詞雲可視化是如此簡單。


題主就是想找個詞雲工具吧,統計分析下文本關鍵詞。

之前做PPT的時候嘗試了很多做詞雲圖的工具,網上搜一搜這樣的工具的確還是挺多的,不過做出來總是不滿意,現有的中文詞雲工具都不太好用,要麼太丑不能調格式,要麼不能自定義關鍵詞(事兒媽要求多...)。用了一圈,有一個倒還不錯,是藍標(對,你沒聽錯,就是那個營銷公關公司藍色游標)剛剛推出的大數據產品,叫BlueView詞雲工具。我現在基本上要用詞雲的地方都是用它來做的。

先上效果圖,隨便粘一段文本好了...再別康橋...

這個工具最好的兩點就是,一可以更改形狀和顏色,二可以篩選關鍵詞,不想要哪個詞可以設置不顯示。

使用起來也很簡單,創建任務然後把文本粘貼進去就行了。可以保存PNG形式的圖片,想放哪兒就放哪兒。

如果想處理的文本再多一點也沒問題,20萬字以內基本都行。

最後附一下鏈接吧,自己搜入口不太好找。BlueView智能營銷系統 ,不過就是得先去他們平台註冊一下,找到「詞雲工具」。具體的還是得自己操作一遍才知道怎麼用,就不展開說了。


很多軟體都可以做,下面奉上一個完整的教程:

首先你需要打開tagul網站,註冊登錄後就可以開始製作了。

1. 點擊下圖中的綠色按鈕: GET STARTED

2. Words: 如圖輸入你想要的文字,並定義號字型大小、顏色、角度、和字體。填下完畢後點擊「Visualize」進行確認更改

3. Shapes: 選擇形狀

4. Fonts: 選擇字體

* MAC電腦的字體路勁在:C:WINDOWSFonts

5. Layout: 選擇布局

6. Colors and Animations: 顏色與合成

7. Download and Share: 下載和分享

用戶可以免費下載普通質量的圖片,例如我們看到的:

下載的文字雲圖用途多多,可在優禮品上定製成企業T恤、帆布袋、水杯、抱枕等。如圖:


我先上圖(自己親手做的),再講具體的方法吧

如果你覺得這就是你想要的效果,那就請接著往下看吧。

第三方詞雲工具固然方便,但是使用起來也是各種問題(如中文亂碼、詞雲形狀、字體顏色調整等等)。我和大家分享一下如何使用 R 語言的 jiebaR 和 wordcloud2 擴展包來完成中文文本(英文當然不在話下)的分詞,並且繪製關鍵詞詞雲。

0.前期準備

準備1:安裝 R ,你可以前往 The Comprehensive R Archive Network 下載並安裝程序。

準備2:把你需要分詞的文本放在一個 txt 文件中(強調:務必是 txt 格式!)。(你可以使用爬蟲獲取這部分文本,或者手動複製粘貼得到文本信息)

1.中文分詞

分詞是繪製詞雲的基礎,說得簡單一點就是將中文文本分割成一個個辭彙。舉個例子,我們現在按照XX演算法對句子「 對公司相關運營數據進行提取、多維度分析和整理」進行分詞,得到如下結果:

對、公司、相關、運營數據、進行提取、多維度、分析、和、整理

只有進行了分詞,才可以進行詞雲的繪製;如果你已經完成了這一步,並且統計出了每一個辭彙的頻數,可以直接略過這一步。

我們用 R語言的 jiebaR 包實現上述操作,如下:

1)安裝並載入 jiebaR 包

install.packages("jiebaR")
library(jiebaR)

2)導入原始文本

f&<-scan("/Users/XXX/Desktop/數據運營JD.txt",sep=" ",what="",encoding="UTF-8")

需要注意的是 /Users/XXX/Desktop/數據運營JD.txt 應該是你的txt文件的路徑,不要直接copy。

3)開始分詞

分詞有很多種演算法,其原理不是我們要關注的重點

seg&<-qseg[f]

4)分詞處理

因為分詞出來可能會有很多常見的辭彙,但是沒啥用的,比如「的」、「是」、「什麼」一類的。我們需要將這個辭彙屏蔽掉。同時特別長的辭彙這裡我們也不要。

我的做法是將字元數控制在3-16之間,也就是最多4個漢字(1個漢字=4個字元),最少3個英文

seg&<-seg[nchar(seg)&>2]
seg&<-seg[nchar(seg)&<17] seg

這個時候分詞結果,也就是 seg 可以顯示在你的R程序上,如下圖所示:

5)對分詞進行轉置

為了方便後面的處理,我們需要對 seg 進行一次轉置(把橫著放變成豎著放)

m1&<-data.frame(seg)

2.統計詞頻

完成分詞後,你需要統計每一個詞出現的頻數,比如「 數據分析 10 」這樣的。

1)載入 sqldf 包

install.packages("sqldf")
library(sqldf)

2)統計詞頻

m2&<-sqldf("select seg,count(1) as freg from m1 group by seg")

結果如下:

3.繪製關鍵詞詞雲

1)載入 wordcloud2 包

install.palckages("wordcloud2")
library(wordcloud2)

2)繪製詞雲

wordcloud2(m2, size = 0.5, minSize = 0, gridSize = 3,color = "random-light", backgroundColor = "grey")

當然,這是丑了一點;你可以自行調整 wordcloud2 的參數,達到你想要的效果。

你也可以按照自己喜歡的圖形或者文字形狀來設置詞雲,比如頭像或者文字R。

wordcloud2(m2,figPath = "/Users/XXX/Desktop/人.png")

letterCloud(m2,word="R",size=2)

更多這這方便的參數細節,你可以到R的幫助文檔中查找 wordcloud2 的使用方法。有不清楚的,歡迎提問。


使用Mathematica中的Wordcloud函數


http://www.tagxedo.com/app.html

用這個,具體教程看這個

詞雲可視化—


我用的2013的office,在插入裡面有個應用程序那一欄,在裡面搜索pro word cloud就可以了


http://www.tagul.com

(圖片來自微博,見水印)


我用 HTML5 Word Cloud 給 LikeU 做的詞雲,分析男生女生對自己的描述和對交往對象的期望, 效果挺好的,也很方便,推薦

  • 女生介紹自己提到最多的詞

比如:性格,旅行,開朗,善良,安靜,活潑

  • 男生介紹自己提到最多的詞

比如:性格,愛好,運動,開朗,工作,朋友

大家可以發現,男女之間有些品質是共同認可的,比如開朗,旅行,朋友;不同的是,男生提的更多的是工作,運動,女生提的更多的是看書,美食,安靜。 這跟你們的想法是否一致呢?

  • 女生期望對方提到最多的詞

比如:責任,善良,陽光,上進心

  • 男生期望對方提到最多的詞

比如:性格,善良,開朗,溫柔,賢惠

由此也可以發現,男女共同提到最多的還是善良;不同的是,男生更希望女生溫柔,賢惠,性格好;而女生更看中男生的品質是:責任,善良,陽光,上進心。

通過以上統計,希望能給大家交往中一點啟示和幫助。看來雖然互聯網新事物把世界顛覆的不行,中國傳統美德還在大家身邊保留地比較完好,至少LikeU的小夥伴都是這樣的,挺好,嘿嘿~

關注LikeU

大數據為你推薦優秀單身男女

~

作者:楊慧明RecSys

鏈接:【男女有別】LikeU的小夥伴是這樣介紹自己的 - 數據科學之趣 - 知乎專欄修改


你好,想問下出現這種情況,怎麼解決呀。

&> da=scan("C://Users//Administrator//Desktop//數據分析.txt",sep="
",what="",encoding="UTF-8")

Read 597 items

&> seg&<-qseg[da]

Error in file.exists(code) : 轉換文件名時出了問題--名字太長了?


----- 引用朋友的一個微信公眾號(運了個營)的文章

微信頭像換成這樣,簡直讓人挪不開眼!

==============1.效果展示 ==============

原圖是這樣的

「標籤雲」頭像效果是這樣的▽

當然,不限於這兩種

其他樣式自由發揮...

============== 2.製作流程 ==============

1.上傳圖片

打開易詞雲官網(易詞雲 - YWordle yciyun.com),在左側工具欄「模板」中選擇「自定義」,上傳本地圖片,上傳成功後,點擊圖片即可在右側呈現標籤雲效果;

2.修改配置

此步驟可設置單詞間隔、文字粗細、背景顏色、清晰度及字體;

3.設置數據

提供數據表格、自定義編輯和詞頻分析等3種數據導入形式。下面以最便捷的「詞頻分析」為例:在輸入框粘貼整段文字內容,點擊「刷新」按鈕即可生成;也可點擊「分詞統計」對內容分詞進行二次編輯。還可對詞頻進行隨機著色,或單獨對一個詞進行著色

4.下載

製作完成後,點擊左側「下載」按鈕,即可將圖片下載到本地保存。(生成圖片效果對如下)

當然,除了製作頭像,標籤雲還適用於創意海報、社會網路分析、可視化技術等多種場景,讓圖片展示更加炫酷有型!

============== 「易詞雲」優勢 ==============

對標籤雲(又叫字雲、詞雲)有了解的小夥伴都應該知道,目前網路上也有不少同類型產品。但功能最完善的基本都是英文站點(很多小夥伴表示操作不便),然鵝,大部分中文版又存在功能單一、識別度低、模板庫少等不足。綜合比較,易詞雲算是目前功能較為齊全的一款。

優勢1:模板庫豐富

易詞雲提供了多種類型的矢量圖,均可免費使用;

同時做了細緻分類,便於用戶查找(以下為部分截圖)。

優勢2:圖片格式多樣

為避免識別有誤,很多同類型平台僅限上傳透明背景的PNG圖片素材(需要摳圖、轉格式...太麻煩!),易詞雲除了可上傳PNG外,還多了JPG和SVG兩種格式選擇。

優勢3:圖片識別度高

即便是有比較複雜的背景,識別也毫無壓力。

優勢4:二次編輯更便捷

如果對已生成的圖片不滿意,可在數據設置中編輯替換文字內容、字型大小、顏色及數量,對呈現效果做調整,直至滿意。

後續我將持續完善。。。畢


有基於web詞雲工具嗎?不用手動收集文章,直接輸入關鍵詞就會幫你分析的工具。有這樣的詞雲嗎


Python的wordcloud庫+jieba分詞完美支持中文。

安利推廣

Python編寫的支持中文詞雲(wordcloud)GUI界面程序

附上使用方法:

另見:

胡歌的這張圖是怎麼做成的? - 蘇寧不賣電器的回答

請問這種圖表是如何做出來的? - 蘇寧不賣電器的回答


d3


可以參考這個,詞雲的製作方法


學習R吧,一兩行代碼就出來了。


如何製作圖表非常精美的 Excel 文檔?

為什麼就不捨得搜索一下呢


R語言,超級英雄雲詞圖,你們要的自定義形狀來了(附完整教程) R語言,一行代碼實現高大上的「高考文字雲」(附完整教程) 可以百度一下,有現成的代碼


推薦閱讀:

哪個網站可以下載股票多年的價格數據?
想從事數據分析行業,請問可以有哪些擇業方向?
Google Anlytics 為什麼不提供每個頁面的UV?
中醫是不是就是大數據?
新浪微博有哪些值得推薦的微博管理應用?

TAG:信息技術IT | 科技 | 數據分析 | 關鍵詞 | MicrosoftExcel |