如何生成關鍵詞雲圖?
如同這種的。
在現實生活中,很多人想做詞雲,也有了關鍵詞的數據但自己又不會做詞雲可怎麼辦,我給大家推薦幾款詞雲製作工具,讓你瞬間呈現美觀、酷炫的詞雲可視化。我們先來看看國外的詞雲製作工具:
1、Wordle
工具地址:http://www.wordle.net/
Wordle是一個用於從文本生成詞雲圖而提供的遊戲工具。雲圖會更加突出話題並頻繁地出現在源文本,你可以調整不同的字體,布局和配色方案等樣式。做完詞雲圖,你可以列印出來或儲存。
2、WordItOut
工具地址:http://worditout.com/
WordItOut的操作簡單,進入網站後只需要輸入一段文本,然後就可以生成各種樣式的「雲」文字。用戶可以根據自己的需要對WordItOut進行再設計,比如顏色、字元、字體、背景、文字位置等,保存下載後,可以複製。
但是WordItOut是不識別中文的,如果輸入中英混合的文本,保存後只顯示英文字體,對於不懂英文的同學是比較痛苦的。
3、Tagxedo
工具地址:http://www.tagxedo.com/
Tagxedo有幾大優點:強大的導入功能(可導入網頁、文字等)、自定義設置詞雲形狀(這個真心好)、可導入想要的字體、顏色主題多(各種選擇)等。最重要的是它支持中文哦,你可以根據自己的喜好進行設置字雲respin和respin,是一款很不錯的詞雲的製作工具。
4、Tagul
工具地址:https://tagul.com/
Tagul雲可以自定義字體、詞雲的形狀(有愛心、BUS、雪人、人像、UFO等),顏色等,做出來的詞雲圖很酷炫,為網站訪問者提供良好的用戶體驗。用戶可以在網站做好詞雲圖,然後印在衣服、杯子、滑鼠墊等地方,自己設計身邊的物件,感覺很有成就感,很實用的網站。
5、Tocloud
工具地址:http://www.tocloud.com/
ToCloud 是一個在線免費標籤雲生成器,你可以設置詞的長度和頻率。ToCloud也非常好用,它能提取短語,是一個比較好的標籤雲工具之一利用詞頻生成詞雲,你可以快速了解頁面優化了某些單詞。
現在,來兩款國內的數據產品,絕對國產,請接收。
1、圖悅
工具地址:http://www.picdata.cn/
這款國內的在線詞頻分析工具,在長文本自動分詞並製作詞雲方面還是很出眾的,而且也容易上手,還可以自定義定製圖形模板:標準、微信、地圖等,切換自如,用起來體驗很不錯。
但是圖悅在導出excel詞頻有一些不足的地方,不介意的話可以忽略。
2、BDP個人版
工具地址:https://me.bdp.cn/home.html
這是一款數據可視化工具,除了詞雲,還有很多其他酷炫的圖表,如GIS地圖、漏斗圖、瀑布圖、桑基圖等,來了解它們的詞雲。工具很容易上手,直接把詞語這個數據拉到維度欄,再選擇詞雲就瞬間呈現詞雲圖表,BDP會自動算好詞頻,你可以設置顏色,快速實現詞雲可視化,特別簡單。
不足之處,不是專門製作詞雲的工具,但是還有幾十種圖表供你使用,是一款比較好的數據分析工具。
這麼多款,大家自行選擇吧,感興趣的話都可以試試,會有很多有意思的發現,原來詞雲可視化是如此簡單。
題主就是想找個詞雲工具吧,統計分析下文本關鍵詞。
之前做PPT的時候嘗試了很多做詞雲圖的工具,網上搜一搜這樣的工具的確還是挺多的,不過做出來總是不滿意,現有的中文詞雲工具都不太好用,要麼太丑不能調格式,要麼不能自定義關鍵詞(事兒媽要求多...)。用了一圈,有一個倒還不錯,是藍標(對,你沒聽錯,就是那個營銷公關公司藍色游標)剛剛推出的大數據產品,叫BlueView詞雲工具。我現在基本上要用詞雲的地方都是用它來做的。先上效果圖,隨便粘一段文本好了...再別康橋...
如果想處理的文本再多一點也沒問題,20萬字以內基本都行。
最後附一下鏈接吧,自己搜入口不太好找。BlueView智能營銷系統 ,不過就是得先去他們平台註冊一下,找到「詞雲工具」。具體的還是得自己操作一遍才知道怎麼用,就不展開說了。很多軟體都可以做,下面奉上一個完整的教程:
首先你需要打開tagul網站,註冊登錄後就可以開始製作了。
1. 點擊下圖中的綠色按鈕: GET STARTED
2. Words: 如圖輸入你想要的文字,並定義號字型大小、顏色、角度、和字體。填下完畢後點擊「Visualize」進行確認更改3. Shapes: 選擇形狀我先上圖(自己親手做的),再講具體的方法吧
如果你覺得這就是你想要的效果,那就請接著往下看吧。
第三方詞雲工具固然方便,但是使用起來也是各種問題(如中文亂碼、詞雲形狀、字體顏色調整等等)。我和大家分享一下如何使用 R 語言的 jiebaR 和 wordcloud2 擴展包來完成中文文本(英文當然不在話下)的分詞,並且繪製關鍵詞詞雲。
0.前期準備
準備1:安裝 R ,你可以前往 The Comprehensive R Archive Network 下載並安裝程序。
準備2:把你需要分詞的文本放在一個 txt 文件中(強調:務必是 txt 格式!)。(你可以使用爬蟲獲取這部分文本,或者手動複製粘貼得到文本信息)
1.中文分詞
分詞是繪製詞雲的基礎,說得簡單一點就是將中文文本分割成一個個辭彙。舉個例子,我們現在按照XX演算法對句子「 對公司相關運營數據進行提取、多維度分析和整理」進行分詞,得到如下結果:
對、公司、相關、運營數據、進行提取、多維度、分析、和、整理
只有進行了分詞,才可以進行詞雲的繪製;如果你已經完成了這一步,並且統計出了每一個辭彙的頻數,可以直接略過這一步。
我們用 R語言的 jiebaR 包實現上述操作,如下:
1)安裝並載入 jiebaR 包
install.packages("jiebaR")
library(jiebaR)
2)導入原始文本
f&<-scan("/Users/XXX/Desktop/數據運營JD.txt",sep="
",what="",encoding="UTF-8")
需要注意的是 /Users/XXX/Desktop/數據運營JD.txt 應該是你的txt文件的路徑,不要直接copy。
3)開始分詞
分詞有很多種演算法,其原理不是我們要關注的重點
seg&<-qseg[f]
4)分詞處理
因為分詞出來可能會有很多常見的辭彙,但是沒啥用的,比如「的」、「是」、「什麼」一類的。我們需要將這個辭彙屏蔽掉。同時特別長的辭彙這裡我們也不要。
我的做法是將字元數控制在3-16之間,也就是最多4個漢字(1個漢字=4個字元),最少3個英文。
seg&<-seg[nchar(seg)&>2]
seg&<-seg[nchar(seg)&<17]
seg
這個時候分詞結果,也就是 seg 可以顯示在你的R程序上,如下圖所示:
5)對分詞進行轉置
為了方便後面的處理,我們需要對 seg 進行一次轉置(把橫著放變成豎著放)
m1&<-data.frame(seg)
2.統計詞頻
完成分詞後,你需要統計每一個詞出現的頻數,比如「 數據分析 10 」這樣的。
1)載入 sqldf 包
install.packages("sqldf")
library(sqldf)
2)統計詞頻
m2&<-sqldf("select seg,count(1) as freg from m1 group by seg")
結果如下:
3.繪製關鍵詞詞雲
1)載入 wordcloud2 包
install.palckages("wordcloud2")
library(wordcloud2)
2)繪製詞雲
wordcloud2(m2, size = 0.5, minSize = 0, gridSize = 3,color = "random-light", backgroundColor = "grey")
當然,這是丑了一點;你可以自行調整 wordcloud2 的參數,達到你想要的效果。
你也可以按照自己喜歡的圖形或者文字形狀來設置詞雲,比如頭像或者文字R。
wordcloud2(m2,figPath = "/Users/XXX/Desktop/人.png")
letterCloud(m2,word="R",size=2)
更多這這方便的參數細節,你可以到R的幫助文檔中查找 wordcloud2 的使用方法。有不清楚的,歡迎提問。
使用Mathematica中的Wordcloud函數
http://www.tagxedo.com/app.html用這個,具體教程看這個詞雲可視化—
我用的2013的office,在插入裡面有個應用程序那一欄,在裡面搜索pro word cloud就可以了
http://www.tagul.com(圖片來自微博,見水印)
我用 HTML5 Word Cloud 給 LikeU 做的詞雲,分析男生女生對自己的描述和對交往對象的期望, 效果挺好的,也很方便,推薦
女生介紹自己提到最多的詞
比如:性格,旅行,開朗,善良,安靜,活潑
男生介紹自己提到最多的詞
比如:性格,愛好,運動,開朗,工作,朋友
大家可以發現,男女之間有些品質是共同認可的,比如開朗,旅行,朋友;不同的是,男生提的更多的是工作,運動,女生提的更多的是看書,美食,安靜。 這跟你們的想法是否一致呢?
女生期望對方提到最多的詞
比如:責任,善良,陽光,上進心
男生期望對方提到最多的詞
比如:性格,善良,開朗,溫柔,賢惠
由此也可以發現,男女共同提到最多的還是善良;不同的是,男生更希望女生溫柔,賢惠,性格好;而女生更看中男生的品質是:責任,善良,陽光,上進心。
通過以上統計,希望能給大家交往中一點啟示和幫助。看來雖然互聯網新事物把世界顛覆的不行,中國傳統美德還在大家身邊保留地比較完好,至少LikeU的小夥伴都是這樣的,挺好,嘿嘿~
關注LikeU
大數據為你推薦優秀單身男女
~
作者:楊慧明RecSys鏈接:【男女有別】LikeU的小夥伴是這樣介紹自己的 - 數據科學之趣 - 知乎專欄修改你好,想問下出現這種情況,怎麼解決呀。
&> da=scan("C://Users//Administrator//Desktop//數據分析.txt",sep="
",what="",encoding="UTF-8")
Read 597 items
&> seg&<-qseg[da]
Error in file.exists(code) : 轉換文件名時出了問題--名字太長了?
----- 引用朋友的一個微信公眾號(運了個營)的文章
微信頭像換成這樣,簡直讓人挪不開眼!
==============1.效果展示 ==============
原圖是這樣的
「標籤雲」頭像效果是這樣的▽
當然,不限於這兩種
其他樣式自由發揮...
============== 2.製作流程 ==============
1.上傳圖片
打開易詞雲官網(易詞雲 - YWordle yciyun.com),在左側工具欄「模板」中選擇「自定義」,上傳本地圖片,上傳成功後,點擊圖片即可在右側呈現標籤雲效果;
2.修改配置
此步驟可設置單詞間隔、文字粗細、背景顏色、清晰度及字體;
3.設置數據
提供數據表格、自定義編輯和詞頻分析等3種數據導入形式。下面以最便捷的「詞頻分析」為例:在輸入框粘貼整段文字內容,點擊「刷新」按鈕即可生成;也可點擊「分詞統計」對內容分詞進行二次編輯。還可對詞頻進行隨機著色,或單獨對一個詞進行著色
4.下載
製作完成後,點擊左側「下載」按鈕,即可將圖片下載到本地保存。(生成圖片效果對如下)
當然,除了製作頭像,標籤雲還適用於創意海報、社會網路分析、可視化技術等多種場景,讓圖片展示更加炫酷有型!
============== 「易詞雲」優勢 ==============
對標籤雲(又叫字雲、詞雲)有了解的小夥伴都應該知道,目前網路上也有不少同類型產品。但功能最完善的基本都是英文站點(很多小夥伴表示操作不便),然鵝,大部分中文版又存在功能單一、識別度低、模板庫少等不足。綜合比較,易詞雲算是目前功能較為齊全的一款。
優勢1:模板庫豐富
易詞雲提供了多種類型的矢量圖,均可免費使用;
同時做了細緻分類,便於用戶查找(以下為部分截圖)。
優勢2:圖片格式多樣
為避免識別有誤,很多同類型平台僅限上傳透明背景的PNG圖片素材(需要摳圖、轉格式...太麻煩!),易詞雲除了可上傳PNG外,還多了JPG和SVG兩種格式選擇。
優勢3:圖片識別度高
即便是有比較複雜的背景,識別也毫無壓力。
優勢4:二次編輯更便捷
如果對已生成的圖片不滿意,可在數據設置中編輯替換文字內容、字型大小、顏色及數量,對呈現效果做調整,直至滿意。
後續我將持續完善。。。畢
有基於web詞雲工具嗎?不用手動收集文章,直接輸入關鍵詞就會幫你分析的工具。有這樣的詞雲嗎
Python的wordcloud庫+jieba分詞完美支持中文。
安利推廣Python編寫的支持中文詞雲(wordcloud)GUI界面程序附上使用方法:
另見:
胡歌的這張圖是怎麼做成的? - 蘇寧不賣電器的回答請問這種圖表是如何做出來的? - 蘇寧不賣電器的回答d3
可以參考這個,詞雲的製作方法
學習R吧,一兩行代碼就出來了。
如何製作圖表非常精美的 Excel 文檔?為什麼就不捨得搜索一下呢
R語言,超級英雄雲詞圖,你們要的自定義形狀來了(附完整教程) R語言,一行代碼實現高大上的「高考文字雲」(附完整教程) 可以百度一下,有現成的代碼
推薦閱讀:
※哪個網站可以下載股票多年的價格數據?
※想從事數據分析行業,請問可以有哪些擇業方向?
※Google Anlytics 為什麼不提供每個頁面的UV?
※中醫是不是就是大數據?
※新浪微博有哪些值得推薦的微博管理應用?
TAG:信息技術IT | 科技 | 數據分析 | 關鍵詞 | MicrosoftExcel |