美國大選Facebook輿情分析——基於R
2016年7月27日,希拉里·柯林頓順利成為民主黨總統候選人,這也意味著她將和之前成為共和黨總統候選人的唐納德·特朗普在11月份進行最終角逐。兩位候選人在之前的五個月的網路口水仗,也使得各大社交平台異彩紛呈。為了從社交媒體這一渠道對兩位候選人的競選表現和粉絲基礎有一個更為具體的了解。我們分析了一年多以來柯林頓(大約360萬粉絲)和特朗普(大約800萬粉絲)的Facebook流量。
數據獲取
用R包「Rfacebook」爬取了2015年5月1日到2016年5月31日的候選人Facebook官方主頁的內容,獲得了這段時間內所有的帖子和相應的評論(特朗普大約140萬評論而柯林頓大約120萬評論)。然後用R的文本挖掘包和文本數據定量分析方法,基於LIWC的詞條目錄對每個評論(不含非英文內容)單獨解析它的情緒和心理結構。最後,我們匯總成為日度數據進行分析。
情緒氛圍
特朗普評論區相較柯林頓表現得更為積極:數據顯示特朗普的積極評論佔比69.46%,消極評論佔比30.46%;柯林頓的積極評論佔比65.94%,消極評論佔比33.94%。而第二張圖顯示特朗普評論區的情緒分化現象更為顯著:這裡用百分比的變異係數來表示情緒分化程度,特朗普評論的百分比變異係數是122.23,而柯林頓的是115.31,這確實很容易理解,特朗普自競選以來發表了種種言論,要麼引來狂熱的追捧,要麼被人詬病為瘋子。
樂觀程度
柯林頓的擁護者相較而言對競選前景表現得更為樂觀(柯林頓31.13%而特朗普是29.57%),並但是可以發現特朗普的評論區有一種向上的積極發展趨勢。同樣,特朗普評論區的樂觀程度分化也更為顯著,擁有130.12的變異係數,而柯林頓只有126.11。
擁護者群體的包容度
第四張圖顯示了評論區中,擁護者相互包容的的程度。比如說如果評論中更多的「我們」出現,則擁護者內部是更加包容和團結的;如果評論中更多的「我」出現,則擁護者內部是更加獨立的。結果顯示雙方表達方式有很大不同,特朗普的擁護者表述的方式更加獨立(36.12%),而柯林頓的擁護者相對包容(30.38%),這可能意味著柯林頓的擁護者能夠更好地凝聚力量支持他們的選擇。
七月底民調結果顯示柯林頓的支持率首次被特朗普反超,但是緊接著由於特朗普的不當言論,柯林頓重獲優勢,但無論下一任世界領袖的歸屬如何,最終決定這一結果的,還是數據。推薦閱讀:
※不得不知的數據競賽之「最」——最全數據競賽匯總
※怎麼理解馬雲說的DT時代的「利他」 ?
※R語言之數據管理
※UCSD 2017秋季數據科學項目閃亮登場!
※我們在可視化什麼?
TAG:数据 |