王寶強事件的數據分析

王寶強離婚事件,在全球華人圈颳起了一陣旋風,不僅讓王寶強本人的百度搜索指數在1天時間飆升835倍

也讓事件的女主角馬蓉的微博粉絲從幾十萬飆升到現在的534萬

周末忙裡偷閒寫了個爬蟲,爬下了馬蓉最後一條微博上面的評論的數據

截止目前該條微博已經有454萬條評論,花了2天時間爬下了接近50萬條,這些數據包括評論內容、評論人性別、出生日期、地理位置共4個維度的信息,經過統計處理,發現了以下有趣的點:

對50萬條評論內容進行去重分詞

最多人提及的詞語是 「賤人」,共有18%的人提及,接下來是「不要臉」,共有9.8%的人提及,然後是出軌,6.6%的人提及,然後有5.6%的人關心起了王的孩子,4%的人覺得馬蓉是現代潘金蓮,2.3%的人四級沒過不會寫英文的bitch寫成了碧池,2.3%的人好心提醒大家記得取關馬蓉,不給漲粉,1.3%的人質疑馬校花的身份,1.3%的人罵起了髒話他媽的。

本來以為關注這件事並評論的人應該女性佔大部分,結果

評論的人居然接近50%都是男性。

根據年齡統計,則是

按照地理位置統計,則是

Top10省份中,廣東的人無疑是最八卦的,或者說對這件事的反應是最激烈的。

恭喜一下我們的成都,成為八卦之都,因為從城市分布上看最多的評論者來自這裡。

另外有3個地方的女性最有 「發言權」,他們是

因為這3個地方的女性評論者超過70%

人均評論數 3.6

是有多恨她 - -!

最多的一個人評論了 3320次

傳說中的水軍?

輕點一贊,手有餘香,給個贊好么 (?????)

更多原創文章請關注專欄 數據時光機


推薦閱讀:

數據分析從入門到大師!
【數據蔣堂】多維分析的後台性能優化手段 | 第1期

TAG:王宝强 | 王宝强马蓉离婚事件 | 数据分析 |