看完鹿晗秀恩愛,我們用Python分析回顧薛之謙與李雨桐互撕的江湖事

9月21日上午10:04,薛之謙終於在微博曬出了勁爆證據,回應了前幾天李雨桐發布的微博《我和薛之謙的事絕非「愛情」這個範圍里能夠釋懷和解釋的》,回復如下:

圖1、薛之謙的回復微博

原文比較長,有興趣自行上薛之謙微博查看原文,不過薛之謙的回應思路很清晰,可以總結如下:

1、拿了李的100萬給小高的事純屬捏造

2、當時跟李在一起的時候,就跟小高協議分手了

3、曬出李雨桐寫的信,他們之間是李雨桐先愛上薛之謙的

4、曬出微信記錄,李雨桐曾經出軌過,請求薛之謙的原諒

5、和小高協議離婚,賣掉房子給的高的錢,並不是李雨桐給的,如果是拿了李雨桐的1000萬,願意入獄

6、給李公司分紅1079萬,個人轉賬給李218萬,給李買房買車花了200多萬

7、2015年夏天分手,李雨桐此時懷孕,兩人商量決定放棄孩子,李雨桐媽媽要100萬損失費,薛之謙同意。9月李有了韓國新男友,10月李家人稱手術大出血向薛之謙索要5000萬,但薛之謙稱李雨桐微博顯示李雨桐在韓國玩

8、11月8日,薛之謙被要求和李單獨談,李未出現,李母帶著一個男人對薛實施暴力,並將錄像發到網上

9、2016年1月26日與李雨桐父親簽署協議,支付了140萬,感情划上句號。

10、3月28日李重新加薛的微信,提出重新合作做服裝,並提出要借500萬資金,薛將UUJULY無償送給李,並願意送其50萬啟動資金,後店鋪閑置;

11、9月15日李雨桐家人聯繫薛之謙要100萬,薛之謙回復沒那麼傻,一邊微博罵他,一邊要錢,薛之謙拒絕。

12、2017年9月8日,李給薛發簡訊,稱給一天時間考慮,不然要將一切交給媒體。

薛之謙做出回應之後,整個事態有了什麼樣的變化呢?這裡我們使用Python,來對薛之謙這條微博產生的評論數據進行抓取與數據分析。

圖2、導入數據

導入數據後,可以看到,在短短不到一個小時內,就累計了16996條評論數據,我們就使用這份數據,看看網友們的態度是怎樣的。

圖3、回復內容數據

繪製詞雲圖,首先需要進行分詞,使用以下代碼,即可把網友們的回復,進行分詞,然後得到最後的分詞數據框。

圖4、分詞代碼示例

執行代碼,可以看到,第一列是回復的ID,第二列是分詞後的片語。

圖5、分詞結果

接著,使用這份數據,來進行詞雲圖的繪製,繪製之前,當然要把停用詞(的、吧、這等詞)去掉。

圖6、移除停用詞代碼

圖7、繪製詞雲圖

執行代碼,即可得到詞雲圖如下所示:

圖8、網友評論詞雲圖

從詞雲圖可以看出,網友們對於薛之謙的回應,基本保持相信的態度,表示一如既往地支持他。

這個結果也是小編的意料之中,咱們再回過頭,去看看李雨桐發布的微博,看看網友在薛之謙回應之前和回應之後,網友們對她的回復會不會有什麼變化。

圖9、李雨桐發布的微博

我們把這條微博今天之前的評論,也就是薛之謙回應之前的評論,進行詞雲圖的繪製,可以看到,如下所示:

圖10、薛之謙回應之前網友的態度

我們把這條微博今天的評論,也就是薛之謙回應之後的評論,進行詞雲圖的繪製,可以看到,如下所示:

圖11、薛之謙回應之後網友的態度

可以看到,薛之謙回應之後,李雨桐發布的微博下面,逐漸開始出現支持薛之謙的聲音,例如證據、出來、相信、打臉、出軌蹭熱度等詞語。

來自:小蚊子數據分析(微信號:wzdata)

作者:ken


你想更深入了解學習Python知識體系,你可以看一下我們花費了一個多月整理了上百小時的幾百個知識點體系內容:

【超全整理】《Python自動化全能開發從入門到精通》筆記全放送

為了方便大家學習,我建立了一個馬哥Python交流群,目前群內已經有2000多個小夥伴,學習寂寞的小夥伴不妨一起來玩~群號:515237230


推薦閱讀:

python爬蟲之微博評論爬取
給妹子講python--01好用的列表
抓取單博主的所有微博及其評論
Python操作SQLite/MySQL/LMDB/LevelDB

TAG:Python | Python教程 | Python入门 |