數據分析之《我不是葯神》
來自專欄 Python程序員11 人贊了文章
前言
作為暑期最受歡迎的電影之一,《我不是葯神》在上映之前就被刷屏,它不僅是豆瓣16年來第9部評分超過9.0的華語影片,也是第5部票房超過20億的影片。記得小編當時還在學校未放假時,葯神就在朋友圈被好友頻頻安利,於是一放假就迫不及待的去看了。看完給我的感覺就是中國這樣的電影真的太少了,毫無疑問,它的成功是必然的。於是在其上映一個月後,小編想看看全國網友對葯神的評價究竟如何,就做了關於葯神的影評分析。
數據抓取
此次數據爬取我們參考了之前其他文章中對於貓眼數據的爬取方法,調用其介面,每次取出1000頁的數據並進行去重,為了使最終的數據可靠性更高,小編抓取了多次當日的數據,代碼如下:
數據分析
我們先來看下所得到的數據
這個數據是小編去重後所得的,並且按照了城市進行排序,後面的部分主要圍繞評分、城市、評論展開。
首先看一下評分熱力圖
京津翼、江浙滬、珠三角等在各種榜單長期霸榜單的區域,在熱力圖中,依然佔據著重要地位。同時,我們看到東三省和四川、重慶所在區域也有著十分高的熱度,這表明葯神的熱度即使到現在也還是特別高的。
下面我們要看的是主要城市的評論數量與打分情況
打出最高分4.86的城市是無錫市,而最低分4.46是東莞市,而徐崢的家鄉上海打分在4.6左右。綜合各個城市的打分來看葯神的評分還是比較高的。
我們按照打分從高到底對城市進行排序
在評論數量最多的二十個城市中,評論數量最高的是深圳,北京,其次是成都。而後15名的評論數量和評分都差不多。說明葯神的口碑沒有出現兩極分化的現象。這也跟葯神一直以來的評價所對應。
我們把城市打分情況投射到地圖中:(紅色表示打分較高,藍色表示較低)
可以看出南北方對這部電影的評價都很高。這也是葯神的票房之高的原因。
看過了評分,我們看一下評論生成的詞雲圖,以下分別是原圖和據此繪製的詞雲圖
從生成的詞雲中可看出網友對葯神的評價最多的是好看,現實,感人,真實,良心。這與小編在朋友圈中看好友所發的對葯神的評價都是一致的。正如戰狼2一樣,把錢花在製作上,用心拍攝的良心大作,相信還是會有回報,國產電影是可以兼顧社會責任和商業利潤的!用心做電影,時代不會辜負你,觀眾不會辜負你!正如一些網友評論所說,這是中國電影人的良知覺醒,應該多些現實題材的呼籲,反映民眾的心聲,告訴政府和社會我們需要做什麼。
部分代碼展示
熱力圖
折線圖+柱形圖組合
詞雲
本篇代碼:
https://github.com/NGUWQ/yaoshen
此文思路來源於:數據森麟 「3天破9億!上萬條評論解讀《西虹市首富》是否值得一看」 一文。
對爬蟲,數據分析,演算法感興趣的朋友們,可以加微信公眾號 TWcoding,我們一起玩轉Python。
If it works for you.Please,star.
自助者,天助之
http://weixin.qq.com/r/Tyo7I4jE3NWjrcxA939d (二維碼自動識別)
推薦閱讀: