數據分析之《我不是葯神》

數據分析之《我不是葯神》

來自專欄 Python程序員11 人贊了文章

前言

作為暑期最受歡迎的電影之一,《我不是葯神》在上映之前就被刷屏,它不僅是豆瓣16年來第9部評分超過9.0的華語影片,也是第5部票房超過20億的影片。記得小編當時還在學校未放假時,葯神就在朋友圈被好友頻頻安利,於是一放假就迫不及待的去看了。看完給我的感覺就是中國這樣的電影真的太少了,毫無疑問,它的成功是必然的。於是在其上映一個月後,小編想看看全國網友對葯神的評價究竟如何,就做了關於葯神的影評分析。

數據抓取

此次數據爬取我們參考了之前其他文章中對於貓眼數據的爬取方法,調用其介面,每次取出1000頁的數據並進行去重,為了使最終的數據可靠性更高,小編抓取了多次當日的數據,代碼如下:

數據分析

我們先來看下所得到的數據

這個數據是小編去重後所得的,並且按照了城市進行排序,後面的部分主要圍繞評分、城市、評論展開。

首先看一下評分熱力圖

京津翼、江浙滬、珠三角等在各種榜單長期霸榜單的區域,在熱力圖中,依然佔據著重要地位。同時,我們看到東三省和四川、重慶所在區域也有著十分高的熱度,這表明葯神的熱度即使到現在也還是特別高的。

下面我們要看的是主要城市的評論數量與打分情況

打出最高分4.86的城市是無錫市,而最低分4.46是東莞市,而徐崢的家鄉上海打分在4.6左右。綜合各個城市的打分來看葯神的評分還是比較高的。

我們按照打分從高到底對城市進行排序

在評論數量最多的二十個城市中,評論數量最高的是深圳,北京,其次是成都。而後15名的評論數量和評分都差不多。說明葯神的口碑沒有出現兩極分化的現象。這也跟葯神一直以來的評價所對應。

我們把城市打分情況投射到地圖中:(紅色表示打分較高,藍色表示較低)

可以看出南北方對這部電影的評價都很高。這也是葯神的票房之高的原因。

看過了評分,我們看一下評論生成的詞雲圖,以下分別是原圖和據此繪製的詞雲圖

從生成的詞雲中可看出網友對葯神的評價最多的是好看,現實,感人,真實,良心。這與小編在朋友圈中看好友所發的對葯神的評價都是一致的。正如戰狼2一樣,把錢花在製作上,用心拍攝的良心大作,相信還是會有回報,國產電影是可以兼顧社會責任和商業利潤的!用心做電影,時代不會辜負你,觀眾不會辜負你!正如一些網友評論所說,這是中國電影人的良知覺醒,應該多些現實題材的呼籲,反映民眾的心聲,告訴政府和社會我們需要做什麼。

部分代碼展示

熱力圖

折線圖+柱形圖組合

詞雲

本篇代碼:

github.com/NGUWQ/yaoshe

此文思路來源於:數據森麟 「3天破9億!上萬條評論解讀《西虹市首富》是否值得一看」 一文。

對爬蟲,數據分析,演算法感興趣的朋友們,可以加微信公眾號 TWcoding,我們一起玩轉Python。

If it works for you.Please,star.

自助者,天助之

weixin.qq.com/r/Tyo7I4j (二維碼自動識別)

推薦閱讀:

TAG:數據分析 | 大數據分析 | python爬蟲 |