從豆瓣數據中看國漫

隨著近幾年越來越多的良心國漫橫空出世,「國漫」這個話題又一次成為了熱點話題。《羅小黑戰記》《大聖歸來》《魁拔》等良心國漫的出世增加了大家對「國漫」的期待與信心。這次,叉鴿帶大家從豆瓣的數據中看國漫。

數據來源:豆瓣標籤「國產動畫」「國漫」的數據與短評(由於豆瓣限制每部動漫最多只爬取了220條短評)

首先我們來看一下豆瓣「國產動漫」「國漫」(一下均以「國漫」代替)年份與產量的折線圖:

從折線圖中看,除了1960-1980與1990-2000年間外,國漫產量總體呈上升趨勢。特別是2010年之後,產量相比之前增產150%左右。

接下來我們看一下根據豆瓣評分繪製的年份與產量折線圖(過濾了沒有評分的動漫):

從圖中可以看出,每條曲線的走向與總體走向基本一致。21世紀之後評分在6.0-8.0之間的動漫增長最為迅速。同時,評分在4.0-6.0之間的動漫增長也十分快,超越了評分在8.0-9.0之間的動漫產量。而評分在8.0-9.0、9.0-10.0的高分動漫基本上處於穩步增長的狀態。另外,1980-1990年間評分在6.0-8.0、8.0-9.0之間的高分動漫產量遠高於低分動漫,而且這十年間的高分動漫產量增長也及其迅速,不過接下來十年增長率就恢復到了正常水平。

下面我們再看兩張同樣關於年份、產量、質量的堆積圖(過濾了沒有評分的動漫):

從這兩張堆積圖中,我們可以看出1990-2000年間國漫極高評分(9.0-10.0)的動漫所佔的比重最大。而在21世紀之後出現了很多的極低分(2.0-4.0)的動漫,這導致了21世紀之後雖然高分動漫處於穩步增長的趨勢,但是其所佔的比重卻越來越小。這也是導致目前很多人對國漫越來越「失望」的原因之一。

雖然當今優秀動漫產量比重越來越小,但是優秀動漫中,21世紀之後的動漫還是佔有很大的比例的:

在這幅高分動漫年代分布圖中,我們可以看出21世紀之後的高分動漫佔總體百分比達到了55%。雖然如今低分動漫問題越來越嚴重,但是良心動漫廠還是能夠不忘初心打造精品動漫。

看完了和產量相關的數據,我們來看看更有趣的評論數據。這裡,叉鴿將評論數據分為兩部分。第一部分的評論數據分為四類:高分高評(影片、短評評分在8.0及以上)、高分低評(影片評分在8.0及以上,短評評分在4.0及以下)、低分低評(影片、短評評分在4.0及以下)、低分高評(影片評分在4.0及以下、短評評分在8.0及以上)

首先是高分高評的短評匯總:

從高分高評的評論關鍵詞雲中,「國產」、「童年」、「劇情」、「故事」、「配音」、「畫風」、「經典」等詞出現的頻率都比較高。真正的高分動漫除了情懷外,確實有很多閃光點。

接下來我們來看高分低評的短評匯總:

在高分低評的匯總圖中,「劇情」、「故事」、「畫面」、「配音」、「人設」等仍然佔有很大的比重。看來對於很多高分動漫,在劇情、畫面、配音方面仍有很大的進步空間。

下面我們再來看看低分低評的匯總:

在低分低評的匯總圖中,「抄襲」佔了最大的比重。國漫中存在很多抄襲外國優秀動漫[而且抄的很沒有尊嚴]的例子,比如《大嘴巴**》與《汽車人***》等。除了「抄襲」,「劇情」、「配音」佔有很大的比重。另外,我們可以看到圖中「國產」的比例同樣很大,無論是由於大家的國產動漫的期待還是失望,都反應了國產動漫在國人心目中的重要程度。

第一部分的最後,我們來看一下低分高評的匯總:

emmmmmmm... ...在低分(低分閾值在4.0及以下,真的是很低了)高評的短評中,沒有營養的評論如「好看」「不錯」「五星」等不佔少數,原因嘛..............另外,「國產」比重之大,說明情懷仍是低分動漫出賣的重點。

看完了短評的第一部分數據,我們再來看看第二部分。第二部分數據分為兩類,分別是21世紀前高分動漫短評關鍵辭彙總與21世紀後高分動漫短評關鍵辭彙總。首先是21世紀前的短評:

「童年」「經典」「小時候」「回憶」等關鍵詞是大家對21世紀前高分動漫的最多的評價。童年的經典確實能夠在大家的心中留下溫馨美好的回憶。在這些關鍵詞中,我們能夠看到「水墨」、「諷刺」、「深刻」等詞,這些也是那個時代動漫的一個特徵。相比21世紀前的動漫,大家對當代高分動漫的評價又是怎樣的呢:

在當代動漫短評中,「國產」、「故事」、「劇情」、「配音」、「畫風」佔了很大的比例,在暫時不涉及情懷時,這些優秀的品質短評中更加能被凸顯出來。其中「國產」這一項成為了重要因素,說明了大家對國產動漫有著極高的期待。同時大家對國漫的要求也更加高,無論是劇情、配音、畫面,這些因素都是大家對國漫評價的重要指標。

在這次分析的最後,叉鴿附上短評數超過10000的國漫中評分最高的TOP5:

TOP1 《羅小黑戰記》:

TOP2 《大盜賊》:

TOP3 《山水情》:

TOP4 《大鬧天宮》:

TOP5 《天書奇譚》:

那麼這次的分析報告就到這裡了。這裡是叉鴿,一個不正經的預備程序猿。

安利:

  • 叉鴿:想知道大家都用python寫過哪些有趣的腳本?
  • 爬蟲IP被限制?Python實現輕量級線程安全IP代理池!
  • 數據指導北京科學買(不起)二手房

推薦閱讀:

機器學習之樸素貝葉斯:基於概論論的分類方法(四)
想要做好社團招新?——會利用數據就好啦
超簡單的熱力地圖教程來襲,各位小主快翻牌啊~
泰坦尼克號倖存預測
Excel--速成路線

TAG:数据分析 | 爬虫计算机网络 | 中国动画 |