你是否認可豆瓣電影的評分?


直到有一天,我在網上看到一副圖片,才知道了豆娘的良苦用心:


1. 有些電影,因為褒貶一致,所以評分可信。

2. 有些電影,因為受眾面和體裁,所以評分不可信。

3. 有些電影,因為帶著你童年的回憶,所以評分五星。

4. 有些電影,因為重名或者被認錯名,所以評分一星。

5. 有些電影,因為水軍曾經賣力的刷分,所以評分噁心。

6. 有些電影,因為用戶針對個人卻不針對內容,所以評分違心。

7. 你可以通過豆瓣,找到一部電影,讓你發現生命的意義。

8.你也可以通過豆瓣,找到一部電影,讓你喪失生存的勇氣。

9. 沒事多看評論,或許你就發現了,分數背後的真諦。

10. 你對電影的評價,不僅在於分數,也在於,你的心。 ^ _ ^


補充一下一樓答案,還有兩種類型。
影史經典「┌」型

毀滅三觀,沒有任何存在價值的影歷史污點「_」型


豆瓣評分個人總結有這麼一個規律:評價高的未必有多好,但評價低的是真心低!


要有技巧的使用豆瓣評分,同時利用好爛番茄。我個人選片的方法,不是100%準確,但選出的片子基本對我的口味。

1。如果是華語新片,第一天評分沒有參考價值,第二天基本平穩。6.3分以下不考慮觀看,為什麼是6.3分,我也不清楚,只是自己的經驗。(個別奇葩水軍片除外),然後看影評(不是短評)打分情況(不是看影評內容,裡面多有劇透),如果排名前面的影評多為4-5星,再看這些影評點支持和反對的比例,支持多的靠譜一些,反對多的
5星影評,多是水軍寫的。

2。如果是國外新片,老片,華語老片,統統去看參考爛番茄Movies | Movie Trailers。(豆瓣下面都有該片的英文名,複製到爛番茄里搜索。(同名電影,看年份區別)
·如果新鮮度(媒體評價)和觀眾評分,都是70以上,基本是必看的佳作。

·如果新鮮度低(60以下)觀眾評分高(70以上)一般是比較帶勁的爆米花電影,按你的口味選擇性觀看。

·如果新鮮度高(70以上)觀眾評分低(60以下)一般是藝術性強一些好片,但是激發不出普通觀眾的荷爾蒙,按你的口味選擇性觀看。

3.看導演和編劇。

ps:imdb評分和豆瓣評分類似,容易刷分,故不參考。好電影太多了,一輩子什麼都不做,只看電影也看不完的,所以一定要篩選,不要把很多2小時浪費在看爛片上面。大多數人一輩子也看不了1000部電影。


我覺得大家可能忽略了一件事,就是分數要跟評分人數結合起來看。 同樣評分的電影,如果打分的人更多,一般來說是更好看的。為什麼是這樣呢?

在一部電影傳播的過程中,越早期傳播到的觀眾,往往跟這部電影的目標受眾更為契合。比如《熱血警探》這部片,最早期的受眾多半是看過《殭屍肖恩》很喜歡,然後看到Edgar Wright,Simon Pegg,和Nick Frost這個鐵三角組合(是不是跟寧浩、黃渤、徐崢的組合有點異曲同工之妙?)又出了新電影,就很自然的跑過去看。這兩部電影風格有很多共同之處,喜歡《殭屍肖恩》的人,多半也會喜歡《熱血警探》,評分自然很高。第二階段,隨著這個片子贏得了很好的口碑,可能會喜歡英式黑色幽默喜劇的人都會被吸引來看這部片子,那麼這群人跟《殭屍肖恩》的風格近似度雖然沒有最早那批人高,但也還是很高的,所以評分也不低。第三階段,隨著這部片子看過的人越來越多,評分的達到幾千人,口碑進一步傳播,可能不少只是喜歡看喜劇的人都會跑來看,但如果一個人是喜歡美式屎尿屁喜劇的,可能這部片子對他來說只是一般或還不錯,那麼平均評分就會下降。最後,當已經有幾萬個人在豆瓣上給這個片子評分,而且總體依然不低,進入了豆瓣TOP100,也有很多友鄰推薦,那麼很多對這個片子本身類型並沒有任何偏好的人,可能 也會抱著好奇的態度來看這部影片,那麼有可能就會導致評分的進一步下降。

我們每一個人都有正義心,會特別照顧冷門的好片,而對熱門電影產生逆反心理。同樣是評分8.0的影片,我們看了以後都覺得是『還不錯』,如果基本沒什麼人看過,是你偶然發現的,你很容易有一種被自己發掘到了瑰寶的感覺,想打高分推薦給更多人知道,你這時的感覺是,『這部片子還不錯啊,為什麼都沒有人知道?』;而如果豆瓣有幾萬十幾萬的人給這部影片打高分,周圍很多對這部電影的溢美之詞,你就可能會覺得這部電影被過譽了,你在某種程度上被欺騙了,你就會刻意打一個偏低的分數,你這時會想『這部片子也就還不錯吧,實在是被追捧過度了』。

如果你注意觀察,就會知道豆瓣上電影的評分,一般也確實都是隨著時間推移,看過的人越來越多,而逐漸下降的。

這兩個現象,其實在所有涉及評價的領域都存在。在知乎上,相信細心的朋友也可以注意到,在自己的一個好回答得到贊的早期,評論的人大多都是讚揚的比較多,但等到這個回答非常熱門了以後,評論里的噴子就會增多。其實是一樣的道理。

為了證明我的觀點,我給大家列兩個我以前統計的豆瓣主要動畫電影的排名表
第一個是直接根據電影評分值進行的排序:

第二個是根據修正的評分進行的排名
修正方法,原始評分+log(評分人數)-5

有沒有覺得第二張表的排名更靠譜?


源代碼: https://github.com/cqcn1991/movie-compare

文中涉及的互動式散點圖: https://cdn.rawgit.com/cqcn1991/movie-compare/master/clusters.html

之前已經寫過這個問題 [1],不過不少同學看不太懂,這裡再簡單寫一下,算是從另一個角度思考這個問題,希望能對大家有所幫助

1. 我們所討論「評分」到底是什麼?

刺客聶影娘來說

評分雖然不錯,但能看到評價差異很大的評價,而且都有不少人贊

於是我們會問:這部電影的豆瓣評分靠譜嗎?上面這些人他們誰是對的,誰是錯的?是不是有水軍?

然而,同樣的評分,卻發現其他的電影並不如此,比如我11

雖然也有好評、中評,但差評明顯少多了

仔細觀察,會發現兩者的評分分布並不相同

● 刺客聶隱娘:同時有不少人覺得不錯/較差,在1星和5星有不少的分布。

● 我11:大家都覺得比較不錯,所以評分集中在了3星-4星

也就是說,儘管兩者(平均)分數相同,但是背後的看法非常不同,評分差異很大,這也正好對應了上面截然相反的熱評的情況。

我們可以用方差來衡量評分分布的差異,計算方法如下

也就是計算 評分偏離平均分的程度。下文使用標準差(STD),由方差開方即可。

用近幾年的國內上映的電影,做出標準差(STD) - 豆瓣評分(Rating )散點分布圖。為了便於比較,做標準差97%範圍線。

可以看到兩者STD差別確實很大。仔細看上面的評論,也能發現分歧的原因 —— 刺客聶隱娘因為畫面水平和講故事的水平相差很大,大家側重不同,所以也就產生了評價差異。

也就是說,我們所說的豆瓣評分,只是一個平均分,並不能反映內在評價差異很大的情況

另外,在這幅圖上也能發現其他有爭議、STD很高的電影,比如大魚海棠、後會無期等等,這裡不再贅述,具體分析可見[1]。

2. 這意味著什麼?

這意味著什麼?不妨從另一個例子來理解

日賺1.6億!騰訊員工人均月薪6.3萬
...以此計算,截至2017年3月31日止3個月,騰訊員工平均月酬金=742300萬/(39258*3),約為6.3萬元。作為一家人員接近4萬的公司,騰訊這樣大手筆給員工發薪酬引發業界震驚。一位騰訊內部人士則指出,酬金不能只看平均的。騰訊的僱員也包括騰訊CEO馬化騰、總裁劉熾平等高管,你要是把萬達董事長王健林的收入和你平均一下,你的收入也高很多。 http://digi.163.com/17/0520/06/CKS04PC2001680NE.html

這樣其實大家也就明白了

豆瓣評分是平均分。當評分分布的差別很大的時候,這個平均分的意義就有限了,就像上面這個人均收入的例子一樣。

不過,為什麼很多時候,我們覺得豆瓣電影的評分有用呢?因為大部分時候,大家的看法是比較一致的(都覺得好看/不好看),就像上面的我11一樣。

明白這點之後,我感覺輕鬆了不少

因為以前我總糾結電影的分數。因為自己的看法和別人不同,所以擔心自己是錯的、不敢表達自己的想法。現在,我明白原來還有很多人的看法和我一樣(評分分布上那些打其他分的比例),只是人比較少而已。

單單談論平均分高低的問題也在於此 —— 預先假設了對於一部電影,其分數應該是唯一的。但實際上,大家對電影可以有不同的看法,不是說你是對的,那我就是錯的。

3. 總結

最後,回答開頭的問題 —— 你是否認可豆瓣的評分?

大多數時候,我是認可的,因為大多數電影,大家的看法很接近,平均分是很有效的。但是當內在評分差別很大的時候,平均分的意義有限,也就無從討論對其認可不認可了。因為對電影的看法本身可以是多元的。

那麼,有什麼辦法能解決這個問題,幫大家更好的理解豆瓣評分呢?

一種可能的做法,是給豆瓣評分旁邊加上一個小標籤。比如,對STD特別大的電影,在旁邊加個「分歧提醒」標籤,註明 「這部電影的評價差異水平達到了前3%,平均分的參考意義較為有限」,進一步還可以分開展示好評/差評,向用戶解釋評價差異具體如何。這樣或許能減少一些人們對(平均)評分的疑慮。

4. 其他問題補充

(1) 沒考慮水軍

對於評分,當然應該考慮水軍的影響。

但是我們所謂的水軍,究竟是虛假帳號評分,還僅僅只是別人的評價和我不同而已?就比如有的人,確實是喜歡刺客聶隱娘的畫面,而對故事沒那麼看重。更重要的是,只考慮水軍,沒有辦法解釋剔除水軍之後,分歧依然很大的現象。

實際上,可以從評分人數的角度來考慮。當評分人數很少(比如幾千人),無論有沒有水軍,這個分數都不一定準,因為很少的人就可以對分數產生較大的影響。而當評分人數超過10W,分數的分布就比較具有代表性了,因為水軍、黑粉也都是有限的。

(2) 豆瓣不是簡單的平均分, 是加權吧?

這並沒有本質影響。因為問題核心在於,單個指標(無論是平均數/中位數/加權)難以表現內部差異。

可以假想一部電影,在剔除水軍之後,50% 1星, 50% 5星,怎麼理解?用哪個分數,都說明不了問題。又比如上面人均收入的例子,用演算法再怎麼算,也沒辦法用一個工資同時表達高管和新入職員工的水平。

最後,關於這個問題更詳細的分析,見 [1]。

[1] 為什麼這部電影的豆瓣評分我不認可?-- 一點數據分析的視角 - 知乎專欄


80%是比較靠譜的。我自己總結的規律就是,如果是準備上映的電影,在電影上映之後的三天里,它的評分不靠譜的可能性非常大,因為水軍比較多。三天到一周之後,由於觀影人數的增多,它的評分就開始往靠譜的方向靠攏。當這部電影下檔,盜版出現之後,因為電影院看和電腦前看,特效、音效和觀影感受、氛圍的原因,它的評分普遍會降低。
所以除非是我特別有信心它是好電影的片子,會在上映當天就去觀看,不太確定的,會在上映一周左右參考豆瓣評分。如果非上映的電影,我一般會綜合豆瓣的評分和評分人數進行參考。


認可啊。

但是我看分的方式和你們可能不大一樣。

不要看1分和5分。

看2分和4分的比例。

原理是:

水軍也不能違反懶惰是人類本能的鐵律的。

啊不。

我們講的好聽一點。

水軍也不能違反人類追求高效率高性能的本能的鐵律的。

所以一樣是刷分,他們會主要刷在1分和5分上。

懂了嗎?


豆瓣上的評分在水軍散去之後,還是有很大參考意義的,不過要記得一些原則,首先是外語片平地多加一分,文藝腔(不僅指文藝片)的片天生多加一分,宣傳期的片子普遍虛高至少一分(現在恐怕都不止了)。


大部分時候我是靠豆瓣的評分來決定看不看一部電影。

8.5分以上的沒看過的不多了,有了果斷看。
8-8.5的有漏網的,果斷或收藏看。
7.5-8分的看看評價後決定,也看IMDB評分。
7.0-7.5的,如果是國產的考慮下,國外的再去看看IMDB的評分,不高就忽略了。
7.0以下的基本忽略了。

下一部電影和看一部電影的時間比上面整個過程長多了,而且看了爛片的沮喪感是會蔓延的,所以必須慎重啊。。

當然,隨著高分的越來越少,沒看過的越來越少,只能繼續往低拉一拉了。。。


豆瓣僅供參考,畢竟用豆瓣的人不能覆蓋到全部群體,所以大部分評分我認為有些偏頗,比如:


認可,畢竟這麼多年來大家早已掌握「高分不一定好看,但低分一定難看」的豆瓣電影評分參考規則了。


習慣性的會去看豆瓣評分,不過會較仔細的還去看下評論,再綜合評分,最終覺著豆瓣還是比較靠譜。


《一次別離》評分特高我就沒明白為什麼。。。
其實不僅是豆瓣,包括奧斯卡的很多得獎影片都未必能滿足每個人的胃口吧。

感覺評分最脫離電影本身的就是經典名著改編電影和漫畫改編電影。
永遠會有一堆原著粉過來破口大罵說拍得好爛完全不是想像中的樣子(其實我覺得很多被原著粉罵的片子還是很好看的啊!比如《飢餓遊戲1》和《傲慢與偏見》之類的

畢竟看原著的時候,根據文字描寫會產生自己的想像
一千個讀者會有一千種想像
但是導演只能拍出其中的一種
所以剩下九百九十九種想像沒有實現的原著粉都會不開心,打低分,致使最後的分數非常不理智。

話說回來,混豆瓣的都是文藝青年
文藝青年有幾個理智的呀 哈哈哈哈 包括我自己呢


以下是我混跡豆瓣多年發現的規律

9.7~9.5分:某些短片動畫如好萊塢最佳短片之類的

9.4~9.3分:某類小眾電視劇或動漫

9.2~8.4分:三觀正故事結構也很好的

8.3~7.9分:三觀正故事結構有一點點不足但不明顯

7.8~7.4分:三觀不正或血腥詆毀人性光輝但故事結構超贊沒明顯缺點的

7.3~6.6分:藝術片,導演不屑於用引人入勝的故事結構吸引人的,更關注藝術表達的形式,故意趕走品味low的偽影迷,越少人看懂越high的自虐型導演,如侯孝賢的刺客聶隱娘

6.5~6.3分:三觀嚴重不正很血腥但也因此吸引部分影迷

6.2~6.0分:有創新的故事但很可惜被拍爛了的三觀不正片

5.9分:有誠意的導演但被拍爛的影片,下次再接再厲

5.8~4.9分:大爛片

4.8~4.4分:郭敬明專屬區

4.3~3.6分:國產恐怖片

2.9分:富春山居圖


電影評分本來就是一種很私人的東西,個人喜好佔了絕大部分比重。所以不僅是豆瓣,Imdb爛番茄時光之類的評分一個都不可靠。


豆瓣的電影評分已經是比較良心的了,雖然有水軍和黑黑,但是參考價值還是有的。
評分有參考價值的前提:評分者超過1萬或者上映天數超過三天。
4分以下正常人不建議觀看,獵奇者除外。
4到6分粉絲(包括IP粉和演員粉)可以看,其他人不建議。
6分到7分的片子多少有亮點,有空可以看。
7分到8.5分的建議看,良片概率大。
8.5分以上不予置評,可能神但未必符合大眾口味。


也不能說私人。
評分不是不可能,理智且有品味的少部份人,他們的評分才可靠。什麽IMDB爛番茄和douban電影沒分別,全部都走開。


還是挺靠譜的,但為啥我辛辛苦苦寫的影評永遠找不到?


推薦閱讀:

為什麼有時候覺得一部電影還可以可是豆瓣上卻百分之八十的人在罵?
求推薦幾部深刻高層次電影,類似香水,超脫,穆赫蘭道,這個殺手不太冷,洛麗塔之流?
《逐夢演藝圈》會不會是故意拍成爛片的?
時光網和豆瓣的電影資料庫是如何建立的?
電影里經典的晚安有哪些?

TAG:電影 | 調查類問題 | 電影推薦 | 豆瓣電影 |