嚴肅認真扒一扒豆瓣電影的評分系統
這兩天,玲小瓏的朋友圈基本都在被一件事刷屏,那就是《人民日報》點名批評豆瓣,說其污衊國產電影,給最近上映的國產《長城》、《擺渡人》等低分評價,惡意評論等,並給國產電影造成了消極影響。還有一位不願透露姓名的影評人表示:《擺渡人》的分數明顯不正常,豆瓣評分系統有人工干預。
當然,網友們也掀起了反攻:「人民群眾花錢吃完屎之後吐槽屎好臭,人民日報說你這是污衊屎!你們知道拉屎有多不容易嗎!」雖說,每個人對電影的評價是比較主觀的,但對於豆瓣電影的評分系統,玲小瓏還是持保留意見的。
今天,玲小瓏就請來了前豆瓣產品經理來給大家現身說法,扒一扒豆瓣評分體系的那些事兒。
大家好,我是京客隆小丸子。
前兩天,人民日報客戶端的一篇評論稱豆瓣里存在惡意刷某些國產電影評分的問題。關於這個問題,豆瓣的CEO阿北在2015年就寫過一篇《豆瓣電影評分八問》回答,大家可以去翻出來看一下。作為一名前豆瓣產品經理,對於豆瓣電影的評分系統也是再熟悉不過。
首先來說下這篇文章的一些基本事實錯誤。第一個是認為《擺渡人》上映0點剛過就有人打一星的,一定有人黑,並且影響票房了。第一,電影上映之前,會有各類型的點映,且豆瓣也為了保護未上映電影受到水軍影響,都是在上映後才能打分的。所以0點剛過,就有人打分並不奇怪。第二,對於大批量刷分的水軍,豆瓣會判斷和甄別,如果判定是水軍,再多水軍打的分數並不影響最後結果,所以如果你的電影真好,何懼水軍呢?第二個臆想,就是有說自己的朋友給電影打5星,被封號。我覺得這個就呵呵了。並且我們看到文章里給的截圖是說賬號存在安全風險,這種結果不一定是因為你在豆瓣給某個電影打了5星,可能是有人蓄意盜號,或者其他原因。怎麼就判斷是豆瓣故意針對你呢?
今天下午還看到一篇文章說,豆瓣拿一年前的文章來公關,揶揄豆瓣不正面面對問題。我覺得有些自媒體真是又壞又蠢。阿北的文章有點長,但是看過的都明白是怎麼回事,阿北把豆瓣電影的評分解釋的很清楚。
水軍哪個網站都有,豆瓣一直在和水軍鬥智斗勇,用各種辦法去偽存真。豆瓣電影超級難刷,這是業內共識,這文章信口雌黃的程度,業內外都要笑掉大牙吧。
即使沒有豆瓣被《人民日報》點名批批評這件事,可能大家對評分體系也有一些疑問,今天就在這兒給大家一一解答,歡迎來問。
玲瓏用戶@於困困
Q:還是那個問題:為啥沒有負分滾粗?
你看玲瓏都有「呵呵」,並影響排序(雖然沒有什麼卵用)
A:我也想問,為啥妹有啊!
你看豆瓣還是愛護電影的,再垃圾,都要打一顆星才能評論。
我是個堅決抵制垃圾電影的人,基本上7.5分才願意看。但是有時也會碰到雷,會在短評里吐吐槽。玲瓏用戶@慢慢吸
Q:貓眼電影有觀眾評分和專業評分 ,你怎麼看待這種評分體系,豆瓣會參考專業和非專業的評分嗎?
A:啊,這位小姐,你的名字很有趣。嘻嘻。下面的意見是我個人意見,不代表我的公司,也不代表豆瓣。
我覺得,一個好的評分體系,一定要有區分度。貓眼的評分問題是,大眾評分一律都是8分.9分,很難給人參考。專業評分,又都是6分.5分,很割裂,每個評分體系內部區分度也不高。
說回受到壓力,改掉了專業評分的問題,我看到的說法是,專業評委人數還是太少了,幾十個,這麼少的樣本,怎麼打分,可能都無法反映更真實的意見。這個和金馬獎還不同,金馬獎之類的,評委也是幾十個,但其他們有討論,最後的意見是集體智慧。但是貓眼的專家評分,可能更多的是個人化表達,這種平均分,參考價值不算大。
至於是不是因為這次事件下掉,不得而知。或許是巧合,正好被《人民日報》拿來做文章呢。玲瓏用戶@Nebula
Q:對這種(弱智)評論怎麼看?
A:哈哈。我覺得這個作者還活在90年代。
水軍截止到目前為止,他們的特點都是大規模,行為機械,目標明確。
所以這類水軍有很多特徵可以辨認,比如沒頭像,註冊時間短,沒有好友,也沒有好友關注他們。這些特徵是可以被學習,並且由程序辨認的。現在大多數水軍都還是這個階段。所以人日有提到通過盜號,撞庫,獲得真實用戶賬戶,給電影刷評分的。這類方式也會被識別,因為這種作案通常是集體規模化的打分,並且請求都來自同一個ip,或者相似ip,也是有跡可循的。高級的水軍,我剛有提到過,就是註冊之後,先養著,甚至cosplay另一個真實用戶的行為,這類就很高級了,不過只要存在固定模式,就能被認出。對於這種,我想說豆瓣還存在一個類似用戶信用體系的系統,這類用戶就算逃過了反水軍系統,他們在豆瓣體系里的信用分數也會比較低,因為他們沒什麼好友,或者好友也跟他一樣是殭屍,這類用戶打的分數的權重會較低,對電影的影響也較小。
玲瓏用戶@秋簾
Q:豆瓣裡面電影分類和相似推薦是根據什麼標準來定的呀?
A:哈哈,這是另一個命題,叫做個性化推薦。基本原理是一個叫做協同過濾的辦法,也就是如果兩部電影,看的都是同一類人,我們會認為這兩部電影相似。
玲瓏用戶@塞夫子
Q:那麼如果你要用無限免費的水軍刷一部電影,你最可能的操作邏輯是什麼?預估結果是什麼?順便說明預估原因,謝謝!
A:有效的分數,來自真的有效的用戶。所以如果真的財大氣粗,雇1萬個大一新生註冊豆瓣,在豆瓣上認真交友,發廣播,寫日記,看影評,到了大四,這些賬號可能才不會被認為是水軍吧。同時,這些用戶,刷評分的時候還不能特別機械,有規律,評語還不能一樣,這個也要注意哦。#黑。其實你看我說的看起來很麻煩,但真的有水軍這麼做,我在豆瓣上有16000粉絲,還算活躍,某一天突發奇想搜自己的id,竟然發現有別的賬號cosplay我的頭像,我的廣播,裝作像是個正常用戶一樣。#水軍辛苦啦。不過我發現之後,就舉辦給程序員哥哥們了,所以這個套路估計又會換了。
玲瓏用戶@元氣少女
Q:為什麼豆瓣沒有一些措施來避免惡意評分?比如說豆瓣賬戶使用時間必須達到多少天以上的評分才有效。
A:嗯,其實這是一個管理者慣常的思路。為評分設置門檻,一個是並不算公平,我如果就是一個剛註冊豆瓣的新用戶,看了爛片,為啥不能讓我對電影進行評價呢?第二是,門檻很清晰的時候,反而會把水軍問題擴大化。比如明確規定註冊30天,發了100條廣播的人能評論,但是這無疑給了水軍指路明燈。所以豆瓣沒有用這樣的做法,而是人人平等,並通過技術手段甄別水軍,去打擊真正要被打擊的人,而不是給正常用戶抬高門檻。
玲瓏用戶@美宅
Q:其實我有一個地方一直不明白,豆瓣給出的電影評分,都是精確到小數點後一位的。但是豆瓣給用戶的評分選項,卻只能評一至五星,在這種機制下,就會因為觀影過程中一丁點的個人好惡導致評分上相差整整兩分,還能真實地反映出打分者對該影片的評判標準嗎?
A:嗯,這是個很專業的問題。其實科學家們有過研究啦,感興趣的可以找到相關的論文。5分制能反映90%的真實意願,是能接受的一個打分體系。另外,打5分比打10分,對用戶來說門檻更低一些。綜合考慮,就提供了5分的打法。這個問題其實豆瓣內部一直有討論,但是截止到目前,還是沿用了5分制,說明這個評分體系目前還是能真實的反映具體情況的。
玲瓏用戶@櫻桃白娘子
Q:每次用豆瓣電影的標籤總是覺得很混亂,雖然已經有我的標籤和常用標籤,但也還是會經常有一些意思比較重複的,比如我的標籤那種,可不可以在自己建新標籤時有一個提示,你已建立相關標籤之類的。
A:真產品經理。我覺得這是個問題,可以優化。然鵝,並不知道哪天會被優化。如同8年沒被優化過的日記,最近才改成人類可用的一樣。
玲瓏用戶@芒果大仙兒
Q:可以說一下口碑榜的評分機制嗎?因為我看也不完全是看分數的吧
A:哇,專業人士!豆瓣之前寫過一篇blog,講了自己怎麼選出top250的。除了考慮評分外,打分人數,打分人的興趣覆蓋範圍,都有考慮。一個片子1萬人打分,得了8分,和10萬人打分,得了8分,肯定是10萬人8分的好。一個片子,如果是粉絲電影,粉絲會有情懷因素,打了高分,但是大眾可能並不喜歡。所以粉絲向,小眾向的高分電影,在排序中,可能就沒有大眾向的高分電影,排序高。
玲瓏用戶@咖灰
Q:豆瓣評論有版權嗎?是怎麼保護的?
A:豆瓣對評論版權問題其實都是很認真,至少是很謹慎的。一般這些評論,在作者未能允許的情況下都是在豆瓣體系內用的,應該不會在別的平台看到。早年應該有網站希望和豆瓣合作評論,換句話說,就是希望把豆瓣內高質量內容通過商業交換,導入自己的網站,都是被拒絕的。最近似乎還和微信一起搞了保護原創的工作。我覺得在這些問題上的操守,豆瓣是國內互聯網公司底線最高的之一。
玲瓏用戶@安提戈涅
Q:關於爛片基本上都是「L」型評分,能用評分規則解釋嗎?
A:L型電影,說明打低分的人多,並且大家意見很一致,沒有人給他打高分,說明這種片子,是大眾蓋章,一致認可的爛!
玲瓏用戶@蘑菇
Q:為什麼豆瓣只有看過和想看兩個選項,能不能有多一些選項,比如「看過但不想再看一遍」這種?
A:哈哈哈。如果有了這個功能,可能還會有用戶要,想看5遍,想看100遍,舔屏觀看的。怎麼說呢,這是個產品問題,主要還是覺得現在功能夠用了,想看100遍的同學,自己可以建個豆列表達哇。
玲瓏用戶@我們失去了黃昏
Q:只要用戶註冊為豆瓣的用戶就可以發表影評和打分,那麼豆瓣如何去判斷用戶是否在看完電影再去打分的?譬如,大眾點評是用戶在某個餐廳消費結束後,才開始打分的,貓眼是出了電影票才有資格打分的。
A:嗯,你說的是一個豆瓣較難判斷的場景問題。
但並不意味著豆瓣無法保證評分體系公允和反應真實情況。
目前豆瓣的思路還是從人上判斷,人是可信的,分數可信程度就高。反之,分數權重就低。#曾幾何時,豆瓣是有過電影票業務的。唉~
關於豆瓣電影評分體系,歡迎下載玲瓏沙龍App!和作者一起聊聊
京客隆小丸子在線等你哦
下載地址:玲瓏 - 更美的生活 更好的自己
推薦閱讀:
※在你不敢早戀的日子裡,人家已經。。。
※確定不是在夢中?檢測智商的電影來了——盜夢空間
※有什麼非常值得一看的經典電影?
※伴我同行這部電影的主旨是在講什麼?