豆瓣電影等影評類網站要如何防止刷票?
01-29
近來豆瓣上出現了些電影存在刷票現象像:奪命金:http://movie.douban.com/subject/3532614/
觸不可及:http://movie.douban.com/subject/6786002/
先給兩個參考——
IMDb 給出的電影評分的計算方法是怎樣的? http://www.zhihu.com/question/19746144
豆瓣的書影音評分是如何計算的? http://www.zhihu.com/question/19929990演算法是基於你希望怎麼解決問題的思路。簡單說一下 IMDb 的思路是:- 評分不靠譜的人,評分權重降低。如果好幾部好片,你給的分都很低,而一些爛片,你給的分都很高,那麼你的評價權重是很低的。
- 不經常評分的人,評分權重降低。如果你註冊 IMDb 半年,半年裡只零零星星地有一搭沒一搭地給那麼幾部片子打過分,那麼你的評分權重是低的。
所以,要想讓 IMDb 將你的評分納入考慮,那麼你就得經常去打分,並且你的打分還得比較靠譜。
這樣一來,你就知道了,既然叫刷票,那麼就是一些新註冊的 ID,或者一些不經常評分的 ID,或者一些評分還看不出來是否靠譜的 ID 來進行大量的評分。這幾種 ID 打的分,是不會產生什麼影響的。
豆瓣的演算法思路,應該也是類似。這個問題比較龐大。拆分到3個關鍵問題
1. 什麼行為算作刷票?2. 通過什麼行為進行所謂的刷票3. 「刷票」的結果是否有體現?也就是刷票成功了么?
什麼算作刷票?這是難點,也是很多人認識的第一個誤區。相左於你的觀點的,或者相左於大眾觀點的,它就是刷票么?這種感情判斷是無法適用於客觀平台的。所以平台處理這種判斷時要做的是驗證人和行為的合理性。
通過什麼行為進行刷票,這是具體的操作步驟,進行針對性的機制補全即可。第三點是被最多人討論的一個認識誤區。也就是行為和結果的對比。很多人只看到了行為,就忽略了行為是否對結果有影響的判斷。解決好這個問題才能判斷你的機制是否完善有效。其實貌似什麼方法也沒說。為了防止水軍刷評分,電影院線應該建立一個電影票識別碼系統,每張電影票上包含一個唯一的只能使用一次的識別碼,需要輸入這個識別碼才能在豆瓣之類網站上給電影打分
像豆瓣的話由於用戶黏性很大,豆油發現有團隊刷票後會自發的採取「反刷票」去平衡,龍門飛甲剛上映時評分被水軍刷到8+,現在····· http://movie.douban.com/subject/4896304/而且可以看一下論壇里洋溢的對水軍的憤怒之情···只要參與的人多,這種影評網不怕刷票。ps:但是為什麼泰坦尼克3d會有這麼高的分·····
身份證註冊或捆版
你是如何鑒別出刷票現象的?鑒別清楚了,好了,那防止方案就出來了。
根據用戶權重來決定
推薦閱讀:
※豆瓣書評的分比影評的分整體較高,是否因為傳統紙質信息載體更能使受眾產生髮自內心的感受?
※python代理爬蟲抓豆瓣電影數據
※豆瓣評分9.0的國產網劇《白夜追兇》火爆背後,我們應該了解些什麼?