如何為豆瓣設計一種公平的電影評分演算法?

最近豆瓣的事鬧的比較大,那麼知乎的數學、物理大神們,大家來說說如何設計一個公平的演算法避免豆瓣「刷分」的事出現。


EM演算法走起就行了
每個賬號有一個惡意用戶似然值,用來描述它屬於惡意用戶的概率,數值是概率的對數值。對每個作品的打分數據進行聚類,聚成若干個類型,對其中每個類型按照:聚類的特徵(期望是否嚴重偏向於1或者5,方差大小),其中所有用戶的惡意用戶似然值的和等來判斷這個分類是刷分的概率。再根據每個用戶的所有打分中,屬於的每個分類的刷分概率,重新計算惡意用戶概率,反覆迭代就可以得到比較準確的惡意用戶似然值和分類的刷分概率。最後計算平均值的時候按該打分屬於惡意刷分的概率加權。

或者按比較流行的方法,直接人工神經網路。


層次分析法
模糊綜合評價法
基於主成分降維的模糊聚類層次分析法

==(分割線)
實務中邏輯回歸+EM評分即可,大不了用到判別分析,亞馬遜的購物籃推薦用到了關聯規則和決策樹


用戶評價+圍觀監督評價+用戶行為真實度,屁……後台搞定。


簡單來說,人都想不明白的問題請問程序怎麼想∞


那必須是有關部門設計出來的


推薦閱讀:

如何優雅的不讓別人在自己的電腦上玩英雄聯盟?
在電腦上有哪些惡作劇的方法?
BT種子的原理是什麼?
如何將電影中人的聲音與背景聲音分開,即去掉人的聲音只保留環境的聲音?如何將音樂人聲去掉伴奏留下?
如何禁止 USB 移動設備訪問 Windows 電腦?

TAG:數學 | 計算機 | 統計學 | 豆瓣電影 | 熱力學與統計物理 |