豆瓣電影的每部電影頁面里,影評默認只顯示前六條熱門影評,那如何避免出現馬太效應?
說這事必須得提到投票機制的設計。
投票被設計出來並成功運用的原因有兩點:1,(參與者)成本低;2,(查閱者、參與者)有結果。以上兩者缺一不可,可以試想有一個人發起了一個參與流程複雜且沒有結果(反饋)的投票,參與度會不會高。
投票被設計出來的意義在於藉助群眾的力量得到相對最優解,藉此幫助後續查閱者降低選擇的成本。
以電影《復仇者聯盟》[1]為例,該條目的長影評基本數據如下:
投票率:36%
回應率:33%
評價率:55%(有「投票」和「回應」的)
(數據採樣截止到 2012-7-3)
- 在理論上選項會無限多的投票面前,投票結果一定是不公平的
- 當投票被運用在對投票的選項排序上時,投票結果一定是不公平的
(當投票選項在一個頁面時)
豆瓣影評使用的投票機制採用的是和知乎一樣經過改進的的僅存在單一勝者的相對多數決制,相對多數決最簡單的判定勝者的標準就是誰得票更多誰就贏,最重要的一點是投票結果在下一位投票者在投票前是可見的,所以當第一個投票產生時,待投票選項已經發生了順序變化,因此馬太效應在第一個投票發生時就已經產生了,只不過這時比較弱而已。
那根據之前說的投票前不要讓人們看到已有結果並且按照時間做默認排序?這樣是有問題的喔:
1,當排序出現的那一刻起就產生馬太效應了;
2,如何區分哪些人是投票者,哪些人是閱讀者?閱讀者一定要投票才能閱讀?
那隨機排序並加一個投票截止時間?改進投票機制,不要用單一勝者的多數決?允許產生多個並列第一?廢棄投票排序機制,平級展示所有回答?使用雙軌道的排序機制?提供更多回答篩選?
哎呀不要爭了,重要的是這個頁面、這個影評模塊是被設計拿來幹嘛的?民主試練場?辯論會?還是希望用群力篩選出相對最優的結果為後面來到這個頁面的人對於是不是要去看這個電影提供決策依據?我想應該是後者,所以豆瓣電影只保留了 6 個相對更好的影評給未來來到這個頁面的人一個更好的參考,對於一部電影的不同意見?沒關係啦,「最有用的好評」和「最有用的中差評」就是為這種情況準備的啦,看了六個還不能滿足?猛擊更多喔^ ^
但是對於可能的潛在好影評怎麼辦呢?回到最開始的兩個結論上來:- 在理論上選項會無限多的投票面前,投票結果一定是不公平的
- 當投票被運用在對投票的選項排序上時,投票結果一定是不公平的
第一個,盡量提供少的選項,讓人們將注意力放到這一個影評上來,如果沒有必要,不要讓人們看到更多的影評。
第二個,在該投票中,不要涉及到排序,只是單純的對該影評進行不涉及排序的評價。
根據以上兩點,豆瓣是如何解決的?當我寫了一篇新的影評,會進入到所有關注我的好友 Feed 中,他們點擊鏈接進入的是影評單頁,不會看到其他的高票影評,更加單純的就該影評進行評價,還可以通過「推薦」按鈕向自己的好友進行推薦,如果推薦很多,還可以進入首頁以及提升排序。
通過這種方式就可以將投票和展示分離:- 展示區展示最優的,為後來的閱讀者提供決策依據
- 讓有決定性意義的早期投票儘可能在流通中進行
在產生首頁 6 個回答之前,相對公平的評價已經做出,首頁的展示只是加劇和提升了這些影評的得票和曝光。(這只是猜測,十分想看一下豆瓣的投票來源數據以及首頁 6 個影評從出現到穩定的變動情況來證實這個猜測。不科學的人工編輯除外 -_-)
(實際上從《復仇者聯盟》的影評數據上看,豆瓣影評的評價率也是很低的,如果不能有效提升評價率,也許未被發現的潛在 Power User 可能會因為激勵不足而流失。)
從以上可以看出,豆瓣的信息間傳播渠道過窄(只有人),如果豆列可以收集更多中元素或許會更豐富以及發現更多影評書評樂評什麼的?當然系統級別的推薦也很重要,比如「你曾經評價過的電影《復仇者聯盟》中新增了一個回應數超過 1000 影評,你要不要去看一下?」之類的東東,或者豆瓣猜足夠牛和強大。
馬太效應的解釋是「強者越強,弱者越弱」,但我們在大多數情況下都將注意力放在了「越強」和「越弱」上,卻沒有注意前面的「強者」和「弱者」以及幫助「強者」成為強者的因素有哪些。讓人們有能力成為強者或者發現和推薦他認為不錯的東西是更需要花時間研究的事情。
初出茅廬,如有不對請指正:)
[1]:http://movie.douban.com/subject/1866479/其實只需要隨機排序顯示影評即可,簡單粗暴。
好吧,嚴肅一點。
減緩/避免馬太效應我認為無非這樣幾種方式:- 通過機器學習,演算法過濾等方式來解決諸如某一篇某幾篇內容長期霸佔排行靠前的問題:隨著時間推移,用戶投票score權值降低,文章熱度降低,新進文章投票權值高等等。
阮一峰老師有個系列文章描述了一些普遍的演算法細節:http://www.ruanyifeng.com/blog/2012/02/ranking_algorithm_hacker_news.html - 除了得分演算法外最好還能根據具體情況通過一些啟發式的方法幹掉一些演算法外的情況(比如強制三個月換一批優質影評進行顯示)。
- 人工編輯,實際上這個是為了彌補第1點所提方法在難度和成本上過高的缺陷。當然,還能應對一些不可抗力因素、滿足一些不可告人的需求……
- 在產品上進行引導和改進。例如,配合演算法高亮近期的優質內容、充分利用網頁空間進行內容挖掘(在右下角突然出現一框告訴你有新影評了!)、鼓勵用戶閱讀更多內容(點擊更多可以看到xxx、xx的精彩影評喲!)、提供更多可供用戶挖掘內容的方式(按冷門、按時間、按關注人、按字數等排序),如此等等。
- 運營用戶,盤活用戶。讓他們不止是來投票的!
隨答附送
知乎的問題回答排序如何避免馬太效應 http://www.zhihu.com/question/19588679
不只是簡單的根據熱度排序
上圖中,排序在下面的文章無論是從評論數還是有用數 都高於上面那篇
所以影響排序的因素會有很多,比如評論數 有用點擊 發布時間 文章長度等,只是熱度的權重會高一些。
lz有興趣的話可以看看這個 http://cache.baidu.com/c?m=9d78d513d9d430a54f9ae3690c66c0101943f0132bd6a0020fd1843f94735b30501795ac57260775d7d20c6415e80902e5aa7034751421c486d5cd0f98ac925f6fcf74683b47d2164e860eafbc17789e3dc004b4fa04e7b8f3328eacd2ce9f070f9308592f97f7ff095e41972fab526bbcb19e3c4f0c41e3ba7072f82d2b7eda6257b630a3a66d30p=8b2a9643909711a05bea9f311c498170user=baidufm=scquery=%C8%EE%D2%BB%B7%E5+%CD%B6%C6%B1qid=d624c60a26912347p1=4像基因變異那樣,過段時間就隨機選一個排名靠後的影評在首頁顯示,同時用顯著的標記標明這是隨機選的。
減緩/避免馬太效應的方式我認為比較好的是:
1.增加影響維度
2.調整各個維度的權重
例如:
就像問題所說,可以增加出了評價以外的維度,比如分享.....
另外可以對比數據增加相應的維度的權重
推薦閱讀:
※IMDb 和豆瓣上有哪些純腦殘粉刷出的「高分影片」?
※知乎和豆瓣的賬號在更改郵箱時為什麼可以不經原始郵箱驗證?
※《富春山居圖》那麼爛,豆瓣電影為什麼不藉機推出個負分功能呢?
※豆瓣上那麼多姑娘喜歡爆照,不怕被認出來么?
※怎麼看待微博話題「爵跡竟然還不錯」的話題?