知乎的問題回答排序如何避免馬太效應?

說馬太效應比較籠統,可以看到的效應有這些:
1. 時間效應
2. 友鄰(社會化)效應
3. 排序效應(排在前面的得到更多投票)


我不太懂數據發掘,只針對社會化效應提點建議。

可運用反社會化的評價機制。

核心問題:3類關注中,只有那種純粹因為對某人的關注,引發的盲目贊同評價是有失客觀公允的。

所以:

在大前提:

排序指標不能是簡單「贊同」數量,而是複合加權運算結果時。

1 計算帶入權值,即分辨其評價前的進入途徑:

是因首頁中所關注的人的新回答而進入,還是自身關注話題(包括通過搜索自己訂閱的),並做複合計算(因為很多時候關注人和自己的關注話題本身就重合)。

2 計算閱讀時效的開銷,即分辨是否其足夠盲目:

這時需要假定一個理性閱讀標準,比如逐一閱讀法,及一種瀏覽速度。那麼評價者(尤其是首次進入該話題的人)是否遵循了這種理性,用了恰當的時間,到達了某條回答的位置做出了評價,理論上是可測,至少統計學上應該可以。

3 跟蹤後續用戶行為,決定是否做滯後調整

比如,對同一個問題,又評價又發表答案的人or既評價又評論,評價了多人的人。

這些行為不是瞬時可預測的,但對聯合判定此人是否為盲目評價很有幫助。


這個沒有必要避免吧,最正確的答案排在最前面並不是知乎的最大追求啊。


第一點和第三點提問者在另一個問題中回答了。

第二個,有個建議,排序的時候還是按照演算法來排。但是回答所獲得的投票數不直接顯示出來。要不是用戶投票後可以查看,要不就是需要多點一步。暫時這麼想,估計這涉及社會學和心理學了。希望能有這方面的人士來討論一下這個問題。


個人認為互相促進是馬太效應的原因

1.對同一個問題的不同回答產生馬太效應的原因:

曝光影響投票,投票影響曝光,權威影響曝光,曝光影響權威

如果想遏制互相促進指數放大的趨勢,就首先對各項指標建模,將因素抽離

比如,只看曝光(同一頁面下不同回答的指數衰減,可以以點擊或滾動條檢測來測量)

有了曝光的建模或測量,就可以對投票進行曝光因素的分離,

按此方法論,同樣剝離權威(social graph有豐富出度的節點)的影響(可以以粉絲數還投票數的比值來測量)

然後就可以造個效率優先機會公平的牛逼公式了~~

2.對不同問題受關注不同的馬太效應的原因:

首先,人類對知識的保有呈現長尾分布(大家都知道1+1=2,但只有我知道我昨晚吃什麼了),所以理論上問題或問題和回答的人的映射就該是長尾分布的(頭問題大家答,尾問題專家答)。所以目標不應該是將極端斯坦世界拉低到平均斯坦。而是讓它別那麼抖。

這個原因同樣是因為曝光的問題,回答門檻低的問題單位曝光產生回答多,回答多的曝光高,曝光高導致回答多,又出現互相導致了。於是按上文的方法論來修正。只不過這次要引進一個問題大眾度(類似這個名字,反映回答門檻),對這個進行剝離其他成分的測量。然後牛逼公式中引進這個參數的考慮。

當然,世界是測不準的,微小的差異仍會蝴蝶效應,被放大。定公式時給個安全值區間可能靠譜些


知乎的問題回答排序在有馬太效應的同時也會有長尾效應的產生,源源不斷的用戶與回答會淡化「 1. 時間效應 2. 友鄰(社會化)效應」這兩點。

至於 「3. 排序效應(排在前面的得到更多投票)」,這個問題在豆瓣的影評區也存在。如果排序上加入發表時間權值的話也許會可以略微避免,但尺度難以把控,同時我認為中心永遠都會有,它們並不會因為微中心的崛起就被「去掉」 ,所以永遠有一個答案會因為它的最優而排在前面並獲得更多的投票。


默認排序是按照贊同次數排序,就像這個答案也許永遠不會被看見,這個機制還是有問題。大多數用戶會接受默認排序,真心尋求答案的用戶會一點點往下解讀。但畢竟這個耗時且成本高,而且被多數人贊同的答案存在更大的共線可能性,容易引起共鳴,所以會很早的得出自己的結論。後面的答案當然就沒有被讀到的可能了。


當你的贊同數有限且和你的聲望掛鉤的時候,你就會掂量掂量是不是該贊同了。


知乎網上的問題不應該出現上百個答案或者要翻頁,真出現了可能就是問題本身的問題,籠統問題還是越少越好。


有影響。

我們部門剛發起一個產品品牌的投票,徵集了10多個名稱。但大家對這事不是很積極,我就是基本上會掃一眼前幾個和投票最多的幾個。看見得票最多的那個還行,就投了它,其它的根本沒看。

所以,會有從眾效應。


你可以把知乎當作一個小社會。排名就是話語權。要有公平的話語權,就得不斷的洗牌。


幻想:

  • 可以通過強化評論功能進行流量引導.

後期的回答者,可以向第一名的回答者,進行補充與說明.並提出自己的補充或者辨論的超鏈接,

這樣用戶會看了第一個回答以後,繼而進下的尋找其補充.

將流量向第二頁,以及更後頁的回答引導,同時增強彼此回答之間的邏輯性!


請題主自行了斷

這個問題真tm贊


不是名人,認真回答知乎一個多月吧,有一個回答在第一。

http://www.zhihu.com/question/20630995

不過那問題,被邀請的名人們好像都沒有在上面作回答……

我想最好是有個方法,比如默認按時間排序,手動可以轉為人氣排序,應該可以避免一些。


推薦閱讀:

怎麼才能有思想有深度的回答知乎的問題?
知乎上的回答被刪除而未收到備份,能否算作侵權?
知乎上我的回答數為什麼變為了0?
知乎里最長的答案是什麼?
知乎上有哪些專業的精品長答案?

TAG:知乎產品 | 知乎回答 |