知乎的問題回答排序如何避免馬太效應?
01-09
說馬太效應比較籠統,可以看到的效應有這些:
1. 時間效應
2. 友鄰(社會化)效應
3. 排序效應(排在前面的得到更多投票)
我不太懂數據發掘,只針對社會化效應提點建議。
可運用反社會化的評價機制。 核心問題:3類關注中,只有那種純粹因為對某人的關注,引發的盲目贊同評價是有失客觀公允的。所以:在大前提:
排序指標不能是簡單「贊同」數量,而是複合加權運算結果時。1 計算帶入權值,即分辨其評價前的進入途徑:
是因首頁中所關注的人的新回答而進入,還是自身關注話題(包括通過搜索自己訂閱的),並做複合計算(因為很多時候關注人和自己的關注話題本身就重合)。2 計算閱讀時效的開銷,即分辨是否其足夠盲目:
這時需要假定一個理性閱讀標準,比如逐一閱讀法,及一種瀏覽速度。那麼評價者(尤其是首次進入該話題的人)是否遵循了這種理性,用了恰當的時間,到達了某條回答的位置做出了評價,理論上是可測,至少統計學上應該可以。3 跟蹤後續用戶行為,決定是否做滯後調整 比如,對同一個問題,又評價又發表答案的人or既評價又評論,評價了多人的人。 這些行為不是瞬時可預測的,但對聯合判定此人是否為盲目評價很有幫助。這個沒有必要避免吧,最正確的答案排在最前面並不是知乎的最大追求啊。
第一點和第三點提問者在另一個問題中回答了。
第二個,有個建議,排序的時候還是按照演算法來排。但是回答所獲得的投票數不直接顯示出來。要不是用戶投票後可以查看,要不就是需要多點一步。暫時這麼想,估計這涉及社會學和心理學了。希望能有這方面的人士來討論一下這個問題。個人認為互相促進是馬太效應的原因1.對同一個問題的不同回答產生馬太效應的原因:曝光影響投票,投票影響曝光,權威影響曝光,曝光影響權威如果想遏制互相促進指數放大的趨勢,就首先對各項指標建模,將因素抽離比如,只看曝光(同一頁面下不同回答的指數衰減,可以以點擊或滾動條檢測來測量)有了曝光的建模或測量,就可以對投票進行曝光因素的分離,按此方法論,同樣剝離權威(social graph有豐富出度的節點)的影響(可以以粉絲數還投票數的比值來測量)然後就可以造個效率優先機會公平的牛逼公式了~~
2.對不同問題受關注不同的馬太效應的原因:
首先,人類對知識的保有呈現長尾分布(大家都知道1+1=2,但只有我知道我昨晚吃什麼了),所以理論上問題或問題和回答的人的映射就該是長尾分布的(頭問題大家答,尾問題專家答)。所以目標不應該是將極端斯坦世界拉低到平均斯坦。而是讓它別那麼抖。這個原因同樣是因為曝光的問題,回答門檻低的問題單位曝光產生回答多,回答多的曝光高,曝光高導致回答多,又出現互相導致了。於是按上文的方法論來修正。只不過這次要引進一個問題大眾度(類似這個名字,反映回答門檻),對這個進行剝離其他成分的測量。然後牛逼公式中引進這個參數的考慮。當然,世界是測不準的,微小的差異仍會蝴蝶效應,被放大。定公式時給個安全值區間可能靠譜些知乎的問題回答排序在有馬太效應的同時也會有長尾效應的產生,源源不斷的用戶與回答會淡化「 1. 時間效應 2. 友鄰(社會化)效應」這兩點。至於 「3. 排序效應(排在前面的得到更多投票)」,這個問題在豆瓣的影評區也存在。如果排序上加入發表時間權值的話也許會可以略微避免,但尺度難以把控,同時我認為中心永遠都會有,它們並不會因為微中心的崛起就被「去掉」 ,所以永遠有一個答案會因為它的最優而排在前面並獲得更多的投票。
默認排序是按照贊同次數排序,就像這個答案也許永遠不會被看見,這個機制還是有問題。大多數用戶會接受默認排序,真心尋求答案的用戶會一點點往下解讀。但畢竟這個耗時且成本高,而且被多數人贊同的答案存在更大的共線可能性,容易引起共鳴,所以會很早的得出自己的結論。後面的答案當然就沒有被讀到的可能了。
當你的贊同數有限且和你的聲望掛鉤的時候,你就會掂量掂量是不是該贊同了。
知乎網上的問題不應該出現上百個答案或者要翻頁,真出現了可能就是問題本身的問題,籠統問題還是越少越好。
有影響。
我們部門剛發起一個產品品牌的投票,徵集了10多個名稱。但大家對這事不是很積極,我就是基本上會掃一眼前幾個和投票最多的幾個。看見得票最多的那個還行,就投了它,其它的根本沒看。
所以,會有從眾效應。你可以把知乎當作一個小社會。排名就是話語權。要有公平的話語權,就得不斷的洗牌。
幻想:
- 可以通過強化評論功能進行流量引導.
後期的回答者,可以向第一名的回答者,進行補充與說明.並提出自己的補充或者辨論的超鏈接,
這樣用戶會看了第一個回答以後,繼而進下的尋找其補充.將流量向第二頁,以及更後頁的回答引導,同時增強彼此回答之間的邏輯性!請題主自行了斷
這個問題真tm贊
不是名人,認真回答知乎一個多月吧,有一個回答在第一。
http://www.zhihu.com/question/20630995 不過那問題,被邀請的名人們好像都沒有在上面作回答……我想最好是有個方法,比如默認按時間排序,手動可以轉為人氣排序,應該可以避免一些。推薦閱讀:
※怎麼才能有思想有深度的回答知乎的問題?
※知乎上的回答被刪除而未收到備份,能否算作侵權?
※知乎上我的回答數為什麼變為了0?
※知乎里最長的答案是什麼?
※知乎上有哪些專業的精品長答案?