如果設計一款微博搜索引擎,哪些因素將影響搜索結果的排名,各因素的權重大小排序如何?


我覺得會影響排名的因素有:

  1. 用戶的PeopleRank。類似google的PageRank,被人關注的越多的人Rank越高,被Rank值高的人關注的人Rank越高,關注的人越多Rank越低。

  2. 時效性。微博具有很強的時效性,用戶發布的內容的Rank會隨著時間衰退。

  3. 社交性。被評論的內容獲得高Rank,評論本身獲得較高的Rank,轉發並沒有產生用戶間交互,所以Rank較低。

至於這幾方面權重的比值都需要看實際效果調整


文章的轉發數量、文章的評論數量以及文章存在的時間長短。帳號粉絲數可以作為參考值,不宜給過高權重。還有是否實名認證。在文章中有沒有##標註,因素很多,如果排名次的話應該是:

轉發(30)、評論(30)、時間(10)、認證(10)、##(15)、粉絲數(5)


我覺得默認權重無意義,不如多種單一維度排序+分面導航,可做到搜索的靈活自由。


1.時效性應該是最重要的(微博非常講究時效)

2.Topic Rank(即是否命中某個熱門話題,命中的應該佔一定權重且約熱的話題rank越高)

3.People Rank

4.分享rank(包括評論和轉發、被分享、被收藏)

5.query與文本內容的簡單相關性


其實主要看你的搜索排名是針對什麼?是針對博主還是針對內容? 針對內容,恰好如果你為SCI投稿過,你就應該很清楚,內容只有在被引用的情況下,價值才會放大。這也是pageRank的模型。如果是針對博主,看你如何定義博主的價值,如果是傳媒性,那3F是應該考慮的,轉發與評論的權重大於粉絲權重。如果定義博主與內容二維排序,建議生活內容引用權重要高,然後才是博主傳媒性。如果是社會內容,反之。總之,是情況而定了。


大致思路:

因素/權重搜索方向 實時搜索 熱門搜索 社交搜索 名人搜索 原創搜索 本地搜索

1,發布內容的關聯度 10 10 ..

2,發布時間 10 8 ..

3,轉發的次數 1 9 ..

4,評論的次數 1 9

5,發布人的身份是否認證 1 1

6,發布人與用戶的關注關係 1 1

7,原創還是轉發 1 1

8,是否包含圖片、視頻、音樂、短連接 1 1

9,發布地點 1 1


如果限定在內容搜索的角度上,個人覺得應該特別注重三個權重:依次為連接關係(雙向關注、單向關注)、內容對應的興趣點專家內容關係、該內容的評論/轉發數值,以及這三個權重與時間線的互相影響。


我覺得,微博更多具備了一個媒體屬性和社交的屬性

我可能會傾向於選擇,時間,粉絲數,轉發數,評論數一次是40 30 20 10


微博是個社交圈子,從三方面考慮:時間、地域、關係。


多謝邀請,個人覺得評論、轉發、發博人的粉絲數三個因素較為重要,權重40%,40%,30%吧,個人愚見,拋磚引玉


百度微博搜索

試用:瀏覽器中輸入http://www.baidu.com/ s?rtt=2tn=baiduwbwd=【關鍵字】,如搜索cnBeta


推薦閱讀:

TAG:微博 | 演算法 | 微博搜索 | 微博搜索引擎 | 搜索演算法 | 搜索引擎 |