這不是文本框,是搜索框

前天,我們上線了新的知乎搜索。新知乎搜索,是我們與專註搜索技術 11 年的合作夥伴搜狗搜索一起,針對知乎特點定製開發的搜索系統。新的搜索改進了自然語言處理、排序演算法和機器學習等方面。評測顯示,搜索效果基本可以與主流系統持平。我們針對之前搜索常出現的問題,比如搜人時回答數和贊同數較多用戶排名靠後,搜問答前面全是 0 回答問題等等,都進行了修正和改進。

同時,新搜索是作為底層技術運行在知乎的伺服器上的。它的提升會使得所有對接搜索介面的服務體驗同步受益。比如提問、邀請回答等功能。這樣,大家可以不用重複提問,更精準方便的邀請專業人士,與更多人在同一問題下交流、討論。

儘管已經和搜狗的兄弟姐妹們一起奮戰了多日,期間也進行了多輪搜索效果評測,但是,要大家彙報「新搜索上線」這件事,我們仍然心有忐忑。這大概是因為很少有搜索引擎能夠像知乎搜索一樣,與知友們有如此親密的關係,我們能鮮明的感知到大家對於搜索效果是否滿意,而我們又是如此迫切的想讓大家滿意。憋著勁改進搜索效果期間,我們一度把用戶對搜索的吐槽做成彈幕循環播放。那時幻想在未來的某一天我們能夠膽宣布,知乎搜索框已經不再如其中某條吐槽所說,「就是個能打字的文本框」。

對於這次的改進和合作,其實有很多可以跟大家分享,不過考慮到大家的興趣重點可能不同,我用問答的形式介紹下,大家可以挑自己關心的問題看。

1.知乎為什麼不直接接入搜狗搜索?而要再重新做一套定製化系統?

簡單的說,雖然直接接入(SITE 語法)是個低成本的解決方案,但是這個方案無法滿足知乎用戶的需求和知乎產品的演進。

知乎不是一個個相對獨立的網頁,我們特有的內容排序機制、豐富的人的屬性和互動關係決定了我們的搜索要對用戶需求有更深的理解。比如,當大家搜索某個用戶時,你的期望可能是這個用戶是貢獻過很多優質回答,可能是與你關注的問題有關、也可能是跟你有過某些互動的。這些需求都必須特別定製。

定製化的知乎搜索,儘管現在看起來跟主流搜索的 SITE 搜索效果差不多。但是,未來持續優化的空間更大。我們將及時根據大家的需求和反饋,及時優化。

2.現在的搜索真的有改好嗎?

其實,這個問題是要等看大家的反饋,我們才能回答。大家說好才算好。

現階段,我們只能說,從技術評測角度,搜索的效果確實是變好了的。反應整體搜索質量的「DCG 評分」由 0.39 提升到 0.64,效果已經基本持平通用搜索平均「SITE 語法」的 0.63(差距在評測誤差範圍內)。 不過,需要特別說明的是,所有搜索評測結果都是抽樣樣本獲得,只能近似反應效果好壞的期望值。所以,評分變好並不意味著每一個搜索詞對應的效果都變好了。我們會繼續與來自搜狗的搜索技術專家們緊密合作,靈活而有針對性的對知乎搜索做出升級和改進,爭取獲得更好的搜索效果。

總之,大家用著看吧。要是覺得有不好用的地方,都請直接評論,我們看到後,會及時優化。

3.知乎和搜狗合作,輸出內容給搜狗是怎麼回事?

作為本次知乎與搜狗搜索合作的一部分,知乎的內容數據將在搜狗獲得更優的結構化展現。具體說,大家在用搜狗搜索時,可以更好的搜到知乎的優質內容、人、和話題。同時,類似搜狗上的微信垂直搜索頁面,我們也上線了知乎垂直搜索頁面,並實時推送站內的熱門內容。

我們會進行這樣合作的原因是,知乎上的優質內容值得更大的舞台,知乎的優質內容貢獻者值得更多的關注。這和做《知乎周刊》、「鹽」系列電子書等內容衍生品是一脈相承的思路。

知乎與搜狗在數據層面的合作建立在知乎現有用戶協議的框架之下,對於用戶的個人隱私信息和版權等有著絕對的尊重。而且,如果你不希望被搜索引擎檢索,可在「設置」中修改「隱私保護」部分的設置,對於站外的用戶與搜索引擎,你的姓名會顯示為「知乎用戶」,頭像圖片也將被隱藏。總之,尊重大家的選擇。

最後,做個預告,我正邀請搜狗那邊的技術專家 @許靜芳,來寫篇專欄,給大家講講我們這套系統背後的搜狗技術。如果對這個話題感興趣,可以保持關注。

推薦閱讀:

玩轉知乎,我只看這一篇。
Firebase App Indexing--谷歌的應用內搜索

TAG:知乎产品改进 | 搜索 | 搜索引擎 |