從『搜索』到『推薦』,以及更遠的未來

『讓人們最平等、便捷地獲取信息,找到所求。』看到這句話時,你可能會想到百度,可能會想到搜索。但是請別忘了,搜索僅僅是一種『獲取信息』的手段,而非唯一路徑。

人們為什麼要搜索?一般的觀點會認為,因為信息量太大所以人們需要通過搜索來篩選信息。而這個觀點遺漏了最重要的動機部分——人們在意圖產生後,才會有搜索行為。

在PC互聯網時代,這個觀點沒問題,畢竟PC很大程度上扮演了一個生產工具的角色,當人們使用PC上網的時候,已經由明確的意圖所指引——要用PC做一些特定的事情。

而在移動互聯網時代,當人手一部攜帶型聯網設備時,情景完全變化了——不再有明確的意圖驅使著人們上網,更多的時候用戶是出於無聊在玩手機,而玩著玩著卻產生了意圖。

我曾經寫過一篇關於搜索的未來的文章『世界的數字化,及搜索的未來』,如今已經可以看到未來的苗頭了。這個未來與用戶的精力極限息息相關。

在互聯網的內容消費上,存在一個『用戶精力』的分水嶺,這個分水嶺劃分出了兩類產品形態。

  • 信息低速增長期,內容的產能不足,用戶的精力過剩,此時需要提高內容數量。

  • 信息高速增長期,內容的產能過剩,用戶的精力不足,此時需要提高內容質量。

貼吧是典型的互聯網時代產物,它的出現顯著地提高了內容產能,同時也堆積了大量的垃圾內容。至今,部分忠實的貼吧用戶們仍然習慣於上古時代的頁面風格,以及從滿屏的垃圾中汲取出點滴精華的『撿破爛式』的快感。

微博是互聯網與移動互聯網交替期的產物,它一方面使內容產能再次飛躍,另一方面也提供了『關注』功能幫助用戶篩選內容。如果我覺得一個人的話很有道理,或者這個人的身份真實可靠,那麼我會關注TA。『關注』行為背後,代表的是我們對信息源的認可,人只是信息源的一種表現形式。

隨著精力閾值的到來,即便是對於『關注』的那些人所生產的內容,我們瀏覽起來也有些力不從心。這時候,需要將『關注』的粒度進一步細化至『內容標籤』級別,才能保證用戶有限的精力能夠投入到更多高質量的內容中。

前一段時間,我發現了這樣的一個app,它具備了關注『內容標籤』進行精準推薦的雛形,並且擁有了一批忠實的、偏好相對小眾的用戶群體。

然而,所謂的『精準推薦』,背後仍然少不了人工運營的影子。甚至可以這樣說,在當前的技術水平下,根本做不到『精準推薦』,所有精準的內容都有著人工干涉的痕迹。沒錯,是所有的,無一例外。

這麼說來,現在的確進入了『人工智慧』時代,畢竟是『人工』堆砌而成的『智能』嘛。令人尷尬的是,『人工智慧』這齣戲一旦開場,便不得不想方設法演下去,不然一切都穿幫了。偉大的無產階級思想家莊子告訴我們:人力也有涯,而智能也無涯,以有涯隨無涯,作死。按照目前的數據增長速度,扮演智能的人力已經有點捉襟見肘了。

所以,是時候考慮一下新的玩法了。比如說下面這種:

  1. 根據用戶的基礎信息匹配內容進行機器推薦。基礎信息包括用戶主動關注的內容標籤,以及從用戶設備中提取出的信息(機型、地理位置、app列表等)。這部分內容標籤屬於基礎標籤。

  2. 根據用戶的行為傾向匹配內容進行機器推薦。通過監測內容的點擊、內容頁面停留時間、閱讀完成度(用戶滑動的頁面長度占內容區域總長度的比例)可以判斷出用戶對內容的偏好度,據此向用戶推薦相關內容。這部分內容標籤屬於擴展標籤。

  3. 根據內容熱度統一向用戶群體進行機器推薦 。熱門內容往往跟用戶現有的內容標籤不相關,但卻擁有很高的點擊率,所以適合推薦給大量的用戶。這部分內容標籤屬於熱度標籤,有時效性的限制。

  4. 向用戶開放內容標籤的註冊,藉助用戶的力量維護內容標籤。專業性的標籤可以由編輯團隊來維護來保證質量,而更多個性化的、小眾的內容標籤交給用戶則是更好的選擇。開放的內容標籤,本質上是一個全民共享的收藏夾,每個人都可以把自己喜歡的內容放進相關的收藏夾中去。看起來開放的邏輯跟貼吧相似,但是要做的事完全不同:貼吧側重於內容生產,收藏夾側重於內容歸納。

方案說著輕巧,但是知易行難。內容標籤的挖掘粒度決定了內容推薦的準確率,而凡是用到『挖掘』這個詞的地方,也必然意味著是一個漫長而艱辛的過程。

篇幅所限,僅就上文提出的方案,寫幾個內容標籤挖掘思路:

  1. 通過用戶的機型信息引入內容標籤。根據我使用的小米MIX便可以推薦『小米』、『MIX』相關的內容,而跟『小米』相關的內容簡直不要太多:雷布斯(和他的好基友們,比如老周與老羅)、小米手機(及其它為發燒而生的產品)、各種友商(蘋果華為藍綠廠、魅族鎚子棒子機)。

  2. 通過用戶的app列表引入內容標籤。如果你通過某些途徑知道了我手機中安裝了微博、知乎、愛奇藝,那麼又可以推薦一波跟這些app相關的內容:微博的熱門話題、知乎的高票答案、最近熱播的網路劇。

  3. 通過用戶的常駐地理位置引入內容標籤。一線城市和三四線城市、城市與鄉村的用戶群體有不同的內容偏好,根據常駐位置推送不同的內容品類會提高準確率(尤其是廣告)。其實城市與鄉村中的手機品牌分布也有很大的不同,可以與位置結合在一起作為推送內容品類的參考。例如:對於在帝都又使用小米的我來說,多推薦一些『科技』、『互聯網』品類的內容看起來是一個明智的選擇。

  4. 抽取與用戶當前偏好不相關的熱門內容進行推薦,嘗試擴展用戶內容標籤。這個嘗試看起來似乎有點莽撞,實則不然:如果能提供一個合理的推薦理由(例如:其他人都在看),用戶往往不會覺得這是一種干擾。用戶討厭的是毫無由來的、強姦般的推薦。例如:我在科技新聞中發現了一個美女圖集,於是我點了進去。首先,圖集的封面吸引了我;其次,我很好奇大家都在看的是什麼。我才不會覺得這個推薦不準確呢。

  5. 通過人工在特定的時間節點上運營突發新聞以及低頻有規律的熱門話題,擴展用戶內容標籤。常見的突發新聞有地震、颱風等天災,恐襲、爆炸等人禍,離婚、分手等八卦。常見的低頻有規律的熱門話題有春節、高考、奧運會、世界盃等。

至於『向用戶開放內容標籤的註冊』,這是一個全新的命題,今天不想再展開寫了(就是這麼任性)。所以,本文就此結束。

『小應用,大內容。』這個未來可以有。


推薦閱讀:

【搜索Case分享】五分鐘,教你優化知乎搜索
Firebase App Indexing--谷歌的應用內搜索
Google 實時搜索索引 twitter 信息,twitter 為此付錢嗎?
互聯網廣告新規出台,這些行業將會受到重大影響
查詢詞-站點相關性計算

TAG:搜索 | 移動互聯網 |