個性化推薦產品小結

前段時間負責的一個產品,主要面向銷售人群,提供企業相關的資料,比如聯繫人、聯繫手機、座機、郵箱等信息。由於銷售是一個很龐大且行業分布廣泛的群體,不同行業的銷售對所需資源方向完全不一樣,同時企業數據量太大,即便是檢索也會是一個繁瑣的過程,於是個性化推薦企業信息系統誕生了。

個性化推薦有三個重要的因素:資源屬性、用戶屬性和個性化推薦方案。我們在網上能找到的最多的相關資料是第三點,個性化推薦方案,這確實是產品推薦準確度最核心的因素,但另外兩點並不只是從屬地位。

用戶是產品存在的根本意義,而資源是產品能夠提供給用戶的信息,很多時候由於各方立場不一樣,用戶體驗認為用戶是王道,產品經理認為資源更重要。事實證明,中庸之道最厲害,用戶和資源是雞和蛋、源與本的關係,都不能輕而視之。下文將對上述三點依次介紹。

用戶屬性

首先對我們的用戶群體進行分析,分析的緯度如下:

  • 用戶來源,即用戶怎麼接觸到產品,SEO/SEM/其他用戶推薦等,對SEO和SEM需要把關鍵詞附上,比如關鍵詞「東莞新能源公司」,了解用戶使用產品的初始原因。這是我們獲取用戶信息的初始點,畢竟用戶之前是否不斷更換搜索關鍵詞才找到我們,天知道。

  • 用戶職業與行業,我們產品吸引到的主要是銷售,但不排除有其他我們之前沒有考慮到的職業人群在,需要記錄好,以備後續的用戶增長;用戶行業是核心的,不同行業的銷售需要尋找不一樣行業特徵的企業,比如會計行業的銷售人員,其實是在找所有有代理做賬需求的中小型企業。 關於用戶具體職業和行業的獲取,我們一般很難靠技術或者第三方去獲取,最簡單直接的辦法是用戶自己主動填寫。

  • 用戶訴求和用戶目標,有重合的地方,但也有很重要的區分點。用戶使用我們的產品,是可以從中獲取價值,類似拿到相關企業負責人的聯繫方式等,但這只是他的基本訴求,而目標更和商業利益相關。比如一個用戶需求是有實體門店的客戶資源,這是基本訴求,而他的目標可能是賣POS機,也可能是某O2O的地推等等。了解了用戶的最終目標後有助於我們更好地完成用戶訴求,提高個性化推薦的準確率。
  • 用戶訴求和目標,這兩點我們也是開放入口由用戶自己填寫,同時也會記錄好用戶瀏覽記錄,作為推薦用的補充信息。
  • 用戶人類學特徵,有些時候並不重要,尤其是我們整個有針對用戶人群的產品,這一塊資料可以起到補充的作用,但是發揮不了太多的作用。

資源屬性

資源屬性主要有三個點,資源數量、資源質量以及資源維度。

  • 資源數量是至關重要的環節,資源獲取也是一個很糾結繁瑣的事情,有時間可以後續再詳細介紹,這裡簡要描述一下。第一步是搜集全網資源,保存到資料庫。第二步是將數據進行欄位規整化處理,並歸類;第三步數據補全和驗證;第四步交付到資源池,供推薦使用。
  • 資源質量,承接了上一段的數據補全和驗證這個階段;質量影響到用戶對產品的信任度,質量差的資源是浪費用戶的時間,從而導致用戶流失和口碑的下滑。資源質量的好壞標準由用戶最看重的產品價值來定,比如我做的這個產品,80%的人看重的是手機聯繫方式的準確性,衡量規則很簡單,從簡單到難有三個梯度:手機號碼能打通——手機號碼能和聯繫人對上/手機號碼能和所屬公司對上——手機號碼能和聯繫人以及公司都對上。除了第一條,接下來的那些都是正常渠道很難解決的問題。暫且不說。
  • 資源維度,這個是為後續的個性化推薦做好準備,標明各條資源有些什麼特點;這個的實現方式有很多種,比較多的是標籤提取。我們由於上一步進行過一步數據欄位規整化處理,其實是已經分出了一些維度,接下來是將這些欄位裡邊能夠繼續細分的拿出來細化處理。比如根據公司的經營範圍或者公司名稱里,去獲取公司更細的行業分類等,維度越多元,個性化推薦的準確率會更高。

資源是整個系統的後備儲蓄糧草,量和質是基本的保障,在現實情況下,數量和質量是難以兼得,需要一個標準,這個標準因產品而異;同樣資源維度的多元會因大量數據而出現誤差,這個誤差的接收標準同樣需要因產品和可承受度而定,最後結合個性化推薦系統揚長避短。

個性化推薦方案

這一步是用戶與資源的對接,最後的落地執行。個性化推薦演算法這一塊網路有很多相關資訊,有多種演算法,包括今日頭條也對外批露了一些方案實施細節。這一塊我主要說一下我們產品做推薦的基本邏輯。

用戶行為在個性化推薦系統中一般分為兩種:顯性反饋行為和隱形反饋行為。前文我介紹過,我們用的方法有用戶填寫信息(顯性),也有歷史行為記錄(隱性反饋行為)。這為我們做推薦的時候提供了兩種方式,顯性的推薦準確率毫無疑問是會很高的,但同時我們可以灰度部分推薦使用隱性。原因很簡單,顯性雖然準確率高,但是對用戶是一個打擾;另一個原因是,用戶顯性提交的需求維度,不一定能匹配上我們目前資源給到的維度,在這種不對等的情況下,用戶的顯性需求在資源池看來是未知生物。

顯性反饋的推薦邏輯非常簡單粗暴,標籤匹配,將用戶輸入的訴求和目標信息,進入到資源池匹配,尋找相關度高的資源進行推薦。在數據量有保證的前提以及維度互相匹配的前提下,準確率很高。

隱性反饋的推薦邏輯相對複雜,需要對瀏覽記錄進行分析,找出瀏覽記錄與用戶真實需求之間可能存在的關聯,這會不斷試錯,且需要大量數據訓練再驗證。

個性化推薦稍不留神就會出現推薦偏差,原因包括用戶填寫信息有誤、數據量不足、資源歸類不正確等等。因此需要一個快速及時的反饋系統。

我們採用的方式主要有三種:客服反饋、用戶抽樣回訪、以及隨機查看後台推薦數據。不斷地在試錯過程中發現和解決問題,推薦不會有最好,只會有持續更迭改進。

好的,暫時就這些。


推薦閱讀:

個性化推薦系列之初步認識推薦系統
推薦系統圈的高端聚會這十年在談些什麼?
個性化推薦系列之初步認識機器學習
聊一聊個性化
Pinterest暴力版人工智慧個性化推薦系統

TAG:個性化推薦 | 推薦 | 互聯網 |