【2018.5】也許你的用戶並不想要千人千面,或是那大數據上帝視角模型的結果

TL;DR

在高維稀疏場景中

  • 用戶可能無法快速理解系統的「推薦結果」(除非有詳細理由)。
  • 用戶無法理解時候,不代表用戶就會自然接受推薦結果。
  • 潛在方案:用戶熟悉的場景下默認給用戶熟悉的結果,並給出其他某方面改進的選項;用戶不熟悉時候再給推薦結果。

前言

不記得從哪個月開始,應該是淘寶的技術同學首先開始使用並宣傳這個詞:千人千面。

但其實相信做過ML的同學都應該對這個詞感到略厭惡,因為其實這就是「個性化」的另一種新的說法,連新瓶裝舊酒都不算。而且個性化也不是推薦領域先出現的,我相信百度肯定很早就做過搜索結果的個性化。在千人千面這個詞提出來之前,包括淘寶和其它電商在內,個性化的工作應該早就存在了。某種意義上,千人千面是一個噱頭,甚至是一個沒有太多成本的噱頭。

不過當我們放下技術人員的潔癖後,還是能從中看到另外兩個可能的好處的:

  1. 在公司內部樹立起一個大目標,你可以管這叫「推薦個性化效果優化專項」,也可以管這叫千人千面。技術公司內也需要大旗,好解釋的大旗,能讓所有技術、非技術同學都懂的大旗,然後才能更容易的統一內部意見和力量。
  2. 用戶是需要教育的。雖然在電商領域用戶已經對個性化很強的推薦結果習以為常。但看看現在用戶對於強個性化強實時性的廣告推薦結果的恐懼、以及對各種大數據殺熟的批判,我得說,淘寶開始大肆宣傳「千人千面」這個功能是必要的,不知道是有意為之還是歪打正著。

無論對內對外,我們都需要教育大眾、普及思想、提升大家對某種技術/現象的接受度,然後方能形成合力,更好的做事——群體的共識是非常重要的,後面可能會單開一篇討論共識的價值。

用戶能接受什麼樣的個性化

電商推薦的角度上面已經說過,下面簡單列舉一些別的場景。

個性化的廣告

其實用戶已經對廣告習以為常,互聯網原住民甚至能夠視而不見。

但當廣告的推薦結果「有如神算」時,還是有相當多的用戶感覺恐懼的。例如:

  • 用戶白天和同事討論某類商品,回家打開淘寶發現被推薦該類商品的廣告,懷疑是淘寶App實時進行錄音。
  • 一個大數據的梗:某家長收到電商為其女兒推薦的孕婦用商品,但其女兒「還單身」,一段時間之後家長認錯,因為他們家女兒確實懷孕了。

這裡面其實2還是有可能的,畢竟只是洞察相關性而已,這方面只要一個人的數據夠多,找出這個人自己都沒有注意到的其他特徵還是不難的。

但你作為用戶會有什麼感覺呢?可能少量技術控會覺得技術很NB很好很強大,但我相信一般的人感覺到的都是恐懼。

價格歧視

這就已經是現在大數據殺熟聲討的領域了。

價格歧視很多人都不太能接受,相對來說個性化的折扣能接受度相對大一些,但仍然會被大數據殺熟質疑。

成交價預測

比價格歧視弱很多的一個技術是預測用戶會選擇何種價位的服務。

例如,我們一般人對機票的時間段、倉位、機場等其實是有偏好的,而且這個偏好還會顯著影響價格。但一般攜程之類的網站只會顯示最低價xx,很少有服務會在那個給你寫「預測你會選擇xx價格的機票」,但其實前者基本用處不大,真正有價值的是後者,不是么?

但問題是,如果真的有服務敢把默認功能換成這個,那我相信肯定會被人罵死。因為這其實和說「我知道你總買貴的」沒啥太大差別,這樣用戶就知道了你有精確了解他喜好的能力,可以耍些手段從他這多賺一些錢,而服務提供者沒法自證清白。

某種意義上,滴滴的預估價是類似的,並且用戶一般都是上車後才會幹預司機的路線,並不是先固定一個路線再開始交易。而大家面對這種服務有什麼反應也都看到了。當然,這也和用戶並沒有明顯感知到這個到底給自己帶來了多少價值有關,畢竟對著打車預估價精打細算的人很少。

總結

一個個性化能被用戶所接受,也許需要以下條件:

  • 用戶自己有選擇權
  • 不能讓用戶感覺自己的隱私有明顯的泄露,例如拿網站A的數據去網站B給他做針對性廣告。
  • 不能讓用戶感覺自己一不小心就會被殺熟。但似乎目前沒有自證清白的手段,上那種信用卡信息嚴監管的方案感覺成本也太高。
  • 用戶能感受到這個個性化給自己帶來的價值,而不是對平台的價值。

你做的個性化究竟是給平台帶來價值還是給用戶帶來價值

我相信,很多策略同學的個性化優化目標都是公司的某種收益目標,很少有真正優化用戶目標的。

也有同學跟我說過,他想優化用戶的瀏覽次數,對公司可以降低每單的計算量,對用戶可以更快的看到自己的商品。

但我估計這個同學可能不太理解為什麼妹子要逛商場……先不說純休閑的需求,其實很多用戶是要先自己瀏覽一些,自己比較之後才做出的選擇。他最後選擇的商品早就已經看過了,但他要確定他的選擇是對的。這個瀏覽量是沒法優化的,或者說這個需求需要的是一個多維度的商品評價體系,你直接告訴他在他的綜合目標下這幾個就是最好的。

我認為一個好的評價體系,一個好的交易系統對用戶的決策是有價值的,但只是把你覺得用戶最可能買的東西推薦給用戶則對用戶未必有價值,畢竟很少用戶是對平台無條件相信的,劣幣驅逐良幣,總有不規矩的平台,用戶很難建立起這種級別的信任。

解決方式?

  • 足夠的用戶接受度(靠全行業教育用戶),或者是同時提供用戶能接受的解釋。
  • 只用在系統內部,而不是展示給用戶。只給用戶展示哪些用戶確實告訴過你的信息,例如他在這個小區上一次的上車點。

可能在數據高度稀疏的場景下,用戶就是無法理解(現狀)的

這裡的數據高度稀疏的定義和討論見

孫嘉龍:【ML專欄】【2018Q1】(4)眾包vs有監督學習?

zhuanlan.zhihu.com圖標

先強調下,非專家的用戶的看法是很重要的,因為這裡的用戶也可能包括你往上的某一級領導。

這裡舉一個真實的業務場景,就是我已經做了快3年的導航路徑規劃。路徑規劃的問題有很多難點:

  • 路況是實時變化的,而時間和是否擁堵是導航體驗很重要的因素。這方面司機和乘客的訴求還不一樣。
  • 整個query的維度較高:起點終點各2維,時間1維,路況到底用大約多少維才適合到現在也沒有定論,還有用戶司機偏好、用戶司機對不同路線的熟悉程度之類的。基本上沒有兩個query是完全相同的。
  • 用戶的目標是有差異的。用戶到底是要一個費用最低,還是一個時間最短,還是某種均衡是不知道的。
    • 有一個很簡單但很容易被人忽略的事實,那就是當你在某地圖App上選擇距離最短策略時候,平台給你返回了一個你期望的路線,但其實這個路線不是真的最短的。如果你想了解最短的路線是什麼樣,你可以參考一下步行導航的結果。
  • 用戶總覺得有一條更「好」的路線,特別是在全城都堵的時候,但其實很可能不存在。我自己做了快3年,相對這個傾向已經小很多了,但在面對某些場景時候都會覺得【這(肯定)應該有更快的路線吧】……

例如下面是從清華東門到亦庄文化園地鐵的最短距離路線(駕車):

而步行路線如下,這條路也是可以走車的:

從平台的角度上來說,路徑規劃的目標就更難以達成共識了。(這方面不展開)

甚至單從作為用戶的角度都會出現:公司內有一部分人覺得A好,一部分覺得B好,另一部分覺得無所謂都一樣……

豆腐腦甜黨和咸黨不能調和,說的就是這種情況。

這裡還沒說有一些不會看地圖、對路線沒有概念的用戶。

用戶真的能理解/想像高維場景中的最優么?

面對本徵意義上就是高維的業務場景,我猜測用戶(甚至是絕大部分普通人),無法建立起一個最優的具體概念。

先不說一般人的能力如何,在考慮實時路況時,讓我們的策略PM判斷哪個路線更好都已經是非常大的挑戰了。當然,路徑規劃並不是我所看到的最高維的場景,如何決定哪些訂單要拼在一起、怎麼拼所涉及的維度更高,是一個連專家RD跑去看case也看不出什麼頭緒/好壞的場景……(極端badcase除外)

那麼我們普通人,在沒有經過大量訓練的情況下,在決策時間不超過幾分鐘的情況下,又能理解到哪裡呢?

在用戶無法理解你的系統結果是否合理的時候,產品形態該如何設計呢?

我們再來看百度地圖的網頁端,有三個選項推薦路線、最短路程、不走高速,每個裡面最多給三條路線。

高德的網頁端的三個選項是:推薦方案、躲避擁堵、避免收費。

從滴滴的場景來說,之前導航只有一條路線,可以算推薦方案。但其實從用戶反饋來看,一個「推薦方案」對用戶解釋是不夠的,但很多用戶的訴求也不是這個路線不夠好,而是【我平時走的路線不給我推薦】。

應該是滴滴的場景和在網上查路線的訴求就是不同吧,頻繁打車的場景自己最熟悉,自己不熟悉的時候才會需要去各類地圖查一下路線。

目前我猜測這個場景的產品形態應該是給這樣3條:

  1. 用戶熟悉的場景下給用戶最熟悉的路線,不熟悉的時候給大眾(或者是用戶所在群體)最常走的路線,或推薦路線。
  2. 給出時間最短的路線,如果重複則不顯示。
  3. 給出費用最小的路線,如果重複則不顯示。
  4. 如果前面不足3個再繼續給其他維度上最優的結果。

思路上就是,除了哪些已經能夠明確量化的維度之外,給用戶最熟悉的選擇,此外再給一些在當前結果上某方面改進的選擇(各方面都好的帕累托改進是很少的)。當用戶不熟悉時候才給所謂的綜合最優的推薦結果。


推薦閱讀:

DataWorks數據埋點的設計及未來發展的思考
未來不遠 --2017雲棲大會觀感
sqoop簡單介紹
數據分析不只Tableau,這款國產工具也能扛上一扛!
解析:數據中心六大節能方法

TAG:大數據 | 個性化 | 互聯網產品設計 |