從2個用數據提升轉化的場景聊開去

利用數據提升經濟效益有很多戰場,本文聊的是用戶轉化領域的2個典型情景和現存的問題。(其他還有偏後台的供應商管理或工作流平台優化,有空再寫)

現在有哪些用戶行為數據(以OTA為例)

用戶從搜索入站,關鍵詞是出行需求;出行日期和當前日期的差距,暗示用戶此時處於出行的何種階段,以及出行可能的類別;反覆搜索、篩選、查看的過程數據;多設備反覆以上過程的數據;(假如沒有就這樣離開了)完成預訂的行為數據;查詢訂單狀態,可能有來電來信的行為數據;完成後的點評,索取發票的溝通等行為數據。

假設我們不看以上任何數據,最傳統方式在後台一個個產品錄入,根據價格/分類排序,也完全可以售賣。借鑒了數據之後,首先「準備幹啥」,其次「為了什麼」,讓我們分兩大類的利用數據的方式,來解答這兩個問題:

第一大類 潤物細無聲

客人沒有感覺到額外的事情發生,最主要的場景是「排序」--這個詞範圍很大,產品排序,類別排序,評論排序等等,只要是排序就有數據優化空間。

排序的基本因素,大致可以分為三部分

一是內容本身的質量

不同類目差距很大:

虛擬產品關注是否傳遞了充分的信息,例如OTA來說,圖片數量、種類、質量,格式化的基本信息,例如位置信息,設施和使用說明等等;

如果是實物產品,涉及倉儲,例如哪個分倉有哪些SKU,配送費用等;

虛擬和實物共有的,影響排序的內容,是服務內容,比如退改籤條例,一般而言服務類內容有行業標準和法律法規,比較難拉開差距(但是鑽空子的行當還是太多了,比如ota。。。。,這種情況下服務類內容對質量分影響很大);

第一部分對大部分打工同學來說根本不是問題,因為如果內容都不具備,根本不會有什麼數據分析和數據運營,然而對創業同學來說,大部分時間還是花在這部分,後面的事情略奢侈。

二是非實時的干預

比如付費對排名的影響(這個可以寫一個p4p的長篇論文,對於不做ppc的人來說就是買流量,其實完全不是這麼一回事兒,市場投放的人命苦就在這裡,不多展開。)

再比如根據市場活動需求排序,根據利潤排序,根據賬號購買歷史排序等等。

這部分其實客人大都可以自己排序篩選,無非是有一個默認排序,以及特殊區域、廣告區域的排序而已。

三是實時的干預

也就是所謂大數據反哺。舉例子來說,如果這個客人在之前的記錄里,顯示出商務或者大款的特徵(類似價格倒序排序,只看這個地區最貴的酒店),此時應該在各個角落將各種排序從D絲版本切到高富帥版本。

這時的排序調整可以對轉化起到戲劇化的影響-不僅僅是增加了客單價,甚至因為優先展示了高價產品,轉化率會更高,因為讓某些客人覺得合乎身價。

三個層次排序的數據應用水平

排序優化的應用水平,也就是一二三的順序,首先基礎內容是最最根本的,沒有一,什麼也玩不起來;二可能對新轉型互聯網的行業有難度,一般來說都是標配;三是更上一層樓的對資源和團隊有一定要求的、比較前沿的領域,二線以上互聯網公司一般都有。

第二大類 嘈切錯雜彈

相比第一類的盡量不打擾,第二類是「適度打擾客人」。

如果說第一類已經充分進入大數據時代,第二類的現狀就基本屬於和數據分析沒有太大的關係,靠行業經驗和直覺來試錯。

類比線下的傳統行業,如果第一大類是超市如何放置商品貨架的話,第二大類無疑就是主動推銷的促銷人員了。

傳統零售行業,包括傳統軟體行業,已經有極其成熟的經驗體系,即在客人進入門店的每個時間節點,介入推銷的成功率是有規律性的差異的,這是需要培訓給每一個,學歷可能不是太高的店員店長的。至於傳統軟體行業,互聯網時代的小朋友可能很難想像,大部分銷售是靠會展的(其他部分是靠酒席的),和傳銷拉人一樣,在展會過程中,為與會者做產品介紹的每個時間節點,例如見面寒暄,介紹冊,參觀展廳,介紹案例,各個環節和情景下,介入干預並說服的成功率是不同的,同樣有完整的培訓體系。

然而目前這一切都是基於經驗,而不是基於理性的。

時代已經悄然發生變化,翻譯軟體已經可以通過機器學習,自行掌握不同語言的語序差異和使用習慣,在統計學進入這個領域之前,這是無法描述給機器的、只有人類能做到的模糊任務。換句話說,假如能收集大量的可供學習的素材,「在哪個時間節點,如何打擾客人,收益的期望最大」是完全可以計算的。

不做任何干預的情況下,客人在進站-搜索-排序-篩選-再次搜索-排序-離站或支付下單,有一個期望的轉化率,我們的命題就是,根據用戶的行為數據,選擇最合適的位置「打擾」客人,並驗證這個選擇是否最優,逐步改善。

對傳統超市、會展銷售、呼叫中心來說,在根據經驗制定了操作流程和培訓之後,在流程和培訓無法企及的地方如何繼續優化呢?--完全是殘酷的適者生存,如果銷售人員和產品、當地客群本身「相性」高(也就是匹配),自然會越「打擾」業績越好,如果不匹配,很快就會走人,天朝最不缺的就是用來試驗的人,很快就會產生明星推銷人員,沒有人會關注離開的人。

然而離開的人並非沒有價值,我們換個角度思考,如果在殘酷的適者生存的過程里,用數據記錄完整的過程呢?性別/年齡/學歷水平/主動程度/切入的話題/擅長的產品類別,不斷淘汰,不斷有人脫穎而出的過程,正是典型的模型參數學習過程。

回到最開頭的ota會員營銷話題,本文想說的是,無論打擾的方式是站內信/edm/微信,還是簡訊/電話,打擾的內容是陽春白雪的文案還是下里巴人的讓利,我們現在跳出執行的細節層面,在整體來看,形式/內容/話術風格/時令/地域文化差異,共同影響了結果,而這一切只要有數據,都是可以機器學習的。

顯然如果只有online數據,無論完整性還是完備性都是不夠的,還需要有和客服/門店/快遞人員的語音記錄等線下內容。雖然難度看起來很大,但是令人不寒而慄的是,如果這些問題被克服了,實際上就不需要多次重複建設,這可能是一種公共社會基礎模塊,類似《三體2》里,幾十年後到處觸摸屏、實時語音提示的情景。

這種(顯然會導致一大堆人失業的)未來,在目前看來並不是非常不可能,除了數據獲取和清洗需要很大的投入之外,暫時無法克服的只剩下一些存儲和運算的性能瓶頸而已。

聊一點題外話

在古裝片里,經常能看到皇帝召出占星師之類的角色,用八卦來推算未來,一般來說我們稱之為「迷信」。

然而假如用數據運營的角度重新看,有一些古代知識分子,根據歷史經驗,把各種相關事件抽象到陰陽八卦(也就是1和0的二進位),以3位數的二進位(例如乾就是111)來將歷史事件歸納提煉,變成「某種規律」,當需要占卜時,只需要把當時已知的情況作為參數錄入進「某種規律」,就可以得到一個誤差極大、但具備一定參考價值、並且演算法還在不斷更新的「天意」。

用這個角度看,在沒有任何計算設備的古代,這個方法是何其的科學。(而且占卜結果不好,並不會重新算、或者改掉,相比之下比現在的統計局還更靠譜一些)

在思考一些數據應用的情景時,偶爾就會想,可能我們現在的很多數據處理方法(為了克服性能問題,大量用減少精確性的偷懶假設,比如馬爾可夫鏈),在未來人類看來,和陰陽八卦的誤差率數量級是差不多的。帶著這些遐思去一邊整理隨筆,一邊回顧歷史、吐槽未來,也算是周末(帶娃之餘)最簡單最純粹的快樂吧。


推薦閱讀:

數據分析師-面試經驗
大概是最全的數據分析平台整理了
013【數據分析】利用Python進行數據分析 第二版 (2017) 中文筆記
今天,我們聊聊如何找資料
【商業分析】為產品找一個完美指標

TAG:互聯網數據分析 |