移動互聯時代,RFM數據模型還有用嗎?

RFM模型已經有50多年的歷史了(具體多少年沒查到,各路文獻基本上都說40-50年)。許多學者、相關從業者對這個模型做了大量研究和實踐,證明了RFM是一個簡潔、有效的模型。RFM模型用3個簡單但是有代表性的維度構建了一個有效的用戶分類運營方法。在如今移動互聯網時代,我們是否還應繼續將這個模型應用到運營中呢?

nn

1. RFM模型定義及變數理解

nn

老生常談,首先從RFM模型的傳統定義說起,其每個維度的定義如下:

nn

  • R(Recency)表示客戶最近一次購買的時間有多遠

  • F(Frequency)表示客戶在最近一段時間內購買的次數

  • M(Monetary)表示客戶在最近一段時間內購買的金額

RFM這3個維度的數據會長什麼樣呢,以下是某個八線內容類APP的RFM值分布(時間跨度為3個月),這裡的Moneytary用PV總和代替,Frequency和Moneytary通常呈現明顯的右偏。Recency就比較有意思了,可以看到,在右邊有一個明顯的波峰,這是因為進行了一波推廣,但是獲取的流量效果不佳,多數用戶來了一次之後就流失了。

nn

在數據分析中,我們選擇的每個指標,做的每個圖表都必須是有意義的,應用之前必須用馬雲的話問一下「So TMnWhat」。那麼RFM3個值有什麼實際意義,反映了什麼商業問題呢?

nn

  • R(Recency)用戶類型。在移動互聯網業務中,可以用Recency定義用戶類型(活躍用戶、休眠用戶、流失用戶)。

  • F(Frequency)用戶忠誠度。這裡隱含了一個假設,即越活躍、越忠誠的用戶,購買次數或者使用頻率越高。

  • M(Monetary)一段時期內的用戶價值或者給公司帶來了多少收益。Monetary不一定非要是收入,可以是任何與收入直接掛鉤的指標。用今日頭條來舉例,Monetary就可以是單人閱讀的文章總量,因為今日頭條的收入與文章閱讀量數據直接相關,它的業務模式其實就是賣廣告,以流量換收入。

2. RFM的傳統用法

nn

RFM模型是一種用戶分類方法,因為模型中包含Monetary,所以它還是一個基於用戶價值的分類方法。在實際應用時,通常包括RFM打分、用戶分類、分類運營3個步驟。

2.1 RFM打分

nn

RFM打分不是一個必須的過程。打分的目的是為了便於分類用戶,但是有了聚類演算法後,就可以直接用RFM的值進行聚類(當然,數據清洗、標準化這些過程不可省略)。如果對RFM打分,還需要考慮劃分方法,劃分的方法有等距離、等總數、等記錄數和均值劃分(劃分方案可以參考John R. Miglautsch的《Thoughts on RFM Scoring》)。到底哪種劃分方法更合理,需要結合具體業務和數據不斷調整、測試。

nn

  • Recency:使用等記錄數量劃分

  • Frequency:使用均值劃分,頻率1的是第一組,求出其他frequency的均值,小於均值的是第二組,循環求均值

  • Monetary:使用等總數劃分,每個區間內的總和相同

2.2 用戶分類

nn

這裡就不說打分後的用戶分類過程,網上有很多現成資料。只說說應用聚類方法時,如何確定分幾類合適。我們可以藉助silhouettenscore,用K-Means聚類時,先設定類別數量區間(比如[2-9]),循環調用聚類演算法,得到每個類別對應的silhouette score,畫一個散點圖,其最高點對應的類別數就是最合適的分類數量。

nn

RFM模型構建的用戶類別通常有重要價值、重要挽留、重要發展、重要保持、一般價值、一般挽留、一般發展、一般保持這8個分類。

如果在分類過程使用聚類演算法,上述8個類別或多或少會有缺失。得到用戶分類後,運營人員就可以為每個類別定製運營策略。

3. RFM模型應用時面臨的問題

nn

從用途來看,RFM模型實際上是一個營銷響應模型。營銷響應模型的目標是預測哪些用戶會響應某個營銷活動,找到最有可能響應的用戶,只對這些用戶進行營銷活動,從而使營銷活動定位目標用戶更準確,並能降低營銷成本,提高ROI。模型上線後,再根據實際響應的人群,調整響應模型或者目標用戶。從響應模型視角看RFM模型,可以發現RFM模型有一些明顯的缺點。

nn

1. RFM這3個維度包含的信息有限,對商業問題的解釋度不夠。Recency可以用來計算用戶用戶類型,但是以此衍生出的用戶類型不夠具體,用戶生類型還可以包括潛在客戶(未轉化的用戶)和新客戶(首次轉化的用戶)。Frequency反映了用戶的忠誠度、活躍度,但是用戶使用了多少不同的產品/服務,使用時間的長短也是活躍度、忠誠度的變數。Monetary僅僅是用戶歷史消費總金額,不能完全代表客戶價值,歷史最大消費金額、歷史消費金額的偏度峰度等變數也是客戶價值的體現。

nn

2.n分類效果不穩定。 在用戶分類過程中,聚類演算法出來的類別數量不定,還有可能聚類效果不佳,silhouette score低於0.5。另外,Frequency和Monetary可能還存在共線性的問題,因為在一段時間內,用戶到訪次數越多,其消費金額越多這一觀點是成立的,很有可能影響聚類效果。

nn

3.n模型可優化性差。在用戶分類運營過程中,只能針對某個群體制定營銷策略,無法具體到個人需求、偏好。另外,如果某個類別的用戶(例如重要保留客戶)對活動沒有響應,他仍然會在下一次的營銷目標人群中,造成了資源浪費。

nn

實際上,有許多機器學習/統計模型可以用來建立響應模型,如logistic、ridge、決策樹、SVM、GBDT等。在機器學習/統計模型的視角下,我們建立的模型實際上是根據歷史響應數據,找出下次活動最有可能響應的人群,因此還要考慮更多的用戶屬性,如人口統計學屬性、產品偏好、產品購買周期等。一個合理的營銷響應模型需要不斷的迭代更新。

4. RFM模型使用建議

nn

對於運營來說,基於RFM的用戶分類運營效果不如基於用戶畫像的營銷響應模型。因為從機器學習角度來看,特徵是王道,而RFM僅僅是用戶畫像中的三個維度,且包含的信息量不足,而一個用戶畫像還包括了用戶的人口統計信息、產品偏好、消費習慣等方面的維度。但是,如果你的公司沒有建立用戶畫像,那麼我們還是可以拿RFM作為臨時解決方案。

nn

對於數據分析來說,RFM倒是一個不錯的分析工具,我們可以藉助RFM來進行月度間的運營效果比較。利用相同RFM均值,將用戶劃分成8個類別,比較本月和上月各個類別的用戶變化情況,從而評估本月的運營效果。

nn

5. 總結一下

總的來說,在移動互聯時代,RFM模型在實際運營中依然有用、有效,但是其效果不如機器學習/統計模型。現在,一個中小型企業利用阿里雲、騰訊雲等雲服務就能夠建立數據倉庫,構建用戶畫像,精細化運營、千人千面的技術門檻大大降低。在移動互聯網跑馬圈地已經基本完成的背景下,各家比拼的是運營水平。因此我建議把RFM作為一個分析工具而不是一個運營工具。
推薦閱讀:

《R語言實戰》第三部分第十二章-重抽樣與自助法學習筆記
《R語言實戰》第四部分第十五章-時間序列學習筆記(II)
Python數據分析及可視化實例之Bokeh與Jupyter生成可視化圖表(8)
市場規模是怎麼估算出來的?都有哪些依據?
老鹿玩數據——不光是求婚神器(二)

TAG:数据分析 | 互联网 | 移动应用运营 |