淺談群組分析(Cohort Analysis)之於產品運營的價值

作者:閆鵬(公眾號:閆鵬),轉載請註明作者及出處。

一、何為群組?

  • 8月份A渠道導入的新用戶們是一個用戶群。

  • 系統版本為iOS10以上的用戶們是一個用戶群。

  • 加入購物車卻沒有完成付款的用戶們是一個用戶群。

  • 曾有過消費行為卻連續7天以上未登錄的用戶們是一個用戶群。

……

我們可以根據分析需要劃分出無數個用戶群。(當然全體用戶也是一個用戶群)

二、使用群組我們可以做什麼?

1.歸因

產品數據無論是變好還是變壞,我們都應找出其原因,找出變好的原因就可以讓它變得更好,找出變差的原因就可以讓它停止變差。

而產品數據的關注點往往在用戶身上,比如用戶的活躍度、留存、付費率等。

因此數據的波動也往往是某些用戶群體導致的,我們要找出這個群體,找出數據波動的原因。

那麼最簡單的方法就是分組看數據(group by),舉個簡單的例子:

用戶流失率升高了,怎麼歸因?

首先要知道我們的用戶在不同維度下都可以分成多組:性別維度分男女,年齡維度分老少……

而各組用戶的數據趨勢往往是不同的,也就是說數據的變化是非均勻分布的。

那麼,如果我們以用戶來源作為維度來分組看數據,我們就可以知道是不是某些渠道的用戶出了問題。除此之外,我們還可以以產品版本為維度、以用戶的操作系統為維度、以用戶的網路環境為維度、以用戶的對產品的使用進度為維度、以用戶具體行為為維度(如通過是否觸發(或完成)過某行為將用戶分為兩組;也可以用多個行為將用戶分為多組)……

回到例子中(以遊戲產品舉例,其他產品同理):

  • 我們先以渠道作為維度,發現各渠道趨勢相似,無明顯差異。那麼,我們就更換維度。
  • 這次,我們以產品使用進度為維度,發現只有等級為5的用戶流失率隨時間的推移上升明顯;
  • 我們再以用戶行為為維度,發現完不成5級的主線任務是5級流失率上升的主要原因;
  • 再以行為為維度,發現沒有獲得道具X是未完成5級主線任務的主要原因;
  • 再以行為為維度,發現沒有去地圖N是未獲得道具X的主要原因;
  • ……(如此一步步歸因到最後)

最終,我們發現是產品的引導做得不夠明晰,用戶不知道要去地圖N才能獲得道具X。

可以看到,通過這樣分組觀察數據,我們可以較容易地找到數據變化的原因所在。

另外,再次提醒:在整體數據趨於穩定的情況下不應大意,此時有可能是一部分用戶群的數據正在變好,另一部分用戶群的數據正在變差。

2.精準觀測目標用戶

我們做產品是有目標人群的,我們做功能優化、活動策劃往往也是有目標用戶的。我們要明確地知道目標用戶是誰,他們之前和之後的數據是怎樣的,才能評估產品改版或活動執行的效果,而如果我們僅通過觀測整體數據來衡量,則效果往往不明顯,因為數據會被沖淡和干擾。

3.精細化運營

不同用戶群的需求往往是有差異的,因此一視同仁不如各給所需。

還有一類特殊的用戶群體,我們稱之為高價值用戶,二八定律大家都知道,顯然我們應該找出這20%的人,並重點服務好他們。

4.對比分析

很多時候,我們看單一群體的數據是不容易發現問題的。

  • 比如,我告訴你某APP第二季度男性用戶貢獻收入1000萬元,你覺得是多還是少?你可能會覺得條件不足,無法判斷。
  • 如果我再告訴你它同比增長15%,環比增長10%呢?通過對比不同時段的群體,你可能會覺得它的増勢還不錯。
  • 如果我再告訴你其女性用戶貢獻收入3000萬元,同比增長60%,環比增長30%呢?通過對比不同性別的群體,你會了解到這兩個群體的差距越拉越大。

這就是數據對比顯而易見的意義。

在其背後我們可以考慮兩個群體差距拉大的原因是什麼?是否符合產品預期與定位?未來是期望繼續拉大差距(專精)還是縮小差距(平衡)?

我們最常用也是最簡單的用戶群對比就是「同期群對比」,包括同比和環比。

「同期群」簡單來說就是以時間起點為唯一變數(時間長度相同,其他條件也相同)的多個用戶群。

用中秋假期(3天)的用戶活躍數據對比端午假期(3天)的用戶活躍數據,就是簡單的同期群對比。

比「同期群對比」高級一點的是「同期群分析」,區別在於前者對比的是「點」數據,後者對比的是「線」數據。也就是說「同期群分析」會對比多個同期群隨著時間而發生的數據變化。

最常用的同期群分析就是留存分析,比如8.20、8.21、8.22三天的新增用戶構成了3個同期群,查看並對比他們在各自隨後七天的留存率變化就是一個簡單的同期群分析。我在3年前寫的一篇關於LTV分析的文章用的也是同期群分析的方法。

同期群分析的主要目的在於通過對比來發現出現問題的「群」,通過優化產品,我們期望「新群」的數據能夠總是好於「老群」。

同期群的分析只是群組分析的一個典型案例,除了時間,我們還有很多劃分群組的維度,也可多維度組合,如一線城市的互聯網從業者對比二線城市的互聯網從業者。

在BI系統的所有數據展示區域,我們都可以加上用戶群對比的功能,以查看並分析不同用戶群體在不同數據指標上的表現差異。

5.群畫像分析

將用戶群體的屬性分布逐一展示出來,就是群體畫像。

通過群畫像,我們可以了解到指定用戶群的年齡分布、性別分布、等級分布、設備品牌分布、活躍度分布等等。

通過觀察和對比群體畫像,我們可以了解到自己對目標用戶群體的定位是否精準,以及該往哪個方向調整。

三、系統實現

沒有成熟的系統支持,群組分析的門檻和成本其實還是有些高的,需要手動取數和作圖,而這部分工作其實是可以交給程序來完成的。

那麼,系統實現的難點就在於如何幫助使用者簡單地拼裝sql語句進行數據的提取,以及如何做好數據的可視化。

具體實現方法我之後會單起一篇文章簡單談一談。

閆鵬,2016.9.8,微信(QQ):11345191,博客:閆鵬 | 不放棄夢想,不脫離實際。


推薦閱讀:

場景、內容、用戶需求!「未來酒店」如何搭建「大數據之路」
如何用表單收集高價值數據?
框架為數據科學家帶來哪些編程語言所不能帶來的優勢
安客誠成為阿里數據銀行首批認證服務商 助力數據營銷新生態
Excel之數據錄入篇(二)

TAG:數據分析 | 大數據 | 數據 |