面向運營的互聯網數據分析體系-(五)運營的數據支持(用戶、內容)

這次要介紹最後兩個運營的數據支持:用戶運營和內容運營。這兩者涉及到的內容比較多,特別是用戶運營的數據支持,工作中會涉及到不少機器學習和統計分析的知識和工具,同時還需要分析師和運營保持良好溝通,牢記數據和業務結合。廢話少說,下面直接進入正題。

1. 數據支持——用戶運營

上一篇列舉了一些用戶運營的職責,其實可以概括為3點:

  • 獲取用戶:通過用戶教育、引導需求、品牌建設等手段獲取有效用戶。
  • 用戶成長:用戶成長有兩個方面的含義,一是用戶認知的成長,用戶熟悉產品能實現的需求,二是用戶價值的成長。
  • 挽留用戶:延長用戶的生命周期。

用戶運營在不同公司可能有不同的職責,初級用戶運營負責客服、群管理、處理用戶反饋等。高級用戶運營包括用戶關係管理、用戶層級管理、用戶激勵、發掘用戶需求、用戶畫像管理等。本質上來說,互聯網的所有運營都是對用戶的運營,因為所有運營策略的對象都是用戶。用戶運營與數據緊密相關,最近幾年出現的增長黑客、數據運營都可以看做用戶運營。用戶運營是駕駛員,為其他運營活動指明方向。結合用戶生命周期,我們可以進一步細化用戶運營的職責(如下表所示),這些職責基本上都需要數據支持。

1.1 引入期

引入期的目的是引流,這是用戶運營的起點。引入什麼流量?在哪裡可以找到這些流量?這些問題需要數據分析師分析現有用戶的基本屬性、行為特徵為運營提供數據支持。

  • 了解現有用戶。基於用戶畫像數據(基礎屬性、用戶價值分級、生命周期分級、交互行為特徵、偏好特徵、到訪行為特徵等),使用聚類演算法,我們可以將用戶劃分為幾個群體。然後分析每個群體的特徵,比較這些群體的異同。用戶聚類後,我們可以使用5W1M模型(who-誰,why-為什麼來,what-來做了什麼,when-什麼時候來,where-在哪裡使用,medium-通過什麼渠道來)來分析每個類別的特徵,就可以得到一份比較詳細的用戶特徵報告。根據用戶使用的功能、購買的品類,我們可以發現每個群體的穩定需求和長尾需求。在聚類分析時,我們不必一次加入所有維度,可以組合某幾個類別的維度,從而發現一些有趣的模式。比如首先用用戶的基礎屬性和偏好特徵聚類,了解什麼人對什麼內容感興趣。然後可以用用戶的到訪行為特徵(到訪間隔、渠道)和偏好特徵聚類,了解特定偏好的人的行為特徵。
  • 觸達有效用戶。在流量運營中,我們常常會面臨這樣的問題:我該去哪裡獲取用戶,推廣費用該怎麼花?當運營提出這個需求時,作為數據分析師,該怎麼做呢?通常情況下,分析師從數據中挑選過去90天消費金額前20%的用戶,然後根據用戶畫像,用excel做一些圖表發給運營。這樣做就夠了嗎?你怎麼知道是性別重要還是年齡重要呢?所以在這裡建議使用分類模型來分析優質用戶特徵。在準備數據集的時候,我們可以將消費金額頭20%和尾50%的用戶挑選出來,從而增加特徵的區別程度。然後構建多個有效的分類模型(從留存率或者用戶價值角度定義二元因變數),綜合這些分類模型,考察各個特徵的重要性。

1.2 成長期

當我們獲取了一批新用戶後,運營的主要職責就變成了讓用戶快速成長。用戶成長有兩個含義:認知成長和價值成長。在生命周期的成長期,運營的首要任務是讓用戶熟悉產品功能、內容和使用場景,讓用戶知道我們的產品能夠滿足自身的需求,從而提高新用戶留存率。為了更高效的引導新用戶成長,用戶運營必須:

  • 找到新用戶留存的關鍵。在早期的電商運營中,激勵措施通常是直接發放代金券,或者直接給折扣。雖然現在也有代金券和折扣,但是這已經不是主要的激勵手段了。舉個例子,餓了么現在會給用戶發放頭三單優惠券,京東會給用戶代金券和多個品類的優惠券。這種轉變的原因是什麼?很簡單,就是我們通過構建分析模型(分類模型、生存模型等),發現購買3次及以上用戶的留存率顯著高於3次以下,而且這個特徵的重要性排名非常靠前。類似的,如果發現購買家居、母嬰的新用戶留存率也非常高,我們就可以給一些特定的用戶發放家居、母嬰優惠券,引導用戶消費行為,達到讓新用戶留存的目的。
  • 使用激勵刺激用戶成長。激勵新用戶的手段可以分為3類:價值激勵、情感激勵和榮譽激勵。這3種激勵方式分別對應了馬斯洛需求的3個層級:生理需求、歸屬和自我實現。在日常運營中,我們需要持續關注激勵手段的有效性,關注的指標有使用人數指標、轉化指標和留存指標。以下是我開發的一個電商優惠券使用監測數據產品。整個報表包含4部分內容,一是優惠使用概括統計,二是訂單指標統計,三是轉化指標,四是新用戶留存指標。基於這些統計指標,我們可以在活動中臨時調整活動策略、在活動後評估活動績效、比較多個活動的效果。

1.3 成熟期

成熟期用戶的運營是運營的關鍵,因為成熟用戶貢獻了絕大多數收益,並且運營成本低於新用戶(因為教育、引導用戶的成本小於非成熟用戶)。成熟期的運營有兩個關注點:價值和活躍度。

  • 通過多種手段提升用戶價值。一般來說,瀏覽量和轉化次數高度相關,而曝光又和瀏覽高度相關,所以提升用戶價值的方式就是將商品更多的在用戶面前曝光,通過推送、推薦的方式將商品、內容、活動告知用戶,吸引用戶瀏覽、購買。這裡有兩個關鍵點:一是觸點、二是內容。觸點即用戶接觸信息的渠道,可以是在產品內(詳情頁的推薦區塊等),也可以是在產品外(合作渠道的廣告位等)。內容則是推薦系統基於協同過濾、基於內容或者基於某些特徵輸出的用戶最可能感興趣的內容。這裡我們要用A/B測試分析增加、減少、修改推薦區塊對用戶瀏覽深度、轉化率的影響;用歸因模型分析外部渠道對轉化的影響;用在線A/B測試和離線模型分析推薦演算法變動對轉化率的影響。
  • 提高活躍度。用戶使用app的時間越長,看到的信息越多,購買的可能性越大。DAU對於任何互聯網產品來說,都是一個非常重要的指標。連以往只注重GMV的電商都在努力提高用戶活躍度,例如京東改進了用戶分層方式,希望加大用戶活躍,用戶在回答問題、評論、簽到等環節都可以獲取積分。我們可以用系列二提到的AARRR模型分析用戶活躍度,不僅要分析整體活躍度,還要關注某些功能、頻道的活躍度,考察這些功能、內容對於轉化的提升有沒有效果。

1.4 休眠期&流失期

對於大多數互聯網產品來說,用戶流失是不可避免的,而且長期的流失率遠大於留存率。大多數情況下,運營做了足夠的召回工作,用戶最終依然流失。因此我個人認為流失用戶的召回更像是一種補救措施,彌補產品、運營的缺陷。為了減少用戶流失和提高用戶召回效果,我們需要:

  • 用戶流失預警。利用用戶畫像數據,我們可以構建一個用戶流失的分類、生存模型來預測當前用戶的流失概率,還可以找出造成流失的關鍵因素。構建模型時,我們一般選擇流失閾值-d日的數據進行建模,我們希望越早預測到用戶流失越好(d越大),但是d越大,模型準確率越低,所以要不斷在線上、線下測試d值。要注意的是,流失模型有一定的滯後性。因為它不是基於最新的數據,無法反應最新的產品功能、內容、流程變動對流失的影響。

  • 分析流失原因。用戶流失原因大致可以分為3類:體驗流失、競品流失和需求流失。體驗流失指的是產品用戶體驗差造成的用戶流失,我們可以從用戶口碑、評論和轉化漏斗發現問題、定位原因。競品流失指的是用戶的需求尚在,只是轉移去了競品。我們可以從外部購買一些行業數據對比自身產品數據和行業基準數據。需求流失指的是用戶不再有這個需求,比如以前有個很火的APP叫「臉萌」,其主要功能就是做頭像,大家圖個新鮮,可有多少人會天天換頭像呢?說到底,非剛需、需求低頻的產品都會面臨需求流失這個問題。另外,調研是最直接的了解用戶流失原因的方法。確定調研目標、選擇調研對象,設計問卷是調研的關鍵。工作中比較少的涉及到調研,經驗不多,就不班門弄斧了。
  • 使用戶重新活躍。用戶運營要想辦法讓休眠、流失用戶重新變成活躍用戶。最常用的手段是推送三件套(郵件、簡訊、應用內消息)。用戶召回通常以推送(為所有用戶推送相同信息)為起點,根據流失、休眠閾值定製推送內容。比如21天未下單時,應用PUSH召回,發放一般力度的優惠券,並提醒2次未過期。29天未下單時,簡訊召回,發放較大力度優惠券,並提醒未過期。在有了一定數據積累後,我們可以構建響應模型(分類預測模型),預測用戶是否會響應指定類型的優惠。另外,渠道曝光也是召回用戶的重要手段,運營需要重點關注高價值流失用戶的活躍渠道。

1.5 所有階段

還有一些數據支持工作是貫穿於整個用戶生命周期,是需求頻率比較高的數據支持,通常固化在數據產品中,這類工作有:

  • 評估用戶滿意度。用戶滿意度有兩層含義:一是用戶對整站、整個產品的滿意度,二是用戶對某類功能、內容、商品的滿意度。我們可以有四個方法評價用戶滿意度。一、留存率直接反應的用戶滿意度,我們可以和行業基準進行比較,從而判斷用戶對產品的整體滿意度。二、我們還可以使用百度、騰訊的語義、情感分析API分析用戶在產品內或者社交平台上的言論。三、用戶對產品的評分直接反應了用戶的購買、使用體驗。四、通過在線調研的方式獲取用戶對產品的整體評價,調研問題通常包括用戶基礎屬性、用戶對各個服務的評價、用戶的關注點。我們可以參考京東、天貓超市的問卷設計自己的滿意度問卷。
  • 預估參與度。這裡的用戶參與度指的是用戶對活動、推送等運營手段的響應。我們可以根據以往的用戶參與數據,構建響應模型預測用戶對未來活動、推送的響應。構建分類模型的時候要注意數據不平衡問題。因為響應率通常可能只有5%左右,所以通常需要進行過採樣/欠採樣(SMOTE在高維度數據上不怎麼好用,太慢了)。
  • 評估活躍度。用戶在轉化前通常會有一系列行為(瀏覽詳情頁、瀏覽評論、瀏覽曬單、加購、提問等),我們首先用歷史數據計算這些行為的匯總數據與轉化次數的相關性,找到那些和轉化高相關的行為。然後計算這些行為到最終購買的轉化率c%,那麼將其權重設為w=c%×100。最後將所有w匯總,即得到當天的活躍度。
  • 用戶變動分析。運營的根本目的是讓用戶變成我們希望的類型,即高活躍、高價值的用戶。我們所有運營策略的效果都體現在用戶變動(或者說用戶轉化)上。常用的用戶變動分析有用戶等級變動分析和生命周期變動分析。用戶變動情況可以固化為數據產品,而變動後面的原因則需要基於用戶畫像進行匯總。比如說流失用戶到成熟用戶的轉化率這個指標,歷史均值是7%,本周是11%,數據分析師就要找出指標變動的原因,是什麼運營策略對什麼人產生了這樣的效果。我們可以用上一周結束日的數據作為用戶池,統計這些用戶在本周的生命周期變化情況。下表是用戶生命周期轉化矩陣示例,紅色表示數值好於平均值,綠色表示弱於平均值,藍色表示最近4周的轉化平均值。每一行的轉化率加起來正好是100%。

  • 發掘用戶的潛在需求。我們一般通過調研和分析用戶行為的方式來了解用戶的潛在需求。數據分析師可以分析用戶行為為運營提供支持。如果用戶對某類商品有需求,將會更頻繁的瀏覽相關信息(商品頁、評論、使用反饋等)。我們可以將用戶行為二元化(是否瀏覽詳情頁,是否瀏覽評論,是否使用搜索),然後分別計算這些行為組合(瀏覽詳情頁+評論+搜索、瀏覽詳情頁+評論等)在全體用戶中的支持度。比如我們上線一個站內的飾品促銷活動,從數據中發現50%的訪問過活動頁的用戶同時瀏覽了A品牌的商品列表頁,那麼我們就可以在A品牌的商品列表頁加上這個活動的banner。

2. 數據支持——內容運營

內容運營工作的核心是提供優質內容。優質的內容必須符合產品定位,並且被用戶喜歡。這裡的內容是個廣義的概念,包括文章、微博、視頻、商品等。因為從本質上來講,它們是一樣的,都是用戶提供感知價值的方式。下面將以商品為分析對象,闡述如何為內容運營提供數據支持(不涉及供應鏈環節)。商品分析有它的基本模式,出發點是商品供需情況。

2.1 商品分類維度

商品分類是商品分析的起點,對商品進行分類是為了滿足運營和用戶的需求。運營的側重點在分析,比如賣的好(差)的商品的特徵是什麼?什麼特徵的商品銷售額上升最快?所以我們在內部構建數據倉庫、開發數據產品時要預設一些運營常用的分析維度。而用戶希望通過商品類別能夠快速找到自己所需的商品,側重點在商品實體屬性。因此,我們可以針對這兩個需求方設計兩種商品分類方法:一是從運營角度分類,二是基於商品實體屬性分類。

● 運營角度的分類

運營角度的商品分類是基於運營策略、運營績效相關的商品屬性,這些屬性通常是無形的,目的是讓運營明確商品/品類所處的地位、經營狀況,從而指導運營,售出更多商品。主要的分類維度有以下幾種:

  • 價格段:將商品按照價格分為n個類別,而價格一般又表示商品的定位(高檔、中檔、低檔)。
  • 商品定位:商品對銷售的貢獻方式,包括引流款、活動款、利潤款和形象款。
  • 產品生命周期:新款、舊款、當季,或者導入、成長、成熟、衰退。

基於商品實體屬性的分類

商品的實體屬性反映了商品本身的特徵,是為了讓用戶更方便的找到所需的商品。商品實體屬性可分的類別很多,不同用途的商品用於分類的屬性一般不同(比如家電和化妝品)。比較通用的三個分類方法是:

  • 品類(用途):品類反映的商品的用途。所用到的分類方法有線分類法和面分類法兩種。線分類法是構建大類、中類、小類的類目樹。面分類法是將某個類目劃分為平行的幾個類別,類別之間不能有重複。比如將男裝品類按照款式劃分為西裝、襯衫、褲子、T恤。
  • 品牌:品牌是商品定位的體現,這些定位包括價格定位、銷售地區定位、目標人群定位、渠道定位等。
  • 原材料:生產產品的基本原料。例如棉、化纖、奧氏體不鏽鋼等。
  • 功能特徵:商品具有的功能。例如手機是否配備NFC、是否支持5G。

2.2 商品銷售分析

商品銷售分析是商品分析的重點,目的有兩點,一是告訴我們商品銷售狀況如何,二是分析銷售變動的原因。從用戶行為和商品銷售業績兩方面進行銷售分析。

基本指標

商品銷售分析的基本指標用來衡量某個產品/品類的用戶行為和銷售業績的整體趨勢是否符合預期,包含3方面的數據:用戶購買行為、用戶瀏覽行為和商品銷售業績。

  • 用戶購買行為

用戶購買行為實際上是用戶的轉化漏斗(從曝光到下單)。我們可以使用這個轉化漏斗來評估用戶的購物體驗,評估方法可以參考上一篇中的產品轉化率分析。除了產品體驗外,活動也會造成轉化漏斗異常。比如雙11前,商家通常鼓勵消費者將商品首先加入購物車,到點搶購,1111當天瀏覽->加購的轉化率就會明顯降低。復購率反映了用戶忠誠度,復購率高的商品是主要的銷售利潤來源。在電商領域,一般使用月復購率來衡量運營效果,類似於留存率,復購率=上月&本月均購買的用戶/上月購買的用戶。選擇哪些商品作為平台利潤的主要來源時,也需要參考該指標。

  • 用戶瀏覽行為

瀏覽行為數據一共包含4個指標。停留時間、關注人數和收藏人數用來衡量用戶對產品的興趣度,可以輔助運營決策(發放定向優惠券、發起專題活動等)。分享人數反映了用戶的滿意度,用戶只有在滿意度很高時,才會將產品分享到自己的圈子中。

  • 商品銷售業績

產品銷售業績報告反映了商品的銷售狀況。通常使用對比分析、趨勢分析方法分析銷售業績數據。

商品指標

商品指標反映了商品採購、庫存、銷售的一些基本情況。由於涉及到庫存數據,所以這部分數據需要調用進銷存系統的介面。

  • 庫齡=當前日期 - 商品上架日期

每個品類都有其特定的周轉周期,理論上庫存周轉率越高,庫齡越低。庫齡越長,說明商品周轉的越慢,銷售狀況越不理想。服裝、化妝品、食品等有保質期和銷售周期的商品尤其需要重視這個指標。

· 存銷比=一段時期內庫存金額/銷售金額

商品銷量越好,存銷比越小,周轉率越高。存銷比一般按照月或季末計算。在涉及到庫存的指標上,一般使用金額計算,因為庫存是以金額的形式體現在財務報表上。

  • 售罄率=一段時間內的銷售數量/(期初庫存數量+期中進貨數量)

售罄率的計算很簡單,就是銷售量/庫存量。售罄率反映了商品的暢銷程度。常用的有周、月和季末售罄率。售罄率可以作為訂貨的參考,還可以用來輔助運營決策(新品跟進、折扣、季末處理等)。除了從數量角度考察售罄率,我們還可以從金額角度使用這個指標。因為商品的進價隨時都在變化,有時候變化還很大,使用金額計算售罄率可以輔助判斷盈虧狀況。女性服裝、鞋履的銷售周期在3個月左右,因此這些品類非常看重售罄率。

  • 折扣率

折扣率直接影響商品的利潤。在計算折扣率的時候需要將優惠券也算作折扣。基於折扣率和銷售數量變動百分比,我們還可以計算某個商品/品類的價格彈性 = 銷售數量變化百分比/折扣率。

  • 動銷率=一段時間內售出國的商品數/一段時間內的庫存商品數

動銷率的統計對象可以是SKU、SPU、品類。電商的商品眾多,但是長尾現象很明顯,頭部的商品佔據絕大多數銷量。但是隨著機器學習、AI技術的應用(還有KPI的壓力),長尾現象得到了一定的改善,動銷率這個指標也越來越重要。動銷率是品類競爭力的體現,結合存銷比、售罄率,可以對商品/品類的銷售狀況有全面的了解。

銷售結構指標

銷售結構指標用於評估各品類、價格區間的銷售額貢獻度,讓我們明確收入的來源。

  • 品類銷售佔比=各品類銷售額/總銷售額。
  • 價格區間銷售佔比=各價格區間銷售額/總銷售額,價格區間的劃分要根據品類設置。
  • 正價銷售佔比=正價銷售商品(無折扣或低折扣)銷售額/總銷售額。該指標佔比越高,企業的利潤越高。運營能力越強,用戶忠誠度越高,該指標越高。然而現在的電商運營通常以GMV為導向,在一定程度上忽視了利潤。

暢滯銷分析

我們可以計算銷售額排名前10的SKU、SPU或者細分品類。前10銷售額佔比越大,說明銷售額越集中,業務發展風險越大,一旦暢銷款銷售不佳或者消費者興趣轉向的時候,對業務的發展是致命的。滯銷品指的是那些賣不出、沒人關注、即將過季的商品。我們可以從瀏覽量、關注人數、銷售數量、庫齡定義商品是否是滯銷商品。

場景分析

分析商品通常在什麼場景下售出。場景有兩個主要維度:地點特徵和時間特徵。地點特徵描述了商品主要銷往什麼地區。現在網路購物的設備載體主要是移動設備,我們還能獲取用戶購買時的地點特徵,比如是在家裡還是在路上或者是在辦公室。時間特徵也是非常重要的維度,時間特徵要結合時間前後的節假日。時間特徵還包括用戶在一天的什麼時候購買商品。

2.3 銷售潛力

商品的銷售潛力不僅僅指商品自身的銷售潛力,還包括商品對其他商品銷售的拉動能力。我們可以通過潛在客戶數評估商品自身的銷售潛力,使用購物籃分析和關聯銷售分析評估商品對其他商品銷售的拉動能力。

潛在客戶數

推薦系統已成為電商業務的必備功能。常用的一個推薦演算法是將商品推薦給與購買者相似的人,我們可以利用推薦系統輸出的用戶相似度匯總在不同的相似度等級上有多少潛在購買者。

購物車分析

在AARRR報表中,我們通常會計算連帶率,連帶率=訂單SKU總量(多個SKU不重複計算)/訂單總量,連帶率越高,說明交叉銷售做的越好。我們可以計算包含某件商品的訂單的連帶率是多少,其結果越高,說明該商品的需求越高,拉動銷售的能力越強。商品連帶率=包含某商品的訂單的SKU總量/包含該商品的訂單總量。例如,包含某個配飾的訂單總共有78個不同的SKU,包含這個配飾的訂單有27個,那麼這個配飾對應的連帶率=78/27=2.89。我們還可以用商品銷量和商品連帶率構建矩陣圖來分析哪些商品是真正的人氣商品,即高銷量、高連帶率的商品。

2.4 售後分析

售後分析從兩個方面分析用戶的購後體驗:不滿和滿意度。與不滿相關的指標有:退貨率、投訴率。與滿意相關的指標有:好評比例、購後分享比例。

2.5 客戶分析

這裡的客戶分析是分析商品的客戶群特徵。一個內容/品類運營既要了解客戶群的地域、性別、年齡、收入等穩定特徵,也要了解客戶的偏好、消費場景、消費習慣、用戶分級等動態特徵。通過分析客戶特徵,了解當前客戶與目標客戶的區別。根據現有客戶穩定和動態特徵調整運營策略。例如我們可以根據客戶的消費場景和購買周期推送活動信息,根據客戶的渠道觸點數據為廣告投放提供指導等。


到這裡,面向運營的互聯網數據分析體系這一系列文章全部結束了。我個人覺得互聯網數據分析的核心點是「轉化」,它是運營和數據分析的核心。另外,文章中提到了一些演算法(例如歸因分析、用戶聚類)將會以專門的文章詳細描述。

推薦閱讀:

課程篇(16):產品運營-數據運營
013【數據分析】利用Python進行數據分析 第二版 (2017) 中文筆記
魅族粉絲畫像:七成不滿30歲,男愛理財女愛學習
用Python讀紅樓夢之——二、詞雲美化
我的視覺廣告日記——紛繁的世界,聚焦的視界

TAG:數據分析 | 互聯網數據分析 | 互聯網運營 |