[轉]產品經理必懂的數據常識
看到這篇文章,覺得很有用。所以轉給大家看看。感謝訂閱號「黑無常產品最前線」!
「數據」這個詞,是產品經理永遠繞不過的話題,當你和開發爭論時數「數據是產品經理最後法寶」,很多2-3歲的產品經理對數據的理解仍是模糊無章法的,鑒於本人也略懂2年的數據產品經驗,特整理成文,給產品新人普及一下基本的數據知識,如有瑕疵,請見諒。
1、基本概念
什麼是「移動App的數據分析」?為什麼要進行「移動App的數據分析」?
簡單來說,通過在App中進行埋點採集,或讀取App存儲在資料庫中的業務數據,以一定目的,將數據進行「篩選、清洗、加工、解析」,產出對產品設計、運營計劃有幫助的結論的過程,就是「數據分析」的過程。持續的數據分析可監控產品的運營狀態、提升推廣效果、發現產品問題、優化產品體驗。
2、基本術語
這裡舉幾個我常遇到的術語,便於同開發和運營進行溝通。
埋點:一般意義上的埋點,是利用如友盟、Talkingdata等第三方公司的SDK,通過在App中嵌入一段SDK代碼,設定觸發條件,當滿足條件時,SDK會記錄日誌,並將日誌發送到第三方伺服器進行解析,並可視化地呈現給我們。這一過程就叫埋點。
埋點方式也分「簡單埋點」和「自定義埋點」,所謂「簡單埋點」就是直接拿到第三方key,寫到App代碼的配置文件中即可。而「自定義埋點」則對應一種叫「自定義事件」的功能,一般第三方統計工具都支持,我們可通過設置「自定義事件」查看App特定的操作行為數據,如點擊按鈕次數、打開指定頁面次數等。
通常創建「自定義事件」都需要產品經理告知開發App的哪些條件下需要觸發「自定義事件」,以及觸發時要如何通過不同參數區分不同的點擊行為。
維度:維度就是指我們平時看事物的角度,也可理解成分析一個數據能從哪些方面去分析,這些「角度」都是有值且可被枚舉的。比如我們註冊用戶數有10萬,那可分析的維度有:用戶所在省份、用戶性別、用戶角色、用戶來源等。不同維度來觀察數據,可以得出不同結論,能否拓展觀察維度,也是評估數據分析能力的一個關鍵。
度量:度量和維度相輔相成,是指可量化的數值,用於考察不同維度觀察的效果,也可理解成「數據指標」。觀察度量值可總體查看,如App總用戶數,也可配合「維度」分層查看,如不同省份的註冊用戶數、活躍用戶數,不同來源的App啟動次數、平均日使用時長等。
渠道:指App的不同安裝來源,如通過第三方應用市場安裝,通過廣告點擊安裝,通過地推二維碼掃碼安裝,通過官網下載安裝等。互聯網公司的商務工作一般就是拓展渠道,觀察不同渠道帶來的數據表現,不斷優化渠道質量。
3、基本指標
註:以下所說的指標,均以移動App常見的核心指標為主,不涉及業務相關指標。目的是希望產品經理在談起某個數據時,能統一認識。
新增用戶:安裝App後,首次啟動App的設備數,需要按「設備號」去重。新增用戶主要為了衡量推廣效果,以及當前產品在整個生命周期所處階段。
活躍用戶:時間段內,啟動過App的設備數,需要按「設備號」去重。活躍用戶主要為了衡量運營效果,以及產品使用情況。
啟動次數:時間段內,啟動App的次數,無需去重。啟動次數主要為了衡量推送效果,以及App的內容是否足夠吸引人。
留存率:時間段內的新增用戶,經過一段時間仍啟動App的用戶,占原新增用戶的比例。「時間段」的劃分方式有:按日、按周、按月,對應指標還可細分為「日留存率、周留存率、月留存率」。而「經過一段時間」的劃分方式有:次日、7日、14日;次周、+2周;次月、+2月等。一般一款App的次日留存率為30-40%,次月留存率為20%,已經算是不錯的成績了。
使用時長:時間段內,從啟動到結束App使用的總時長。所謂「結束App」,通常指殺掉進程,或者將App退到後台超過30秒。一般會按「人均使用時長、次均使用時長、單次使用時長」分析,衡量產品粘性和活躍情況。
使用頻率:用戶上次啟動App的時間,與再次啟動的時間差。使用頻數分布,可觀察到App對用戶的粘性,以及運營內容的深度。
4、基本技術
數據採集技術——抓包
所謂「抓包」,一般指觀察App上傳到伺服器上的數據都有哪些。
通過「抓包」觀察,一方面可判斷自家App是否正確上傳了想要統計的數據,另一方面還可抓取到手機上安裝的其他App的上傳數據,用來分析競品內容更新情況。
一般在Mac系統上,我習慣用Charles工具,Windows系統可以用Wireshark。當然抓到的數據如果想進行詳盡分析,需要一點基本的http協議知識和json格式知識
數據提取技術——sql語言。sql語言一般用於從資料庫中進行數據的增刪改查,需要企業運維人員或DBA人員開啟許可權才可訪問,大公司的產品經理基本沒機會用到,但如果你是小公司的高級產品經理,且和技術商議僅開啟只讀許可權,還是可以嘗試使用的。
以我個人經驗,掌握sql只是基本要求,更關鍵的在於了解資料庫表結構和關聯關係,以及你提取數據的思路,sql只是工具而已。sql語言本身也和資料庫軟體相關,推薦學習mysql的sql語法,簡單易試。至於語句,只要掌握group by的維度,where的限制條件,還有join語句的表連接邏輯,基本就能應對80%的數據查詢需求,剩下的就是熟能生巧了。
數據處理技術——Excel、Python、JS。提取出來的數據,要深入分析,肯定得進行二次加工。按使用的難度高低,需要掌握工具如下:
Excel:大名鼎鼎的office工具,有著極其強大的數據處理能力。常用數據分析功能有透視表和命令行。推薦一個我喜歡的處理命令:
VLOOKUP:這是一個查找函數,給定一個查找目標,它就能從指定的查找區域中返回想要查找到的值。它的基本語法為:
VLOOKUP(查找目標,查找範圍,返回值的列數,false)
我們可在一堆數據中,根據指定條件,進行二次篩選,非常方便。當然這個函數的作用還不止如此,有興趣的同學可以深入研究一下。
此外,包括COUNTIF、IF等判斷語句,也是篩選數據非常好用的函數。
Python、JS:Python、JS其實是一種通用腳本語言,不止適用於數據分析,但由於其安裝、使用方便,函數庫豐富,特別適合有開發基礎的同學嘗試。舉個例子,mysql提取出來的數據,DBA通常會以Excel格式提供,簡單的二次處理可用Excel完成,但涉及根據業務不同,要根據Excel做數據的條件判斷計算,以及循環處理,就要藉助第三方開發語言了(當然Excel自帶的VBA也很強大)。此外,如果希望以更可視化的方式查看數據,還可通過JS技術,調取第三方開發庫。
5、基本分析方法
介紹幾個常用的數據分析思路:
對比:字面上理解,就是非孤立地看數據,而是多個數據提取進行比較。根據對比方法不同,分為「橫向對比」和「縱向對比」。
橫向對比:指空間維度的對比。相當於一個指標,在不同條件下的對比,但每個條件都屬於一個層級。舉個例子,App功能的A/B測試數據對比,各個渠道的新增用戶對比,都屬於橫向對比。
縱向對比:指時間維度的對比。一般的對比方法有:同比、環比。同比一般指是指本期數據與上年同期數據對比,環比則是本期統計數據與上期比較。觀察時間軸上的數據折線圖來判斷產品運營狀態也是一種縱向對比。
拆分:分析這個詞,從字面意義上理解,就是「拆分」和「解析」,當某個維度對比後發現問題需要找原因時,就需要進一步「拆分」了。舉個例子,如果發現某日的銷售額只有昨日的50%,就需要對銷售額指標拆分為:成交用戶數 x 客單價,而成交用戶數 = 訪客數 x 轉化率。那麼我們接下來就可分別針對:訪客數、轉化率、客單價,觀察今日和昨日相比的數據變化,找出原因。
降維:當維度太多時,我們不可能全部分析,這時就要篩選出有代表性的關鍵維度,去除掉那些無關數據,這就是「降維」。比如「成交用戶數 = 訪客數 x 轉化率」,當同時存在這三個指標時,其實我們只要三選二就能得出結論了。
增維:增維和降維是相對的,如果當前觀察的維度無法解釋當前問題,就需要對數據進行運算,多增加一個指標。在可視化分析領域,也可將不同類型的圖表嵌套使用,能達到增加信息展現維度,擴展分析廣度的目的,如下圖所示:(將環形圖和折線圖進行增維嵌套)。
分組:也可叫聚類,合適的分組能更好地理解業務和場景。例如用戶畫像過程,就是一個按不同維度對數據分組的過程。通過用戶畫像,可以很清晰地知道產品的用戶地區、用戶興趣、用戶年齡、用戶性別等屬性佔比,產品經理可通過畫像進一步了解用戶需求。
漏斗分析:主要用於分析產品使用的關鍵路徑,通過設定一系列操作步驟,統計每一步中的操作用戶數,並將用戶數以柱狀圖縱向排列,就可形成用戶流失漏斗,我們可分析漏斗每個環節的流失率,並觀察改進環節交互體驗後,流失用戶的變化情況,以此來驗證改動效果。
AARRR模型:該模型一般用於遊戲數據分析,是Acquisition、Activation、Retention、Revenue、Refer,這五個單詞的縮寫,分別對應一款移動應用生命周期中的5個重要環節。AARRR本身是一個循環,使用者需觀察每個環節的數據情況,以此來分析產品是否在執行一個正循環過程。這其中的任一環節除了問題,都會導致產品數據的異常。
推薦閱讀:
※如何成為BAT瘋搶的產品實習生?
※《啟示錄-打造用戶喜愛的產品》讀書筆記
※互聯網簡訊早報-20170726
※產品經理如何基於需求迭代產品(下篇1):產品設計的高內聚低耦合
※互聯網簡訊-20180423
TAG:產品經理 |