別落後了,開始你的第一方數據分析
一、有哪些第一方數據
我們常說數據驅動決策,首要的就是選擇利用什麼數據,今天這裡主要探討的就是用「第一方數據」來驅動決策。
第一方數據簡單來理解就是自有數據,大多數公司的自有數據就是資料庫裡面的用戶產生的業務數據,數據分析意識高一點的公司在此之外,可能會嘗試通過日誌收集一些用戶的行為數據。所謂行為數據就是包括進入產品,瀏覽等一系列的使用行為。所以對於一個產品而言,第一方數據一般就是用戶從各種來源(包含來源渠道版本等)來到產品開始,接下來在持續使用產品過程中產生的所有數據,包括用戶業務數據和用戶的行為數據。二、流量時代的第一方數據分析
1. 小公司的做法對於大多數非數據驅動型小公司而言,都沒有自己的數據分析平台,所以大多數時候的第一方數據分析,是依賴於工程寫腳本,根據需求查資料庫去計算。
很多時候時間都浪費在了溝通,確認需求,寫腳本,等待結果運算上,我相信很多公司一定有共鳴。2. 中大公司的做法對於很多中大型互聯網公司,公司內部也開始構建自己的數據分析平台,並且已經開始收集用戶的行為數據進行分析,但是大多數對於行為的數據利用還是限制於兩種:第一種做法還是基於Hadoop的統計分析,只是去統計一些關鍵行為的發生次數,常見的就是計算頁面訪問量,獨立用戶數,留存率等指標。第二種做法就是利用行為數據進行個性化的數據推薦。
在過去的十幾年,流量時代,得益於人口紅利,人群較為單一,業務沒有現在那麼垂直細分多樣化,所以大家的關注點都在於怎麼拉新(拉取新用戶),上面這一些指標可以比較概括的了解到產品的發展狀況,並且結合渠道的維度篩選,也能滿足比較拉新流量的需求。綜合兩類公司的做法來看,其實用戶的產品互動行為數據基本上始終被當做一個黑盒子來看,推薦演算法雖然對這些數據利用的比較好但是只是一個對單用戶縱深的分析做法,而橫向的用戶分析最終止於高度匯總的報表,並不能探索和驗證用戶在產品上的行為如何影響了公司的業務指標。一個典型的現象就是很多產品的迭代決策靠的是猜測或者直覺。三、現有數據分析存在的問題
但最近幾年的創業浪潮興起,業務越來越多樣化,人群越來越多樣化,不同於過往流量時代時人口紅利,單靠根據DAU,PV這些泛指標指示發展狀況,然後逼著眼睛找流量帶來新客戶,現在更多的是對提供用戶的留存和客戶忠誠度的需求,所以分析這些指標高低趨勢變化背後的原因也愈加重要了。所以如何去尋找分析背後的價值呢?
1. 數據分析場景化大多的數據分析工具,包括很多中大公司的數據分析平台,搭建的出發點就有一些問題,不是從解決問題的場景出發,而是要支持多牛逼的數據交叉查詢,然後就成了純粹的基礎分析平台工具,這樣越抽象,對於解決問題就會越遠,需要人參與解讀的就越多。對於大多數公司而言沒有專業的數據分析師,自然用市面上的通用工具就很難發揮出價值。同樣,大公司數據部門飽受詬病,也有很多原因因為各個業務線對於分析的需求不一致,要不然統一平台開發迭代慢,要不然就是定製化的分析需求太多,內耗也就很大。到最後花費大力氣兼容的分析需求其實最後也不會用的太多,metrics太多不一定是好事,有價值才是最好的。
所以分析必須從場景化出發,才能更快速解決問題。那麼有哪些場景呢?一般來講,也就是公司的各個職能分析需求,例如產品,銷售,運營,ERP,CRM,客服,財務等等,分析需求也就需要應用到這些場景中去了。每一個場景都有自己關注的指標類型,比如產品就是用戶持續使用情況,訪問路徑等等,銷售就是客戶轉化周期和轉化漏斗,運營是活動效果監測,來源對比等等,所以需要將分析從這些場景所需要關注的指標去抽離工具,能滿足這些場景分析的思路或者關注指標進行設計。2. 數據分析難點通常數據分析難的問題在於以下幾點:1. 沒有分析目標沒有分析目標帶來最大的兩個問題是:
第一,會收集所有的數據,總覺得可能用得上,會分析第二,收集了很多維度的數據,無從下手,不知道哪些維度可以找到問題。2. 不懂基本的分析方法基本上會看整體的變化趨勢或指標,但是不太會篩選業務相關的指標數據進行查看,所以忽視了很多指標是虛榮指標,一來可能是某些指標單調變化,無法反映真實情況,二是沒有同期群的對比,影響數據剝離對比,三是只注重結果,但是不會用漏斗去分析路徑,或者用自定義留存去觀察滿足某一條件用戶的實際使用情況。
3. 不能驗證跟蹤在推薦系統中用戶的反饋很重要,同樣在數據分析過程中,我們也需要去驗證一些分析結果,也要跟蹤改進後的用戶效果。四、場景時代的第一方數據分析
指標會轉向跟更多業務相關,並且數據不再是高度匯總的報表,而是我們能循蹈到這些報表背後的元數據關係,過去數據分析大多都是根據預想分析展開維度,基於這些維度統計發生次數,丟失的用戶的行為路徑,所以也就很難找到背後數據組織的邏輯,打開產品黑盒子,利用起第一方數據分析,很重要的一點就是需要基於用戶維度進行分析,例如諸葛io分析平台就是基於用戶的。
另外一方面產品的業務數據大多也是從用戶的行為數據轉化過來的,所以類似諸葛io分析會記錄用戶的行為用業務維度描述,這樣了解不是一個個粗粒度的頁面訪問,而是功能模塊的流向,當以用戶維度記錄這些流向之後,自然也就能從最後業務指標的變化,找到流失人群或者價值人群了,那麼對於提供用戶的留存度和客戶忠誠度也就有了方向,找到價值人群的價值共性,或者彌補流失人群的缺陷共性。五、第一方數據分析如何落地
對於簡單的分析,可以用後台工程師利用ELK(Elasticsearch+Logstash+Kibana)這一類的技術組件進行搭建分析平台,但是對於更複雜的,還是不要自己搭建平台,內耗太大,我相信隨著諸葛io,GrowingIO,AppAdhoc等這一類的平台興起,對於大多數公司而言分析也會變得越來越簡單,並且不同過去大多數據分析平台多為第三方數據分析,雖為免費使用,實際數據會被交換給其他平台,而這些第一方的數據分析平台也會更加保障數據的安全性。
本文為諸葛io 孔淼原創,轉載請註明出處!推薦閱讀:
※SQL,從熟練到掌握
※如何看待近兩年用戶行為數據分析平台的發展?
※財務分析經典圖表及製作方法(第1季)
※酷炫的matplotlib
※產品流量分析
TAG:数据分析 | GrowthHack | 诸葛IO |