標籤:

如何成為數據驅動型公司

作者:桑文鋒,神策數據創始人兼 CEO,前百度大數據部技術經理

[引言] 這是在 Xtecher 大數據微信群里做的一個分享,感謝高琳記錄整理。如果想聽語音版的,可以移步知乎 Live:如何成為數據驅動型公司。

大家晚上好,很高興能夠有機會做這次分享。我今天分享的內容是如何成為數據驅動型公司。我看到今天這群里有一些是投資人,還有一些本身就是數據從業者,光 CEO 就有好幾個。今天我講的內容有可能還是比較基礎一些,希望起到拋磚引玉,促進大家一起探討。

一、什麼是數據驅動

先看一個故事。秦朝末年的劉邦、項羽,當時都是起義軍。最早是劉邦先打到了咸陽,但他沒有燒殺搶掠。他手下有一個謀士,就是大名鼎鼎的蕭何。蕭何做了一件事情,就把丞相、御史家裡的書和地圖之類都收集起來了,然後他們撤出了咸陽。後來過了幾個月項羽來了,那就是燒殺搶掠,把阿房宮也給燒了。之後項羽分封各路諸侯,劉邦被分到了四川,也就是巴蜀之地。那個時候蕭何經過數據分析,發現了一個特點。就是在漢中那個地方,在當時秦國的偏南一點,巴蜀北邊。地方不大,但是占秦國的稅收比例還挺大的。蕭何就勸說劉邦,讓劉邦找找人把這個地方分給他們。劉邦還真找到人了。當時項羽就覺得這個地方偏而且不大,反正也沒多大關係,就把漢中給了劉邦。劉邦就是在漢中之地集結力量回擊的,幾年之後把項羽給搞定了。

我們可以看到古代也是這樣,會數據分析的人和不會數據分析的人,差距還是很大的。蕭何會數據分析,幫助劉邦做出了關鍵的決策。而像項羽這樣不會數據分析,最終導致亡國都有可能。

(圖 1 楚漢爭霸圖,來源於百度圖片)

我們接下來說為什麼要做數據驅動。其中數據很大的價值就是:驅動決策。大家平時做一些討論,討論什麼事情該做不該做,項目怎麼樣,許多時候是憑感覺來拍腦袋的。這種方式有可能拍對,有可能拍錯。更好的方式要靠數據來驅動的。比如,一個產品的界面,到底綠色背景好還是藍色背景好,從設計的層面考慮,是都有可能的。那我們可以做一下 A/B 測試。可以讓50%的人顯示綠色背景,50%的人顯示藍色背景,然後看用戶點擊量。哪個點擊比較多,就選擇哪個。這就是我們討論的數據驅動。這樣就轉變成不是拍腦袋,而是通過數據去決策。

2001 年我剛讀大學,電腦輸入法都是用智能 ABC。打字非常慢的,需要打然後去選,效率很低。後來出現了紫光拼音,相比之前就好了很多。打起字來感覺按鍵都沒有按下去,字就已經跳出來了。但是也有問題,就是互聯網新出現的辭彙打不出來。這是因為它的詞庫更新比較慢。到了 2006 年的時候,搜狗輸入法出現了。當時給我的感覺是比較震撼的。網上出現的一些新辭彙,很快就能打出來,並且很流暢,就是因為它利用了數據。不論是打的字也好,還是搜索引擎里用的字也好,搜狗都會收集起來,進行統計分析。通過詞頻統計,把一些新出現的詞抽出來,更新到用戶的詞庫裡邊,這樣就讓輸入法變得更好。對比之前的輸入法產品,其中最大的區別,就是利用了大數據。

結合以上這兩個例子,我想表達的就是數據的價值有兩點:一是數據驅動決策。幫助你拍板,更科學的做決策。二是數據驅動產品智能。怎樣讓產品變得更加智能化。

下面我將主要圍繞這兩個視角,來講數據驅動的價值。

二、數據驅動決策

(圖 2 數據驅動決策)

在互聯網公司,數據驅動決策包括三個視角:

  • 運營監控。搞一些運營活動,不管是市場活動,線上線下活動,總之針對用戶的運營。運營情況、轉化情況,都是要通過數據進行監控的。

  • 產品改進。產品的新功能使用情況如何,接下來該怎麼迭代,都要基於數據。

  • 商業決策。是否要在新領域開展業務,是否要收購一個公司,都是要通過數據來做決策。

2.1 數據驅動運營監控

對於運營監控,可以分成三點:

  • 留存。用戶有很好的黏性,不斷過來用產品。
  • 拉新。怎麼獲取新用戶。
  • 變現。怎麼從用戶身上賺到錢。

對互聯網產品來說,我覺得運營的核心就是把這三件事做好。

首先,從用戶留存的角度。留存在我看來,重要性比拉新還高。做一個產品,我們把產品推上線,首先要關注的是,不是拉很多用戶過來,而是已有的用戶,哪怕是種子用戶,來了之後都不走了。黏度很高,來的用戶都能留下來,那以後滾起來是很厲害的。但如果比較低,拉多少用戶,就像猴子掰玉米一樣,結果只剩了兩個,這個就大打折扣了。

那怎麼做留存分析呢?我們來看一個例子。經常看到一些餐館會搞一些會員活動,比如每周二東坡肉半價優惠。那會員活動會帶來什麼後果呢,是會員進店次數增多呢,還是只有會員日過來,其他時間就不過來,只是換了個時間,佔了點便宜呢?這些我們通過留存分析,就會發現到底活動是不是有效的。

(圖 3 餐館門店留存分析)

這是一家連鎖店,連鎖店有好幾家分店。紅色標註的是案例門店。這家店以及倒數第二家都搞了會員活動,我們看到它們的前三周留存率都超過了 20%。沒有搞的店就沒有這樣好的數據。因此可以判斷會員活動本身就是非常有用的。不止會員日當日會過來,在其他時間表現也是非常好的。通過留存分析,就很好地解答了會員活動是否有效這個問題。

運營的第二個事情就是拉新,我們怎麼去獲取新用戶。

獲取新用戶,不能只關心怎麼到你這裡的。許多市場的同事容易存在這種誤區。在做宣傳的時候,用戶註冊了,就是達到目的了。其實不然,要衡量用戶激活。什麼意思?用戶激活就是完整的體驗了你產品的核心流程。如果做不到這一點,那註冊的價值就沒有那麼大。就拿一家新聞網站來說,如果用戶只停了 0.5 秒就跑了,那不叫激活用戶。用戶起碼得看個 20 秒或者 30 秒才行。

我們來看一個例子。這是在 8 月初的時候,我發現我們從某網站來的流量忽然增加了,明顯要高一些。問團隊的同學是不是有什麼合作。後來得知,是在合作夥伴那裡把我們加上去了,從那導入了一些流量。我問效果怎麼樣,市場負責同學就說挺好的,訪問首頁每天都增加這麼多流量。我聽完就笑了,用戶來了之後,是否變成了一個激活用戶?不然來了可能都是無效流量。

(圖 4 首頁訪問來源分析)

對於自己官網來說,只是到首頁還是遠遠不夠的。我會關心這個用戶是否會註冊申請使用,註冊之後就會發一個賬號,還關心是否會登陸,是否會進行關鍵的操作。這樣就形成一個漏斗,這一系列的之後,我判斷他是一個激活用戶。做市場活動,就是要把登陸使用的用戶吸引過來。中間環節雖然有用,但達不到最終目的。當你通過數據發現異常的時候,就儘快去用它。

(圖 5 用戶試用轉化漏斗)

按照來源分組後,我發現這個來源的用戶,轉到到試用的比例非常低,因此判斷這個合作夥伴鏈接,並不是一個有效的渠道。

運營的最後一步是變現。舉個例子,滴滴打車。平台對司機要進行抽成,那抽成多少比較合適呢,這也要通過大量的數據來進行分析,不是隨便拍腦袋做的決策。

2.2 數據驅動產品改進

講完運營監控,接下來講數據怎麼驅動產品改進。大家可以回想一下平時是怎麼做產品的。

(圖 6 產品迭代的錯誤流程)

我把它歸結為兩個環:一個是拍腦袋,一個是研發功能。基本上,產品經理通過一些調研,想了一個功能,做了設計,把這個研發出來,然後看一下效果怎麼樣。都是憑一些感覺,然後再去做下一步。基本上就是不斷的拍腦袋做功能。這樣總是出現問題,很容易走一些彎路。產品經理也不知道問題出在哪,所以更好的方式還是要把數據用起來。

這就是《精益創業》里的提到的一個理念。相比前面的兩個環,加入數據分析。我們是有一些點子,通過點子去研發這些功能。研發這些功能之後,重要的是要進行數據收集,然後進行數據分析。基於數據分析得到一些結論,然後基於這些結論,再去進行下一步的操作。整個過程就形成了一個循環。這樣人為的因素影響越來越少,更多的時候是用一種科學的方法來進行產品的迭代。

(圖 7 產品迭代的正確流程)

2008 年我在百度知道做研發。我們做了一個個性化推薦的功能。就是根據用戶以往回答過的問題或瀏覽過的頁面,推薦待解決問題。那引導語是用「等待您來解答」,還是「我來幫忙解答」。當時很難做決策。產品經理就做了一個測試,最終通過數據來判斷採用哪個。我們發現「等待您來回答」,比「我來幫忙解答」點擊率高了 15%,用哪個不用哪個就很顯然了。如果這些事情不通過數據分析是很難知道的,也不夠客觀。

(圖 8 百度知道問題推薦)

2.3 數據驅動商業決策

第三點就是數據驅動商業決策。比如:我們一段時間官網訪問的用戶分布。北京第一,上海第二,深圳第三,杭州第四。一般人覺得廣州也挺多的,但是數據顯示廣州還沒有青島多。青島為啥這麼多,這個我也感覺挺奇怪的。後來了解到,青島那邊有很多孵化器、科技園等產生了影響。那如果我們自己要開分部,那我們就按照這個這個數據,哪裡訪問量多,我就到開到哪裡去。這樣跟我的用戶分布是匹配的。

(圖 9 神策官網用戶分布)

三、數據驅動產品智能

講完了數據驅動決策,那數據更大的一個價值就是產品智能。什麼是產品智能呢?數據能夠自動反饋到產品裡邊去,就像百度搜索上的點擊調權。根據用戶點擊情況,去調整在搜索結果中的位置。我們把數據收集起來,然後在這個基礎上,去設計一些演算法,這樣讓產品變得更加智能化。產品智能覆蓋的面比較廣,個性化推薦、精準廣告、AI 等,都屬於這個範疇,我就不展開來講了。

(圖 10 數據驅動產品智能)

四、不同創業階段的數據分析

再來看一下,在不同的創業階段,怎麼做數據分析。

我把創業公司分為三個階段:

首先是 MVP 階段,也是《精益創業》裡邊提到的一個概念,即最小可行產品。這個階段產品沒有定形,我們總是在試探產品核心功能該做成什麼樣子。這些時候也沒什麼數據,主要是做定性分析,種子用戶可能都是你認識的,這時候並不需要專門的數據投入。

接下來就會進入增長階段。你的產品出來了,相對比較成型了,這個時候你就需要關注留存、拉新。首先保證老的用戶體驗比較好,不斷留下來。另外新的用戶怎麼吸引過來。這些過程需要做大量的數據分析,我們就需要專門的數據工程師、數據分析師,來去支持數據分析的工作。同時也要藉助一些數據分析工具。

(圖 11 理想和現實中的數據驅動)

在這個階段經常出現的問題,是在數據分析這塊效率比較低。一般市場、產品、運營都有數據需求。那工程師從雜亂的數據中滿足需求,效率比較低,幾天一個。因此還是要把數據源整好,數據源整全整細。讓業務人員自助地去完成數據分析的需求,這樣就從串列的事情變成並行的事情,從幾天滿足的需求,變成幾分鐘幾秒鐘滿足的需求。效率就得到提升了。

到了增長階段後期,也就是變現階段。用戶到了一定規模,那一定要考慮變現方面的事情。這時候可能營收相關的數據分析比例就會非常大。那你會關注渠道、成本這些東西。對於大體量公司來說,一般就會有專門的數據團隊,適當藉助第三方工具。

對一家公司來說,所有數據分析的工具、平台都自己開發,這也不現實。這就像在電氣時代,每家都建個電廠,也不現實。有一些公司專門做工具,其他公司用這個工具去提升效率,那就可以了。

五、常用數據分析工具

那在數據分析這塊,我把常見的工具分成 6 類:

第一類:流量分析類(Google Analytics、百度統計、CNZZ 等)

這類產品都是流量時代的產物。三大門戶、新聞網站,包括個人網站等,那個時候誰的流量大誰就牛。所以關注點主要是訪問量統計。

第二類:App 分析類(友盟、TalkingData、百度移動統計等)

2009 年智能手機慢慢起來了。起來之後,出現了專門針對 App 做分析的。這些統計工具關注的點,就關注 App 裝機量、激活量,統計一下活躍用戶數。這些是可以,做一些深度的分析還是不太行的。

第三類:用戶行為分析類(Mixpanel、Heap Analytics、神策分析等)

相比於 App 分析類,這類公司偏向於用戶行為分析的深度分析。比如我們神策分析可以自定義事件、維度、指標體系,數據源採集上也會支持的更全更細。

第四類:數據可視化類(Tableau、Qlik、BDP、永洪 BI 等)

這類產品主要解決數據可視化的問題,特別是老闆看報表的需求。

第五類:應用市場監控類(App Annie、ASO100、ASO114 等)

偏向於監控在應用市場中下載和評論這些數據。

第六類:廣告效果檢測類(AppsFlyer、Adjust、秒針、AdMaster 等)

AppsFlyer、Adjust,這些都屬於這一類,一些出海的應用在用,監控 Facebook 之類的廣告效果投放。

六、數據分析的流程

接下來看一下數據分析金字塔:

(圖 12 數據分析金字塔)

第一層:要做數據採集,把數據採集源頭整好。

第二層:對數據進行建模。

第三層:真正去做數據分析的事情。

那我們要避免的誤區就是:我們只關注第三層的數據分析,只關心要取數,把數拿到,但是不關注把底層數據採集跟建模這些事情做好。那就會發現這個數據本身也很容易出錯,另外去獲取數據的時候效率非常低。

七、互聯網公司的數據分析痛點

再來看互聯網企業在數據驅動這點上,常見的問題:

1、創始人/管理者本身缺乏數據意識

平常都是拍腦袋做決策,憑感覺行事,下面的人就沒有動力去關注數據了。所以想成為數據驅動企業,創始人本身要對數據要有敬畏之心。要知道不管什麼時候,看數據是第一位的。

2、工程團隊和數據團隊的配合問題

數據本身是牽扯到整個業務的方方面面,紮根到一個產品裡邊的各個環節裡面去。但是工程團隊一般都是在忙著開發功能,在做這個產品迭代。數據相關的需求都是比較低優先順序的,都是順便搞一搞。這樣就導致第三個問題,那就是數據採集缺失或埋點混亂,數據根本就沒有采。數據根基不行,想要的數據都拿不到。

3、數據採集缺失或埋點混亂

4、缺乏數據工程師/分析師人才

數據工程師還好,數據分析師沒有系統的培養方案,大學沒有相關的專業,也沒有很好的培訓課程。這是一個比較大的問題。

八、傳統企業的數據分析痛點

傳統企業,問題更大。前面說的互聯網企業的問題,它一個不會少,另外一點它還有它更大的問題,最突出的兩點:

1、數據採集條件不具備

2、數據分析的能力欠缺

最後做一個總結。對於一家企業,想要成為數據驅動型公司,要做到以下三點:

1、培養數據驅動的意識。

2、重視數據採集。

3、藉助合適的數據分析工具。

如果你想成為數據分析師

不管是在知乎上,還是在一些線下沙龍,許多數據分析愛好者都想能夠系統的學習數據分析知識,而不是瑣碎的學習。

遺憾的是現在沒這樣的專業,系統性的培訓也是少之又少。我是在想有沒有可能通過幾輪迭代,創造出一個適合數據分析人員學習的培訓課程。

在今年 11 月 4 日 ~ 11 月 6 日,我們神策數據將要舉辦一次《數據驅動大會》,定位是數據分析師的培訓,有興趣的同學可報名參加:2016年末盛典。


推薦閱讀:

打造個人新維度 迎接未來新挑戰
從一個小問題洞察掙錢秘籍,卻被90%的數據分析師忽略
如何用數據驅動產品和運營(上)
學習數據分析對我的意義及實踐計劃
pandas 1 | 10分鐘入門pandas,SO EASY!!!

TAG:大数据分析 |