數據分析的出路在哪裡
題圖來源:nipic.com
數據分析的出路在哪裡?類似問題出現在很多場景下:
有的是面試的時候被問到:你覺得這個職位長期發展的前景如何
有的是在各種群里的討論:Data Scientist 的出路在哪裡?為什麼做 Analytics 的活 title 卻是 Data Scientist?
有的是同事之間的交流:你接下來做啥?
問法不同,但討論的內容其實是類似的:數據分析 (Analytics) 有什麼用?
我們先看一下數據分析的幾個階段:
第一階段:沒有數據,更沒有分析
不管是產品也好,還是策略也好,憑的是從上到下的決定,靠的是經驗和感覺。
最後效果如何,沒有一個數據上的衡量標準,或者只有簡單粗暴的幾個數據:有多少人用(購買),收入多少,成本多少,最後賺了多少。
第二階段:有數據,看起來好像有分析
這個階段,數據多起來了,比如除了有多少人用,還有更多多維度的數據,比如年齡、性別、地區等等,也有了更多層次的數據,比如各種留存、拉新等方面。
分析方面則是有各種報表,看得眼花繚亂,很全面。
問題在於,這種情形下我們知道發生了什麼,可能知道得還挺詳細,但是並不知道為什麼會發生這些,以及接下來可能發生什麼。
於是進入
第三階段:有數據,有分析,有原因
這個階段開始引入 hypothesis 的概念,我們不但要知道發生了什麼(reporting),還要知道為什麼會發生 (hypothesis driven).
知道了為什麼會發生,可以告訴我們以後做類似的事情,可能會發生什麼。
可能是通過 correlation analysis,找到一些互相有關係的線索。
可能是通過 A/B test,找到因果性。
諸如此類。
而在這個階段做各種分析,A/B test 的時候,需要有 hypothesis-driven 的概念,而不能僅僅是:來,我們看下數據是什麼樣子的。
比如 A/B test 能提供因果性,幫我們做決定是一方面 (launch product or not),更重要的是能幫助我們積累某一領域的知識,諸如提高 metrics A 可以提升留存;進一步, 我們可以知道提高 x% 的 A 可以提升 y% 的留存;再進一步,我們甚至還能搞清楚,對於不同的用戶、不同的階段,這個 x% -> y% 是不一樣的。
而這也是 analytics 的工作會掛著 Data Scientist 的 title.
Scientist 的定義並不是工作方法多麼高大上,而在於其思緒方式:通過 hypothesis-driven,不但要知道發生了什麼,還要知道為什麼發生。
(當然另一方面也是因為 Data Scientsit 這個名字比較好聽了)
第四階段:知道發生了什麼、知道為什麼發生、知道接下來應該做什麼
跟上一階段的區別在於,我們不但知道發生了什麼 (reporting),知道為什麼發生 (hypothesis-driven),還知道接下來應該做什麼 (product/strategy leadership).
這個階段有很多難點:本身搞清楚應該做什麼就很難,還需要把這些東西 sell 出去,就更是難上加難了,而這恰恰是數據分析的出路(之一)。
不管數據分析做出了什麼結果,如果沒有把結論應用到實際 product change 裡面去的話,都是垃圾。
知道發生了什麼,比如 reporting,風險低回報低,因為不太能改變產品走向。
有些類型的數據分析,知道為什麼發生,比如 A/B test,算是能改變產品走向,至少能決定 launch / no launch.
上面兩點對於大多數人來說又是必不可少的,除去工作本身會有需要以外,還有很重要的一點是通過這些事情來跟合作者打下互相信任的基礎,比如 product/engineering/design/UX research.
如果一上來就拋出數據分析的結論說咱們組接下來應該做 ABCD,要麼他/她已經有了 track record,大家都很信任;要麼其實產品組也不知道做什麼,反正試試看唄。
所以大多數情況下,還是需要通過一些基本的項目打點基礎,讓 cross function team 覺得:哎不錯,這個人挺靠譜的,數據分析做出來的東西還是要信的。
接下來再慢慢提供產品的方向:我們接下來一個月應該試試做 A,可能會有預期的效果。
於是試了一下做 A,發現預期的效果沒錯,信任進一步建立。
於是再接下來:我們接下來半年應該試試做 B, C, D,其中 B 可能性比較大,但是回報也不會太大;C 風險比較大,但是如果成功的話回報也多;D 則是一個新的方向,做成做不成不知道,咱們試試看。成的話一起喝湯吃肉,不成的話再試試別的。
因為有了前面打下的互相信任的基礎,即使最後 C 和 D 都沒有做成,也不會被覺得是數據分析本身不夠 solid,瞎提供方向,而是這些項目本來就是有風險的。
當然了,如果沒有互相信任的基礎的話,很有可能大家也不會做 C 和 D,只會做 B.
而 B 的方向,很有可能本來就是打算做的,最後結果是數據分析提供了 support,而不是 lead.對於大多數數據分析來說,階段二是基礎,階段三是應該做到的,階段四是好像能做到一些,但是還有很大提高餘地的。
而數據分析的出路和影響力,就來源於四。
這也是為什麼很多數據分析的職位看起來要求很低:第四階段做得如何,實在是太難量化了。
從某個角度來說,數據分析跟算命是類似的:先告訴你人生過去的幾十年發生了什麼,你一對比發現說得還真不錯 (reporting);然後說你當下是不是有什麼憂慮,在擔心什麼 (hypothesis driven);再說你要解決這些問題,需要做 ABCD ( product leadership).
算命先生想要產生 impact,就需要把 reporting 做得准,hypothesis 搞得清楚,這樣客戶才能相信,接下來才能忽悠。
當然,數據分析做的事情,跟算命的區別在於最後一點:如果算命先生說的不對,你也不能回頭去找他把攤兒掀了;而數據分析總是說得不對的話,攤兒可能真就沒了。
數據分析的出路在哪裡
推薦閱讀:
※Quick BI----讓每個人都是數據分析師
※用數據講故事
※【數據分析】中文筆記翻譯計劃順利結束
※數據篇(1):數據分析