數據分析師的成長之路?

想了解下數據分析師的成長過程,在每個階段需要掌握哪些能力,這些能力如何去學習,以及每個階段可以應聘什麼樣的職位?


同學A:22歲,男,大四準備實習,計算機專業,迷茫期

作為一個很普通的即將邁入職場的他來說,看到周邊的同學都找了技術開發的崗位,頓覺自己很迷茫,因為自己不是那麼喜歡鑽研寫代碼,而自己又沒太多的經驗。

那年他實習,選擇了一家國內一線梯隊的電商公司,HR問道想選擇什麼崗位,而他本人自己也比較困惑,說對數據感興趣。而恰好那年公司打算成立一個數據部門,就把同學A分配到了市場部的數據組......

.....【大型長篇網路小說:數據分析俠A的成長故事】......

————————————————————最新更新——————————————————

著作權歸作者所有。

商業轉載請聯繫作者獲得授權,非商業轉載請註明出處。

-----------------------------------------------------------------------------------------------------

作者:麵包君
鏈接:https://zhuanlan.zhihu.com/p/20206932
來源:知乎
著作權歸作者所有。商業轉載請聯繫作者獲得授權,非商業轉載請註明出處。

--2017.2.25更新

幸運的一年

一年了,小說都沒有繼續更新,沒想到寫故事比寫代碼更痛苦,需要靈感。
去年,我們說到「數據分析俠A的團隊變化,來了新同學」。

這一年是A這幾年最開心的一年,原因主要是圍繞兩個主題。

一是認識到自己心動的姑娘。

二是真正的完成了畢業3年實現了100萬。

團隊剛來的這位J同學,是大家眼裡傳說中的「程序媛」,寫的了代碼,爬的了圍牆,下的了廚房,打的了流氓。所以J在團隊里很受大家的歡迎,畢竟碼農好不容易盼來了一個寫代碼的女生,而且長相還很漂亮,所以都特別開心,平時的話題也都說J說的特別多,而J同學其實是個比較寡言的女生,剛畢業沒多久,所以還不知道怎麼在工作中和同事相處,遇到很多經常來搭話的男同事,也有點緊張,有些不知所措。

細心的A察覺到這些,也是正好一次偶然的機會,團隊中的另一個女同事M,和J都是女生,所以聊得來,所以兩人就相約一起去周邊郊遊玩玩,也同時喊上A一起參加,A也不好推辭就答應了。到了周五的時候,M突然有事說,周末去不了了,就讓A陪陪J。

也就是這樣的一次機會,讓A和J徹底認識了。

周末兩人一起去安徽黃山去,黃山不愧是一座名山,仙氣十足,到處迷茫著詩情畫意。也是這次來黃山,A也愛上了安徽,對安徽改變了以前的看法,沒想到徽文化有這麼濃烈的特色。古色古香的村子,到處插隊的皖牌車,形形色色的鄉民,讓安徽活靈活現。

兩天的時間,A和J相聊勝歡,彼此都認識了很多。而A心中,真正的第一次不想回去上班。就想兩人永遠停留在這一刻。

4月份迎來了阿里的KPI考核,這對於每個阿里的人來說都是心驚膽戰的,對於A也不另外,A自認業務能力和技術能力都沒問題,可是這是個人情味很濃的社會,誰也不知道主管是打著什麼的算盤。而A這時候的心裡也時刻惦記著和J在一起的美好時光,相對有壓力的KPI考核倒是相對壓力減輕了不少。到了月底,幸運的是,還好KPI沒有出現什麼意外,但主管也表示說希望A能夠再接再厲,但A自己心裡很清楚將來的職業生涯和目標是什麼。

5月份的時候,大家都在談論中國股市,鋪底蓋地的新聞都在講證券商的開戶數開創了歷史的新高,而A自己之前也沒有嘗試買過股票,只是自己了解了一些,但聽說都是很悲傷的賠本故事,所以A對股市一直都很保持敬畏之心,覺得能夠在股市上賺到錢的都是運氣和技術過人。而同事也給A推薦了買哪支股票,A也下載了相關的股票軟體,看了看,的確是漲了不少。剛開始先買了相對應的股票基金,投了30萬,每天的利息差不多也有1%,看著每天都有3000塊錢的入賬現金,這是A第一次覺得賺錢可以如此輕鬆,真是躺著賺錢。

而其他的現金因為買了1年期的P2P的關係,所以A也沒有多餘的現金繼續加大投入,這讓A懊悔不已,覺得以後再也不能買定期周期過長的理財產品,影響現金流,也錯過了很多市場的機會。

就在這時,有個同事和A說起了房子貸款的問題,而這個同事也認識那個銀行的客戶經理,A也微信加了那個銀行客戶經理,閑聊的過程中A發現銀行提供了周轉靈活的消費貸30w,這讓A看到了希望,毫不猶豫就辦了都投入到股市中去。

好景不長,在5月底股市迎來了一波黑色星期五,整個股市3000多股票有2000多都大跌超過5%。這讓A好不容易才賺到的10萬利息,一下子就回到只剩7萬。一天就虧了3萬,這讓A親身感受到股市的殘酷。所以A給自己定了個規矩,如果連續兩天跌5%,就清倉。不管是虧了還是小賺,都清倉。也正是因為這條紀律,6月份股市從牛市一下子變為熊市時,拯救了A。

6月份的時候,同學G(A的哥們)和A說了一個很賺錢的項目,是俄羅斯的一個項目,其實這個就是傳說中的「旁氏騙局」。操作的模式也很簡單,就是一個人給另一個人轉賬10萬,過30天後,又會有人再給你轉13萬,這就是傳統中的一個月利息30%。

當時A聽到這個消息,也沒放在心上,感覺這種東西就是不靠譜的事情。過了一個月到了7月份的時候,一次吃飯的機會,G又說起了此事,把他的賬單還曬給了A看。而A真的看到了G每個月給一個陌生人轉賬10w,過一個月後有人給他轉賬,而G也是剛買完房要還房貸,正是這10萬每個月的投入讓G可以輕鬆應對房貸和信用卡。

這次A真的心動了,就試著投了10w給G,說幫忙也投資一下,G毫不猶豫答應了。

這3個月,對於A來說是心驚肉跳的,加入10w虧了怎麼辦,自己這一年就白乾了。然後想想這也是股市中賺到了,如果虧了就認栽吧。

然而讓A沒有想到的是,不僅沒有虧本,還陸陸續續的有人轉賬過來了,這不禁讓A感慨「真是很有素質的投資人」!而G也把A拉進了投資的微信群,群里就像一個傳銷組織,大家暢所欲言,聊著賺錢很快的路子。有曬買了房的,也有曬買了賓士寶馬路虎的。

後面A也陸陸續續投了50萬給G,幫忙打理。就是這半年時間,30%一個月的收益,讓A第一次擁有了屬於自己的100萬。而A也是憑藉著自己的數據敏感和市場覺察,在這個俄羅斯龐氏騙局資金斷鏈之前,及時的撤出了這個騙局。看到有很多人賺錢的,說著冠冕堂皇的道理,而那些後面接盤的,有些甚至是刷信用卡套現的,背上了血本無歸的慘痛教訓,後悔自己再也不做這種事情了。

這一年,讓A學習到了很多,也從一個單純的技術男,搖身變成對互聯網、金融和人心深刻感悟的少年。

也正是這一年的成長,讓A在接下來的生涯中對各種商業模式、騙局都有了新的看法。

——未完待續 2017.2.27

——————————

。。。。。。。。。。

同學A的互聯網金融數據分析之路。。。。。。

同學A的數據分析創業之路。。。。。。

也可移步到http://zhuanlan.zhihu.com/dataman/20206932/


只是是互聯網行業的數據分析師,傳統行業不包括在內。歡迎補充。

個人覺得,數據分析,不是數據挖掘的話,業務理解能力是數據分析師的短板,需要從一開始就做培養。

首先,數據分析從業務角度分三類:網站數據分析(視頻、新聞資訊、。。。)、遊戲數據分析(移動、頁游、端游)、應用數據分析(主要是工具類的)。其實沒打算一一列舉了。

接著是按數據分析工作的流程來了:

1、數據收集和統計一定要會,這個是基礎,一般最好是數學相關專業出身的會比較好,這個過程要掌握一些分析和收集的工具及語言,(收集統計工具:谷歌分析、百度統計、cnzz、友盟、talkingdata、等,統計處理:Excel、spss、SAS、R、SQL等,看你做哪些了。)

2、接著是數據的了解:你要了解這些數據指標及演算法,不同業務角度的數據指標也有所不同。下面列舉些基礎常用的吧。

網站:退出率、蹦失率、瀏覽量、頁面訪問時長、平均頁面訪問數,訪問量、唯一身份訪問量。

遊戲:新增用戶數(註冊)、登入用戶數、周活躍數、最高在線、1~7日留存、14、30日留存、arpu、付費率、等

應用,其實目前沒有很標準的行業數據定義,大部分參考遊戲吧。

3、數據的表達,如何用圖表,文字,圖案及邏輯關係串聯,關鍵是別以為誰都懂你的表達,要讓那些不懂數據的人看懂才是好的表達。

4、這些整個過程中,還涉及到一點就是分析目的、分析方案或者分析思路,這些是在整個數據分析之前就需要有的,你才可以知道你要收集什麼數據,為了什麼而做,要怎麼做。這個是作為一個基礎的數據分析師必須具備的全局技能點了。


剛進入行業,你覺得自己是個拉數據給業務的,什麼雞毛蒜皮的需求都有;等你慢慢了解業務後,對行業有了更深更廣的理解和挖掘後,你覺得自己就是公司業務部門的內部戰略諮詢師;再積攢幾年後,當你可以徹底領悟專業與行業的需求關係,想像的空間就更大了,這個目前為也無法臆測。從前輩的經驗來看,他們或者成為了行業的數據專家、比業務更理解業務的執行官,或者創業等等。


我已經無語了。數據分析這個行業的確是最近火了。自從13年NYU率先開了「Data science」這個ms,許多學校紛紛效仿出了各種ms/phd program。之後之間彷彿一夜之間到處都是數據分析師,企業似乎也是遍地都願意要。在這個情景下,似乎「快速成為」是可能的。我是真心來打臉的。

數據分析人員的價值到底在哪裡體現呢?

我認為在於:

第一在於對行業知識和常識的深度理解對信息流通渠道的高度敏感。這需要廣泛閱讀和自我檢驗。因為Causal relation並不好用統計學知識得到,很容易犯錯;專業知識和常識才能保證不會犯傻瓜錯誤。

第二,幫助企業和項目搭建自動化的數據pipeline。一來需要分析師要有能力搞data source,另外這也需要他有以數據驅動的IT架構的設計能力。畢竟無論你使用什麼模型,其本質都是在做measure。你數據不夠,永遠不可能得到更貼近真實環境的measure。另外,好的pipeline才能讓未來的分析工作和企業方便地scale,不必總需要重複造輪子。你的介面設計的好壞,數據方便調用的程度都是極其考驗人能力的。

第三,選用合適的模型簡化真實世界的情況,追求定量結果。這需要不僅僅是統計學知識,其它工程知識甚至都需要放入常備的知識庫。舉幾個例子:描述非平穩高維時間序列(Multivariate Time Series)你就用VAR能做得好么?那我用Sticky HDP-HMM就比它好得多。可是這就是唯一的好描述么?未必。Acoustics里的Impulse response analysis/dynamical systems在某些情況下的經驗可以借用過來,那也許會比直接用以上那些方法更好。你要是多留心,熱工程、地震地質研究、EE、氣象、統計物理等等不同的領域都有一些模型能遷移到其它領域使用。

這三塊環環相扣,不是一朝一夕就能做好的。說白了一個好的數據分析師,他的名字叫quant。做好這個工作震需要相當的數學、常識和運氣。

而目前來看,數據分析的門檻至少在我看來相當低。如果只是做粗放的描述統計工作和基本的定性定量研究,一個只要修過intro to stat之流的大學生完全可以勝任。可是這並沒有什麼卵用。請記住一切和數據、信息相關行業的核心價值在於提供「消除信息不對稱的渠道」。如果你只追求快速入門——你基本只想用描述性統計和基本的定性定量研究,寫寫報告,我認為還是不要做數據分析好了。因為多數這樣的數據分析的工作其實算是被高估了。等各個行業發現其實自己養了一群寫報告但其實無法為公司帶來利潤的人,這都是挺悲哀的事。


為什麼要做數據分析師?

在通信、互聯網、金融等這些行業每天產生巨大的數據量(長期更是積累了大量豐富的數據,比如客戶交易數據等等),據說到2020年,全球每年產生的數據量達 到3500萬億GB;海量的歷史數據是否有價值,是否可以利用為領導決策提供參考依據?隨著軟體工具、資料庫技術、各種硬體設備的飛快發展,使得我們分析 海量數據成為可能。

而數據分析也越來越受到領導層的重視,藉助報表告訴用戶什麼已經發生了,藉助OLAP和可視化工具等分析工具 告訴用戶為什麼發生了,通過dashboard監控告訴用戶現在在發生什麼,通過預報告訴用戶什麼可能會發生。數據分析會從海量數據中提取、挖掘對業務發 展有價值的、潛在的知識,找出趨勢,為決策層的提供有力依據,為產品或服務發展方向起到積極作用,有力推動企業內部的科學化、信息化管理。

我們舉兩個通過數據分析獲得成功的例子

(1) Facebook廣告與微博、SNS等網路社區的用戶相聯繫,通過先進的數據挖掘與分析技術,為廣告商提供更為精準定位的服務,該精準廣告模式收到廣大廣 告商的熱捧,根據市場調研機構eMarketer的數據,Facebook年營收額超過20億美元,成為美國最大的在線顯示廣告提供商。

(2) Hitwise發布會上,亞太區負責人John舉例說明: 亞馬遜30%的銷售是來自其系統自動的產品推薦,通過客戶分類,測試統計,行為建模,投放優化四步,運營客戶的行為數據帶來競爭優勢。

此外,還有好多好多,數據分析,在營銷、金融、互聯網等方面應用是非常廣泛的:比如在營銷領域,有資料庫營銷,精準營銷,RFM分析,客戶分群,銷量預測等 等;在金融上預測股價及其波動,套利模型等等;在互聯網電子商務上面,百度的精準廣告,淘寶的數據魔方等等。類似成功的案例會越來越多,以至於數據分析師 也越來越受到重視。

然而,現實卻是另一種情況。我們來看一個來自微博上的信息:在美國目前面臨14萬~19萬具有數據分析和管理 能力的專業人員,以及150萬具有理解和決策能力(基於對海量數據的研究)的管理人員和分析人員的人才短缺。而在中國,受過專業訓練並有經驗的數據分析人 才,未來三年,分析能力人才供需缺口將逐漸放大,高級分析人才難尋。也就是說,數據分析的需求在不斷增長,然而合格的為企業做分析決策的數據分析師卻寥寥 無幾。好多人想做數據分析卻不知道如何入手,要麼不懂得如何清洗數據,直接把數據拿來就用;要麼亂套模型,分析的頭頭是道,其實完全不是那麼回事。按俗話 說就是:見過豬跑,沒吃過豬肉。

我的職業規劃

對於數據分析,有一句話說的非常好:spss/sql之類的軟體、決策樹、時間序列之類的方法,這些僅僅就都是個工具而已,最重要的是對業務的把握。沒有正確的業務理解,再牛的理論, 再牛的工具,都是白搭。做一名合格的數據分析師,除了對數據需要有良好的敏感性之外,對相關業務的背景的深入了解,對客戶或業務部門的需求的清晰認識。根 據實際的業務發展情況識別哪些數據可用,哪些不適用,而不是孤立地在「真空環境」下進行分析。

為此,我對自己的規劃如下:

第一步:掌握基本的數據分析知識(比如統計,概率,數據挖掘基礎理論,運籌學等),掌握基本的數據分析軟體(比如,VBA,Matlab,Spss,Sql 等等),掌握基本的商業經濟常識(比如宏微觀經濟學,營銷理論,投資基礎知識,戰略與風險管理等等)。這些基礎知識,在學校里盡量的學習,而且我來到了和 君商學院,這樣我可以在商業分析、經濟分析上面領悟到一些東西,增強我的數據分析能力。

第二步:參與各種實習。研一開始我當時雖然有課,不 過很幸運的找到一份一周只需去一兩天的兼職,內容是為三星做競爭對手分析,當然分析框架是leader給定了,我只是做整合資料和往ppt里填充的內容的 工作,不過通過兼職,我接觸到了諮詢行業,也向正式員工學習了很多商業分析、思考邏輯之類的東西。之後去西門子,做和VBA的事情,雖然做的事情與數據分 析無關,不過在公司經常用VBA做一些自動化處理工作,為自己的數據分析工具打好了基礎。再之後去了易車,在那裡兼職了一個多月,參與了大眾汽車銷量數據 短期預測的項目,一個小項目下來,數據分析的方法流程掌握了不少,也了解了企業是如何用一些時間序列模型去參與預測的,如何選取某個擬合曲線作為預測值。 現在,我來到新的地方實習,也非常幸運的參加了一個央企的碼頭堆場優化系統設計,其實也算數據分析的一種吧,通過碼頭的數據實施調度,通過碼頭的數據進行 決策,最後寫成一個可操作的自動化系統。而這個項目,最重要的就是業務流程的把握,我也參與項目最初的需求調研,和制定工作任務說明書SOW,體會頗多。

第三步:第一份工作,預計3-5年。我估計會選擇諮詢公司或者IT公司吧,主要是做數據分析這塊比較強的公司,比如Fico,埃森哲,高沃,瑞尼 爾,IBM,AC等等。通過第一份工作去把自己的知識打得紮實些,學會在實際中應用所學,學會數據分析的流程方法,讓自己成長起來。

第四步:去自己喜歡的一個行業,深入了解這個行業,並講數據分析應用到這個行業里。比如我可以去電子商務做數據分析師。我覺得我選擇電子商務,是因為未來必將 是互聯網的時代,電子商務必將取代傳統商務,最顯著的現象就是傳統零售商老大沃爾瑪正在受到亞馬遜的挑戰。此外,電子商務比傳統的零售商具有更好的數據收 集和管理能力,可以更好的跟蹤用戶、挖掘潛在用戶、挖掘潛在商品。

第五步:未知。我暫時沒有想法,不過我希望我是在一直的進步。

總結:數據分析師的能力和目標

能力:  

1、 一定要懂點戰略、才能結合商業;  

2、 一定要漂亮的presentation、才能buying;  

3、一定要有global view、才能打單;  

4、 一定要懂業務、才能結合市場;  

5、 一定要專幾種工具、才能幹活;  

6、 一定要學好、才能有效率;  

7、 一定要有強悍理論基礎、才能入門;  

8、 一定要努力、 才能賺錢;最重要的:  

9、 一定要務實、才有reputation;

目標:

  1.做過多少個項目? 

  2.業務背景有哪些,是否跨行業?  

3.做過多少種類型的模型?做了多少個模型? 

  4.基於模型做過多少次完整的marketing閉環?

以上四個問題,足以秒殺95%以上的忽悠和菜鳥!

我僅以此為努力之坐標,時刻提醒自己。

路在前方,漫漫前行。


大數據的職業發展方向主要有兩個方向,一是技術、數據專家方向,這個方向偏技術研究,終極目標是數據科學家,二是業務和技術管理方向,終極目標是高級管理人員、企業家,這個方向偏業務應用和技術管理。兩個方向孰優孰劣呢,個人覺得沒有誰比誰更好,關鍵要看自己的興趣愛好和擅長點在哪裡。有人喜歡搞演算法、鑽研技術、追求新技術並為之著迷,探討更多的未知世界,而另一方面,性格也偏內向,不太喜歡與人溝通,不喜歡被人被雜事打擾,那麼,數據專家、數據科學家肯定是他首選,當然啦,希望大家選這個方向的時候,全面評估下自己的能力和性格特點、學歷背景等。除此之外,更多的人應該是往應用、往業務和管理方向發展,做一個既懂業務應用,又懂技術管理新型人才,這也是未來企業大量需要的專家型管理人才,而絕非傳統的為管人而管理的人才。

先說說技術、數據專家方向。這一類人,在學校和工作中,對技術有著狂熱的追求。在工作的初期,也許是一名普通的程序員或者演算法工程師,但是,他們對技術刨根問底,他們精通人工智慧、機器學習演算法、圖像識別、語音語義識別、大規模高並發、分散式計算等等的一個或者多個方向。他們先是初級工程師,接著是高級、資深工程師,再是專家、架構師、高級專家、總架構師,最後發展到研究員、科學家、首席科學家等,是代表公司最先進技術研究方向的靈魂人物。這一類人員,是最稀缺的,職業發展快,薪資漲得也快。

再說說業務專家型管理人才方向。這一類人,性格偏外向(當然啦,是自己與自己比較,非你和他人比較)不甘寂寞,有著強烈的事業心和抱負,是公司技術專家,也是業務專家,更懂得如何管理團隊,他們樂於溝通、懂得借力、善於發揮技術優勢,把業務做大做強。他們是公司未來的總監、副總裁、甚至是總經理。在職業的初期也會像上面那一類人員,鑽研技術,讓自己變成技術專家,但是,他們也會在意更多關於產品、運營、業務方面的東西,幾年行業的積累後,也會是一個業務專家,轉到管理崗位後,工作重心已經不在於演算法的研發和優化了,而是重點關注業務增長、商業模式、把商業理解成生意本身,為股東創造利益、讓企業可持續增長。這一類人的職業發展通道是:數據研發工程師、分析師、演算法工程師、產品經理》高級研發工程師、高級分析師、高級演算法工程師、高級產品經理》專家級》BI總監、技術總監》副總裁、CTO》CEO。在這裡,有個最快的職業通道,那就是大數據分析師》大數據分析師專家》BI總監》副總裁》CEO,為啥這樣說呢,分析師精通數據更熟悉業務,最出色的分析師,一定是最有商業feels的人,高度的商業敏感度和犀利的戰略眼光,讓他不僅能夠精通公司業務的同時,熟悉整個市場和行業,成為老闆的最得力的助手。

歡迎大家拍磚指正,歡迎大家關注我的知乎專欄「大數據實踐與職業生涯」並留言,專欄會陸續的推出過往十多年的大數據工作經驗總結和我的一些研究實踐成果。如果你是大數據新人,或者想轉行進入大數據領域,或者職業生涯上存在一些疑惑,都歡迎關注我的知乎live分享「大數據人的職業生涯規劃」 和 「數據分析師-從零入門到精通」。


我覺得分析師會吹牛,越吹越成長,郭明池就是例子


推薦閱讀:

做用戶研究如何系統學習數據分析?
自學數據分析需要看哪些書(從初級到高級)的?
如何快速成為大數據開發實戰專家?
Python numpy,scipy,pandas這些庫的區別是什麼?
如何高效地使用RStudio?

TAG:數據分析 | 數據分析師 |