從事數據工作的你,有多少數據競爭力?

文 | 傅一平

原文自:微信號「與數據同行」

有處在十字路口的數據職場人寫信給我,談到了職業發展的困惑,談到了能否跳槽,這是個沉重的話題,今天就來聊一聊,權當回信吧,僅作參考。

從技術通道講,數據崗位大致分為5類,不同的行業分法和叫法可能不同,大家意會就行,當然管理人員不在討論範圍之內。

1、數據分析師:也可叫作經營分析師,比如撰寫經營分析報告,這類工作大多在業務部門,其主要的工具是EXCEL及PPT,基礎數據大多需要技術部門提供,可能自己也掌握一些可視化挖掘工具,比如SAS或SPSS,當前跟數據挖掘師的邊界開始模糊,互相滲透吧,其核心使命是為公司決策提供服務。

2、數據挖掘師:主要基於數據倉庫或大數據平台,通過挖掘演算法進行模型的創建和學習,其與經營分析師有很多相似之處,比如都需要理解業務、數據和場景,最大的區別就是具備較高的開發技能,比如掌握了Python、Scala等挖掘語言,能夠操作專門的挖掘平台等等,現在很多的崗位如數據科學家啥的,都同出一脈,其核心使命是挖掘數據價值為應用服務。

3、數據開發師:主要根據業務的要求提供取數或報表開發支撐,其在各個行業都是非常龐大的群體,需要熟練使用FineReport、水晶報表一類的報表開發工具和商業BI工具。與數據挖掘師的區別就是一般用不到挖掘技能,比如用簡單的SQL就能搞定,一般數據挖掘師都經歷過數據開發師這個階段,其核心使命是完成數據需求。

動圖:

down.finereport.com/EDM

down.finereport.com/EDM

down.finereport.com/EDM

4、數據架構師:這類人員是數據倉庫或大數據平台的數據建設和運營者,負責數據的採集、建模及治理,注意這裡的建模是數據倉庫建模,不是指數據挖掘,其核心使命是建設一個可用的數據系統並確保數據可用。

5、平台架構師:負責數據倉庫或大數據平台各類產品的規劃和建設,很多時候,其包含了數據架構師的職能,其核心使命是滿足數據計算、存儲和查詢要求。

很多公司沒有分這麼多崗位,要麼是一人承擔多種工作,比如數據架構師和數據開發師混編,數據挖掘師和數據分析師混編,要麼沒有相關崗位,比如沒有數據挖掘師,雖然很多崗位是想通的,但其實每類崗位專業技能要求還是有所不同,如果你想做精做深,就需要明白其中的區別,明確自己真正的專業方向,不同企業同樣一個數據分析師的稱呼,做的可是天壤之別。

比如大家看到大數據很熱,以為自己在企業也搞數據,就認為很有競爭力,但仔細剖析一下,就會發現諸如BAT招聘的數據分析師根本不是你以為的數據分析師,大多企業搞數據的其實都不能勝任,因為混淆了概念。

如果你搞清了自己歸屬哪一種類別,我們就可以來談談具體的要求和評估下自己所處的階段。

吳軍把工程師分為五個等級,第五級是能獨立完成所分配的工作,第四級是能指導和帶領其他人一同完成更有影響力的工作,第三級是能夠獨立帶領人做出一個為公司掙得利潤的產品了,第二級是能夠做出先前沒有的東西的人,第一級是開創一個產業的人。

當然我們不需要像吳軍定義的那麼的高大上,筆者也只是針對5年以內的數據新人所處階段給個大致評估,數據科學家或資深人士啥的超出了範圍,而且數據工作越往後越強調創造性,因此沒法評估。

1、數據分析師的基本要求是懂企業的業務和數據,具備寫報告的能力,所處的階段,跟自己所處的企業強相關,你提交的經營分析報告能夠呈送到公司哪一層,就代表了你的水平,比如你主要為科室寫,就代表了達到科室的水平,如果你的報告能在公司的市場經營分析會發表,就代表了公司的市場水平,如果你的報告給老大,就代表了公司的水平,經營分析報告考驗的一方面當然是你的數據分析水平和業務能力,但更考驗的是你的溝通力、理解力和表達力。

數據為根,領導為本,數據分析師從事的工作也算是一門藝術。

2、數據挖掘師所處階段很難劃分,純粹從技能的角度看,第一階段是能理解業務和數據,能熟練的處理數據,以經驗導向去打造一個模型,這算是入門了,第二階段是對統計學有一定理解,掌握專門的挖掘引擎,能採用更為科學的方式去打造一個模型,第三階段是自己搞演算法去創造一個模型,這在很多應用型企業不太需要,基本上是數據科學家要乾的活了。

上面僅僅是從技能的角度做了劃分,數據挖掘最終還是要效果導向,無論你掌握了什麼技能,最主要的評估依據是創造了多少效益,即使你經驗導向,模型沒有採用什麼演算法,但只要效益高,就可以稱是個好的挖掘師,因為你擁的數據和業務經驗足以彌補挖掘技能的短板。

傳統數據挖掘業務理解和數據處理佔到了70%以上精力,因此技能要求並不是那麼苛求,但隨著大數據的來臨,海量數據處理、機器學習的技能要求會大幅加大,比如計算優化啥的,這已經不是業務經驗所能彌補的,要靠一定的技術,很多互聯網公司對於數據挖掘師都提出了相關的技術要求,由此可見一般。

3、數據開發師本質屬於開發人員,就是俗稱的碼農,只是他操作的平台大多是數據倉庫類OLAP平台,使用的語言大多是SQL,展現的方式大多是報表、指標或清單,業務和數據理解力基本代表了其開發水平,因此,評估的方式既有傳統的開發人員的及時率啥的,也包括數據準確性等指標,公司的運營報表,KPI指標都依賴於代碼質量,影響也不可謂不大。

數據開發師的技術通道較窄,除了上升為管理者,常見的是轉型成為數據架構師或數據挖掘師。

4、數據架構師相對於數據開發師內涵更廣,視野更寬,其致力於企業數據的採集、整合和治理,如果說數據開發師側重於滿足一個個數據需求,數據架構師則側重打好數據基礎,為前者提供更好的服務保障,我們通常說的數據倉庫建模、數據質量管理、元數據管理等等,都是其工作範圍,阿里不是在提打造小前台,大中台嗎?那麼數據的大中台誰來打造,就是數據架構師,可以這麼說,數據架構師是公司數據資產的總體設計師。

注意數據架構師和大數據架構師是兩個概念,大數據架構師前面的大數據是大數據領域的概念,一般是指大數據平台的架構師,數據架構師的數據才指真正的對於數據的規劃。

數據架構師的評估比較難,因為領域覆蓋很廣,很多企業實際將其職能分散到了多個人手中,比如數據倉庫由項目經理建設,數據治理工作則讓運維人員負責,這導致了建設和運維的脫離,兩張皮現象使得數據治理工作很難真正落地,實際上數據管理領域是最需要DevOps的。

基於實踐的認知,筆者覺得初級的數據架構師一般只具備單點能力,比如能規劃企業的數據藍圖,能完成企業相關數據管理規範的制定,或是能完成一個數據倉庫、數據質量或元數據項目,優秀的數據架構師則能貫通管理、開發和運維線,讓數據規範能在實踐中真正落地。

沒有做過數據開發,就不要輕易讓人做數據架構,很容易眼高手低,那種沒做過數據倉庫的,一上來就談數據管理的,大多也是無法落地的。

5、平台架構師就不用多說了,完全技術導向,如果懂業務和數據更好,不懂也沒關係,一般的技術控走的都是這條路線,之所以將其納入數據人的範疇,是因為大數據時代系統和數據耦合性越來越高,諸如深度學習、人工智慧什麼的,演算法能否高效,已經不僅僅是個數據問題,也是個平台問題。

但即使你有了很強的能力,也並不代表你對外就有競爭力,比如你在一個企業內可能很厲害,對外卻是一文不值,因為你的能力在自己的企業可能是稀缺的,獨特的,但對外則要遵循市場的供求關係。

有了這些鋪墊,我們就來談談數據人跳槽的可行性問題,不同的數據崗位行業需求不一樣,決定了你的實際競爭力。

如果你的數據技能越通用,意味著社會需求就多,如果再加上你不俗的能力,你對外就有相當的競爭力。

相比較而言,當前外部最稀缺的是數據挖掘師和平台架構師,大家在招聘網站上看到的,大多都是這類崗位,大數據時代到來,讓具備這類技能的數據人員有很大的跳槽優勢,這是一條路很寬的康庄大道,如果已經走在這條道上了,就持續的提升這方面的專業能力吧。

每個行業這類崗位的優秀人員,往往是在企業內部的平台上千錘百鍊出來的,實踐經驗很豐富,決定了較其他沒有環境的讀書派,自學派有獨天獨厚的優勢,比如數據挖掘師,假如你所在的企業有海量的數據,就要用好這個優勢,無論於甲方乙方。

數據分析師(經營分析師)實際是最難跳槽的,因為你的專業知識跟你所在的企業相關性很大,你理解的業務和數據可能僅在你的企業有用,如果換了一個企業,知識體系可能需要推倒重來,當然很多數據分析師養成了很好的邏輯思維能力,也有很好的方法論,但這個屬於管理層面的技能了,外面評估你也不再會是專業技能,而是你所在企業的職位高低了,因此,你懂的。

數據開發師包含了我們廣大的表哥群體,但很遺憾,從專業技能的角度看,在外面也沒有什麼競爭力,你熟悉的業務和數據圈子太小了,報表和取數實際也並不需要太多的專業技能,如果不想做管理,建議逐步往數據挖掘師、平台架構師進行轉型,數據開發師在日常工作中會接觸到很多的平台技術,要抓住參與的機會。

最後,談談很糾結的數據架構師,也是寫信給我的同仁當前所做的工作,從來信中感覺她更側重於數據治理方面。

從數據建模的角度講,業務為王,畢竟數據倉庫都是分主題的,不熟悉業務和數據就不要來做數據倉庫,決定了在數據倉庫方面的能力只能在所屬的行業有競爭力,比如筆者就沒看到過金融行業的建模團隊可以馬上轉到通信行業建模的。

從數據治理的角度講,雖然其有一套方法論,但筆者沒有看到過有專門的外部數據治理團隊能從天而降來做好我的企業的數據治理的,銷售數據治理產品還可以,但具體的數據治理工作還是依賴自己企業的人員,其牽扯的企業環節太多了。

因此,如果做數據架構師,還是很能鍛煉能力的,但數據架構師屬於練內功的事情,離業務遠了一點,價值較難評估,導致在一些企業並不很受重視,同時數據架構師蠻吃行業,一般企業不會冒險去對外招聘一個數據架構師,畢竟首先得理解自己企業的數據。

但未來數據架構師行情看好,因為大數據成為企業的資產,數據資產管理工作舉足輕重,筆者從BI時代走來,深刻感覺到當前企業內的數據架構師變得越發重要,成為稀缺的人才。

以上五類還有一個轉型或升級方向是去做數據產品的相關崗位,比如售前啥的,如果你溝通表達不錯,善於與客戶相處,加上你已有的數據背景,當然這個沒有客觀評定的標準了,身邊這類例子還是蠻多的。

總之,1-5年的數據人,需要客觀的認識這五類數據工作的性質,明確自己的專業發展方向,雖然我們強調綜合性人才,但對於數據類工作一定要精通一門,知道自己的擅長和局限之處,不要好像什麼都懂一點,但其實哪樣都不精通,這是大忌,其實任何一門只要沉下心去做,達到出類拔萃的境界,就不會受上面所說的一些限制了。

如果真得想換個環境,其實可以看看招聘網站相關的要求,大致也可以了解自己的競爭力如何,應該如何改進,希望能給予一些啟示。


推薦閱讀:

PowerBI公式 - VAR
【效率提升】Python中的並行運算
Kaggle入門系列(三)Titanic初試身手
營銷轉數據,兩年半到P7,我都做了哪些事兒?

TAG:数据分析 | 大数据分析 | 数据分析师 |