數據科學家、數據分析師、數據挖掘工程師、數據工程師,你分的清楚嗎?

數據科學家(Data scientist)的叫法來自國外,廣義上它是對從事數據分析和數據挖掘從業人員的一個泛稱,它只是一個頭銜,並不是一個職位。狹義上,數據科學家一般是指行業裡面的領軍人物和頂尖科學人才,如百度前首席數據科學家吳恩達。

在人才市場上我們通常可以看到的是後三個職位(數據分析師、數據挖掘工程師、數據工程師),接下里我們就區分一下這幾個職位的相同點和不同點。首先看下企業對這三個職位的要求和描述。

職位和能力

下面是阿里對這3個職位的要求和描述:

數據分析師

崗位描述:

1、獨立負責業務數據收集整理,搭建業務數據體系,結合業務對多種數據源進行深度診斷性組合分析、挖掘、深度分析;

2、通過專題分析,對業務問題進行深入分析,為業務的策略、產品優化提供數據支持;

3、獨立完成業務日常的產品運營工作,可以快速有效地取得一定的業務成果。

崗位要求:

1、統計、數學、信息技術、生物統計等專業本科及以上學歷(碩士優先),二年以上相關工作經歷;

2、熟悉資料庫基本原理,熟練運用SQL,熟練操作excel、PPT;熟悉數據挖掘的基本原理,熟練操作SAS、SPSS clementine等數據分析/挖掘工具的優先;

3、良好的數據敏感度,能從海量數據提煉核心結果,熟練獨立編寫商業數據分析報告,及時發現和分析其中隱含的變化和問題,給出建議;

4、具備良好的溝通能力和團隊精神,較強的學習能力,能承擔一定的工作壓力

數據挖掘工程師

崗位描述:

在這裡,你可以學習和掌握阿里巴巴集團業界最先進的大數據處理平台,涉及信息檢索、自然語言處理、機器學習、數據挖掘、分散式計算等一系列的專業領域;

在這裡,你將擁有最好的數據和實驗環境,立足於uc瀏覽器數億用戶和數千億瀏覽信息,與這些領域內的頂尖大牛工程師們一起參與目前最前沿的推薦、預測等大數據應用場景的演算法設計和工程實現。

崗位要求:

1、本科以上學歷,紮實的統計學、數據挖掘、機器學習理論基礎,能夠利用高等數學知識推演高維數學模型。

2、熟悉聚類、分類、回歸、圖模型等機器學習演算法,對常見的核心演算法理解透徹,有實際建模經驗;

3、具有紮實的計算機操作系統、數據結構等編程基礎,精通至少一門編程語言例如c++/python/R;

4、深入理解Map-Reduce模型,對Hadoop、Spark、Storm等大規模數據存儲與運算平台有實踐經驗;

5、對於推薦系統和廣告系統有實踐經驗者優先;

6、能夠積極創新, 樂於面對挑戰, 負責敬業;

7、優秀的團隊合作精神;誠實, 勤奮, 嚴謹。

數據開發工程師

崗位描述:

1. 參與阿里大數據開發平台建設,構建開放、安全、標準的阿里對外數據開發平台體系

2. 基於阿里海量數據的數據倉庫建設和數據分析,同時針對各業務場景探索大數據解決方案

3. 在公共雲計算環境構築數據交換、融合、分享的生態,讓數據驅動業務

崗位要求:

1. 計算機或相關專業本科及以上學歷

2. 具有豐富的數據開發經驗,對數據處理、數據建模、數據分析等有深刻認識和實戰經驗

3. 熟悉SQL,有一定的SQL性能優化經驗

4. 熟練掌握Java語言,MapReduce編程,腳本語言Shell/Python/Perl之一

5. 業務理解力強,對數據、新技術敏感,對雲計算、大數據技術充滿熱情

6. 積極樂觀、誠信、有責任心;具備強烈的進取心、求知慾及團隊合作精神

可以簡單概括一下這三個職位的特點:

數據分析師

業務線,負責通過數據分析手段發現和分析業務問題,為決策作支持。

數據挖掘工程師

偏技術線,負責通過建立模型、演算法、預測等提供一些通用的解決方案,當然也有針對某業務的。

數據工程師

技術線,負責搭建倉庫搭建、數據的存儲、處理、計算處理、報表開發等。

從能力上看,可以認為:

從關係上看,數據分析師和數據挖掘工程師一般是可以相互替代的,在很多公司里,對這兩個職位也是不加以區分的

下圖是國外對這幾個職位的能力棧描述。圖中藍色圈為普通工程師能力棧,粉色圈為數據開發工程師能力棧,綠色圈為數據科學家能力棧。需要說明的是,國外並沒有數據挖掘工程師這一說法,國內的數據挖掘工程師的能力棧和本圖中綠色圈相當,而數據分析師的能力棧則正好和不於粉絲圈交叉的純綠色區域相當。

定位和價值

正如我之前的《三三制:大數據企業如何打造一支打不爛、打不散的團隊?》一文所述,上述這三個職位在大數據團隊里分別是開發者、構建者和分析者的角色。他們是大數據團隊里最核心的成員,這三個角色組合起來,可以覆蓋大部分企業大數據項目需求。

在PPV課社區里經常有人會比較這幾個職位,問題也是五花八門,隨便拎幾個出來大家感受一下:

針對上述問題在此我談一下看法。首先,不同職位在不同行業、不同公司、不同階段的貢獻是不一樣的。如同部隊打仗一樣,企業需要的也是團隊配合,多部門協同作戰,每個職位都有其獨特價值,沒有什麼可比性。這就如同你比較一個公司的銷售和研發人員誰價值更大一樣,不實際也沒有任何意義。

其次,大多數情況下,薪酬(指平均薪酬)只代表一個人在職場的價格,不代表他在公司的價值。找工作除了看薪酬也要看是否合適自己,職場中拼的都是相對優勢,你要想獲取高收入,應該揚長避短,尋找可以發揮自己優點的行業和職位,而不是尋找什麼最有價值的工作。

目前市場上數據挖掘工程師的平均工資的確是要高於數據分析師的,原因是數據挖掘工程師寫代碼比較多,寫代碼越多,工資越高,這個在任何一個國家、任何一個行當都是如此,不代表數據挖掘工程師的價值更大(參見《2016年數據科學薪酬大盤點》一文)。

下圖是國外這幾個職位的薪酬對比:

數據來源:Datacamp

可以看出在國外薪資待遇排序是: 頂尖數據科學家 > 數據架構師 >數據工程師 >數據分析師。在國內,數據挖掘工程師的薪酬是略高於數據工程師的,其他排序和上圖相同。

在此,PPV課也給出幾個職位之間的晉陞通道供大家參考:

手邊書推薦

最後針對不同職位推薦幾本手邊書給大家,如果你對上述職位感興趣,歡迎加入PPV課數據科學社區,和我們一起向著數據科學的夢想不斷探索和前行!

數據挖掘工程師:

機器學習工程師:

數據分析師:

數據開發工程師:

END.

PPV課原創,轉載需要申請授權。

推薦閱讀:

如何整合複雜技術打造數據分析平台?
我數學不好、不會編程,能成為數據科學家嗎?
人不如新?Uber空窗期終結,黑馬掌門人Expedia CEO被選中
中國民生銀行大數據團隊的Flume實踐

TAG:数据科学家 | 大数据 | 数据分析师 |