數據科學家、數據分析師、數據挖掘工程師、數據工程師,你分的清楚嗎?
數據科學家(Data scientist)的叫法來自國外,廣義上它是對從事數據分析和數據挖掘從業人員的一個泛稱,它只是一個頭銜,並不是一個職位。狹義上,數據科學家一般是指行業裡面的領軍人物和頂尖科學人才,如百度前首席數據科學家吳恩達。
在人才市場上我們通常可以看到的是後三個職位(數據分析師、數據挖掘工程師、數據工程師),接下里我們就區分一下這幾個職位的相同點和不同點。首先看下企業對這三個職位的要求和描述。
職位和能力
下面是阿里對這3個職位的要求和描述:數據分析師
崗位描述:
1、獨立負責業務數據收集整理,搭建業務數據體系,結合業務對多種數據源進行深度診斷性組合分析、挖掘、深度分析;
2、通過專題分析,對業務問題進行深入分析,為業務的策略、產品優化提供數據支持;3、獨立完成業務日常的產品運營工作,可以快速有效地取得一定的業務成果。崗位要求:1、統計、數學、信息技術、生物統計等專業本科及以上學歷(碩士優先),二年以上相關工作經歷;2、熟悉資料庫基本原理,熟練運用SQL,熟練操作excel、PPT;熟悉數據挖掘的基本原理,熟練操作SAS、SPSS clementine等數據分析/挖掘工具的優先;3、良好的數據敏感度,能從海量數據提煉核心結果,熟練獨立編寫商業數據分析報告,及時發現和分析其中隱含的變化和問題,給出建議;4、具備良好的溝通能力和團隊精神,較強的學習能力,能承擔一定的工作壓力數據挖掘工程師崗位描述:
在這裡,你可以學習和掌握阿里巴巴集團業界最先進的大數據處理平台,涉及信息檢索、自然語言處理、機器學習、數據挖掘、分散式計算等一系列的專業領域;在這裡,你將擁有最好的數據和實驗環境,立足於uc瀏覽器數億用戶和數千億瀏覽信息,與這些領域內的頂尖大牛工程師們一起參與目前最前沿的推薦、預測等大數據應用場景的演算法設計和工程實現。
崗位要求:1、本科以上學歷,紮實的統計學、數據挖掘、機器學習理論基礎,能夠利用高等數學知識推演高維數學模型。2、熟悉聚類、分類、回歸、圖模型等機器學習演算法,對常見的核心演算法理解透徹,有實際建模經驗;3、具有紮實的計算機操作系統、數據結構等編程基礎,精通至少一門編程語言例如c++/python/R;4、深入理解Map-Reduce模型,對Hadoop、Spark、Storm等大規模數據存儲與運算平台有實踐經驗;5、對於推薦系統和廣告系統有實踐經驗者優先;6、能夠積極創新, 樂於面對挑戰, 負責敬業;7、優秀的團隊合作精神;誠實, 勤奮, 嚴謹。數據開發工程師
崗位描述:
1. 參與阿里大數據開發平台建設,構建開放、安全、標準的阿里對外數據開發平台體系
2. 基於阿里海量數據的數據倉庫建設和數據分析,同時針對各業務場景探索大數據解決方案3. 在公共雲計算環境構築數據交換、融合、分享的生態,讓數據驅動業務崗位要求:
1. 計算機或相關專業本科及以上學歷2. 具有豐富的數據開發經驗,對數據處理、數據建模、數據分析等有深刻認識和實戰經驗3. 熟悉SQL,有一定的SQL性能優化經驗4. 熟練掌握Java語言,MapReduce編程,腳本語言Shell/Python/Perl之一5. 業務理解力強,對數據、新技術敏感,對雲計算、大數據技術充滿熱情6. 積極樂觀、誠信、有責任心;具備強烈的進取心、求知慾及團隊合作精神
可以簡單概括一下這三個職位的特點:
數據分析師
業務線,負責通過數據分析手段發現和分析業務問題,為決策作支持。數據挖掘工程師偏技術線,負責通過建立模型、演算法、預測等提供一些通用的解決方案,當然也有針對某業務的。
數據工程師技術線,負責搭建倉庫搭建、數據的存儲、處理、計算處理、報表開發等。
從能力上看,可以認為:
從關係上看,數據分析師和數據挖掘工程師一般是可以相互替代的,在很多公司里,對這兩個職位也是不加以區分的。
下圖是國外對這幾個職位的能力棧描述。圖中藍色圈為普通工程師能力棧,粉色圈為數據開發工程師能力棧,綠色圈為數據科學家能力棧。需要說明的是,國外並沒有數據挖掘工程師這一說法,國內的數據挖掘工程師的能力棧和本圖中綠色圈相當,而數據分析師的能力棧則正好和不於粉絲圈交叉的純綠色區域相當。
定位和價值
正如我之前的《三三制:大數據企業如何打造一支打不爛、打不散的團隊?》一文所述,上述這三個職位在大數據團隊里分別是開發者、構建者和分析者的角色。他們是大數據團隊里最核心的成員,這三個角色組合起來,可以覆蓋大部分企業大數據項目需求。
在PPV課社區里經常有人會比較這幾個職位,問題也是五花八門,隨便拎幾個出來大家感受一下:
針對上述問題在此我談一下看法。首先,不同職位在不同行業、不同公司、不同階段的貢獻是不一樣的。如同部隊打仗一樣,企業需要的也是團隊配合,多部門協同作戰,每個職位都有其獨特價值,沒有什麼可比性。這就如同你比較一個公司的銷售和研發人員誰價值更大一樣,不實際也沒有任何意義。
其次,大多數情況下,薪酬(指平均薪酬)只代表一個人在職場的價格,不代表他在公司的價值。找工作除了看薪酬也要看是否合適自己,職場中拼的都是相對優勢,你要想獲取高收入,應該揚長避短,尋找可以發揮自己優點的行業和職位,而不是尋找什麼最有價值的工作。
目前市場上數據挖掘工程師的平均工資的確是要高於數據分析師的,原因是數據挖掘工程師寫代碼比較多,寫代碼越多,工資越高,這個在任何一個國家、任何一個行當都是如此,不代表數據挖掘工程師的價值更大(參見《2016年數據科學薪酬大盤點》一文)。
下圖是國外這幾個職位的薪酬對比:
數據來源:Datacamp
可以看出在國外薪資待遇排序是: 頂尖數據科學家 > 數據架構師 >數據工程師 >數據分析師。在國內,數據挖掘工程師的薪酬是略高於數據工程師的,其他排序和上圖相同。
在此,PPV課也給出幾個職位之間的晉陞通道供大家參考:
手邊書推薦
最後針對不同職位推薦幾本手邊書給大家,如果你對上述職位感興趣,歡迎加入PPV課數據科學社區,和我們一起向著數據科學的夢想不斷探索和前行!
數據挖掘工程師:
機器學習工程師:
數據分析師:
數據開發工程師:
END.
PPV課原創,轉載需要申請授權。
推薦閱讀:
※如何整合複雜技術打造數據分析平台?
※我數學不好、不會編程,能成為數據科學家嗎?
※人不如新?Uber空窗期終結,黑馬掌門人Expedia CEO被選中
※中國民生銀行大數據團隊的Flume實踐