數據科學家 (Data Scientist) 的職業發展路徑是什麼?

如果一直做這一行,不轉行的話,希望各位詳細談談數據科學家(Data Scientist )在美國和在中國的職業發展路線分別是怎樣的。


謝邀。

數據科學算是新行業,有很多東西說不準,而且你的job title可能是其他東西,如data analyst或software developer之類的,行業變化很大,而且要知道business knowledge。

其他的我引用以前的答案好了:職業規劃:Data Scientist(數據科學家) 和 Software Developer,如何選擇? - 何史提的回答

軟體工程師是一個存在多年的職業,工作也有規範,如編寫代碼,要用OOP,要寫Unit Test,當然要除蟲了,懂得version control,要deploy??分工也細。

可是數據科學家是相對較新的行業,但具體來說,要處理大量數據,當中包括很多如格式、錯誤資料、語言等要處理,這往往花掉了一半的精力;然後要從數據中找出訊息或知識,當中涉及不少數學、統計模型,或者機器學習的方法,可見數學能力是一個重要要求。另外也要有商業觸覺,要多看新聞。

由於數據科學家需要編程,所以他做的東西也有和軟體工程師重迭。我的職銜是軟體工程師,但做起來像研究員,其實是數據科學家的工作。

當中的Data Developer相當於Software Developer,和Data Researcher(即Data Scientist)有點不同。但注意的是,時代還在改變,這行業還沒穩定,這種圖形會繼續改變。


謝邀。直接投簡歷就行,現在很多企業招聘數據科學家要求1~3年經驗,但實際上你如果是應屆生也可以投的。數據科學是一門新學科,Glassdoor新發布的全美國50個最佳工作名單,數據科學家又是當之無愧的NO.1

其中排名Top10的工作中,有一半與Analytics、Big Data、Data Science相關:

  1. Data Scientist $110,0002
  2. DevOps Engineer $110,0003
  3. Data Engineer $106,0005
  4. Analytics Manager $112,0007
  5. Database Administrator 8$93,000

其實從這份名單你就可以看出,成為一名數據科學家之前,你可以是軟體工程師、可以是數據工程師、數據分析師甚至資料庫管理員,所以不要太拘泥於某一條路徑,現在開始干就好。

基本技能需求:

  • 熟悉數據科學相關編程語言,如R,SAS,Python,SQL,Hive,Spark
  • 數學和統計學基礎要好,有一定分散式計算和統計建模方面的經驗
  • 熟悉資料庫架構,數據過程,數據建模,數據挖掘和數據分析技術
  • 熟悉數據可視化技術,會寫數據分析報告
  • 能夠為初級團隊成員(數據工程師,分析師和統計人員)提供指導

2016 post where Data Scientist was also no. 1 job in USA


感覺Data Scientist (DS)的職業發展方向和兩個因素關係最大,一個是出身(或者說本科研究生PHD領域),一個是職業生涯過程中遇到的機遇。

首先說出身,對於絕大多數人,如果畢業後選擇職業方向,有三類人會成為或者說可以成為DS:

  1. 領域和DS自然相關的,比如CS,Stats,Machine Learning,偏CS、Computtional的Informatics等等;
  2. 領域和DS非自然相關的,但是學業背景非常專,而且這些領域往往依靠數據和編程的情況比較多,比如Computational Bio,Neuro Science,Mechanical Engineer;
  3. 領域可以transferable到DS上,尤其是從business/social impact的層面,比如Political Science,Global Health等等。

2和3最大的區別是編程和數據往往貫穿於2的日常工作學習,而3是往往已經知道事情的發展方向,有傾向地去找數據支持自己的觀點。1和其他兩點最大的不同是,專業細分度差,只學習方法,具體到事實場景再具體學習context。

之所以我先談出身而不說發展方向是因為出身基本決定了方向,而且這個決定是主動的,也是被動的(市場和行業需要)。

對於1,絕大多數都會去tech或者fintech(有些fintech可能會更加傾向於某些專業,像物理和數學),原因是:

  1. 他們沒有被special trained,這也是tech和fintech喜歡的一點;
  2. 去其他領域只能當support部門,接觸前沿的機會相對少,職業發展很容易面臨瓶頸。

對於2,絕大多數反而不會去tech或者fin tech,而最終會去他們自己領域的公司:

  1. 因為被special trained,如果只是去tech當一個普通的DS,自己這麼多年學的東西就浪費了;
  2. 從技術環節上講,和學ML、Stats和CS的競爭tech同等級的職位還是比較劣勢的;
  3. 很多巨頭公司現在都有很specialize的下放研究機構,比如Google(或者叫Alphabet更貼切)的Verily,也有不少更適合他們的機會;
  4. 最重要的是,這些高度專業的公司,基本不會招純技術背景的去做核心的職位 (比如藥廠裡面的研發部門)。

對於3,還有1和2中對business層面更感興趣的人,絕大多數會去tech,vendor/service company,big4或者consulting,總之選擇的職位更加偏向analytics或者BI:

  1. tech領域的包容性比較強,有些DS職位其實對技術並不是有非常高的要求;
  2. 現在很多consulting和big4為了順應big data的趨勢,有很多DS的職位;
  3. 這些職位往往需要理解力和溝通力強的人,技術並不是必須要求,反而懂點技術並且溝通能力強的人才是最需要的(當然也有一些因為client的原因,必須要求PHD的職位);
  4. 並不是說做偏business而不是tech的人就low掉了。實際上過10年後,走管理路線的人,很多都是從這個track出來的(管2個人的小manager/director並不能完全算是管理路線,管理路線是指VP and above,比如EVP和CEO)。

職業發展路徑, 對於1和2,很多人可能就是一直走tech track(我身邊絕大多數都是這樣的)。這樣的話,從一開始負責一個project,期間慢慢開始熟悉更多的DS tools,然後可以了解和把控各個project的處理方式,從而可以組成一個小團隊,自己負責項目的同時安排劃分項目給自己的團隊。對於3,我自己並不了解。

我剛剛入職9個月,所以對「發展路徑」這個問題了解還是相對片面的。但是從我個人的角度來說,我最開始入職時候做的東西還是以R和Python為主,慢慢開始寫R package。同時,很快接觸到hadoop和spark,開始重視Visualization,學習AWS。從被動給一個project去做,到開始接觸其他的團隊申請新的project,學會調配資源,學習evaluate各種DS Tool。目前為止,在我這個職業階段,我覺得最重要的是:

  1. 熟練各種DS工具,因為這些工具是為了自己的工作服務的;
  2. 熟悉自己所在部門和公司整體的業務聯繫和業務流程;
  3. 理解自己做的東西究竟有什麼樣的business impact。

至於未來的職業發展途徑,就靠個人選擇和機遇了。總體還是基於你自己的行業和職業規劃。比如,已經有了幾年大公司經驗的DS加盟了startup,自然就要擔當lead的職位。自己日常工作中的團隊協調和真正的技術部分的所佔百分比要自己調整。也有很多人求穩,在大的企業中做幾十年。如果有機會,爭取下management position,沒有機會倒是也樂於做最基層的技術工作。

總之,職業途徑是基於踏實做事的。踏實做事努力認真總會有好的機遇把自己拽到合適自己發展的路徑上來。但是,不管走哪條路線,自己選擇的項目的business impact是最重要的,也是衡量自己工作結果的唯一途徑。這點對於DS這種新型職位尤其重要。在日常工作中,每天反思下,自己的工作的意義是什麼,能給自己的團隊帶來什麼,能給自己的公司帶來什麼。



Data scientist 數據科學家我覺得需要有幾方面突出的能力吧:

1. 需要有很強的所屬行業的行業背景,分析都是要具體落地的,行業經驗需要很強,才能真正讓數據分析數據科學落到實處;

2. 需要有較好的數據處理,數據分析的能力。有了行業背景,知道應該如何對自己的行業做分析,也知道該從哪些方面,需要哪些數據去做分析,那兒接下來就是分析本身了,這是一個數學理論方面的活;

3. 其他,這個比較零散,最常見的包括通過前端的BI,數據可視化等工具進行有效的數據展現,讓同樣的一份數據,經過不同的展現方式,圖表等手段,透露出更多的直觀信息,這不能不說也是一種極其重要的能力啊。

謝謝!


我的理解是,題主的問題太廣,我是做體育營銷的,工作中電商運營、新媒體運營為基礎的所有工作都離不開數據。而且今年紅利是「智能化」,都是以大數據為基礎的。體育行業的不便對外放,貼一篇MBA期間用百度關鍵詞規劃師做的受眾分析,拋磚引玉~


這年頭偽數據科學家太多了,所以就給大家來科普一下。

  • 什麼Business Analyst那種根本不算是Data Scientist。Data Scientist最基礎需要用到linear algebra也就是說起碼要求碩士學歷。除非你本科是數學或者統計專業的,一般大學生本科也就學到微積分。
  • 然後高階一些的分析需要stochastic processes這種課程的基礎,也就是說700-level的課;因此這就是為什麼我之前說需要碩士學歷了。
  • 能用excel分析的最多稱得上analyst,離真正的data scientist還是有很大一段距離的。
  • 很多時候data scientist被誤認為做偽統計學的人,做一些什麼「高管都用Android」這種無下限無節操的統計。然而不是的!數據科學家要挖掘的信息比這個複雜多了。逼格高一點的,如我一個同事(不在同一個公司),研究分析ISIS最可能使用的網路暗號...

下面說一下最基本的專業條件:

  • 要會編程,特別是back end語言。有時候要跟碼農組一起改程序!有些數據科學家負責設計網站capture數據的一些feature。基本上需要專業碼農級別2-3年的編程經驗(實戰的)。
  • 另外就是碩士級別應用數學基礎和統計學基礎。

特殊條件:

  • 需要偏文科生的critical thinking skill以及注重用戶體驗的慧眼。
  • 有解釋數據的能力(story telling)
  • 也就是說文科理科都需要很強
  • 有時候給上級,別的部門的,或者是executive級別的做報告

總結以上條件,基本上是PhD或者PhD candidate級別的人才能夠擔任Data Scientist的職務。行業起薪在~$120K。特別適合經濟學PhD。


先讀PHD,沒有PHD CANDIDATE身份怎麼算DATA SCIENTIST。

---

引用@CLK的評論:

「 很多本科畢業的business analyst來偽裝成data scientist把行業門檻拉得「看似」很低 」。

他的答案寫的挺好的,推薦大家看看。


同學老公是福特總部的data scientist. 他的經歷是加拿大統計本科,在加拿大統計局還是什麼官方機構做了五年,在美國又讀了個Business Analytics 碩士,然後就進福特了。。。


過去幾年,湧現出了很多不同的數據科學角色,但很難理解之間的差異和不同的技能要求。例如, 「這些職位到底有何異同?」、「我需要掌握什麼技能?」 以及 「什麼樣的思維方式能夠幫助我贏得這個職位?

數據行業職位匯總

Data Scientist 數據科學家

Data Scientist(數據科學家)可能是你能在名片上寫下的最熱頭銜之一,並且你離矽谷越近,這個職位就越有價值。數據科學家跟麒麟一樣稀有,而且每天的工作都需要有充滿好奇心的數據奇才那樣的思維體系。

需要有廣泛的數據科技技能和處理,分析原始數據的天賦,以及用一個吸引人可信服的方式來與同伴分享自身的深刻見解。這也難怪為什麼像谷歌和微軟這些公司都非常渴望像這樣的人才。

2015 薪資範圍:$103,000-$138,250

2016 薪資範圍:$109,000-$153,750

增長 8.9%

Data Analyst 數據分析員

Data Analyst(數據分析員)是數據小組的福爾摩斯。像R, Python, SQL 和 C語言是必備的基礎技能。就像數據科學家一樣,在不同的數據處理環節里,這個職位的具體技能要求差異很大,但都要求有一個精益求精,一絲不苟的態度。HP and IBM (將與其最新電腦系統Watson組成工作小組)等很多公司都需要數據分析員。

2015 薪資範圍:$106,250-$149,000

2016 薪資範圍:$113,500-$160,000

增長 7.1%

Data Architect 數據構架師

隨著大數據的興起,數據構架師的重要性日益凸顯。數據構架師繪製數據管理系統的藍圖,來整合、集中、保護和維持數據源。他們掌管著Hive, Pig和Spark等科技,並且需要一直站在行業創新的前沿。

2015 薪資範圍:$119,750-$164,750

2016 薪資範圍:$127,250-$175,500

增長 6.4%

Data Engineer 數據工程師

Data Engineer(數據工程師)一般都有軟體工程師的背景,並且喜歡使用資料庫和大規模處理系統。因此他們能夠很容易地掌握科技,所以不管是對統計程序語言還是程序網頁開發導向語言都很熟悉。每個公司都需要數據工程師。

2015 薪資範圍:$119,250-$168,250

2016 薪資範圍:$129,500-$183,500

增長 8.9%

Statistician 統計員

數據行業中歷史性的領導,代表著數據科學領域的主要職能:從數據中挖出重要涵義。具備紮實的統計理論和方法論,以及邏輯嚴密的思維體系,他們採集大量數據並將原始數據處理後得出數據信息分析報告。

得益於強大的數理背景,現代統計員能處理所有類型的數據並快速掌握新技術和使用這些來提升他們的知識容量。統計員為數據產業帶來了數學基礎理論,將從根本上改變商業。

2015 薪資範圍:$101,750-$145,250

2016 薪資範圍:$106,750-$155,500

增長 6.2%

Database Administrator 資料庫管理員

人們常常說數據是一座金礦,意味著需要有人來開採這座礦山。資料庫管理員確保所有相關用戶都能符合規定地正確使用資料庫,規避數據使用風險。確保資料庫的備份和回復系統運行正常,安全問題和正在使用中的各項支持技術都能被實時追蹤。

2015 薪資範圍:$71,250-$105,750

2016 薪資範圍:$76,250-$112,000

增長 6.4%

Business Analyst(商務分析員)

商務分析員跟團隊中其他成員有所不同。一般技能要求不高,但是需要不同商業流程的知識來將數據深度分析轉化為可執行的商業計劃,並且要能使用講故事技巧來將信息傳播遍整個組織。通常作為連接商業和技術的橋樑。需要商務分析員的公司多種多樣,遍布各個行業,典型公司有:Uber, Dell和Oracle。

2015 薪資範圍:$108,500-$153,000

2016 薪資範圍:$113,750-$164,000

增長 6.2%

Data and Analytics Manager(數據與分析經理)

數據分析經理是團隊中的拉拉隊隊員,他們為數據科學團隊制定方向並確保制定了正確的優先順序。需要熟練掌握SQL, R, SAS等軟體,並且社交能力要強,能夠管理好團隊。

這是一個很艱難的工作。但是如果你覺得這個工作適合你,一定不要忘記去查看Coursera, Slack, 和 Motorola等公司的職位。

2015 薪資範圍:$106,250-$148,250

2016 薪資範圍:$110,750-$160,750

增長 6.7%

(部分數據來源:Robert Half Technology 2016 Salary Guide via ://http://pcadvisor.co.uk)

數據行業總體情況一覽

說完了數據科學的就業方向和薪資待遇,下面我們來談一談它的總體情況。總的來說,數據科學行業薪酬待遇較高,並且發展前途較為廣闊,但是對從業人員的專業能力也要求很高。下圖是O』Reilly2016年關於數據科學職位薪酬的研究。本次研究的983個樣本來自45個國家以及美國45個州的不同行業。

研究表明,所有研究對象的薪酬中位數是87000美元,2016年的樣本有更多非美國的被調查者,更多30歲及以下的被調查者。五分之三的樣本來自於美國,他們的薪酬中位數為106000美元。

與美國東北部與中西部相比,西北部的薪酬中位數更高(105000美元對比98000美元),而加州擁有最高的薪酬中位數。調查還顯示,Python和Spark是對薪水貢獻最大的兩大工具。

調查還顯示,最受歡迎的工具是ExcelSQL,接下來是R以及Python。超過90%的被調查者表示會花時間在編碼上,80%至少會Python、R以及Java中的一種,8%的人會使用全部三種語言。

總的來說,影響薪酬高低的因素有很多,而能力越大相應地也就獲得的越多

當某一項工具成為行業標準時,僱主就會希望應聘者具有該項能力,當你不具備這項技能時,你找到好工作的可能性就會大打折扣。因此在具備面試技巧的同時,擁有這方面的專業技能才會使你有更大機會進入自己喜歡的行業。

該回答由Paragon One授權留學快問整理髮布。上Paragon One獲取留美求職資訊。

---------------------------------

歡迎關註:

知乎機構號:@留學快問

微信公眾號:liuxuekuaiwen

留學機構哪家強?上留學快問看真實評價!


程序員

工程師

科學家

我有點想不到下一個title了


「數據科學」一詞,是很久以前便開始存在的詞,但「數據科學家」,卻是近年內才突然出現的詞,社會上對數據科學家的關注度之所以提高,一方面也和Google、亞馬遜、Facebook等企業崛起的背後,都存在著數據科學家一事廣為人知有關。

這些互聯網企業不只是累加大量數據,還把這些數據轉化為更有價值的金礦。比方說,提供準確搜尋結果、定位廣告、精準商品推薦、你可能認識的用戶清單等。

未來十年,最吸引人的工作將是「數據科學」,提取數據的能力、理解數據的能力、處理數據的能力、從數據中萃取價值的能力、把數據可視化的能力、把數據傳達給他人的能力,以此為基本方向,學習相關方向所包含的技術,一定能規劃好自己的數據科學的職業發展之路,大數據的沓然而至,更值得我們把握,大數據時代來臨,大數據的價值主要體現在哪幾個方面? - 大數據 多智時代


本文節選自「大數據人的數據科學家之路」 Live分享的第三章 「數據科學家的職業生涯規劃」,希望對大家了解數據科學家的職業發展路徑有些許幫助:

在前面兩章,我們講清楚了什麼是數據科學家,作為一個數據科學家,有哪些爽的地方,它的誘惑力在哪裡,以及數據科學家需要具備哪些技術能力、應用能力、商業化能力,需要具備怎樣的大數據戰略思維,和作為企業大數據領域的專家,需要具備應有的科研能力,同時,作為一個實踐性的科學家,需要具備的大數據實戰能力,解決企業實際問題的能力,等等。我們不難看出,數據科學家是一個比較綜合性的帶有實踐性質的科學家,需要掌握技術、產品、商業、管理、科研等各方面的能力。成為數據科學家的道路有千千萬萬,每個人的背景和知識結構不一樣,選擇的道路肯定會不一樣,沒有最優的路,只有最適合自己的路,但最終殊途同歸。下圖是比較常見的幾類人員成為數據科學家的路徑,供大家參考。

針對這幅圖,有2點說明:

1.數據科學家是一個綜合的崗位,是大數據各方面的專家,當你把大數據架構、演算法模型、數據分析、數據產品和應用、數據化運營、數據價值變現等等方面都成為專家之後,你就是一個數據科學家

2.建議大家在職業的早期,有關大數據方方面的崗位,都去做去輪崗研究,掌握各崗位的工作核心內容和工具技能,將會非常有利於你未來成為一個數據科學家。

想了解數據科學家的詳細職業發展規劃,歡迎大家參加我的如下的LIVE分享,會給你更全面的做好數據科學家的職業規劃提供非常有益的幫助。如下是分享的大綱內容,請大家參考。

-------------------「大數據人的數據科學家之路」 Live分享大綱-----------------------

第一章 數據科學家-21世紀最性感的職業

1.什麼是大數據,大數據有哪些特徵,大數據時代到來了嗎?

2.什麼是數據科學家,怎樣的人能成為數據科學家,零基礎也可以嗎?

3.為何說數據科學家是21世紀最性感的職業?

第二章 如何才能成為數據科學家

1.成為數據科學家需要具備哪些大數據基礎知識和技能工具?

2.成為數據科學家需要具備大數據平台建設能力,如何培養你的大數據架構水平?

3.成為數據科學家需要具備數據產品化、數據應用能力,數據如何驅動業務增長?

4.成為數據科學家需要具備數據商業化能力,如何進行數據的價值變現?

5.成為數據科學家需要具備大數據戰略、大數據思維,如何培養?

第三章 數據科學家的職業生涯規劃

1.開發工程師的數據科學家之路?

2.產品經理的數據科學家之路?

3.運營人員的數據科學家之路?

4.其他職業者的數據科學家之路?

歡迎大家拍磚指正,歡迎大家關注我的知乎專欄「大數據實踐與職業生涯」並留言,專欄會陸續的推出過往十多年的大數據工作經驗總結和我的一些研究實踐成果。如果你是大數據新人,或者想轉行進入大數據領域,或者職業生涯上存在一些疑惑,都歡迎關注我的知乎live分享「大數據人的職業生涯規劃」 和 「數據分析師-從零入門到精通」、「大數據人的數據科學家之路」。


你和數據科學家之間只差一個數說立方

http://cube.datastory.com.cn


推薦閱讀:

大數據熱潮是泡沫么?
Python在數據科學領域能否完全取代R?
2016 年,美國舊金山灣區就業形勢如何?
CMU碩士還有半年畢業,找工作想專註找到真正熱愛的data scientist工作但又怕太冒險怎麼辦?
ECE博士如何轉行做機器學習?

TAG:互聯網 | 數據挖掘 | 職業發展 | 數據科學家 | 大數據 |