年薪超70萬,為什麼數據科學家們還都忙著找新工作?
本文由 「AI前線」原創(ID:ai-front),原文鏈接:年薪超70萬,為什麼數據科學家們還都忙著找新工作?
策劃編輯 | Vincent
作者 | Jonny Brooks-Bartlett編譯 | Debra
AI 前線導讀:不知道你是否也偶爾會有下面那張圖中的狀態,不要以為這只是苦逼上班狗才會有的狀態,深耕於各大科學實驗室的科學家們內心也同樣經常充斥著這樣的情緒。終於有一位數據科學家在重重壓力之下受不了了,他決定「棄碼」從文,寫篇文章好好討伐一下這種現狀,於是我們找到了這篇文章,翻譯整理了出來,或許···你也會有共鳴呢?
更多乾貨內容請關注微信公眾號「AI 前線」,(ID:ai-front)
是的,我是一名數據科學家。沒錯,就是數據科學家這個名頭。我們一定聽到很多人說,數據科學家是 21 世紀最性感的工作,干這行有賺不完的錢(根據權威部門統計:入門級數據科學家的平均年薪約人民幣744253元)、這行里有很多經驗豐富的人才,他們聊著一些別人聽不懂的技術解決方案的話題,似乎一切都表明這是一份理想的工作。
然而事實上,《金融時報》(https://www.ft.com/content/49e81ebe-cbc3-11e7-8536-d321d0d897a3)這篇文章沒騙人,數據科學家們的確每周花 1-2 小時的時間找新工作。
這篇文章還說,「機器學習專家在急於找新工作的開發者中拔得頭籌,佔比 14.3%(此處指的是機器學習專家這一崗位中有 14.3% 的人正在尋找新工作,下同)」。數據科學家緊隨其後排第二,為 13.2%。」這是 Stack Overflow 對 64000 名開發者調研得出的結論。而在 2018 年 Stack Overflow 的最新開發者調查中,數據科學家和機器學習專家共有 18% 的人正在急於尋找新工作。
(https://insights.stackoverflow.com/survey/2018?utm_source=so-owned&utm_medium=meta&utm_campaign=dev-survey-2018-promotion#work)
我也是其中一份子,最近在忙著找新工作。
為啥這麼多數據科學家不想好好乾了?
首先我聲明,目前我仍是一名數據科學家,也沒有想斷了其他人成為數據科學家念頭的意思,這份工作其實還是挺有意思的,報酬也不錯。我寫這篇文章的目的只是想發發牢騷,晒晒這份工作不好的一面。
在我看來,數據科學家不滿他們的工作主要歸咎於 4 個原因。
1. 理想太豐滿,現實很骨感
大數據就像是青春期的性愛:每個人都談論,但沒人知道它的滋味,每個人都覺得別人干過這事,所以所有人都假裝自己是老司機。」
——Dan Ariely
這句名言還真是貼切啊。很多初出茅廬的數據科學家(包括我自己)進入這個領域都是奔著數據科學能夠用新型的機器學習演算法解決複雜問題,對商業產生巨大影響這一點去的,這很酷不是嗎?這讓我們覺得我們從事的工作比以往做的所有事情都更有意義。然而,事實是殘酷的。
在我看來,「理想很豐滿,現實很骨感」是很多數據科學家離開這一領域的最終原因。具體的原因太多,我不能一一窮舉,但是這篇文章中的幾個問題是我切身經歷的。
每家公司情況不一,因此我不能以偏概全,但是的確有很多公司在招聘數據科學家,卻沒有為他們在公司組織中安排一個合適的位置(https://hackernoon.com/the-ai-hierarchy-of-needs-18f111fcc007),以利用 AI 獲取價值。這會導致 AI 的冷啟動問題(https://towardsdatascience.com/the-cold-start-problem-with-artificial-intelligence-49938ed3f612)。加上在招聘那些初入這一領域的小年輕時公司並沒有能夠招到高級、經驗豐富的數據科學家,這對於沒有經驗的他們來說會很迷茫,不知如何自處。
數據科學家們可能是抱著編寫智能機器學習演算法,來推動 AI 洞察力發展的目標來的,但他們卻發現無法做到這一點,因為他們實際上幾乎整天都忙於需要整理數據基礎架構和 / 或創建分析報告。與他們的期待相悖,公司好像只需要一張可以在每天董事會會議上展示的圖表。然後這家公司會感到沮喪,因為他們沒有看到他們的工作迅速產生價值,隨後導致數據科學家對他們扮演的角色不滿。
Robert Chang 在他的博客文章中給出了非常有見地的想法,給初級數據科學家們提出了一些建議:
文章地址:https://medium.com/@rchang/advice-for-new-and-junior-data-scientists-2ab02396cf5b
評估我們的抱負與我們所處的環境之間是否一致是非常重要的事。找一家最能與你志趣相投的項目、團隊和公司。
這很明白地說明了僱主和數據科學家之間的雙向關係。如果公司與數據科學家的目標不一致,那麼數據科學家發現其他存在的問題只是時間問題。
Samson Hu 關於團隊建設的一篇文章 Building The Analytics Team At Wish 也非常有見地。
文章地址: https://medium.com/wish-engineering/scaling-the-analytics-team-at-wish-part-2-scaling-data-engineering-6bf7fd842dc2
數據科學家感到失望的另一個原因,與我為什麼對學術界失望的原因相似:我相信我能夠對世界各地的人們產生巨大的影響,而不僅僅是在公司內部。 事實上,如果公司的核心業務不是機器學習(我以前的僱主是一家媒體出版公司),那麼你所做的數據科學很可能只會帶來很少的收益。這些成果積少成多,或者你可能很幸運地偶然發現一個金礦項目,都會讓價值增加,但這種事情可遇不可求。
2. 政治至高無上
關於政治性的話題已經在一篇精彩的文章中有所詮釋:數據科學最困難的問題:政治(The most difficult thing in data science https://www.rdisorder.eu/2017/09/13/most-difficult-thing-data-science-politics/),推薦你讀一下。這篇文章的前幾句話幾乎總結了我想說的:
當我早上 6 點醒來研究支持向量機時,我想:「這真的很難!但是,嘿,至少我會對我未來的僱主非常有價值!「如果我有一台 DeLorean 時光機(https://en.wikipedia.org/wiki/DeLorean_time_machine),我會回到過去給自己打電話:「放 TM 屁!」
如果你覺得掌握很多機器學習演算法會讓你成為最有價值的數據科學家,那麼你可能會失望,請參見第一點:理想很豐滿,現實很骨感。
事實是,企業中最有影響力的人需要對你有一個好印象。這可能意味著你必須不斷進行臨時工作,比如從資料庫中獲取數字,並在正確的時間交給合適的人員,做一些簡單的項目,為的就是給人留下好印象。在我以前工作的地方我必須做很多這樣的事情。儘管覺得沮喪,但這是我工作的必要組成部分。
3. 數據出問題,大家都找你
儘管你竭盡所能取悅那些有影響力的人,但他們往往不明白「數據科學家」的含義。這意味著你不僅是分析專家和首席報告人員,不要忘記你還是資料庫專家。
不僅只有非技術高管把你視作無所不能的大神,技術上的其他同事也覺得你了解所有和數據相關的東西,你得知道 Spark,Hadoop,Hive,Pig,SQL,Neo4J,MySQL,Python,R,Scala,Tensorflow,A / B Testing,NLP,和所有機器學習相關的知識(以及其他任何你可以想到的相關數據——如果你看到一份招聘信息包含所有這些,請清醒一點。這表明這家公司不知道他們的數據策略是什麼,什麼人他們都敢雇,因為他們認為隨便雇一個做數據的就能幫修復所有的數據問題)。
還有更多。因為你知道所有這些東西,而且你可以訪問所有的數據,所以你需要能夠回答所有的問題...
告訴大家你真正知道並掌握哪些知識不是件容易的事。不是因為他們會看低你,而是因為作為一個沒有行業經驗的初級數據科學家,你會擔心人們會看低你。這可很難熬啊!
4. 在一個孤立的團隊中工作
一款成功的數據產品一般會有專業設計的用戶界面,帶有智能功能,最重要的是,它會產生有用的輸出,至少可以解決用戶的問題。現在,如果一個數據科學家把時間花在學習如何編寫和運行機器學習演算法,那麼在產品成功產生價值的過程中,他們只能作為團隊中的一小部分(儘管是必要的)。這意味著,在孤島中工作的數據科學家團隊必須拚命顯示自己的價值!
儘管如此,許多公司仍然有數據科學團隊可以自己發起項目,並嘗試用代碼來解決問題。在某些情況下,這可以滿足要求。例如,如果公司需要的只是每季度生成一次靜態電子表格,那麼它能有一些價值。另一方面,如果目標是為網站產品提供智能優化建議,那麼這將涉及許多不同的技能,這就不能指望絕大多數數據科學家具備所有技能(只有真正的數據科學大神才能做到)。因此,如果項目是由孤立的數據科學團隊組成的,那麼任務很可能會失敗(或者需要很長時間,因為組織孤立的團隊在大型企業中開展協作項目並不容易)。
因此,要成為行業內成功的數據科學家,僅僅在 Kaggle 比賽中完成一些在線課程是不夠的。幸運的是(或不幸,取決於你看待它的方式),這些課程涉及一些階級和政治如何在商業中發揮作用的內容。在尋找能夠滿足你需求的數據科學工作時,最關鍵的一點是要找到一家與你的規劃相符的公司。但是,你仍然需要重新調整對數據科學家崗位的期望。
如果你有任何意見、問題或反對意見,請在留言區發表評論,因為有建設性的討論對幫助有抱負的數據科學家對他們的職業道路做出明智的決定是非常必要的。
希望我沒有讓你失業。
原文鏈接:https://towardsdatascience.com/why-so-many-data-scientists-are-leaving-their-jobs-a1f0329d7ea4
今日薦文
FB 隱私門再爆內部猛料:哪怕被利用搞恐襲,只要用戶增長就行!
如果你喜歡我們的文章,就去移步關注我們的微信公眾號吧,AI前線,ID:ai-front
面向17W+AI愛好者、開發者和科學家,每周一節免費AI公開課,囊括上萬人的AI學習社群,提供最新AI領域技術資訊、一線業界實踐案例、搜羅整理業界技術分享乾貨、最新AI論文解讀。回復「AI前線」、「TF」等關鍵詞可獲取乾貨資料文檔。
推薦閱讀:
※聚類演算法第一篇-概覽
※哈佛大學數據科學專業解析
※雖然是BSO但是還算是我的DS提高路程
※從微積分和線性代數角度看線性最小二乘原理