讓你掛掉數據科學家面試的4宗罪
來自專欄數據汪4 人贊了文章
大數據文摘作品
編譯:李雷、吳雙、蔣寶尚
「數據科學家」可能是本世紀最性感的工作。
但僱用一個數據科學家卻不是如此。
對於立志在數據科學領域有一定作為的新手來說,「數據科學家」可不僅僅是一個光彩照人的代名詞。
新手需要不斷的學習,才能成長為一名具有創造力的數據科學家。
另外,作為小白的你可能急切想得到一份數據科學的職位。
但你在面試的時候,面試官讓你「掛掉」的原因可能有數百種。
總的來說,可以分為四種。為了更好的理解這四項失誤,文摘菌將此類比狙擊手的訓練。
讓我們開始吧......那麼,讓數據科學家面試失敗被拒的4宗罪是什麼?
用機器學習流行語來修飾你的簡歷
與任何工作一樣,用行業術語來刻畫個人簡歷可能會很吸引人的。數據科學領域也不乏各種流行用語。也許這種表面功夫可能能提高你的簡歷通過人力資源自動揀選的機會,但往往更可能會事與願違。
很多時候,簡歷上聲稱的高級分析技能實際上只是會用excel數據透視表、SQL查詢或Google分析。就算不管因此而在面試上浪費掉的時間,這種拙劣的策略也會導致求職者徹底失敗或者喪失信心。
對於一個有抱負的狙擊手來說,這種行為無異於光說不做,穿著軍服拿著槍,卻不去訓練自己成為一名士兵。儘管這聽起來很荒謬,但是做一隻披著狼皮的羊一點意思也沒有。
建模少而只顧程序庫調用
許多求職者都聲稱他們如何熟悉建模,但實際上他們都只是在努力解釋模型函數的調用和參數。其實在問到諸如某項技術是做什麼的之前,比如Random Forest,還有一個更重要的問題就是為什麼你會首先選擇它。
說實在的,一個模型是可以通過單行庫調用來運行。但是,機器學習絕不僅僅是這樣。比如說,人們需要明白什麼情況下邏輯回歸比SVM更合適。又或者,什麼時候簡單的外推法會比ARIMA或Holt-Winters等預測技術更強大。
一個好的狙擊手需要做的不僅僅是瞄準和射擊。其實,射擊訓練只佔狙擊學校課程的20%。真正的狙擊手需要其他細節技能,比如耐心、紀律和好的觀察評估目標距離的能力。
缺乏數據分析必不可少的基礎知識
儘管對機器學習技術的直觀理解可以成為求職者的強項,但他們往往在這方面反而做得不足。他們常常忽視投入實踐培訓以掌握更多基礎技能,如統計和探索性數據分析。
建模僅占整個數據分析生命周期的一小部分。在任何成功的機器學習(ML)項目中,超過50%的時間都是花在準備數據,討論和尋找方法上。還有大約25%的時間花在之後的模型解釋和建議上。
即使求職者都標榜他們的分析項目有90%的準確率,但是如果你看到他們在解釋p值(當原假設為真時所得到的樣本觀察結果或更極端結果出現的概率)是什麼,和為什麼模型需要置信區間時那種越說越沒自信的表情,你就會覺得這對他們來說簡直是一場悲劇。
就像狙擊手首先需要成為一名偉大的步兵一樣,牢牢掌握基礎知識在所有學科中都是至關重要的。如果一個人在戰鬥中不會修槍或是開槍走火的話,那麼他槍法再好又有什麼用?
不懂應用分析技術來解決業務問題
顯然要在我們剛才討論過的各方面都做到很好已經是一項艱巨的任務。但是我們還沒講到整個鏈條中的關鍵環節,而這正是大多數面試沒有了下文的原因。
數據科學家的最終使命是解決業務問題,而不僅僅是分析數據或建立一個偉大的模型,這是數據分析的終極目標。人們需要在用分析工具處理任何數據之前就界定好正確的業務問題,並制定解決問題的一系列步驟。
當求職者被問及企業如何解決客戶流失問題時,如果他急於用數據分析來解釋,或者更有甚者,單靠模型名稱來胡亂預測客戶流失,那麼面試就沒法繼續下去了。較好的方式是從探討客戶註冊的原因以及客戶的期望和影響業務的核心因素是什麼開始。
這就好比一個專家級別的狙擊手無所不知,但卻不能隱蔽自己或找到真正需要除掉的目標。這樣的人真的很危險,因為豬隊友比神對手更具風險性。
總結:對數據科學的追求
總之,我們對數據科學的追求必須有一定的規則:
- 通過問題重構和一系列步驟推演來應對挑戰,解決業務問題;
- 把基礎知識技能應用於統計學和探索性數據分析中,以獲得數據感並代分析方法;
- 選擇一系列分析技術或機器學習模型,然後為業務用戶處理和解釋分析結果;
- 並通過正確定位自己的專業知識來展現這些技能,這是數據科學家所必備的。
好吧,願你能消除這些缺陷,並在數據分析職場中獲得一席之地!
相關報道:
https://towardsdatascience.com/4-ways-to-fail-a-data-scientist-job-interview-d9c4c85c683
推薦閱讀:
※小米科技的四次戰略轉型——談雷軍的創新遠見
※雷軍發微博:高通驍龍845發布會 我是唯一手機廠商代表 你怎麼看?
※獵隼科技:專業無人機為行業賦能,AI技術對標Intel
※同性戀科技,我才剛上路?
※你不懂我的沉默,又怎懂得我的難過 | 酷聽科技