數據科學家面試如何準備?

編輯 | April & Emma

專欄 | 九章演算法

數據科學家(Data Scientist)被《財富》雜誌譽為21世紀最性感的職業。據調查顯示,僅僅在美國市場,2018年大數據和高級分析相關人才的缺口就將高達19萬。然而雖然現在很多人對這份職業躍躍欲試,但是卻對這份新興職業並不了解,更不知道應該如何準備面試。

下面我們就來簡單介紹一下什麼是數據科學家,以及我們應該如何準備數據科學家面試,希望能對想要從事這一職位的朋友有所幫助。

什麼是數據科學家

「數據科學家」在2009年由Natahn Yau首次提出,簡單來說數據科學家就是指能採用科學方法、運用數據挖掘工具對複雜多量的數字、符號、文字、網址、音頻或視頻等信息進行數字化重現與認識,並能尋找新的數據洞察的工程師或專家(不同於統計學家或分析師)。

一個優秀的數據科學家需要具備的素質有:

懂數據採集、懂數學演算法、懂數學軟體、懂數據分析、懂預測分析、懂市場應用等。

在初步了解了數據科學家這一概念後,我們來重點研究一下應該如何準備數據科學家面試

如何準備數據科學家面試

1.了解你申請的崗位所需的技能

數據科學家這個職業的定義很廣泛。在不同行業不同公司,即使崗位名稱同樣叫做數據科學家,他們的工作內容也可能是不一樣的。這也就是說這個職業有很多分類。

比如:

  • 如果這個職位對你的編程能力要求很高,那麼,建議你看一看與軟體工作師有關的面試題。
  • 如果這個職位要求你有很高的統計技術,並且需要你了解不同的人口分布、懂得如何設計實驗、熟悉如何設置A / B測試和假設測試等,你就要對這些內容進行學習和練習。

所以在面試前,你一定要明確你申請的崗位所要求的技能和職責,因為這決定著你面試時會遇到什麼樣的題目。

2.向招聘人員詢問面試流程

向招聘人員詢問面試流程,了解準備面試時可以使用哪些資源以及面試時的著裝要求。

可以的話,詢問一下面試官的姓名,這樣你就可以在網上查找他們的相關資料,從而了解他們的專業領域等信息,並就此作準備,會起到事半功倍的效果。

3.在網上查找以往的面試題

你可以在網上查找你將要面試的公司數據科學家這一崗位的相關面試題,包括行為問題和技術問題。

就算你找不到你將要面試的公司的面試題,你也可以看看其他公司的面試題,讓心中對面試問題的類型有個大體了解。

4.提前準備好行為問題的答案

在面試前你要提前準備好你可能遇到的行為問題以及這些問題的答案。

比如說你可能遇到這些問題:

  • 你對要工作的內容感興趣嗎?
  • 你會如何對待團隊工作?
  • 你願意做一些煩人的工作嗎?比如清理雜亂的數據。
  • 在這個行業,每個公司都想努力解決的問題是什麼?你和你的團隊將如何發揮作用?

想要回答好這些問題,你可以查找相關資料並結合自身經驗在面試前準備好這些問題的答案,這樣當你面試過程中遇到這些問題時,你就能邏輯很清晰的表達出來。

5.仔細閱讀招聘要求

查看你那份工作的招聘要求,從中挖掘出你的優勢和興趣。並在面試官根據這些要求提問時說出你的興趣和優勢。這樣不僅能體現出你對這份崗位的精準了解,而且能表現出的你的專業能力,從而讓你在面試中脫穎而出。

比如:

  • 招聘要求:精通X語言。

面試時:可突出——我本身會Python,所以我學公司要求的X語言是很快的。

  • 招聘要求:會用不同的NLP模塊分析文本。

面試時:可突出——我很擅長用不同的NLP模塊分析文本,並加以舉例。

  • 招聘要求:熟練掌握web-scraping和web-pages-inspecting

面試時:可突出——我會用web scrap和查找web頁面寫一個爬蟲,並舉例。

  • 招聘要求:能在SQL和NoSQL資料庫找數據。

面試時:可突出——我很擅長在SQL和NoSQL資料庫找數據並基於這些數據分析模塊。

6.熟悉你的項目經歷

每輪面試前,重溫一下自己的簡歷。因為,大多數面試官會根據你簡歷上所寫的項目進行提問。所以,做一個perfect的總結至關重要。

準備工作:

翻看你的項目資料,回顧一下技術細節。

準備一下你在設計項目時使用數據科學的過程,裡面需要包括:你為什麼選擇這個方法、你對項目的個人貢獻、你遇到的挑戰、你在這個過程中學到的東西。

多加練習,確保你的總結是連貫的。

7.編程(通常要求在白板上寫)

如果你的工作職位需要考察編程能力的話,那麼你需要開始以下的準備工作:

  • 掌握基本的演算法以及數據結構和演算法複雜度。
  • 練習在白板或記事本上編碼,熟悉這種感覺。
  • 練習的時候給自己定時,以免面試時因有時間限制而過度緊張。
  • 如果沒有太多軟體工程經驗,可以找精通的朋友幫忙。

面試時:

  • 確保你完全理解題目意思,不清楚的地方要提前問面試官。
  • 寫代碼前,先將方法告訴面試官,讓他們可以對你的設計提出優化建議,從而節省時間。
  • 除非面試官提出,不要寫到一半去檢查無效輸出。一般情況下,面試官不會在意這個。
  • 寫完代碼後,注意檢查一下變數初始化、結束條件和邊界情況。

8.了解和應用機器學習理論

有的數據科學家職位對機器學習知識有一定的要求。

機器學習理論將測試你對基本機器學習概念的理解,一般側重於監督式學習。

對於機器學習理論,你應該了解:

  • 監督式學習系統的一般設置
  • 為什麼要將數據分為測試集和訓練集
  • 如果根據樣本數據不能找到普遍規律,那麼該怎麼辦?(參考答案:用不同的樣本數據或者投射到更高的維度空間)
  • 如果樣本數據太多太雜該怎麼辦?(參考答案:對其進行正規化)

此外,面試官也可能考察你的應用機器學習的能力。通常,面試官會讓你想一個演算法實現一個預測類的題。

比如:怎麼找出可以推薦給用戶的書? 回答此類問題,要明確:

  • 對象是什麼?
  • 可以用的機器學習演算法有哪些?
  • 內容列表樣式

根據問題的定義,對不同的可能情況擴展更多的解決方案,問題就迎刃而解了。

對你的聲譽和職業生涯產生影響。

最近活動

BAT求職大禮包 | 你的秋招網申時間餘額不足,百度、阿里、騰訊面試資料免費領取

歡迎關注我的微信公眾號:九章演算法(ninechapter)。

精英程序員交流社區,定期發布面試題、面試技巧、求職信息等。


推薦閱讀:

谷歌有個不為人知的面試渠道
前端面試那些事兒
如何畫好一個成熟大氣的面試妝?
我們總結出了寶潔八大問的標準答案
馬上要開始找工作了,有沒有比較好的面試正裝的選擇建議,以及各個不同檔次、價位的西服定製品牌推薦呢?

TAG:数据科学家 | 面试 | 信息技术IT |