標籤:

初入數據科學職業時,要避免的9個錯誤

如果你想要在數據科學方向發展,避免這9個代價不菲的初學者錯誤,你能夠免去數天,數周甚至數月的受挫。

如果您不小心,這些錯誤將會消耗您最寶貴的資源:您的時間,精力和動力。

我們將它們分為三類:

  • 學習數據科學時的錯誤
  • 申請工作時的錯誤
  • 工作面試中的錯誤 ## 何時學習數據科學

第一套錯誤是「卧底」,很難發現。他們慢慢地,但肯定會耗盡你的時間和精力,而不會給你警告,他們從這個領域的誤解中產生。

1. 花費太多時間在理論上。

許多初學者陷入了花費太多時間在理論上的陷阱,無論是數學相關(線性代數,統計學等)還是機器學習相關的(演算法,派生等)。

這種方法效率低下有三個主要原因:

  • 首先,這是緩慢而艱巨的。如果你曾經感到所有學習的內容都非常費解,你可能已深陷陷阱。
  • 第二,你也不會保留這些概念。數據科學是一個應用領域,鞏固技能的最佳方法是通過實踐。
  • 最後,如果你不能看到你正在學習的東西如何和現實聯繫起來,那麼會增加你變得消極想要放棄的風險。 這種重視理論的方法是學術界教授的傳統論調,但大多數從業者更易從結果導向中受益。

為了避免這個錯誤:

  • 平衡花費在研究與提供實踐機會的項目的時間。
  • 學會對部分知識不求甚解。隨著進度,你自然會填補空白。
  • 了解每件作品如何適應背景。

2.從頭編寫太多的演算法。

下一個錯誤也會導致學生為了一棵樹錯過一片森林。在最初,你真的不需要從頭開始編寫每個演算法。

雖然實現一些只是為了學習目的很好,但現實是演算法正在成為商品。由於成熟的機器學習庫和基於雲的解決方案,大多數從業人員從來沒有從頭開始編碼演算法。

今天,了解如何在正確的設置(以正確的方式)應用正確的演算法更為重要。

為了避免這個錯誤:

  • 學習通用機器學習庫,如Scikit-Learn(Python)或Caret(R) 。
  • 如果你從頭開始編寫一個演算法,這樣做是為了學習而不是完善你的實現。
  • 了解現代機器學習演算法的優勢及其優缺點。

3. 跳入深淵。

有些人進入這個領域是因為他們想要構建未來的技術:自駕車,高級機器人,計算機視覺等。這些技術由深度學習和自然語言處理等技術驅動。

但是,掌握基本原理很重要。正如每個奧運潛水員都需要先學習如何游泳,你也一樣。

為了避免這個錯誤:

  • 首先掌握「古典」機器學習的技術和演算法,作為高級課題的基石。
  • 知道古典機器學習仍然具有難以置信的未開發潛力。雖然演算法已經成熟,但我們仍然處於挖掘如何利用它們的早期階段。
  • 學習系統的方法來解決任何形式的機器學習問題。

申請工作時

下一套錯誤可能會導致您在求職過程中錯過一些很好的機會。即使你已經合格,你可以通過避免這些小錯誤來最大限度地發揮你的作用。

4.在簡歷中有太多的技術術語。

許多申請人在寫簡歷時最大的錯誤是用太多技術術語。

相反,你的簡歷應該畫一張照片,你的核心應該講故事。您的簡歷應主張您對組織帶來的影響,特別是如果您申請入門級職位。

為了避免這個錯誤:

  • 不要簡單地列出您使用的編程語言或庫。描述你如何使用它們並解釋結果。
  • 「少即是多……」仔細思考後強調最重要的技能,並通過消除其他不必要的內容。
  • 製作簡歷主模板,以便您可以分離針對不同角色定製的不同版本。這保持每個版本乾淨。

5. 高估學位的價值。

有時,畢業生可以高估他們的教育價值。雖然在相關領域的強大程度肯定會提高您的機會,但它也不夠充分,也不是通常最重要的因素。

很顯然,我們不是說畢業生傲慢自大...

在大多數情況下,在學術環境中所教授的東西與企業中應用的機器學習過程截然不同。使用期限,客戶和技術阻礙在學術界不那麼迫切地需要根據實際權衡。

為了避免這個錯誤:

  • 用使用現實世界數據的項目練習作為課程的補充。
  • 系統學習解決機器學習問題的方法。
  • 參加相關實習,即使是兼職。
  • 在LinkedIn上接觸當地的數據科學家進行咖啡聊天。

6. 搜索工作時太局限。

數據科學是一個相對較新的領域,組織仍在不斷發展,以適應日益增長的數據影響。如果您只搜索「數據科學家」開頭,那麼您將會限制自己。

許多職位沒有被標註為「數據科學」,但是它們將允許您以類似的角色發展類似的技能和功能。

為了避免這個錯誤:

  • 通過所需技能 (機器學習,數據可視化,SQL等)進行搜索。
  • 按工作職責搜索(預測建模,A / B測試,數據分析等)。
  • 通過所用技術手段搜索(Python,R,Scikit-Learn,Keras等)。
  • 根據職位擴展您的搜索(數據分析師,定量分析師,機器學習工程師等)。

面試期間

最後一套錯誤是面試過程中的絆腳石。你已經做了艱苦的工作來實現這一步,所以現在是時候做個好的結尾。

7.沒有為面試時可能談及的項目做準備。

有實際的項目經驗是當遇到「如何做」類型面試問題時的應對保障。不僅僅只能在假設的說明應對方案,你還可以指出處理某些情況的具體例子。

此外,許多招聘經理會想要你有自給自足的能力,因為數據科學角色自然包括項目管理的要素。這意味著您應該了解整個數據科學工作流程,並了解如何將所有內容整理在一起。

為了避免這個錯誤:

  • 從頭到尾地完成一次項目,使您能夠練習每一個重要步驟 (即數據清理,模型訓練等)。
  • 組織你的方法論。數據科學應該是深思熟慮的,而不是無計劃的。
  • 回顧和重新描述你過去在實習,工作或課程中曾做過的項目。

8.低估領域知識的價值。

技術技能和機器學習知識是獲取數據科學職位的基本先決條件。但是,要真正脫穎而出,您應該了解更多關於您將應用您的技能的具體行業。

記住,數據科學從來不存在於真空中。

為了避免這個錯誤:

  • 如果你正在面試一個銀行的職位,請刷一些基本的財務概念。
  • 如果您在《財富》雜誌500周年期間面試一個重要位置,那麼就可以進行一些案例訪談並了解盈利能力的驅動因素。
  • 如果您正在為創業公司面試,了解其市場,並嘗試了解如何獲得競爭優勢。
  • 簡而言之,在這裡採取一點額外的舉措可以帶來很大的好處!

9.忽視溝通技巧

目前,在大多數組織中,與開發團隊或分析師團隊相比,數據科學團隊仍然很小。因此,當入門級軟體工程師一般被一名高級工程師指導時,數據科學家往往在更多的跨功能設置中工作。

面試官會需要你有能夠與技術或數學背景的同事溝通的能力。

為了避免這個錯誤:

  • 練習為非技術觀眾解釋技術概念。例如,嘗試向朋友解釋你最喜歡的演算法。
  • 為常見的面試問題準備重點,並提供答案。
  • 實踐分析各種數據集,提取關鍵洞察力,並呈現您的發現。

結論

在本指南中,您學習了避免數據科學初學者9個最常見錯誤的實用技巧:

1.花費太多時間在理論上。 2.從頭編寫太多的演算法。 3.直接跳入高級課程,例如深度學習,太快。 4.在簡歷中有太多的技術術語。 5.高估學位的價值。 6.搜索工作時太局限。 7.沒有為面試時可能談及的項目做準備. 8.低估領域知識的價值。 9.忽視溝通技巧。


推薦閱讀:

簡明數據科學 Part1:原理與過程
PyCharm:2017.3版即將新增科學計算模式,預覽版現在可以下載使用
[重溫Statistics] P-Value
醫療保健行業將如何受益於數據科學的發展?
和生意人打交道,數據科學家常犯的三大典型錯誤

TAG:数据科学 |