如何才能進入數據孵化器中心
提示:文章中劃線部分涉及的鏈接列在文章的末尾。
我們數據孵化器中心收到成千上萬份想要加入我們數據分析協會的申請。我們的要求非常高,以致於經常有人問我們以下問題:「我要怎麼做才能加入你們的數據分析協會呢?」
接下來我將介紹我們最看重的五個技能以及相應的學習資源,雖然我們並不要求申請者同時擁有這些技能,但是大多數申請人需要掌握大部分的技能。
爬蟲技術
SQL
當你獲得一大堆結構化數據後,接下來你需要考慮的問題是如何儲存它們?SQL 是一門原始的查詢語言,以至於許多語言都有 SQL 查詢介面,比如 R 語言中的 sqldf和 HIVE。通常情況下,安裝 SQL 的過程非常麻煩。不過幸運的是,這裡有一個在線學習網站,該網站提供了一個互動式環境,你可以在網站上提交自己的 SQL 查詢代碼。此外,如果你想在本地環境中使用 SQL,那麼你可以嘗試使用 SQLite。
數據框
機器學習模型
可視化
數據科學的一個重要過程是與他人共享你的一些發現,其中數據可視化是一個非常有效的手段。Python 中提供了 MATLAB 風格的繪圖軟體包 matplotlib,R 則提供了一個非常強大的繪圖工具 ggplot。當然如果你想嘗試動態可視化繪圖工具的話,你可以試下 d3。
以上都是一些數據科學家的基礎技能,掌握這些技能後對你的職業生涯會有很大的幫助。如果你僅僅只掌握了一部分技能,這是一個很好的開始。而且如果你已經做好準備的話,那麼就來加入我們吧!
更多課程和文章盡在微信號:「datartisan數據工匠」
原文鏈接:How to Prepare for The Data Incubator
原文作者:Michael
譯者:Fibears
推薦閱讀:
※數據科學博文
※考察數據科學家支持向量機(SVM)知識的25道題,快來測測吧
※3 步搭建系統化數據看板 | 技能卡片 No.2
※Python | 為什麼優化代碼?
※什麼使得一個預測模型可被解釋?
TAG:数据科学家 |