成為數據科學家的 7 本入門推薦書籍

文 | Tomi Mester

編譯 | 王下邀月熊_Chevalier

過去的幾年中我一直在閱讀各式各樣的數據科學方面的書籍資料,上述7本是我個人最為欣賞的,它們都是我認為的將數據科學的基礎原理闡述的通俗易懂的很有價值的資料。書讀百遍,其義自見,即使你初看之下覺得晦澀難懂,相信多讀幾遍也就慢慢理解了。

1. Lean Analytics?—?by Croll & Yoskovitz

第一本書是教會你如何建立基本的以商業思維去使用這些數據,雖然這本書本身定位是面向初學者,不過我覺得你可以從中學到更多。你可以從本書中學到一條基本準則、6個基礎的線上商業形態以及隱藏其後的數據策略。

2. Business value in the ocean of data?—?by Fajszi, Cser & Fehér

如果說Lean Analytics是關於面向初學者講解商業邏輯加上數據,那麼本書是面向大型公司來講解這些內容。聽上去好像沒啥新鮮的,不過往往初創企業與獨角獸之間面對的問題是千差萬別,本書中會介紹譬如保險公司是如何進行定價預測或者銀行從業者們又在面臨怎樣的數據問題。

3. Naked Statistics?—?Charles Wheelan

這本書我一直很是推薦,因為它不僅僅面向數據科學家,而是為任何一個行業的人提供基本的統計思維,這一點恰恰是我認為非常關鍵的。這本書並沒有太多的長篇大論,而是以一個又一個的故事形式來講解統計思維在公司運營中的重要作用。

4. Doing Data Science?—?Schutt and O』Neil

這算是最後一本非技術向的書了吧,這本書相較於上面三本更上一層樓,他深入了譬如擬合模型、垃圾信息過濾、推薦系統等等方面的知識。

5. Data Science at the Command Line?—?Janssens

在介紹本書之前首先要強調下,千萬不要畏懼編程,學習些簡單的編程知識能夠有助於你做更多有趣的事。你可以自己去獲取、清洗、轉化或者分析你的數據。不過我也不會一上來就扔出大堆的編程知識,我建議還是從簡單的命令行操作開始學起,而本書正是介紹如何只用命令行就幫你完成些數據科學的任務。

6. Python for Data Analysis?—?McKinney

Python算是近幾年來非常流行的數據分析的語言了吧,人生苦短,請用Python。這本書算是個大部頭了,有400多頁吧,不過它首先為你介紹了Python的基礎語法,因此學起來不會很困難吧。

7. I heart logs?—?Jay Kreps

最後一本書則是短小精悍,加起來才60多頁吧。不過它對於數據收集和處理的技術背景有很好的概述,雖然很多分析家或者數據科學家並不會直接用到這些知識,但是至少你能夠理解技術人員們可以用哪些架構去解決數據問題。

推薦閱讀:

2016年你最值得回顧的五本書:橋都堅固,隧道都光明
有沒有一些《S.》的互動型解密小說?
短篇推薦——《復仇》
拆解|《絲綢之路》第二十五章

TAG:数据科学家 | 书籍推荐 | 数据 |