Tableau 冠軍推薦的10本數據分析圖書,果斷收藏!

機器學習和數據分析密不可分,除了網課,我相信一些優質圖書肯定能幫到你的忙,優達菌特意請到了2017 Tableau 上海站冠軍 Young 向大家推薦10本技術圖書,都是非常實用且有幫助的,多讀讀多看看,肯定獲益匪淺。文末還有送書活動,千萬別錯過。

Tableau 2017上海站冠軍 Young Lin 介紹

  • 畢業於台灣大學金融系,University of Maryland MS Marketing Analytics
  • 美國創業兩次,目前任職於上海 Merkle(美庫爾)
  • 喜歡數據分析,因為數據背後的真理使人自由
  • 喜歡數據可視化,因為有效的溝通可以改變人

機器學習和數據分析是一對複雜且相互關聯的概念。為了跟上潮流,你需要做足準備,花時間研究並且更新知識。即使日復一日地在這個行業工作,仍然有可能落後於當前的趨勢。

為了不落人後,最好的方式是繼續刷新自己的知識,同時保持上手的經驗。在這行業中要取得成功,需要完美的項目經驗和技能組合。儘管網上有大量的資源,我們仍要專門推薦一些好的實體書籍。

1. 《Machine Learning Yearning》 by 吳恩達

由現代數據,大數據和數據科學開發並生產出的機器學習系統已經不是什麼秘密。雖然它們不一定是同義詞,但卻是互相關聯的,因此如果你在數據行業工作,那麼提高對機器學習的理解和認識是個不錯的想法。

從本書中你可以學到一些洞察能力,例如你應該多長時間收集一次訓練數據集,如何使用端到端的深度學習,以及如何利用你正在創建的系統來共享數據和統計信息。

2. 《Hadoop:權威指南》 by Tom White

Apache Hadoop是用於處理和管理大量數據的主要框架。任何從事編程或數據科學工作的人都有必要熟悉這個平台。事實上,這是開發可擴展系統最有效的方法之一。

身為Hadoop顧問和Apache軟體基金會成員的Tom White寫了這本標準指南,其中包羅作者的個人見解和一些有用的資源。更重要的是,它將引導你完成Hadoop的設置並且過一遍整體流程。

Apache Spark是你可能需要花時間學習的另一個重要平台。

3.《預測分析》 by Eric Siegel

本書詳細解釋了如何獲取多種形式的數據和信息,並將其轉化為可實施的預測或見解的方法。本書的核心目的是幫助專業人員更好地了解他們的受眾。你將學會如何識別他們購買的產品和服務,訪問的地點,與他們產生共鳴的內容等等。

眾所周知,數據科學家的工作是查看未經過濾的原始數據,並發現可用的趨勢和模式。本書不僅可以幫助你做到這一點,而且還提出必要的預測演算法來改進未來的操作和流程。本書可以算是預測分析的聖經。

4. 《用數據講故事》 by Kole Nussbaumer Knaflic

《用數據講故事:商業專業人士的數據可視化指南》 是業內的重要讀物,甚至對與商業不怎麼相關的人士也極為重要。為什麼呢?

簡而言之,本書涉及大量數據的管理和提取工作。其中包含:去除過多且不明確的數據,改進數據收集流程,併產出相關且實際的數據可視化結果。

這是一本權威指南,旨在幫助你了解應該如何處理收集到所有有用的數據,以及如何實際去做的方式。許多見解適用於科技產業,但對於非科技領域的專業人員同樣適用。

5. 《大拐點》 by Scott Stawski

本書對於了解當前數據分析和雲計算行業的發展勢頭十分有幫助。特別值得注意的是,Stawski主要關注原始數據存儲和挖掘系統、如何部署以及在現實世界中的使用情況。

它不僅是一個理論指南,還揭示了實際的工作系統,並且提到如何把相應模式套用到你的企業或公司。更重要的一點是,你可以從本書中清楚了解如何在組織內部署這些工具和平台。

6. 《統計學習導論·基於R應用》 by Gareth James等人

統計學習和相關的方法是數據科學工作所必需的概念。這本教科書旨在幫助每個人——從本科到博士,了解這些統計概念。

當然,它也提供了一些很好的R-lab與練習,其中有詳細的解釋和攻略。你可以在學習階段直接用它來練習數據科學。他還能在你的日常應用中作為工具書反覆查閱。

7. 《商業中的數據分析》 by Foster Provost, Tom Fawcett

本書由著名數據科學專家Foster Provost和Tom Fawcett撰寫,介紹了數據科學的基本原理,讓你從收集的數據中提取有用的知識和業務價值所需的「數據分析思維」,並可幫助你了解當今使用的許多數據挖掘技術。

這本書有趣的地方,是會特別標記出較困難的技術部分,並深入淺出的介紹數據挖掘中的重要的幾個概念:分類,聚類和回歸。更重要的是書中包含了這些概念在商務上的的直接應用。

8. 《數據科學實戰》 by Cathy ONeil, Rachel Schutt

這本以哥倫比亞大學的數據科學入門課為基礎,包含了Google,Microsoft和eBay等公司的數據科學家的經驗,通過介紹案例研究和他們使用的代碼的經歷,分享了新的演算法,方法和模型。

如果你熟悉線性代數,概率和統計,並具有編程經驗,本書是你對數據科學的理想介紹。主題包括:統計推斷、探索性數據分析和數據科學過程演算法、垃圾郵件過濾器、樸素貝葉斯和數據處理邏輯回歸、財務建模、推薦引擎和因果關係數據可視化、社交網路和數據新聞、數據工程、MapReduce。

9. 《Show Me the Numbers》 by Stephen Few

在BI產業有30多年的經驗之後,Stephen Few並不針對哪一種可視化工具進行鑽研,而是從更高層次的去討論,什麼圖形該怎麼使用,來傳達什麼樣的訊息是最有效的,以及數據分析產業的發展與趨勢。

這本書中,他介紹了可視化的起源和背後的應用,為讀者提供實際的設計指導,針對不同數據使用者的不同使用場景給出建議,在一些現在流行卻有潛在問題的可視化設計上做出改進。

10. 《精益數據分析》 by Alistair Croll / Benjamin Yoskovitz

本書延續了新創企業文化中MVP(Most Valuable Product)概念和商業畫布架構,展示了如何利用數據的方式,分析六個產業中(電子商務、SaaS、免費移動應用、媒體網站、用戶生成內容與雙邊市場)的數據,驗證創業者自己的設想、找到真正的客戶、打造能賺錢的產品,以及提升企業知名度。

有趣的地方是,就算新創企業的數據沒有成熟企業來的多,作者認為每種不同的產業仍有必須關注的指標數字。根據這些數字新創公司可以更有效的管理和拓展生意。

機器學習(入門) | Udacitycn.udacity.com

作/譯者: Young Lin

參考出處: kdnuggets.com/2017/10/6(Kayla Matthews)

嘿嘿,介紹了這麼多本書,不送書說不過去了,今天優達菌就來送5本清華大學出版的《機器學習》吧,傳說中非常實用的西瓜書,每個人都能參與,只要關注微信公眾號 優達學城(id:youdaxue),回復關鍵字「送書」即可參與。

本文首發於微信訂閱號優達學城Udacity(id:youdaxue),關注訂閱號,回復關鍵字「學習資料」,獲取來自矽谷的包括「機器學習」、「深度學習」、「數據分析」和「前端開發」在內的獨家學習資料。優達學城 (Udacity) - 傳授矽谷的名企官方課程

歡迎大家踴躍投稿~可以通過私信聯繫優達菌~


推薦閱讀:

計算機碩士期間如何發力,畢業後能衝擊30-40w年薪的offer?
我靜香就是要閉著眼玩數獨~
該不該堅持學習Machine Learning?
計算中有哪些好用的文本相似度演算法?

TAG:数据分析 | 机器学习 | 书单 |