【書單】18本數據科學家必讀的R語言和Python相關書籍

原文來自 Analytics Vidhya

編譯 CDA 編譯團隊

本文為 CDA 數據分析師原創作品,轉載需授權

前言

「這就是閱讀。即將新軟體安裝到大腦里的過程。」

就我個人而言,我從視頻和在線教程中所學到的始終沒有從書本中學到的多。

了解機器學習和數據科學很容易。目前有許多開放課程,你可以馬上就開始學習。但是,獲得更深入的學習需要額外的努力。例如:你可能會很快了解隨機森林如何運作,但了解其背後的邏輯需要額外的努力。

質疑的信心來自於閱讀。有些人很容易接受現狀。另一方面,一些好奇的人則會反思「為什麼不能這樣做呢?」就是在這種情況下,人們開始嘗試用新的方式完成任務。幾乎每個我在美國管理協會(AMA)遇到的數據科學家,都曾在公開的採訪中強調過書籍在他們生活中充當了不可取代的作用。

以下是我在過去的一年中所發現的 R 語言和 Python 相關的機器學習、數據科學書籍。閱讀是一個好習慣,希望通過閱讀本文,你也可以養成閱讀的好習慣。祝閱讀愉快!

數據科學之R語言

R 語言入門與實踐

Hands-on Programming with R

作者:Garrett Grolemund

譯者: 馮凌秉

本書適合剛開始學習 R 語言的人。學習寫函數和循環可以使你用 R 實現更多功能。一些人認為,R 包可以讓他們避免寫函數和循環,但那並不是長久之計。本書將介紹 R 編程環境的細節,同時附有有趣的項目,如加權骰子,撲克牌,老虎機等。本書語言淺顯易懂。

大家的 R:高級分析和圖形學

R for Everyone: Advanced Analytics and Graphics

作者:Jared P. Lander

本書涵蓋數據可視化,數據處理,預測建模等數據科學各方面內容,而且並不晦澀難懂。同時內容廣泛,細節詳實。強調了演算法的使用標準和每個示例在 R 中的實現。本書適合傾向從實際方面理解演算法的人群。

R 語言經典實例

R Cookbook

作者: Teetor Paul

譯者:李洪成

本書為幫助人們克服在數據預處理和操作中遇到的各種問題。很多時候,面對熟悉的場景,我們知道要做些什麼。但是,如何完成卻成為了一個巨大的挑戰。這本書就很好解決了這個問題。它並沒有對概念進行理論解釋,而重點介紹如何在 R 中使用它們。本書涵蓋了廣泛的主題,如概率,統計,時間序列分析,數據預處理等。

R 數據可視化手冊

R Graphics Cookbook

作者:Winston Chang

譯者:肖楠, 鄧一碩 , 魏太雲

數據可視化使人能夠使用形狀和顏色來表達和分析他們的發現,而不僅僅使用表格。透徹的了解圖表,明確何時使用哪個圖表,以及如何定製圖表是數據科學家的關鍵技能。本書不僅僅具有理論知識,而且強調如何在 R 中構建樣本數據集。同時專註使用 ggplot2 包來進行可視化。

應用預測建模

Applied Predictive Modeling

作者:Max Kuhn, Kjell Johnson

作者之一 Max Kuhn 本身就是 caret 包的開發者。本書是理論和實踐知識的完美融合。它討論了幾個關鍵的機器學習主題,如過擬合,特徵選擇,線性和非線性模型,樹型方法等。並且使用 caret 包演示了所有演算法。Caret 是 CRAN 庫中功能強大的機器學習包之一。

統計學習導論:基於 R 應用

Introduction to Statistical Learning

作者:Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani

譯者:王星

本書是最詳盡統計建模的書之一。此外,它包括對線性回歸,邏輯回歸,樹木,SVM,無監督學習等主題的深入解釋。由於是導論,所以解釋淺顯易懂,任何新手都可以輕鬆學習。而且還附有練習。推薦這本書給所有使用 R 語言進行機器學習新手。

統計學習要素

Elements of Statistical Learning

作者:Trevor Hastie, Robert Tibshirani, Jerome Friedman

本書是「統計學習導論」的下一部分。它包含更高級的主題,因此不建議跳過上一本書直接讀這本。這本書適合掌握機器學習基礎知識的人。它涉及收縮方法,不同的線性回歸方法,分類,內核平滑,模型選擇等。對於想深入了解機器學習的人來說,這是一本必讀書。

機器學習與 R 語言

Machine Learning with R

作者: Brett Lantz

譯者: 李洪成, 許金煒, 李艦

書中作者解釋概念淺顯易懂,令人印象深刻。本書圍繞機器學習,同時涵蓋了很多實踐方面的知識。通過案例研究,討論了 Bagging,Boosting,SVM,神經網路,聚類等演算法。這些案例將幫助你了解這些演算法。另外還闡述了機器學習參數的知識。

掌握機器學習與 R 語言

Mastering Machine Learning with R

作者: Cory Lesmeister

本書適合所有想要通過掌握 R 語言進行機器學習人。它包括(幾乎)所有演算法及其在 R 語言中的執行。此外,本書介紹了一些用於機器學習的 R 包,包括最近推出的 H2o 包。本書還介紹了機器學習的最新發展,因此建議每個學習 R 語言的人閱讀本書。但是,不能期望從本書中學習到高級機器學習概念,如堆疊。

機器學習:實用案例解析

Machine Learning for Hackers

作者: Drew Conway, John Myles White

譯者: 陳開江, 劉逸哲, 孟曉楠

與其他類似書籍相比,本書篇幅較短。但是對每個涉及的主題都進行了深入探討。為了加強理解,作者還通過例子,在解決問題的同時解釋了基礎方法。對於想要學習機器學習的人群來說,本書值得一讀。

數據科學:理論、方法與 R 語言實踐

Practical Data Science with R

作者:Nina Zumel,John Mount

譯者: 於戈, 鮑玉斌, 王大玲

顧名思義,本書注重在現實生活中使用數據科學。本書與眾不同之處在於,上述其他書籍均未討論模型構建,模型的部署在現實問題中面對的挑戰。本書作者的關注點始終沒有偏離構建機器學習的理論與現實世界影響之間的聯繫。對尚未進入分析行業的人士來說,推薦閱讀本書。

數據科學之 Python

掌握 Python 進行數據科學

Mastering Python for Data Science

作者:Samir Madhavan

本書首先介紹了 Numpy 和 Pandas 的數據結構,並描述從各種來源將數據導入到這些結構中。你將學習在 Python 中執行線性代數,並通過使用推論統計進行分析。同時本書著重構建推薦引擎,使用 Python 進行高端可視化,集體建模等先進概念。

利用 Python 進行數據分析

Python for Data Analysis

作者:Wes McKinney

譯者:唐學韜

想通過學習 Python 進行數據分析?作者 Wes McKinney 是 Python 庫—— pandas 的主要開發者。本書內容詳實,涵蓋了通過 Python 進行數據分析的各方面內容,如:操作,處理,清理,可視化和處理數據等。如果你是使用 Python 進行數據科學的新手,那麼本書不可錯過。

Python 機器學習入門

Introduction to Machine Learning with Python

作者:Andreas Muller,Sarah Guido

本書旨在幫助初學者開始進行機器學習。本書教你從零開始,利用 Python scikit-learn 建立機器學習模型。本書適合之前沒有接觸過 Python 和機器學習的人群。此外,它還涵蓋了模型評估和參數調優的高級方法,使用文本數據的方法,以及文本特定的處理技術等。

Python 機器學習

Python Machine Learning

作者:Sebastian Raschka

譯者:高明 , 徐瑩, 陶虎成

這是迄今為止我所看過的,機器學習在 Python 方面最全面的書之一。作者解釋了關於機器學習的詳盡內容,他通過例子逐步解釋概念。本書涵蓋了神經網路,聚類,回歸,分類,集成等主題。

用 Python 構建機器學習系統

Building Machine Learning Systems with Python

作者:Willi Richert , Luis Pedro Coelho

譯者:劉峰

在本書,作者先從基礎開始,接著通過項目解釋概念,最終附上總結,循循漸進。推薦這本書給使用 Python 進行機器學習的零基礎人群。它涵蓋了圖像處理,推薦引擎,情感分析等主題,易於理解和實際運用。

利用 Python 進行高級機器學習

Advanced Machine Learning with Python

作者:John Hearty

本書適合每個機器學習愛好者閱讀。本書能夠讓你掌握機器學習的基礎技術知識,自動編碼器,功能工程技術,集成等。同時也重視機器學習的理論和實踐。

集體智慧編程

Programming Collective Intelligence

作者:Toby Segaran

譯者:莫映, 王開福

本書有個有趣的標題的書名。書中介紹了一些機器學習的演算法,如 SVM,樹,聚類,優化等,並使用有趣的例子。這本書最適合使用 Python 進行機器學習的的新手。某些章節還附有練習,能夠幫助更好的理解。

ref:

18 New Must Read Books for Data Scientists on R and Python
推薦閱讀:

推薦 | 經典R學習書籍
可以重新考慮下民主,或許它不僅僅是票選那麼簡單
書?《列女傳》
《了不起的蓋茨比》:我們頭頂上的天空哪一塊是屬於自己的
8月讀書筆記

TAG:R编程语言 | Python | 书籍推荐 |