機器學習和數據科學領域必讀的10本免費書籍

機器學習和數據科學領域必讀的10本免費書籍

來自專欄我是程序員97 人贊了文章

摘要: 暑期來了,別出去溜達了,看書學習一波~

在這個暑假,有興趣的可以閱讀一下這些免費的有關機器學習和數據科學的書籍,他們能給你打開一扇看清機器學習和數據科學的窗。如果在閱讀完這一文章後想知曉更多免費的好書,請查看本系列的前一篇或下面的相關內容。

1. Python Data Science Handbook

作者:Jake VanderPlas

本書介紹了在Python中處理數據所必需的核心庫,特別是IPython,NumPy,Pandas,Matplotlib,Scikit-Lean和相關的軟體包。在此之前您需要掌握Python這種語言,如果您想快速掌握這門語言,可以參閱這個針對研究人員和科學家的Python語言快速入門的「Python的旋風之旅(A Whirlwind Tour of Python)」。

2. Neural Networks and Deep Learning

作者:Michael Nielsen

這是一本免費的在線書籍。通過這本書你會知道神經網路是一個美麗的生物啟發式編程範例,使計算機可以從觀測數據中學習。而深度學習則是一套強大的神經網路學習技術。

目前,神經網路和深度學習為圖像識別、語音識別和自然語言處理(NLP)中的問題提供了很多效果不錯的解決方案。通過這本書您將會知道更多神經網路和深度學習背後的核心概念。

3. Think Bayes

作者:Allen B.Downey

這本書主要介紹了如何使用計算方法處理貝葉斯統計。

如果您想使用本書中的技能來學習其他技能,您需要知道如何編程。

貝葉斯統計是根據數學概念(如微積分)提出的,有關它的大多數書籍也都使用的是數學符號。本書使用Python代碼而不是數學,因此「積分」變成了「總和」。這是書中的一個特色。

4. Machine Learning & Big Data

作者:Karee Alkaseer

這本書背後的目的是為了讓軟體工程師在不依賴庫的情況下可以輕鬆使用機器學習模型。大多數情況下,模型或技術背後的概念很簡單、直觀,但在細節或行話中會丟失。另外,一般情況下,現有的庫可以解決手頭的問題,但是有時候它們會用自己的方式抽象和隱藏基本概念,這就是它們被稱為「黑盒子」的原因。這本書也嘗試著將「黑盒子」里被抽象和隱藏的基本概念清晰化。它是一個還在進行中的作品,它的內容將慢慢的豐富。

5. Satistical Learning with Sparsity:The Lasso and Generalizations

作者:Trevor Hastie,Robert Tibshirani,Martin Wainwright

在過去的十年中,計算和信息技術得到了迅猛發展。隨著它的應用,在醫學、生物學、金融和市場營銷等領域中湧現出了大量的數據。本書在一個共同的概念框架下,闡述了這些領域中的一些重要觀點。

6. Statistical inference for data science

作者:Brian Caffo

作為數據科學專業的一部分 ,本書是統計推理課程(Statistical Inference)的一本配套書籍。如果你沒有上這門課,也可以配著YouTube上有關視頻單獨學習這本書。

本書旨在以低成本介紹統計推理這一重要領域,使得具有編程能力的學生將這些技能用到數據科學或統計學當中去。

7. Convex Optimization

作者:Stephen Boyd & Lieven Vandenberghe

這本書的主要內容是關於凸優化(convex optimization),這是一類特殊的數學優化問題,它包括最小二乘和線性規劃問題。眾所周知,最小二乘和線性規劃問題有一個相當完整的理論,出現在各種應用中,並且可以非常有效地用數值求解。本書的基本觀點是,對於較大類的凸優化問題也可以如此。

8. Natural Language Processing with Python

作者:Steven Bird & Ewan Klein & Edward Loper

本書基於Python編程語言和一個叫自然語言工具包(NLTK)的開源庫寫作而成的。「自然語言」是指用於人類日常交流的語言,與編程語言和數字元號等語言不同,自然語言在代代相傳的過程中不斷發展,並且很難用明確的規則來確定。為了讓計算機更好地理解自然語言,我們開發運用了自然語言處理(NLP)。這本書就是有關自然語言處理(NLP)的書。

9. Automate the Boring Stuff with Python

作者:AI Sweigart

你是否有過為花費數小時為文件重命名或更新表格里的數百個單元格而煩躁的經歷?在這本書中,你將會學到如何使用Python來輕鬆搞定這些問題。Python十分好上手,一旦掌握了編程的基礎知識,就可以創建Python程序,就此輕鬆解決那些繁瑣的事情。

10.Social Media Mining: An Introduction

作者:Reza Zafarani & Mohammad Ali Abbasi & Huan Liu

社交媒體在過去十年的發展已經徹底革新了個人互動和行業開展業務的方式。個人通過社交媒體互動、共享產生了大量的數據。

在這本書中,你將了解到社交媒體挖掘(Social Media Mining)整合了社交媒體,社交網路分析和數據挖掘,為學生、從業人員、研究人員等提供了一個方便而一致的平台。同時也將會了解到社交媒體挖掘(Social Media Mining)的潛力。

本文由阿里云云棲社區組織翻譯,點此查看譯文。

文章原標題《10 More Free Must-Read Books For Machine Learning and Data Science》

作者:Matthew Mayo

譯者:烏拉烏拉,審校:袁虎。

文章為簡譯,更為詳細的內容,請查看原文文章。

更多技術乾貨敬請關注云棲社區知乎機構號:阿里云云棲社區 - 知乎

本文為雲棲社區原創內容,未經允許不得轉載。


推薦閱讀:

detnet詳細解讀(網路主幹分類任務部分)
交叉熵、相對熵及KL散度通俗理解
機器學習演算法面試小結
如何利用手機遠程調參
技術宅如何進化為女裝大佬

TAG:機器學習 | 數據挖掘 | 深度學習DeepLearning |