免費學習資源!10 本數據分析和機器學習圖書推薦
本文作者是知名數據科學網站 KDnuggets 的副主編 Matthew Mayo ,他本身是一位很厲害的數據科學家,在機器學習和數據分析領域具有資深從業經驗。在本文中,他推薦了一份和機器學習和數據科學相關的書單,而且都有免費閱讀地址,優達菌特地翻譯出來哦和大家分享,一起學習一起進步。
《Python Data Science Handbook》
《Python數據科學手冊》
By Jake VanderPlas
推薦理由
本書介紹了用Python處理數據所必需的核心庫:特別是IPython,NumPy,Pandas,Matplotlib,Scikit-Learn和相關軟體包。你需要熟悉Python的基本操作,這裡還有一些和Python相關的Github上的項目:https://github.com/jakevdp/WhirlwindTourOfPython,專為你快速入門Python而設計。
在線閱讀地址:
https://github.com/jakevdp/PythonDataScienceHandbook
《Neural Networks and Deep Learning》
《神經網路和深度學習》
By Michael Nielsen
推薦理由
《神經網路和深度學習》是一本免費的電子書。 這本書將教你兩樣東西:
?神經網路,一個美麗的生物啟髮型編程範式,它能讓計算機從觀測數據中學習
?深度學習,一套強大的神經網路學習技術
神經網路和深度學習目前為圖像識別、語音識別和自然語言處理中的許多問題提供了最佳解決方案。 本書將教授許多神經網路和深度學習背後的核心概念。
免費閱讀地址:http://neuralnetworksanddeeplearning.com/
《Think Bayes》
《貝葉斯思維》
By Allen B. Downey
推薦理由
關於貝葉斯統計的大多數書籍都使用數學符號,並根據數學概念(如微積分)來提煉思路。本書則用Python代碼取代數學,用離散近似取代連續數學。 因此,數學部分會整合為一個整體,而大多數關於概率分布的操作都是簡單的循環。
在線閱讀地址(英文):http://greenteapress.com/wp/think-bayes/
《Machine Learning & Big Data》
《機器學習和大數據》
By Kareem Alkaseer
推薦理由
本書背後的目的是為了讓軟體工程師在不過度依賴庫的情況下,輕鬆實現機器學習模型,從而在理論和實施之間取得平衡。大多數情況下,模型或技術背後的概念要麼很簡單要麼很直觀,但人們常在在細節處理或專業名詞中迷失方向。 另外大多數時候,現有的庫可以解決手頭的問題,但是它們會被視為黑盒子,而更多的情況是,為了隱藏底層概念,庫們有自己的抽象表示和架構。本書想嘗試將基礎概念描述得更為清晰。
在線閱讀地址:http://www.kareemalkaseer.com/books/mleapress.com/wp/think-bayes/
《Statistical Learning with Sparsity: The Lasso and Generalizations》
《稀疏統計學習》
By Trevor Hastie, Robert Tibshirani, Martin Wainwright
推薦理由
在過去的十年里,計算機和信息技術出現了爆炸性增長。諸如醫學,生物學,金融和市場營銷等領域湧現出大量數據。本書試圖用一個共同的概念框架來覆蓋這些領域中的重要思想。
本書涵蓋了統計學的所有重要分支,每個主題都有基本問題的詳盡介紹和求解演算法,給出了基於稀疏性的分析方案。可以說,此書就是稀疏統計學習的標準教材。
在線閱讀地址:https://web.stanford.edu/~hastie/StatLearnSparsity/
《 Statistical inference for data science》
《數據科學的統計推斷》
By Brian Caffo
推薦理由
本書是Coursera數據科學專項課程中統計推斷一課的配套書。但如果你沒參加過這門課,那麼這本書也能在你的書單里佔據一席之地。書中還附帶一系列構成Coursera課程的YouTube視頻。
本書旨在簡單地介紹統計推斷這一重要領域。 目標受眾是具有數字和計算能力、未來希望將這些技能用於數據科學或統計學的人。
在線購買地址:https://leanpub.com/LittleInferenceBook
《 Convex Optimization》
《凸優化》
By Stephen Boyd and Lieven Vandenberghe
推薦理由
這本書是關於凸優化的,凸優化是一類特殊的數學優化問題,它包括最小二乘和線性規劃問題。 眾所周知,最小二乘和線性規劃問題具有相當完備的理論,出現在各種實際應用中,並且能非常有效地用數值方法解決。 本書的基本觀點是,對於較大類的凸優化問題也能很方便地處理。
在線閱讀地址:http://stanford.edu/~boyd/cvxbook/
《 Natural Language Processing with Python 》
《基於Python的自然語言處理》
By Steven Bird, Ewan Klein, and Edward Loper
推薦理由
《Python自然語言處理》提供了非常易學的自然語言處理入門介紹,該領域涵蓋從文本和電子郵件預測過濾,到自動總結和翻譯等多種語言處理技術。在本書中,你將學會編寫Python程序處理大量非結構化文本。你還將通過使用綜合語言數據結構訪問含有豐富注釋的數據集,理解用於分析書面通信內容和結構的主要演算法。
本書將幫助你學習運用Python編程語言和自然語言工具包(NLTK)獲得實用的自然語言處理技能。如果對於開發Web應用、分析多語言新聞源或記錄瀕危語言感興趣——即便只是想從程序員視角觀察人類語言如何運作,你將發現《Python自然語言處理》是一本令人著迷且極為有用的好書。
在線閱讀地址:https://www.nltk.org/book/
《 Automate the Boring Stuff with Python 》
《基於Python的自動化處理冗餘》
By Al Sweigart
推薦理由
如果你曾花費幾個小時重命名文件或更新幾百個excel單元格,想必你也知道這些繁瑣的任務是多麼的乏味。 但如果用電腦來為你代勞呢?
在《基於Python的自動化處理冗餘》中,你將學習如何使用Python編寫原本你要花幾小時手動完成的事兒——電腦幾分鐘就能做好——甚至不用什麼編程經驗。 如果你掌握了編程的基礎知識,就可以創建Python程序,輕鬆完成非常有用的自動化操作。
在線閱讀地址:https://automatetheboringstuff.com/
《Social Media Mining: An Introduction 》
《社交媒體挖掘:導論》
By Reza Zafarani, Mohammad Ali Abbasi and Huan Liu
推薦理由
社交媒體在過去十年的發展已經徹底改變了人與人之間交互和企業開展業務的方式。 個人通過社交媒體互動、共享和消費內容,並以前所未有的速度產生數據。 人們通過理解和處理這種新型數據來搜集可行模式,同時也為跨學科研究、新演算法和工具開發帶來了挑戰和機遇。 《社交媒體挖掘》整合了社交媒體、社交網路分析和數據挖掘內容,為學生、從業人員、研究人員和項目經理提供了一個方便且互聯的平台,以了解社交媒體挖掘的基礎和潛力。
在線閱讀地址:http://dmml.asu.edu/smm/
好了,介紹完了,希望大家學習愉快,如果你有什麼好書推薦,歡迎在評論區和大家一起分享。
人生苦短,我用 Python!簡潔高效,新手友好!來自矽谷的「Python 編程入門」基石納米學位課程,已經開放報名,限量課程席位!點擊以下的卡片,免費預覽和體驗課程。
python基礎教程_python培訓班_python快速入門-優達學城(Udacity)官網
推薦閱讀:
※Google自動編程框架AutoML入門指南
※你需要的Scikit-learn中文文檔:步入機器學習的完美實踐教程
※RNN(循環神經網路)-2
※樸素貝葉斯演算法和R語言
※使用tensorflow構建卷積神經網路(CNN)