七本書籍帶你打下機器學習和數據科學的數學基礎
大多數人學習數據科學的重心放在編程上面,然而,要真正精通數據科學的話是不能夠忽視數據科學背後的數據基礎。本篇文章,將分享給讀者我喜歡的七本有關於數據科學基礎的書,下面將逐一為大家介紹這七本數學基礎書,請大家開始「享受」吧!
首先要明確一點,我們為什麼要為學習數據科學的數學基礎而努力呢?以下是激勵我的原因:- 人工智慧正在快速的改變著世界。Geoffrey Hinton大牛使得我們重新對BP演算法有了新的思考。
- 理解背後的數學原理會幫助你更好地理解人工智慧的變革。它將幫助你從深度上理解人工智慧,與那些淺嘗輒止的研究者區分開來。
- 它還將幫助你更好地了解人工智慧知識產權(IP)的潛力。
- 最後,理解數據科學背後的數學知識也能引導你進入人工智慧和數據科學更高端的工作。
1.統計學習理論的本質(The Nature Of Statistical Learning Theory)——Vladimir Vapnik
在數學界中,如果你想創建一個關於數學書的列表並不包括偉大的俄國數學家,那是不可能的。所以,在本文列表中的第一本書籍自然而然就是由Vladimir Vapnik編寫的統計學習理論。該書是七本書中最難找到的一本,當然,在中國這都不是事兒。Vladimir Vapnik也是支持向量機(SVM)演算法的創造者,其維基百科頁面上介紹了很多關於他的工作。
2.模式分類(Pattern Classification)——Richard O Duda
類似於Vladimir Vapnik的書,Duda是另一個時代的經典書籍。首次發表於1973年,在25年後(2000年)得到更新,之後再也沒有進行更新,但這並不妨礙本書成為一本重要的書籍。該書採用模式識別的方法,並涵蓋了大量的演算法。
3.機器學習:演算法透視(Machine Learning: An Algorithmic Perspective, Second Edition (Chapman & Hall/Crc Machine Learning & Pattern Recognition))——Stephen Marsland
此書現在有第二版,這本書也是我讀過最早的書籍之一。第一版和第二版都很好,其中第二版有更多的Python代碼。與前兩本書類似,該書也非常強調演算法。
4.統計學習要素:數據挖掘、推理和預測(The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Second Edition)——Trevor Hastie, Robert Tibshirani, Jerome Friedman
又一本經典教材,我使用的版本印刷得非常好,具有很高的參考價值。
5.模式識別與機器學習(Pattern Recognition and Machine Learning (Information Science and Statistics))——Christopher M. Bishop
Christopher M. Bishop編寫的模式識別和機器學習(信息科學和統計學)也是一本深入淺出且非常完善的書籍,參考價值高。
6.機器學習:理解數據的演算法中的藝術和科學(Machine Learning: The Art and Science of Algorithms that Make Sense of Data)——Peter Flach
我喜歡Peter Flach的書籍,儘管購物網站上的一些評論說其有些冗長並缺少代碼,但我喜歡其整本書的布局(演算法的分組:邏輯模型、線性模型以及概率模型)和主題的整體處理。
7.深度學習(Deep Learning)——Goodfellow、Bengio和 Corville
該書也被稱作「花書」,內容很詳細且知識新,涵蓋你能想到的一切知識點。
兩個值得推薦的其它資源:- 機器學習的第一門課程(A First Course in Machine Learning, Second Edition (Machine Learning & Pattern Recognition))——Simon Rogers、Mark Girolami 這本書有第一版和第二版,其中第一版是我得到的第一本書,但我不建議初學者看這本書,但這不妨礙該書是本好書(尤其是第二版)。
- 機器學習:從概念的角度(Machine Learning: A Probabilistic Perspective )——Kevin Murphy該書評價很高,但我沒有親自閱讀它,因此沒有放在列表中。
總結
除了「花書」以外,我不會推薦從頭到尾的閱讀。我偏愛於按照主題閱讀書籍,即將其作為參考書,當需要清楚哪部分內容時閱讀相應的內容。通過閱讀以上這些書籍使我覺得自己很謙卑,知道的很少,而機器學習和數據科學領域是多麼的廣闊。
書籍是永恆的,也是不會拋棄自己的朋友,一直在那裡等著你去相遇、相識。Vladimir Vapnik現在已經81歲高齡,Duda這本書首次出版與1973年,我估計50年後,這個行業的從業者仍將閱讀它們,就像經受住時間考驗的老朋友一樣。這展示了基於數學方法的壽命,永不褪色和凋零!數十款阿里雲產品限時折扣中,趕緊點擊領劵開始雲上實踐吧!
以上為譯文,由阿里云云棲社區組織翻譯。
譯文鏈接
文章原標題《7 Books to Grasp Mathematical Foundations of Data Science and Machine Learning》譯者:海棠,審校:Uncle_LLD。
文章為簡譯,更為詳細的內容,請查看原文。更多技術乾貨敬請關注云棲社區知乎機構號:阿里云云棲社區 - 知乎
推薦閱讀:
※包含min函數的棧
※阿里集團搜索和推薦關於效率&穩定性的思考和實踐
※哇!講個"爬坡"演算法
※矩陣中的路徑
※最萌編程高手是這樣煉成的