轉行數據科學路上看過的一些書總結推薦
前言
這些書的看書周期大概有一年半吧
一年半前決定轉行數據科學
之前寫過一篇:
回顧與展望轉行數據科學路上的點點滴滴(2016-2018)
深知轉行學習的痛苦,入門踩過很多坑,所以寫了Python入門連載,還錄製了免費視頻,有興趣學習的朋友可以看看哈:
https://edu.hellobi.com/course/234
當然轉行不能只是說說而已,還是要下功夫的,於是買了很多書,也被送了很多書,下面談談我這一年半看過的相關的書:
SQL
SQL學習指南
個人推薦指數:
SQL是學數據分析挖掘必須會的,這本書因為之前買的,就看的這個,個人感覺,初學者會在多表連接和查詢那裡糾結很久,當然,我SQL學的並不是很好,還需多多加強,可惜的一點是,這本書的數據好像並沒有提供,所以我沒辦法實操一下。
Python
Python基礎教程
個人推薦指數:
書的內容是用Python2寫的,不太適合初學者學習,因為Python2不久將不在維護,還是學Python3好,在京東等商城銷量很高,但是不建議作為入門書籍,因為第六章就開始寫到參數魔法,新手會很難理解,入門書應當是生動有趣易理解的,這也是我寫Python從零開始入門連載的原因之一。
像計算機科學家一樣思考Python
個人推薦指數:
這本書銷量很高,看的時候印象最深的就是遞歸的思想,如果你已經看過我的Python入門基礎課,可以不看這本,這本書相對多出來的知識點問我在Python進階文章前幾篇已經寫出來了。這本書不適合作為入門書,原因是每個點講的不全面。
Head First Python
個人推薦指數:
這本書是我最開始接觸Python看的幾本書之一,書中大量插畫,使用Python解決一些實際問題,初學者可以不按照本書內容敲代碼,看懂即可,因為本書代碼量太大,可能讓初學者從入門到放棄。
Python程序設計基礎
個人推薦指數:
這本書推薦給喜歡應試教育的朋友,作為入門書也是很合適的,基於Python3寫的,再說Python已經加入全國計算機二級考試,這本書作為教材也是很OK的。
流暢的Python
個人推薦指數:
這本書是奉獻給那些想將Python寫的更優雅的朋友,深度剖析Python的深層內容,細細品讀,每章都有極大收穫,當然,書很厚,我還沒看完。
網路爬蟲
精通Python網路爬蟲
個人推薦指數:
我學網路爬蟲是看的韋瑋老師視頻,通俗易懂,很棒!之後韋瑋老師這本書出版之後,就看了一遍,書中對網路爬蟲原理,urllib庫,正則表達式,scrapy講得比較透徹,推薦大家額外看看BeautifulSoup,xpath等給力解析庫,本書使用Fiddler抓包分析,但我更推薦谷歌瀏覽器的開發者模式。
數據分析
深入淺出數據分析
個人推薦指數:
這本書適合作為學數據分析的入門書,書中大量插圖,生動形象,深入淺出,每章都是為了解決特定問題而反覆思考迭代。
機器學習
白話大數據與機器學習
個人推薦指數:
推薦這本書入門機器學習,不要糾結書中的代碼,看每種機器學習的舉例介紹,通俗易懂,書中很多漫畫插圖,演算法原理推導基本不深,特別是隱馬爾可夫部分講的很棒,作為入門機器學習的書非常棒!
機器學習
個人推薦指數:
周志華老師的機器學習,應當算是國內機器學習書籍銷量最高了吧,除去國外書籍,這是你學機器學習必看的經典書籍(因為我所了解的國外有好幾本經典的機器學習書籍)。這本書從西瓜數據開始,到西瓜數據結束,每個演算法點到即止(不代表深度不夠,這裡指的是篇幅上不廢話)。對我幫助最大的是本書第二章的模型評估選擇,講的非常成體系。當然,書上的理論推導很難,有興趣可以看看一些學習筆記。
機器學習基礎教程
個人推薦指數:
這本書是理論書,從線性回歸開始,將最小二乘法和極大似然法實現全都詳細推導一遍,酣暢淋漓,之後的貝葉斯方法和貝葉斯推理,理論性太強,看的讓人想撕書,不過通俗易懂,再之後的分類聚類降維寫的沒什麼特色。數學好的同學可以挑戰看看。
集體智慧編程
個人推薦指數:
這本書Python代碼是2版本,書比較老(經典)了,這本書我看了一部分就放棄了,原因是書中的數據提供的網站很多都失效了,不過這本書的思想還是不錯的,以後還會回來看看的。
機器學習實戰
個人推薦指數:
這本書非常給力,基本不用sklearn等別人造好的輪子,基本都是自己定義函數實現功能,對你從底層了解機器學習代碼實現非常有幫助,注釋不夠多,你可能不明白某段代碼的含義,你可以使用print函數輸出看看,然後加以理解,遇到沒見過的方法,可以百度它的作用,因為書比較老,所以有些方法已經改動過或者不用,你百度最新替代的方法試試。
Python機器學習及實踐
個人推薦指數:
整本書180頁,不到兩天就能擼完,書中提供的代碼是Python2,自己稍作修改改成3運行一遍,有Python基礎就跳過第一章,第二章將常見機器學習演算法的實現,主要有用的是sklearn,通過看完這章,你就知道了用sklearn做機器學習的步驟:導入數據,數據預處理,訓練數據訓練模型,測試數據預測,模型性能評估。第三章是本書兩點,講到了特徵提升、模型正則化、模型檢驗、超參數搜索優化。本書在模型的欠擬合和過擬合部分闡述的很好,之後講到了一些流行的庫,包括NLTK、Word2Vec、XGBoost、Tensorflow,涉及自然語言處理,深度學習。全本書原理一筆帶過,最後一章講到鼓勵參加Kaggle比賽,並拿出了三個案例講解。本書適合學完sklearn基礎的朋友想用sklearn實現完整機器學習項目,缺點是書中模型基本使用的都是默認參數。
統計學習方法
個人推薦指數:
想學數據挖掘或者機器學習不可避免要接觸數學相關理論,儘管你可以只用sklearn等做機器學習,但不懂底層理論,是無法做深入的,而這本書,就是給你打好機器學習基礎的書,先修內容大學數學三件套(高等數學、線性代數、概率論與數理統計),如果你不是數學基礎特別好,看這本書的時候會像我一樣看不懂一些公式推導,莫慌,百度一下別人的學習筆記或者技術博客,慢慢鑽研,本書適合看多次,每次都有新的收穫,書本身不厚,230頁,建議邊看邊將感悟推導公司等寫在旁邊,方便下次看。
數據挖掘
數據挖掘導論
個人推薦指數:
說是導論,大家不要以為他很簡單就能看懂,還是有難度的,第一章簡介,第二章詳談了數據這一概念,你會接觸很多沒聽過的專業術語,分類演算法講的不多,SVM中對核函數的引入講解的特別傳神,本書花了大量筆墨在關聯分析和聚類分析,這兩處挖得很深,本書最後講到異常檢測,書中全是理論,沒講代碼實現。
數據結構演算法
大話數據結構
個人推薦指數:
如果你還是在校學生,並且想通過校招找一份數據分析挖掘或者機器學習崗位,那必然會面對數據結構演算法問題,如果你和我一樣非科班出身,剛接觸數據結構演算法一定會很懵逼,那我推薦你這本書,書中大量插畫,幫助理解,上課式情景教學,非常棒,幫你打開數據結構演算法大門,讓你破門而入!
總結
除了看這些書之外,我之前報名了2017年天善的 SVIP,這次又來學習天善的2018 SVIP 課程,因為看書難免有枯燥時候,有個老師指路是非常好的~
看視頻過程中,能快速掌握核心的技術,至於想拓展,可以翻翻工具書或者看官方文檔
學無止境,不斷看書總結提升非常有必要,還有很多書等著我看,以後繼續給大家分享~
買書如山倒,讀書如抽絲,別只有三分鐘熱度,學習是一件持久戰,哦不,是持久快樂的過程
買書可以經常去京東、噹噹看看,好像是年中大促會有5折之類優惠哦,平時也經常有優惠(我要去領盒飯了)
學習使我快樂!
作者:王大偉 Python愛好者社區唯一小編,請勿轉載,謝謝。
博客專欄:王大偉-一個數據分析菜鳥配套視頻教程:1小時破冰入門Python https://edu.hellobi.com/course/234公眾號:Python愛好者社區(微信ID:python_shequ),關注,查看更多連載內容。
推薦閱讀:
※使用Python讀取AutoCAD DXF文檔
※學會python對你的生活產生什麼樣的改變?
※一文掌握 Python 異常處理的所有知識點
※用python多進程,fork()之後創建了新進程,原來上下文裡面的局部變數也會再創建值完全一樣的么?
※在學python基礎的時候遇到一個怎麼都解決不了的問題(關於int),求助?
TAG:Python | Python編程書籍 | 機器學習 |