自學數據分析需要看哪些書(從初級到高級)的?


從入門到精通:互聯網數據分析的書籍清單!

任何一個技能的學習,都有從淺到深的過程,數據分析也不例外。因此我把推薦書籍劃分成幾個段位,更便於大家挑選。

在列書單之前,先介紹一本:我們一直在做互聯網行業數據分析知識的普及,目前我們已經做了 15 期「GrowingIO 數據分析公開課」,面向產品經理、運營等等,這裡是我們整理出來的「互聯網增長的第一本數據分析手冊」:

這是一本神奇的書。

產品經理用它來分析數據、拆解指標,實現流程的良性運轉;

市場運營用它來解析數據、確定方法,實現運營效果最大化。

30%註冊率的提升,90%的客戶留存,矽谷數據之神手把手教你實踐增長黑客。

翔實的分析方法,真實案例與心得,GrowingIO 團隊的創業實戰分享都在這裡了!

嚴格意義上這不算是一本書,但是能夠手把手教你如何做數據分析。

獲取完整書籍下載,點擊 互聯網增長的第一本數據分析手冊 。

下面是數據分析從入門到精通書籍推薦:

Part 1 | 入門版

適合對數據分析的入門者,對數據分析沒有整體概念的人,常見於應屆畢業生,經驗尚淺的轉行者。

深入淺出數據分析 (豆瓣):HeadFirst 類的書籍,一向淺顯易懂形象生動,可以對分析概念有個全面的認知。

誰說菜鳥不會數據分析 (豆瓣):不僅講解了一些常見的分析技巧,並附帶 Excel 的一些知識以及數據分析在公司中所處的位置,對職場了解亦有一定幫助。

赤裸裸的統計學 (豆瓣):作者年輕時是個追求學習意義的學霸,後來自己從統計學中發掘了很多可以應用到生活的地方。這也是本書的主旨,結合生活講解統計知識,生動有趣。可以避免統計學一上來就大講貝葉斯概率和隨機分析的枯燥。

同樣類似的書籍還有「統計數字會撒謊 (豆瓣)」,這本書知名度要高點,不過我還沒看…

Part 2 | 進階版

具有一定的行業針對性,要求具備一定的分析常識,適合網站分析師,商業分析師以及數據產品經理。

精通 Web Analytics 2.0 (豆瓣):此書雖老,但其中很多思想和流量分析的案例仍然很有借鑒意義,現在紙質書只能上淘寶買舊書了。

與此類似的有「網站分析實戰 (豆瓣)」,是國內一本講網站分析的書,沒有上面經典,但勝在新出,很多案例和理念都有及時的更新。

深入淺出統計學 (豆瓣):Headfirst 類書籍,可以幫助你快速了解統計方面的知識。

數據化管理:洞悉零售及電子商務運營 (豆瓣):黃成明著,講解在企業中應用數據的例子,讀完受益匪淺,裡面舉的很多例子都很接地氣。雖說偏向於零售業管理,但大道歸一,可適用於很多行業,當時依據裡面的理念規划了美團外賣面向 BD 的數據產品。

MySQL 必知必會 (豆瓣):這本也是我當年學習 SQL 的入門書,薄冊子一本,看起來很快。SQL 是個性價比很高的技能,簡單而強大。任何想進一步提高自己數據分析技能的產品/運營/分析師 同學,都建議點亮 這個技能點。

互聯網增長的第一本數據分析手冊:我司 GrowingIO 出的一本數據分析的增長手冊(封面和目錄見下圖),為大家提供常見的分析手段講解,如漏斗分析,同期群分析等等。可點擊書籍名字在 GrowingIO 技術論壇中免費下載。

Part 3 | 高階版

更高階的數據相對來說專業性較強了,如涉及到企業內部數據治理,數據結合的業務分析,數據可視化等。當然,還有數據挖掘演算法之類的更深入的東西,這塊沒有研究就不瞎推薦了。

決戰大數據 (豆瓣):阿里巴巴前數據副總裁車品覺老師所著,講解了阿里巴巴在企業內部治理數據過程中的心得,所講「存-通-用」數據管理三板斧和「從數據化運營到運營數據」,字字珠璣,可堪借鑒。

精益數據分析 (豆瓣):此書優勢在於將企業分成了幾個大的行業類別,並分門別類的講解了每個行業的商業模式特點及分析技巧,對使用者的分析能力要求較高,且必須具備相應的業務知識。

The Wall Street Journal Guide to Information Graphics (豆瓣),華爾街日報負責商業分析的人做的可視化指南,精華且實用,我之前在公眾號上寫過讀書筆記「華爾街日報是這樣做數據可視化的(1)」,可供大家參考。

《數據倉庫經典教程》:網上有人整理出來的資料,優點是簡單明了,不像正常的數據倉庫教材厚厚一本。

Part 4 | 推薦關注

在知乎上有不少數據分析及 Growth 的大牛,在這裡推薦幾位我熟悉的,經常會寫一些相關的文章:

覃超,前 Facebook 早期工程師,關於增長黑客寫了許多優秀的文章;

鄒昕,Facebook 用戶增長數據分析,在數據分析方面很有見解;

范冰,「增長黑客」一書作者,人非常有趣,同時也非常推薦「增長黑客」這本書;

曾加,螞蟻金服 BI-數據分析,數學方面的牛人;

何明科,專註於數據和互聯網產品,許多回答很值得細看。

本文作者陳新濤,GrowingIO - 矽谷新一代數據分析產品 產品經理。


整體來講,數據分析的學習可以分為三大塊內容:

1.分析工具(技能)

初級的:EXCEL,SPSS等

深入的:SAS,R,MATLAB(公司少用),python(偏開發)等任選一種即可

分析工具的學習,可以買本經典的教材,如《EXCEL入門大全》、spss(百度下張文彤)、《R in action》也不錯,主要是多實踐案例。

另外,簡單取數能力還是要具備的,熟練SQL,網站看看SQL基本語法就行,主要熟悉資料庫和表。

工具是一個基本的前提,紮實的應用能達到快速解決問題的效果。

2.商業知識(業務)

這個是你想從事行業的商業知識(包括基礎理論知識、工作中學習的業務知識),例如想進入金融行業,那麼你一定要對金融的基礎知識較為熟悉,對基本的經濟學知識熟悉。大學教材,外國經典著作都可以看看。

業務決定數據分析的深度,這個是灰常重要的,越深入數據分析這行,越會發現其重要性。

3.思維方式(邏輯)

沒有一個好的邏輯,想必做事一定做不明白,特別是在溝通過程中,浪費的時間很多,思考的方式、表達的方式、呈現的方式都跟你的邏輯有關,《金字塔原理》是一本不錯的書,也可以百度一下麥肯錫的相關書籍

良好的思維邏輯:想清楚,說明白,做對事

整體而言,數據分析工作對綜合能力要求是較高的,想做好這份工作不是一時半會的事,需要耐心,多思考,多實踐,多總結。


熱誠推薦看過的幾本經典。

一、數據分析入門:

  • 《Head First Data Analysis》鏈接:深入淺出數據分析 (豆瓣)

電子工業出版社的經典書目系列,從數據分析基本步驟開始、實驗方法、最優化方法、假設檢驗方法、貝葉斯統計方法、主觀概率法、啟發法、直方圖法、回歸法、誤差處理、相關資料庫、數據整理技巧一一講到。圖比較多,適合入門。

  • 《Head First Statistics》鏈接:深入淺出統計學 (豆瓣)

推薦理由同上,適合入門者的經典教材。

  • 《R in Action-Data Analysis and Graphics with R》鏈接:R語言實戰 (豆瓣)

R是屬於GNU系統的一個自由、免費、源代碼開放的軟體,用於統計計算和統計製圖。這本書從實用的統計研究角度逐例分析R在數據處理、模型構建、以及圖形操作上的由淺入深的結合,堪稱經典。

  • 《數據之魅-基於開源工具的數據分析》鏈接:數據之魅 (豆瓣)

作者是華盛頓大學理論物理學博士。這本書是數據分析的經典之一,包含大量的R語言模擬過程及結果展示,例舉了很多數據分析實例和代碼。

  • 《數據挖掘-市場營銷、銷售與客戶關係管理領域應用》鏈接:數據挖掘技術 (豆瓣)

作者是Data Miners的創辦人,有二十多年的營銷和客戶關係管理結合數據挖掘的經驗。詳細介紹了作為一個數據挖掘團隊需要的知識體系,包括資料庫、SAS使用、統計學、機器學習、數據可視化、如何訪問用戶收集需求、如何寫論文與溝通等等。有條件的建議看英文原版。

  • 《Data Analytics for Beginners: Basic Guide to Master Data Analytics》

入門五星推薦。裡面很多圖表實例,手把手教你如何EXCEL畫圖,對各種知識點(平均值,模式,中值,方差,標準偏差)的講解相當的到位,比起大學裡的各種課本靠譜。

先把這些花時間啃啃,數據分析的理論部分就基本入門了,根據實際情況還需要結合你的業務需求來進行系統的學習。

二、數據分析進階:

  • Doing Data Scienc

作者Cathy O』Neil是哈佛大學的博士,MIT的數據博士後,曾今作為一名Quant在對沖基金D.E. Shaw 工作,目前是一家紐約初創公司的Data scientist 。這本書需要有一定的編程和理論基礎,作為入門教材來說有點難,雖然只有400來頁,但是涉及的知識點很全面。每一章節的核心內容都附有編程案例,R/Python/Shell三種語言任君挑選。

  • Python for Data Analysis

Python數據分析必看,適合入行不久的數據分析師。作者有多年的Python數據分析工作經驗,對各種Pyhon包iPython,NumPy,pandas,matpotlib等有著很深的理解。看完這本,敲完代碼,Python數據分析就算入行了。

  • Data Science for Business

很多牛人為之作序,數據科學如何與商業結合,相信這本書會給你一些啟發。

  • Python Data Science Handbook

2016年6月出版的,500頁保質保量,作者(Jake VanderPlas)是華盛頓大學電子科學研究所的高級數據科學研究員,研究領域包括天文統計學、機器學習和可擴展計算。書的前半部分介紹了用於數據分析和一般的科學計算的基本Python庫,後面從實際應用的角度使用Python庫scikit-learn開始機器學習實踐。適合有一定Python基礎人(或者R基礎),並且想學習如何使用Python進行數據分析的人。

  • Storytelling with Data

作者Cole NussbaumerKnaflic,私募分析師,前Google人力分析團隊總監。本書展示了如何高效率展示量化資訊,如何用豐富的資料講故事。Google內部的數據可視化課程講師,之前也在Maryland Institute College of Art兼職講師。如果你想知道如何以圖敘事,這邊好書不容錯過。

OK,這幾本夠看一陣了,有時間再更新。

歡迎關注我存儲知識的地方:預見未來——Han Hsiao的知乎專欄Foresee


我寫過一個帖子,詳細的描述了零基礎的同學,如何從初級學到高級的過程,推薦了好幾本經典的書籍,答主可以前去查看。

傳送門:做數據分析不得不看的書有哪些? - 卡牌大師的回答


統計學習三大巨匠Trevor Hastie, Robert Tibshirani和Friedman《the elements of statistical learning》和Trevor Hastie, Robert Tibshirani的13年的新書《An Introduction to Statistical Learning: with Application in R》是大家推薦得非常多的了,我覺得可以簡單補充一些信息:

對於看英文書覺得有理解困難的同學來說,《the elements of statistical learning》寫得其實內容非常廣泛,很多東西都是融合了作者深厚的統計學習理論功底,一般很難啃透,研究生階段的其實能完全理解這本的不多,我會認為這本是博士階段的人會受益更多,但是這本書在機器學習或者說數據挖掘這個領域,具有無可替代的地位,大概就是這個領域的定海神針一樣的地位吧;書偏統計,不太適合計算機的同學;

中文版是清華大學出版社的《統計學習基礎》,這個嘛,不推薦,翻譯得不好,很多術語和表述都不夠"統計",但是我認為能翻譯巨作的,都是有貢獻的。

《An Introduction to Statistical Learning: with Application in R》這本呢,其實跟《the elements of statistical learning》的大部分內容是相同的,但是這本書的特點是起點更低,弱化了數學推導的細節,更加註重方法的應用,更加適合研究生階段的、學計算機的和從業者;屬於翻完就能上手的那種;

【入門級好書:數量不多,絕對精品】

《An Introduction to Statistical Learning: with Application in R》的中文版是機械工業出版社的《統計學習導論:基於R的應用》,15年6月份出來的新書,譯者和原書作者都是在同一個領域搞研究的,可以說是同宗同源啦,水平也是相當高的;以前找我推薦書的,都被安利了這本;甚至還有書還沒上市就被我安利的人...

也有回答提到了吳喜之老師的《從數據到結論》,其實我會更加推薦吳喜之老師的另外一本《統計學:從概念到數據分析》,這本書搜索成本比《從數據到結論》要稍微高一點,吳老師一慣的風格,書特別薄,三言兩語點透方法的精髓;而且也都有R代碼;


崗回答了一個類似的了,再回答一遍吧~~

《精益數據分析》強烈推薦之~~

這主要是針對創業者還有一些企業投資人的一本書,裡面的內容很專業,同時作者用一切企業家真實生動的案例,加上專業的數據分析的方法相結合,步步深入,可以說通俗易懂,科學小白和數據盲都可以看的明白,我看的時候感覺收穫還蠻多。

就是這個精益數據分析-【加】阿利斯泰爾·克羅爾;本傑明·尤科維奇


準備好你的決心和智商。 如果只是想掙點錢,可以先看看其他的。

如果你堅持下來了,你會發現錢只是附帶收穫。


要學會講故事,學會吹牛和看書一樣重要!


推薦閱讀:

如何快速成為大數據開發實戰專家?
Python numpy,scipy,pandas這些庫的區別是什麼?
如何高效地使用RStudio?
考慮從事 SAS 程序員工作,有哪些需要注意的點?
想學習數據分析,有哪些書籍或資料參考學習?

TAG:書籍 | 數據分析 | 學習資料 |