數據分析,從入門到摔門

Hello World!我是有毒的聶大哥~

今天我來散播一發數據分析毒教程~

聽說很多人想走數據分析這條路......

我勸你,還是直接從入門到放棄吧......

作為一名半桶水的商業分析在讀研究僧,今天給大家列一下,數據分析這條路上的妖魔鬼怪們~

乖乖們,聽大哥一句勸:

1. 統計

統計需要掌握的姿勢:

  • Descriptive Statistics
  • Probability Concepts and Probability Distributions
  • Sampling Distributions and the Central Limit Theorem
  • Confidence Intervals
  • Hypothesis Testing
  • Analysis of Variance
  • Chi Square and Nonparametric Tests
  • Simple and Multiple Regression

想躲過統計???

入門課收好,Coursera上阿姆斯特丹大學的Basic Statistics,卡通配圖教學,和萌萌噠的你最配!!

  • University of Amsterdam:Basic Statistics | Coursera (旁聽免費)

喏,還有一本簡潔易懂的step by step英文教材,也是我們課上用的教材~

  • Basic Business Statistics by Mark L.Berenson & Others

2. SQL

常用語句來來回回就那麼幾個,但是要熟,要熟,要熟!

簡歷上有SQL技能,很重要!!!很重要!!!

常用語句總結:SQL Quick Reference From W3Schools

再送你一門超好,超好,超好的MySQL課!Coursera!杜克大學!我太喜歡教課的那個溫柔美麗的大姐姐了~

  • Managing Big Data with MySQL | Coursera (旁聽免費)

3. R

R和Python誰才是數據分析一哥,江湖上已經爭論很多年了,至今沒有定論...... 事實大概是Python的主要功能是編程,除了單純的數據分析,在很多領域還有廣泛利用,所以就業市場上對Python的需求是遠大於R。

R主要側重統計功能,在統計方面顯示出了很多的優勢,用R做單純的數據分析還是妥妥的穩穩的。但是往數據科學方向走的話,R就有點頂不住了,輪到Python揚眉吐氣了......

這兩門語言我都渣,只能說個大概,大家還需要自己去摸索這兩門語言的美~

我學R上的課是Coursera上Johns Hopkins University的經典R課程和在Data Application Lab實習的時候上的商業分析師培訓課。Coursera的那門課我上得不太走心,默默吐槽一下課程莫名散發著濃濃的時代感,老師有點面無表情,比較打擊我的學習激情...... 好吧,我知道我作......

後來實習的時候上公司的培訓課,教R的是個講話乾脆利落的小姐姐,才讓我重新喜歡上R......

  • R Programming | Coursera (旁聽免費)
  • 商業分析師 - Data Application Lab

作為一名主觀上比較站Python的小粉絲,我目前學過的R就這麼多啦!!大體了解了R的語言思維,碰到不會的問題再Google找代碼就差不多了~

另外,我在Udemy上找到一門R的課,看課程設置覺得還是挺不錯的,想學R的可以試試~ 關於Udemy上課程的價格補充一句,原價是嚇人的,常年打折,但是打折力度經常變來變去的,最便宜的時候一般是10-20塊的價格可以買到好課...... 下面這門50刀的課我覺得可能會打到更低~

  • R Programming A-Z?: R For Data Science With Real Exercises!

4. Python

Python 是一門可以讓人渾然忘我的語言......

這輩子學過韓語、日語、英語,和一丟丟R,但Python是我學得最有激情的......

學Python的時候正值跟親愛的先生異國半年,Python的存在大大緩解了我對老公的思念!!!

最沉浸的那段時間裡,不管幾點回家,晚上睡覺前一定要看一點Python爬蟲才能安心睡下,晚上做夢也是爬蟲代碼......

我最開始接觸Python的時候上的課是Coursera上University of Michigan的經典系列:Python for Everybody,裡面包含五門專項課,除了最後一門Capstone,其他四門都刷過(沒寫作業)。

這門課非常實在,內容非常贊,上課的是個親切的老爺爺,學下來有助於你系統了解Python的功能~ 個人感覺 Using Python to Access Web 對於純小白來說可能有點難度~

提醒一下,如果你搜Python for Everybody,會發現...... 要交錢上啊!!!省錢小tip就是在搜索欄里一門一門搜專項課,進入專項課的頁面就可以免費旁聽了...... 同理適用於Coursera很多其他的系列課程。

University of Michigan: Python for Everybody | Coursera

  • Programming for Everybody (Getting Started with Python) | Coursera
  • Python Data Structures | Coursera
  • Using Python to Access Web Data | Coursera
  • Using Databases with Python | Coursera
  • Capstone: Retrieving, Processing, and Visualizing Data with Python | Coursera

密西根大學還出了Python的數據科學進階課,包含了數據分析、畫圖和機器學習等內容:

  • University of Michigan: Applied Data Science with Python | Coursera

另外,我還追過大神 @秦路 的運營大濕兄知乎專欄,從「開始Python的新手教程」 到「用Python分析用戶消費行為」,一共六篇文章,超快速入門Python數據分析。

Udemy上也有一門很棒的Python數據分析課,我目前在上,覺得好棒棒~

教numpy、pandas、畫圖、帶著練三個數據小項目,至此覺得內容量已經很良心了,老師竟然還教機器學習!!!20個機器學習視頻,用SciKit Learn這個包!還有還有!11個統計視頻!還沒完還沒完!還有幾個SQL和Web Scraping的小視頻!滿滿的良心學習大禮包~

  • Learning Python for Data Analysis and Visualization

想必還有很多盆友們對爬蟲充滿了興趣......

學爬蟲當然要看崔慶才大神的系列教程啊!!!

文字版教程免費,使用的是Python 2.7版本↓

  • Python爬蟲學習系列教程 | 靜覓

視頻教程499軟妹幣,之前有過折扣,印象中270多~

  • Python3爬蟲視頻學習教程 | 靜覓

如果你只是比較隨意,不想玩那麼高深,或者你真的和我一樣窮,可以看看文字版教程,了解urlib庫、Requests庫、BeautifulSoup庫、Selenium庫以及正則表達式後,跟著崔大神的三個免費case練一遍~ 我覺得對於小白來說就差不多了~

  • Python3爬蟲三大案例實戰分享

對於數據分析師來說,會爬蟲不屬於必備技能,那麼學爬蟲的意義是什麼呢?大神 @董偉明 在他接近滿分的「爬蟲從入門到進階」的Live簡介中說得直戳心坎~

5. Tableau

終於,數據分析界的女神出場了!!!讓我們大聲喊出她的名字:T! A! B! L! E! A! U!

讀作「Tab-low」!!!

我身邊很多學Tableau的孩紙們,反應不是醬紫的,

就是醬紫的......

紛紛表示在這個看臉的時代,要好好學習女神軟體......

(Source: Best Practices for Designing Efficient Tableau Workbook)

憑藉著打娘胎起就異於常人的顏值,Tableau迅速躥紅,逐漸滲透進業界和美國高校。對於在美帝的數據分析師來說,Tableau也是簡歷上必備的技能之一。

我目前覺得學習Tableau的最好方式,還是去Coursera上上杜克大學的那門課,基本涵蓋入門到中高級操作,牆裂打call,牆裂推薦!!!真的好喜歡教課的杜克大姐姐......

  • Data Visualization and Communication with Tableau | Coursera

另外,Tableau為了推廣自家軟體,在免費培訓方面也是做得很拼......

  • Tableau Training & Tutorials (中英文都有)
  • Live Training Resources
  • Webinars

還有很多很棒的Tableau使用者的case展示~

  • Gallery

還有Moveover Monday Project,每周一po一個數據集和數據分析展示~

  • A weekly social data project

至於有些人說,下載都這麼貴,土豪才學得起吧...... 只要你乖乖去上Coursera杜克大姐姐的課,會有驚喜......

6. Excel

無論你多喜歡Excel或者多不喜歡Excel...... 作為數據分析師,簡歷上有Excel技能也是必備......

最重要的當然是會Pivot Tables~

我也是通過DAL的商業分析培訓課學的Pivot Tables,如果你只想學Pivot Tables,可以去Udemy上這門↓

  • Microsoft Excel - Data Analysis with Excel Pivot Tables

當然,還有一個免費的學習神器,YouTube啊~ 哈哈,Pivot Tables一搜一大把~

我真的非常熱愛YouTube,基本沒有YouTube不到的姿勢......

7. Forecasting

預測/時間序列也是我們數據分析僧要掌握的技能,不過學得比較淺顯,大概了解幾個預測模型的原理和會用軟體操作就行了。我們用過的教材是Business Forecasting,有中文版,不過我相信你不會想看的......

  • 商業預測 (豆瓣)

Udemy上依舊有葯!介紹Moving Average, Simple Exponential Smoothing, Double Exponential Smoothing / Holts, Winters / HoltWinters等模型以及在R和Tableau中的操作。

  • Data Science-Forecasting/Time series Using XLMiner,R&Tableau

如果你對Tableau女神是真愛!可以去上Udemy新課,目前評價4.7分,感覺還挺不錯的樣子,反正是安利到我了~

  • Forecasting and Time Series Analysis in Tableau

8. Data Mining and Machine Learning

想當年,剛接觸數據時,我還是個蠢萌的寶寶,在聽說「Machine Learning」這個東東的時候,內心是下面那樣的......

何方的妖魔鬼怪,尼瑪聽名字就不明覺厲......

入坑數據分析一年,但才剛接觸機器學習一個月(網課加這學期修的數據挖掘專業課),感覺難度明顯拔高了一級,但越學越刺激,越學越稀飯~

目前還是個渣渣,不敢瞎說,就大概羅列一下機器學習入門需要掌握的知識點和網上的學習資源吧:

  • Linear Regression
  • Logistic Regression
  • Decision Trees
  • k-Nearest Neighbors
  • Naive Bayes Classification
  • Discriminant Analysis
  • Neural Nets
  • Support Vector Machines
  • Cluster Analysis
  • Random Forest
  • Natural Language Processing

如果沒聽說過吳恩達男神的機器學習王牌課程,那你一定是假的數據猿......

  • Machine Learning | Coursera

說實話,沒上男神的Machine Learning前,我還挺不理解為什麼這個看上去其貌不揚的大叔,有這麼多死忠信眾...... 每次大叔的動向更新,都跟地震一樣...... 娶的老婆還是跟他智商一樣上天高的女神大牛!約翰霍普金斯的CS博士......

如果你和曾經的我一樣迷惑,請去Coursera上課...... 順帶必須提一句,男神還是Coursera的聯合創始人啊!!!我的前半生沒有Coursera,但是後半生必須要跟Coursera緊緊相依......

反正現在的我是痛哭流涕著入吳恩達教了......

之前我在Python部分介紹的Udemy的Python數據分析課中,也涉及一部分機器學習的內容:

  • Learning Python for Data Analysis and Visualization

內容設置很贊,也很系統的數據科學課程還有:

  • University of Michigan: Applied Data Science with Python | Coursera

以上就是我總結的一些數據分析經典姿勢~ 其實還有Decision Analysis(主要講概率)和Optimization,大家就自行去YouTube吧,視頻很多~

一年前的今天,我沒開始刷網課,不會SQL,不會R,不會Python,不會Tableau,不懂Forecasting,更不知道機器學習是什麼鬼...... 就修了兩門專業課,統計和Optimization(Excel Modeling),僅此而已......

按照這份教程一點點啃完,其實你也可以在家DIY出半個名校學生(如果不提名校的校友資源和networking機會等的話)~

大家可以再參考一下幾個美國出名的數據分析項目的課程設置:

  • University of Texas -Austin | MS in Business Analytics
  • USC | MS in Business Analytics
  • University of Chicago | MS in Analytics

最後再來個勵志的故事,我最新關注的一個YouTuber,Harrison Kinsley。小哥畢業於Sam Houston State University(懵逼臉),專業是Philosophy and Criminology(茫然臉),畢業後就開始創業,自學python編程,並在網上po免費python教程,還創立了一個python學習網站,YouTube上目前有27萬多粉絲。

如果你好奇小哥怎麼賺錢存活?小哥說,他一周就能接好幾個offer...... 你們沒聽過的公司一堆一堆的,全宇宙人民都聽過的大公司FacebookApple的offer他都有...... 另外他還做諮詢賺錢,生計完全不愁......

既然你都讀到這兒了,看來也是數據的真愛,那就趕緊和我一起學到昏厥吧!


推薦閱讀:

產品經理該看哪些數據?(入門篇)
R語言實戰(三)圖形初階
使用R語言對照片人物進行情緒分析
第四講:概率思維及應用

TAG:数据分析 | 大数据 | Python |