想學習數據分析,有哪些書籍或資料參考學習?

互聯網數據分析需要哪些工具?要掌握哪些基本知識?


之前做了300頁的PPT專門講過網站分析,外加前幾年做微博運營時積累的大量PPT以及工具、圖表,大概有好幾G(Ps,私信要PPT的同學不點個贊么,淚奔中……)。

入行互聯網的契機是做了一個「網站分析」的微博賬號,做自媒體跟真正的實踐者還是有很大距離的,所以推薦一個list的,如果你對網站分析有興趣,可以專註這些大牛!

知乎上面的數據分析大神: @何明科@鄒昕

網站分析領域的: @宋星@胡力 @joeghwu 《網站分析實戰》作者 @ 孫立東《網站分析基礎教程》作者之一 @王彥平(藍鯨)

一、如何入門互聯網數據分析

1、網站分析是一種能力

對於大部分人互聯網從業者而言,網站分析是一種能力,因為基於網站分析之上的結論可以指導運營、產品、設計、技術的同事的工作。

2、網站分析解決的問題

即分析出:

用戶是誰(目標用戶),

從哪裡來(流量從哪裡來,流量的價值等),

到哪裡去(為什麼離開,如何降低用戶流失)

3、對於產品OR運營,網站分析能做什麼

對於產品:

產品改版是否合理?

用戶的反饋如何?

哪些功能存在問題?

功能使用頻率?

轉化路徑是否靠譜?

對於運營:

用戶來源路徑?

用戶活躍度如何?

如何分配廣告預算

網站內容是否有效?

如何分解KPI?

4、為什麼進行網站分析

5、網站分析的核心

二、網站分析的流程

定義問題——測量——分析——改進——維持

三、定義問題

如何你已經知道如何有效的去描述一個問題,那麼你已經成功了一半了,因為你知道問題,而且也知道如何去問。

工作可不是試券設計好問題來問你,首先得你自己發現問題。

比如如註冊轉化率的降低就跟非常多的問題是正相關的。

產品支持度是否足夠?

頭像上傳

郵箱驗證

必填資料

營銷是否到位?

新老訪客比如何

外界口碑如何

問題的要素:本質、現象、特徵、量化

定義一個問題:即給整個團隊確認一個方向,圍繞著這個目標往下分解,制定計劃,在計划具體執行的過程中發現了某個問題,再來具體分析的。

所以作為一個網站分析師,立足點應該是從公司 戰略出發, 了解產品,運營,技術,商業邏輯等等層面的知識,給公司的發展提供大量的建議。

商業產品運營設計,的推薦書單:

《財富》雜誌推薦的75本商業必讀書

豆瓣豆列的推薦人數達 1316人,收藏人數達 6291。目前我讀看過的不到十分之一,但是確實有助於從事網站分析的同事提升商業格局。

互聯網產品經理 全方位入門

@蘇傑 老師整理的互聯網產品經理全方位入門書籍。豆瓣豆列的推薦人數達986人,收藏人數達 7774。慚愧,只看過豆列裡面20%的書。

噹噹,僅僅通過讀書是無法培養行業格局的,還需要善於向人請教、善用網路資源、自己體驗、實踐等等。

強烈推薦大家關注 @鄒昕 Facebook的數據科學家,以及他的專欄文章

求職互聯網數據分析,如何準備行業知識? - 鄒昕的文章 - 知乎專欄

四、測量

收集數據。

目前常用的數據流量監測的工作:

工具名稱
說明
流量監測類

Google
Analytics
Google 網站分析工具
Omniture
Omniture SiteCatalyst
webtrends
webtrends
sitemeter
Real time web analytics
Clicky
Real time web analytics
Crazyegg
Heatmap features
Woopra
Real time web analytics
Piwik
Open source
Chartbeat
Real time web analytics
ClickTracks Pro
Custom ROI Analysis
GoingUp!
Web Analytics SEO
One SWeb
analyticstat
Web analytics
Mixpanel
Real-time Funnel analytics
CNZZ
CNZZ數據專家
我要啦
網路流量統計
51yes
網路流量統計
百度統計
百度統計工具
騰訊分析
主要針對論壇
99Click
99Click統計
JYC統計
JYC統計
聚合分析
與shopex結合的電商流量監控工具
孔明統計
孔明數據分析

比如教育行業的數據,可以從一些行業數據收集的網站中找到

另外,作為不會寫程序的產品OR運營,只能通過第三方的工具或者平台來拿到數據了,或者向技術同學提需求。

感覺數據的方式太小兒科了,強烈推薦大家關注 @何明科

並且可以在以下問題當中去膜拜一下。

有哪些網站用爬蟲爬取能得到很有價值的數據? - 何明科的回答

做投行、行研、諮詢等金融崗位,有沒有什麼好用的找數據技巧呢? - 何明科的回答

技術才是第一生產力。如果會一些 SQL或者Python,獲取的數據太要太精彩哇……

推薦書籍:

做數據分析不得不看的書有哪些? - 知乎用戶的回答

這個問答下面推薦的書,基本都是關於數據挖掘或者獲取的。

五、分析、改進、維持

比如某遊戲的玩家行業軌跡是這樣的

於是分析的時候決定重點關注新用戶的流失問題

流失的任務類型分析:

操作複雜

任務不平滑、不流暢

升級緩慢

有組隊任務或者其他互動任務

案例選自,@陳嘉慶 在幾年前的分享,侵刪。

然後就是不斷的循環優化著。分析出問題,確認用戶的需求,改進產品,進一步統計並維持提升結果。

分析的流程方法大概如此,比較好掌握,但是具體到工作當中,遠非這幾句話能解釋當的,所以慢慢實踐成長吧。

推薦的書:

1、精準數據分析

2.轉化:提升網站流量和轉化率的技巧

3.數據分析 :企業的賢內助

4.網站數據分析:數據驅動的網站管理.優化和運營

5.人人都是網站分析師:從分析師的視角理解網站和解讀數據

6、圖解網站分析

網站優化研究工具:

群英網站監測
24小時免費監控網站是否正常運行
百度站長工具
網站問題初步診斷
谷歌站長工具
網站問題初步診斷
Google
AdWords Keyword Tool
Google AdWords關鍵詞工具
Microsoft
adCenter Labs
Microsoft Keyword Research
4Q
4Q用戶調研工具
limesurvey
用戶調研工具(需下載客戶端,問卷設計收集一體)
usertesting
網站可用性測試——號稱1小時發現你的網站問題
surveymonkey
用戶調研
surveygizmo
用戶調研
Question Pro
用戶調研
User Voice
用戶調研
問卷星
中文在線問卷調查
問道網
中文在線問卷調查
Google Website
Optimizer
Google網站優化工具
Visual Website
Optimizer
A/B測試工具
Vertster
多變數測試工具
Split Test
Calculator
A/B測試計算器
Google Analytics API
谷歌分析數據調用
Data Feed Query
Explorer
Data Feed URI

競爭對手流量趨勢監測:

Alexa
alexa中國
WebSearch Ranking
海外網站排名
Compete.com
海外類alexa工具,但做的更多更細
Google Trends for Websites
谷歌站點流量趨勢
百度指數
關鍵詞趨勢查詢,熱門指數可參考百度風雲榜
Google Ad Planner
可查詢網站流量上下游的谷歌產品


在Blog分享過兩本數據分析方面書籍的思維導圖,可以做個參考:

圖有些大,最好用思維導圖軟體打開

1、誰說菜鳥不會數據分析

《誰說菜鳥不會數據分析》思維導圖(2)

《誰說菜鳥不會數據分析》思維導圖讀書筆記

2、《精通Web Analystics 2.0》思維導圖讀書筆記


從你的問題當中,我能看出你應該是數據分析初學者。

首先,我想問得一個問題是,你學習數據分析,想幹嘛,你的目的是什麼?因為不同的目的,其學習的內容和方式都會不大一樣。

其次,我根據自己的經驗給出一些參考。

工具:

1、SQL(你必須會資料庫查詢語言,主要是用來從資料庫當中提取數據,先把基礎的查詢語句學好,然後再在工作中,或者是一些習題來實踐)

2、數據分析工具(Excel中的函數和數據透視表功能,SPSSSASR等統計軟體,需要你熟悉其中的一種,根據你的語言水平來選,如果你沒有編程基礎,建議學SPSS,如果有語言基礎,建議學SAS或者R)

理論知識:

1、行業知識

2、業務知識

3、統計理論知識

具體的參考書籍,建議到這個網址里找吧,http://www.techxue.com/dh/

裡面會有你想要的東西。


數據分析這個崗位可以說很寬泛很雜,從數據錄入員到行業分析師科學家都可以認為是數據分析,甚至一些搞數據挖掘、人工智慧的都可以包括到數據分析的範疇里,但是這些工作所做的事情卻相差甚遠,當然待遇也天壤之別。所以大家在應聘時不要只看崗位名稱,重要的是看看清崗位職責和要求。言歸正傳,咱們談談如何學習數據分析。

1、學科知識:從數據分析涉及到的專業知識點上看,主要是這些:

(1)統計學:參數檢驗、非參檢驗、回歸分析等

(2)數學:線性代數、微積分等

(3)社會學:主要是一些社會學量化統計的知識,如問卷調查與統計分析;還有就是一些社會學的知識,這些對於從事營銷類的數據分析人員比較有幫助

(4)經濟金融:如果是從事這個行業的數據分析人員,經濟金融知識是必須的,這裡就不多說了

(5)計算機:從事數據分析工作的人必須了解你使用的數據是怎麼處理出來的,要了解資料庫的結構和基本原理,同時如果條件充足的話,你還能有足夠的能力從資料庫里提取你需要的數據(比如使用SQL進行查詢),這種提取數據分析原材料的能力是每個數據從業者必備的。此外,如果要想走的更遠,還要能掌握一些編程能力,從而借住一些專業的數據分析工具,幫助你完成工作。

……

好好學習,雖然累,但是要堅持!

2、軟體相關:從事數據分析方面的工作必備的工具是什麼

(1)數據分析報告類:Microsoft Office軟體、水晶易表等,如果連excel表格基本的處理操作都不會,連PPT報告都不會做,那我只好說離數據分析的崗位還差的很遠。現在的數據呈現不再單單只是表格的形式,而是更多需要以可視化圖表去展示你的數據結果,因為數據可視化軟體就不能少,BDP個人版、TABLUEA、Echart等這些必備的,就看你自己怎麼選了。

(2)專業數據分析軟體:Office並不是全部,要從在數據分析方面做的比較好,你必須會用(至少要了解)一些比較常用的專業數據分析軟體工具,比如SPSS、SAS、Matlab等等,這些軟體可以很好地幫助我們完成專業性的演算法或模型分析,還有高級的python、R等。

(3)資料庫:hive、hadoop、impala等資料庫相關的知識可以學習;

(3)輔助工具:比如思維導圖軟體(如MindManager、MindNode Pro等)也可以很好地幫助我們整理分析思路。

最重要的是:理論知識+軟體工具=數據分析基礎,最後要把這些數據分析基礎運用到實際的工作業務中,好好理解業務邏輯,真正用數據分析驅動網站運營、業務管理,真正發揮數據的價值。


我之前回答過一個帖子:做數據分析不得不看的書有哪些?

我詳細的列了一個從新手到高手晉級的書單,包括三種主流數據分析軟體的學習:SAS SPSS R

最後也推薦了三本網頁分析的數據。

在書單裡面,最重要的就是核心部分,關於統計學和數據挖掘理論知識的學習,這是最基礎的階段,是整個數據分析學習大廈的基石。

這個書單裡面大部分書籍都是英文版本的,至於為什麼是全英文的,我也在帖子里有一個簡單的解釋。

如果題主有興趣,不妨去看一看!


我們一直在做互聯網行業數據分析知識的普及,目前我們已經做了 14 期「GrowingIO 數據分析公開課」,面向產品經理、運營等等,這裡是我們整理出來的「互聯網增長的第一本數據分析手冊」:

這是一本神奇的書。

產品經理用它來分析數據、拆解指標,實現流程的良性運轉;

市場運營用它來解析數據、確定方法,實現運營效果最大化。

30%註冊率的提升,90%的客戶留存,矽谷數據之神手把手教你實踐增長黑客。

翔實的分析方法,真實案例與心得,GrowingIO 團隊的創業實戰分享都在這裡了!

嚴格意義上這不算是一本書,但是能夠手把手教你如何做數據分析。

獲取完整書籍下載,點擊 互聯網增長的第一本數據分析手冊 。


其實前面有回答提到過統計學習三大巨匠Trevor Hastie, Robert Tibshirani和Friedman《the elements of statistical learning》了,也提到了Trevor Hastie, Robert Tibshirani的13年的新書《An Introduction to Statistical Learning: with Application in R》,我覺得可以簡單補充一些信息,希望可以幫到大家:-)

對於看英文書覺得有理解困難的同學來說,《the elements of statistical learning》寫得其實內容非常廣泛,很多東西都是融合了作者深厚的統計學習理論功底,一般很難啃透,研究生階段的其實能完全理解這本的不多,我會認為這本是博士階段的人會受益更多,但是這本書在機器學習或者說數據挖掘這個領域,具有無可替代的地位,大概就是這個領域的定海神針一樣的地位吧;書偏統計,不太適合計算機的同學;

中文版是清華大學出版社的《統計學習基礎》,這個嘛,不推薦,翻譯得不好,很多術語和表述都不夠"統計",但是我認為能翻譯巨作的,都是有貢獻的。

《An Introduction to Statistical Learning: with Application in R》這本呢,其實跟《the elements of statistical learning》的大部分內容是相同的,但是這本書的特點是起點更低,弱化了數學推導的細節,更加註重方法的應用,更加適合研究生階段的、學計算機的和從業者;屬於翻完就能上手的那種;

《An Introduction to Statistical Learning: with Application in R》的中文版是機械工業出版社的《統計學習導論:基於R的應用》,15年6月份出來的新書,譯者和原書作者都是在同一個領域搞研究的,可以說是同宗同源啦,水平也是相當高的;以前找我推薦書的,都被安利了這本;甚至還有書還沒上市就被我安利的人...

也有回答提到了吳喜之老師的《從數據到結論》,其實我會更加推薦吳喜之老師的另外一本《統計學:從概念到數據分析》,這本書搜索成本比《從數據到結論》要稍微高一點,吳老師一慣的風格,書特別薄,三言兩語點透方法的精髓;而且也都有R代碼;


數據分析在運營工作中無處不在,無論是活動復盤、專題報告、項目優化,還是求職面試,數據分析都有一席之地。

對於數據分析,我發現很多運營都有這樣一些困惑:

不知道從哪裡獲取數據;

不知道用什麼樣的工具;

不清楚分析的方法論和框架;

大部分的數據分析流於形式;

……

其實,數據分析並沒有大家想像的那麼難!接觸了很多數據從業者,總結了這篇文章,希望對有志於學習數據分析的運營同學有所幫助。

一、概念:數據和數據分析

其實大家一直都在接觸數據和數據分析,但是對於兩者具體的定義又很難說清楚。我曾經做過一個調查,問一些運營同學,下面5個選項哪些屬於「數據」概念的範圍。

運營入門,從0到1搭建數據分析知識體系

大部分人都知道把「4.報表」選上,但是很難有人會認為上面5個選項都是。其實這反映了一個很普遍的現象:很多人都會先入為主,認為數據就是各種表格、各種數字,例如excel報表、各種資料庫。其實這是一個錯誤或者說有偏差的認識,它會使得我們對數據的認識變得很狹隘。

(一)什麼是數據

數據(data)是描述事物的符號記錄,是構成信息或者知識的原始材料。這種哲學層次的定義,讓數據的範圍極大豐富,也符合目前「大數據」發展的需要。試想一下,現在很多搜索引擎做的 「圖片識別」、「音頻識別」 難道不是數據分析的一部分嗎?

作為一名互聯網企業的運營從業者,我們接觸到的數據可能沒有那麼複雜,但是也有很多類別。

運營入門,從0到1搭建數據分析知識體系

從數據的來源來看,可以分為企業外部數據和內部數據。外部數據主要包括社會人口、宏觀經濟、新聞輿情和市場調研數據;內部數據包括用戶行為數據、服務端日誌數據、CRM與交易數據。不同數據的獲取途徑、分析方法、分析目的都不經相同,不同行業、不同企業在實際分析中也都各有偏好。

那麼我們常見的「信息」和「數據」有何不同?

數據是信息的載體和表現形式;信息是數據的內涵,信息載入於數據之上。以書本和知識為例,書本屬於數據概念範疇,知識屬於信息概念範疇;書本是知識的一種載體和表現形式,知識是書本的內涵和升華。

(二)什麼是數據分析

數據分析是指從數據中提取有用的信息,並指導實踐。

這裡有兩個點需要注意:首先,我們需要提取的是有用的信息,而不是自嗨;其次,這些信息需要用來指導實踐,而不是流於形式。

二、思路:方法論和方法

很多新人入門數據分析的時候,要麼鬍子眉毛一把抓,要麼無從下手。這都是缺少分析思路的表現,需要宏觀的方法論和微觀的方法來指導。

那麼方法論和方法有什麼區別?

方法論是從宏觀角度出發,從管理和業務的角度提出的分析框架,指導我們接下來具體分析的方向。方法是微觀的概念,是指我們在具體分析過程中使用的方法。

(一)方法論

數據分析的方法論很多,這裡我給大家介紹一些常見的框架。

PEST分析法:從政治(Politics)、經濟(Economy)、社會(Society)、技術(Technology)四個方面分析內外環境,適用於宏觀分析。

SWOT分析法:從優勢(Strength)、劣勢(Weakness)、機遇(Opportunity)、威脅(Threat)四個方面分析內外環境,適用於宏觀分析。

5W2H分析法:從Why、When、Where、What、Who、How、How much 7個常見的維度分析問題。

4P理論:經典營銷理論,認為產品(Product)、價格(Price)、渠道(Place)和促銷(Promote)是影響市場的重要因素。

AARRR:增長黑客的海盜法則,精益創業的重要框架,從獲取(Acquisition)、激活(Activition)、留存(Retention)、變現(Revenue)和推薦(Referral)5個環節增長增長。

數據分析的方法論很多,這裡不能一一列舉;沒有最好的方法論,只有最合適的。下面我詳細介紹一下 AARRR 方法論,對於精益化運營、業務增長的問題,這個方法論非常契合。

運營入門,從0到1搭建數據分析知識體系

對於互聯網產品而言,用戶具有明顯的生命周期特徵,我以一個O2O行業的APP為例闡述一下。

首先通過各種線上、線下的渠道獲取新用戶,下載安裝APP。安裝完APP後,通過運營手段激活用戶;比如說首單免費、代金券、紅包等方式。通過一系列的運營使部分用戶留存下來,並且給企業帶營收。在這個過程中,如果用戶覺得這個產品不錯,可能推薦給身邊的人;或者通過紅包等激勵手段鼓勵分享到朋友圈等等。

需要注意的是,這5個環節並不是完全按照上面順序來的;運營可以根據業務需要靈活應用。

AARRR的五個環節都可以通過數據指標來衡量與分析,從而實現精益化運營的目的;每個環節的提升都可以有效增長業務。我們下面的分析也是圍繞這個方法論展開的。

(二)方法

根據運營工作的實際需要,在參考了 GrowingIO 陳明的文章《一名優秀的數據分析師是怎樣煉成的》基礎上,我整理了7種分析方法。藉助常見的網站/APP數據分析產品,我們非常快速的完成這7種分析。

1.趨勢分析

趨勢分析是最簡單、最基礎,也是最常見的數據監測與數據分析方法。通常我們在數據分析產品中建立一張數據指標的線圖或者柱狀圖,然後持續觀察,重點關注異常值。

在這個過程中,我們要選定第一關鍵指標(OMTM,One Metric That Metter),而不要被虛榮指標(Vanity Metrics )所迷惑。

以社交類APP為例,如果我們將下載量作為第一關鍵指標,可能就會走偏;因為用戶下載APP並不代表他使用了你的產品。在這種情況下,建議將DAU(Daily Active Users,日活躍用戶)作為第一關鍵指標,而且是啟動並且執行了某個操作的用戶才能算上去;這樣的指標才有實際意義,運營人員要核心關注這類指標。

2.多維分解

多維分解是指從業務需求出發,將指標從多個維度進行拆分;這裡的維度包括但不限於瀏覽器、訪問來源、操作系統、廣告內容等等。

為什麼需要進行多維拆解?有時候一個非常籠統或者最終的指標你是看不出什麼問題來的,但是進行拆分之後,很多細節問題就會浮現出來。

舉個例子,某網站的跳出率是0.47、平均訪問深度是4.39、平均訪問時長是0.55分鐘。如果你要提升用戶的參與度,顯然這樣的數據會讓你無從下手;但是你對這些指標進行拆解之後就會發現很多思路。

下面展示的是一個產品在不同操作系統下的用戶參與度指標數據。

運營入門,從0到1搭建數據分析知識體系

仔細觀察的話,你會發現移動端平台(Android、Windows Phone、IOS)的用戶參與度極差,表現在跳出率極高、訪問深度和平均訪問時長很低。這樣的話你就會發現問題,是不是我們的產品在移動端上沒有做優化導致用戶體驗不好?在這樣一個移動互聯網時代,這是非常重要的一個問題。

3.用戶分群

用戶分群主要有兩種分法:維度和行為組合。第一種根據用戶的維度進行分群,比如從地區維度分,有北京、上海、廣州、杭州等地的用戶;從用戶登錄平台進行分群,有PC端、平板端和手機移動端用戶。第二種根據用戶行為組合進行分群,比如說每周在社區簽到3次的用戶與每周在社區簽到少於3次的用戶的區別,這個具體的我會在後面的留存分析中介紹。

4.用戶細查

正如前面所說的,用戶行為數據也是數據的一種,觀察用戶在你產品內的行為路徑是一種非常直觀的分析方法。在用戶分群的基礎上,一般抽取3-5個用戶進行細查,即可覆蓋分群用戶大部分行為規律。

我們以一個產品的註冊流程為例:

運營入門,從0到1搭建數據分析知識體系

用戶經歷了如下的操作流程:【訪問官網】-【點擊註冊】-【輸入號碼】-【獲取驗證碼】。本來是非常流暢的一個環節,但是卻發現一個用戶連續點擊了3次【獲取驗證碼】然後放棄提交。這就奇怪了,用戶為什麼會多次點擊驗證碼呢?

這個時候我建議您去親自體驗一下您的產品,走一遍註冊流程。你會發現,點擊【獲取驗證碼】後,經常遲遲收不到驗證碼;然後你又會不斷點擊【獲取驗證碼】,所以就出現了上面的情況。

絕大多數產品都或多或少存在一些反人類的設計或者BUG,通過用戶細查可以很好地發現產品中存在的問題並且及時解決。

5.漏斗分析

漏斗是用于衡量轉化效率的工具,因為從開始到結束的模型類似一個漏斗,因而得名。漏斗分析要注意的兩個要點:第一,不但要看總體的轉化率,還要關注轉化過程每一步的轉化率;第二,漏斗分析也需要進行多維度拆解,拆解之後可能會發現不同維度下的轉化率也有很大差異。

某企業的註冊流程採用郵箱方式,註冊轉化率一直很低,才27%;通過漏斗分析發現,主要流失在【提交驗證碼】的環節。

運營入門,從0到1搭建數據分析知識體系

經過了解發現,郵箱驗證非常容易出現註冊郵箱收不到郵件的情況,原因包括郵件代理商被屏蔽、郵件含有敏感字被歸入垃圾郵箱、郵件送達時間過長等等。既然這麼多不可控因素影響註冊轉化率,那就換一種驗證方式。換成簡訊驗證後,總體轉化率提升到了43%,這是非常大的一個增長。

6.留存分析

留存,顧名思義就是新用戶留下來持續使用產品的含義。衡量留存的常見指標有:次日留存率、7日留存率、30日留存率等等。我們可以從兩個方面去分析留存,一個是新用戶的留存率,另一個是產品功能的留存。

運營入門,從0到1搭建數據分析知識體系

第一個案例:以社區網站為例,「每周簽到3次」的用戶留存率明顯高於「每周簽到少於3次」的用戶。簽到這一功能在無形中提升了社區的用戶的粘性和留存率,這也是很多社群或者社區主推這個功能的原因。

運營入門,從0到1搭建數據分析知識體系

第二個案例:首次註冊微博,微博會向你推薦關注10個大V;首次註冊LinkedIn,LinkedIn會向你推薦5個同事;申請信用卡時,發卡方會說信用卡消費滿4筆即可抽取【無人機】大獎;很多社交產品規定,每周簽到5次,用戶可以獲得雙重積分或者虛擬貨幣。

在這裡面「關注10個大V」、「關注5個同事」、「消費4筆」、「簽到5次」就是我想說的Magic Number,這些數字都是通過長期的數據分析或者機器學習的方式發現的。實踐證明,符合這些特徵的用戶留存度是最高的;運營人員需要不斷去push,激勵用戶達到這個標準,從而提升留存率。

7.A/B測試與A/A測試

A/B測試是為了達到一個目標,採取了兩套方案,一組用戶採用A方案,一組用戶採用B方案。通過實驗觀察兩組方案的數據效果,判斷兩組方案的好壞。在A/B測試方面,谷歌是不遺餘力地嘗試;對於搜索結果的顯示,谷歌會制定多種不同的方案(包括文案標題,字體大小,顏色等等),不斷來優化搜索結果中廣告的點擊率。

這裡需要注意的一點,A/B測試之前最好有A/A測試或者類似準備。什麼是A/A測試?A/A測試是評估兩個實驗組是否是處於相同的水平,這樣A/B測試才有意義。其實這和學校裡面的控制變數法、實驗組與對照組、雙盲試驗本質一樣的。

三、流程:宏觀、中觀和微觀

(一)宏觀

1.中國古代樸素的分析哲學

其實數據分析自古有之,中國古代很多名人從事的其實就是數據分析的工作;他們的名稱可能不是數據分析師,更多的是「丞相」、「軍師」、「謀士」,如張良、管仲、蕭何、孫斌、鬼谷子、諸葛亮。

他們通過 「歷史統計」-「經驗總結」-「預測未來」 為自己的組織創造了極大的價值,這是中國古代樸素的分析哲學的重要內容。

2.精益創業的MVP理念

風靡矽谷的精益創業,它推崇MVP(最簡化可行產品)的理念,通過小步快跑的方式來不斷優化產品、增長用戶。

運營入門,從0到1搭建數據分析知識體系

在運營工作中,我們要大膽嘗試,將想法轉化成產品和運營方法。然後分析其中的數據,衡量產品或者運營的效果。如果好的話保持並大力推廣,如果不好的話總結問題及時改進。在「構建-「衡量」-「學習」的不斷循環中逐漸優化,這個流程是非常適合運營工作的。

(二)中觀

《誰說菜鳥不會數據分析》書中介紹了更為具體的分析流程:1.明確分析目的和思路 →2.數據收集 →3.數據處理 →4.數據分析 →5.數據展現 →6.報告撰寫。

這個流程只是從「數據」的角度闡述了前後的流程,並未結合業務實際;而且它將數據分析的落腳點定位於「報告撰寫」是具有誤導性的,因為數據分析的最終目的是為了指導實踐,而不是寫一份報告。

但是這個流程仍具有參考價值,尤其是 「明確分析目的和思路」 對於新手入門具有一定的指導意義。

(三)微觀

下面介紹的是一個非常詳細的分析流程,藉助於一定的分析工具,我們可以按照這個思路對您的網站/APP進行細緻入微的分析。

運營入門,從0到1搭建數據分析知識體系

這是GrowingIO商務分析師檀潤洋在《提高用戶留存,產品、市場和運營都有哪些方法》中介紹的流程,我認為適用於大部分的運營數據分析。

它的前提是用數據分析工具做好數據採集和監控工作,把精力集中在業務分析上。

這個流程的核心是「MVP」的理念,「發現問題」-「設計實驗」-「分析結果」,通過數據來不斷優化產品和運營。

四、應用:體系和分析

(一)案例1:搭建數據分析體系

小張今年剛畢業,在某公司從事新媒體工作,負責微信的日常運營。小張並不清楚微信運營的核心目的,嘗試了很多方法,原創、翻譯、改寫了很多文章發布在微信上,但是閱讀量時高時低,總體一般。

經理讓小張想辦法改進一下微信運營,提高微信的粉絲數和閱讀數;但是張三毫無頭緒,無從下手。

這是很多運營真實的寫照,瑣碎的工作容易讓人忘記思考,這很可能就發生在你我的身邊。

我們從數據分析的角度對這個案例進行了診斷,總結了小張存在的這些問題:

不清楚自己需要關注哪些核心指標;

不清楚目標用戶的特徵(用戶屬性、用戶畫像等);

對自己過往工作缺乏系統分析(數據採集、監測和分析)。

從業務增長的角度出發,我給小張量身定做了一套數據分析體系,配合其內容工作的開展。

第一點,內容定位。

運營需要明確知道自己的目標或者KPI,然後選擇一個核心關鍵指標(OMTM)進行監測。如果是創業公司,初期可能需要拉新,那麼核心指標是註冊用戶數或者新訪問用戶數。如果是資訊媒體,注重影響力和覆蓋面,那麼核心指標應該是微信閱讀數或者網頁PV。

第二點,用戶畫像。

無論是哪一種運營崗位,都需要明確知道自己的(目標)用戶是那些人?這些人都有哪些特徵,他們的關注點和痛點是什麼?如果你的用戶是產品經理,那麼可以嘗試爬蟲抓取產品經理網站上有關的問題,然後做文本分析:這是定量層面的分析。

同時,通過調查訪問和問卷調研,獲取更加深入的用戶特徵信息:這是從定性層面的分析。

第三點,持續監測。

藉助數據分析工具,對核心關鍵指標(OMTM)進行持續監測。對於指標異常情況,我們需要及時分析和改進。

第四點,數據分析。

統計和分析過往內容的數據,找出哪些內容、哪些標題、哪些形式、哪些渠道的效果更好,然後朝這方面不斷優化。

案例2:分析業務核心指標

電子郵件營銷是現在很多企業仍在採用的營銷和運營方式,某互聯網金融企業通過EDM給新用戶(有郵件地址但是未註冊用戶)發送激活郵件。一直以來註冊轉化率維持在20%-30%之間,8月18日註冊轉化率暴跌,之後一直維持在10%左右。

運營入門,從0到1搭建數據分析知識體系

這是一個非常嚴重的衰退,需要立即排查原因。EDM渠道註冊轉化率涉及到太多的因素,需要一個一個排查,數據分析師幫運營羅列了可能的原因:

技術原因,ETL(數據抽取、轉化、載入)出現問題,導致後端數據沒有及時呈現在BI報表中;

宏觀原因,季節性因素(節假日等),其餘郵件衝擊(其餘部門也給用戶發郵件稀釋了用戶的注意力);

微觀原因,郵件的標題、文案、排版設計,CTA設計,註冊流程設計。

一個簡單的業務指標,會影響到它的因素可能是多種多樣的,所以我們需要對可能涉及到的因素進行精細化衡量才能不斷優化。最後發現,產品經理在註冊環節添加了『綁定信用卡』,導致註冊轉化率大幅度下降。

五、學習:業務、工具和資源

(一)業務層面

數據分析並沒有想像中的高不可及,掌握好相應的概念、思路、流程,運營都可以做好數據分析。這裡要著重強調一點,數據分析的目的是指導業務實踐;脫離實踐的數據分析、為分析而分析的數據分析都是在耍流氓。

不同於職業的數據分析師和數據科學家,運營人員做好數據分析的前提是嫻熟的業務理解。從業務的角度來說,數據不是數字,它是用戶的心聲。運營人員要從數據中發現問題,不斷優化,提升用戶體驗、為用戶創造更多的價值。

(二)工具層面

磨刀不誤砍柴工,做好數據分析工具必不可少。我匯總了下面幾種工具,運營可以結合自己的實際需要採用。

Excel 是最常見、最基礎的數據分析工具,Excel 裡面的圖表、函數、透視表能滿足大家基本的需求。Access 是微軟 office 系列套裝的一部分,是一種小型的關係資料庫;當excel數據量很大、表格之間各種關聯、查詢、更新頻繁的時候,Access就是一種非常不錯的選擇。

Python是一種高級的編程語言,近年來發展很快,它可以用來做數據分析、編程或爬蟲;R語言是一種數據分析工具,在統計學中廣泛使用。目前,Python被廣泛用來編寫爬蟲程序,獲取網上的信息,這是對運營人員非常有幫助的。

Google Analytics、百度統計、友盟是常見的網站流量分析工具,Mixpanel、Heap、GrowingIO屬於用戶行為數據分析工具,較前者功能更加豐富、分析更細緻。

(三)資源層面

運營入門數據分析,並不需要學習多麼複雜的數學知識理論,更多的是將業務操作和數據分析結合起來。我這裡推薦兩個網站和兩本書,希望有幫助。

數據分析網(http://www.afenxi.com/ ):覆蓋統計理論、數據分析方法、業務分析等內容。

GrowingIO博客(https://blog.growingio.com/ ):GrowingIO數據分析、增長實踐等內容。

《誰說菜鳥不會數據分析》:數據分析入門知識匯總。

《精益數據分析》:從精益創業的角度,詮釋業務增長的分析方法和前言案例。

本人是踏浪100學習者,這是一個專門學習互聯網營銷的網站:踏浪100(http://shicao.talang100.com/?utm_source=zhihuutm_campaign=0219rayutm_medium=word)。就是想讓大家學到,學到就能用到工作中的互聯網營銷知識,課程體系從文案、到微信、數據分析、sem跟營銷整個流程需要用到的實際技能,都有講到。


推薦你看看《誰說菜鳥不懂數據分析》,我現在就在讀這本書,是我們頭推薦我看的,覺得不錯,網上有試讀章節,你可以先看看


入門版

適合對數據分析的入門者,對數據分析沒有整體概念的人,常見於應屆畢業生,經驗尚淺的轉行者

《深入淺出數據分析》:HeadFirst 類的書籍,一向淺顯易懂形象生動,可以對分析概念有個全面的認知

《誰說菜鳥不會數據分析》:不僅講解了一些常見的分析技巧,並附帶 Excel 的一些知識以及數據分析在公司中所處的位置,對職場了解亦有一定幫助

《赤裸裸的統計學》:作者年輕時是個追求學習意義的學霸,後來自己從統計學中發掘了很多可以應用到生活的地方。
這也是本書的主旨,結合生活講解統計知識,生動有趣。可以避免統計學一上來就大講貝葉斯概率和隨機分析的枯燥。同樣類似的書籍還有《統計數字會撒謊》,這
本書知名度要高點,不過我還沒看…

進階版

具有一定的行業針對性,要求具備一定的分析常識,適合網站分析師,商業分析師以及數據產品經理。

《精通web analytics 2.0》:此書雖老,但其中很多思想和流量分析的案例仍然很有借鑒意義,現在紙質書只能上淘寶買舊書了。與此類似的有《網站分析實戰》,是國內一本講網站分析的書,沒有上面經典,但勝在新出,很多案例和理念都有及時的更新

《深入淺出統計學》:Headfirst 類書籍,可以幫助你快速了解統計方面的知識

《數據化管理》:黃成明著,講解在企業中應用數據的例子,讀完受益匪淺,裡面舉的很多例子都很接地氣。雖說偏向於零售業管理,但大道歸一,可適用於很多行業,當時依據裡面的理念規划了美團外賣面向 BD 的數據產品

《SQL從入門到精通》:這本也是我當年學習 SQL 的入門書,薄冊子一本,看起來很快。SQL是個性價比很高的技能,簡單而強大。任何想進一步提高自己數據分析技能的產品/運營/分析師 同學,都建議點亮這個技能點

我司 GrowingIO 出的一本數據分析的增長手冊,可以為大家提供常見的分析手段講解,如漏斗分析,同期群分析等等,可在 GrowingIO 官方博客中下載

高階版

更高階的數據相對來說專業性較強了,如涉及到企業內部數據治理,數據結合的業務分析,數據可視化等。當然,還有數據挖掘演算法之類的更深入的東西。

《決戰大數據》:阿里巴巴前數據副總裁車品覺老師所著,講解了阿里巴巴在企業內部治理數據過程中的心得,所講「存-通-用」數據管理三板斧和「從數據化運營到運營數據」,字字珠璣,可堪借鑒

《精益數據分析》:此書優勢在於將企業分成了幾個大的行業類別,並分門別類的講解了每個行業的商業模式特點及分析技巧,對使用者的分析能力要求較高,且必須具備相應的業務知識

《The Wall Street Journal Guide to Information Graphics》,華爾街日報負責商業分析的人做的可視化指南,精華且實用,我之前在公眾號上寫過讀書筆記《華爾街日報是這樣做數據可視化的》,可供大家參考

《數據倉庫經典教程》:網上有人整理出來的資料,優點是簡單明了,不像正常的數據倉庫教材厚厚一本。


我剛剛發布了一個關於數據分析的幾本書的貼子,可以參考下。

作者:郭志敏

鏈接:關於數據分析的幾本書 - 出版圈郭志敏 - 知乎專欄

來源:知乎

著作權歸作者所有。商業轉載請聯繫作者獲得授權,非商業轉載請註明出處。

1、統計會犯錯——如何避免數據分析中的統計陷阱

【一本值得珍藏、大膽迷人,並將永遠改變你對統計看法的書 】

面對充滿不確定性的未知世界,人們在科學研究中需要大量使用統計分析方法。但是,如何正確使用統計分析方法充滿玄機,即使對那些最優秀和最聰明的人也是如此。讀完此書你會驚訝地發現,許多科學家使用的統計方法中其實隱藏著許多謬誤和陷阱。

本書簡明扼要地指出了現代科學研究中常見的統計謬誤,諸如 p 值與基礎概率謬誤、統計顯著性和模型誤用等。從這本書中,你將理解什麼是統計謬誤及其產生的原因,了解如何檢查科學研究中隱藏的統計謬誤。你還將學會如何正確地使用統計方法,如何在科學研究中避免這些統計謬誤。

2、數據科學與大數據分析——數據的發現 分析 可視化與表示

數據科學與大數據分析在當前是炙手可熱的概念,關注的是如何通過分析海量數據來洞悉隱藏於數據背後的見解。本書是數據科學領域為數不多的實用性技術圖書,它通過詳細剖析數據分析生命周期的各個階段來講解用於發現、分析、可視化、表示數據的相關方法和技術。

本書共分為12章,主要內容包括大數據分析的簡單介紹,數據分析生命周期的各個階段,使用R語言進行基本的數據分析,以及高級的分析理論和方法,主要涉及數據的聚類、關聯規則、回歸、分類、時間序列分析、文本分析等方法。此外,本書還涵蓋了用來進行高級數據分析所使用的技術和工具,比如MapReduce和Hadoop、資料庫內分析等。

本書內容詳細,示例豐富,側重於理論與練習的結合,因此比較適合對大數據分析、數據科學感興趣的人員閱讀,有志於成為數據科學家的讀者也可以從本書中獲益。

【電子版入口】http://www.epubit.com.cn/book/details/4178

3、Python數據分析

及機器學習的一種理想編程語言,它能幫助你快速提升工作效率。

本書將會帶領新手熟悉Python數據分析相關領域的方方面面,從數據檢索、清洗、操作、可視化、存儲到高級分析和建模。同時,本書著重講解一系列開源的Python模塊,諸如NumPy、SciPy、matplotlib、pandas、IPython、 Cython、scikit-learn和NLTK等。此外,本書還介紹了數據可視化、信號處理、時間序列分析、資料庫、預測性分析和機器學習等主題。通過閱讀本書,你將華麗變身數據分析高手。

【電子版入口】Python數據分析

4、貝葉斯思維:統計建模的Python學習法

這本書幫助那些希望用數學工具解決實際問題的人們,僅有的要求可能就是懂一點概率知識和程序設計。而貝葉斯方法是一種常見的利用概率學知識去解決不確定性問題的數學方法,對於一個計算機專業的人士,應當熟悉其應用在諸如機器翻譯,語音識別,垃圾郵件檢測等常見的計算機問題領域。

可是本書實際上會遠遠擴大你的視野,即使不是一個計算機專業的人士,你也可以看到在戰爭環境下(二戰德軍坦克問題),法律問題上(腎腫瘤的假設驗證),體育博彩領域(棕熊隊和加人隊NFL比賽問題)貝葉斯方法的威力。怎麼從有限的信息判斷德軍裝甲部隊的規模,你所支持的球隊有多大可能贏得冠軍,在《龍與地下城》勇士中,你應當對遊戲角色屬性的最大值有什麼樣的期望,甚至在普通的彩彈射擊遊戲中,擁有一些貝葉斯思維也能幫助到你提高遊戲水平。

除此以外,本書在共計15章的篇幅中討論了怎樣解決十幾個現實生活中的實際問題。在這些問題的解決過程中,作者還潛移默化的幫助讀者形成了建模決策的方法論,建模誤差和數值誤差怎麼取捨,怎樣為具體問題建立數學模型,如何抓住問題中的主要矛盾(模型中的關鍵參數),再一步一步的優化或者驗證模型的有效性或者局限性。在這個意義上,這本書又是一本關於數學建模的成功樣本。

5、數據科學實戰手冊(R+Python)

這本書是基於R和Python的數據科學項目案例集錦,內容涵蓋了基於數據科學的所有要素,包括數據採集、處理、清洗、分析、建模、可視化以及數據產品的搭建。案例包含了汽車數據分析、股票市場建模、社交網路分析、推薦系統、地理信息分析,以及Python代碼的計算優化。通過手把手的案例解析,令讀者知其然並知其所以然。

業界的數據分析師、數據挖掘工程師、數據科學家都可以讀一讀。想要了解實際工作中如何用數據產生價值的在校學生,或者對數據科學感興趣的人也值得一讀。

【電子版入口】數據科學實戰手冊(R+Python)

6、R數據可視化手冊

R具有強大的統計計算功能和便捷的數據可視化系統。《R數據可視化手冊》重點講解R的繪圖系統,指導讀者通過繪圖系統實現數據可視化。書中提供了快速繪製高質量圖形的150多種技巧,每個技巧用來解決一個特定的繪圖需求。讀者可以通過目錄快速定位到自己遇到的問題,查閱相應的解決方案。同時,作者在大部分的技巧之後會進行一些討論和延伸,介紹一些總結出的繪圖技巧。

  《R數據可視化手冊》側重於解決具體問題,是R數據可視化的實戰秘籍。《R數據可視化手冊》中絕大多數的繪圖案例都是以強大、靈活製圖而著稱的R包ggplot2實現的,充分展現了ggplot2生動、翔實的一面。從如何畫點圖、線圖、柱狀圖,到如何添加註解、修改坐標軸和圖例,再到分面的使用和顏色的選取等,本書都有清晰的講解。雖然本書的大多數技巧使用的是ggplot2,但是並不僅僅局限於ggplot2的介紹。作者的理念是用合適的工具來完成合適的繪圖任務,讀者也可以學到許多其他有用的繪圖函數和工具,來適應各種複雜的需求。

  《R數據可視化手冊》是學習R中豐富的數據可視化方法的權威手冊,非常適合對R 語言有基本的了解的讀者閱讀。

【電子版入口】R數據可視化手冊


Cousera有一門杜克大學的數據挖掘和分析課https://www.coursera.org/learn/inferential-statistics-intro,

老師講課條理清晰易懂,有課後作業、期中考、期末考,個人感覺很不錯~我當時做基因晶元的數據分析,所以專門去學了下,至少了解了各類檢驗方法。期末考還拿了優秀,得意。

軟體推薦:(按簡單到難)

SPSS&>SAS&>R 語言


數據分析,先學會數據分析工具操作方法,數據分析基本理論。其實這兩樣就夠了!

剩下的最主要的就是你的一次又一次的經歷和經驗,利用你的經驗來分析矯正利用這些數據。說多無用,實踐出真知。當然這其中的悟性就要看個人了!

最近建了一個運營新鮮事分享群,目的是為了擴大運營人員的見識和學習技巧。每個人每周需要分享三篇你覺得很好的內容到群里,並說明分享理由。每周也會定一個座談會主題來交流。

如果想進群,加我微信並備註知乎拉你入群。443203387


這是一本新出來的書,可以免費看 如果是網站或者APP分析方向,是不錯的選擇,東西很新很全,以主流工具GA為主 cn.analyticsbook.org,


數據分析PPT 謝謝


其實我想說的是,那麼多的數據,如何有效的分析和使用才是關鍵。統計學原理等數據不可以少的,數據是客觀公正的,數據不會做假,但是分析會的。很多人的分析是唯心論的,所以會導致數據分析後的結果有所偏差。這點一定要注意注意再注意。


個人建議先了解一下背景,比如《統計學原理》,然後再看一下《概率論與數理統計》,最後就可以買《數據分析與處理》了。


做數據分析,要看你做哪方面的,技術要求高不高。簡單的財務處理,數據統計分析用excel就夠了,看樓上有人推薦 誰說菜鳥不會數據分析 這本書,還不錯,適合新手入門。複雜點的數據處理,就需要SAS,SPSS,STATA,Gauss等知識。計算機軟體方面還有資料庫,vba等


R Language

如果懂英文的話推薦http://coursera.org

上面的Data Analysis ,JHU的免費公開課程,不知道下一個session是什麼時候,但感覺英文公開課一向的特點,脈絡清晰,補充網上公開的R資料,效果不錯。(爪機敲的,需要的話再來補充)


推薦閱讀:

暴雪最近的幾款遊戲作為公司的產品來說表現如何?
為什麼我國農民收入低?
有什麼醫藥行業專業的數據分析公司?
數據分析團隊如何給自己找活干?
金融行業有哪些領域需要大量運用數據分析?具體有哪些職位?

TAG:產品經理 | 產品運營 | 數據挖掘 | 數據分析 | 互聯網數據分析 |