超級菜鳥怎麼學習數據分析?
數據挖掘、工具、技術、所需知識點
作為互聯網營銷從業者的我,在開始什麼也不太懂,當然也是一個超級菜鳥了。直到我有一天在網上看到了它:數據分析篇2:數據分析幫你實際解決的10個問題,我才知道原來數據分析對於網站的運營,乃至是對於整個營銷流程來說,都是非常關鍵的一環。沒有數據分析,就沒有反饋,營銷效果就不能得到評估,當然也就更加無法知道這次的營銷好在哪,差在哪,也就沒有任何可以對整個營銷流程做進一步調整優化的可能了。
那麼,作為一個超級菜鳥,該怎麼學習數據分析呢?
既然是學習,那當然是先掌握基本的數據分析知識。我是互聯網營銷從業者。就以互聯網營銷當中要用到的數據分析來為題主解答一下。
首先,我們先來認識一下最常見的數據分析工具。基本上很多企業做常用的就兩種:國內百度的百度統計,以及國外Google的Google Analytics(GA)。而通過對比使用,我們發現GA的數據統計更加的準確,而且實現的功能也更加齊全。
因此,接下來,我就以GA作為講解,按以下講解的步驟,大家就可以一邊學習,一邊自己練習,然後就可以直接用在自己的工作中,這樣更有實際意義一些。這樣也算是不會浪費大家的時間來看我的這篇文章。
好了,大家可以先去喝口水,下面就進入我們的乾貨環節。
學習分成3個階段:0基礎水平(毛都不會)、略懂皮毛(能監測到轉化率)、中級水平(會製作你自己的自定義報告)。
知道你只看文字理解起來費盡,往後翻,每個知識點都給你做截圖示例了,我現在有一種深深的老媽子趕腳。
第一階段:零基礎水平
你至少得需要了解GA的工作原理,如果你的網站,沒有設置過監測鏈接,你至少知道如何跟你的工程師說「幫我把監測代碼部署到前端頁面」,以及如何設置一個你自己的監測鏈接,涉及到的知識點如下:
【1】了解GA的工作原理
很簡單,一個網站是由N多個頁面組成的,一個頁面是由N多行代碼寫出來的,當用戶訪問你的網站時,瀏覽器就在:加-載-代-碼!所以GA會給你的網站生成一段代碼,當工程師同學把這段代碼放到你的網站頁面時,用戶來瀏覽你的網站,先載入了你的監測代碼,這時候用戶的信息就留下了,你開始可以看到數據了。
找到網站的跟蹤代碼,如圖:
【2】學會設置一條監測鏈接
設置檢測鏈接不用多解釋了,就是把一條正常的鏈接,加上可被GA識別的監測。
比如踏浪實操教學網站中的一個課程頁面作為我的監測目標鏈接,原來的鏈接是這樣的:
這就是一個正常的、沒有加監測的網址。
而對這個目標鏈接加了監測就是醬紫的,如下圖所示:
大家看到了,這裡面source,也就是來源,是ZhiHu,因為我選擇在知乎上進行推廣,這裡面medium,也就是媒介,是HuiDa,就是我設置的,意思就是通過回答知乎網友的問題進行推廣,這裡面廣告系列名稱campaign,你需要寫一個你能看懂的規則,我在這兒寫的是zhihu0529hq,後面那個0529就是日期,hq是本人的名字首字母,便於以後方便做自定義報表進行數據分析。
至於在哪裡製作你的監測鏈接,附上網址構建器地址(注意,因為是Google的數據分析工具,所以需要翻牆後才能使用,如果需要翻牆工具的話,可以在下面評論留言):https://support.google.com/analytics/answer/1033867?hl=zh-Hansref_topic=1727148
再給大家找個例子,借一下蘇文閣同學的數據給大家看一下:【3】查看監測報告
閱讀數據報告不多說,提3點吧。
第一,在GA裡面的菜單欄,選擇查看【來源/媒介】,再加上你的時間維度,可以看到一段時間內的全部流量來源。
第二,你設置過的監測鏈接的這些數據,比如,你在微博發布了一條內容,附上了加了監測的鏈接,你要查看這次微博的引流效果,這時候你需要在【廣告系列】查看你的數據。
第三,GA提供了很多數據篩選器,比如你要看一天內各個時段的用戶行為,就是用對用的數據篩選器。
從廣告系列裡面看設置了監測的數據,如圖:
ok,到這裡你已經學會製作監測鏈接,並且能看到數據了。
你可以意識到,這意味著你可以開始算真實流量的獲取成本了。
之前總是關注微博轉發評論數,微信閱讀數的同學,可以醒醒了。現在你可以看到真實的渠道引流效果,然後做一個小學除法,你就知道你花錢了多少錢,帶來了多少個真實流量,每個流量你花了多少錢。
零基礎水平的你,已經有一點料去跟別人吹吹牛逼了對吧。
第二階段:略懂皮毛
ok,你現在已經學會怎麼設置監測鏈接,但是你還不知道流量來了之後,轉化率到底怎麼樣,第二階段你要學會這些,包括對提高轉化率有幫助的一些功能。
【4】監測目標達成結果(goal)
舉例,當用戶付款成功後,會來到一個/success的頁面,你可以把這個頁面作為目標(goal)。這樣你就能知道,【有多少人】,【通過什麼廣告】,【最終完成了付款】,你在百度通過競價排名投放了一個廣告,花了200塊錢,帶來100個流量,帶來一個轉化,也就是1%的轉化率,你的產品單價是2000,也就是說,你花了200塊,掙到2000塊(沒刨除成本,僅僅舉例),所以你才知道,對應的這個SEM百度創意,是划算的,所以你繼續增加投放。這就是goal給你帶來的數據意義。
如圖:
【5】知道用戶用什麼瀏覽器或設備瀏覽你的網站,用戶是什麼地區
你可以通過GA知道網站訪客使用什麼設備,以此來調整宣傳內容,舉例,你在微博投放了一個廣告,你放上了一條鏈接,這條鏈接來到了一個製作精美的網頁。但是一直用戶停留時間很短。你巨費解,這時候你用上了GA,你吃驚的發現,70%的用戶是手機訪問你的網站,而是你的網站,在移動端根本沒有適配,你現在整個人都不好了對不對。
還要注意的是,不管你投放百度競價,還是其他媒體,在投放過程中,都涉及到一個【投放維度】的選擇,地域是一個重要的維度,一個適合一線城市的產品,投放到農村,這事兒就不好玩了,所以你需要通過數據,清楚地知道你的訪客都是什麼地方的人。
瀏覽器:
城市:
【6】實時了解用戶行為
這個很容易理解,就是實時看到你的網站有多少訪客,有多少是新訪客,多少是老訪客,大家都在分別看什麼頁面,這個功能對於一個大的營銷活動來說,實時觀察用戶行為,很有必要。
如圖:
【7】了解用戶喜歡在你的網站上做什麼
了解用戶行為,既屬於營銷問題,也屬於產品問題。針對營銷人員,當製作了一個營銷的著陸頁面時,需要根據數據調優頁面,針對產品人員,就需要對整個網站、或者APP產品進行基於用戶行為的產品調整。
如圖:
【8】知道用戶達到你的網站目標之前,都做了什麼(行為流)
哇,這個相當重要。不管你是做一個電商網站,還是做一個社區網站,都有自己的目標。以電商網站為例,顯然目標是付費,那麼這時候,清楚的了解付費用戶在付費之前都做了什麼,非常重要,因為這意味著你可以在網站產品、營銷內容上做調整,把用戶最希望看到的頁面呈現給他。
如圖:
第三階段:中級水平
這時候GA給到你的模板工具已經滿足不了你的需求了,隨著數據量越來越大,你開始需要自定義數據報表,簡單理解,就是你在微博天天都發內容,回收了很多數據,但是你總不能每天數據自己去做加法來看整個渠道的數據情況吧,所以我們製作自定義報表,通過正則表達式,來把自己需要的數據篩選出來。
【9】製作自定義報表
舉例,你分別在2天,發布了3條微博鏈接,分別設置的監測規則為:1008weibo1、1008weibo2和 1009weibo1。我們發現這些監測規則的格式是統一的,所以我們可以把統一的規則,通過正則表達式篩選出來,在計算機的眼裡,這個規則是【4位數字】+【weibo全拼】+【1位數字】
如圖:
OK,希望通過我以上的講解,你能夠邊學邊用,掌握以上九點之後,你就已經算是一個中級的數據分析人員了。相信會對你的網站運營工作帶去很多意想不到的幫助。
另外,你想詳細學習數據分析,並且希望還有經驗豐富的老師在實戰中指導你,讓你零基礎都能掌握的話,良心推薦踏浪100【專註學習互聯網營銷知識】,它讓我系統性的認識到了互聯網營銷,而數據分析又是互聯網營銷中的重要一環,這個平台幫助了我,我想它也能幫助到你。
作為一名數據分析的新手,學習數據分析重要的一點是要建立數據分析的知識體系和方法論。
這兩年,隨著大數據、精益化運營、增長黑客等概念的傳播,數據分析的思維越來越深入人心。人人都知道數據的重要性,但是卻一直困擾於如何做好數據分析工作。
那麼該如何搭建自己的數據分析知識體系?數據分析的價值又在哪裡?做數據分析有哪些具體的方法?又如何學習數據分析?本文將和大家分享一下這些問題。
Part 1 | 數據分析體系:道、術、器
「道」是指價值觀。要想做好數據分析,首先就要認同數據的意義和價值。一個不認同數據分析、對數據分析的意義缺乏理解的人是很難做好這個工作的。
「術」是指正確的方法論。現在新興的「Growth Hacker」(增長黑客)概念,從 AARRR 框架 ( 獲取、激活、留存、變現與推薦五個環節)入手進行產品分析,這是一個非常好的分析方法。
「器」則是指數據分析工具。一個好的數據分析工具應該能幫助大家進行數據採集、數據分析、數據可視化等工作,節省時間和精力,幫助更好理解用戶、更好優化產品。
Part 2 | 數據分析的價值
數據分析不能為了分析而分析,而要將落腳點放到業務、產品和用戶上。以產品經理為例,數據分析應該幫助產品經理不斷優化產品設計和迭代,驅動產品和用戶增長。
當我們上線了一個新的產品(product)或者功能時,需要對其進行數據監控和衡量(measure)。然後從監控中採集到產品的用戶行為數據(data),並對這些數據進行分析和總結(learn)。最後從分析中得出結論和觀點(idea),如果數據證明我們的新產品/功能是優秀的,那麼可以大力推廣;如果數據說明我們的產品還存在問題,就需要對產品進行新一輪的優化(build)。在「產品——數據——結論」的不斷循環中,我們不斷用數據來優化我們的產品,加快產品迭代的步伐、提升用戶體驗。
Part 3 | 數據分析的方法
1. 流量分析
a. 訪問 / 下載來源,搜索詞
網站的訪問來源,App 的下載渠道,以及各搜索引擎的搜索關鍵詞,通過數據分析平台都可以很方便的進行統計和分析,分析平台通過歸因模型判斷流量來源,產品經理在分析這些流量時,只需要用自建或者第三方的數據平台追蹤流量變化即可,第三方平台如 Google Analytics 、GrowingIO 等;b. 自主投放追蹤
平時我們在微信等外部渠道投放文章、H5 等,許多產品都會很苦惱無法追蹤數據。分析不同獲客渠道流量的數量和質量,進而優化投放渠道。常見的辦法有 UTM 代碼追蹤,分析新用戶的廣告來源、廣告內容、廣告媒介、廣告項目、廣告名稱和廣告關鍵字。c. 實時流量分析
實時監測產品的訪問走勢,尤其要關心流量異常值。舉個例子,某互聯網金融平台因為一個產品 Bug 導致用戶瘋狂搶購造成的流量峰值,產品經理髮現實時數據異常後迅速下線該產品修復 Bug,避免了損失擴大。2. 轉化分析
無論是做網站還是 App,產品裡面有很多地方需要做轉化分析:註冊轉化、購買轉化、激活轉化等等。一般我們藉助漏斗來衡量用戶的轉化過程。
影響轉化率的因素很多,我們總結了三個大的方面:渠道流量、用戶營銷、網站 / APP 體驗。以渠道流量為例,通過優選渠道並且量化分配我們的投放資源,可以有效提升總體的轉化率。更詳細的轉化分析方法,可以參考我之前的這篇回答 如何提升轉化率? - 張溪夢的回答 。
3. 留存分析
在互聯網行業里,通常我們會通過拉新把客戶引過來,但是經過一段時間可能就會有一部分客戶逐漸流失了。那些留下來的人或者是經常回訪我們公司網站 / App 的人就稱為留存。
在一段時間內,對某個網站 / App 等有過任意行為的用戶,稱之為這個網站 / App 這段時間的活躍用戶,這個任意行為可以是訪問網站、打開 App 等等。現在大家經常會用到所謂的「日活」 (日活躍用戶量,DAU)、「周活」 (周活躍用戶量,WAU)來監測我們的網站,有的時候會看到我們的「日活」在一段時期內都是逐漸地增加的,以為是非常好的現象,但是如果沒有做留存分析的話,這個結果很可能是一個錯誤。
留存是產品增長的核心,用戶只有留下來,你的產品才能不斷增長。一條留存曲線,如果產品經理不做什麼的話,那麼用戶就慢慢流失了。這是一個常見的留存曲線,我把它分成了三個部分:第一部分是振蕩期,第二部分是選擇期,第三部分是平穩期。
從產品設計的角度出發,找到觸發留存的關鍵行為,幫助用戶儘快找到產品留存的關鍵節點。之前我們發現我們產品裡面,使用過「新建」功能用戶的留存度非常高;於是我們做了產品改進,將「新建」按鈕置於首頁頂部刺激用戶使用,效果非常好。
矽谷流行的 Magic Number(魔法數字)也是留存分析的一部分,比如 Facebook 發現「在第一周里加 10 個好友」的新用戶留存度非常高。作為產品經理,我們也需要通過數據分析來不斷探索我們產品裡面的魔法數字,不斷提高用戶留存度和活躍度。
更詳細的留存分析方法,可以參考這篇文章 你能找到的最深入的留存分析文章 - 留存 · 增長 · Magic Number 。
4. 可視化分析
用戶體驗,是一個非常抽象的概念,我們可以對其進行形象化。目前一個普遍的方法就是對用戶的數據進行可視化,以熱圖的形式呈現。
藉助熱圖,產品經理可以非常直觀了解用戶在產品上的點擊偏好,檢驗我們的產品設計或者布局是否合理。熱圖的概念、原理、類型和應用,可以參考這個回答 熱力圖是什麼原理? - 張溪夢的回答 。
5. 群組分析 挖掘用戶需求、改進及優化產品
千人千面,產品經理對用戶精細化的分析必不可少。不同區域、不同來源、不同平台甚至不同手機型號的用戶,他們對產品的使用和感知都可能存在巨大的差異。產品經理可以對不同屬性的用戶進行分群,觀察不同群組用戶的行為差異,進而優化產品。
之前我們做過一次分析,網站的總體註冊轉化率是 6%;但是使用 Chrome 瀏覽器的新用戶註冊轉化率高達 12%,使用 IE 瀏覽器的新用戶註冊轉化率才 1%。這樣一分的話,問題就很明顯了,極有可能是瀏覽器兼容性的問題,產品經理應該關注一下這個問題。詳細的群組分析操作流程,可以參考這個回答 產品經理一般是怎麼搜集產品不好用之處的? - 張溪夢的回答 。
Part 4 | 數據分析的書籍
做好數據分析,不是一朝一日就可以的,需要在產品規劃設計、產品升級迭代中不斷實踐。下面的這些書籍對於產品經理學習數據分析都有一定的幫助:
推薦 1: @范冰XDash 的《增長黑客》
這是國內對於增長黑客的第一本詳細介紹,作者從AARRR的視角切入,描述了大量產品優化、產品增長的案例,對於產品經理非常有益。推薦 2:埃里克·萊斯的《精益數據分析》
在這本書裡面,作者介紹數據分析的相關指標、不同行業的數據分析要點,並且有大量的數據分析案例和翔實數據。如果想要把數據分析落地,這本書對產品經理是非常有幫助的。推薦 3:我們一直在做互聯網行業數據分析知識的普及,目前我們已經做了 14 期「GrowingIO 數據分析公開課」,面向產品經理、運營等等,這裡是 GrowingIO 的產品和分析師寫的《互聯網增長第一本數據分析手冊》
這裡面彙編了我們一年多來數據分析、產品優化的實戰案例,裡面不少文章被被大號轉過,例如《如何成為一個優秀的數據產品經理》等等。下載電子版的分析手冊,請參考這裡 互聯網增長的第一本數據分析手冊 。
推薦 4:埃里克·萊斯的《精益創業》
作者提出了最小可行性產品(MVP)、小步快跑,快速迭代等產品設計和優化的理念,影響深遠。| 結語
數據分析是一門多學科、多領域的交叉學問,涉及到的東西非常多。要想做好數據分析,應該有一套完整的思維體系,在價值觀、方法論和工具三個層面上儲備相關知識。同時立足於產品和用戶,用數據來打磨產品,用數據來檢驗迭代,不斷提升用戶體驗。
註:本文中熱圖、實時等產品功能均來自 GrowingIO 官網 矽谷新一代數據分析產品 。1、學科知識:從數據分析涉及到的專業知識點上看,主要是這些:
(1)統計學:參數檢驗、非參檢驗、回歸分析等
(2)數學:線性代數、微積分等
(3)社會學:主要是一些社會學量化統計的知識,如問卷調查與統計分析;還有就是一些社會學的知識,這些對於從事營銷類的數據分析人員比較有幫助
(4)經濟金融:如果是從事這個行業的數據分析人員,經濟金融知識是必須的,這裡就不多說了
(5)計算機:從事數據分析工作的人必須了解你使用的數據是怎麼處理出來的,要了解資料庫的結構和基本原理,同時如果條件充足的話,你還能有足夠的能力從資料庫里提取你需要的數據(比如使用SQL進行查詢),這種提取數據分析原材料的能力是每個數據從業者必備的。此外,如果要想走的更遠,還要能掌握一些編程能力,從而借住一些專業的數據分析工具,幫助你完成工作。
……
好好學習,雖然累,但是要堅持!
2、軟體相關:從事數據分析方面的工作必備的工具是什麼
(1)數據分析報告類:Microsoft Office軟體、水晶易表等,如果連excel表格基本的處理操作都不會,連PPT報告都不會做,那我只好說離數據分析的崗位還差的很遠。現在的數據呈現不再單單只是表格的形式,而是更多需要以可視化圖表去展示你的數據結果,因為數據可視化軟體就不能少,BDP個人版、TABLUEA、Echart等這些必備的,就看你自己怎麼選了。
(2)專業數據分析軟體:Office並不是全部,要從在數據分析方面做的比較好,你必須會用(至少要了解)一些比較常用的專業數據分析軟體工具,比如SPSS、SAS、Matlab等等,這些軟體可以很好地幫助我們完成專業性的演算法或模型分析,還有高級的python、R等。
(3)資料庫:hive、hadoop、impala等資料庫相關的知識可以學習;
(3)輔助工具:比如思維導圖軟體(如MindManager、MindNode Pro等)也可以很好地幫助我們整理分析思路。
最重要的是:理論知識+軟體工具=數據分析基礎,最後要把這些數據分析基礎運用到實際的工作業務中,好好理解業務邏輯,真正用數據分析驅動網站運營、業務管理,真正發揮數據的價值。
一、通關的利器:
1、行動力
我是8月加入的猴子群,過完第一關後,中間因為很多事情被耽誤了很久,期間總感覺挪不出學習時間,荒廢了兩個月。一次看了吳軍他是如講何忙裡偷閒,每天在「得到」上發文章的文章,讓我獲益良多。吳軍博士是個大忙人:google的資深工程師,在數學、計算機科學、IT行業都有研究,不僅好攝影,古典音樂,還出版過《浪潮之巔》《文明之光》《數學之美》基本頗受歡迎的書。
他講到其實他不是每天騰出一段時間來才寫,而是,只要能在任何時間裡想到某個觀點,就會儘快記下來,在任何休息的夾縫中就開始寫文章,如在會議休息時,在接送孩子上學的時,像串珠子一樣完成整篇文章。我突然想時間是海綿里的水,擠一擠就有。
其實猴子在第一關就已經教給了我方法,只是當初沒有身體力行的做,而真正開始履行時間之後,每次完成一關,我都很開心,也很期待下次的闖關!
2、學習夥伴
我是編程小白,剛開始學習,運行程序特別容易出錯,有點泄氣,·後來看了群里一篇小姑娘的文章,講她是怎麼「先蠢,蠢完了就成熟」的故事,給我了鼓勵,其實編程沒想像中那麼複雜,初級階段遇到的問題知乎,google,網易雲課堂就可以,或者也可以查閱隊友的業。我比較喜歡知乎,因為下面還有相似的知識點鏈接。在學習過程中,還交了個小夥伴,特別聰明,每一關的文章,寫的很清晰,而且闖關進度很快,我書還沒看明白,他就已經提交作業了,還真讓我有壓力······幾個月下來,發現猴子群里更是藏龍卧虎,有了他們,更得督促自己要進步,還真是要去的遠方和同行的人一樣重要!
3、學習方法
學習中,Titanic案例分析,是花費我時間,精力最多的,也讓我收穫最大,一下從懵懵懂懂的狀態找到到數據分析師感覺,猴子的方法論里也講到,初學項技能時,不要先糾細節,而是先搭框架,對這件事的流程從頭到尾有個了解,再往框架裡面填東西,遇到不會的先空著,繼續下一項;然後找來那些高質量的模板效仿,再找到自己搞不懂的難點,逐個攻破;這個案例我也是按照這樣的方式來學習的,的確很有效!
a、搭建分析所需的流程框架:數據導入—text,train數據合併—查看數據—數據處理(缺失值,異常值)—特徵提取—數據類別轉化—建模預測—檢驗結果的準確率。
b、技能效仿:在選擇特徵,建模時,參考了很多別人的思路,他們選了哪些特徵,自己再一次次嘗試。
c、在模仿別人過程中,遇到了很多難點,比如lappy家族,ggplot2繪圖;隨機森林演算法,邏輯回歸演算法,決策樹....然後逐個擊破。
4、對自己的文章評價
進入猴子群我才開始在知乎上寫文章,這的確是倒閉輸出的好方法,每一次的文章都是重新溫習一遍知識點的過程,溫故而知新,知識點掌握的更牢靠。
因為知乎上的文章,必須要發布出來給別人看,每次只好認真寫,內容,排版,思路、細節都得注意,自己的東西拿出去遛,總得展示好的一面吧,的確很鍛煉思維和認真度。
文章「 excel數據導入R」,「Titanic數據分析」相對其他文章收藏點贊的多,你看,正如李笑來所說「你的對別人有用,才有意義。」
二、知識點總結
整體分為三個階段: R語言—SQL——回顧總結
各關學習歷程:
第一關:第一關:厲兵秣馬 砥礪前行
第二關:R語言數據結構入門-第二關
第三關:三、簡單數據處理
第四關:第四關 複雜數據處理;如何編寫業務模塊;Model 章節翻譯(R for Data Science-Hadley Wickham);
第五關:mysql入門-安裝, 常用函數 ;R語言操作資料庫;Kaggle-Titanic: Machine Learning from Disaster
寫在後面的話:
還有3天就是2018年了,整理自己的學習進度,回看以前的文章,欣慰又感動,加入「數據分析群」,除學習了以上這些數據分析方法以外,更重要的是,我每天都在提醒自己,要如期完成闖關任務,要把自己置身於「時間」這個夥伴旁,認真而精心過好每一天····雖然有時感到約束,但這一刻的幸福超過那些玩耍時的快樂加起來的總和。
喜歡木心的一句話「從前的那個我,如果來找現在的我,會到很好的款待」。
超級菜鳥是多菜?是程序員還是產品運營人員?這種叫法是程序員的可能性比較大。這要看你以後想往技術走,還是往業務走。如果往技術走,那就要學習數據倉庫、數據挖掘相關的知識,以及學習開源的一些組件,如hadoop、spark、kafka、impala等。如果是往業務走,那就學習一些業務分析方法,比如《精益數據分析》、《增長黑客》這樣的書籍,可以讀讀。當然,最好還是找個相關的工作崗位,在工作中,鍛煉是最快的。
第一階段 網站統計分析認知
在這一階段,主要通過百度統計、GA等增加對網站分析工具、基本定義、應用場景的初步認知,並通過自建網站(也就是現在在看的這個搜索營銷藝術)摸索不同工具的差異性,理解數據含義。
通過閱讀業內大牛的網站,如藍鯨、宋星、子木等增加對網站分析領域的認知。通過這個階段,基本會具備初級分析師所需要的能力——網站分析領域基本理解、應用等。
第二階段 網站統計分析工具應用提高經過之前的網站分析入門,已經具備一定的網站分析經驗。隨著對不同工具的應用,尤其是大型商用網站分析工具,發現網站分析的可用點越來越多,比如Webtrekk、Urchin、omniture等,對趨勢、細分、轉化這三個方面進行的擴展,最經典是路徑關聯的應用,已經開始找尋站內不同業務節點、站外不同業務節點的關係。另外,在於不同第三方服務商的接觸過程中,對行業內網站分析的應用也有一定程度的了解。此時網站分析已經可以遊刃有餘的與業務進行結合。
第三階段 開源、二次開發或自建網站分析項目網站分析是有瓶頸的,當網站越來越大、認知越來越深入之後,發現現有的工具很難滿足需求,沒有任何一款工具可以滿足所有網站分析需求,包括Webtrekk、Adobe、Webtrends、Webtrekk、Coremetrics這些頂級的工具。他們或多或少都有自己的缺點,在眾多業務應用中,最典型的短板包括:
- 網站數據實時性要求高,但很多工具不能滿足T+1分級甚至到秒級別的查看需求;
- 網站數據需要結合公司後端數據進行打通處理,目前網站分析工具支持的包括用戶ID、產品ID、訂單ID級別的數據導入和整合功能,已經不能滿足數據業務發展需要,並且這些工具始終都還是網站分析,不適合做大規模數據導入處理;
- 很多很好的工具在國內沒有應用優勢,主要原因之一是無法本土化,不能根據國內實際情況進行二次開發和定製;
- 國內的服務公司的水平和能力都需要提高,遠遠不能實現第三方行業經驗和best practice的預期等。
基於對現有國內網站分析工具以及相應服務商的考量,我發現現有固定的工具和服務模型很難滿足業務分析需求,因此我們需要其他替代方案,替代方案有三個方向:
- 對某些大型商用網站分析工具做二次開發。現在商用網站分析工具在國內二次開發做的比較好有Webtrekk、webtrends和webtrekk,adobe和coremetrics做的都不行。
- 基於開源的網站分析工具做自定義開發。比如基於piwik做二次開發,既省錢,有能滿足基本需求,還可定製。
- 公司自己做網站分析系統開發。這也是最需要開發能力的一種解決方案,通常在實施過程中,既可以和第三方公司一起來做(推薦這種方法),也可以自己獨立開發。
第四階段 拓展到整個公司的數據領域去
網站分析或者網站數據其實只是公司數據的一部分,當然具體視行業的不同而定:- 假如你的公司是媒體或服務性乙方,那麼恭喜你,網站分析是你們公司的重頭戲,網站數據分析也是公司業務數據分析的核心。
- 假如你的公司是輕電商模式,比如淘寶、攜程等,那麼網站分析也是公司重要數據之一,也是具備相當重要的地位。
- 假如你的公司是重電商模式,比如國美、蘇寧和京東,那麼很遺憾的告訴你,網站分析只是公司數據的一小部分,除了網站數據外,公司的物流配送、倉儲、訂單銷售和商品數據等在公司層面的意義遠大於網站數據。
- 假如你的公司是傳統媒體或線下業務為主,那麼更悲劇的告訴你,你的網站數據基本上價值不大,因此你的業務重點都不是線上,線上的那點數據怎麼會成為重點?
因此,除了網站數據,我們已經拓展到會員、物流倉庫、配送、客服CC、采銷等。這裡說的緊緊是數據範圍上的擴展,另外一層是數據流的擴展,我們的關注點已經從單純的數據結果、數據分析和數據報告應用向底層和上層延伸。
- 向底層,我們會關注每個數據(尤其是線下數據、多數據主從庫節點、多生產資料庫)的數據生產、存儲、ETL、入庫、提取規則等,從源頭上理解數據時怎麼收集、存放和抽取的;
- 向上層,我們在做的是脫離日常的業務需求→取數據→報告→溝通落地→優化評估等,將常規性的項目做成流程化、自動化的應用,把數據分析的能力交給業務,提高業務數據理解和應用能力的同時,也能發揮數據分析師價值最大化。同時業務數據經驗可以慢慢沉澱下來,形成業務應用模型和應用慣性。
另外,在數據分析的方向上,除了網站分析,還需要把WAP分析、APP分析建立起來。WAP和APP分析跟WEB分析是完全不同的方向,各自關注的業務點都不同,因此在業務方向上,也需要把這些業務囊括進來。
基於以上的發展,現在整個數據上,我們已經在做的數據不僅僅局限於網站分析,範圍上涵蓋了圍繞公司銷售從採購到妥投的所有業務模塊,從WEB到WAP、APP的完整線上業務模塊,流程上涵蓋了整個數據採集端到應用端的數據鏈。
另外有幾點感觸比較深,跟各位分享下:
- 初期更多是個人在工作,靠熱情和個人主動性,後期需要靠團隊,靠制度和流程;
- 建立與系統運維、DBA、產品經理、技術開發工程師的流程工作流程,並站在他們的角度上思考問題是每時每刻都不能缺少的因素,數據從採集到存儲到數據自動化都離不開他們;
- 千萬別局限於工具本身,工具永遠都是輔助於思想的,百萬級的工具人,不行照樣用的很爛;
- 圍繞業務的數據系列運作是數據落地化、價值化根本,只局限於數據本身沒什麼意義,一定要把數據價值「推銷」到全公司去;
- 拓展自己的知識面,了解和你相關的所有流程和工作方法,如果你也能參與其中那你和你團隊一定都會受益匪淺;
- 不要迷戀數據,數據不是萬能的。
推薦書籍:
最近比較火的一本叫 菜鳥也會數據分析(好像是這個名字),是一本小黃書
統計學基礎類的書可以看看
簡單的數據分析,可以用excel
複雜的,就需要學spss那要看你想往哪個方向發展了。往技術層發展,就要了解演算法。決策樹、關聯規則、粗糙集、模糊聚類的原理,變形,代碼實現。往應用層發展,重要的是熟悉相關業務。操作流程,業務中的數據節點,數據監控的位置,挖掘結果的展現方式。
講一個不懂編程也能入門的路線。
說到超級菜鳥:女生,二本,市場營銷專業,別說vlookup連sum是啥都不知道,代碼一個字母都不會,平時工作連電腦都不咋敲,這個應該夠超級菜了。(確實是個小姐姐,沒有性別歧視的意思哈)。唯一的優勢就是顏值還行。小姐姐畢業後去了某個銀行信用卡中心做業務員。某段時候我在做銀行項目,廣泛體驗各個銀行的信用卡,於是就這麼機緣巧合的認識了。100%出於想了解銀行發卡模式,而不是被小姐姐顏值吸引的原因,我很認真的和她聊了平時的工作情況。得知這個小姐姐業績非常的好,團隊Ace,每月激活卡100張以上,個人收入估算接2w以上了。
有意思的是,小姐姐對我的工作也很感興趣。她問我:「如何能轉行到後台做工作?」我很驚訝,為什麼收入這麼好還想轉數據分析呢?不覺得沒錢途嗎?要知道很多號稱「數據分析師」都沒有一年25萬的。小姐姐表示:因為跑業務太辛苦了,風吹日晒,而且一天不做一天沒收入,這日子沒法過下去了。「還是你們後台好,對著電腦敲敲就有錢拿,為啥不做」。100%出於分享知識的考慮,我和小姐姐做了深度溝通。發現對於已經工作的同學而言,轉行有著至少三大難關。
第一,曰:沒精力。作為一個Ace銷售,小姐姐性格非常獨立堅強。想要她放下工作,關門謝客,再交上幾萬塊培訓費去讀個培訓班是非常不現實的。人家已經習慣了照顧家人而不是被人照顧。而且處於工作敏感性,她也不信任那些培訓機構的銷售:「還交一萬九年薪五十萬就業,他自己怎麼不交一萬九還在這賣課?」好吧,這個邏輯簡直無懈可擊
第二,曰:沒基礎。我也試著向小姐姐介紹sas,不過真的是一個字都看不懂。「我在學校都沒搞懂,現在咋可能搞懂」好吧,又是一個無懈可擊的邏輯。那試著介紹一下spss吧,可視化戳戳戳總行了吧。結果發現光安裝就卡了好久。而且一點統計基礎都沒有的話,也不知道戳出來是個啥。
第三,曰:沒記性。我轉了一些文章讓小姐姐看,基本上前腳看後腳忘。因為工作中用不到。實際上,我自己也有這種感覺。工作中用不到的東西,即使對著學了忘的也特別快。因為平時不用啊,就靠對著課本練,脫離書就是個獃子。
咋辦?我認真思考了問題的關鍵:如果能找到一個工作中就能用到的例子開始訓練就好了。真是完全沒有基礎的話,一上來就列一堆信息、公式、概念只會把人繞暈。如果能找個簡單的方法讓她理解到:什麼是數據、什麼是分析,後續如何做數據分析就是水到渠成的事。剛好我當時正在做相關的項目,優秀的銷售和死蠢的銷售都接觸過,這一點極大的啟發了我後來的思路。
我試著啟發小姐姐的思路,從一個簡單的問題開始:什麼樣的顧客容易成功?小姐姐瞬間打開了話匣子,列舉一堆例子。OK,這裡先不急著講完所有故事,我拿出了銀行信用卡申請表,問道:假設把剛才故事裡的顧客特徵對應到表上需要填的這些空格,該如何填?小姐姐愣了一下,然後開始笑話這些申請表能記錄的信息太少,很多信息需要銷售直觀判斷。OK,我繼續引導:所以這裡就有兩類信息:一類容易記錄的、客觀的、格式化的數據,一類難記錄的、主觀的、個性化的數據。然而,後台的工作人員遠在千里之外,他們無法直面顧客,他們只能通過能記錄的數據來判斷,考慮做什麼樣的政策,出什麼樣產品。所以,如果你真想轉到後台去的話,你就得想辦法:要麼從現有的有限的數據中得出結論,要麼把主觀的數據合理記錄下來。
小姐姐似乎想到了什麼,然後開始說:那樣的話,這裡哪幾個欄位可能最有用處,這裡哪些欄位其實都是銷售們瞎填的。如果真需要添加的話,能不能添加1,2,3,4個維度,而且為了防止一線的銷售們瞎搞,還可以配合比如工牌照片、人車合照等等辦法。我們邊聊,邊拿出一張值,把可以用的、有問題的、需要添加的欄位都記錄下來,並且標上數據格式,填寫規範等等。完成以後,我開始介紹:這就是後台部門面臨的資料庫的簡單樣式,有欄位、欄位屬性、數據來源、數據真實性、數據清理等等等問題。小姐姐似乎一下恍然大悟,這樣講比一上來講什麼數據倉儲容易理解多了。
於是我趁勝追擊,開始引導一下階段問題:你看,你一個月能做100多張卡,有沒有計算過辦哪些卡,總收入更高?(不同信用卡對應的提成,是否伴隨貸款,是否開自動還款業務都會影響提成收入)。小姐姐開始認真考慮不同產品組合下自己的收入。之前也有考慮過,但從沒有認真計算過數據,都是自己粗略估算或者聽營銷中心的日報。有了之前的基礎,我們開始分解日報。利用一張最基礎的含用戶、卡信息的excel表,開始試著做數據統計,計算收入。因為和收入有關,所以小姐姐計算起來格外起勁。並且數據透視表、求和、平均值、if等公式用幾次就會了。
於是我趁勝追擊*2,開始引導一下階段問題:你看,這些卡片銷售數據和顧客特徵結合起來,是不是可以看出來哪些顧客容易辦哪種卡?(不是所有的申請表都會被批准的,多多少少都會退一批,填寫規範下,過審率一般六成左右)。小姐姐一下興趣被調了起來,因為被退卡是一線銷售非常深惡痛絕的事,因此我們繼續拿基礎excel表練習,這次是練習交叉表。開始交叉分類看用戶特徵,試著用不同維度交叉,看哪些類型用戶更容易被pass。嘗試幾次後,竟然發現銷售們日常總結的審批規律,有一些還真有道理,甚至還反推出一些審批的潛規則。
於是我趁勝追擊*3,開始引導一下階段問題:你看,你作為這麼厲害的銷售,肯定有些人會比你差。你和他們比,他們差在哪裡。小姐姐又一下興趣大開,講了一堆很具體的行為差異。OK,我們回歸一下,把這些具體事件中的可以用數據量化的部分截取出來,把那些不能用數據量化的部分,看看是否能有欄位記錄。這樣再歸納以後,就找出來衡量銷售行為的基本指標,進而導出了分析團隊業績的基本思路。(實際上,我直接分享了部分項目結論給她。自己解讀數據是個很好的嘗試思路,但是一個0基礎自學者,自己總結結論還是太難了)。
完成這幾步以後,小姐姐已經基本具備了數據分析的初級能力,還差臨門一腳:簡歷要怎麼投?因為數據分析範圍實在太寬泛了,即使做了訓練,以小姐姐的能力投開發類崗位也實在是天方夜譚。好在銀行里各個分行、營銷中心都有數據專員的崗位,這些崗位主要任務就是做銷售數據分解和解讀,小姐姐的能力非常適合。最後臨門一腳,幫小姐姐包裝一下簡歷,一頓飯的功夫,突出一下在分析問題上的經驗和能力,之後便一投即中。雖然薪資降低了不少,但是還是如願做了不用風吹日晒的後台工作。
後來,聽說小姐姐嫁了人。俺也在太太的監督下,清空了所有這種100%出於學習分享目的講過一大堆話的小姐姐的聯繫方式。後續的情況不得而知。但這確實是我指導過的,最有挑戰性、最0基礎、也最快速實現轉行的例子了。前後用了沒倆月。回想起來,小姐姐雖然數學和代碼基礎差,但有幾個優勢:
第一,業務能力強。對業務流程非常熟悉,有豐富實戰經驗。這樣很容易找出業務中的問題,就容易找到分析問題的思路,看到數據也容易明白含義。第二,思維邏輯性好。比如第一步總結顧客特徵,她可以很快理解我的用意,把那些一個個具體的人,歸納成:39歲、小企業主、500萬經營收入、本地人等等欄位。數據分析是以欄位為基礎的,這一步如果理解不了,就真的深入不下去了。我也見過很多思維方式特別感性的人,就是卡在這一步,始終無法把一個具體事情抽象成一組數據,後邊的分析也就無法基於數據進行了。他們更多是基於感情、直覺做判斷,把數據分析的過程視為一個黑箱,等著聽結論。第三,動手能力強。Excel操作幾次就會了,沒有耽擱很多時間反覆練習。第四,公關能力強。營銷中心、卡中心她認識不少人,直接拿到了內部一些數據表做練習,進步非常快。這個真的是用模擬數據無法比擬的優勢了。
而我只是起到一個穿針引線的作用。找了一個好的切入點,吊起來她的興趣,讓她能堅持思考下去,而不是半途而廢。或者裝著一腦袋和工作完全不相關的東西,完全不知道學了有什麼用。其實數據分析,是數據+分析組成的。技術上如何生成數據是一個切入點。業務上如何做分析也是一個切入點。能從問題出發的好處,就是能以始為終,很快找到思路。當然,這是以能理解數據欄位、數據來源為前提的。
當然,這是極特別的個案,其實但凡有一些excel、sql基礎,上路都不會這麼艱難,也不需要那麼強公關能力或者顏值什麼的。即使看起來行業差的特別遠,即使崗位看起來特別奇怪也沒有關係。因為數據分析其實是職場的一項基本技能,在哪裡都有用,在哪裡都能練習。
比如我遇到過一個三線城市做拖拉機設計的男同學。他想轉數據分析,但滿眼望去,都是「互聯網數據分析XXX」。感覺自己的工作跟數據分析,跟互聯網很遙遠。然而我不這麼認為。我提示他:你做設計,也分創新設計和改良設計。如果改良,你要改哪些款?為什麼選這些款?是銷量不好,還是故障率高,還是用戶口碑差?如果是銷量不好,怎麼判定好?數據從哪裡來?標準怎麼定?
拖拉機哥認真想想,忽然覺得恍然大悟:是哦!平時會走訪市場,會看不同省市區的銷量,還會看售後服務的數據,就是從來沒認真思考過這些。平時工作都是拍腦袋,看著哪個月問題多了就做個市場走訪,收集收集問題回來寫報告,從來沒認真思考過到底什麼數據算好!這麼一說還真的有挺多東西可以挖的!
我繼續鼓勵他:是滴,這就是一個項目了!因為有明確的目標:改良產品,有明確的時間限制。如果你再主動跟蹤下,你們改良後的產品批次是否故障率下降,這就是成果。這就是標標準準的一個數據驅動產品迭代升級的例子。誰說傳統企業沒有數據思維了,只是大家都習以為常了。
還是拖拉機哥,在整理了思路後,覺得自己有信心了。但他想面試的互聯網公司大部分都要求python,SQL一類經驗,在現有崗位上確實沒得練習。還是得練爬蟲。我又提示他:做產品研發,你們肯定會參照競品是不是?以前的競品信息八成是手動更新的吧。你可以把爬蟲技能拿來練習爬競品產品信息啊,從官網上、從阿里巴巴,反正只要能找到信息的都可以爬。這些可是貨真價實對你工作有用的呢,不比爬什麼拉勾網管用。
拖拉機哥恍然大悟:是啊,這樣還能顯得利用爬蟲提高了工作效率,還能進一步分析,自學的也與工作結合了。這個例子敢拿出來講,當然是happy ending,拖拉機哥如願離開內地三線城市到了魔都成為一名互聯網數據分析師,薪酬翻了1.5倍。雖然在陳老師看來,他那個薪酬在四線城市不少了,但是人各有志,達到自己的目標就好。
類似的例子還有很多,比如財務的同學可以練習ROI分析、做經營分析;比如運維的同學可以練習項目開發資源管理的分析;比如做銷售的同學可以練習目標客戶與銷量分析;比如做開發的同學至少接觸過數據可視化。其實,數據早已滲透進工作方方面面,對轉行的同學來說,最大的敵人是:「習以為常」四個字。太多的固定思維,導致對數據不敏感,導致分析能力下降。導致看不到自己工作中的數據應用,導致過份依賴網上所謂「乾貨」。然而收藏的東西固然多,買的書本固然厚,能看完吸收的又有多少?
寫sql,python是一種技能,數據分析是一種能力。技能可以照抄,能力需要鍛煉。不練,永遠不會。與大家共勉。
更多分享,可關注公眾號:接地氣學堂
學習中
大數據時代已經來臨,但是今天我們不聊這麼高大上的東西,哈哈,我也不會,我們今天要聊的是網站數據分析。我們知道它是網站運營中必不可少的一部分,怎麼才能知道自己的運營效果,最好的辦法就是通過數據分析。
然而,對於新手朋友來說,這是個比較頭疼的問題,通過安裝數據統計代碼,每天也能收集大量的網站數據,但是越看越頭大,更別提從裡面發現問題了。這種現象就會直接影響你網站運營中一個很重要的環節——優化。或者這樣說,你所有的優化工作都是基於主觀判斷,沒有數據支撐,凡事都是「我認為」;歸根結底一個原因,你的數據分析沒有目的性,今天我就來和大家聊聊什麼樣的數據分析才是有價值的,希望對新手朋友有所幫助。
在講如何進行數據分析之前,我們先說幾個常見的場景,如果你還是像下面的這樣進行網站數據分析,那麼你就是不合格的:
一、只是簡單的添加全站統計分析代碼;
從統計網站上面獲取的一段代碼,放在網站上面以後就不管了,我想大多數新手朋友做數據分析的時候都是這樣乾的,每天過來只是簡單的看下昨天的流量怎麼樣,對比前天是增加還是減少了等,其實我以前也是這樣乾的,但是這種嚴格來說不是數據分析,而是數據收集!
二、跟蹤一些簡單的鏈接點擊行為;
知道跟蹤一些簡單的網站內部的鏈接點擊行為,說明你是有點數據分析的意識了,因為你已經開始意識到跟蹤網站和用戶之間的互動行為是有必要的了,但是僅僅是鏈接監測是遠遠不夠的;
以上兩種行為其實都是錯誤的,根本原因就一個:數據分析沒有目的性!所以導致的一個原因就是,在你面前的就是一堆數據,沒有任何的參考價值。
好了,問題來了,我們應該怎麼做,才能成為合格的運營數據分析?這裡就來分享一下我之前的轉變思路歷程,希望能夠對你有所啟發:
一、你想通過數據分析知道什麼?
我把這個叫做「分析未動,目標先行」,什麼意思?就是先不要著急去添加統計代碼,先想好一個問題,你要通過數據分析了解哪些信息?比如這些:
1、用戶購買率:某段時間內,訪問你網站的人有多少佔比成交?
2、用戶註冊率:多少比例的用戶註冊我們的會員?
3、用戶下載率:有多少用戶點擊了網站上面的下載鏈接地址?
4、用戶留存率:一個星期裡面,有多少用戶重複訪問過?
6、廣告點擊率:在外面做的硬廣點擊通過率怎麼樣?
這些都叫你的業務目標。為什麼要知道業務目標?因為你要通過它們去設計你的數據分析代碼。也就是我們下面要和大家聊得話題。
二、通過目標設計你的統計代碼
第一的目標清晰了,接下來你要做的就是從目標出發,設計你的數據分析代碼,然後幫你去收集有用的數據,然後通過這些數據你就能快速的分析出想要的結果。
目標的種類千差萬別,統計工具的類型也是各不相同。為了幫助新手朋友理解,我們這裡以Google analytics為例講解幾種非常常見的代碼設計模式:
1、廣告代碼的設計;
這種一般針對有付費廣告的情形,比如搜索詞競價,硬廣,廣點通,EDM郵箱等,我們需要知道廣告的效果,這個時候我們可以針對不同的廣告形式和平台,進行標記,以此來判斷不同廣告的效果;
在GA中有一個網址構建器,可以很方便的幫助我們進行網址標記,這樣我們在投放廣告的時候,只要把標記好的鏈接地址寫上就可以了(如果對於構建器的參數不了解的,可以參考GA幫助手冊);
假如:我們的域名是http://www.abc.com,現在銷售一本電子書(ebook),我們做了百度推廣,競價和電子書有關的關鍵詞「xyz」,這個時候我們就可以構建這樣的地址:
2、網站轉化代碼的設計;
前面的文章中,我們講過轉化的類型有很多,註冊,下載,購買,諮詢等,我們可以根據業務來設置自己的轉化目標,然後在轉化報告中去有針對性的分析,比如我們可以在GA後台的目標中添加不同的目標類型:
3、想看某一欄目下數據
有很多時候,我們想要看網站某一個欄目下面的數據統計,或者某一特定URL類型的廣告數據(如廣點通),這個時候我就可以利用GA的內容分組來實現,見圖:
三、收集想要數據
通過上面的代碼設計,接下來的工作就是收集數據階段了,注意要在指定的報告中去查看自己的定製數據,在GA中,我們查看廣告效果數據,我們可以在「流量獲取-&>廣告系列」報告中查看;
比如轉化類的報告數據,我們在「轉化」報告中查看:
內容分組數組可以在「行為-&>網站內容-&>所有頁面-&>內容分組」報告中查看:
四、發現問題
通過收集到有明確目標的統計數據,我們在加以分析,從不同的角度去細分,最後發現問題所在,這樣的話,就會比盲目的收集數據效率會高很多;而且這個時候,你會發現,數據分析是一項很有意思的工作;
比如我們通過對留存率的分析,發現網站的留存率很差,這個時候你就想辦法提高用戶粘性,是不是可以優化一下網站的布局,增加一些有價值的內鏈接,或者做一些活動,讓用戶參與進來,帶動網站的留存率等;
五、給出解決方案
針對發現的問題,我們除了分析原因,作為網站運營人員,我們還要給出相應的解決方法,比如:
1、為什麼跳出率很高?是不是落地頁面體驗不好、是不是跨域訪問造成的、是不是代碼部署有遺漏等等,不同的原因我們要給出相應的解決方法!
2、怎麼找到最合適的廣告投放平台?我們可以細分不同來源下的廣告效果,然後篩選出那些性價比最高的平台;
3、為什麼網站用戶註冊率很低?是不是流程太複雜,註冊按鈕不明顯等;
結語
沒有目的性的數據分析都是盲目的,有朋友說,我有目的了,不盲目了,但是就是不會操作,那你就去學習一種適合自己的網站分析工具,百度統計,CNZZ,GA都可以,把裡面基本的設置方法給研究透,記住好的運營數據分析=目標+工具,而這缺一不可。
數據驅使決策絕對不是一句空話,只有提煉有價值的數據,才能不斷的發現問題,進而解決問題。
如果小夥伴們想學習更多有關數據分析的知識,可以看看這個網站:數據分析篇學習課程
希望大家一起交流學習,共同進步!
以上,謝謝!(如果覺得回答可以記得點贊喲(^U^)ノ~YO)
可私信與我聯繫,積累了很多學習材料和案例
最重要的還是對業務的了解,必須跟所服務的對象深入交流,開始先了解他們對數據的需求,然後是他們的工作內容,甚至流程。前者能讓你的數據更有效,後者能幫助你進行創造性的分析,被動變主動,否則你覺得很完美的數據在別人那裡就只能發揮一小半的作用。
業務之外,要跟IT(或者可能本身你也是半個IT)了解多一些數據結構方面的東西,最好能跟業務邏輯結合起來,這樣更有利於快速拿到自己需要的數據。
至於技術方面,那都是水到渠成的,有google,有百度,那些所謂工具書里的東西沒有搜不到的,只要有學習能力,會學習,會搜索,沒有什麼學不會學不到的。當然有個好老師能節省很多時間。第一次回答有點小緊張,噴吧我就在這哈哈先從工具說起吧1、excel是基礎中基礎,學好真心沒商量啦2、SPSS是數據分析好手,裡面有聚類,各種回歸預測,時間序列,統計,卡方檢驗等等,易操作,屬於中級。本人經常用3,R語言是目前數據分析師主流工具,功能強大,貌似裡面的數據可視化可謂酷炫吊炸天。屬於中高級。4、python是一種編程語言,用於數據分析挖掘,網路爬蟲等。強大高級。學習C++或者面向對象程序設計可以自學啦!說起數據分析,本人真有點望眼欲穿,隨著放下大數據,雲計算概念膨脹以及各種創業公司興起,前途個人比較看好。話說一名好的數據分析師沒有不懂業務的,所以精深業務才是根本。至於菜鳥而言,先學好一些工具如上所列,還有統計學知識這就是一個起點,找到你想從事的行業再尋得一份數據分析工作就夠了夠了……其他的就到工作中磨練吧。
那給你推薦一本書吧,誰說菜鳥不會數據分析,百度雲 網盤-千絮引的分享,這裡有一些電子檔共享
從業務中來,到業務中去。
我的一篇雜文,希望能回答好這個問題
文:朱元祿(@數據分析-jacky)視野決定了境界和能力,而所處的環境又決定了視野。好多人不知道什麼是數據分析師,認為會熟練使用Excel就是數據分析師,如果你還會使用Excel中的一些高級功能如透視和函數等等,可能別人就認為你是牛*的數據分析師了,如果你工作中還用到了VBA,(word天啊!),在別人眼中你就是數據分析大神了。真的是這樣嗎?誠然,單用Excel的確可以解決大部分的數據問題,但是作為一個數據分析師,你並不是一個基層的統計分析從業者,那麼數據分析師應該是怎樣的職業呢?
(一)數據分析師的職場之路
圖1:數據分析職位分類
數據分析的職位分類按照數據處理的不同階段分為數據採集、數據分析、與數據挖掘三種。其中數據採集的概念是對企業來說的,是jacky企業(航航數據)在做的事,包括原始數據源的採集和地理信息數據的採集,這裡受眾面太窄,就不一一說了,想了解的朋友可以私信我。
下面主要說下數據分析和數據挖掘的職位:
大家要記住一句話:數據分析的職位分為業務方向與技術方向兩個方向,這兩個方向決定了兩條不同的職業規劃和晉陞途徑,包括下面章節要說的數據分析的學習規劃也跟這兩個方向緊密相關。
1、業務方向
大家在招聘網站中搜索數據分析的職位,大概分為兩類:輔助業務的數據分析職位和數據分析師職位。
1)輔助業務的數據分析:一般在零售業里職位設置較多,該職位一定要對業務爛熟於心,對業務有長時間的積澱和理解,用數據發現業務流程中的問題,並提出合理化的解決方案,分析數據是為整個商業邏輯去做支撐。細分職位包括:市場調查、行業分析和經營分析三類。
2)數據分析師:業務方向的數據分析師,該職位招聘時一定前面有一個限定詞,什麼數據分析師,歸結起來分為三類:產品數據分析師,運營數據分析師和銷售數據分析師。
2、技術方向
技術方向主要指數據挖掘方向,分為三類:數據挖掘工程師(機器學習)、數據倉庫工程師(構架師)和數據開發工程師。在互聯網和金融行業崗位設置較多
普遍來說:技術方向的基礎崗的工資薪酬要比業務崗的薪酬高一個等級,但是做到管理崗的話,在中國,業務崗的薪酬比技術崗的薪酬要高。
(二)數據分析從業者需具備的核心能力
我認為,數據分析從業者要具備四種核心能力:1、基礎科學的能力;2、使用分析工具的能力;3、掌握編程語言的能力;4、邏輯思維的能力
圖2:數據分析核心能力體系
1、基礎科學的能力
可以說,在數據決策的時代,數據分析幾乎滲透到企業的每個業務環節中,行業數據分析報告更是淋漓滿目,發布報告的有的是世界500強企業,有的是知名的數據洞察諮詢公司,jacky做為第三方數據評估機構的從業者,在看到可視化效果越來越絢麗的同時,我也憂心忡忡,大多數的數據分析報告:邏輯不見了,故事線沒有了,統計學支撐沒有了,金在其外,敗絮其中。
統計學,數學,邏輯學是數據分析的基礎,是數據分析師的內功,內功不紮實,學再多都是徒勞。
掌握統計學,我們才能知道每一種數據分析的模型,什麼樣的輸入,什麼樣的輸出,有什麼樣的作用,開始我們並不一定要把每個演算法都弄懂。
如果我們要做數據挖掘師,數據能力是我們吃飯的飯碗。如果你沒有數學能力,用現成的模型也好,模塊也好,也能做,但一定會影響你的技術提升,當然更影響你的職位晉陞。
2、使用分析工具的能力
數據分析工具:SQL、SPSS、SAS、R、EXCEL等等吧,都必須掌握並且會應用,畢竟企業需要的不是學者而是應用型人才。
3、掌握編程語言的能力
不會Python、不會R,說你懂數據分析誰都不信。
4、邏輯思維的能力
邏輯思維對於數據分析來說特別重要,不單單是數理邏輯這塊,還要有邏輯學的知識。反映商業數據里,大家可以理解為去搭建商業框架或者說是故事線,有邏輯的推進,結果才會另人信服。
下面補充下做數據分析的流程邏(參考知乎網友,有改進,非原創):
1)提出假設
2)驗證假設(統計方法)3)取數(SQL / Hive / Spark)4)清洗和整理數據(R / Python Pandas / PySpark)5)可視化(Excel / R ggplot2 / Python matplotlib)6)展示給非技術人員(PowerPoint / Tableau / iPython Notebook / R Markdown)(三)2017,數據分析學習規劃
任何一門技術或學科都有其內部規律,需要有計劃,有先後,循序漸進來學,jacky跟大家分享下潤祿數據學院的一些經驗:2017,數據分析的學習規劃(因個體差異,僅供參考)
下圖:橙色區域代表數據採集板塊,藍色區域代表數據分析板塊,綠色區域代表數據挖掘板塊。
圖3:數據分析學習規劃(從入門到中級)
1、統計學(業務方向)與SQL(技術方向):首要必會技能
任何數據分析師從事業務方向的工作都必須會統計學,統計學的學習最好輔助SPSS或其他SAS來學,做到數據分析基本功紮實,兼顧實戰性。
任何數據分析師從事技術方向的工作都必會SQL,不單是數據分析師,每一個運營、產品經理、尤其是互聯網行業,一定要會SQL,基本知名互聯網公司的產品經理都能寫SQL。
學習中,要掌握SQL的基礎語法、中級語法和常用函數,結合關係資料庫系統(Oracle Database、SQL Server、DB2等)來學習SQL語句,找好方法,真的不難。
2、Python與R:不分伯仲,都要掌握
Python主要掌握基礎語法,pandas操作、numpy操作、sklearn建模,學會用python編寫網路爬蟲爬取數據,等等。
R語言就是為了統計而存在的語言,我們要掌握R語言的基礎語法、數據管理、數據挖掘建模與評估等。
以上是我們第二階段要學的技能。
3、數據可視化
有了Python、和R的基礎,我們可以就可以學習數據可視化了。運營和產品都需要學習可視化,可視化說白了,就是畫圖,但做為數據分析師來說,我們不能用EXCEL 來實現可視化,因為它的局限性太大了。這裡也不建議花太多時間學習給非專業人士展示的Tableau,有1個小時學會Tableau足夠。
Python中可視化的工具有matplotlib,seaborn,ploltly;
R中可視化工具有plot基礎庫、ggplot2
隨心所欲,用Python和R,你就知道做數據分析工作是多麼爽一個事
4、數據挖掘
這裡知道要掌握基本概念,知道數據挖掘時做什麼的,知道它與數據分析相比有什麼不同
5、監督學習、非監督學習、模型評估
Model建模,知道模型建好後應該怎樣去評估,掌握怎樣用一些定量的指標,數據,數值來衡量模型建好後到底有多準確,或者說到底有多錯誤。模型評估的指標或計算方式選擇正確與否,能夠直接影響到整個項目獲模型是否有效。
6、以上這些只是數據分析的入門,還有... ...
機器學習,文本與自然語言處理,分散式計算工具SPARK.... ...
數據分析的路上,你準備好了嗎?2017,跟我一起,來逆襲吧
End
轉載請註明出處
創建於 13:14著作權歸作者所有誰說菜鳥不會數據分析 是這名吧~~~講的比較實用包括怎樣作圖 怎樣寫報表 怎樣分析之類的·~
新手。在看《精通Web Analytics 2.0-用戶中心科學與在線統計藝術》從最基本的會話、訪問、跳出率到綜合的案例分析都有介紹。更多時候,作者在傳遞的是一種思考的方式而不僅僅是介紹理論。推薦。
寫論文的時候恨不得把能想到的數據分析方法全部用一遍,弄了很龐大的一堆表格,奔著優秀論文去的結果大出所望,至今仍是心頭傷。工作後一次周報中用了只是用了個數據透視表,簡單幾句話讓同事膜拜了好久。工具只是工具,弄出一堆數據無從分析是大忌,別人看著也會煩。
推薦閱讀:
※機器學習中使用「正則化來防止過擬合」到底是一個什麼原理?為什麼正則化項就可以防止過擬合?
※想在機器學習做演算法的創新是否必須讀博士?
※你所在的公司或者領域在做哪些大數據應用?
※在機器學習中有哪些典型的Online演算法?
※數據與數據圖表的適用規則?