雨沐田:數據分析有哪些步驟呢?

之前談了數據分析的定義和作用:

雨沐田:到底什麼是數據分析? 雨沐田:數據分析有什麼作用呢?

今天來說一說數據分析的步驟,大數據分析和傳統數據分析的步驟都是一樣的,就一起說了。

在說步驟前有必要回顧下對數據分析的定義:

數據分析就是為了特定目的對相關數據在理解的基礎上進行消化,並挖掘提取有用信息的過程。

通過對數據分析的定義,就可以對步驟有個初步的分解了:

第一步:明確分析目的,設計分析的思路

不能為了數據分析而分析,目標是起點。

企業客戶轉化率分析、產品市場佔有率分析、訂單增長情況分析等等,都是一個個具體的業務目標。

有了具體的目標後,就要根據目標性質確定分析思路和方法,這裡牽扯到數據分析方法論的問題,我之後會專門分解。常見的有A/B測試法、PEST分析法、4P理論等。

第二步:收集相關數據

有了具體目標和思路後,要做的第一件事情就是收集相關數據,數據有內部數據和外部數據;從來源看,有網路數據、付費數據、免費數據、問卷調查數據等等,收集的數據越全越多,對數據分析越有利。

第三步:整理清洗收集的數據

現在能獲取數據雖然多,但拿到的數據不一定都是真的,也不一定有效的,所以要對數據進行清洗,認真篩選,刪除無效數據。

然後對剩下的有效數據進行整合、補缺等,使數據儘可能的規範、完整。

第四步:開始數據分析

之前的步驟都是為了數據分析做準備,數據分析是最核心的一步;數據分析是在既定的目標及思路的前提下,以收集到的數據為基礎,用特定的方法進行的數據提煉過程。

分析方法有很多,常見的有對比分析法、相關分析法、平均分析法、交叉分析法、漏斗圖分析法等等,數分析的方法很多,要根據分析的目標和方向來確定有什麼方法。[ 關於數據分析方法請等後文一一分解 ]

數據分析要有方法,也要藉助各種工具,常見的有Excel、SAS,SPSS,R語言等等,其中Excel最常見,也能解決絕大部分問題。

第五步:組織數據,展現數據

數據分析完了是否結束了呢?還沒有呢!

數據分析的結果往往還是一些數據,是被提煉出來的數據,這些數據並不夠直觀,對於閱讀的人來說有難度,於是要考慮數據可視化的問題,就是要讓數據以更直觀的方式展現出來,常用的方法就是將數據圖表化。常見的圖有柱狀圖、餅圖、條形圖、折線圖、散點圖等等。

圖表表現力更強,人也更喜歡看圖表。

第六步:編寫數據分析報告

數據展現了,還沒有結束,為什麼呢?

數據分析的結論需要多個數據的支撐,而每個數據分析過程又相互關聯、相互影響,數據的驗證和分析也有邏輯順序。

為此,我們直接將分析的結果全盤托出,對方可能就懵了,根本不知道這些數據和圖表是什麼,所以為了更好的傳達數據分析的觀點,需要將分析邏輯、分析思路、分析過程、分析結論等合理的組織並以專業報告的形式體現出來,可以是PPT,PDF文檔或Word等,根據需要而定。

最後一步屬於數據分析的結晶和果實,是傳達結果的最終形式。也是很多數據分析師不夠重視的一環,分析要專業,報表也要專業,一定要重視!


到這裡,一個完整的數據分析流程就結束了。傳統數據分析和大數據分析都是一樣,整理如下圖:

而數據分析的每一步都有具體的方法和工具使用技巧,更多內容且聽之後文章逐一分解。


推薦閱讀:

使用開源軟體快速搭建數據分析平台
從頭學習大數據培訓課程 spark 基於內存的分散式計算框架(八)Spark 的 updateStateByKey...
初識R數據結構
積夢智能-為中國製造業揭開數據之霧
劉邦背後的數據分析師——蕭何

TAG:數據分析 | 大數據分析 |