雨沐田:數據分析有哪些步驟呢?
之前談了數據分析的定義和作用:
雨沐田:到底什麼是數據分析? 雨沐田:數據分析有什麼作用呢?
今天來說一說數據分析的步驟,大數據分析和傳統數據分析的步驟都是一樣的,就一起說了。
在說步驟前有必要回顧下對數據分析的定義:
數據分析就是為了特定目的對相關數據在理解的基礎上進行消化,並挖掘提取有用信息的過程。
通過對數據分析的定義,就可以對步驟有個初步的分解了:
第一步:明確分析目的,設計分析的思路
不能為了數據分析而分析,目標是起點。
企業客戶轉化率分析、產品市場佔有率分析、訂單增長情況分析等等,都是一個個具體的業務目標。
有了具體的目標後,就要根據目標性質確定分析思路和方法,這裡牽扯到數據分析方法論的問題,我之後會專門分解。常見的有A/B測試法、PEST分析法、4P理論等。
第二步:收集相關數據
有了具體目標和思路後,要做的第一件事情就是收集相關數據,數據有內部數據和外部數據;從來源看,有網路數據、付費數據、免費數據、問卷調查數據等等,收集的數據越全越多,對數據分析越有利。
第三步:整理清洗收集的數據
現在能獲取數據雖然多,但拿到的數據不一定都是真的,也不一定有效的,所以要對數據進行清洗,認真篩選,刪除無效數據。
然後對剩下的有效數據進行整合、補缺等,使數據儘可能的規範、完整。
第四步:開始數據分析
之前的步驟都是為了數據分析做準備,數據分析是最核心的一步;數據分析是在既定的目標及思路的前提下,以收集到的數據為基礎,用特定的方法進行的數據提煉過程。
分析方法有很多,常見的有對比分析法、相關分析法、平均分析法、交叉分析法、漏斗圖分析法等等,數分析的方法很多,要根據分析的目標和方向來確定有什麼方法。[ 關於數據分析方法請等後文一一分解 ]
數據分析要有方法,也要藉助各種工具,常見的有Excel、SAS,SPSS,R語言等等,其中Excel最常見,也能解決絕大部分問題。
第五步:組織數據,展現數據
數據分析完了是否結束了呢?還沒有呢!
數據分析的結果往往還是一些數據,是被提煉出來的數據,這些數據並不夠直觀,對於閱讀的人來說有難度,於是要考慮數據可視化的問題,就是要讓數據以更直觀的方式展現出來,常用的方法就是將數據圖表化。常見的圖有柱狀圖、餅圖、條形圖、折線圖、散點圖等等。
圖表表現力更強,人也更喜歡看圖表。
第六步:編寫數據分析報告
數據展現了,還沒有結束,為什麼呢?
數據分析的結論需要多個數據的支撐,而每個數據分析過程又相互關聯、相互影響,數據的驗證和分析也有邏輯順序。
為此,我們直接將分析的結果全盤托出,對方可能就懵了,根本不知道這些數據和圖表是什麼,所以為了更好的傳達數據分析的觀點,需要將分析邏輯、分析思路、分析過程、分析結論等合理的組織並以專業報告的形式體現出來,可以是PPT,PDF文檔或Word等,根據需要而定。
最後一步屬於數據分析的結晶和果實,是傳達結果的最終形式。也是很多數據分析師不夠重視的一環,分析要專業,報表也要專業,一定要重視!
到這裡,一個完整的數據分析流程就結束了。傳統數據分析和大數據分析都是一樣,整理如下圖:
而數據分析的每一步都有具體的方法和工具使用技巧,更多內容且聽之後文章逐一分解。
推薦閱讀:
※使用開源軟體快速搭建數據分析平台
※從頭學習大數據培訓課程 spark 基於內存的分散式計算框架(八)Spark 的 updateStateByKey...
※初識R數據結構
※積夢智能-為中國製造業揭開數據之霧
※劉邦背後的數據分析師——蕭何