使用藥店數據分析
02-24
藥店數據分析
數據分析的一般步驟(自己借鑒並總結的6個步驟):明確本次分析的目標、觀察和理解給定的數據、數據清洗、構建模型、數據可視化、產生報告。R或者Python等在數據分析中扮演的工具的角色,並不是數據分析的重點,而且並不是每一步都會用到工具。數據分析的目標是通過對數據的挖掘,給出報告,提出切實可行的建議,為組織目標服務。
本文通過對藥店數據進行分析,完整的闡述這個過程。
第一節:明確本次數據分析的目標
明確本次分析的目標。月均消費次數、月均消費金額、客單價、消費趨勢。
第二節:觀察和理解給定的數據
觀察和理解給定的數據。使用jupyter導入Excel數據,並從不同角度觀察數據,包括觀測、變數、導入的數據格式等。如下圖:
第三節:數據清洗
數據清洗。一般步驟:選擇子集、列名重命名、缺失數據處理、數據類型轉換、數據排序、異常值處理。如下圖:
Pandas所支持的數據類型:
1. float
2. int
3. bool
4. datetime64[ns]
5. datetime64[ns,tz]
6. timedelta[ns]
7. category
8. object
默認的數據類型是int64,float64.
第四節:構建模型
構建模型。如下圖:
第五節:數據可視化
業務指標四:消費趨勢,用可是化的手段來展示。如下圖:
第六節:產生報告
最後將這些數據分析的結果做成PPT。
推薦閱讀:
※Python的第三方庫安裝
※使用django開發一個上線標準的mooc網站(四)
※python寫的CGI腳本,用print為什麼不是列印到控制台,而是發送到客戶端?
※你打算什麼時候轉到Python3?
※給妹子講python--04迭代和列表解析式