使用藥店數據分析

藥店數據分析

數據分析的一般步驟(自己借鑒並總結的6個步驟):明確本次分析的目標、觀察和理解給定的數據、數據清洗、構建模型、數據可視化、產生報告。R或者Python等在數據分析中扮演的工具的角色,並不是數據分析的重點,而且並不是每一步都會用到工具。數據分析的目標是通過對數據的挖掘,給出報告,提出切實可行的建議,為組織目標服務。

本文通過對藥店數據進行分析,完整的闡述這個過程。

第一節:明確本次數據分析的目標

明確本次分析的目標。月均消費次數、月均消費金額、客單價、消費趨勢。

第二節:觀察和理解給定的數據

觀察和理解給定的數據。使用jupyter導入Excel數據,並從不同角度觀察數據,包括觀測、變數、導入的數據格式等。如下圖:

第三節:數據清洗

數據清洗。一般步驟:選擇子集、列名重命名、缺失數據處理、數據類型轉換、數據排序、異常值處理。如下圖:

Pandas所支持的數據類型:

1. float

2. int

3. bool

4. datetime64[ns]

5. datetime64[ns,tz]

6. timedelta[ns]

7. category

8. object

默認的數據類型是int64,float64.

第四節:構建模型

構建模型。如下圖:

第五節:數據可視化

業務指標四:消費趨勢,用可是化的手段來展示。如下圖:

第六節:產生報告

最後將這些數據分析的結果做成PPT。


推薦閱讀:

Python的第三方庫安裝
使用django開發一個上線標準的mooc網站(四)
python寫的CGI腳本,用print為什麼不是列印到控制台,而是發送到客戶端?
你打算什麼時候轉到Python3?
給妹子講python--04迭代和列表解析式

TAG:Python | 數據分析 |