標籤:

基於Numpy、Pandas分析包對某藥店銷售數據分析

數據分析常用工具包Numpy、Pandas、matplotlib,本文將重點介紹Numpy、Pandas分析包,利用Numpy、Pandas對某藥店銷售數據分析。

一、Numpy一維數組

二、Numpy二維數組

三、Pandas一維數組

四、Pandas二維數組

五、案列分析(藥店銷售數據分析)

一、Numpy一維數組

二、Numpy二維數組

三、Pandas一維數組

四、Pandas二維數組

五、案列分析(藥店銷售數據分析)

1、數據分析基本過程

1.1、提出問題

從銷售數據中分析出以下業務指標: 1)月均消費次數 2)月均消費金額 3)客單價 4)消費趨勢

1.2、理解數據

1.3、數據清洗

1.3.2、列名重命名

1.3.3、缺失數據處理

dropna函數詳細使用地址:

pandas.DataFrame.dropna - pandas 0.22.0 documentationpandas.pydata.org

1.3.4、數據類型轉換

1)、字元串轉為數值(浮點型)

2)、字元串轉換為日期類型

None與NaN區別:None是Python的一種數據類型,NaN是浮點類型 兩個都用作空值

1.3.5、數據排序

1.3.6、異常值處理

1.4、構建模型

1.4.1、業務1:月均消費次數=總消費次數 / 月份數

1.4.2、業務2:月均消費金額 = 總消費金額 / 月份數

1.4.3、業務3:客單價=總消費金額 / 總消費次數

客單價(per customer transaction)是指商場(超市)每一個顧客平均購買商品的金額,客單價也即是平均交易金額。

推薦閱讀:

人人都是數據科學家?Airbnb數據大學開課了
一篇文章入門Python
SQL初級數據分析(基於Microsoft Access)
大數據有哪些工作崗位,日常工作內容是什麼,需要掌握哪些工具和技能
R語言4月到6月全職學習計劃

TAG:數據分析 |