基於Numpy、Pandas分析包對某藥店銷售數據分析
數據分析常用工具包Numpy、Pandas、matplotlib,本文將重點介紹Numpy、Pandas分析包,利用Numpy、Pandas對某藥店銷售數據分析。
一、Numpy一維數組
二、Numpy二維數組
三、Pandas一維數組
四、Pandas二維數組
五、案列分析(藥店銷售數據分析)
一、Numpy一維數組
二、Numpy二維數組
三、Pandas一維數組
四、Pandas二維數組
五、案列分析(藥店銷售數據分析)
1、數據分析基本過程
1.1、提出問題
從銷售數據中分析出以下業務指標: 1)月均消費次數 2)月均消費金額 3)客單價 4)消費趨勢
1.2、理解數據
1.3、數據清洗
1.3.2、列名重命名
1.3.3、缺失數據處理
dropna函數詳細使用地址:
pandas.DataFrame.dropna - pandas 0.22.0 documentation1.3.4、數據類型轉換
1)、字元串轉為數值(浮點型)
2)、字元串轉換為日期類型
None與NaN區別:None是Python的一種數據類型,NaN是浮點類型 兩個都用作空值
1.3.5、數據排序
1.3.6、異常值處理
1.4、構建模型
1.4.1、業務1:月均消費次數=總消費次數 / 月份數
1.4.2、業務2:月均消費金額 = 總消費金額 / 月份數
1.4.3、業務3:客單價=總消費金額 / 總消費次數
客單價(per customer transaction)是指商場(超市)每一個顧客平均購買商品的金額,客單價也即是平均交易金額。
推薦閱讀:
※人人都是數據科學家?Airbnb數據大學開課了
※一篇文章入門Python
※SQL初級數據分析(基於Microsoft Access)
※大數據有哪些工作崗位,日常工作內容是什麼,需要掌握哪些工具和技能
※R語言4月到6月全職學習計劃
TAG:數據分析 |