將python運用到實際案例分析中(第四關作業)
將python運用到實際案例分析中(第四關作業)
本章節主要分為兩個部分,一是理解數據分析,二是分析銷售數據案例析銷售數據案例
一、理解數據分析
此處又分為一維數據分析、二維數據分析
一維數據分析用Numpy(array)和pandas(series)
用Numpy定義一維數據:a=np.array([1,2,3,4]), 可以實現查詢元素、切片訪問、查看數據類型等多種功能
用pandas定義一維數據:a=pd.series([1,2,3,4]), 可以用Stocks.descbibe()用於獲取統計信息,iloc屬性用於根據位置獲取值,loc屬性用於根據索引獲取值
二維數據分析用Numpy(array) 和pandas(dataframe)
定義二維數據:a=np.array([1,2,3],[4,5,6]),可以查詢元素,獲取某行或某列數據。
pandas表示數據框(dataframe)時,可製作有序的數據框,計算平均值,iloc屬性用於根據位置查詢值,loc屬性用於根據索引查詢值。
二、銷售數據分析案例
解決問題的思路:提出問題—理解數據—數據清洗—構建模型——數據可視化
其中,1.提出問題:本案例中業務指標1-3是需要解決的問題,需根據提出的問題構建模型。
業務指標1:月均消費次數=總消費次數/月份數
業務指標2:月均消費金額=總消費金額/月份數
業務指標3:客單價=總消費金額/總消費次數
2.數據清洗步驟:選擇子集、列表重命名、缺失數據處理、數據類型轉換、數據排序、異常值處理
以下為第四章作業代碼匯總:
ps:本來有截圖修改過的,但是一導入文檔又變成之前的圖片了,所以看上去有一點混亂。
食品藥品的案例
讀取表格數據
SalesDf.head()列印前5行
查看列的數據類型:dtype
有多少行多少列:shape
每一列的統計數:SalesDf.describe()
、
推薦閱讀:
※50年前我們預想的今天(2017年)人類科技發展是什麼樣的?
※氰化物!不怕,我教你怎麼檢測~~
※花樣雷軍:穿過科技與人文的十字路口
※關於預測的矛盾想了很久不明白。?
※有哪些讓你忍不住想吐槽/點贊的設計或者設定?
TAG:科技 |