標籤:

將python運用到實際案例分析中(第四關作業)

將python運用到實際案例分析中(第四關作業)

將python運用到實際案例分析中(第四關作業)

本章節主要分為兩個部分,一是理解數據分析,二是分析銷售數據案例析銷售數據案例

一、理解數據分析

此處又分為一維數據分析、二維數據分析

一維數據分析用Numpy(array)和pandas(series)

用Numpy定義一維數據:a=np.array([1,2,3,4]), 可以實現查詢元素、切片訪問、查看數據類型等多種功能

用pandas定義一維數據:a=pd.series([1,2,3,4]), 可以用Stocks.descbibe()用於獲取統計信息,iloc屬性用於根據位置獲取值,loc屬性用於根據索引獲取值

二維數據分析用Numpy(array) 和pandas(dataframe)

定義二維數據:a=np.array([1,2,3],[4,5,6]),可以查詢元素,獲取某行或某列數據。

pandas表示數據框(dataframe)時,可製作有序的數據框,計算平均值,iloc屬性用於根據位置查詢值,loc屬性用於根據索引查詢值。

二、銷售數據分析案例

解決問題的思路:提出問題—理解數據—數據清洗—構建模型——數據可視化

其中,1.提出問題:本案例中業務指標1-3是需要解決的問題,需根據提出的問題構建模型。

業務指標1:月均消費次數=總消費次數/月份數

業務指標2:月均消費金額=總消費金額/月份數

業務指標3:客單價=總消費金額/總消費次數

2.數據清洗步驟:選擇子集、列表重命名、缺失數據處理、數據類型轉換、數據排序、異常值處理

以下為第四章作業代碼匯總:

ps:本來有截圖修改過的,但是一導入文檔又變成之前的圖片了,所以看上去有一點混亂。

食品藥品的案例

讀取表格數據

SalesDf.head()列印前5行

查看列的數據類型:dtype

有多少行多少列:shape

每一列的統計數:SalesDf.describe()


推薦閱讀:

50年前我們預想的今天(2017年)人類科技發展是什麼樣的?
氰化物!不怕,我教你怎麼檢測~~
花樣雷軍:穿過科技與人文的十字路口
關於預測的矛盾想了很久不明白。?
有哪些讓你忍不住想吐槽/點贊的設計或者設定?

TAG:科技 |