求均值及索引時Pandas的特性

求平均值時,Numpy要加入行或列的參數,才能計算行或者列的平均值。否則計算整個表格的平均值,往往是無意義的。Pandas可以直接求出列的平均值。

Pandas可以有鍵名來索引,Numpy只能用數字。因為通常不會記住第幾列,所以pandas現實使用時用鍵名會更清晰。

【Numpy】

#按行求平均數

a. mean(axis=1)

#按列求平均數

a.mean(axis=0)

【Pandas】

#平均值:是默認按每列來求平均值

salesDf.mean()

其他特性:

salesDf[商品名稱]#與salesDf.loc[:,商品名稱]相同,更簡單。這是有index的情況下。表格沒有index時不能這麼用。

#通過切片功能,獲取指定範圍的列

salesDf.loc[:,購葯時間:銷售數量]

#可以對列進行查詢

querySer=salesDf.loc[:,銷售數量]>1

#輸出查詢後為true的整行

salesDf.loc[querySer,:]

新增知識點

fileNameStr=./朝陽醫院2018年銷售數據.xlsx#./為與本執行文件同一個文件夾下的文件

#格式化輸出

print(客單價:%.2f%pct)

封面圖來自熊二的搜索結果_百度圖片搜索


推薦閱讀:

Python XGBoost演算法代碼實現和篩選特徵應用
記一次調試python內存泄露的問題
Python 構建一個簡單爬蟲系統 (二)
用Python做Lorenz attrator的動畫模擬

TAG:Python | 數據分析 |