求均值及索引時Pandas的特性
05-08
求平均值時,Numpy要加入行或列的參數,才能計算行或者列的平均值。否則計算整個表格的平均值,往往是無意義的。Pandas可以直接求出列的平均值。
Pandas可以有鍵名來索引,Numpy只能用數字。因為通常不會記住第幾列,所以pandas現實使用時用鍵名會更清晰。
【Numpy】
#按行求平均數
a. mean(axis=1)
#按列求平均數
a.mean(axis=0)
【Pandas】
#平均值:是默認按每列來求平均值
salesDf.mean()
其他特性:
salesDf[商品名稱]#與salesDf.loc[:,商品名稱]相同,更簡單。這是有index的情況下。表格沒有index時不能這麼用。
#通過切片功能,獲取指定範圍的列
salesDf.loc[:,購葯時間:銷售數量]
#可以對列進行查詢
querySer=salesDf.loc[:,銷售數量]>1
#輸出查詢後為true的整行
salesDf.loc[querySer,:]
新增知識點
fileNameStr=./朝陽醫院2018年銷售數據.xlsx#./為與本執行文件同一個文件夾下的文件
#格式化輸出
print(客單價:%.2f%pct)
封面圖來自熊二的搜索結果_百度圖片搜索
推薦閱讀:
※Python XGBoost演算法代碼實現和篩選特徵應用
※記一次調試python內存泄露的問題
※Python 構建一個簡單爬蟲系統 (二)
※用Python做Lorenz attrator的動畫模擬