Python3 pandas(20) 填充缺失值fillna()
05-18
Python3 pandas(20) 填充缺失值fillna()
推薦閱讀:
來自專欄 python3 pandas庫
在數據集裡面的缺失值需要填充起來,避免各種出錯。
基本的結構非常簡單:
這裡可以指定數值進行填充,也可以使用計算公式進行填充,比如np.mean(), sum()等等。
當然原數據也是沒有改變的,需要添加參數inplace=True,才可以改變原數據。
在上面這個操作中,只對『數量』這一列進行了操作,並將結果返回給了原數據。
在做分析的時候,我們經常要將缺失值填充為前一個值,或者是後一個值,而不是單純的填充0.
『bfill』就是將缺失值按照後面一個值進行填充。
ffill 就是將缺失值按照前面一個值進行填充。
這裡的前、後一個數值默認是縱向看的,如果需要使用左或者右邊的數值進行填充,只需要加參數axis=1,就可以了。
判斷一個數據是否有缺失值需要用到isnull()
這樣就能看到出有多少是缺失值了。
推薦閱讀: