Python3 pandas(20) 填充缺失值fillna()

Python3 pandas(20) 填充缺失值fillna()

來自專欄 python3 pandas庫

在數據集裡面的缺失值需要填充起來,避免各種出錯。

基本的結構非常簡單:

這裡可以指定數值進行填充,也可以使用計算公式進行填充,比如np.mean(), sum()等等。

當然原數據也是沒有改變的,需要添加參數inplace=True,才可以改變原數據。

在上面這個操作中,只對『數量』這一列進行了操作,並將結果返回給了原數據。

在做分析的時候,我們經常要將缺失值填充為前一個值,或者是後一個值,而不是單純的填充0.

『bfill』就是將缺失值按照面一個值進行填充。

ffill 就是將缺失值按照面一個值進行填充。

這裡的前、後一個數值默認是縱向看的,如果需要使用左或者右邊的數值進行填充,只需要加參數axis=1,就可以了。

判斷一個數據是否有缺失值需要用到isnull()

這樣就能看到出有多少是缺失值了。


推薦閱讀:

TAG:Python入門 | Python教程 | Python庫 |