Pandas填补空栏
有时,数据框架中包含一个空列,在现实生活中可能会造成一个真正的问题。缺少的数据在pandas中也可以称为NA(Not Available)值。在DataFrame中,有时许多数据集只是到达了缺失的数据,要么是因为它存在但没有被收集,要么是它从未存在过。在这篇文章中,让我们看看如何使用pandas来填补数据框架中的空列。
填写空栏:
import pandas as pd
df = pd.read_csv("Persons.csv")
df
首先,我们导入pandas,然后在df变量中加载我们的CSV文件。试着在jupyter notebook或colab中运行这个程序。
输出:
df.set_index('Name ', inplace=True)
df
这一行用来删除索引值,我们不希望这样,所以我们删除它。
输出:
有几种方法可以用来填补空栏,我们将逐一看到它
方法1:
在这个方法中,我们将使用 “df.fillna(0) “将所有NaN元素替换为0。
示例:
df1 = df.fillna(0)
df1
输出:
方法2:
在这个方法中,我们将使用 “df.fillna(method=’fill’)”,它被用来向前或向后传播非空值。
语法: DataFrame.fillna ( value=None , method=None , axis=None , inplace=False , limit=None , downcast=None )
df2 = df.fillna(method='ffill')
df2
输出:
方法3:
在这个方法中,我们将使用 “df.interpolate()”。
语法: DataFrame.interpolate ( method=’linear’ , axis=0 , limit=None , inplace=False , limit_direction=None , limit_area=None , downcast=None , **kwargs )
df3 = df.interpolate()
df3
输出: