Pandas填补空栏

Pandas填补空栏

有时,数据框架中包含一个空列,在现实生活中可能会造成一个真正的问题。缺少的数据在pandas中也可以称为NA(Not Available)值。在DataFrame中,有时许多数据集只是到达了缺失的数据,要么是因为它存在但没有被收集,要么是它从未存在过。在这篇文章中,让我们看看如何使用pandas来填补数据框架中的空列。

填写空栏:

import pandas as pd
df = pd.read_csv("Persons.csv")
df

首先,我们导入pandas,然后在df变量中加载我们的CSV文件。试着在jupyter notebook或colab中运行这个程序。

输出:

填补空栏--Pandas

df.set_index('Name ', inplace=True)
df

这一行用来删除索引值,我们不希望这样,所以我们删除它。

输出:

填补空栏--Pandas

有几种方法可以用来填补空栏,我们将逐一看到它

方法1:

在这个方法中,我们将使用 “df.fillna(0) “将所有NaN元素替换为0。

示例:

df1 = df.fillna(0)
df1

输出:

填补空栏--Pandas

方法2:

在这个方法中,我们将使用 “df.fillna(method=’fill’)”,它被用来向前或向后传播非空值。

语法: DataFrame.fillna ( value=None , method=None , axis=None , inplace=False , limit=None , downcast=None )

df2 = df.fillna(method='ffill')
df2

输出:

填补空栏--Pandas

方法3:

在这个方法中,我们将使用 “df.interpolate()”。

语法: DataFrame.interpolate ( method=’linear’ , axis=0 , limit=None , inplace=False , limit_direction=None , limit_area=None , downcast=None , **kwargs )

df3 = df.interpolate()
df3

输出:

填补空栏--Pandas

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程