Python fillna函数用法|极客教程

Python fillna函数用法

在数据处理中，经常会遇到缺失值的情况。而在处理缺失值时，我们常会用到pandas库中的fillna函数来填充缺失值。fillna函数的作用是填充缺失值，可以根据需要填充指定的值、前一个值、后一个值或者统计值等。本文将详细介绍fillna函数的用法及示例代码。

fillna函数基本用法

fillna函数的基本用法是填充缺失值。其语法如下：

DataFrame.fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None)

参数说明：

value：填充缺失值的值，可以是数字、字符串或者字典等。
method：填充缺失值的方法，可以是ffill（用前一个值填充）、bfill（用后一个值填充）等。
axis：填充的方向，可以是0（列方向）或1（行方向）。
inplace：是否在原数据上进行填充，默认为False。
limit：填充的最大数量。
downcast：类型转换。

接下来，我们将通过一些示例代码来详细说明fillna函数的使用方法。

示例一：使用指定值填充缺失值

首先，我们创建一个包含缺失值的DataFrame数据：

import pandas as pd
import numpy as np

data = {'A': [1, 2, np.nan, 4, 5],
        'B': ['a', 'b', 'c', np.nan, 'e']}
df = pd.DataFrame(data)

DataFrame df的内容如下：

     A    B
0  1.0    a
1  2.0    b
2  NaN    c
3  4.0  NaN
4  5.0    e

接下来，我们使用指定值来填充缺失值：

df_filled = df.fillna(value=0)

填充后的DataFrame df_filled内容如下：

     A    B
0  1.0    a
1  2.0    b
2  0.0    c
3  4.0    0
4  5.0    e

从上面的示例中可以看出，缺失值被填充为指定的值0。

示例二：使用前一个值填充缺失值

接下来，我们使用前一个值来填充缺失值：

df_ffill = df.fillna(method='ffill')

填充后的DataFrame df_ffill内容如下：

     A    B
0  1.0    a
1  2.0    b
2  2.0    c
3  4.0    c
4  5.0    e

从上面的示例中可以看出，缺失值被填充为前一个值。

示例三：使用后一个值填充缺失值

接下来，我们使用后一个值来填充缺失值：

df_bfill = df.fillna(method='bfill')

填充后的DataFrame df_bfill内容如下：

     A    B
0  1.0    a
1  2.0    b
2  4.0    c
3  4.0    e
4  5.0    e

从上面的示例中可以看出，缺失值被填充为后一个值。

示例四：使用统计值填充缺失值

最后，我们使用统计值均值来填充缺失值：

df_mean = df.fillna(value=df.mean())

填充后的DataFrame df_mean内容如下：

     A    B
0  1.0    a
1  2.0    b
2  3.0    c
3  4.0  NaN
4  5.0    e

从上面的示例中可以看出，缺失值被填充为均值。

总结

通过上面的示例代码，我们详细介绍了fillna函数的用法，包括使用指定值、前一个值、后一个值以及统计值来填充缺失值。fillna函数在数据处理中非常实用，能够有效处理缺失值问题，提高数据质量和分析效率。

Python fillna函数用法