pandas筛选非空值
在数据分析和处理过程中,经常会遇到需要筛选数据中的非空值的情况。pandas是Python中一个强大的数据处理库,在处理数据时提供了许多方便的方法。本文将介绍如何使用pandas筛选数据中的非空值,帮助读者更好地处理数据。
1. 删除含有空值的行
首先,我们可以使用dropna()
方法删除含有空值的行。假设我们有一个包含空值的DataFrame,如下所示:
import pandas as pd
data = {
'A': [1, 2, None, 4],
'B': ['geek-docs.com', 'hello', None, 'world']
}
df = pd.DataFrame(data)
我们可以使用dropna()
方法删除含有空值的行,示例如下:
df_dropna = df.dropna()
print(df_dropna)
运行结果如下:
A B
0 1.0 geek-docs.com
1 2.0 hello
3 4.0 world
可以看到,删除空值后只剩下了含有非空值的行。
2. 筛选非空值
除了删除含有空值的行之外,我们还可以使用notna()
方法筛选出非空值。示例如下:
df_notna = df[df['A'].notna()]
print(df_notna)
运行结果如下:
A B
0 1.0 geek-docs.com
1 2.0 hello
3 4.0 world
可以看到,我们成功筛选出了’A’列中的非空值所对应的行。
3. 替换空值
有时候,在处理数据中的空值时,我们也可以选择将空值替换为其他值。这时可以使用fillna()
方法。示例如下:
df_fillna = df.fillna(0)
print(df_fillna)
运行结果如下:
A B
0 1.0 geek-docs.com
1 2.0 hello
2 0.0 None
3 4.0 world
可以看到,空值已经被成功替换为了0。
总之,pandas提供了多种方法来处理数据中的空值,包括删除含有空值的行、筛选非空值和替换空值。读者可以根据自己的需求选择合适的方法进行数据处理。