pandas 删除|极客教程

pandas 删除

在数据分析和处理中，经常需要对数据进行删除操作。pandas 是一个强大的数据分析工具，提供了丰富的方法来删除数据。本文将详细介绍 pandas 中一些常用的删除数据的方法和注意事项。

删除行或列

在 pandas 中，可以通过 drop() 方法来删除行或列。drop() 方法有两个重要的参数：labels 和 axis。labels 参数用于指定要删除的行或列的索引或标签，axis 参数用于指定是删除行还是列，其中 axis=0 表示删除行，axis=1 表示删除列。

删除行

import pandas as pd

data = {'A': [1, 2, 3, 4],
        'B': [5, 6, 7, 8],
        'C': [9, 10, 11, 12]}

df = pd.DataFrame(data)
print("原始数据:")
print(df)

df.drop(index=1, inplace=True)
print("\n删除第1行后的数据:")
print(df)

运行结果：

原始数据:
   A  B   C
0  1  5   9
1  2  6  10
2  3  7  11
3  4  8  12

删除第1行后的数据:
   A  B   C
0  1  5   9
2  3  7  11
3  4  8  12

删除列

df.drop(columns=['B'], inplace=True)
print("\n删除列 B 后的数据:")
print(df)

运行结果：

删除列 B 后的数据:
   A   C
0  1   9
2  3  11
3  4  12

在 drop() 方法中设置 inplace=True 可以直接在原始数据上进行删除操作，而不是返回一个删除后的副本。

删除缺失值

在数据分析中，缺失值是经常遇到的问题。pandas 提供了 dropna() 方法来删除包含缺失值的行或列。

data = {'A': [1, 2, None, 4],
        'B': [5, None, 7, 8],
        'C': [9, 10, 11, 12]}

df = pd.DataFrame(data)
print("原始数据:")
print(df)

df.dropna(inplace=True)
print("\n删除缺失值后的数据:")
print(df)

运行结果：

原始数据:
     A    B   C
0  1.0  5.0   9
1  2.0  NaN  10
2  NaN  7.0  11
3  4.0  8.0  12

删除缺失值后的数据:
     A    B   C
0  1.0  5.0   9
3  4.0  8.0  12

删除重复值

有时候数据中会存在重复值，可以使用 drop_duplicates() 方法来删除重复值。

data = {'A': [1, 2, 1, 4],
        'B': [5, 6, 5, 8],
        'C': [9, 10, 9, 12]}

df = pd.DataFrame(data)
print("原始数据:")
print(df)

df.drop_duplicates(inplace=True)
print("\n删除重复值后的数据:")
print(df)

运行结果：

原始数据:
   A  B   C
0  1  5   9
1  2  6  10
2  1  5   9
3  4  8  12

删除重复值后的数据:
   A  B   C
0  1  5   9
1  2  6  10
3  4  8  12

删除指定条件的行或列

除了以上介绍的删除方法，还可以根据指定条件来删除行或列。

data = {'A': [1, 2, 3, 4],
        'B': [5, 6, 7, 8],
        'C': [9, 10, 11, 12]}

df = pd.DataFrame(data)
print("原始数据:")
print(df)

df = df[df['A'] > 2]
print("\n根据条件删除行后的数据:")
print(df)

运行结果：

原始数据:
   A  B   C
0  1  5   9
1  2  6  10
2  3  7  11
3  4  8  12

根据条件删除行后的数据:
   A  B   C
2  3  7  11
3  4  8  12

以上是一些常用的 pandas 删除数据的方法，根据实际情况选择合适的方法来处理数据，可以使数据清洗和分析更加高效准确。

pandas 删除

pandas 删除

删除行或列

删除行

删除列

删除缺失值

删除重复值

删除指定条件的行或列

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程

Pandas 精品教程

回顶部