pandas遍历每一行数据|极客教程

pandas遍历每一行数据

在使用 pandas 进行数据处理时，经常会遇到需要遍历 DataFrame 中的每一行数据的情况。本文将详细介绍如何使用 pandas 进行遍历每一行数据，以及一些常用的方法和技巧。

1. 遍历 DataFrame 的每一行数据

在 pandas 中，可以使用 iterrows() 方法来遍历 DataFrame 的每一行数据。该方法会返回每一行的索引和数据，可以通过这个数据来进行进一步处理。

下面是一个简单的示例代码，演示如何遍历 DataFrame 的每一行数据并输出：

import pandas as pd

# 创建一个示例 DataFrame
data = {'A': [1, 2, 3], 'B': ['a', 'b', 'c']}
df = pd.DataFrame(data)

# 遍历每一行数据
for index, row in df.iterrows():
    print(f'Index: {index}')
    print(f'Row data:\n{row}\n')

运行结果如下所示：

Index: 0
Row data:
A    1
B    a
Name: 0, dtype: object

Index: 1
Row data:
A    2
B    b
Name: 1, dtype: object

Index: 2
Row data:
A    3
B    c
Name: 2, dtype: object

可以看到，通过 iterrows() 方法我们可以遍历每一行数据，并对每一行进行进一步处理。

2. 使用 apply() 方法

除了 iterrows() 方法外，还可以使用 apply() 方法来对 DataFrame 的每一行进行处理。apply() 方法接收一个函数作为参数，该函数会被应用到每一行数据上。

下面是一个示例代码，演示如何使用 apply() 方法对每一行数据进行处理：

import pandas as pd

# 创建一个示例 DataFrame
data = {'A': [1, 2, 3], 'B': ['a', 'b', 'c']}
df = pd.DataFrame(data)

# 定义一个函数，处理每一行数据
def process_row(row):
    return row['A'] * 2

# 对每一行进行处理
df['A_processed'] = df.apply(process_row, axis=1)

print(df)

运行结果如下所示：

   A  B  A_processed
0  1  a            2
1  2  b            4
2  3  c            6

可以看到，通过 apply() 方法我们可以对每一行数据进行自定义处理，并将处理结果保存在新的列中。

3. 使用 lambda 函数

除了定义一个独立的函数外，还可以使用 lambda 函数来对每一行数据进行快速处理。lambda 函数是一种匿名函数，可以简洁地表示一些简单的处理逻辑。

下面是一个示例代码，演示如何使用 lambda 函数对每一行数据进行处理：

import pandas as pd

# 创建一个示例 DataFrame
data = {'A': [1, 2, 3], 'B': ['a', 'b', 'c']}
df = pd.DataFrame(data)

# 使用 lambda 函数对每一行进行处理
df['A_processed'] = df.apply(lambda row: row['A'] * 2, axis=1)

print(df)

运行结果与上一节的示例相同。lambda 函数在处理简单逻辑时非常方便快捷。