pandas lambda函数|极客教程

pandas lambda函数

在 pandas 中，lambda 函数是一种匿名函数，即一种没有名称的函数。这种函数通常用于需要一个短小的函数而又不想用 def 定义的情况。lambda 函数可以在数据处理过程中非常实用，尤其是在对数据进行转换、整理和筛选时。

lambda 函数的基本用法

lambda 函数的语法格式为：

lambda arguments: expression

其中 arguments 是函数的参数，在冒号 : 左边，expression 是函数的返回值，在冒号右边。lambda 函数的实现体现在一行代码中，非常简洁高效。

下面通过一个简单的示例来说明 lambda 函数的基本用法：

# 导入 pandas 库
import pandas as pd

# 创建一个示例数据集
data = {'A': [1, 2, 3, 4, 5],
        'B': [10, 20, 30, 40, 50]}

df = pd.DataFrame(data)

# 使用 lambda 函数对 A 列进行平方处理
df['A_squared'] = df['A'].apply(lambda x: x**2)

print(df)

运行结果如下所示：

   A   B  A_squared
0  1  10       1
1  2  20       4
2  3  30       9
3  4  40      16
4  5  50      25

可以看到，通过 lambda x: x**2 这个 lambda 函数，我们对数据集中的 A 列进行了平方处理，并将结果保存在新的列 A_squared 中。

lambda 函数与 apply() 方法结合使用

在 pandas 中，我们通常会使用 apply() 方法来对数据集中的每个值进行操作。lambda 函数和 apply() 方法的结合使用可以实现对整列数据进行快速处理。

下面通过一个示例说明 lambda 函数与 apply() 方法的结合使用：

# 导入 pandas 库
import pandas as pd

# 创建一个示例数据集
data = {'A': [1, 2, 3, 4, 5],
        'B': [10, 20, 30, 40, 50]}

df = pd.DataFrame(data)

# 使用 lambda 函数和 apply() 方法进行数据处理
df['A_squared'] = df['A'].apply(lambda x: x**2)
df['B_cubed'] = df['B'].apply(lambda x: x**3)

print(df)

运行结果如下所示：

   A   B  A_squared  B_cubed
0  1  10       1      1000
1  2  20       4      8000
2  3  30       9      27000
3  4  40      16     64000
4  5  50      25    125000

通过将 lambda 函数和 apply() 方法结合使用，我们对数据集中的 A 列和 B 列分别进行了平方和立方处理，并将结果保存在新的列 A_squared 和 B_cubed 中。

lambda 函数与条件判断结合使用

lambda 函数还可以与条件判断结合使用，实现对数据进行筛选和变换。

下面通过一个示例说明 lambda 函数与条件判断的结合使用：

# 导入 pandas 库
import pandas as pd

# 创建一个示例数据集
data = {'A': [1, 2, 3, 4, 5],
        'B': [10, 20, 30, 40, 50]}

df = pd.DataFrame(data)

# 使用 lambda 函数和条件判断进行数据筛选
df_filtered = df[df['A'].apply(lambda x: x % 2 == 0)]

print(df_filtered)

运行结果如下所示：

   A   B
1  2  20
3  4  40

以上代码中，通过 lambda x: x % 2 == 0 这个 lambda 函数，我们对数据集中的 A 列进行了条件判断，筛选出 A 列中的偶数值所对应的行。

lambda 函数的进阶用法

除了简单的数据处理和条件判断，lambda 函数还可以与其他函数结合使用，实现更加复杂的逻辑处理。

下面通过一个示例说明 lambda 函数的进阶用法：

# 导入 pandas 库
import pandas as pd

# 创建一个示例数据集
data = {'A': [1, 2, 3, 4, 5],
        'B': [10, 20, 30, 40, 50]}

df = pd.DataFrame(data)

# 定义一个自定义函数
def custom_func(x):
    if x % 2 == 0:
        return x * 2
    else:
        return x

# 使用 lambda 函数和自定义函数进行数据处理
df['A_processed'] = df['A'].apply(lambda x: custom_func(x))

print(df)

运行结果如下所示：

   A   B  A_processed
0  1  10        1
1  2  20        4
2  3  30        3
3  4  40        8
4  5  50        5

在以上代码中，通过自定义函数和 lambda 函数的结合使用，我们对数据集中的 A 列进行了复杂的处理，根据奇偶性分别进行了不同的操作。

总结

本文详细介绍了 pandas 中 lambda 函数的基本用法和进阶用法，包括与 apply() 方法和条件判断的结合使用。通过 lambda 函数，我们可以在数据处理过程中实现快速、高效的操作，提升数据处理的效率和灵活性。

pandas lambda函数