pandas assign|极客教程

pandas assign

在进行数据分析和处理时，经常需要创建新的列来储存计算得到的结果。pandas库中的assign方法可以帮助我们方便地实现这一目的。本文将详细介绍pandas中的assign方法，包括其用法、参数、示例代码以及运行结果。

1. `assign`方法的基本用法

assign方法用于向DataFrame对象中添加新的列。其基本语法如下：

DataFrame.assign(self, **kwargs)

其中，DataFrame是要操作的数据框对象，**kwargs表示以键值对的形式传入新列的名称和值。该方法会返回一个包含新列的新的DataFrame对象，原始的DataFrame对象不会被改变。

2. 参数说明

**kwargs: 关键字参数，用于传入新列的名称和值。可以一次性添加多个新列。

3. 示例代码

接下来，我们将通过一个示例来演示assign方法的用法。假设我们有一个包含学生姓名和分数的数据框df，现在我们想要计算每位学生的总分，并将总分作为新的一列添加到原数据框中。

import pandas as pd

data = {'姓名': ['小明', '小红', '小刚'],
        '语文成绩': [80, 90, 85],
        '数学成绩': [70, 85, 75]}

df = pd.DataFrame(data)

print("原始数据框：")
print(df)

# 计算总分并添加新列
df = df.assign(总分=df['语文成绩'] + df['数学成绩'])

print("\n添加总分列后的数据框：")
print(df)

4. 运行结果

原始数据框：
   姓名  语文成绩  数学成绩
0  小明     80     70
1  小红     90     85
2  小刚     85     75

添加总分列后的数据框：
   姓名  语文成绩  数学成绩   总分
0  小明     80     70  150
1  小红     90     85  175
2  小刚     85     75  160

从运行结果可以看出，我们成功地使用assign方法计算了学生的总分，并将总分作为新的一列添加到了原数据框中。

除了简单的加法运算外，assign方法还支持其他复杂的操作，比如使用lambda函数、调用自定义函数等，灵活性较高。