Pandas 使用.iterrows() 方法创建列
在本文中,我们将介绍使用 Pandas python 中的 .iterrows() 方法创建新的列。
阅读更多:Pandas 教程
什么是 .iterrows() 方法?
.iterrows() 方法是 Pandas python 中用于遍历数据帧的函数。这个方法返回一个元组,其中包含当前行的索引以及行的值。
以下是一个使用 .iterrows() 方法的示例:
import pandas as pd
df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie'],
'age': [25, 30, 35]})
for index, row in df.iterrows():
print(index, row['name'], row['age'])
执行上述代码将输出以下内容:
0 Alice 25
1 Bob 30
2 Charlie 35
使用 .iterrows() 方法创建新列
我们可以使用 .iterrows() 方法创建一个新的列。实现步骤如下:
- 循环遍历数据帧的每一行
- 在每一行中使用已有的列数据计算出新列的值
- 将新列的值添加到数据帧中
以下是一个使用 .iterrows() 方法创建新列的示例:
import pandas as pd
df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie'],
'age': [25, 30, 35]})
# 计算每个人的年龄段
for index, row in df.iterrows():
if row['age'] < 30:
df.at[index, 'age_group'] = 'young'
else:
df.at[index, 'age_group'] = 'old'
print(df)
执行上述代码将输出以下数据帧:
name age age_group
0 Alice 25 young
1 Bob 30 old
2 Charlie 35 old
总结
在本文中,我们介绍了使用 Pandas python 中的 .iterrows() 方法创建新的列。通过遍历数据帧的每一行,我们能够计算出新列的值并将其添加到数据帧中。现在,您可以在自己的项目中使用 .iterrows() 方法来计算新的列了。
极客教程