如何在Pandas DataFrame的组中应用函数
在这篇文章中,让我们看看如何在Pandas DataFrame中的一个组中应用函数。执行这项任务需要遵循的步骤是–
- 导入必要的库。
- 将数据设置为Pandas DataFrame。
- 使用_apply _函数找到不同的统计量,如滚动平均数、平均数、总和、最大和最小。你可以为此使用lambda函数。
以下是实现情况:
让我们来创建DataFrame。
#import libraries
import pandas as pd
# set up the data
data_dict = {"Student House": ["Lavender", "Lavender", "Lavender",
"Lavender", "Daisy", "Daisy",
"Daisy", "Daisy", "Daffodils",
"Daffodils", "Daffodils", "Daffodils"],
"Points": [10, 4, 6, 7, 3, 8, 9, 10, 4, 5, 6, 7]}
data_df = pd.DataFrame(data_dict)
print("Dataframe : ")
data_df
输出:
示例 1:
# finding rolling mean
rolling_mean = data_df.groupby("Student House")["Points"].apply(
lambda x: x.rolling(center=False, window=2).mean())
print("Rolling Mean:")
print(rolling_mean)
输出:
示例 2:
# finding mean
mean = data_df.groupby("Student House")["Points"].apply(
lambda x: x.mean())
print("Mean:")
print(mean)
输出:
示例 3:
# finding sum
sum = data_df.groupby("Student House")["Points"].apply(
lambda x: x.sum())
print("Sum:")
print(sum)
输出: