Python – Pandas的DataFrame中的列分组
要在Pandas数据框中分组列,请使用groupby()。首先,让我们创建Pandas数据框 –
dataFrame = pd.DataFrame(
{
"汽车": ["奥迪", "雷克萨斯", "奥迪", "奔驰", "奥迪", "雷克萨斯", "奔驰", "雷克萨斯", "奔驰"],
"注册价格": [1000, 1400, 1100, 900, 1700, 1800, 1300, 1150, 1350]
}
)
现在让我们按汽车列进行分组 –
res = dataFrame.groupby("汽车")
分组后,我们将使用函数来查找分组汽车名称的平均注册价格(Reg_Price)-
res.mean()
这将根据汽车列计算注册价格的平均值。
更多Pandas文章,请阅读:Pandas教程
示例
以下是示例代码 –
import pandas as pd
#在数据框中有一个列为Reg_Price
dataFrame = pd.DataFrame(
{
"汽车": ["奥迪", "雷克萨斯", "奥迪", "奔驰", "奥迪", "雷克萨斯", "奔驰", "雷克萨斯", "奔驰"],
"注册价格": [1000, 1400, 1100, 900, 1700, 1800, 1300, 1150, 1350]
}
)
print"数据框...\n",dataFrame
#按汽车类型分组
res = dataFrame.groupby("汽车")
print"\n按汽车名称分组的注册价格的平均值...\n",res.mean()
输出结果
这将产生以下输出 –
数据框...
汽车 注册价格
0 奥迪 1000
1 雷克萨斯 1400
2 奥迪 1100
3 奔驰 900
4 奥迪 1700
5 雷克萨斯 1800
6 奔驰 1300
7 雷克萨斯 1150
8 奔驰 1350
按汽车名称分组的注册价格的平均值...
注册价格
汽车
奥迪 1266.666667
雷克萨斯 1450.000000
奔驰 1183.333333