Python – 计算Pandas DataFrame中组的第一个值
要计算组的第一个值,请使用groupby.first()方法。首先,使用别名导入必需的库 –
import pandas as pd;
创建一个包含3列的DataFrame –
dataFrame = pd.DataFrame(
{
"Car": ['BMW', 'Lexus', 'BMW', 'Tesla', 'Lexus', 'Tesla'],"Place": ['Delhi','Bangalore','Pune','Punjab','Chandigarh','Mumbai'],"Units": [100, 150, 50, 80, 110, 90]
}
)
现在,按一列对DataFrame进行分组 –
groupDF = dataFrame.groupby("Car")
计算组的第一个值并重置索引 –
res = groupDF.first()
res = res.reset_index()
示例
以下是完整的代码 –
import pandas as pd;
dataFrame = pd.DataFrame(
{
"Car": ['BMW', 'Lexus', 'BMW', 'Tesla', 'Lexus', 'Tesla'],"Place": ['Delhi','Bangalore','Pune','Punjab','Chandigarh','Mumbai'],"Units": [100, 150, 50, 80, 110, 90]
}
)
print("DataFrame ...\n",dataFrame)
# 按列Car对DataFrame进行分组
groupDF = dataFrame.groupby("Car")
res = groupDF.first()
res = res.reset_index()
print("\n组的第一个值 = \n",res)
输出
这将产生以下输出。显示重复值的第一个出现,即组的第一个值 –
DataFrame ...
Car Place Units
0 BMW Delhi 100
1 Lexus Bangalore 150
2 BMW Pune 50
3 Tesla Punjab 80
4 Lexus Chandigarh 110
5 Tesla Mumbai 90
组的第一个值 =
Car Place Units
0 BMW Delhi 100
1 Lexus Bangalore 150
2 Tesla Punjab 80
极客教程