Python – 计算Pandas DataFrame中组的第一个值

要计算组的第一个值，请使用groupby.first()方法。首先，使用别名导入必需的库 –

import pandas as pd;

创建一个包含3列的DataFrame –

dataFrame = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'BMW', 'Tesla', 'Lexus', 'Tesla'],"Place": ['Delhi','Bangalore','Pune','Punjab','Chandigarh','Mumbai'],"Units": [100, 150, 50, 80, 110, 90]
   }
)

现在，按一列对DataFrame进行分组 –

groupDF = dataFrame.groupby("Car")

计算组的第一个值并重置索引 –

res = groupDF.first()
res = res.reset_index()

示例

以下是完整的代码 –

import pandas as pd;

dataFrame = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'BMW', 'Tesla', 'Lexus', 'Tesla'],"Place": ['Delhi','Bangalore','Pune','Punjab','Chandigarh','Mumbai'],"Units": [100, 150, 50, 80, 110, 90]
   }
)

print("DataFrame ...\n",dataFrame)

# 按列Car对DataFrame进行分组
groupDF = dataFrame.groupby("Car")

res = groupDF.first()
res = res.reset_index()

print("\n组的第一个值 = \n",res)

输出

这将产生以下输出。显示重复值的第一个出现，即组的第一个值 –

DataFrame ...
     Car       Place   Units
0    BMW       Delhi     100
1  Lexus   Bangalore     150
2    BMW        Pune      50
3  Tesla      Punjab      80
4  Lexus  Chandigarh     110
5  Tesla      Mumbai      90

组的第一个值 =
     Car      Place   Units
0    BMW      Delhi     100
1  Lexus  Bangalore     150
2  Tesla     Punjab      80