Pandas GroupBy中的最大和最小日期
Pandas GroupBy是一个非常强大的函数。这个函数能够将一个数据集分割成各种组进行分析。
语法:
dataframe.groupby([column names])
除了groupby函数,我们还可以使用pandas库的agg()函数。Agg()函数对数据进行聚合,用于寻找数据集中的最小值、最大值、平均值、总和。
语法:
dataframe.agg(dictionary with keys as column name)
步骤:
- Import module
- 创建或加载数据
- 在你想要的列上使用GroupBy函数
- 然后在Date列上使用agg()函数。
- Display result
使用中的DataFrame:
代码:
import pandas as pd
import numpy as np
# Creating Dataframe
dataset = {'Group': ['G-2', 'G-3', 'G-3', 'G-2', 'G-2',
'G-2', 'G-3', 'G-1', 'G-1', 'G-2'],
'Date': ['2019-11-04', '2020-05-17', '2020-12-12',
'2019-10-15', '2019-01-31', '2019-02-13',
'2020-12-25', '2018-06-01', '2018-07-15',
'2019-09-14']}
dataset = pd.DataFrame(dataset, columns=['Group', 'Date'])
# using groupby() function on Group column
df = dataset.groupby(['Group'])
# using agg() function on Date column
df2 = df.agg(Minimum_Date=('Date', np.min), Maximum_Date=('Date', np.max))
# Displaying result
display(df2)
输出: