Pandas GroupBy中的最大和最小日期

Pandas GroupBy中的最大和最小日期

Pandas GroupBy是一个非常强大的函数。这个函数能够将一个数据集分割成各种组进行分析。

语法:

dataframe.groupby([column names])

除了groupby函数,我们还可以使用pandas库的agg()函数。Agg()函数对数据进行聚合,用于寻找数据集中的最小值、最大值、平均值、总和。

语法:

dataframe.agg(dictionary with keys as column name)

步骤:

  • Import module
  • 创建或加载数据
  • 在你想要的列上使用GroupBy函数
  • 然后在Date列上使用agg()函数。
  • Display result

使用中的DataFrame:

Pandas GroupBy中的最大和最小日期

代码:

import pandas as pd
import numpy as np
  
# Creating Dataframe
dataset = {'Group': ['G-2', 'G-3', 'G-3', 'G-2', 'G-2', 
                     'G-2', 'G-3', 'G-1', 'G-1', 'G-2'],
             
           'Date': ['2019-11-04', '2020-05-17', '2020-12-12', 
                    '2019-10-15', '2019-01-31', '2019-02-13',
                    '2020-12-25', '2018-06-01', '2018-07-15',
                    '2019-09-14']}
  
dataset = pd.DataFrame(dataset, columns=['Group', 'Date'])
  
# using groupby() function on Group column
df = dataset.groupby(['Group'])
  
# using agg() function on Date column
df2 = df.agg(Minimum_Date=('Date', np.min), Maximum_Date=('Date', np.max))
  
# Displaying result
display(df2)

输出:

Pandas GroupBy中的最大和最小日期

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程