如何在pandas聚合中计算不同的数据

如何在pandas聚合中计算不同的数据

在这篇文章中,让我们看看如何在pandas聚合中计算不同的数据。为了计算pandas聚合中的区别,我们将使用groupby()和agg()方法。

  • groupby()。 该方法用于根据一些标准将数据分成组。Pandas对象可以在其任何轴上进行分割。我们可以创建一个类别的分组,并对类别应用一个函数。分组的抽象定义是提供一个标签到组名的映射
  • agg()。该方法用于传递一个函数或函数列表,以应用于一个系列,甚至系列中的每个元素。在函数列表的情况下,agg()方法会返回多个结果。

下面是一些例子,描述了如何在Pandas聚合中计算不同的。

示例 1:

# import module
import pandas as pd
import numpy as np
 
# create Data frame
df = pd.DataFrame({'Video_Upload_Date': ['2020-01-17',
                                         '2020-01-17',
                                         '2020-01-19',
                                         '2020-01-19',
                                         '2020-01-19'],
                   'Viewer_Id': ['031', '031', '032',
                                 '032', '032'],
                   'Watch_Time': [34, 43, 43, 41, 40]})
 
# print original Dataframe
print(df)
 
# let's Count distinct in Pandas aggregation
df = df.groupby("Video_Upload_Date").agg(
    {"Watch_Time": np.sum, "Viewer_Id": pd.Series.nunique})
 
# print final output
print(df)

输出:

如何在pandas聚合中计算不同的数据

示例 2:

# import module
import pandas as pd
import numpy as np
 
# create Data frame
df = pd.DataFrame({'Order Date': ['2021-02-22',
                                  '2021-02-22',
                                  '2021-02-22',
                                  '2021-02-24',
                                  '2021-02-24'],
                   'Product Id': ['021', '021',
                                  '022', '022', '022'],
                   'Order Quantity': [23, 22, 22,
                                      45, 10]})
 
# print original Dataframe
print(df)
 
# let's Count distinct in Pandas aggregation
df = df.groupby("Order Date").agg({"Order Quantity": np.sum,
                                   "Product Id": pd.Series.nunique})
 
# print final output
print(df)

输出:

如何在pandas聚合中计算不同的数据

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程