Python Pandas dataframe.aggregation()

Python是一种进行数据分析的伟大语言，主要是因为以数据为中心的Python软件包的奇妙生态系统。Pandas就是这些包中的一个，它使导入和分析数据变得更加容易。

Dataframe.aggregation()函数用于在一个或多个列中应用一些聚合。聚合使用可调用的，字符串，dict，或字符串/可调用的列表。最经常使用的聚合是。

sum:返回所请求的axis的数值之和
min:返回所请求的axis的最小值
max:返回所请求的axis的最大值

语法: DataFrame.aggregate(func, axis=0, *args, **kwargs)

参数:
func :可调用，字符串，字典，或字符串/可调用列表。用于聚合数据的函数。如果是函数，必须在传递给DataFrame或传递给DataFrame.apply时发挥作用。对于DataFrame，可以传递一个dict，如果键是DataFrame的列名。
axis：（默认为0） {0或’索引’，1或’列’}。0或’index’：对每一列应用函数。1或’列’：将函数应用于每一行。

返回：汇总数据框架

关于代码中使用的CSV文件的链接，请点击这里

例子#1：在数据框中的所有列中聚合’sum’和’min’函数。

# importing pandas package
import pandas as pd
  
# making data frame from csv file
df = pd.read_csv("nba.csv")
  
# printing the first 10 rows of the dataframe
df[:10]

Python Pandas dataframe.aggregation()

聚合只对数字类型的列起作用。

# Applying aggregation across all the columns 
# sum and min will be found for each 
# numeric type column in df dataframe
  
df.aggregate(['sum', 'min'])

输出:
对于每一个有数字值的列，我们都会找到所有数值的最小值和总和。对于数据框架df，我们有四个这样的列Number, Age, Weight, Salary。

Python Pandas dataframe.aggregation()

示例 #2:

在Pandas中，我们也可以在不同的列中应用不同的聚合函数。为此，我们需要传递一个字典，其中的键包含列名，值包含任何特定列的聚合函数的列表。

# importing pandas package
import pandas as pd
  
# making data frame from csv file
df = pd.read_csv("nba.csv")
  
# We are going to find aggregation for these columns
df.aggregate({"Number":['sum', 'min'],
              "Age":['max', 'min'],
              "Weight":['min', 'sum'], 
              "Salary":['sum']})

输出:
每一列都有单独的聚合，如果任何特定的聚合没有应用于某一列，那么它就有NaN值与之对应。

Python Pandas dataframe.aggregation()