Python Pandas dataframe.aggregation()

Python Pandas dataframe.aggregation()

Python是一种进行数据分析的伟大语言,主要是因为以数据为中心的Python软件包的奇妙生态系统。Pandas就是这些包中的一个,它使导入和分析数据变得更加容易。

Dataframe.aggregation()函数用于在一个或多个列中应用一些聚合。聚合使用可调用的,字符串,dict,或字符串/可调用的列表。最经常使用的聚合是。

sum:返回所请求的axis的数值之和
min:返回所请求的axis的最小值
max:返回所请求的axis的最大值

语法: DataFrame.aggregate(func, axis=0, *args, **kwargs)

参数:
func :可调用,字符串,字典,或字符串/可调用列表。用于聚合数据的函数。如果是函数,必须在传递给DataFrame或传递给DataFrame.apply时发挥作用。对于DataFrame,可以传递一个dict,如果键是DataFrame的列名。
axis:(默认为0) {0或’索引’,1或’列’}。0或’index’:对每一列应用函数。1或’列’:将函数应用于每一行。

返回:汇总数据框架

关于代码中使用的CSV文件的链接,请点击这里

例子#1:在数据框中的所有列中聚合’sum’和’min’函数。

# importing pandas package
import pandas as pd
  
# making data frame from csv file
df = pd.read_csv("nba.csv")
  
# printing the first 10 rows of the dataframe
df[:10]

Python Pandas dataframe.aggregation()

聚合只对数字类型的列起作用。

# Applying aggregation across all the columns 
# sum and min will be found for each 
# numeric type column in df dataframe
  
df.aggregate(['sum', 'min'])

输出:
对于每一个有数字值的列,我们都会找到所有数值的最小值和总和。对于数据框架df,我们有四个这样的列Number, Age, Weight, Salary。

Python Pandas dataframe.aggregation()

示例 #2:

在Pandas中,我们也可以在不同的列中应用不同的聚合函数。为此,我们需要传递一个字典,其中的键包含列名,值包含任何特定列的聚合函数的列表。

# importing pandas package
import pandas as pd
  
# making data frame from csv file
df = pd.read_csv("nba.csv")
  
# We are going to find aggregation for these columns
df.aggregate({"Number":['sum', 'min'],
              "Age":['max', 'min'],
              "Weight":['min', 'sum'], 
              "Salary":['sum']})

输出:
每一列都有单独的聚合,如果任何特定的聚合没有应用于某一列,那么它就有NaN值与之对应。

Python Pandas dataframe.aggregation()

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程