Python Pandas dataframe.aggregation()
Python是一种进行数据分析的伟大语言,主要是因为以数据为中心的Python软件包的奇妙生态系统。Pandas就是这些包中的一个,它使导入和分析数据变得更加容易。
Dataframe.aggregation()函数用于在一个或多个列中应用一些聚合。聚合使用可调用的,字符串,dict,或字符串/可调用的列表。最经常使用的聚合是。
sum:返回所请求的axis的数值之和
min:返回所请求的axis的最小值
max:返回所请求的axis的最大值
语法: DataFrame.aggregate(func, axis=0, *args, **kwargs)
参数:
func :可调用,字符串,字典,或字符串/可调用列表。用于聚合数据的函数。如果是函数,必须在传递给DataFrame或传递给DataFrame.apply时发挥作用。对于DataFrame,可以传递一个dict,如果键是DataFrame的列名。
axis:(默认为0) {0或’索引’,1或’列’}。0或’index’:对每一列应用函数。1或’列’:将函数应用于每一行。
返回:汇总数据框架
关于代码中使用的CSV文件的链接,请点击这里
例子#1:在数据框中的所有列中聚合’sum’和’min’函数。
聚合只对数字类型的列起作用。
输出:
对于每一个有数字值的列,我们都会找到所有数值的最小值和总和。对于数据框架df,我们有四个这样的列Number, Age, Weight, Salary。
示例 #2:
在Pandas中,我们也可以在不同的列中应用不同的聚合函数。为此,我们需要传递一个字典,其中的键包含列名,值包含任何特定列的聚合函数的列表。
输出:
每一列都有单独的聚合,如果任何特定的聚合没有应用于某一列,那么它就有NaN值与之对应。