Pandas透视表aggfunc列表

Pandas透视表aggfunc列表

在本文中,我们将介绍Pandas透视表的常见聚合函数列表。Pandas透视表是一种根据一个或多个键将数据拆分成多个部分的数据聚合方法,非常适合数据分析和汇总。透视表一般情况下包括四个参数,分别是值,行,列,聚合函数,本文着重介绍聚合函数这个参数。

阅读更多:Pandas 教程

Pandas透视表

在开始介绍聚合函数列表之前,我们先来看一下透视表的基本用法。

Pandas的透视表是通过pd.pivot_table()函数实现的,该函数的常见参数如下:

  • dataframe:需要透视的数据源,一般情况下是一个DataFrame;
  • values:指定需要汇总的列;
  • index:指定一个或多个列作为行索引;
  • columns:指定一个或多个列作为列索引;
  • aggfunc:指定透视表需要使用的聚合函数。

下面是一个简单的例子:

import pandas as pd

df = pd.DataFrame({
    'Month': ['Jan', 'Feb', 'Mar', 'Jan', 'Feb', 'Mar'],
    'City': ['New York', 'New York', 'New York', 'Los Angeles', 'Los Angeles',  'Los Angeles'],
    'Sales': [100, 200, 300, 150, 250, 350]
})

table = pd.pivot_table(df, values='Sales', index='Month', columns='City', aggfunc=sum)

print(table)
Python

输出结果如下:

City  Los Angeles  New York
Month                      
Feb           250       200
Jan           150       100
Mar           350       300
Python

上面的例子中,我们通过透视表实现了按月份和城市对销售数据进行了汇总。

聚合函数列表

Pandas透视表有很多可用的聚合函数,下面我们列出了一些常见的聚合函数以及它们的使用方法:

sum

计算透视表中的总和。

pd.pivot_table(df, values='Sales', index='Month', columns='City', aggfunc=sum)
Python

mean

计算透视表中的平均值。

pd.pivot_table(df, values='Sales', index='Month', columns='City', aggfunc='mean')
Python

count

计算透视表中每个组合的频率。

pd.pivot_table(df, values='Sales', index='Month', columns='City', aggfunc='count')
Python

max

计算透视表中每个组合的最大值。

pd.pivot_table(df, values='Sales', index='Month', columns='City', aggfunc='max')
Python

min

计算透视表中每个组合的最小值。

pd.pivot_table(df, values='Sales', index='Month', columns='City', aggfunc='min')
Python

median

计算透视表中每个组合的中位数。

pd.pivot_table(df, values='Sales', index='Month', columns='City', aggfunc='median')
Python

std

计算透视表中每个组合的标准差。

pd.pivot_table(df, values='Sales', index='Month', columns='City', aggfunc='std')
Python

var

计算透视表中每个组合的方差。

pd.pivot_table(df, values='Sales', index='Month', columns='City', aggfunc='var')
Python

describe

对透视表中的每个组合计算基本描述性统计量(数量、均值、标准差、最小值、25%分位数、50%分位数、75%分位数、最大值)。

pd.pivot_table(df, values='Sales', index='Month', columns='City', aggfunc='describe')
Python

总结

本文介绍了Pandas透视表的常见聚合函数列表,包括sum、mean、count、max、min、median、std、var和describe。透视表是一种强大的数据汇总工具,可以方便地对数据进行聚合、分组和统计分析。我们建议读者可以多尝试不同的聚合函数,并深入了解透视表的基本用法和相关参数。

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程

登录

注册