Pandas 操作之获取列平均值

Pandas 操作之获取列平均值

在本文中,我们将介绍如何通过Pandas获取DataFrame中某一列的平均值。Pandas是一个非常强大的Python数据分析库,可以快速便捷地完成数据的清洗、分析和可视化等操作。

阅读更多:Pandas 教程

Pandas数据结构:DataFrame和Series

在学习如何获取DataFrame中的列平均值之前,我们需要先了解Pandas的两个重要的数据结构:

  • DataFrame:类似于电子表格或SQL表格的二维表格数据结构,由多个列构成,每列可以是不同的数据类型。
  • Series:类似于一维数组的数据结构,由多个元素构成,每个元素都有一个索引。

在Pandas中,DataFrame是由多个Series组成的。我们可以通过DataFrame中的列索引获取对应的Series。

获取DataFrame某一列的平均值

获取DataFrame中某一列的平均值非常简单,只需要使用
“`mean()“`函数即可。例如,我们有一个由学生姓名、性别、学生ID和成绩组成的DataFrame:

import pandas as pd

data = {'姓名': ['小明', '小红', '小王', '小李'],
        '性别': ['男', '女', '男', '女'],
        '学生ID': [1, 2, 3, 4],
        '成绩': [89, 90, 87, 94]}
df = pd.DataFrame(data)
Python

获取成绩列的平均值,只需要运行以下代码:

average = df['成绩'].mean()
print('成绩列的平均值为:', average)
Python

运行结果为:

成绩列的平均值为: 90.0
Python

获取DataFrame多列的平均值

如果我们想获取DataFrame多列(两列或两列以上)的平均值,可以使用
“`mean()“`函数的参数“`axis“`。“`axis=0“`表示按列计算平均值,“`axis=1“`表示按行计算平均值。

例如,我们可以计算姓名和成绩两列的平均值:

average = df[['姓名', '成绩']].mean(axis=0)
print('姓名和成绩列的平均值为:\n', average)
Python

运行结果为:

姓名和成绩列的平均值为:
 学生ID     2.5
成绩      90.0
dtype: float64
Python

获取DataFrame所有列的平均值

获取DataFrame所有列的平均值也非常简单,只需要对整个DataFrame使用
“`mean()“`函数即可。

例如,我们可以计算整个DataFrame的平均值:

average = df.mean()
print('DataFrame所有列的平均值为:\n', average)
Python

运行结果为:

DataFrame所有列的平均值为:
 学生ID     2.5
成绩      90.0
dtype: float64
Python

总结

通过本文的介绍,我们了解了如何使用Pandas获取DataFrame中某一列、多列或所有列的平均值。掌握这一技巧,可以方便快捷地对数据进行分析和可视化处理,提高工作效率。

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程

登录

注册