Pandas 计算数据行平均值

在本文中，我们将介绍使用Pandas计算数据框(DataFrame)中行的平均值的基本方法。Pandas是Python中一个非常流行的数据处理库，它可以帮助我们轻松地处理和分析数据。

什么是平均值？

平均值是一组数值的总和除以这组数值总数的结果。在数据分析中，平均值通常用于表示某个数据组的典型值。

Pandas 如何计算行平均值

首先，我们需要创建一个包含我们要计算平均值的数据的数据框(DataFrame)。在这个例子中，我们将使用Iris数据集，这个数据集包含了三种不同的鸢尾花的测量数据。

import pandas as pd
from sklearn.datasets import load_iris

iris_data = load_iris()
df = pd.DataFrame(data=iris_data['data'], columns=iris_data['feature_names'])

上述代码从sklearn.datasets中导入了Iris数据集，并用Pandas将其转成了数据框。现在我们有了一个包含4列150行数据的数据框。

我们可以利用Pandas的mean()函数来计算每一行的平均值。对于一个数据框df，df.mean()函数将对列的平均值进行计算。

df.mean()

上述代码将返回每一列的平均值：

sepal length (cm)    5.843333
sepal width (cm)     3.054000
petal length (cm)    3.758667
petal width (cm)     1.198667
dtype: float64

如果我们想计算每一行的平均值，我们可以将df.mean()函数应用于每一行。可以使用axis参数来指定方向(0表示列方向，1表示行方向)。

df.mean(axis=1)

上述代码将返回每一行的平均值：

0      5.006
1      4.900
2      4.860
3      4.840
4      5.006
       ...  
145    6.112
146    5.784
147    6.160
148    6.020
149    5.720
Length: 150, dtype: float64