如何在Python中获取数据框中特定列的均值?
有时需要获得数字型特定列的均值。这就是可以使用 ‘均值’ 函数的地方。
要计算平均值的列可以被索引到数据框中,然后使用点运算符调用该列的均值函数。
可以传递列的索引以查找均值。术语 mean() 是指查找所有值的和并将其除以数据集中的总值数。
让我们看一个相同情况的演示:
阅读更多:Python 教程
示例
import pandas as pd
my_data = {'Name':pd.Series(['Tom','Jane','Vin','Eve','Will']),
'Age':pd.Series([45, 67, 89, 12, 23]),
'value':pd.Series([8.79,23.24,31.98,78.56,90.20])}
print("数据框是:")
my_df = pd.DataFrame(my_data)
print(my_df)
print("列 'Age' 的均值为:")
print(my_df ['Age'].mean())
print("列 'value' 的均值为:")
print(my_df ['value'].mean())
输出
数据框是:
Name Age value
0 Tom 45 8.79
1 Jane 67 23.24
2 Vin 89 31.98
3 Eve 12 78.56
4 Will 23 90.20
列 'Age' 的均值为:
47.2
列 'value' 的均值为:
46.553999999999995
解释
-
导入所有必要的库,并为其指定别名以便于使用。
-
创建一个具有键和值的系列字典,其中值实际上是系列数据结构。
-
稍后将此字典作为参数传递到 ‘pandas’ 库中的 ‘Dataframe’ 函数。
-
将数据框打印到控制台上。
-
要计算特定列的数字均值。
-
通过指定列名并使用点运算符在数据框上调用 ‘mean’ 函数。
-
在控制台上打印数字列的均值。
极客教程