Python Pandas dataframe.mean()
Python是一种进行数据分析的伟大语言,主要是因为以数据为中心的Python包的奇妙生态系统。Pandas就是这些包中的一个,它使导入和分析数据变得更加容易。
Pandas dataframe.mean()函数返回所请求axis的平均值。如果该方法应用于一个pandas系列对象,那么该方法会返回一个标量值,该标量值是数据框架中所有观测值的平均值。如果该方法应用于一个pandas数据框架对象,那么该方法将返回一个pandas系列对象,其中包含指定axis上的数值的平均值。
语法:
DataFrame.mean(axis=None, skipna=None, level=None, numeric_only=None, **kwargs)
参数 :
axis: {指数(0),列(1)}。
skipna : 在计算结果时排除NA/null值
level : 如果坐标axis是一个多指标(分层的),沿着一个特定的层次计数,折叠成一个系列。
numeric_only :只包括浮动、int、boolean列。如果没有,将尝试使用所有数据,然后只使用数字数据。不实现系列。
返回:平均值:系列或数据框架(如果指定水平)。
实例#1:使用mean()函数求出索引axis上所有观测值的平均值。
# importing pandas as pd
import pandas as pd
# Creating the dataframe
df = pd.DataFrame({"A":[12, 4, 5, 44, 1],
"B":[5, 2, 54, 3, 2],
"C":[20, 16, 7, 3, 8],
"D":[14, 3, 17, 2, 6]})
# Print the dataframe
df
让我们使用dataframe.mean()函数来寻找索引axis上的平均值。
# Even if we do not specify axis = 0,
# the method will return the mean over
# the index axis by default
df.mean(axis = 0)
输出 :
实例2:在一个有Na值的数据框架上使用mean()函数。同时找到列axis上的平均值。
# importing pandas as pd
import pandas as pd
# Creating the dataframe
df = pd.DataFrame({"A":[12, 4, 5, None, 1],
"B":[7, 2, 54, 3, None],
"C":[20, 16, 11, 3, 8],.
"D":[14, 3, None, 2, 6]})
# skip the Na values while finding the mean
df.mean(axis = 1, skipna = True)
输出 :