Python Pandas dataframe.median()
Python是一种进行数据分析的伟大语言,主要是因为以数据为中心的Python包的奇妙生态系统。Pandas就是这些包中的一个,它使导入和分析数据变得更加容易。
Pandas dataframe.median()函数返回所请求的axis的中值
如果该方法应用于pandas系列对象,那么该方法将返回一个标量值,即数据框架中所有观测值的中值。如果该方法应用于pandas数据框架对象,那么该方法将返回一个pandas系列对象,其中包含指定axis上的中值。
语法:
DataFrame.median(axis=None, skipna=None, level=None, numeric_only=None, **kwargs)
参数 :
axis:沿给定的axis线将对象与阈值对齐。
skipna : 在计算结果时排除NA/null值
level : 如果坐标axis是一个多指标(分层的),沿着一个特定的层次计数,折叠成一个系列。
numeric_only :只包括浮动、int、boolean列。如果没有,将尝试使用所有数据,然后只使用数字数据。不实现系列。
返回:中位数:系列或数据框架(如果指定级别)。
例子#1:使用median()函数来查找索引axis上所有观测值的中位数。
# importing pandas as pd
import pandas as pd
# Creating the dataframe
df = pd.DataFrame({"A":[12, 4, 5, 44, 1],
"B":[5, 2, 54, 3, 2],
"C":[20, 16, 7, 3, 8],
"D":[14, 3, 17, 2, 6]})
# Print the dataframe
df
让我们使用dataframe.median()函数来寻找索引axis的中位数。
# Find median Even if we do not specify axis = 0, the method
# will return the median over the index axis by default
df.median(axis = 0)
输出 :
实例2:在一个有Na值的数据框架上使用median()函数。同时找到列axis上的中位数。
# importing pandas as pd
import pandas as pd
# Creating the dataframe
df = pd.DataFrame({"A":[12, 4, 5, None, 1],
"B":[7, 2, 54, 3, None],
"C":[20, 16, 11, 3, 8],
"D":[14, 3, None, 2, 6]})
# Print the dataframe
df
让我们来实现中位数函数。
# skip the Na values while finding the median
df.median(axis = 1, skipna = True)
输出 :