Python取中位数|极客教程

Python取中位数

在统计学和概率论中，中位数是一组数据中居于中间位置的数值。它是一个比平均值更稳定的度量，尤其在数据中存在离群值的情况下。在Python中，我们可以使用多种方法来计算一组数据的中位数。

方法一：使用sorted()和len()函数

一个简单的方法是先对数据进行排序，然后根据数据的长度来确定中位数的位置。如果数据长度为奇数，则中位数是排序后的列表中间的元素；如果数据长度为偶数，则中位数是中间两个元素的平均值。

def median(lst):
    sorted_lst = sorted(lst)
    n = len(sorted_lst)
    if n % 2 == 0:
        return (sorted_lst[n//2 - 1] + sorted_lst[n//2]) / 2
    else:
        return sorted_lst[n//2]

data = [5, 2, 9, 1, 7, 6, 3, 8, 4]
print(median(data))  # 输出为 5

在上面的代码中，我们定义了一个函数median()来计算中位数。首先，我们对输入的数据进行排序，然后根据数据长度的奇偶性来计算中位数并返回结果。

方法二：使用statistics模块

Python的statistics模块提供了更方便的方法来计算中位数，我们可以直接使用statistics.median()函数来得到数据的中位数。

import statistics

data = [5, 2, 9, 1, 7, 6, 3, 8, 4]
print(statistics.median(data))  # 输出为 5

使用statistics.median()函数可以简化计算中位数的过程，避免手动排序和计算索引位置的麻烦。

方法三：使用numpy库

numpy库是Python中处理数组和矩阵运算的常用工具，也提供了计算中位数的函数numpy.median()。

import numpy as np

data = [5, 2, 9, 1, 7, 6, 3, 8, 4]
print(np.median(data))  # 输出为 5.0

numpy.median()函数能够处理更复杂的数组操作，适用于大规模数据处理和科学计算。

总结

本文介绍了三种常用的方法来计算一组数据的中位数：使用sorted()和len()函数，使用statistics模块，以及使用numpy库。根据实际情况选择合适的方法来计算中位数，可以提高代码的效率和可读性。

Python取中位数