Pandas中的mad函数|极客教程

Pandas中的mad函数

在数据分析中，MAD（Median Absolute Deviation）是一种衡量数据变异程度的统计量，它是数据点与数据集的中位数之间的绝对差的中位数。在Pandas库中，我们可以使用mad函数来计算数据的MAD值。

本文将介绍Pandas中mad函数的用法、参数和示例，帮助读者了解如何在数据分析中应用这一函数。

mad函数的语法

Pandas中mad函数的语法如下：

DataFrame.mad(axis=None, skipna=None, level=None, numeric_only=None)

参数说明：

axis：指定计算MAD的轴方向，可以是0（按列计算）或1（按行计算）。
skipna：指定是否忽略缺失值（NaN），默认为True。
level：指定多级索引的级别。
numeric_only：指定是否仅计算数值类型的列/行，默认为True。

示例

接下来，我们将使用一个示例数据集来演示mad函数的用法。

import pandas as pd

data = {
    'A': [1, 2, 3, 4, 5],
    'B': [10, 12, 8, 15, 7]
}

df = pd.DataFrame(data)
print("原始数据集：")
print(df)

# 计算按列的MAD值
mad_col = df.mad(axis=0)
print("\n按列计算MAD：")
print(mad_col)

# 计算按行的MAD值
mad_row = df.mad(axis=1)
print("\n按行计算MAD：")
print(mad_row)

运行以上代码，我们可以得到以下输出：

原始数据集：
   A   B
0  1  10
1  2  12
2  3   8
3  4  15
4  5   7

按列计算MAD：
A    1.6
B    2.88
dtype: float64

按行计算MAD：
0    4.0
1    5.0
2    2.0
3    5.0
4    3.0
dtype: float64

从输出可以看出，按列计算的MAD值为[1.6, 2.88]，按行计算的MAD值为[4.0, 5.0, 2.0, 5.0, 3.0]。