变量集2的估计
与可变性指标有关的术语:
- 中位数绝对偏差。平均绝对偏差、方差和标准偏差(在上一节中讨论过)对极端值和异常值并不健全。我们对偏离中位数的偏差之和进行平均。
- 示例 :
输出 :
- 顺序统计。这种变异性测量方法是基于排列(排序)数据的传播。
- 范围。它是属于秩序统计的最基本的测量。它是数据集的最大和最小值之间的差异。它对了解数据的分布很有好处,但它对离群值非常敏感。我们可以通过删除极端值来使它变得更好。
示例 :
- 百分位数:这是一个非常好的测量方法,可以测量数据的可变性,避免离群值。数据中的第P个百分位数是指至少有P%或更少的数值小于它,至少有(100-P)%的数值大于P。
中位数是数据的第50个百分点。
示例 :
- 代码 –
输出 :
- 四分位数间范围(IQR)。它适用于排名(排序的数据)。它有三个四分位数来划分数据–Q1(25分位数)、Q2(50分位数)和Q3(75分位数)。四分位数范围是Q3和Q1之间的差异。
示例 :
- 代码 – 1
输出 :
- 代码 – 2
输出 :