变量集1的估计
变异性:它是衡量数据变异的进口维度,即数据是分散的还是紧密聚拢的。也被称为分散性 当在机器学习或数据科学中处理数据集时,涉及许多步骤–变异性测量、减少、区分随机变异性和真实变异性。识别真实变异性的来源,根据它做出关于预处理选择或模型选择的决定。
与可变性指标有关的术语:
- 偏差。我们也可以称它为误差或残差。它是衡量数值与中心/观察值的差异/分散程度的标准。
示例 :
- 方差(s 2)。 它是估计变异性的最著名的措施,因为它是平方差。人们可以称它为平均平方误差,因为它是标准偏差的平均值。
示例 :
**代码 **
输出 :
- 标准偏差。它是方差的平方根。也被称为欧几里德规范。
示例 :
代码 –
输出 :
- 平均绝对偏差。人们可以对这些偏差进行一个典型的估计。如果我们对这些数值进行平均,负偏差会抵消正偏差。而且,与平均值的偏差之和总是为零。所以,取平均偏差本身是一个简单的方法。
示例 :
输出 :