变量集1的估计

变量集1的估计

变异性:它是衡量数据变异的进口维度,即数据是分散的还是紧密聚拢的。也被称为分散性 当在机器学习或数据科学中处理数据集时,涉及许多步骤–变异性测量、减少、区分随机变异性和真实变异性。识别真实变异性的来源,根据它做出关于预处理选择或模型选择的决定。

与可变性指标有关的术语:

-> Deviation 
-> Variance
-> Standard Deviation
-> Mean Absolute Deviation
-> Median Absolute Deviation
-> Order Statistics
-> Range
-> Percentile 
-> Inter-quartile Range
  • 偏差。我们也可以称它为误差或残差。它是衡量数值与中心/观察值的差异/分散程度的标准。
    示例 :
Sequence : [2, 3, 5, 6, 7, 9] 
Suppose, Central/Observed Value = 7

Deviation = [-5, -4, -2, -1, 0, 2]
  • 方差(s 2)。 它是估计变异性的最著名的措施,因为它是平方差。人们可以称它为平均平方误差,因为它是标准偏差的平均值。

变量集1的估计

示例 :

Sequence : [2, 3, 5, 6, 7, 9] 
Mean              = 5.33
Total Terms, n    = 6
Squared Deviation = (2 - 5.33)2 + (3 - 5.33)2 + (5 - 5.33)2
                    (6 - 5.33)2 + (7 - 5.33)2 + (9 - 5.33)2
Variance          = Squared Deviation / n

**代码 **

# Variance
 
import numpy as np
 
Sequence = [2, 3, 5, 6, 7, 9]
 
var = np.var(Sequence)
 
print("Variance : ", var)

输出 :

Variance :  5.5555555555555545
  • 标准偏差。它是方差的平方根。也被称为欧几里德规范。

变量集1的估计

示例 :

Sequence : [2, 3, 5, 6, 7, 9] 
Mean              = 5.33
Total Terms, n    = 6
Squared Deviation = (2 - 5.33)2 + (3 - 5.33)2 + (5 - 5.33)2
                    (6 - 5.33)2 + (7 - 5.33)2 + (9 - 5.33)2

Variance             = Squared Deviation / n
Standard Deviation   = (Variance)1/2

代码 –

# Standard Deviation
 
import numpy as np
 
Sequence = [2, 3, 5, 6, 7, 9]
 
std = np.std(Sequence)
 
print("Standard Deviation : ", std)

输出 :

Standard Deviation :  2.357022603955158
  • 平均绝对偏差。人们可以对这些偏差进行一个典型的估计。如果我们对这些数值进行平均,负偏差会抵消正偏差。而且,与平均值的偏差之和总是为零。所以,取平均偏差本身是一个简单的方法。

变量集1的估计

示例 :

Sequence : [2, 4, 6, 8] 
Mean     = 5
Deviation around mean = [-3, -1, 1, 3]

Mean Absolute Deviation = (3 + 1 + 1 + 3)/ 4
# Mean Absolute Deviation
 
import numpy as np
 
def mad(data):
    return np.mean(np.absolute(
            data - np.mean(data)))
     
Sequence = [2, 4, 6, 8]
 
print ("Mean Absolute Deviation : ", mad(Sequence))

输出 :

Mean Absolute Deviation :  2.0

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程