R语言 如何在R编程中计算精度
在这篇文章中,我们将学习如何使用R编程语言中的混淆矩阵来计算精度。
精度
一个数字量的精度表示该量的精确程度。通常情况下,这是以比特为单位的,尽管它也可以是十进制的数字。它与数学精度有关,数学精度指的是表示一个数值所需的数字数量。
混淆矩阵
这个用于衡量性能的矩阵总结了分类算法的表现如何。每一类预测值和实际值都与正确和错误预测的总数一起列出。它提供了关于所产生的错误类型的信息,这比仅仅是分类器所犯的错误更重要。
混淆矩阵
在R编程语言中计算精度的逐步程序
第1步: 这一步将定义两个向量,一个是实际值,另一个是任何模型的预测值;此外,我们将使用这两个向量来计算预测值的精度。
# Creating data sets
actual_v <- c(1,0,1,0,1,0,1,
0,1,0,1,0,1,0,1,0,1)
predict_v <- c(1,0,1,0,1,1,0,
0,1,1,0,0,1,1,1,0,0)
# printing data sets
print(actual_v)
print(predict_v)
输出 。
> print(actual_v)
[1] 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1
> print(predict_v)
[1] 1 0 1 0 1 1 0 0 1 1 0 0 1 1 1 0 0
第2步: 在这一步,我们要创建一个混淆矩阵,这将提供一个2×2的矩阵。从这个矩阵中,我们可以得到真阳性和假阳性的值,这些值将分别进一步用于计算精度的公式中。
# Creating Data sets
actual_v <- c(1,0,1,0,1,0,1,
0,1,0,1,0,1,0,1,0,1)
predict_v <- c(1,0,1,0,1,1,0,
0,1,1,0,0,1,1,1,0,0)
# Assuming thershold to be 0.5
table(ACTUAL=actual_v,
PREDICTED=predict_v > 0.5)
输出 。
PREDICTED
ACTUAL FALSE TRUE
0 5 3
1 3 6
我们可以看到,在输出中,我们的[实际错误,预测错误]是5,因为在实际数据中,错误值在预测数据中也是错误的。同样地,我们也可以分析其他的值。
第3步: 这是最后一步,我们将使用混淆矩阵中的真阳性和假阳性值来计算精度,从而得到精度值。
精度的公式
Precision : True Positive / (True Positive + False Positive)
从上面计算的混淆矩阵来看。
TP(True Positive) = 6
FP(False Positive) = 3
Precision=6/(6+3) = 0.6666667
# calculating precision
precision <- 6/(3+6)
# Printing precision
print("The Precision score is:")
print(precision)
输出 。
[1] "The Precision score is:"
> print(precision)
[1] 0.6666667