R语言 未知方差的群体平均值的上尾测试的第二类错误

R语言 未知方差的群体平均值的上尾测试的第二类错误

传统上,在上尾检验中,无效假设指出真实的群体平均值(μo)小于假设的平均值(μ)。如果在选定的显著性水平下,测试统计量小于临界值,我们就不能拒绝无效假设。在这篇文章中,让我们讨论一下已知方差的群体均值的上尾检验的II型错误的概率百分比。

第二类错误是指即使真实的群体平均数μo大于假设的平均值μ,如果基于随机样本的假设检验未能拒绝无效假设,就会出现这种错误。

这里的假设是群体方差σ2是未知的。让s2成为样本方差。对于较大的n(通常>30),所有可能的n大小的样本的以下统计量的群体近似于具有n-1自由度(DOF)的学生t分布。

学生t分布的样本均值范围计算如下

R中未知方差的群体平均值的上尾测试的第二类错误

检验统计量

上述公式可以帮助我们计算无效假设不会被拒绝的样本均值范围,从而计算出第二类错误的概率。

让我们通过考虑一个案例研究来理解II型错误。

假设数据标签公司说,任何一页上的标记标签的错误都少于2个。假设每页的实际平均错误量为2.12,而样本标准差为0.2。在0.05的显著性水平下,对于40页的样本量,出现II型错误的概率是多少?

例子

让我们先来计算一下平均值的标准误差,如图所示

n = 40 # sample size 
s = 0.2 # sample standard deviation 
SE = s/sqrt(n); # standard error estimate 
SE

输出

0.0316227766016838

然后,计算无效假设μo≤2不会被拒绝的样本平均值的上限。

alpha = .05 # significance level 
mu0 = 2 # hypothetical upper bound 
q = mu0 + qt(alpha, df=n-1, lower.tail=FALSE) * SE;
q 

输出

2.05328042957561

上限值表示,在假设检验中,只要样本平均值小于2.05328,就不会拒绝无效假设。让我们试着计算一下样本平均数低于2.05328的概率,因为我们已经假定实际的人口平均数为2.12。这个概率可以进一步用来计算第二类错误的概率。

mu = 2.12             # assumed actual mean 
pt((q - mu)/SE, df=n-1)

输出

0.0206695278070304

如果样本量为40,每页的实际平均错误量为2.12,样本标准差为0.2,那么在0.05的显著性水平下,检验无效假设μ≤2的II型错误概率为2.06%,假设检验的力量为97.93%。

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程