R语言未知方差的群体平均值的上尾测试的第二类错误

传统上，在上尾检验中，无效假设指出真实的群体平均值（μo）小于假设的平均值（μ）。如果在选定的显著性水平下，测试统计量小于临界值，我们就不能拒绝无效假设。在这篇文章中，让我们讨论一下已知方差的群体均值的上尾检验的II型错误的概率百分比。

第二类错误是指即使真实的群体平均数μo大于假设的平均值μ，如果基于随机样本的假设检验未能拒绝无效假设，就会出现这种错误。

这里的假设是群体方差σ2是未知的。让s2成为样本方差。对于较大的n（通常>30），所有可能的n大小的样本的以下统计量的群体近似于具有n-1自由度（DOF）的学生t分布。

学生t分布的样本均值范围计算如下

R中未知方差的群体平均值的上尾测试的第二类错误

检验统计量

上述公式可以帮助我们计算无效假设不会被拒绝的样本均值范围，从而计算出第二类错误的概率。

让我们通过考虑一个案例研究来理解II型错误。

假设数据标签公司说，任何一页上的标记标签的错误都少于2个。假设每页的实际平均错误量为2.12，而样本标准差为0.2。在0.05的显著性水平下，对于40页的样本量，出现II型错误的概率是多少？

例子

让我们先来计算一下平均值的标准误差，如图所示

n = 40 # sample size 
s = 0.2 # sample standard deviation 
SE = s/sqrt(n); # standard error estimate 
SE

输出

0.0316227766016838

然后，计算无效假设μo≤2不会被拒绝的样本平均值的上限。

alpha = .05 # significance level 
mu0 = 2 # hypothetical upper bound 
q = mu0 + qt(alpha, df=n-1, lower.tail=FALSE) * SE;
q

输出

2.05328042957561

上限值表示，在假设检验中，只要样本平均值小于2.05328，就不会拒绝无效假设。让我们试着计算一下样本平均数低于2.05328的概率，因为我们已经假定实际的人口平均数为2.12。这个概率可以进一步用来计算第二类错误的概率。

mu = 2.12             # assumed actual mean 
pt((q - mu)/SE, df=n-1)

输出

0.0206695278070304

如果样本量为40，每页的实际平均错误量为2.12，样本标准差为0.2，那么在0.05的显著性水平下，检验无效假设μ≤2的II型错误概率为2.06%，假设检验的力量为97.93%。

Python教程