R语言 未知方差的群体平均值的上尾测试的第二类错误
传统上,在上尾检验中,无效假设指出真实的群体平均值(μo)小于假设的平均值(μ)。如果在选定的显著性水平下,测试统计量小于临界值,我们就不能拒绝无效假设。在这篇文章中,让我们讨论一下已知方差的群体均值的上尾检验的II型错误的概率百分比。
第二类错误是指即使真实的群体平均数μo大于假设的平均值μ,如果基于随机样本的假设检验未能拒绝无效假设,就会出现这种错误。
这里的假设是群体方差σ2是未知的。让s2成为样本方差。对于较大的n(通常>30),所有可能的n大小的样本的以下统计量的群体近似于具有n-1自由度(DOF)的学生t分布。
学生t分布的样本均值范围计算如下
检验统计量
上述公式可以帮助我们计算无效假设不会被拒绝的样本均值范围,从而计算出第二类错误的概率。
让我们通过考虑一个案例研究来理解II型错误。
假设数据标签公司说,任何一页上的标记标签的错误都少于2个。假设每页的实际平均错误量为2.12,而样本标准差为0.2。在0.05的显著性水平下,对于40页的样本量,出现II型错误的概率是多少?
例子
让我们先来计算一下平均值的标准误差,如图所示
n = 40 # sample size
s = 0.2 # sample standard deviation
SE = s/sqrt(n); # standard error estimate
SE
输出
0.0316227766016838
然后,计算无效假设μo≤2不会被拒绝的样本平均值的上限。
alpha = .05 # significance level
mu0 = 2 # hypothetical upper bound
q = mu0 + qt(alpha, df=n-1, lower.tail=FALSE) * SE;
q
输出
2.05328042957561
上限值表示,在假设检验中,只要样本平均值小于2.05328,就不会拒绝无效假设。让我们试着计算一下样本平均数低于2.05328的概率,因为我们已经假定实际的人口平均数为2.12。这个概率可以进一步用来计算第二类错误的概率。
mu = 2.12 # assumed actual mean
pt((q - mu)/SE, df=n-1)
输出
0.0206695278070304
如果样本量为40,每页的实际平均错误量为2.12,样本标准差为0.2,那么在0.05的显著性水平下,检验无效假设μ≤2的II型错误概率为2.06%,假设检验的力量为97.93%。