R语言 未知方差的群体平均值的下尾测试的第二类错误

R语言 未知方差的群体平均值的下尾测试的第二类错误

传统上,在下尾检验中,无效假设指出真实的群体平均值(μo)大于假设的平均值(μ)。如果在选定的显著性水平上,测试统计量大于临界值,我们就不能拒绝无效假设。在这篇文章中,让我们讨论在未知方差的情况下对人口平均数进行下尾测试的II型错误的概率百分比。

第二类错误是指,如果基于随机样本的假设检验未能拒绝无效假设,即使真实的群体均值μo小于假设的均值μ,也会出现这种错误。

这里的假设是群体方差σ2是未知的。让s2为样本方差。对于较大的n(通常>30),所有可能的n大小的样本的以下统计量的群体近似于具有n-1自由度(dof)的 学生t分布

学生t分布的样本平均数的范围计算如下

R中未知方差的群体平均值的下尾测试的第二类错误

检验统计量

上述公式可以帮助我们计算无效假设不会被拒绝的样本均值范围,从而计算出第二类错误的概率。

让我们通过考虑一个案例研究来理解II型错误。

假设制造商声称轮胎的平均寿命超过10,000公里。假设实际平均轮胎寿命为9950公里,样本标准差为120公里。在0.05的显著性水平下,对于30个轮胎的样本量,出现II型错误的概率是多少。

代码

让我们先来计算一下平均值的标准误差,如图所示

n = 30 # sample size 
s = 120 # sample standard deviation 
SE = s/sqrt(n)
SE # standard error estimate 

输出

21.9089023002066

然后,计算无效假设μo>=10000不会被拒绝的样本平均值的下限。

alpha = .05 # significance level 
mu0 = 10000 # hypothetical lower bound 
q = mu0 + qt(alpha, df=n-1) * SE
q 

输出

9962.77399198004

下限值表示,在假设检验中,只要样本平均值大于9962,就不会拒绝无效假设。现在让我们计算一下样本平均数高于9962的概率,因为我们知道实际人口平均数是9950。根据这个概率,我们可以找到第二类错误的概率。

mu = 9950 # assumed actual mean 
pt((q - mu)/SE, df=n-1, lower.tail=FALSE) 

输出

0.282183182187887

如果轮胎样本数为30,样本标准方差为120公里,轮胎实际平均寿命为9950小时,那么在0.05的显著性水平下,检验无效假设μ≥10000的II型错误概率为28.21%,假设检验的力量为71.78%。

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程