R语言对已知方差的群体平均值进行上尾测试

统计假设检验是一种统计推理方法，用于决定手头的数据是否充分支持某一特定假设。

在制定假设检验时遵循的常规步骤列举如下

传统上，在上尾检验中，无效假设指出真实的群体平均值（μo）小于假设的平均值（μ）。如果在选定的显著性水平上，测试统计量小于临界值，我们就不能拒绝无效假设。在这篇文章中，让我们讨论如何对已知方差的群体平均值进行上尾检验。

这里的假设是人口方差σ2是已知的。从中心极限定理（CLT）来看，种群……种群的所有可能样本的样本均值近似于正态分布。让我们根据CLT来定义测试统计量如下

如果z>=-zα，其中zα是标准正态分布的100（1-α）百分位数，我们将不得不拒绝无效假设。

让我们尝试通过考虑一个案例研究来理解上尾检验

假设数据标签公司说，任何一页上的标记标签的错误都少于2个。假设每页的实际平均错误量为2.12，而群体标准差为0.2。在0.05的显著性水平下，我们能否拒绝每页的平均数据标记错误大于2个错误的无效假设？

例子

让我们先计算一下平均值的标准误差，如图所示

sample_mean = 2.12
  
# hypothesized mean value
m0 = 2 
  
pop_std_dev = 0.25
sample_size = 40
  
# test statistic
z = (xbar-mu0)/(sigma/sqrt(n)) 
z

输出

3.035786553

然后，计算无效假设μo≤2不会被拒绝的样本平均数的上界。

alpha = .05 
  
# critical value
z.alpha = qnorm(1-alpha) 
z.alpha

输出

1.644

检验统计量3.03大于临界值1.6449。因此，在0.05的显著性水平下，我们拒绝无效假设，即每页的平均标签误差不小于2。

Python教程