R语言 对已知方差的群体平均值进行上尾测试
统计假设检验是一种统计推理方法,用于决定手头的数据是否充分支持某一特定假设。
在制定假设检验时遵循的常规步骤列举如下
- 说明无效假设(Ho)和备用假设(Ha)。
- 收集相关的数据样本来检验假设。
- 选择假设检验的显著性水平。
- 进行适当的统计检验。
- 根据检验统计数据和P值决定是否拒绝或不拒绝你的零假设。
传统上,在上尾检验中,无效假设指出真实的群体平均值(μo)小于假设的平均值(μ)。如果在选定的显著性水平上,测试统计量小于临界值,我们就不能拒绝无效假设。在这篇文章中,让我们讨论如何对已知方差的群体平均值进行上尾检验。
这里的假设是人口方差σ2是已知的。从中心极限定理(CLT)来看,种群……种群的所有可能样本的样本均值近似于正态分布。让我们根据CLT来定义测试统计量如下
如果z>=-zα
,其中zα是标准正态分布的100(1-α)百分位数,我们将不得不拒绝无效假设。
让我们尝试通过考虑一个案例研究来理解上尾检验
假设数据标签公司说,任何一页上的标记标签的错误都少于2个。假设每页的实际平均错误量为2.12,而群体标准差为0.2。在0.05的显著性水平下,我们能否拒绝每页的平均数据标记错误大于2个错误的无效假设?
例子
让我们先计算一下平均值的标准误差,如图所示
sample_mean = 2.12
# hypothesized mean value
m0 = 2
pop_std_dev = 0.25
sample_size = 40
# test statistic
z = (xbar-mu0)/(sigma/sqrt(n))
z
输出
3.035786553
然后,计算无效假设μo≤2不会被拒绝的样本平均数的上界。
alpha = .05
# critical value
z.alpha = qnorm(1-alpha)
z.alpha
输出
1.644
检验统计量3.03大于临界值1.6449。因此,在0.05的显著性水平下,我们拒绝无效假设,即每页的平均标签误差不小于2。