R语言 对未知方差的群体平均值进行上尾测试
统计假设检验是一种统计推理方法,用于决定手头的数据是否充分支持某一特定假设。在制定假设检验时遵循的常规步骤如下
- 说明无效假设(Ho)和备用假设(Ha)。
- 收集相关的数据样本来检验假设。
- 选择假设检验的显著性水平。
- 进行适当的统计检验。
- 根据检验统计数据和P值决定是否拒绝或不拒绝你的无效假设。
传统上,在上尾检验中,无效假设指出真实的群体平均值(μo)小于假设的平均值(μ)。如果在选定的显著性水平上,测试统计量小于临界值,我们就不能拒绝无效假设。在这篇文章中,让我们讨论如何对未知方差的群体平均值进行上尾检验。
这里的假设是人口方差σ2是未知的。让s2为样本方差。对于较大的n(通常>30),所有可能的n大小的样本的以下统计量的群体近似于具有n-1自由度(DOF)的学生t分布。
让我们将基于t分布的测试统计量定义如下
如果t>=-tα ,其中tα是具有n-1个自由度的学生t分布的100(1-α)百分位数,我们可以拒绝空假设。
让我们通过一个案例研究来理解未知方差的上尾检验。
假设数据标签公司说,任何一页上的标记标签的错误都少于2个。假设每页的实际平均错误量为2.12,而样本标准差为0.2。在0.05的显著性水平下,对于40页的样本量,是否有可能拒绝该公司的说法?
无效假设 :每页的标签错误<=2
备选假设 :每页的标签错误>2
显著性水平 :0.05
例子
让我们计算一下测试统计量
xbar = 2 # sample mean
mu0 = 2.12 # hypothesized value
s = 0.2 # sample standard deviation
n = 40 # sample size
t = (xbar-mu0)/(s/sqrt(n))
t # test statistic
输出
3.7947331
现在,让我们计算一下0.05显著性水平下的临界值。
alpha = .05
t.alpha = qt(1-alpha, df=n-1)
t.alpha # critical value
输出
1.68487
检验统计量3.794733远远大于临界值1.68487,这意味着根据我们最初的假设,这里t>tα,所以我们拒绝了无效假设。
因此,在0.05的显著性水平下,我们拒绝该公司的声明,即在40页的样本中,他们每页的平均标签错误不低于2。在这里,我们没有足够的证据不能拒绝该公司的说法。