R语言 人口比例的两尾测试
统计假设检验 是将你对人口参数的假设进行检验,并通过计算和比较人口参数与检验统计数据来检查你的假设是否仍然有效。
在制定假设检验时遵循的常规步骤如下
- 说明无效假设(Ho)和备用假设(Ha)。
- 收集一个相关的数据样本来检验假设。
- 为假设检验选择一个显著性水平。
- 进行适当的统计检验。
- 根据检验统计数据和P值决定是否拒绝或不能拒绝你的无效假设。
一般来说,假设检验是为了估计人口平均数和人口比例,在这篇文章中,让我们讨论如何进行双尾人口比例检验。一般来说,双尾检验是一种方法,其中分布的临界区域是双侧的(两个极端),测试样本是否大于或小于特定的数值范围。
双尾检验,α=0.05,(两边都是0.025)。
比例的假设检验涉及测量两个结果,如成功或失败,真或假,好或坏,等等,在一组确定的试验中。在整个试验过程中,得到成功或失败的概率应该是相同的。
让我们举一个更现实的例子,今天网络犯罪是网上的一个主要威胁,所以让我们考虑一个信用卡欺诈性交易案例。假设一家流行的银行公司已经进行了几年的研究,并得出了标准的参考值,即任何交易被欺诈的概率是5%,反过来说,任何交易被非欺诈的概率是9%。因此,这里的成功概率是0.95,失败概率是0.05,并假设这些数字对任何信用卡交易来说都是恒定的。
有一天,一家有竞争力的银行公司希望挑战这些数字,并希望进行一个假设测试来证明欺诈性交易的概率不等于2%。这家有竞争力的银行公司随机抽取了25笔交易,发现25笔交易中有2笔是欺诈性的。让我们根据上述问题来构建人口比例假设。
无效假设: 任何交易被欺诈的概率为5% p=po(这里,po=0.05
备选假设: 任何交易被欺诈的概率不等于5% p != po
α: 0.05
让我们将测试统计量定义如下
其中
- :样本比例
- p = 人口比例
- n = 样本大小
例子
让我们用R计算测试统计量函数,如下所示
pbar = 2/25 # sample proportion
p0 = 0.05 # hypothesized value
n = 25 # sample size
z = (pbar-p0)/sqrt(p0*(1-p0)/n) # test statistic
z
输出
z = 0.688247201611683
现在让我们计算一下0.05显著性水平下的临界值。
alpha = .05
z.half.alpha = qnorm(1-alpha/2)
c(-z.half.alpha, z.half.alpha)
输出
-1.95996398454005, 1.95996398454005
计算出的检验统计量0.68824720位于临界值-1.9600和1.9600之间。因此,在 0.05的显著性水平 下 , 我们 无法拒绝无效假设。 换句话说, 我们没有足够的证据得出结论,欺诈性交易的概率不等于5%。