R语言 Chi-Square测试
独立性的卡方检验评估了两个变量的类别之间是否存在关联。基本上有两种类型的随机变量,它们产生两种类型的数据:数字型和分类型。Chi-square统计学被用来研究分类变量的分布是否彼此不同。在比较两个(或更多)独立组之间的分类反应的统计数字或计数时,Chi-square检验也很有用。
在R中,用于进行卡方检验的函数是 chisq.test()。
语法:
chisq.test(data)
参数:
data :data是一个包含表中变量的计数值的表格。
例子
我们将采取 MASS 库中的调查数据,它代表了对学生进行调查的数据。
输出
上述结果表明,数据集有许多因素变量,可以被视为分类变量。对于我们的模型,我们将考虑变量 “Exer “和 “Smoke “。 Smoke一栏记录了学生的吸烟习惯,Exer一栏记录了他们的运动水平。 我们的目的是在0.05的显著性水平上检验学生的吸烟习惯是否与他们的运动水平无关的假说 。
输出
最后我们将 chisq.test() 函数应用于或然率表stu_data。
输出
由于P值0.4828大于0.05,我们得出结论,吸烟习惯与学生的运动水平无关,因此这两个变量之间存在着微弱的或不相关的关系。
下面是完整的R代码。
因此,综上所述,可以说使用R语言进行Chi-square检验是非常容易的。人们可以使用R语言中的 chisq.test() 函数来执行这一任务。