R语言 卡方检验
卡方检验 是一种统计方法,用于确定两个分类变量之间是否存在显著的相关性。这两个变量应来自同一总体,且应是分类的,例如:是/否、男/女、红/绿等。
例如,我们可以建立一个数据集,观察人们的购买冰淇淋的模式,并试图将一个人的性别与他们喜欢的冰淇淋口味相关联。如果发现相关性,我们可以根据访问的人数来计划适当的库存。
语法
用于执行卡方检验的函数是 chisq.test() 。
在R中创建一个卡方检验的基本语法如下:
以下是所使用参数的描述−
- data 是以表格形式呈现的数据,包含观察中变量的计数值。
示例
我们将使用”MASS”库中的Cars93数据,该数据代表了1993年不同车型的销售情况。
当我们执行上述代码时,会产生以下结果 –
上述结果显示数据集有许多因子变量,可以视为分类变量。对于我们的模型,我们会考虑”AirBags”和”Type”这两个变量。在这里,我们的目标是找出销售的汽车类型和其所配备的安全气囊类型之间是否存在显著相关性。如果观察到相关性,我们可以估计哪种类型的汽车可以更好地销售与哪种类型的安全气囊配备。
当我们执行上面的代码时,它会产生以下结果 –
结论
结果显示p值小于0.05,表明存在强相关性。