R语言 方差同质性测试
在统计学中, 如果 一个随机变量序列 的所有随机变量具有相同的有限 方差,那么它就是 同质性 的。这也被称为 方差的同质性 。在这篇文章中 , ,让我们解释一下在R编程中检查两组或多组的 方差同质性测试 的方法。一些统计检验,如两个独立样本的T检验和方差检验,假定各组的方差是相等的。有各种方差检验可以用来评估方差的平等性。这些包括。
- F检验: 它 比较两组的变异。在这个测试中,数据必须是正态分布。
- 巴特利特检验: 它比较两组或多组的方差。在这个测试中,数据也必须是正态分布的。
- Levene检验: 是Bartlett检验的稳健替代品,对偏离正态的情况不太敏感。
- Fligner-Killeen检验: 一种非参数检验,对偏离正态性非常稳健。
准备数据集
在解释每个测试之前,让我们先准备并理解数据集。考虑到R中包含的标准学习数据集之一是 “ToothGrowth “数据集。牙齿生长数据集是10只豚鼠在三种维生素C剂量水平(0.5、1和2毫克)和两种给药方法(橙汁或抗坏血酸)下各自的牙齿长度。该文件包含3个变量的60个观测值
- len: 牙齿长度
- supp: 补充剂类型(VC或OJ
- dose : 剂量,以毫克计
输出
F检验
它 用于比较两组的变异性。F检验是用来评估两个种群的方差是否相等。在这个测试中,数据必须是正态分布。
统计学假设
假设 ,是 关于给定问题 的一个 。假设检验是一种统计方法,用于利用实验数据做出统计决策。假设检验基本上是我们对人口参数的一种假设。它评估关于一个群体的两个相互排斥的陈述,以确定哪一个陈述得到了样本数据的最佳支持。要了解更多关于 统计假设的信息,请参考 《理解假设检验》。对于F检验来说,统计假设是。
- 空白假设: 两组的变异量相等。
- 备选假设: 方差不同。
在R中实现
在 var.test() 方法的帮助下,人们可以在R编程中对两个正常种群之间进行F检验,假设两个种群的变异量相等。
语法
var.test(formula, dataset)
参数
formula: 一个公式,其形式 为值~组
dataset: 一个矩阵或数据框
例子
输出
解释 。
p值为p=0.2,大于显著性水平0.05。综上所述,两个变异体之间没有显著差异。
巴特利特检验
Bartlett’s test 是用来检验 k个 样本是否来自 方差相等的人群 。不同种群的方差相等 被称为 同质性或方差同质性。一些统计测试,例如 , 方差分析测试 ,假定各组或样本的方差是相等的。巴特利特检验可以用来验证这一假设。 巴特利特检验 使 ,我们可以比较两个或多个样本的方差,以 决定它们是否来自方差相等的群体。它 适合于正态分布的数据 。
统计学假设 。
- 无效假设: 所有种群的方差都相等。
- 备选假设: 至少有两个不同。
在R中实现
R提供了一个函数 bartlett.test () ,它在 stats 包中可用来计算Barlett’s test。这个函数的语法如下 。
语法
bartlett.test(formula, dataset)
参数
formula: 形式为 数值~组 的公式
dataset: 一个矩阵或数据框
例子
输出
李文氏检验
在统计学中, Levene检验 是一种 推断统计学 , 用于评估两个或更多群体 的变量 的变异性是否相等 。一些 标准的统计程序 发现, 形成不同样本 的人群的变异 是相等的。Levene检验评估了这个假设。它 检查了人口方差相等 的 无效假设,称为 方差的同质性或同 方差性。它 比较了 k个 样本的方差,其中k可以是两个以上的样本。它是 Bartlett’s检验 的一个替代方法,对偏离正态性不那么敏感 。
统计学假设
- 无效假设: 所有种群的变异都相等
- 备选假设: 至少有两个差异
在R中实现 。
R提供了一个函数 leveneTest () ,在 car 包中可以 用来计算Levene的检验。这个函数的语法如下 。
语法
leveneTest(formula, dataset)
参数
formula: 数值~组 的形式的公式
dataset: 一个矩阵或数据框
例子
输出
弗利格纳-基伦检验
Fligner-Killeen 检验是一种基于等级的群体方差均匀性的非参数检验。当数据为非正态分布或与数据集中的异常值有关的问题无法解决时,它很有用。它 也是众多方差均匀性检验中的一种,对偏离正态性的情况最为稳健 。
统计学假设 。
- 空白假设: 所有种群的变异性都相等
- 备选假设: 至少有两个不同。
在R中实现 。
R提供了一个函数 fligner.test() ,它在 stats 包中可用 来计算 Fligner-Killeen检验 。这个函数的语法如下 。
语法
fligner.test(formula, dataset)
参数
formula: 一个公式,其形式为 数值~组
dataset: 一个矩阵或数据框
例子
输出