R语言 曼-惠特尼U检验
一个流行的非参数(无分布)测试是 曼-惠特尼U测试, 用于比较两个独立组之间的结果 。 当比较两个独立样本时,当结果不是正态分布且样本较小时,非参数检验是合适的。它被用来查看两个独立变量之间的分布差异,其依据是一个序数(具有内在顺序或等级的分类变量)因变量。在R编程中执行这个测试是非常容易的。
在R编程中实现曼-惠特尼U测试
假设我们的数据中有两种灯泡,比如橙色和红色,这些灯泡是按每天的基本价格划分的。因此,这里的基本价格是红色和橙色这两个类别的因变量。因此,我们将尝试分析,如果我们想买一个红色或橙色的灯泡,我们应该在价格的基础上选择哪一个。如果两个分布相同,那么这意味着 无效假设 ( 意味着两者之间没有明显的差异 ) 是真实的,我们可以购买其中的任何一个,价格并不重要。为了理解曼-惠特尼U检验的概念,我们需要知道什么是 P值。 这个值实际上告诉我们是否可以拒绝我们的无效假设(0.5)。下面是上述例子的实现。
方法
- 制作一个有两个分类变量的数据框架,其中一个是序数型的。
- 之后,通过加载软件包 dplyr 和 summarise() 来检查非序数分类变量的汇总。 使用 median() ,得到中位数,并传递灯泡价格列,IQR-四分位数范围,以及两组的计数,即 红色和橙色灯泡。
- 然后,在安装软件包 ggpubr 和使用 ggboxplot() 的帮助下,查看Bowxplot,并在x和y中传递列作为参数,在 调色板 的帮助下给它们颜色 并 传递 颜色代码。
- 然后最后应用 wilcox.test() ,得到p值 。
- 如果发现p值小于0.5,那么 无效假设 将被拒绝。
- 如果我们发现该值大于0.5,那么 无效假设 将被接受。
- wilcox.test() 函数将两个分类变量、数据框架作为参数,并给我们提供假设 p-value 。
输出
**> DATASET **
# 数据的摘要
# boxplot
**> 资源 **
解释一下
这里我们可以看到, p 值为 0.2072 ,远远小于 无效假设(0.5)。 由于这个原因,它将被拒绝。因此可以得出结论,红色和橙色灯泡的价格分布是不一样的。因此,它不能说购买上述灯泡中的任何一个都是有利可图的。