R语言平均值和标准误差制作箱线图
在统计分析中,箱线图是一种常用的数据可视化工具,可以用来展示一组数据的分布情况,包括数据的中位数、上下四分位数以及离群值。而在绘制箱线图的过程中,除了展示数据的分布信息外,有时候我们也想同时展示数据的平均值和标准误差,以更全面地了解数据的特征。本文将详解如何使用R语言制作箱线图,并在图中显示平均值和标准误差。
准备数据
首先我们需要准备一组数据,假设这组数据包括了两组观测值,分别为group1
和group2
。我们可以使用以下代码生成这组数据:
set.seed(123)
group1 <- rnorm(50, mean = 10, sd = 2)
group2 <- rnorm(50, mean = 12, sd = 2)
data <- data.frame(group = rep(c("Group 1", "Group 2"), each = 50),
value = c(group1, group2))
上述代码中,我们生成了两组随机正态分布的数据,分别代表group1
和group2
,每组包括50个观测值,均值分别为10和12,标准差均为2。
绘制箱线图
接下来,我们可以使用ggplot2
包中的geom_boxplot
函数绘制箱线图,并通过stat_summary
函数添加平均值和标准误差的显示。以下是绘制箱线图的代码:
library(ggplot2)
ggplot(data, aes(x = group, y = value)) +
geom_boxplot(fill = "lightblue") +
stat_summary(fun = mean, geom = "point", shape = 18, size = 3, color = "red") +
stat_summary(fun.data = mean_se, geom = "errorbar", width = 0.2, color = "red")
在上述代码中,我们首先使用ggplot
函数创建一个绘图对象,指定group
为x轴变量,value
为y轴变量。然后通过geom_boxplot
函数绘制箱线图,并指定填充颜色为”lightblue”。接着使用stat_summary
函数添加平均值的显示,fun = mean
表示计算平均值,geom = "point"
表示用点表示平均值,shape = 18
和size = 3
指定点的形状和大小,color = "red"
指定颜色为红色。最后通过stat_summary
函数再次添加标准误差的显示,fun.data = mean_se
表示计算标准误差,geom = "errorbar"
表示用误差线表示标准误差,width = 0.2
指定误差线的宽度,color = "red"
同样指定颜色为红色。