R语言 如何在R中使用ggplot2创建没有晶须的boxplot
箱形图是一种以四分位数的形式来表示一组数字数据的方法。四分位数是指在整个数据集中处于某个特定百分位数的数值。箱形图表示一组数据的五位数汇总。五位数汇总有数据的最低值、第一四分位数、第二四分位数(中位数)、第三四分位数和最大值。
如上图所示,箱形图也有从第一四分位数到最小值和从第三四分位数到最大值的晶须。本文主要讨论如何显示没有晶须的膨胀图。
列表图的组成部分
- 最小值:数据集中的最低值,不包括离群值。
- 第一四分位数(Q1):数据集中位于第25个百分点的数值。
- 第二四分位数(Q2):数据集中第50个百分点的数值。它也被称为数据的中位数。
- 第三四分位数(Q3):数据集中第75个百分点的数值。
- 最大值:数据集中的最高值,不包括离群值。
- 四分位数范围(IQR)。第一四分位数(Q1)和第三四分位数(Q3)之间的距离。IQR的定义如下:
- 晶须:上面显示的从最小值到Q1和Q3到最大值的线是晶须。
- 离群值:任何小于最小值和大于最大值的数值都是数据的离群值。
使用的函数
语法: boxplot(x, data, notch, varwidth, names, main)
参数。
- x: 该参数设置为一个向量或公式。
- data: 该参数设置为数据框。
- notch: 该参数是横轴的标签。
- varwidth: 这个参数是一个逻辑值。设置为 “true”,可以绘制与样本大小成比例的框的宽度。
- main: 该参数是图表的标题。
- names: 该参数是将在每个boxplot下显示的组标签。
程序1: 常规boxplot
x <- 1:20
y <- sample(1000,20, replace = TRUE)
df <- data.frame(x,y)
library(ggplot2)
ggplot(df, aes(x,y, group =1))+geom_boxplot()
输出:
带有晶须的波谱图
现在,为了创建同样的无晶须图,geom_boxplot()函数的coef参数应该设置为0。这里,coef参数是晶须的长度为IQR的倍数。默认值是1.5,但在这里我们把它设置为0。因此,晶须被消除了。
方法
- 导入资料库
- 创建数据
- 创建数据框架
- 绘制无晶须的boxplot
程序2 :
x <- 1:20
y <- sample(1000,20, replace = TRUE)
df <- data.frame(x,y)
library(ggplot2)
ggplot(df,aes(x,y, group =1))+geom_boxplot(coef=0)
输出:
无晶须的波谱图