R语言 如何使用ggplot2制作以文本为点的膨胀图
在这篇文章中,我们将讨论如何使用R编程语言中的ggplot2包制作以文本为点的boxplots。
箱形图是一种图表,它显示了包括中心趋势衡量标准之一的五个数字汇总的数据。这五个摘要数字是最小值、第一四分位数、中位数、第三四分位数和最大值,这有助于我们通过视觉表现来分析不同的统计措施。
要导入和安装ggplot2软件包,我们需要遵循以下语法。
install.package('ggplot2') # To install
import('ggplot2') # To import
创建基本的boxplot
我们可以通过使用R语言中ggplot2包的geom_boxplot()函数来创建一个基本的boxplot。
语法
ggplot(dataframe, aes( x, y, color ) ) + geom_boxplot()
例子
在这个例子中,使用ggplot2软件包的geom_boxplot函数制作了一个基本的boxplot。
本例中使用的CSV文件可以在这里下载。
# Load library ggplot2
library(ggplot2)
# read sample_data from csv as a dataframe
sample_data <- read.csv("df.csv")
# use sample_data to plot a boxplot
# Color the plot by group using color parameter
ggplot(sample_data, aes(x=group, y=value, color=group))+
geom_boxplot()
输出

添加数据点作为叠加
为了将抖动的数据点作为覆盖层添加到boxplot中,我们将使用ggplot2包的geom_jitter()函数。这个函数在boxplot上添加了一个层,上面绘制了实际的点。
语法
ggplot(dataframe, aes( x, y, color )+ geom_boxplot() + geom_jitter()
参数
- x 是分类变量
- y 是定量变量
- z 是小组在颜色图中使用的分类变量。
例子
在这个例子中,使用ggplot2包的geom_boxplot函数制作了一个boxplot。实际的数据点是用geom_jitter()函数叠加到boxplot上的。
# Load library ggplot2
library(ggplot2)
# read sample_data from csv as a dataframe
sample_data <- read.csv("df.csv")
# use sample_data to plot a boxplot
# Add jitter points to boxplot using
# geom_jitter() function
ggplot(sample_data, aes(x=group, y=value, color=group))+
geom_boxplot()+
geom_jitter()
输出

用标签替换数据点
现在,为了分析数据,我们将使用参数position的geom_text()函数将数据点与各自的标签替换。geom_text()函数用数据标签替换了数据点,但所有的标签都是一条直线。为了使其具有抖动性,我们使用position参数作为position_jitter()。
语法
ggplot(dataframe, aes( x, y, color )+ geom_boxplot() + geom_text( position= position_jitter() )
例子
这里,使用geom_text()函数将实际数据点叠加到boxplot上作为标签文本。
# Load library tidyverse
library(tidyverse)
# read sample_data from csv as a dataframe
sample_data <- read.csv("df.csv")
# use sample_data to plot a boxplot
# Add jitter points to boxplot using geom_jitter()
# function
ggplot(sample_data, aes(x=group,y=value, label = Label, color=group))+
geom_boxplot()+
geom_text(check_overlap = TRUE, position=position_jitter(width=0.15))
输出

极客教程