R语言 如何用ggplot2制作分组博弈图
在这篇文章中,我们将讨论如何在R编程语言中使用ggplot2包制作分组的博列表。
Boxplot帮助我们可视化比较不同的连续变量或分类变量的定量数据的分布。膨胀图由五个数字总结组成,有助于检测和去除数据集中的异常值。这五个摘要数字是最小值、第一四分位数、中位数、第三四分位数和最大值。
分组膨胀图用于可视化具有多个子组的数据。此外,我们还可以用分组膨胀图一次直观地显示三个变量,其中一个变量是数字变量,另外两个是分类变量。我们可以通过使用R中ggplot的颜色属性来实现第四个变量的可视化。
首先,为了在R语言中使用ggplot2包制作一个基本的boxplot,我们使用R语言中的geom_boxplot()函数。
语法
ggplot(dataframe, aes( x, y ) )+ geom_boxplot()
例子
这里,是一个使用ggplot2包的geom_boxplot函数制作的基本boxplot。
# load library ggplot
library(ggplot2)
# Plot boxplot using ggplot function
# diamonds dataset used here is inbuilt in the R Language
plot <- ggplot(diamonds, aes(x=factor(cut), y=carat))+
geom_boxplot()+
theme( legend.position = "none" )
# print boxplot
plot
输出

创建分组的boxplot
为了将这个基本的boxplot转换为分组的boxplot,我们使用了ggplot2包的ais()函数的颜色属性。在这里,我们使用第三个变量作为参数color的值,将一个基本的boxplot转换为分组boxplot。
语法
ggplot(dataframe, aes( x, y, color = z ) )+ geom_boxplot()
参数 :
- x 是第一个分类变量
- y 是定量变量
- z 是第二个分类变量。
例子
这里,是一个在ggplot2中按变量颜色分组的boxplot。例子中使用的钻石数据集是在R语言中预先建立的。
# load library ggplot
library(ggplot2)
# Plot boxplot using ggplot function
# diamonds dataset used here is inbuilt in the R Language
plot <- ggplot(diamonds, aes(x=factor(cut), y=carat, color = factor(color)))+
geom_boxplot()+
theme( legend.position = "none" )
# print boxplot
plot
输出

带有切面的分组博弈图
还有一种方法可以在R语言中使用ggplot2包来制作分组的博列表。它就是在ggplot中使用facet。ggplot2中的faceting函数提供了一个通用的解决方案,可以通过一个或多个变量来分割数据,并将数据的子集放在一起绘制成图。为了创建一个分组的boxplot,我们可以使用facet_wrap()函数。
语法
ggplot(dataframe, aes( x, y ) )+ geom_boxplot() + facet_wrap(~z)
参数 :
- x 是第一个分类变量
- y 是定量变量
- z 是第二个分类变量
例子
这里,是一个使用facet_wrap()函数在ggplot2中按颜色变量分组的boxplot。本例中使用的钻石数据集是在R语言中预先建立的。我们还通过在ggplot()函数中使用切割变量作为颜色参数的值来为该图着色。
# load library ggplot
library(ggplot2)
# Plot boxplot using ggplot function
# diamonds dataset used here is inbuilt in the R Language
plot <- ggplot(diamonds, aes(x=factor(cut), y=carat, color=factor(cut) ))+
geom_boxplot()+
theme( legend.position = "none" )+
facet_wrap(~color, ncol=3)
# print boxplot
plot
输出

极客教程