R语言 如何创建和解释对子图
在这篇文章中,我们将讨论如何在R语言中创建和解释配对图。
对子图帮助我们直观地看到单个变量的分布以及两个变量之间的关系。它们是确定变量之间趋势的一个很好的方法,用于后续分析。对子图本质上是多面板散点图,每个不同的面板都包含一对变量之间的散点图。
方法1:在基础R中创建对子图
为了在R语言中创建一个对子图,我们使用pair()函数。R语言中默认提供了pair函数,它产生了一个散点图矩阵。pairs()函数将数据框作为一个参数,并返回数据框中每一对变量之间的散点图矩阵。
语法: pairs( df )
参数 。
- df: 决定用于绘制散点图的数据框架。
例子 。
这里,是Base R中的一个基本的Pair Plot。
输出 。
在这里,在上面的配对图中,对角线框显示了变量x、y和z的名称,所有其他框显示了每个变量配对组合之间的散点图。例如,第二个方框显示x和y之间的散点图,而第三个方框显示x和z之间的散点图。
这种配对图的问题是,它没有给我们提供任何关于变量的统计信息,在上图的六个散点图中,只有三个有区别的散点图,因为x-z和z-x图相同,y-x和x-y图相同,y-z和z-y图也相同。因此,存在着空间的浪费和关系数据的缺失。为了解决这个问题,我们使用ggplot2包。
方法2:使用ggplot2和ggally创建配对图
为了使用ggplot2包创建成对图,我们使用ggally包的ggpairs()函数。ggally包是ggplot2包的一个扩展,它通过增加几个函数来扩展ggplot2包,以降低将几何图形与转换后的数据相结合的复杂性。ggpairs()函数用一个给定的数据集制作了一个图的矩阵。它为每对变量制作散点图,为每个变量制作密度图,还显示每对变量的皮尔逊相关系数。
语法。
ggpairs( df )
参数。
- df: 决定用于绘制散点图的数据框架。
例子 。
这里,是一个使用ggplot2和ggally包库的基本配对图。
输出 。
在上面的配对图中,变量名称以x、y和z的形式显示在矩阵的外缘。沿对角线的方框显示每个变量的密度图,而左下角的方框显示每个变量配对之间的散点图。右上角的方框显示每个变量之间的皮尔逊相关系数。
皮尔逊相关系数为我们提供了两个变量之间线性关系的衡量标准。它的值在-1到1之间,其中-1的值表示完全的负线性相关,0表示没有相关,而+1表示完全的正相关。
使用ggplot2软件包绘制的对子图更好,因为它们提供了更多的视觉信息,而且没有重复绘制的痕迹。它们也给我们提供了皮尔逊相关系数,帮助我们理解这些变量之间的关系。