R语言 使用ggplot2进行多元线性回归
回归线基本上用于统计模型,帮助估计因变量和至少一个自变量之间的关系。有两种类型的回归线。
- 单一回归线。
- 多重回归线。
在这篇文章中,我们将讨论如何在R编程语言中使用ggplot2散点图绘制多重回归线。
使用的数据集: 这里我们使用一个内置的数据框 “Orange”,其中包括五种不同类型的橙子树的生长细节。该数据框有 35行和3 列。这个数据框中的列是 。
- 树。在橙子直径增加的基础上进行实验的树的排序。
- 年龄:树木的年龄,从它们被种植开始。
- 周长。橙子的周长。
我们首先创建一个散点图。我们将使用ggplot2库中的函数 geom_point( ) 来绘制散点图。
语法
geom_point( mapping=NULL, data=NULL, stat=identity, position=”identity”)
基本上,我们正在对橙子的周长与年龄进行比较分析。使用的函数是 geom_smooth( ) 来绘制平滑线或回归线。
语法: geom_smooth(method=”auto”,se=FALSE,fullrange=TRUE,level=0.95)
参数:
- method : 使用关键字loess, lm, glm等来指定平滑方法
- lm : 线性模型,loess : 在小数据集观察期间默认为平滑线。
- formula : 公式。你也可以使用平滑线的公式。例如:y~poly(x,4),这将绘制出4度的平滑线。 度数越高,平滑线的弯曲度越大。
- se : 它的逻辑值是 “TRUE “或 “FALSE”。
- fullrange : 它的逻辑值是 “TRUE “或 “FALSE”。
- level:默认情况下,置信区间的水平为0.95。
让我们先画一个简单的单线回归,然后再增加复杂度到多线回归。
例子
输出
这是一个单一的平滑线,或俗称为回归线。在这里,各点是结合在一起的,没有在任何组的基础上进行隔离。
多重线性回归将处理相同的参数,但每条线将代表一个不同的组。因此,如果我们想在它们所属的组的基础上绘制点,我们需要多重回归线。每条回归线将与一个组相关联。
多重回归线的基本公式:
在R语言中,计算与多元回归线有关的系数和其他参数的语法是 。
var <- lm(formula, data = data_set_name)
summary(var)
lm : 线性模型
var:变量名称
为了在同一个图形上计算多条回归线,应设置属性,在此基础上形成形状参数的组。
语法
shape = attribute
一条回归线与一个组相关联,可以在图表的图例中看到。现在,为了给每条回归线分配不同的颜色,请写下命令。
color = attribute
例子
输出