R语言 使用ggplot2进行多元线性回归

R语言 使用ggplot2进行多元线性回归

回归线基本上用于统计模型,帮助估计因变量和至少一个自变量之间的关系。有两种类型的回归线。

  • 单一回归线。
  • 多重回归线。

在这篇文章中,我们将讨论如何在R编程语言中使用ggplot2散点图绘制多重回归线。

使用的数据集: 这里我们使用一个内置的数据框 “Orange”,其中包括五种不同类型的橙子树的生长细节。该数据框有 35行和3 列。这个数据框中的列是 。

  • 树。在橙子直径增加的基础上进行实验的树的排序。
  • 年龄:树木的年龄,从它们被种植开始。
  • 周长。橙子的周长。

我们首先创建一个散点图。我们将使用ggplot2库中的函数 geom_point( ) 来绘制散点图。

语法

geom_point( mapping=NULL, data=NULL, stat=identity, position=”identity”)

基本上,我们正在对橙子的周长与年龄进行比较分析。使用的函数是 geom_smooth( ) 来绘制平滑线或回归线。

语法: geom_smooth(method=”auto”,se=FALSE,fullrange=TRUE,level=0.95)

参数:

  • method : 使用关键字loess, lm, glm等来指定平滑方法
  • lm : 线性模型,loess : 在小数据集观察期间默认为平滑线。
  • formula : 公式。你也可以使用平滑线的公式。例如:y~poly(x,4),这将绘制出4度的平滑线。 度数越高,平滑线的弯曲度越大。
  • se : 它的逻辑值是 “TRUE “或 “FALSE”。
  • fullrange : 它的逻辑值是 “TRUE “或 “FALSE”。
  • level:默认情况下,置信区间的水平为0.95。

让我们先画一个简单的单线回归,然后再增加复杂度到多线回归。

例子

# Scatter Plot
library(ggplot2)
  
ggplt <- ggplot(Orange,aes(x=circumference,y=age))+
         geom_point()+
         theme_classic()
  
ggplt
  
# Plotting a single Regression Line
ggplt+geom_smooth(method=lm,se=FALSE,fullrange=TRUE)
R

输出

在R中使用ggplot2进行多元线性回归

这是一个单一的平滑线,或俗称为回归线。在这里,各点是结合在一起的,没有在任何组的基础上进行隔离。

多重线性回归将处理相同的参数,但每条线将代表一个不同的组。因此,如果我们想在它们所属的组的基础上绘制点,我们需要多重回归线。每条回归线将与一个组相关联。

多重回归线的基本公式:

在R中使用ggplot2进行多元线性回归

在R语言中,计算与多元回归线有关的系数和其他参数的语法是 。

var <- lm(formula, data = data_set_name)

summary(var)

lm : 线性模型
var:变量名称

为了在同一个图形上计算多条回归线,应设置属性,在此基础上形成形状参数的组。

语法

shape = attribute

一条回归线与一个组相关联,可以在图表的图例中看到。现在,为了给每条回归线分配不同的颜色,请写下命令。

color = attribute

例子

library(ggplot2)
  
ggplt <- ggplot(Orange,aes(x=circumference,y=age,shape=Tree))+
         geom_point()+
         theme_classic()
  
ggplt
  
# Plotting multiple Regression Lines
ggplt+geom_smooth(method=lm,se=FALSE,fullrange=TRUE,
                  aes(color=Tree))
R

输出

在R中使用ggplot2进行多元线性回归

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程

登录

注册