R语言 如何在R中提取线性回归模型的截距

R语言 如何在R中提取线性回归模型的截距

线性回归是机器学习中的一种预测分析方法。它基本上用于检查两件事。

  1. 一组预测变量(独立变量)是否能很好地预测结果变量(因变量)。
  2. 哪些预测变量在预测结果变量方面是显著的,以何种方式,这分别由估计值的大小和符号决定。

线性回归用于一个结果变量和一个或一个以上的预测变量。简单线性回归对一个结果和一个预测变量起作用。简单线性回归模型本质上是一个线性方程,其形式为 y=c+b*x ;其中y是因变量(结果),x是自变量(预测器),b是直线的斜率;也称为回归系数,c是截距;标记为常数。

线性回归线是一条最适合预测变量(自变量)和预测变量(因变量)之间图形的线。

如何在R中提取线性回归模型的截距

收入与幸福数据集的回归线(绿色实线)。

在上图中,绿色的线是最佳拟合线;它被视为给定数据集的回归线。

决定回归线的最流行的方法之一是最小二乘法。这种方法主要是通过最小化每个数据点的垂直偏差的平方之和(位于线上的点的偏差为0)来找到数据的最佳拟合线。由于偏差的平方,偏差的正负值之间没有抵消。

办法

  1. 为线性回归选择一个合适的问题陈述。我们将选择收入.data_ 。
  2. 安装并加载用于绘图/可视化的软件包。你可以将数据点可视化,看看数据是否适合于线性回归。
  3. 在一个数据框中读取数据集。你也可以在读取后将数据框可视化(下面的代码中显示的例子)。
  4. 使用 lm() 函数从数据中创建一个线性回归模型。将创建的模型存储在一个变量中。
  5. 探索该模型。

如何在R中提取线性回归模型的截距

将因变量和自变量相互绘制后的散点图

第1步: 安装并加载所需的软件包。读取并探索数据集。你也可以使用 setwd() 函数设置笔记本的工作目录,将目录的路径(数据集存放的地方)作为参数传入。

# install the packages and load them
install.packages("ggplot2")
install.packages("tidyverse")
library(ggplot2)
library(tidyverse)
  
# Read the data into a data frame
dataFrame <- read.csv("income_data.csv")
  
# Explore the data frame
head(dataFrame)
Bash

输出

如何在R中提取线性回归模型的截距

第2步: 将数据集的变量分开。将数据集可视化。

# Allocate the columns to different variables
# x is the independent variable
x <- dataFrameincome
  
# y is the dependent variable
y <- dataFramehappiness
  
# Plot the graph between dependent and independent variable
plot(x, y)
Bash

输出

如何在R中提取线性回归模型的截距

X(收入)与Y(幸福感)的关系图

第3步: 从数据中清除线性回归模型。训练并查看该模型。

# Create the linear model from the data. 
# y ~ x denotes y dependent and x is the independent variable
model <- lm(y~x)
  
# Print the model to check the intercept
model
Bash

输出

Call:
lm(formula = y ~ x)

Coefficients:
(Intercept)            x  
     0.2043       0.7138  
Bash

正如你所看到的,截距的数值是0.2043。但是如何在一个变量中获得这个值呢?

提取截距的数值

我们可以用创建的模型的摘要来提取截距的值。

代码

model_summary <- summary(model)
  
intercept_value <- model_summary$coefficients[1,1]
  
intercept_value
Bash

输出

0.204270396204177
Bash

如果你试图打印模型(model_summary)变量的摘要,你会看到下面的系数。这是一个二维矩阵,它存储了所有上述系数。因此,[1,1]将对应于(回归线的)预测截距。

model_summary <- summary(model)
model_summary
Bash

输出

如何在R中提取线性回归模型的截距

这就是我们如何从R语言的线性回归模型中提取截距值的方法。

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程

登录

注册