R语言中的线性回归和决策边界|极客教程

R语言中的线性回归和决策边界

在统计学和机器学习领域，线性回归是一种常见的建模技术，用于预测一个或多个自变量与因变量之间的关系。决策边界是指在分类问题中，通过学习得到的模型将不同类别的样本分开的边界。本文将详细介绍R语言中如何进行线性回归和如何绘制决策边界。

线性回归

线性回归是通过拟合一个线性函数来描述自变量与因变量之间的关系。在R语言中，我们可以使用lm()函数来进行线性回归。下面是一个简单的示例：

# 生成一组随机数据
set.seed(123)
x <- rnorm(100)
y <- 2*x + rnorm(100)

# 进行线性回归
model <- lm(y ~ x)

# 查看回归结果
summary(model)

上面的代码首先生成了一组随机的数据，然后使用lm()函数对其进行线性回归。最后使用summary()函数查看回归结果。在输出中，我们可以看到回归系数、残差标准误差、R平方值等信息。

决策边界

决策边界通常用于分类问题，用来将不同类别的样本进行分割。在二维空间中，决策边界通常是一个直线或曲线。在R语言中，我们可以使用一些包来绘制决策边界，比如ggplot2和caret。下面是一个简单的示例：

# 加载所需的包
library(ggplot2)
library(caret)

# 生成一组随机数据
set.seed(456)
x1 <- rnorm(50, mean=0, sd=1)
x2 <- rnorm(50, mean=1, sd=1)
y <- c(rep(0, 50), rep(1, 50))

data <- data.frame(x1=x1, x2=x2, y=as.factor(y))

# 训练模型
model <- train(y~x1+x2, data=data, method='glm')

# 绘制决策边界
ggplot(data=data, aes(x=x1, y=x2, color=y)) + 
  geom_point() + 
  geom_abline(intercept=model $finalModel$ coefficients[1], 
              slope=-model $finalModel$ coefficients[2]/model $finalModel$ coefficients[3])

上面的代码首先生成了一组二维随机数据，然后使用caret包中的train()函数训练了一个逻辑回归模型。最后使用ggplot2包中的函数绘制了决策边界。在图中，我们可以看到将两类样本分开的直线。

通过学习本文，您可以了解到如何在R语言中进行线性回归和绘制决策边界。