线性回归的假设–同方差性

线性回归的假设–同方差性

简介

线性回归是机器学习中最常用和最简单的算法之一,它有助于预测几乎所有类型的问题陈述中的线性数据。尽管线性回归是一种参数化的机器学习算法,但该算法对数据进行了某些假设,以使预测更快、更容易。同质性也是线性回归的核心假设之一,在对所尊重的数据集应用线性回归时,假定其得到满足。在这篇文章中,我们将讨论线性回归的同方差假设,它的核心思想,它的重要性,以及其他一些与此相关的重要内容。

在这篇文章中,我们将讨论线性回归的行为模式,为什么它是一种参数化的算法,什么是同方差,以及它的重要性。这篇文章将帮助人们理解线性回归的参数化行为,也将能够理解线性回归的同方差假设。

假设的必要性

在开始讨论线性回归的假设之前,有必要知道我们为什么要假设这个东西;这样做的必要性是什么?

为了更好地理解这个概念,有必要先了解参数模型。参数模型是机器学习中的一种算法,它的工作原理是使用函数进行训练,它们的输出结果是基于函数的。由于函数是用来训练和预测算法的,每一个数据点或数据集都不能直接应用,因此,为了使这个过程更加方便和有效,我们假设某些事情,然后建立一个相同的函数。

例如,线性回归是一种参数化的算法,它假设数据是线性和同方差的。

什么是同方差

同方差是线性回归的假设之一,其中残差的方差被假定为常数。简单地说,误差项在图形或误差与预测变量的关系中应该是方差不变的,而且误差项的值不应该随着预测变量值的变化而变化。

与同方差相反的是异方差,即误差项或残差不随预测变量的变化而恒定,误差项随着预测变量的变化而迅速变化。

我们知道,在线性回归中,石灰方程被用来解决数据模式问题,即Y=mX+c,其中m和c是常数,X是自变量,y是因变量。

现在,我们将有一些因变量Y的值被认为是真实值,同时,我们将用自变量X预测Y的值,这将被称为变量Y的预测值。

这里的误差项只是变量Y的真实值和变量Y的预测值之间的差值,同方差表示误差项和预测变量Y之间的恒定方差。

同方差实例

让我们尝试通过一个例子来理解同方差的概念,以清楚它背后的所有核心直觉。

让我们假设,你想根据某个学生花在学习这个科目上的时间来预测学生的分数。因此,在这种情况下,学生的分数将是我们的因变量,它将取决于时间变量,而独立列或变量将是一个特定的学生花在学习该科目的时间。

现在,让我们假设我们拥有的数据是线性的,我们将使用线性回归来解决这个问题。在这里,在这种情况下,将产生一条最佳拟合线,这将是回归线,它也可以给出一个关于未知数据的学生分数的想法。

但是,由于你已经创建了一个预测学生分数的模型,你将检查模型的准确性以验证算法,并在需要时进行修改。现在为了验证模型,你将通过计算学生分数的实际值和学生分数的预测值之间的差异来计算模型的误差。

现在,如果你想检查模型是否遵循同方差性,那么你可以绘制误差项(残差)和预测变量Y(学生的预测分数)之间的图表(散点图)。

线性回归的假设--同方差性

正如我们在上图中所看到的,标记或因果预测变量的预测值与残差之间的散点图被绘制出来,其中散点或方差是恒定的,这意味着该模型遵循同方差,是令人满意的。

同方差的重要性

同方差是线性回归的假设之一。我们知道,线性回归是一个参数模型,需要其假设得到满足,所以如果我们应用线性回归。如果这个假设没有得到满足,那么所建立的模型将非常差,准确性也不高。

另外,同方差使我们了解误差项相对于预测变量的分布或方差;通过分析同方差的图形,我们可以很容易地确定模型的高误差和错误之处,从而影响模型的整体性能。

主要启示

  • 线性回归是一个参数模型,它假定数据和模型都满足某些假设。

  • 同方差是定义模型的误差项和预测变量之间在图形上的方差相等的术语。

  • 异方差模型在误差与预测变量的图形上没有相等的方差。

  • 同方差图给我们提供了一个概念,即模型给出了高的误差值,这些误差值可以被固定。

  • 符合同方差的模型对线性回归算法来说是令人满意的。

结论

在这篇文章中。我们讨论了线性回归算法的同方差假设,并讨论了其他重要术语,如参数模型,为什么需要假设,以及同样的例子。这篇文章将帮助人们更好地理解同方差的概念,并能够非常有效地回答与之相关的面试问题,这些问题大多被问及。

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程