如何在Python中执行量化回归
在这篇文章中,我们将看到如何在Python中进行量化回归。
线性回归被定义为根据给定的变量集构建因变量和自变量之间关系的统计方法。在进行线性回归时,我们对计算响应变量的平均值感到好奇。相反,我们可以使用一种被称为量化回归的机制,以计算或估计响应值的量化(百分位数)值。例如,第30个百分点,第50个百分点,等等。
量化回归
量子回归只是线性回归的一个扩展版本。量子回归构建了一组变量(也称为自变量)和量子(也称为百分位数)因变量之间的关系。
在Python中执行量化回归
计算量化回归是一个循序渐进的过程。下面将详细讨论所有的步骤。
创建一个用于演示的数据集
现在让我们创建一个数据集。作为一个例子,我们将创建一个数据集,其中包含20辆不同品牌的汽车的总行驶距离和总排放量的信息。
输出:
估算量化回归
现在我们将借助于构建一个量化回归模型。
- 行走的距离。作为一个预测变量
- 实现的里程数。作为一个反应变量
现在,我们将利用这个模型来估计基于汽车总行驶距离产生的第70个百分点的排放。
从这个程序的输出,可以推导出估计的回归方程为。
val = 39.5647 + 1.3042 * X (距离,公里)
这意味着所有行驶X公里的汽车的第70个百分位数的排放量预计为Val。
输出:
可视化的量化回归
为了可视化和理解量化回归,我们可以使用散点图与拟合的量化回归一起。
输出: