R语言 量化回归
量子回归是一种研究自变量对因变量分布的不同量级的影响的算法。Quantile Regression提供了Z和Y之间关系的完整画面。在量化回归中,估计和推断是无分布的。 量子回归是线性回归的延伸,即当线性回归的条件不满足时(即线性、独立性或正态性),它被使用。 它将条件量化函数估计为预测因子的线性组合,用于研究变量的分布关系,有助于检测异方差,也有助于处理删减的变量。在R编程中执行量化回归是非常容易的。
数学表达式
量子回归更有效,对离群值更稳健。在量化回归中,你不仅限于寻找中位数,即你可以计算特征变量中某个特定值的任何百分比(量化)。例如,如果想找到某栋楼的价格的第 30个四分位数,这意味着该楼的实际价格有30%的机会低于预测值,而有70%的机会高于预测值。因此,量化回归模型的方程式为。
因此,现在贝塔系数不再是常数,而是与四分位数有关的函数。在一个特定的四分位值上寻找这些贝塔系数的值,其过程与常规的线性量化几乎相同。我们现在必须减少中位数的绝对偏差。
另外,数学上pt的形式。
函数 pt(u)是检查函数,它给误差以不对称的权重,这取决于量化和误差的整体符号。
R语言 实现
数据集
mtcars (motor trend car road test)包括32种汽车的油耗、性能和汽车设计的10个方面。它预先安装了R语言中的 dplyr 包。
输出
在数据集上执行量化回归
通过使用数据集中的特征或变量训练模型,在数据集上使用量化回归算法。
输出
- 模型Quan_fit
模型Quan_fit的截距为-129.7880,自由度为32度。
- 模型摘要
该模型的tau值为0.5,下bd为-185.6818,上bd为-100.5439,系数为-129.7880。
- 图形
图中蓝色为量化回归线,红色为线性回归线。因此,量化回归的应用在增长图、统计、回归分析中得到了充分的应用。
类比回归的优点
- 有助于理解具有非线性关系的数据变量与预测变量之间的关系。
- 它对离群值是稳健而有效的。
- 它有助于获得统计学上的分散性,这有助于更深入地审查变量之间的关系。