如何使用R编程在回归中包括交互作用
在这篇文章中,我们将研究什么是交互作用,以及我们是否应该在模型中使用交互作用以获得更好的结果。
在回归中使用R语言包括交互作用
假设X1和X2是一个数据集的特征,Y是我们试图预测的类标签或输出。那么,如果X1和X2相互影响,这意味着X1对Y的影响取决于X2的值,反之亦然,那么数据集的特征之间的相互影响是什么呢?现在,我们知道了我们的数据集是否包含交互作用。我们也应该知道什么时候在我们的模型中考虑到交互作用,以获得更好的精度或准确性。我们将使用R语言来实现这一点。
我们是否应该在我们的模型中包括交互作用
在将互动纳入模型之前,你应该问两个问题。
- 这个交互作用在概念上有意义吗?
- 交互项在统计上有意义吗?或者说,我们是否认为回归线的斜率有明显不同。
在R中的实施
让我们通过一个例子来看看线性回归模型中的交互作用。
- 数据集
- 肺活量数据集
- 参数/变量。
- 独立变量(Y)。肺活量
- 因果变量(X1):吸烟(是/否)
- 因果变量(X2):年龄
例子
第1步:加载数据集
第2步:绘制数据,用不同颜色表示吸烟者(红色)/非吸烟者(蓝色 )
输出
输出
输出
第3步。拟合一个Reg模型,使用年龄、吸烟和它们的相互作用,并在回归线中添加 。
输出
输出
第4步:让我们使用abline命令添加我们模型的回归线
输出
输出
输出