如何在Python中使用多项式回归模型来理解非线性趋势数据?
在构建回归模型时,要检查多重共线性。这是因为我们需要了解连续变量的所有不同组合之间存在的相关性。如果变量之间存在多重共线性,则必须确保从数据中删除它。
实际世界中的数据通常是非线性的。我们需要找到机制来将这种非线性数据拟合到模型中。我们将使用安斯科姆数据集来可视化此数据。
使用非线性数据的“implot”函数−
更多Python相关文章,请阅读:Python 教程
示例
import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
my_df = sb.load_dataset('anscombe')
sb.lmplot(x="x", y="y", data=my_df.query("dataset == 'II'"), order=3)
plt.show()
输出
解释
- 导入所需的软件包。
- 输入数据为从Seaborn库加载的“anscombe”。
- 此数据存储在数据框中。
- 使用“load_dataset”函数加载鸢尾花数据。
- 使用“implot”函数可视化此数据。
- 在此处,提供数据框作为参数。
- 还指定了x值,y值和顺序。
- 此数据在控制台上显示。