如何使用Python Scikit-learn生成随机回归问题?
Python Scikit-learn提供了make_regression()函数,借助它我们可以生成随机回归问题。在本教程中,我们将学习如何生成随机回归问题和具有稀疏不相关设计的随机回归问题。
随机回归问题
要使用Python Scikit-learn生成随机回归问题,我们可以遵循以下步骤:
步骤1 – 导入必需的库sklearn.datasets.make_regression和matplotlib。
步骤 2 – 提供样本数和其他参数。
步骤 3 – 使用matplotlib库设置输出图形的大小和样式。
步骤 4 – 使用matplotlib绘制回归问题。
示例
在下面的示例中,我们将生成具有500个样本的回归问题。
# 导入库
from sklearn.datasets import make_regression
from matplotlib import pyplot as plt
from matplotlib import style
import seaborn as sns
# 设置图形大小
plt.rcParams["figure.figsize"] = [7.50, 3.50]
plt.rcParams["figure.autolayout"] = True
# 创建和绘制回归问题
style.use("Solarize_Light2")
r_data, r_values = make_regression(n_samples=500, n_features=1, n_informative=2, noise=1)
plt.scatter(r_data[:,0],r_values,cmap='rocket');
plt.show()
输出
它将生成以下输出−
具有稀疏不相关设计的随机回归问题
Python Scikit-learn提供了make_sparse_uncorrelated()函数,借助它我们可以生成具有不相关设计的随机回归问题。
为此,我们可以执行以下步骤−
步骤 1 – 导入必需的库sklearn.datasets.make_sparse_uncorrelated和matplotlib。
步骤 2 – 提供样本数和其他参数。
步骤 **- 使用matplotlib库设置输出图形的大小和样式。
步骤 4 – 使用matplotlib绘制回归问题。
示例
在下面的示例中,我们将生成具有500个样本和4个特征的回归问题。 n_features参数的默认值为10。
# 导入库
from sklearn.datasets import make_sparse_uncorrelated
from matplotlib import pyplot as plt
from matplotlib import style
# 设置图像大小
plt.rcParams["figure.figsize"] = [7.50, 3.50]
plt.rcParams["figure.autolayout"] = True
# 创建一个稀疏非相关的设计回归问题
X, y = make_sparse_uncorrelated(n_samples=500, n_features=4)
# 绘制数据集
style.use("Solarize_Light2")
plt.figure(figsize=(7.50, 3.50))
plt.title("具有稀疏非相关设计的随机回归问题", fontsize="12")
plt.scatter(X[:,0],y,edgecolor="k");
plt.show()
输出
它将产生以下输出 −