如何使用Python Scikit-learn创建样例数据集?
在本教程中,我们将学习如何使用Python Scikit-learn创建样例数据集。
虽然Scikit-learn有各种内置的数据集,我们可以轻松地用于我们的机器学习模型,但有时我们需要一些玩具数据集。为此,Scikit-learn Python库为我们提供了一个非常棒的样例数据集生成器。
使用Scikit-Learn创建样例Blob数据集
要创建示例blob数据集,我们需要导入 _sklearn.datsets.makeblobs 它非常快速和易于使用。
示例
在下面的示例中,让我们看一下如何使用该库创建样例blob数据集。
# 导入库
from sklearn.datasets import make_blobs
# Matplotlib用于绘制数据集blob
from matplotlib import pyplot as plt
from matplotlib import style
# 设置图形大小
plt.rcParams["figure.figsize"] = [7.50, 3.50]
plt.rcParams["figure.autolayout"] = True
# 使用sklearn.datasets.make_blobs创建Blob测试数据集
style.use("Solarize_Light2")
X, y = make_blobs(n_samples = 500, centers = 3,
cluster_std = 1, n_features = 2)
plt.scatter(X[:, 0], X[:, 1], s = 20, color = 'red')
plt.xlabel("X-轴")
plt.ylabel("Y-轴")
plt.show()
输出
它将产生以下输出−
上述输出显示,它从500个样本中创建了3个blob。
使用Scikit-Learn创建样例Moon数据集
要创建样例moon数据集,我们需要导入 _sklearn.datsets.makemoons 它非常快速和易于使用。
示例
在下面的示例中,让我们看一下如何使用该库创建样例moon数据集。
# 导入工具库
from sklearn.datasets import make_moons
# Matplotlib 用于绘制书的图形
from matplotlib import pyplot as plt
from matplotlib import style
# 设置图形的大小
plt.rcParams["figure.figsize"] = [7.16, 3.50]
plt.rcParams["figure.autolayout"] = True
# 使用sklearn.datasets.make_moon创建圆月测试数据集
style.use("fivethirtyeight")
X, y = make_moons(n_samples = 1500, noise = 0.1)
plt.scatter(X[:, 0], X[:, 1], s = 15, color ='red')
plt.xlabel("X轴")
plt.ylabel("Y轴")
plt.show()
输出结果
将会输出以下的结果
使用Scikit-Learn创建样本圆形数据集
要创建样本圆形数据集,我们需要导入sklearn.datsets.make_circles,这非常快速、简单。
例子
在下面的例子中,让我们看看如何使用这个库来创建样本圆形数据集。
# 导入工具库
from sklearn.datasets import make_circles
# Matplotlib 用于绘制圆形图形
from matplotlib import pyplot as plt
from matplotlib import style
# 设置图形的大小
plt.rcParams["figure.figsize"] = [7.16, 3.50]
plt.rcParams["figure.autolayout"] = True
# 创建圆形测试数据集,使用sklearn.datasets.make_circles
style.use("ggplot")
X, y = make_circles(n_samples = 500, noise = 0.02)
plt.scatter(X[:, 0], X[:, 1], s = 20, color ='red')
plt.xlabel("X轴")
plt.ylabel("Y轴")
plt.show()
输出结果
将会输出以下的结果