如何使用Python Scikit-learn创建样例数据集?

如何使用Python Scikit-learn创建样例数据集?

在本教程中,我们将学习如何使用Python Scikit-learn创建样例数据集。

虽然Scikit-learn有各种内置的数据集,我们可以轻松地用于我们的机器学习模型,但有时我们需要一些玩具数据集。为此,Scikit-learn Python库为我们提供了一个非常棒的样例数据集生成器。

使用Scikit-Learn创建样例Blob数据集

要创建示例blob数据集,我们需要导入 _sklearn.datsets.makeblobs 它非常快速和易于使用。

示例

在下面的示例中,让我们看一下如何使用该库创建样例blob数据集。

# 导入库
from sklearn.datasets import make_blobs

# Matplotlib用于绘制数据集blob
from matplotlib import pyplot as plt
from matplotlib import style

# 设置图形大小
plt.rcParams["figure.figsize"] = [7.50, 3.50]
plt.rcParams["figure.autolayout"] = True

# 使用sklearn.datasets.make_blobs创建Blob测试数据集

style.use("Solarize_Light2")

X, y = make_blobs(n_samples = 500, centers = 3,
      cluster_std = 1, n_features = 2)

plt.scatter(X[:, 0], X[:, 1], s = 20, color = 'red')
plt.xlabel("X-轴")
plt.ylabel("Y-轴")
plt.show()

输出

它将产生以下输出−

如何使用Python Scikit-learn创建样例数据集?

上述输出显示,它从500个样本中创建了3个blob。

使用Scikit-Learn创建样例Moon数据集

要创建样例moon数据集,我们需要导入 _sklearn.datsets.makemoons 它非常快速和易于使用。

示例

在下面的示例中,让我们看一下如何使用该库创建样例moon数据集。

# 导入工具库
from sklearn.datasets import make_moons

# Matplotlib 用于绘制书的图形
from matplotlib import pyplot as plt
from matplotlib import style

# 设置图形的大小
plt.rcParams["figure.figsize"] = [7.16, 3.50]
plt.rcParams["figure.autolayout"] = True

# 使用sklearn.datasets.make_moon创建圆月测试数据集
style.use("fivethirtyeight")
X, y = make_moons(n_samples = 1500, noise = 0.1)
plt.scatter(X[:, 0], X[:, 1], s = 15, color ='red')
plt.xlabel("X轴")
plt.ylabel("Y轴")
plt.show()

输出结果

将会输出以下的结果

如何使用Python Scikit-learn创建样例数据集?

使用Scikit-Learn创建样本圆形数据集

要创建样本圆形数据集,我们需要导入sklearn.datsets.make_circles,这非常快速、简单。

例子

在下面的例子中,让我们看看如何使用这个库来创建样本圆形数据集。

# 导入工具库
from sklearn.datasets import make_circles

# Matplotlib 用于绘制圆形图形
from matplotlib import pyplot as plt
from matplotlib import style

# 设置图形的大小
plt.rcParams["figure.figsize"] = [7.16, 3.50]
plt.rcParams["figure.autolayout"] = True

# 创建圆形测试数据集,使用sklearn.datasets.make_circles
style.use("ggplot")
X, y = make_circles(n_samples = 500, noise = 0.02)
plt.scatter(X[:, 0], X[:, 1], s = 20, color ='red')
plt.xlabel("X轴")
plt.ylabel("Y轴")
plt.show()

输出结果

将会输出以下的结果

如何使用Python Scikit-learn创建样例数据集?

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程