如何使用Python Scikit-learn创建随机森林分类器?
随机森林 是一种监督式机器学习算法,通过在数据样本上创建决策树来用于分类、回归和其他任务。创建决策树后,随机森林分类器通过投票收集每个决策树的预测并选择最佳解决方案。
随机森林分类器最大的优点之一是通过平均结果来减少过拟合。这就是相比单个决策树获得更好结果的原因。
创建随机森林分类器的步骤
我们可以按照以下步骤使用Python Scikit-learn创建随机森林分类器 −
步骤1 −导入所需的库。
步骤 2 −加载数据集。
步骤 3 −将数据集分为训练和测试数据集。
步骤 4 −从sklearn.ensemble模块中导入随机森林分类器。
步骤 5 −创建数据集的数据框。
步骤 6 −创建随机森林分类器并使用fit()函数训练模型。
步骤 7 −从测试数据集进行预测。
步骤 8 −导入度量标准以找到分类器的准确性。
步骤 9 −打印随机森林分类器的准确性。
示例
在下面的示例中,我们将使用鸢尾花植物数据集来构建随机森林分类器:
输出
它将产生以下输出 −
让我们使用分类器预测花的类型−
输出
它将产生以下输出 −
数组array([1])代表了versicolor类型。
输出结果
它会输出以下结果 −
这里的 array([2]) 表示 鸢尾花中的 维吉尼亚种类。