如何在Python中使用Tensorflow和增强树?
Tensorflow可以与增强树一起使用来提高数据集的预测性能。数据以通常方式加载和预处理,但是当进行预测时,会使用多个模型进行预测,并将所有这些模型的输出组合在一起以得出最终结果。
更多Python相关文章,请阅读:Python 教程
我们将使用Keras Sequential API构建一个顺序模型来处理纯层堆栈,其中每个层恰好具有一个输入张量和一个输出张量。
至少包含一个层的神经网络称为卷积层。我们可以使用卷积神经网络构建学习模型。
我们使用Google Colaboratory来运行以下代码。Google Colab或Colaboratory可在浏览器上运行Python代码,不需要任何配置,并可免费访问GPU(图形处理单元)。 Colaboratory是基于Jupyter Notebook构建的。
我们将看到如何使用决策树和tf.estimator API训练梯度提升模型。增强树模型被认为是回归和分类最流行和有效的机器学习方法之一。它是一种组合技术,将10个或数百个或数千个树模型的预测组合在一起。它们可以在最少的超参数调整下实现出色的性能。
示例
import numpy as np
import pandas as pd
from IPython.display import clear_output
from matplotlib import pyplot as plt
print("加载数据集")
dftrain = pd.read_csv('https://storage.googleapis.com/tf-datasets/titanic/train.csv')
dfeval = pd.read_csv('https://storage.googleapis.com/tf-datasets/titanic/eval.csv')
print("删除'survived'列")
y_train = dftrain.pop('survived')
y_eval = dfeval.pop('survived')
import tensorflow as tf
tf.random.set_seed(123)
代码来源 – https://www.tensorflow.org/tutorials/estimator/boosted_trees
输出
加载数据集
删除'survived'列
说明
- 导入所需的包。
- 加载数据集。
- 它以csv文件的形式读取。
- 删除“survived”列。