使用Python如何使用Estimators使用Tensorflow检查泰坦尼克数据集?
可以使用Tensorflow和估计器迭代特征,将特征转换成列表,并在控制台上显示的方式来检查泰坦尼克数据集。
更多Python相关文章,请阅读:Python 教程
我们将使用Keras Sequential API,这对于构建顺序模型非常有帮助,该模型用于处理纯堆栈层,每个层都有一个输入张量和一个输出张量。
至少包含一层的神经网络称为卷积层。我们可以 使用卷积神经网络构建学习模型。
我们将使用Google Colaboratory运行下面的代码。 Google Colab或Colaboratory可以通过浏览器运行Python代码,无需任何配置,并免费使用GPU(图形处理单元)。 Colaboratory基于Jupyter Notebook构建。
Estimator是TensorFlow完整模型的高级表示形式。它旨在便于扩展和异步训练。
我们将使用tf.estimator API训练逻辑回归模型。该模型用作其他算法的基线。我们使用泰坦尼克数据集,目标是根据性别,年龄,班级等特征预测乘客的生存状况。
估计器使用功能列描述模型如何解释原始输入特征。 Estimator期望数值输入向量,特征列将帮助描述模型应如何将数据集中的每个特征转换。选择和使用正确的功能列集对于学习有效的模型至关重要。
例子
print("正在检查数据集")
ds = make_input_fn(dftrain, y_train, batch_size=10)()
for feature_batch, label_batch in ds.take(1):
print('一些特征键为:',列表(feature_batch.keys()))
print()
print('一批类:',feature_batch['class'].numpy())
print()
print('一批标签:',label_batch.numpy())
代码信用− https://www.tensorflow.org/tutorials/estimator/linear
产量
正在检查数据集
一些特征键:['sex','age','n_siblings_spouses','parch','fare','class','deck','embark_town','alone']
一批类别:[b'First' b'First' b'First' b'Third' b'Third' b'Third' b'First' b'Third'
b'Second' b'Third']
一批标签:[0,1,1,0,0,0,1,0,0,0]
说明
- 数据集已检查。
- 在控制台上显示了特征键,标签和类。
- 通过迭代一批数据集完成了此操作。