使用Python如何使用Estimators使用Tensorflow检查泰坦尼克数据集？

可以使用Tensorflow和估计器迭代特征，将特征转换成列表，并在控制台上显示的方式来检查泰坦尼克数据集。

更多Python相关文章，请阅读：Python 教程

我们将使用Keras Sequential API，这对于构建顺序模型非常有帮助，该模型用于处理纯堆栈层，每个层都有一个输入张量和一个输出张量。

至少包含一层的神经网络称为卷积层。我们可以使用卷积神经网络构建学习模型。

我们将使用Google Colaboratory运行下面的代码。 Google Colab或Colaboratory可以通过浏览器运行Python代码，无需任何配置，并免费使用GPU（图形处理单元）。 Colaboratory基于Jupyter Notebook构建。

Estimator是TensorFlow完整模型的高级表示形式。它旨在便于扩展和异步训练。

我们将使用tf.estimator API训练逻辑回归模型。该模型用作其他算法的基线。我们使用泰坦尼克数据集，目标是根据性别，年龄，班级等特征预测乘客的生存状况。

估计器使用功能列描述模型如何解释原始输入特征。 Estimator期望数值输入向量，特征列将帮助描述模型应如何将数据集中的每个特征转换。选择和使用正确的功能列集对于学习有效的模型至关重要。

例子

print("正在检查数据集")
ds = make_input_fn(dftrain, y_train, batch_size=10)()
for feature_batch, label_batch in ds.take(1):
print('一些特征键为：'，列表（feature_batch.keys（）））
print()
print('一批类：'，feature_batch['class'].numpy()）
print()
print('一批标签：'，label_batch.numpy（））

代码信用− https：//www.tensorflow.org/tutorials/estimator/linear

产量

正在检查数据集
一些特征键：['sex'，'age'，'n_siblings_spouses'，'parch'，'fare'，'class'，'deck'，'embark_town'，'alone']
一批类别：[b'First' b'First' b'First' b'Third' b'Third' b'Third' b'First' b'Third'
b'Second' b'Third']
一批标签：[0,1,1,0,0,0,1,0,0,0]