如何使用 Python 中的 Tensorflow 找到数据集中预处理层的状态?
Tensorflow 是由 Google 提供的机器学习框架。它是一个开源框架,可与 Python 一起使用来实现算法、深度学习应用程序等等。它被用于研究和生产用途。它具有优化技术,能够快速执行复杂的数学运算。
这是因为它使用了 NumPy 和多维数组。这些多维数组也被称为“张量”。该框架支持使用深度神经网络。它具有高度的可扩展性,并带有许多流行的数据集。它使用 GPU 计算,并自动管理资源。它带有大量的机器学习库,并受到良好的支持和文档化。该框架具有运行深度神经网络模型、训练它们并创建预测各自数据集相关特征的应用程序的能力。
可以使用以下代码在 Windows 上安装“tensorflow”软件包:
pip install tensorflow
Tensor 是 Tensorflow 中使用的一种数据结构。它有助于连接流程图中的边缘。这个流程图被称为“数据流程图”。张量本质上是多维数组或列表。
我们使用 Google Colaboratory 运行下面的代码。Google Colab 或 Colaboratory 可以在浏览器上运行 Python 代码,并且不需要配置,同时免费访问 GPU(图形处理单元)。Colaboratory 是基于 Jupyter Notebook 构建的。以下是代码片段:
更多Python相关文章,请阅读:Python 教程
示例
print("准备一个仅包含文本的数据集,不包含标签")
train_text = raw_train_ds.map(lambda text, labels: text)
print("调用 adapt 方法")
binary_vectorize_layer.adapt(train_text)
int_vectorize_layer.adapt(train_text)
print("在控制台上显示结果")
def binary_vectorize_text(text, label):
text = tf.expand_dims(text, -1)
return binary_vectorize_layer(text), label
代码来源 – https://www.tensorflow.org/tutorials/load_data/text
输出
准备一个仅包含文本的数据集,不包含标签
调用 adapt 方法
在控制台上显示结果
说明
-
准备没有使用标签的数据集。
-
对此数据集调用一个名为“adapt”的方法。
-
这将使用模型的“二进制”格式来对数据集进行向量化。