如何使用TensorFlow在Python中预处理时尚MNIST数据?
TensorFlow是由Google提供的机器学习框架。它是一个开源框架,结合Python用于实现算法、深度学习应用等等。它被用于研究和生产目的。
可以使用以下代码行在Windows上安装’tensorflow’包:
pip install tensorflow
Tensor是TensorFlow中使用的数据结构。它有助于在流程图中连接边缘。这个流程图被称为“数据流图”。张量只是多维数组或列表。
“时尚MNIST”数据集包含不同种类的服装图像。它包含属于10个不同类别的70多万件服装的灰度图像。这些图像的分辨率很低(28 x 28像素)。我们使用Google Colaboratory来运行以下代码。Google
Colab或Colaboratory可以在浏览器上运行Python代码,需要零配置并免费访问GPU(图形处理单元)。Colaboratory是在Jupyter Notebook之上构建的。
以下是代码段−
更多Python相关文章,请阅读:Python 教程
例子
plt.figure()
plt.imshow(train_images[0])
plt.colorbar()
plt.grid(False)
plt.show()
train_images = train_images / 255.0
test_images = test_images / 255.0
plt.figure(figsize=(12,12))
for i in range(15):
plt.subplot(5,5,i+1)
plt.xticks([])
plt.yticks([])
plt.grid(False)
plt.imshow(train_images[i], cmap=plt.cm.binary)
plt.xlabel(class_names[train_labels[i]])
plt.show()
代码来源 − https://www.tensorflow.org/tutorials/keras/classification
输出


解释
-
在训练网络之前,需要处理输入数据集。
-
一旦在控制台上检查并显示图像,便可以确定像素值在0到255之间。
-
这些像素值首先被缩放为在0到1之间。
-
为了实现这一点,每个像素值都被255除以。
-
培训数据集和测试数据集必须以相同的方式进行预处理。
-
这确保在培训和评估期间提供了类似类型的数据。
-
为了确保数据格式正确,将前几个图像和每个图像所属的类名称一起显示在控制台上。
极客教程