Python 如何使用Python和TensorFlow下载和探索时尚MNIST数据集?

Python 如何使用Python和TensorFlow下载和探索时尚MNIST数据集?

Tensorflow是谷歌提供的机器学习框架。它是一个开源框架,与Python一起使用,实现算法、深度学习应用等。它被用于研究和生产目的。

可以使用以下代码在Windows上安装’tensorflow’包 –

pip install tensorflow

“Fashion MNIST”数据集包含不同类型衣服的图像。它包含属于10个不同类别的70多万件服装的灰度图像。这些图像的分辨率很低(28×28个像素)。

我们使用Google Colaboratory来运行以下代码。Google Colab或Colaboratory可在浏览器上运行Python代码,需要零配置且可以免费访问GPU(图形处理单元)。 Colaboratory 建立在Jupyter Notebook之上。

以下是代码:

阅读更多:Python 教程

举个例子

import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt

print("所使用的tensorflow版本是")
print(tf.__version__)
print("正在加载数据集")
fashion_mnist = tf.keras.datasets.fashion_mnist
print("将数据集分类为训练集和测试集")
(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()
class_names = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat', 'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']

print("训练数据的维度")          
print(train_images.shape)

print("训练数据中的行数")
print(len(train_labels))

print("数据集的列名")
print(train_labels)
print("测试数据的维度")          
print(test_images.shape)
print("测试数据中的行数")
print(len(test_labels))

代码来源 - https://www.tensorflow.org/tutorials/keras/classification

输出

所使用的tensorflow版本是
2.4.0
正在加载数据集
将数据集分类为训练集和测试集
Download data from <https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-labels-idx1-ubyte.gz>
32768/29515 [=================================] - 0s 0us/step
Download data from <https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-images-idx3-ubyte.gz>
26427392/26421880 [==============================] - 0s 0us/step
Download data from <https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-labels-idx1-ubyte.gz>
8192/5148 [===============================================] - 0s 0us/step
Download data from[ https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-images-idx3-ubyte.gz](https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-images-idx3-ubyte.gz)
4423680/4422102 [==============================] - 0s 0us/step
训练数据的维度
(60000, 28, 28)
训练数据中的行数
60000
数据集的列名
[9 0 0 ... 3 0 5]
测试数据的维度
(10000, 28, 28)
测试数据中的行数
10000

说明

  • 导入所需的包。

  • 确定使用的Tensorflow版本。

  • 加载时尚MNIST数据集,可以直接从TensorFlow中访问时尚MNIST数据集。

  • 接下来,将数据分为训练和测试数据集。

  • 数据集共有70000行,其中60000个图像用于训练,10000个用于评估模型学习将图像分类到不同标签的能力。

  • 这是一个分类问题,其中数据集中的每个图像都被赋予特定的标签。

  • 这些图像是关于服装的,相应的标签被分配给它们。

  • 在控制台上显示数据集的形状、训练和测试数据集中的行数以及数据集中的列名。

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程