如何使用Tensorflow预处理花卉训练数据集?

如何使用Tensorflow预处理花卉训练数据集?

可以使用keras预处理API对花卉数据集进行预处理。它有一个名为“image_dataset_from_directory”的方法,该方法使用验证集、存储数据的目录和其他参数来处理数据集。

更多Python相关文章,请阅读:Python 教程

我们将使用Keras Sequential API来构建顺序模型,它用于处理具有恰好一个输入张量和一个输出张量的纯层堆栈。使用keras.Sequential模型创建图像分类器,并使用preprocessing.image_dataset_from_directory加载数据。

数据可以高效地从磁盘上加载。使用数据增强和dropout等技术来识别过拟合并减少它。该数据集包含3700张花卉图片,它包含5个子目录,每个类别有一个子目录。它们分别是:雏菊,蒲公英,玫瑰,向日葵和郁金香。

我们使用Google Colaboratory来运行以下代码。Google Colab或Colaboratory可通过浏览器运行Python代码,不需要进行任何配置,并可以免费访问GPU(图形处理器)。Colaboratory是在Jupyter Notebook的基础上构建的。

print("使用keras.preprocessing预处理数据集")
val_ds = tf.keras.preprocessing.image_dataset_from_directory(
  data_dir,
  validation_split=0.2,
  subset="validation",
  seed=123,
  image_size=(img_height, img_width),
  batch_size=batch_size)
class_names = train_ds.class_names
print("类别名称是:")
print(class_names)

代码来源: https://www.tensorflow.org/tutorials/images/classification

输出

使用keras.preprocessing预处理数据集
共找到3670个文件,属于5个类别。
使用了734个文件进行验证。
类别名称是:
['daisy', 'dandelion', 'roses', 'sunflowers', 'tulips']

解释

  • 使用keras.preprocessing方法处理数据集。
  • 接下来是在控制台显示类别名称。

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程