PyTorch 数据集

PyTorch 数据集

在这一章中,我们将更多地关注 torchvision.datasets 及其各种类型。PyTorch包括以下数据集加载器:

  • MNIST
  • COCO(字幕和检测)

数据集包括以下两种主要类型的函数:

  • Transform - 一个接受图像并返回修改后的标准内容版本的函数。这些可以与转换一起组合使用。

  • Target_transform - 一个接受目标并进行转换的函数。例如,接收字幕字符串并返回单词索引的张量。

MNIST

以下是MNIST数据集的示例代码:

dset.MNIST(root, train = TRUE, transform = NONE, 
target_transform = None, download = FALSE)

参数解释如下:

  • root − 数据集的根目录,其中存在处理后的数据。

  • train − True = 训练集,False = 测试集。

  • download − True = 从互联网下载数据集并放置在根目录下。

COCO

需要安装COCO API。以下示例用于展示使用PyTorch进行COCO数据集实现:

import torchvision.dataset as dset
import torchvision.transforms as transforms
cap = dset.CocoCaptions(root = ‘ dir where images are’, 
annFile = ’json annotation file’,
transform = transforms.ToTensor())
print(‘Number of samples: ‘, len(cap))
print(target)

实现的输出如下 –

Number of samples: 82783
Image Size: (3L, 427L, 640L)

PyTorch 教程目录

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程