PyTorch 数据集
在这一章中,我们将更多地关注 torchvision.datasets 及其各种类型。PyTorch包括以下数据集加载器:
- MNIST
- COCO(字幕和检测)
数据集包括以下两种主要类型的函数:
- Transform - 一个接受图像并返回修改后的标准内容版本的函数。这些可以与转换一起组合使用。
-
Target_transform - 一个接受目标并进行转换的函数。例如,接收字幕字符串并返回单词索引的张量。
MNIST
以下是MNIST数据集的示例代码:
dset.MNIST(root, train = TRUE, transform = NONE,
target_transform = None, download = FALSE)
参数解释如下:
- root − 数据集的根目录,其中存在处理后的数据。
-
train − True = 训练集,False = 测试集。
-
download − True = 从互联网下载数据集并放置在根目录下。
COCO
需要安装COCO API。以下示例用于展示使用PyTorch进行COCO数据集实现:
import torchvision.dataset as dset
import torchvision.transforms as transforms
cap = dset.CocoCaptions(root = ‘ dir where images are’,
annFile = ’json annotation file’,
transform = transforms.ToTensor())
print(‘Number of samples: ‘, len(cap))
print(target)
实现的输出如下 –
Number of samples: 82783
Image Size: (3L, 427L, 640L)
PyTorch 教程目录
- PyTorch 简介
- PyTorch 安装
- PyTorch 神经网络的数学基本构建模块
- PyTorch 神经网络基础
- PyTorch 机器学习的通用工作流程
- PyTorch 机器学习 vs. 深度学习
- PyTorch 实现第一个神经网络
- PyTorch 神经网络到功能块
- PyTorch 术语
- PyTorch 加载数据
- PyTorch 线性回归
- PyTorch 卷积神经网络
- PyTorch 循环神经网络
- PyTorch 数据集
- PyTorch 卷积神经网络介绍
- PyTorch 从头训练一个卷积神经网络
- PyTorch 卷积神经网络中的特征提取
- PyTorch 卷积神经网络的可视化
- PyTorch 序列处理与卷积
- PyTorch 词嵌入
- PyTorch 递归神经网络