PyTorch – 加载数据
PyTorch包含一个名为torchvision的软件包,用于加载和准备数据集。它包括两个基本函数,即Dataset和DataLoader,它们有助于数据集的转换和加载。
数据集
数据集用于从给定的数据集中读取和转换一个数据点。实现的基本语法如下所示
trainset = torchvision.datasets.CIFAR10(root = './data', train = True,
download = True, transform = transform)
DataLoader是用来洗牌和批处理数据的。它可以用来与多处理工作者并行地加载数据。
trainloader = torch.utils.data.DataLoader(trainset, batch_size = 4,
shuffle = True, num_workers = 2)
例子:加载CSV文件
我们使用Python软件包Panda来加载csv文件。原始文件的格式如下:(图像名称,68个地标–每个地标有一个x、y坐标)。
landmarks_frame = pd.read_csv('faces/face_landmarks.csv')
n = 65
img_name = landmarks_frame.iloc[n, 0]
landmarks = landmarks_frame.iloc[n, 1:].as_matrix()
landmarks = landmarks.astype('float').reshape(-1, 2)