Pytorch 重寫Dataloader

本文轉載自查看原文 2020-04-17 18:42 1876 Pytorch

這是一個官網的例子：torch.nn入門。

一般而言，我們會根據自己的數據需求繼承Dataset（from torch.utils.data import Dataset, DataLoader）重寫數據讀取函數。或者利用TensorDataset更加簡潔實現讀取數據。

抑或利用 torchvision里面的ImageFolder也可管理數據。這幾種方法已經可以實現數據讀取了，而DataLoader的作用是更加全面管理批量數據：

下面進入正題，MNIST數據利用CNN時需要轉換為二維數據，所以需要對初始的線性數據進行轉換。一般，可以讀取先行數據后在模型中進行view來實現：

class Lambda(nn.Module):
    def __init__(self, func):
        super().__init__()
        self.func = func

    def forward(self, x):
        return self.func(x)


def preprocess(x):
    return x.view(-1, 1, 28, 28)

model = nn.Sequential(
    Lambda(preprocess),
    nn.Conv2d(1, 16, kernel_size=3, stride=2, padding=1),
    nn.ReLU(),
    nn.Conv2d(16, 16, kernel_size=3, stride=2, padding=1),
    nn.ReLU(),
    nn.Conv2d(16, 10, kernel_size=3, stride=2, padding=1),
    nn.ReLU(),
    nn.AvgPool2d(4),
    Lambda(lambda x: x.view(x.size(0), -1)),
)

文中給出另一種解決方案：重寫DateLoader：將數據處理移到生成器里面

def get_data(train_ds, valid_ds, bs):
    return (
        DataLoader(train_ds, batch_size=bs, shuffle=True),
        DataLoader(valid_ds, batch_size=bs * 2),
    )

def preprocess(x, y):
    return x.view(-1, 1, 28, 28), y


class WrappedDataLoader:
    def __init__(self, dl, func):
        self.dl = dl
        self.func = func

    def __len__(self):
        return len(self.dl)

    def __iter__(self):
        batches = iter(self.dl)
        for b in batches:
            yield (self.func(*b))

train_dl, valid_dl = get_data(train_ds, valid_ds, bs)
train_dl = WrappedDataLoader(train_dl, preprocess)
valid_dl = WrappedDataLoader(valid_dl, preprocess)

模型就可以寫成這樣：

model = nn.Sequential(
    nn.Conv2d(1, 16, kernel_size=3, stride=2, padding=1),
    nn.ReLU(),
    nn.Conv2d(16, 16, kernel_size=3, stride=2, padding=1),
    nn.ReLU(),
    nn.Conv2d(16, 10, kernel_size=3, stride=2, padding=1),
    nn.ReLU(),
    nn.AdaptiveAvgPool2d(1),
    Lambda(lambda x: x.view(x.size(0), -1)),
)

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 PyTorch筆記之 Dataset 和 Dataloader PyTorch DataLoader()使用 pytorch遍歷兩個dataloader pytorch dataloader num_workers Pytorch Dataset和Dataloader 學習筆記(二) Pytorch：Dataloader和Dataset以及搭建數據部分的步驟 Pytorch中dataloader之enumerate與iter，tqdm Pytorch入門上 —— Dataset、Tensorboard、Transforms、Dataloader [源碼解析] PyTorch 分布式(2) --- 數據加載之DataLoader PyTorch源碼解讀之torch.utils.data.DataLoader(轉)