用PyTorch進行神經網絡訓練時,如果訓練用的數據是圖像數據,則需要在訓練之前對圖像進行預處理。以MNIST數據為例:
train_data = torchvision.datasets.MNIST(
root='./mnist/',
train=True,
transform=torchvision.transforms.ToTensor(), # Converts a PIL.Image or numpy.ndarray to
# torch.FloatTensor of shape (C x H x W) and normalize in the range [0.0, 1.0]
download=True,
)
transform=torchvision.transforms.ToTensor()起到的作用是把PIL.Image或者numpy.narray數據類型轉變為torch.FloatTensor類型,shape是C*H*W,數值范圍縮小為[0.0, 1.0]。
如果想把數值范圍調整為[-1.0, 1.0],則可加torchvision.transforms.Normalize([mean_channel1,mean_channel2,mean_channel3], [std_channel1,std_channel2,std_channel3]),如果是黑白圖像,比如MNIST里的圖像,只有一個通道,則mean只需要一個,std也只需要一個。
im_tfs = torchvision.trasnsforms.Compose([
torchvision.trasnsforms.ToTensor(),
torchvision.trasnsforms.Normalize([0.5], [0.5])
])
train_data = torchvision.datasets.MNIST(
root='./mnist/',
train=True,
transform=torchvision.transforms.ToTensor(),
download=True,
)
