安裝pytorch時,torchvision獨立於torch。torchvision包由流行的數據集(torchvision.datasets)、模型架構(torchvision.models)和用於計算機視覺的常見圖像轉換組成t(torchvision.transforms)。
1)數據庫
- MNIST
- Fashion-MNIST
- KMNIST
- EMNIST
- COCO
- LSUN
- ImageFolder
- DatasetFolder
- Imagenet-12
- CIFAR
- STL10
- SVHN
- PhotoTour
- SBU
- Flickr
- VOC
- Cityscapes
使用torchvision.datasets中的數據集
import torchvision mnist = torchvision.datasets.MNIST("path/to/mnist/", train=True, transform=transforms, target_transform=None, download=False)
2)模型框架
使用torchvision.models中的模型
import torchvision vgg16 = torchvision.models.vgg16(pretrained=True)
3)變換操作
- Transforms on PIL Image
- Transforms on torch.*Tensor
- Conversion Transforms
- Generic Transforms
- Functional Transforms
Transforms on PIL Image中常用的有操作:
torchvision.transforms.CenterCrop(size) torchvision.transforms.RandomCrop(size, padding=None, pad_if_needed=False, fill=0, padding_mode='constant') torchvision.transforms.RandomHorizontalFlip(p=0.5) torchvision.transforms.RandomRotation(degrees, resample=False, expand=False, center=None) torchvision.transforms.Resize(size, interpolation=2) torchvision.transforms.Scale(*args, **kwargs) #還有更多再次不列出,詳見
略
使用torchvision.transforms中的變換
transfrom = torchvision.transforms.CenterCrop(224)