[深度學習] pytorch學習筆記（4）(Module類、實現Flatten類、Module類作用、數據增強)

本文轉載自查看原文 2019-08-03 15:10 3764 [深度學習]/ pytorch

一、繼承nn.Module類並自定義層

我們要利用pytorch提供的很多便利的方法，則需要將很多自定義操作封裝成nn.Module類。

首先，簡單實現一個Mylinear類：

from torch import nn

# Mylinear繼承Module
class Mylinear(nn.Module):
    # 傳入輸入維度和輸出維度
    def __init__(self,in_d,out_d):
        # 調用父類構造函數
        super(Mylinear,self).__init__()
        # 使用Parameter類將w和b封裝，這樣可以通過nn.Module直接管理，並提供給優化器優化
        self.w = nn.Parameter(torch.randn(out_d,in_d))
        self.b = nn.Parameter(torch.randn(out_d))

    # 實現forward函數，該函數為默認執行的函數，即計算過程，並將輸出返回
    def forward(self, x):
        x = x@self.w.t() + self.b
        return x

這樣就可以將我們自定義的Mylinear加入整個網絡：

# 網絡結構
class MLP(nn.Module):
    def __init__(self):
        super(MLP, self).__init__()

        self.model = nn.Sequential(
            #nn.Linear(784, 200),
            Mylinear(784,200),
            nn.BatchNorm1d(200, eps=1e-8),
            nn.LeakyReLU(inplace=True),
            #nn.Linear(200, 200),
            Mylinear(200, 200),  
            nn.BatchNorm1d(200, eps=1e-8),
            nn.LeakyReLU(inplace=True),
            #nn.Linear(200, 10),
            Mylinear(200,10),
            nn.LeakyReLU(inplace=True)
        )

我們可以看出，MLP網絡實際上也是繼承自Module，這就說明了，nn.Module實際上可以實現一個嵌套的結構，我們的整個網絡就是由一個嵌套的樹形結構組成的。例如：

# Mylinear繼承Module
class Mylinear(nn.Module):
    # 傳入輸入維度和輸出維度
    def __init__(self, in_d, out_d):
        # 調用父類構造函數
        super(Mylinear, self).__init__()
        # 使用Parameter類將w和b封裝，這樣可以通過nn.Module直接管理，並提供給優化器優化
        self.w = nn.Parameter(torch.randn(out_d, in_d))
        self.b = nn.Parameter(torch.randn(out_d))

    # 實現forward函數，該函數為默認執行的函數，即計算過程，並將輸出返回
    def forward(self, x):
        x = x @ self.w.t() + self.b
        return x


# 將幾個nn.Module組件綜合成一個
class Mylayer(nn.Module):
    def __init__(self, in_d, out_d):
        super(Mylayer, self).__init__()
        # 包含一個全連接層，一個BN層，一個Leaky Relu層
        self.lin = Mylinear(in_d, out_d)
        self.bn = nn.BatchNorm1d(out_d, eps=1e-8)
        self.lrelu = nn.LeakyReLU(inplace=True)

    # 按順序跑一遍3種網絡，返回最終結果
    def forward(self, x):
        x = self.lin(x)
        x = self.bn(x)
        x = self.lrelu(x)
        return x


# 網絡結構
class MLP(nn.Module):
    def __init__(self):
        super(MLP, self).__init__()

        self.model = nn.Sequential(
            Mylayer(784, 200),
            Mylayer(200, 200),
            # nn.Linear(200, 10),
            Mylinear(200, 10),
            nn.LeakyReLU(inplace=True)
        )

上述代表表示的結構如下圖所示：

其中所有的類都繼承自nn.Module，從前往后是嵌套的關系。在上述代碼中，真正做計算的是橙色部分1-8，而其他的都只是作為封裝。其中nn.Sequential、nn.BatchNorm1d、nn.LeakyReLU是pytorch提供的類，Mylinear和Mylayer是我們自己封裝的類。

二、實現一個常用類Flatten類

Flatten就是將2D的特征圖壓扁為1D的特征向量，用於全連接層的輸入。

# Flatten繼承Module
class Flatten(nn.Module):
    # 構造函數，沒有什么要做的
    def __init__(self):
        # 調用父類構造函數
        super(Flatten, self).__init__()

    # 實現forward函數
    def forward(self, input):
        # 保存batch維度，后面的維度全部壓平，例如輸入是28*28的特征圖，壓平后為784的向量
        return input.view(input.size(0), -1)

三、nn.Module類的作用

1.便於保存模型：

# 每隔N epoch保存一次模型
torch.save(net.state_dict(),'ckpt_n_epoch.mdl')
# 下次訓練時可以直接導入接着訓練
net.load_state_dict(torch.load('ckpt_n_epoch.mdl'))

2.方便切換train和val模式

### 不同模式對於某些層的操作時不同的，例如BN，dropout層等
# 切換到train模式
net.train()
# 切換到validation模式
net.eval()

3.方便將網絡轉移到GPU上

# 定義GPU設備
device = torch.device('cuda')
# 將網絡轉移到GPU，注意to函數返回的是net的引用（引用是不變的）
# 不同的是net中的參數都轉移到GPU上去了
net.to(device)
    
# 不同於參數直接轉移，轉移后的w2(在GPU上)和轉移前的w(在CPU上)兩者完全是不一樣的
# 我們要使之在GPU上運行，則必須使用w2
#w2 = w.to(device)

4.方便查看各層參數

# 獲取由每一層參數組成的列表
para_list = list(net.parameters())
# 獲取一個(name,每層參數)的tuple組成的列表
para_named_list = list(net.named_parameters())
# 獲取一個{'model.0.weight': 參數,'model.0.bias': 參數, 'model.1.weight': 參數}
para_named_dict = dict(net.named_parameters())

四、數據增強

torchvision提供了很方便的數據預處理工具，數據增強可以一次性搞定。

from torchvision import datasets, transforms

train_data_trans = datasets.MNIST('../data', train=True, download=True,
                            transform=transforms.Compose([
                                # 水平翻轉，50%執行
                                transforms.RandomHorizontalFlip(),
                                # 垂直翻轉，50%執行
                                transforms.RandomVerticalFlip(),
                                # 隨機旋轉范圍在正負15°之間，也可以寫(-15,15)
                                transforms.RandomRotation(15),
                                # 旋轉范圍在90-270之間
                                #transforms.RandomRotation([90,270]),
                                # 將圖片方縮放到指定大小
                                transforms.Resize([32,32]),
                                # 隨機剪裁圖片到指定大小
                                transforms.RandomCrop([28,28]),

                                transforms.ToTensor(),
                                transforms.Normalize((0.1307,), (0.3081,))
                            ]))

如果pytorch沒有提供需要的預處理類，我們可以參照源碼仿造寫一個自定義處理的類來進行處理。例如對圖片添加白噪聲，按通道變換顏色等等。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 pytorch學習筆記（十二）：詳解 Module 類 Pytorch學習筆記07----nn.Module類與前向傳播函數forward的理解深度學習Keras框架筆記之TimeDistributedDense類【深度學習】PyTorch Dataset類的使用與實例分析 Pytorch 學習筆記之自定義 Module pytorch nn.Module類—使用Module類來自定義模型 AngularJS Module類的方法 TypeScript學習筆記（三）：類學習筆記——pytorch中數據增強【501】pytorch教程之nn.Module類詳解