[Pytorch]Pytorch加載預訓練模型(轉）

本文轉載自查看原文 2018-12-21 15:46 5666 pytorch

轉自：https://blog.csdn.net/Vivianyzw/article/details/81061765

東風的地方

1. 直接加載預訓練模型

在訓練的時候可能需要中斷一下，然后繼續訓練，也就是簡單的從保存的模型中加載參數權重：


   
   
   
            
             
              
               
              
              
              
                net = SNet() 
               
              
             
              
               
              
              
              
                net.load_state_dict(torch.load( 
               "model_1599.pkl"))

這種方式是針對於之前保存模型時以保存參數的格式使用的：

torch.save(net.state_dict(), "model/model_1599.pkl")

pytorch官網更推薦上述模型保存方法，也據說這種方式比下一種更快一點。

下面介紹第二種模型保存和加載的方式：


   
   
   
            
             
              
               
              
              
              
                net = SNet() 
               
              
             
              
               
              
              
              
                torch.save(net, 
               "model_1599.pkl") 
               
              
             
              
               
              
              
               
               
              
             
              
               
              
              
              
                snet = torch.load( 
               "model_1599.pkl")

這種方式會將整個網絡保存下來，數據量會更大，會消耗更多的時間，占用內存也更高。

2. 加載一部分預訓練模型

模型可能是一些經典的模型改掉一部分，比如一般算法中提取特征的網絡常見的會直接使用vgg16的features extraction部分，也就是在訓練的時候可以直接加載已經在imagenet上訓練好的預訓練參數，這種方式實現如下：


   
   
   
            
             
              
               
              
              
              
                net = SNet() 
               
              
             
              
               
              
              
              
                model_dict = net.state_dict() 
               
              
             
              
               
              
              
               
               
              
             
              
               
              
              
              
                vgg16 = models.vgg16(pretrained= 
               True) 
               
              
             
              
               
              
              
              
                pretrained_dict = vgg16.state_dict() 
               
              
             
              
               
              
              
              
                pretrained_dict = {k: v 
               for k, v 
               in pretrained_dict.items() 
               if k 
               in model_dict} 
               
              
             
              
               
              
              
               
               
              
             
              
               
              
              
              
                model_dict.update(pretrained_dict) 
               
              
             
              
               
              
              
              
                net.load_state_dict(model_dict)

也就是在網絡中state_dict部分，屬於vgg16的，替換成vgg16預訓練模型里的參數（代碼里的k:v for k,v in pretrained_dict.items() if k in model_dict），其他保持不變。

3. 微調經典網絡

因為pytorch中的torchvision給出了很多經典常用模型，並附加了預訓練模型。利用好這些訓練好的基礎網絡可以加快不少自己的訓練速度。

首先比如加載vgg16（帶有預訓練參數的形式）：


   
   
   
            
             
              
               
              
              
               
               import torchvision.models 
               as models 
               
              
             
              
               
              
              
              
                vgg16 = models.vgg16(pretrained= 
               True)

比如，網絡第一層本來是Conv2d(3, 64, 3, 1, 1)，想修改成Conv2d(4, 64, 3, 1 ,1)，那直接賦值就可以了：


   
   
   
            
             
              
               
              
              
               
               import torch.nn 
               as nn 
               
              
             
              
               
              
              
              
                vgg16.features[ 
               0]=nn.Conv2d( 
               4, 
               64, 
               3, 
               1, 
               1)

4. 修改經典網絡

這個比上面微調修改的地方要多一些，但是想介紹一下這樣的修改方式。

先簡單介紹一下我需要需改的部分，在vgg16的基礎模型下，每一個卷積都要加一個dropout層，並將ReLU激活函數換成PReLU，最后兩層的Pooling層stride改成1。直接上代碼：


   
   
   
            
             
              
               
              
              
               
               def feature_layer(): 
               
              
             
              
               
              
              
              
                layers = [] 
               
              
             
              
               
              
              
              
                pool1 = [ 
               '4', 
               '9', 
               '16'] 
               
              
             
              
               
              
              
              
                pool2 = [ 
               '23', 
               '30'] 
               
              
             
              
               
              
              
              
                vgg16 = models.vgg16(pretrained= 
               True).features 
               
              
             
              
               
              
              
               
               for name, layer 
               in vgg16._modules.items(): 
               
              
             
              
               
              
              
               
               if isinstance(layer, nn.Conv2d): 
               
              
             
              
               
              
              
              
                layers += [layer, nn.Dropout2d( 
               0.5), nn.PReLU()] 
               
              
             
              
               
              
              
               
               elif name 
               in pool1: 
               
              
             
              
               
              
              
              
                layers += [layer] 
               
              
             
              
               
              
              
               
               elif name == pool2[ 
               0]: 
               
              
             
              
               
              
              
              
                layers += [nn.MaxPool2d( 
               2, 
               1, 
               1)] 
               
              
             
              
               
              
              
               
               elif name == pool2[ 
               1]: 
               
              
             
              
               
              
              
              
                layers += [nn.MaxPool2d( 
               2, 
               1, 
               0)] 
               
              
             
              
               
              
              
               
               else: 
               
              
             
              
               
              
              
               
               continue 
               
              
             
              
               
              
              
              
                features = nn.Sequential(*layers) 
               
              
             
              
               
              
              
               
               #feat3 = features[0:24] 
               
              
             
              
               
              
              
               
               return features

大概的思路就是，創建一個新的網絡（layers列表）, 遍歷vgg16里每一層，如果遇到卷積層（if isinstance(layer, nn.Conv2d）就先把該層（Conv2d）保持原樣加進去，隨后增加一個dropout層，再加一個PReLU層。然后如果遇到最后兩層pool，就修改響應參數加進去，其他的pool正常加載。最后將這個layers列表轉成網絡的nn.Sequential的形式，最后返回features。然后再你的新的網絡層就可以用以下方式來加載：


   
   
   
            
             
              
               
              
              
               
               class SNet(nn.Module): 
               
              
             
              
               
              
              
               
               def __init__(self): 
               
              
             
              
               
              
              
              
                super(SNet, self).__init__() 
               
              
             
              
               
              
              
              
                self.features = feature_layer() 
               
              
             
              
               
              
              
               
               def forward(self, x): 
               
              
             
              
               
              
              
              
                x = self.features(x) 
               
              
             
              
               
              
              
               
               return x

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Pytorch加載預訓練模型的坑利用Pytorch加載預訓練模型的權重 pytorch預訓練模型 PyTorch保存模型與加載模型+Finetune預訓練模型使用 pytorch中修改后的模型如何加載預訓練模型 pytorch:修改預訓練模型加載Pytorch中的預訓練模型及部分結構的導入 Pytorch加載預訓練模型前n層 PyTorch-網絡的創建，預訓練模型的加載 pytorch快速加載預訓練模型參數的方式