LeNet-5網絡搭建詳解

本文轉載自查看原文 2021-06-20 20:06 179 LeNet-5/ Yann LeCun/ Python深度學習

LeNet-5是由Yann LeCun設計的用於手寫數字識別和機器打印字符的卷積神經網絡。她在1998年發表的論文《基於梯度學習的文本識別》中提出了該模型，並給出了對該模型網絡架構的介紹。如下圖所示，LeNet-5共有7層（不包括輸入層），包含卷積層、下采樣層、全連接層，而其輸入圖像為32*32.論文鏈接：Gradient-based learning applied to document recognition | IEEE Journals & Magazine | IEEE Xplore

圖1. LeNet-5網絡架構

1.C1:卷積層

c1層采用卷積層對輸入的圖像進行特征提取，利用6個5*5的卷積核生成6個特征圖（feature map)。其步長為1且不使用擴充值。因此卷積后的特征層為28*28.一個卷積核擁有的可訓練參數為5*5+1=26,其中1為偏置參數。整個C1層可訓練參數為（5*5+1）*6=156.

2.S2:下采樣層

下采樣（subsampling)層主要對特征進行降維處理，效果與池化相同。S2層使用2*2的濾波器池化C1的特征圖，因此將生成6個尺寸為14*14的特征圖。在計算時，將濾波器中的4個值相加，然后乘以可訓練權值參數w,加上偏置參數b,最后通過sigmoid函數形成新的值。S2層的每個特征圖中都有兩個參數，一個是權值參數，一個是偏置參數，因此該層共有2*6=12個參數。

3.C3:卷積層

C3層有16個大小為5*5的卷積核，步長為1且不填充邊界。C3層將S2層6個14*14的特征圖卷積成16個10*10的特征圖。值得注意的是，S2層與C3層的卷積核並不是全連接的，而是部分連接的。

圖2：S2層特征圖與C3層卷積核連接的組合

4.S4:下采樣層

S4的濾波器與S2層的濾波器相似，也是2*2的，所以，S4層的特征圖池化后，將生成16個5*5的特征圖。S4層參數的個數為2*16=32.

5.C5:卷積層

C5層有120個5*5的卷積核，將產生120個1*1的特征圖，與S4層是全連接的。C5層參數的個數不能參照C1層來計算，而是要參照C3層來計算，且此時是沒有組合的，因此，應該是（5*5*16+1）*120=48120.

6.F6:全連接層

F6有84個單元，單元的個數與輸出層的設計有關。該層作為典型的神經網絡層，每一個單元都計算輸入向量與權值參數的點積並加上偏置參數，然后傳給sigmoid函數，產生該單元的一個狀態並傳遞給輸出層。在這里，將輸出作為輸出層的徑向基函數的初始參數，用於識別完整的ASCII字符集。C5有120個單元；F6層有84個單元，每個單元都將容納120個單元的計算結果。因此，F6層參數的個數為（120+1）*84=10164.

7.output:輸出層

output層是全連接層，共有10個單元，代表數字0~9。利用徑向基函數，將F6層84個單元的輸出作為節點的輸入x_j,計算歐氏距離。距離越近，結果就越小，意味着識別的樣本越符合該節點所代表的字符。由於該層是全連接層，參數個數為84*10=840。

網絡搭建：

import torch.nn as nn
import torch.nn.functional as F

class Net(nn.Module):
    
    def __init__(self):
        super(Net, self).__init__()
        #input image channel is one, output channels is six,5*5 square convolution
        self.conv1=nn.Conv2d(1, 6, 5)
        self.conv2=nn.Conv2d(6, 16, 5)
        self.fc1=nn.Linear(16*5*5, 120)
        self.fc2=nn.Linear(120, 84)
        self.fc3=nn.Linear(84, 10)
    
    def forward(self, x):
        #max pooling over a (2,2) window
        #c1
        x = F.max_pool2d(F.relu(self.conv1(x)), (2, 2))
        #if the kernel size is a square you can only specify a single number
        x = F.max_pool2d(F.relu(self.conv2(x)), 2)
        x = x.view(-1, self.num_flat_features(x))
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x
    
    def num_flat_features(self, x):
        #all dimensions except the batch dimension
        size = x.size()[1:]
        num_features = 1
        for s in size:
            num_features *= s
        return num_features

net = Net()
print(net)

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Pytorch 搭建 LeNet-5 網絡 LeNet-5 centos7網絡配置詳解 docker0網絡詳解經典卷積神經網絡算法(1)：LeNet-5 Hyperledger Fabric 1.4.6網絡搭建實例（raft）搭建一個簡易的IPv6網絡測試環境 Python3網絡學習案例二：traceroute詳解 Python3網絡學習案例一：Ping詳解 Resnet-50網絡結構詳解