注意力機制


注意力機制分為:通道注意力機制, 空間注意力機制, 通道_空間注意力機制, 自注意力機制

參考:

https://blog.csdn.net/weixin_44791964/article/details/121371986

 

通道注意力機制

SENet

其重點是獲得輸入進來的特征層中每一個通道的權值。

 

其具體實現方式就是:

1、對輸入進來的特征層進行全局平均池化。

2、然后進行兩次全連接,第一次全連接神經元個數較少,第二次全連接神經元個數和輸入特征層相同。

3、在完成兩次全連接后,我們再取一次Sigmoid將值固定到0-1之間,此時我們獲得了輸入特征層每一個通道的權值(0-1之間)。

4、在獲得這個權值后,我們將這個權值乘上原輸入特征層即可。

核心思想:將全局平均池化作為通道要學習的注意力分數

 

import torch

import torch.nn as nn

import math

   

class se_block(nn.Module):

    def __init__(self, channel, ratio=16):

        super(se_block, self).__init__()

        self.avg_pool = nn.AdaptiveAvgPool2d(1)

        self.fc = nn.Sequential(

                nn.Linear(channel, channel // ratio, bias=False),

                nn.ReLU(inplace=True),

                nn.Linear(channel // ratio, channel, bias=False),

                nn.Sigmoid()

        )

   

    def forward(self, x):

        b, c, _, _ = x.size()

        = self.avg_pool(x).view(b, c)

        = self.fc(y).view(b, c, 11)

        return * y

 

ECANet

ECANet可以看作是SENet的改進版

ECANet的作者認為SENet對通道注意力機制的預測帶來了副作用,捕獲所有通道的依賴關系是低效並且是不必要的。

在ECANet的論文中,作者認為卷積具有良好的跨通道信息獲取能力。

ECA模塊的思想是非常簡單的,它去除了原來SE模塊中的全連接層,直接在全局平均池化之后的特征上通過一個1D卷積進行學習。

既然使用到了1D卷積,那么1D卷積的卷積核大小的選擇就變得非常重要了,了解過卷積原理的同學很快就可以明白,1D卷積的卷積核大小會影響注意力機制每個權重的計算要考慮的通道數量。用更專業的名詞就是跨通道交互的覆蓋率。

1D卷積就不單單只考慮一個通道的分數了, 而是考慮1D卷積核大小的通道個數。1D卷積見:一維卷積tensorflow2版本的Conv1D以及PyTorch的nn.Conv1d用法 - 知乎 (zhihu.com)

class eca_block(nn.Module):

    def __init__(self, channel, b=1, gamma=2):

        super(eca_block, self).__init__()

        kernel_size = int(abs((math.log(channel, 2+ b) / gamma))

        kernel_size = kernel_size if kernel_size % 2 else kernel_size + 1

           

        self.avg_pool = nn.AdaptiveAvgPool2d(1)

        self.conv = nn.Conv1d(11, kernel_size=kernel_size, padding=(kernel_size - 1// 2, bias=False

        self.sigmoid = nn.Sigmoid()

   

    def forward(self, x):

        = self.avg_pool(x)

        = self.conv(y.squeeze(-1).transpose(-1-2)).transpose(-1-2).unsqueeze(-1)

        = self.sigmoid(y)

        return * y.expand_as(x)

 

核心思想:將SENet中的全連接改為1D卷積

 

空間注意力機制

像素級空間注意力

 

論文名:基於注意力機制的改進雙判別器圖像修復算法

核心:通過像素注意力塊對高關聯通道特征圖上所有像素進行打分, 主要是通過卷積層,將通道映射到1個通道,實現像素注意力打分

 

通道_空間注意力機制

CBAMNet

 

圖像的上半部分為通道注意力機制,通道注意力機制的實現可以分為兩個部分,我們會對輸入進來的單個特征層,分別進行全局平均池化全局最大池化。之后對平均池化和最大池化的結果,利用共享的全連接層進行處理,我們會對處理后的兩個結果進行相加,然后取一個sigmoid,此時我們獲得了輸入特征層每一個通道的權值(0-1之間)。在獲得這個權值后,我們將這個權值乘上原輸入特征層即可。

 

圖像的下半部分為空間注意力機制,我們會對輸入進來的特征層,在每一個特征點的通道上取最大值和平均值。之后將這兩個結果進行一個堆疊,利用一次通道數為1的卷積調整通道數,然后取一個sigmoid,此時我們獲得了輸入特征層每一個特征點的權值(0-1之間)。在獲得這個權值后,我們將這個權值乘上原輸入特征層即可。

核心思想:通道注意力機制將全局平均池化和全局最大池化作為通道要學習的注意力分數

空間注意力機制:在通道上求每一個像素點的平均值和最大值作為空間注意力

 

class ChannelAttention(nn.Module):

    def __init__(self, in_planes, ratio=8):

        super(ChannelAttention, self).__init__()

        self.avg_pool = nn.AdaptiveAvgPool2d(1)

        self.max_pool = nn.AdaptiveMaxPool2d(1)

   

        利用1x1卷積代替全連接

        self.fc1   = nn.Conv2d(in_planes, in_planes // ratio, 1, bias=False)

        self.relu1 = nn.ReLU()

        self.fc2   = nn.Conv2d(in_planes // ratio, in_planes, 1, bias=False)

   

        self.sigmoid = nn.Sigmoid()

   

    def forward(self, x):

        avg_out = self.fc2(self.relu1(self.fc1(self.avg_pool(x))))

        max_out = self.fc2(self.relu1(self.fc1(self.max_pool(x))))

        out = avg_out + max_out

        return self.sigmoid(out)

   

class SpatialAttention(nn.Module):

    def __init__(self, kernel_size=7):

        super(SpatialAttention, self).__init__()

   

        assert kernel_size in (37), 'kernel size must be 3 or 7'

        padding = 3 if kernel_size == 7 else 1

        self.conv1 = nn.Conv2d(21, kernel_size, padding=padding, bias=False)

        self.sigmoid = nn.Sigmoid()

   

    def forward(self, x):

        avg_out = torch.mean(x, dim=1, keepdim=True) # 通道上求每一個像素點的平均

        max_out, _ = torch.max(x, dim=1, keepdim=True) # 通道上求每一個像素點的最大值

        = torch.cat([avg_out, max_out], dim=1)

        = self.conv1(x) # 調整通道為1通道

        return self.sigmoid(x)

   

class cbam_block(nn.Module):

    def __init__(self, channel, ratio=8, kernel_size=7):

        super(cbam_block, self).__init__()

        self.channelattention = ChannelAttention(channel, ratio=ratio)

        self.spatialattention = SpatialAttention(kernel_size=kernel_size)

   

    def forward(self, x):

        = * self.channelattention(x)

        = * self.spatialattention(x)

        return x

 

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM