mini-batch的TripleLoss實現(Pytorch)

本文轉載自查看原文 2019-09-24 17:01 700 深度學習

以前都是直接調用別人的，但是詳細實現沒有了解過，今天自己實現一把。簡單來說，找出batch中每個anchor對應的最大正樣本postive和最小負樣本nagetive，然后距離max(a-p)和min(a-n)做差即可。


class TripleLoss(nn.Module):
    def __init__(self, margin=0.3):
        super(TripleLoss, self).__init__()
        self.margin = margin # 閾值
        self.rank_loss = nn.MarginRankingLoss(margin=margin)

    def forward(self, inputs, labels, norm=False):      
        dist_mat = self.euclidean_dist(inputs, inputs, norm=norm)  # 距離矩陣
        dist_ap, dist_an = self.hard_sample(dist_mat, labels) # 取出每個anchor對應的最大
        y = torch.ones_like(dist_an) # 系數矩陣，1/-1
        loss = self.rank_loss(dist_ap, dist_an, y)
        return loss

    @staticmethod
    def hard_sample( dist_mat, labels, ):
        # 距離矩陣的尺寸是 (batch_size, batch_size)
        assert len(dist_mat.size()) == 2
        assert dist_mat.size(0) == dist_mat.size(1)
        N = dist_mat.size(0)

        # 選出所有正負樣本對
        is_pos = labels.expand(N, N).eq(labels.expand(N, N).t()) # 兩兩組合， 取label相同的a-p
        is_neg = labels.expand(N, N).ne(labels.expand(N, N).t()) # 兩兩組合， 取label不同的a-n

        list_ap, list_an = [], []
        # 取出所有正樣本對和負樣本對的距離值
        for i in range(N):
            list_ap.append( dist_mat[i][is_pos[i]].max().unsqueeze(0) ) 
            list_an.append( dist_mat[i][is_neg[i]].max().unsqueeze(0) )
            dist_ap = torch.cat(list_ap)  # 將list里的tensor拼接成新的tensor
            dist_an = torch.cat(list_an)
        return dist_ap, dist_an

    @staticmethod
    def normalize(x, axis=1):
        x = 1.0*x / (torch.norm(x, 2, axis, keepdim=True) + 1e-12)
        return x

    @staticmethod
    def euclidean_dist(x, y, norm=True):
        if norm:
            x = self.normalize(x)
            y = self.normalize(y)
        m, n = x.size(0), y.size(0)
        xx = torch.pow(x, 2).sum(dim=1, keepdim=True).expand(m, n)
        yy = torch.pow(y, 2).sum(dim=1, keepdim=True).expand(n, m).t()
        dist = xx + yy # 任意的兩個樣本組合， 求第二范數后求和 x^2 + y^2
        dist.addmm_( 1, -2, x, y.t() ) # (x-y)^2 = x^2 + y^2 - 2xy
        dist = dist.clamp(min=1e-12).sqrt()
        return dist

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Mini-Batch 、Momentum、Adam算法的實現 Mini-batch 和batch的區別 keras基礎-優化策略：mini-batch gradient decent 梯度下降法（BGD & SGD & Mini-batch SGD）隨機梯度下降、mini-batch梯度下降以及batch梯度下降【深度學習】：梯度下降，隨機梯度下降（SGD），和mini-batch梯度下降 pytorch 實現一個自定義的dataloader，每個batch都可以實現類別數量均衡【pytorch】帶batch的tensor類型圖像顯示 web-mini框架的基本實現（一） Pytorch錯誤Expected input batch_size (324) to match target batch_size (4) Log In