Triple Loss

本文轉載自查看原文 2019-07-03 13:49 504 深度學習

Pass Anchor image through all layers
Pass Positive image through same layers
Pass Negative image through same layers
Compute Loss: L(A,P,N) = max(|| f(A) - f( P) ||2 - || f(A) - f(N) ||2 + alpha, 0

前言】
最近，learning to rank 的思想逐漸被應用到很多領域，比如google用來做人臉識別（faceNet），微軟Jingdong Wang 用來做 person-reid 等等。learning to rank中其中重要的一個步驟就是找到一個好的similarity function，而triplet loss是用的非常廣泛的一種。

【理解triplet】

如上圖所示，triplet是一個三元組，這個三元組是這樣構成的：從訓練數據集中隨機選一個樣本，該樣本稱為Anchor，然后再隨機選取一個和Anchor (記為x_a)屬於同一類的樣本和不同類的樣本,這兩個樣本對應的稱為Positive (記為x_p)和Negative (記為x_n)，由此構成一個（Anchor，Positive，Negative）三元組。

【理解triplet loss】
有了上面的triplet的概念， triplet loss就好理解了。針對三元組中的每個元素（樣本），訓練一個參數共享或者不共享的網絡，得到三個元素的特征表達，分別記為：。triplet loss的目的就是通過學習，讓x_a和x_p特征表達之間的距離盡可能小，而x_a和x_n的特征表達之間的距離盡可能大，並且要讓x_a與x_n之間的距離和x_a與x_p之間的距離之間有一個最小的間隔。公式化的表示就是：

對應的目標函數也就很清楚了：

這里距離用歐式距離度量，+表示[]內的值大於零的時候，取該值為損失，小於零的時候，損失為零。
由目標函數可以看出:

當x_a與x_n之間的距離 < x_a與x_p之間的距離加時，[]內的值大於零，就會產生損失。
當x_a與x_n之間的距離 >= x_a與x_p之間的距離加時，損失為零。
【triplet loss 梯度推導】
上述目標函數記為L。則當第i個triplet損失大於零的時候，僅就上述公式而言，有：

【算法實現時候的提示】
可以看到，對x_p和x_n特征表達的梯度剛好利用了求損失時候的中間結果，給的啟示就是，如果在CNN中實現 triplet loss layer, 如果能夠在前向傳播中存儲着兩個中間結果，反向傳播的時候就能避免重復計算。這僅僅是算法實現時候的一個Trick。
---------------------
作者：tangwei2014
來源：CSDN
原文：https://blog.csdn.net/tangwei2014/article/details/46788025
版權聲明：本文為博主原創文章，轉載請附上博文鏈接！

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Huber loss ctc loss Dubbo3 Triple 協議簡介與選型思考 train loss和test loss分析為什么驗證集的loss會小於訓練集的loss？前端加解密庫 CryptoJS 使用(Triple DES 對稱加密) 損失函數（Loss Function） pytorch loss總結與測試 train loss相關問題 Caffe Loss分析