機器學習-Loss函數-Triplet loss&Circle loss - 碼上歡樂

相關內容簡體繁體

機器學習-Loss函數-Triplet loss&Circle loss

本文轉載自查看原文 2020-03-30 18:15 2566

https://blog.csdn.net/u013082989/article/details/83537370

一、 Triplet loss

1、介紹

Triplet loss最初是在 FaceNet: A Unified Embedding for Face Recognition and Clustering 論文中提出的，可以學到較好的人臉的embedding
為什么不適用 softmax函數呢，softmax最終的類別數是確定的，而Triplet loss學到的是一個好的embedding，相似的圖像在embedding空間里是相近的，可以判斷是否是同一個人臉。

2、原理

輸入是一個三元組 <a, p, n>
- a： anchor
- p： positive, 與 a 是同一類別的樣本
- n： negative, 與 a 是不同類別的樣本

triplet loss示意

公式是：
- 所以最終的優化目標是拉近 a, p 的距離，拉遠 a, n 的距離
- easy triplets:
- hard triplets:
- semi-hard triplets:

三種triplets 情況

FaceNet 中是隨機選取semi-hard triplets 進行訓練的, （也可以選擇 hard triplets 或者兩者一起進行訓練）

3、訓練方法

3.1 `offline`

訓練集所有數據經過計算得到對應的 embeddings, 可以得到很多<i, j, k> 的三元組，然后再計算 triplet loss
效率不高，因為需要過一遍所有的數據得到三元組，然后訓練反向更新網絡

3.2 `online`

從訓練集中抽取B個樣本，然后計算 B 個embeddings，可以產生 $B3B^3B3 個 triplets （當然其中有不合法的，因為需要的是<a, p, n>）$

online triplet loss

實際使用中采用此方法，又分為兩種策略（是在一篇行人重識別的論文中提到的 In Defense of the Triplet Loss for Person Re-Identification），假設
- Batch All: 計算batch_size中所有valid的的hard triplet 和 semi-hard triplet，然后取平均得到Loss
  - 注意因為很多 easy triplets的情況，所以平均會導致Loss很小，所以是對所有 valid 的所有求平均（下面代碼中會介紹）
  - 可以產生
    - PK個 anchor
    - K-1 個 positive
    - PK-K 個 negative
- Batch Hard: 對於每一個anchor，選擇距離最大的d(a, p) 和距離最大的 d(a, n)
  - 所以公有

二、 Tensorflow 中的實現

全部代碼
Tensorflow 中有實現好的triplet loss 接口，這里自己實現，（實現起來還是有點繞的, 有一些小細節問題）
使用numpy也仿照實現了，便於調試查看中間的結果, 全部代碼

實際上這個損失函數不管K和L的差距有多大https://www.zhihu.com/question/382802283

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 circle loss：統一softmax CrossEntropy loss 和 triplet loss / 2020 triplet loss 機器學習中的損失函數（着重比較：hinge loss vs softmax loss）機器學習總結：幾種常見的損失函數（Loss function）機器學習中 margin loss 、hinge loss 和 ramp loss 的區別 Facenet Triplet Loss 基於keras的triplet_loss Re-ID with Triplet Loss 【深度學習】一文讀懂機器學習常用損失函數（Loss Function）機器學習入門03 - 降低損失 (Reducing Loss)

粵ICP備18138465號 © 2018-2025 CODEPRJ.COM