一、Motivation
- 正樣本對距離和負樣本對距離的分布通常都是重疊的,沒有被很好的分開
- ReID的推理是一個全局的檢索問題,而訓練優化的目標函數是局部的 Triplet Loss (這是一個優化和目的的不匹配)
- 無論是在 instance 還是在 batch level 都不能很好解決這個問題
- 從 dataset-level 設計 loss 存在低效,更新不及時,計算不准確等問題
二、Method
I. Overall
分三階段:① 在源域上進行預訓練,獲取一個特征提取器;② 進行聚類,獲取偽標簽;③ 使用 GDS 進行 fine-tuning。
II. Global Distance-distribution (GDS) Modeling with Momentum Update
由於同時挖掘所有樣本的距離關系,需要很大的內存且費時,本文采用一個動量更新的方式進行優化。
GDS Loss
優化目的:拉開正負樣本兩個分布均值的距離,減小兩個分布的方差,使得分布更尖銳。
Hard Mining Loss
優化目的:為了更好分開兩個分布,拉開正樣本分布右尾和負樣本分布左尾的距離(理論依據:3\(\sigma\) 原理)
Overall Loss
可微性分析
三、Experiments
I. Ablation Study
- 可以明顯看出來,作者提出的兩個 Loss 都漲了不少的點
- 可視化結果也比較直觀的觀察出,原先的分布的確存在很大的重疊,加了GDS之后,分布更加集中且重疊部分減少了,再加上GDS-H,兩個分布拉的更開了
II. Comparision with SOTA
四、Conclusion
- 首個從全局距離分布的角度去考慮無監督的ReID問題,具有啟發性。
- 引入動量更新,使得難以優化的全局問題成為了可能。
- 作為一個即插即用的方法,可以應用到其他的無監督的網絡框架中。
- 角度新穎,方法漂亮。