這篇稍老一點,18年的用GAN做reid的paper,和上篇19年將輸入分解為appearance和structure不同。這篇FD-GAN是希望提到的特征僅僅和id有關,而和姿勢無關。所以將輸入分解為id+pose。編碼器可視化如下:

FD-GAN盡量在同一id姿態改變的情況下保持id特征的不變。在推理時又不會增加額外的復雜度。特征學習采用雙分支結構,每個分支包括一個圖像編碼器和一個圖像生成器。生成器基於id特征和姿態信息生成新圖。感受一下整體框架:

網絡結構:

訓練過程分三個步驟:
1. 訓練一個reid baseline的分類網絡
2. 固定E和V,加入G,D來預訓練FD-GAN
3. 全局微調
一些副產品:

