Domain Adaptation for Semantic Segmentation via Class-Balanced Self-Training

本文轉載自查看原文 2020-06-09 10:10 623

問題
方法

問題

主要解決的問題是自監督訓練中，偽標簽的質量問題。

方法

提出了一種基於迭代自訓練過程的UDA框架，將問題表示為隱藏變量損失最小化，可以通過在目標數據上交替生成偽標簽，並使用這些標簽重新訓練模型。

在自訓練的頂層，提出了一個新的類別平衡自訓練框架避免在偽標簽生成過程中大類的梯度主導，並引入空間先驗優化生成的偽標簽。

自訓練的方法是：根據在目標域高置信度的預測交替生成偽標簽，然后使用這些偽標簽和標注的源域數據微調網絡。注意：這個框架假設高置信度預測的目標樣本有更高的預測准確率。

使用自步學習的自監督訓練

同時學習模型參數和未標注數據的偽標簽是很困難的，因為很難保證偽標簽的正確性。
一個更好的策略是采取”easy-to-hard“的策略，即由易到難的步驟學習，這需要用到自步學習。
首先生成置信度較高偽標簽，希望他們是正確的，然后再考察那些置信度較低的偽標簽。
將問題描述為，同時優化模型參數和偽標簽：
。
k是一個控制忽略偽標簽的超參數。一個較大的k鼓勵使用更多的超參數。
交替采取下面兩個步驟訓練上式：
a. 固定\(w\)，優化\(\hat{y}_{t,n}\)；
b. 固定\(\hat{y}_{t,n}\)，優化\(w\)。