論文鏈接:PDF
總結:利用梯度信息去更新siamese tracker中的模板,使用了一種新的訓練方式,使得網絡更關注於梯度信息,防止過擬合
圖片的梯度信息可以反映目標的變化(類似DAT,DAT中有理論解釋)
網絡框架:
可以看到,網絡主要有兩個分支,下面的一個分支用來提取search region的特征,上面一路提取target的特征,並進行模板更新。
給定一個圖像對:, 希望對模板進行優化,得到優化的模板
, 能夠更好的從搜索區域中找出目標。首先,獲取初始的模板特征:
其中, f2()是兩層卷積層,U1是框架圖中所示的一個子網絡,是U1的參數
計算得分圖:
計算loss:
Y是標簽
將loss對 求導,將其加到
上去,更新目標的特征:
得到新的模板,並計算得分圖:
loss:
另外,作者認為現有的優化方法,不能很好的優化梯度,而是更關注於目標特征的相似性。因此,使用了一種新的模板生成的方式,去訓練優化網絡。
左邊的是一般的做法,右邊的是本文使用的模板生成的方法,使用一個模板在來自不同視頻的搜索域上搜索目標,使得網絡更關注於梯度,而不是外觀特征,並能防止過擬合。