GradNet: Gradient-Guided Network for Visual Object Tracking閱讀筆記


論文鏈接:PDF

總結:利用梯度信息去更新siamese tracker中的模板,使用了一種新的訓練方式,使得網絡更關注於梯度信息,防止過擬合

 

 

 圖片的梯度信息可以反映目標的變化(類似DAT,DAT中有理論解釋)

網絡框架:

 

可以看到,網絡主要有兩個分支,下面的一個分支用來提取search region的特征,上面一路提取target的特征,並進行模板更新。

給定一個圖像對:, 希望對模板進行優化,得到優化的模板, 能夠更好的從搜索區域中找出目標。首先,獲取初始的模板特征:

 

 

 其中, f2()是兩層卷積層,U1是框架圖中所示的一個子網絡,是U1的參數

 

計算得分圖:

 

 計算loss:

 

 Y是標簽

將loss對 求導,將其加到上去,更新目標的特征:

 

 

 

得到新的模板,並計算得分圖:

 

 

loss:

 

另外,作者認為現有的優化方法,不能很好的優化梯度,而是更關注於目標特征的相似性。因此,使用了一種新的模板生成的方式,去訓練優化網絡。

 

 

 

 左邊的是一般的做法,右邊的是本文使用的模板生成的方法,使用一個模板在來自不同視頻的搜索域上搜索目標,使得網絡更關注於梯度,而不是外觀特征,並能防止過擬合。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM