在faster-r-cnn 中,因為引入rpn層,使得算法速度變快了不少,其實rpn主要作用預測的是
“相對的平移,縮放尺度”,rpn提取出的proposals通常要和anchor box進行擬合回歸,就像
卡爾曼濾波一樣,最終結果是基於觀測量加上一個預測量。這里將的不錯,公式和代碼也
切合。
下面部分來源:http://www.cnblogs.com/dudumiaomiao/p/6560841.html
主要步驟,
回歸/微調:
回歸/微調的對象是什么?
(4) Bounding-box regression(邊框回歸)
那么經過何種變換才能從圖11中的窗口P變為窗口呢?比較簡單的思路就是:
和知乎 https://www.zhihu.com/question/42205480 的回答:
這里輸出的並不是一個boundingbox的左上右下坐標,而是一個修改量(boundingbox regression)。在r-cnn的supplementary material中,給出了下面幾個公式

這里面的
就是的anchor(高、寬、中心),而里面的
是rpn_bbox層輸出的四個值,
就是修改之后的高、寬、中心。



作者:劉緣
鏈接:https://www.zhihu.com/question/42205480/answer/128259995
來源:知乎
著作權歸作者所有。商業轉載請聯系作者獲得授權,非商業轉載請注明出處。