RFCN的核心是通過修改roi pooling的位置,來增加共享參數的層,減少運算時間;
roi pooling位置的影響如下:
- 越靠近 Input - 對應 ROI-Wise 檢測子網越深,准確度也就越高;
- 越靠近 Output - 對應 ROI-Wise 子網越淺,針對每個 ROI 計算量就越小,效率提高;
而修改roi pooling位置到整個網絡最后端的理由則是:
RoI pooling 的插入,打破了原卷積網絡的平移不變性,所以用新的方法來彌補;
采用Position Sensitive 的 Score Map,Score Map 包含了位置信息
從基礎cnn提取的feature maps通過k^2(c+1)維的卷積核生成position sensitive score map,
然后通過roi pooling對roi分成k^2個區域,每個區域分別對應每個位置敏感得分圖所定的某個特定位置;
網絡結構核心部分score map如下:
實現過程,網絡的結構如圖:
21總類別,8坐標的個數。score mpa和bbox map的區別就在於每張圖的維度不同,其他都一樣。
參考自:https://blog.csdn.net/wfei101/article/details/79284512
https://www.cnblogs.com/shouhuxianjian/p/7710707.html