location
對輸入圖像定位,找到盒子坐標(x,y,w,h);Clssificaion and Location的最后一層是的特征做兩件事,一個是分類,一個是定位。
訓練時使用已有的模型,也就是最后一層全聯接之前所有的參數都用已有模型的,然后在這個基礎上進行微調(fine tune),使其向着想要的網絡去收斂。
分類時,softmax計算loss,隨機梯度下降SGD反向傳播更新參數。測試時同時得到分類得分和定位(坐標)。
回歸模塊(regression head)放在什么位置呢?選擇不同的卷積神經網絡,回歸模塊放的位置也是不一樣的。可以用於box坐標定位,也可以用於姿勢識別、人臉識別。
滑動窗口:實際要做scale變換,就是將圖像縮小、放大,用同一個滑動窗口去檢測。不同的神經網絡對比(ResNet深度參差網絡,層數越多Error越低)。