一、核心思路
人臉檢測任務與通用目標檢測是一派任務,檢測上的tricks均可以在人臉領域測試使用。
①使用retinanet作為基本結構,輕量級backbone,輕量級fpn結構,
②加入了iou預測分支
③使用inception模塊帶來多尺度感受野,增加dcn模塊進行靈活卷積
④框損失使用Diou-loss,使用GN代替BN。
網絡結構如圖:
二、方法解讀
①使用DCN,通過改變采樣位置達到把注意力聚焦目標本身的目的,動態調整感受野;
加入inception模塊,即多尺度多感受野,檢測出各種尺度的人臉
②Iou分支,加入iou分支在推理的時候,NMS的score依據更完善。解除分類分數和框質量之間的不匹配。
③Diou-loss,各種IOU-LOSS變體詳見知乎鏈接,diou-loss就是既考慮了box四個點的相關性,又考慮了兩框相交的各種形式,再加上中心點懲罰項形成的較完善的Iou-loss形式。
三、實驗結果
消融實驗,策略組合的情況
幾種策略或多或少均有提升。
當前SOTA模型的對比:
總體來說,借鑒通用目標檢測領域的各種有效tricks,簡單而實用地提升了人臉檢測的效果,幾乎達到了目前最高的水平。