圖像處理中的hard negative mining（難例挖掘）

本篇總結了一下知乎上的回答，原文鏈接：https://www.zhihu.com/question/46292829

在目標檢測中我們會事先標記好ground_truth，接下來在圖片中隨機提取一系列sample，與ground_truth重疊率IoU超過一定閾值的(比如0.5)，則認為它是positive sample，否則為negative sample，考慮到實際負樣本數>>正樣本數，我們為了避免network的預測值少數服從多數而向負樣本靠攏，取正樣本數：負樣本數大約為1:3，顯而易見，用來訓練網絡的負樣本為提取的負樣本的子集，那么，我們當然選擇負樣本中容易被分錯類的困難負樣本來進行網絡訓練啰。

那么負樣本中哪些是困難負樣本(hard negative)呢？困難負樣本是指哪些容易被網絡預測為正樣本的proposal，即假陽性(false positive)，如roi里有二分之一個目標時，雖然它仍是負樣本，卻容易被判斷為正樣本，這塊roi即為hard negative，訓練hard negative對提升網絡的分類性能具有極大幫助，因為它相當於一個錯題集。

如何判斷它為困難負樣本呢？也很簡單，我們先用初始樣本集(即第一幀隨機選擇的正負樣本)去訓練網絡，再用訓練好的網絡去預測負樣本集中剩余的負樣本，選擇其中得分最高，即最容易被判斷為正樣本的負樣本為困難樣本，加入負樣本集中，重新訓練網絡，循環往復，然后我們會發現:咦！我們的網絡的分類性能越來越強了！假陽性負樣本與正樣本間也越來越相似了！(因為此時只有這些妖怪區域能迷惑我們的分類器了)。

完結！撒花！

圖像處理中的hard negative mining（難例挖掘）

圖像處理中的hard negative mining（難例挖掘）

免責聲明！