NMS代碼說明(來自Fast-RCNN)
個人覺得NMS包含很多框,其坐標為(x1,y1,x2,y2),每個框對應了一個score,我們將按照score得分降序,並將第一個最高的score的框(我們叫做標准框)作為標准框與其它框對比,即計算出其它框與標准框的IOU值,然后設定閾值,與保留框的最大數量,若超過閾值,就刪除該框,以此類推,所選框最大不能超出設定的數量,最后得到保留的框,結束NMS
接下來,請看代碼:
import numpy as np
def py_cpu_nms(dets, thresh):
"""Pure Python NMS baseline."""
x1 = dets[:, 0]
y1 = dets[:, 1]
x2 = dets[:, 2]
y2 = dets[:, 3]
scores = dets[:, 4]
areas = (x2 - x1 + 1) * (y2 - y1 + 1) # 我認為xy坐標應該包含了(0,0)坐標,所以需要+1(個人是這么認為)
order = scores.argsort()[::-1] # [::-1]表示降序排序,輸出為其對應序號
keep = [] #需要保留的bounding box
while order.size > 0:
i = order[0] #取置信度最大的(即第一個)框
keep.append(i) #將其作為保留的框
#以下計算置信度最大的框(order[0])與其它所有的框(order[1:],即第二到最后一個)框的IOU,以下都是以向量形式表示和計算
xx1 = np.maximum(x1[i], x1[order[1:]]) #計算xmin的max,即overlap的xmin
yy1 = np.maximum(y1[i], y1[order[1:]]) #計算ymin的max,即overlap的ymin
xx2 = np.minimum(x2[i], x2[order[1:]]) #計算xmax的min,即overlap的xmax
yy2 = np.minimum(y2[i], y2[order[1:]]) #計算ymax的min,即overlap的ymax
w = np.maximum(0.0, xx2 - xx1 + 1) #計算overlap的width,我認為xy坐標應該包含了(0,0)坐標,所以需要+1(個人是這么認為)
h = np.maximum(0.0, yy2 - yy1 + 1) #計算overlap的hight
inter = w * h #計算overlap的面積
ovr = inter / (areas[i] + areas[order[1:]] - inter) #計算並,-inter是因為交集部分加了兩次。
inds = np.where(ovr <= thresh)[0] #本輪,order僅保留IOU不大於閾值的下標坐標,但是是從第二個數開始當成第一個數
order = order[inds + 1] #刪除IOU大於閾值的框,因為從第二個數開始,當作第一個數,所以需要+1,如[1,2,3,4],將從[2,3,4]開始,
#若選擇第一個數2,下標為0,所以需要+1,才能對應原來數[1,2,3,4],選擇為2.
return keep
單獨對這句話的理解,如下: