“RoIAlign 方法可以基於每個個體在場景中的邊界框從多尺度特征圖中獲得獨立個體的特征。”
什么叫做“多尺度特征”?
多尺度特征 = 多尺度+特征
特征(feature):圖像內某一對象與其他對象區別的信息
多尺度(variable-scale?muti-scale!):深度網絡中 有n個conv_kernel 可以將一張圖片(長*寬*1 ps:rgb應該是3)的維度擴展至 長*寬*n,這就把一個高為1的長方體擴展為一個高為n的長方體,在這里提取信息就與原圖像(高為1)中提取的信息尺度不同(尺度不同:維度不一樣了),后面經過不同比例的下采樣后,每個比例內獲得的信息在統稱上稱為“多尺度”信息。