“RoIAlign 方法可以基于每个个体在场景中的边界框从多尺度特征图中获得独立个体的特征。”
什么叫做“多尺度特征”?
多尺度特征 = 多尺度+特征
特征(feature):图像内某一对象与其他对象区别的信息
多尺度(variable-scale?muti-scale!):深度网络中 有n个conv_kernel 可以将一张图片(长*宽*1 ps:rgb应该是3)的维度扩展至 长*宽*n,这就把一个高为1的长方体扩展为一个高为n的长方体,在这里提取信息就与原图像(高为1)中提取的信息尺度不同(尺度不同:维度不一样了),后面经过不同比例的下采样后,每个比例内获得的信息在统称上称为“多尺度”信息。