解决的问题
该论文探讨了前人提出的卷积神经网络CNN
和超像素方法相结合进行区域级图像分类的优缺点。指出该方法与按像素分类相比,基于区域的算法可以探索像素之间的空间关系,从而可以减少某些像素级别的分类错误。但是,该方法没有考虑超像素区域之间的空间约束,这可能会限制这些算法的性能。因此该论文提出了基于RCC-MRF(区域分类置信度的马尔可夫随机场)的区域级SAR图像分类算法,该算法利用了超像素区域之间的深度特征和空间约束,可以减少某些区域级别的分类错误。
卷积神经网络:通常应用于机器视觉领域,进行图像的识别。其基本组件有输入层,卷积层,池化层,完全连接层和分类层。如下图所示:
- 卷积层所做的,本质上是一个具有核的图像卷积,得到特征图。
核实际上是神经网络需要学习的权重。权重是像素点属于哪个类别的占比。
- 池化层
池化的目的是减少输入的空间尺寸。以最大池化为例,使用 2×2 大小过滤器,跨距为 2 的MAX
池化. 对于𝑛×𝑚
的输入,通过将输入中的每个2×2
区域替换为单个值(该区域中4
个值的最大值),得到\(\frac{n}{2}×\frac{m}{2}\)的结果. 下图表示池化过程:
- 完全连接层
在完全连接的层中,将特征图重塑为特征向量,然后将特征向量连接起来以形成单个特征向量。
超像素:超像素最直观的解释,便是把一些具有相似特性的像素“聚合”起来,形成一个更具有代表性的大“元素”。而这个新的元素,将作为其他图像处理算法的基本单位。如下图所示:
MRF(马尔科夫随机场):有向图方法,便于分析因果关系,将图像模拟成一个随机变量组成的网格。其中的每一个变量具有明确的对由其自身之外的随机变量组成的近邻的依赖性(马尔科夫性)。
RCC-MRF:RCC-MRF
是一种改进的区域级MRF
。区域级MRF
是在区域上定义的MRF
模型。区域应表示为区域邻接图RAG
。在RAG
中,节点代表超像素区域,边缘代表区域之间边界的存在。通常通过过度分割获得超像素,并且将这些超像素视为区域。区域级MRF
在RAG上定义,以类似于像素的方式对区域的行为进行建模。令\(R_i\)表示RAG
中的顶点i
,而\(x_i\)表示属于\(R_i\)的所有位点的标签。 RCC-MRF
对\(R_i\)的能量函数可定义为:
\(E=(E_{GMM}+E_{RCC})+\beta E_S\)
\(\begin{equation} E_{G M M}=\sum_{R_{i} \in S} V_{G M M}^{R_{i}} ; \quad V_{G M M}=\sum_{p \in R_{i}}\left\{\frac{1}{2} \ln \left(2 \pi \sigma_{x_{i}}^{2}\right)+\frac{\left(y_{p}-\mu_{x_{i}}\right)^{2}}{2 \sigma_{x_{i}}^{2}}\right\} \end{equation}\)
\(\begin{equation} E_{R C C}=\sum_{R_{i} \in S} V_{R C C}^{R_{i}} ; \quad V_{R C C}=-\ln \left\{\frac{1}{N} \sum_{p \in R_{i}} p\left(x_{p}=l | F_{p}, W_{C N N}\right)\right\} \end{equation}\)
\(\begin{equation} E_{S}=\sum_{R_{i} \in S} V_{S}^{R_{i}} ; \quad V_{S}\left(x_{i}, x_{j}\right)=\left\{\begin{array}{l} \beta, x_{i}=x_{j} \\ 0, x_{i} \neq x_{j} \end{array}\right. \end{equation}\)
由以上公式可知,RCC-MRF
模型是在MRF
模型原来的能量函数中加了一项一阶能量函数\(E_{RCC}.\)
\(E_{RCC}\)是由像素的概率分布构造的,用于查找某个区域最有可能属于的类别.\(p(x_{p}=l | F_{p}, W_{C N N})\)表示\(R_i\)属于类别l
的置信度,因此其值越大,\(R_i\)属于l
的可信度就越高.
由最后一个公式可知区域标签应与相邻区域的标签一致.
解决方法流程
- 进行
CNN
训练。训练后得到所有像素的标签和类别置信度 - 应用
SLIC
(简单线性迭代聚类)算法获得过度分割的超像素区域 - 对于每个区域,采用一种投票策略,即将最主要的标签确定为该区域的标签
- 初始化区域标签后,将构建RCC-MRF并将其应用于区域级分类
-
通过最小化一元能量函数\(E_{RCC}\)值,确定区域最可能的类别,该项可以纠正区域初始标签中的一些错误分类,如图所示:
-
利用二元能量函数检验判定的区域类别
实验数据
本文实验数据采用的是一个拥有single look speckle噪声的合成SAR影像和两幅真的SAR影像。
合成SAR影像有四种纹理,容易导致错误分类,刚好可以用来评价该算法的准确性。合成SAR影像大小是486×486,里面包含八种类别。
两张真实SAR影像采用的是Radarsat-2卫星影像,一张是旧金山湾区的,大小为1010 × 1160;另一张是荷兰Flevoland省的,大小为1000 × 1400.