RRU-Net: The Ringed Residual U-Net for Image Splicing Forgery Detection阅读

本文转载自查看原文 2020-03-23 08:44 974 image forensics

出处： 2019 CVPRW

摘要： 基于神经网络的方法是通过利用篡改和非篡改区域间的差异来完成拼接篡改检测。

本文提出一个端到端的 image essence attribute segmentation 网络：RRU-net ，即环形残差U-net。

核心思想是强化CNN的学习方式。

受到大脑recall 和 consolidation 机制的启发，作者利用残差传播 recall 输入特征来解决gradient degradation 梯度退化问题，利用残差反馈 consolidate 输入特征使篡改区域和非篡改区域间的差异更加明显

code

数据集 CASIA [24] and COLUMB [8]

实验环境 a computer with Intel Xeon E5-2603 v4 CPU and NVIDIA GTX TITAN X GPU.

metrics precision 、recall 、f-score

1 背景

传统的基于特征提取的方法:

有一种基于 image essence attribute 检测的方法，问题是如果拼接篡改后做了一些隐蔽处理（如整体模糊操作），这个方法会失败。

基于CNN的检测方法：

输入 image patch，可能会丢失 the contextual spatial information。

随着网络加深，梯度退化问题会使得特征的 discrimination 辨识度弱化，可能造成失败

U-net： 能够提取一些shallow discriminative features，只利用了u-net 的两边

ResNet： 为解决梯度退化问题而提出

https://blog.csdn.net/Candy_GL/article/details/80584191

2 网络结构

本文结构

是端到端的图像本质属性分割网络
无需预处理后处理，直接定位篡改区域
解决梯度退化问题
更好地利用了上下文空间信息

residual propagation

解决梯度退化问题，图2 是示意图，包含两个卷积层（稀疏卷积+relu）和残差传播

Snipaste_2020-03-21_10-44-41

公式2 ，输入 x ，输出\(y_f\) ，\(W_i\) 是 i 层的权重，\(F(x,{W_i})\) 表示待学习的残差映射

Snipaste_2020-03-21_10-47-24

其中 Snipaste_2020-03-21_10-48-03 ,\(\sigma\) 表示 relu 。为简化表达，删去bias

残差传播类似于人脑的recall机制。当我们学习更多的新知识时，我们可能会忘记以前的知识，所以我们需要recall机制来帮助我们唤起那些以前模糊的记忆。

Residual Feedback

[36]通过将篡改图像通过SRM滤波层来叠加额外的噪声属性差异，增强检测效果。

但SRM 是一种手动选择方法，只适用于RGB图像篡改检测。当篡改区域和非篡改区域来自同一相机时，由于噪声属性相同，SRM方法表现不好

本文提出 residual feedback，强化图像本质属性的差异，不只局限于几个特定的图像属性。根据[9]，设计了一个简单有效的attention机制，加在residual feedback，给输入的辨识度高的特征分配更多注意力。attention机制采用带有sigmoid 激活函数的简单 gating 门控机制，学习有辨识度的特征通道之间的非线性相互作用，避免特征信息的扩散。我们将sigmoid激活得到的响应值叠加在输入信息上，放大未篡改区域和篡改区域的图像本质属性差异。

如图3 和公式 3

Snipaste_2020-03-21_11-10-46