論文閱讀之:Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network


 

Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network 

2016.10.23 

 

  摘要:本文針對傳統超分辨方法中存在的結果過於平滑的問題,提出了結合最新的對抗網絡的方法,得到了不錯的效果。並且針對此網絡結構,構建了自己的感知損失函數。先上一張圖,展示下強大的結果:

  Contributions 

  GANs 提供了強大的框架來產生高質量的 plausible-looking natural images。本文提供了一個 very deep ResNet architure,利用 GANs 的概念,來形成一個 perceptual loss function 來靠近 human perception 來做 photo-realistic SISR

  主要貢獻在於:

  1. 對於 image SR 來說,我們取得了新的頂尖效果,降低 4倍的分辨率,衡量標准為:PSNR 和 structure similarity (SSIM)。具體的來說,我們首先采用 fast feature learning in LR space and batch-normalization 來進行訓練殘差網絡。

  2. 提出了結合 content loss 和 adversarial loss 作為我們的 perceptual loss。

 

  Method: 

  首先是幾個概念:

    super solved image $I_{SR}$: W * H * C ;   low-resolution input image $I_{LR}$: rW * rH * C ;   high-resolution image $I_{HR}$ : rW * rH * C.  

  我們的終極目標是:訓練一個產生式函數 G 能夠預測給定的輸入圖像 LR input image 的 HR 部分。我們達到這個目的,我們訓練一個 generator network 作為一個 feed-forward CNN $G_{\theta_{G}}$ 參數為 $\theta_{G}$ , 此處的 $\theta_{G} = {W_{1:L} ; b_{1:L}}$ 表示一個 L 層 deep network 的 weights 和 biases,並且是通過優化一個 SR-specific loss function $l^{SR}$ 得到的。對於一個給定的 訓練圖像 $I^{HR_{n}}$ ,n =  1,...,N 對應的低分辨率圖像為:$I^{LR}_n$ ,我們優化下面這個問題:

 

  1. Adversarial Network Architecture 

  產生式對抗網絡的訓練學習目標是一個 minmax problem :

  作者也將圖像超分辨看作是這么一個過程。通過 generator 產生一張超分辨圖像,使得 discriminator 難以區分。

  上圖就是本文所涉及的大致流程。

  

  2. Perceptual Loss Function 

  本文所設計的感知損失函數 是本文算法性能的保證。

    2.1. Content Loss 

    像素級 MSE Loss 的計算為:

    這個是最經常使用的優化目標。但是,這種方式當取得較高的 PSNR的同時,MSE 優化問題導致缺乏 high-frequency content,這就會使得結果太過於平滑(overly smooth solutions)。如圖2 所示:

    我們對此做了改進,在 pre-trained 19-layer VGG network 的 ReLU activation layers 的基礎上,定義了 VGG loss

    我們用 $\phi_{i,j}$ 表示 VGG19 network 當中,第 i-th max pooling layer 后的 第 j-th 卷積得到的 feature map。然后定義 the VGG loss 作為重構圖像 和 參考圖像之間的歐氏距離 :

    其中,$W_{i, j}$  and $H_{i, j}$ 表示了 VGG network 當中相應的 feature maps 的維度。

    

    2.2. Adversarial Loss 

    在所有訓練樣本上,基於判別器的概率定義 generative loss :

    此處,D 是重構圖像是 natural HR image 的概率。

  

    2.3. Regulatization Loss 

    我們進一步的采用 基於 total variation 的正則化項 來鼓勵 spatially coherent solutions。正則化損失的定義為:

  


  3. Experiments

     

 

  


  總結 :  本文給出了一種比較直觀的利用 產生式對抗網絡的方法,結合 GANs 的比較好的應用到 Super-Resolution 上。

      主要是利用了 GANs 可以創造新的圖像的能力。

      

  

  

   


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM