- 摘要
- 問題描述
何愷明將深度學習技術引入超分辨問題的開山之作SRCNN(2014年),主要存在以下幾個問題:
1、感受野小,使得獲取的語義信息少,對於恢復細節信息有難度
2、收斂很慢
3、SRCNN只針對單尺度超分
- 主要貢獻點
1、設計了一個20層的卷積神經網絡來做超分辨
2、小的學習率會使的網絡收斂很慢,而大的學習率容易使得梯度爆炸,因此通過殘差學習和大的學習率及梯度裁剪(gradient cropping)加速收斂
3、設計的一個網絡可以同時實現多尺度超分辨
- 網絡結構
1、可以看到現將低分辨的圖像(LR)進行插值到目標分辨率大小的低分辨率圖像(ILR),然后將其作為網絡的輸入
2、ILR經過D-1次的Conv+ReLU,再經過第D次的Conv層+上ILR圖像,作為最終輸出圖像,可以看出,網絡主要學習真實圖像與ILR的殘差。
- 訓練細節
1、損失函數:其中f(x)表示網絡的預測輸出,r=y - x, y為真實高分辨圖像,x為經過插值的低分辨圖像。
2、 optimization methods:SGD,momentum=0.9, weight decay=1e-4
3、Adjustable Gradient Clipping。The gradients are clipped to [-θ/γ; θ/γ ], where γ denotes the current learning rate. And θ is tuned to be small to avoid exploding gradients in a high learning rate regime.
4、Multi-Scale Training
可以看到,只用單尺度的圖像對訓練,那么只在對應的尺度,PSNR最高。而用多尺度的訓練,測試的時候不同尺度的結果都是最好的(倒數第二列)
- 實驗結果
paper link:https://cv.snu.ac.kr/research/VDSR/VDSR_CVPR2016.pdf