SRCNN 論文閱讀

這篇論文Learning a Deep Convolutional Network for Image Super-Resolution)

講述了 用CNN解決了低解析度圖片轉換到高解析度圖片的問題。

輸入一張低解析度的圖片,這個神經網路能返回一張高解析度的圖片。

他們把這個方法叫做SRCNN(Super-Resolution Convolutional Networks)。

名詞解釋

LR: 低解析度圖像 low resolutional images

HR: 高解析度圖像 high resolutional images

SR: 超解析度圖像 Super-Resolution images

CNN: 卷積神經網路 Convolutional Networks

流程

1. 獲取一張HR圖

2. 根據原圖製作一張低解析度原圖,記錄這個scale factor。

3. 用bicubic法過採樣(Upsampling )第二步獲得的圖像,讓返回的圖像和HR一樣大小,但這張圖仍然叫做LR。

4. 訓練一個三層神經網路

4.1 神經網路的輸入為第三步獲得的LR,輸出為SR, LR和SR的size一樣。

4.2 HR 作為SR 的ground truth, CNN 通過backprop 不斷讓SR 更逼近 HR 。

4.3 損失函數用 pixel-loss 具體公式為 l(sr,hr) = frac{1}{C	imes H	imes W}||sr-hr||_{2}^{2}。其中HWC 分別為圖片的長,寬和color channel個數,一般為1 或3 。

這個三層神經網路可以用下圖表示出來。

5. 不斷重複上述步驟, 訓練這個三層神經網路,使得這個網路能獲取任意大小的圖像, 然後生成相應的SR

結果

我們用PSNR 作為衡量圖像一和圖像二相似度的指標, PSNR 越大說明圖像越相似。

可見用SRCNN 的方法能取得比A* KK ANR 等更優的結果。

下圖是他們提供的栗子


推薦閱讀:

TAG:機器學習 | 計算機視覺 |