NTIRE 2018 超解析度 CVPR Workshop
來自專欄計算機視覺論文速遞57 人贊了文章
大牛分享 | NTIRE 2018 圖像超解析度 CVPR Workshop優勝方案
原創:王超鋒來源:CVer 微信公眾號
NTIRE 2018 圖像超解析度 CVPR Workshop優勝方案
很榮幸邀請了王超鋒同學為大家做關於《NTIRE 2018 圖像超解析度 CVPR Workshop優勝方案》專題分享。
王超鋒同學,研究生階段主要研究圖像超解析度(Image Super Resolution)方向,他是Amusi 眼中的深度學習大佬。向他邀文了很久,大佬終於答應寫一篇專題分享,再次感謝。
話不多說,下面介紹專題正文:
專題正文
今年的CVPR已經在美國鹽湖城結束。這裡主要想借著CPVR聊一下目前low level領域上的一些進展,本人研究生時,做過一些超解析度上不算太深入的研究。目前工作了,實踐的少了,但依然有關注這個方向。這幾天整理關注了下NTIRE 圖像復原(Image Restoration)挑戰賽上超解析度賽道上一些優勝隊伍的方法。在這裡跟大家分享下,如有錯誤的地方,還請指正,學習為主。
今年是NTIRE挑戰賽舉辦的第二年(以下都稱為NTIRE2018),主要有圖像超解析度(super-resolution)、圖像去霧(dehazing)、光譜重建(spectral reconstruction)三個方向。網站如下: http://www.vision.ee.ethz.ch/ntire18/。超解析度上有四個賽道,其中一個為使用經典的bicubic降尺度方式作為待重建圖像,進行8倍放大重建。這也是目前大部分文獻中最常見的設置方式之一。而其餘三個賽道均是來自不同程度(Mild、Difficult、Wild)未知退化運算元模擬相機採集的待重建圖像,進行4倍放大重建。暫時拋開比賽,聊一點近幾年基於深度學習的超解析度重建的背景。從我自己了解的論文來看,目前基於深度學習(主要還是CNN)最為經典的論文應該是SRCNN[1]、FSRCNN[2]、ESPCN[3]、VDSR[4]、EDSR[5]、SRGAN[6]這幾篇論文。SRCNN是最早用CNN來進行超解析度重建的論文(Kaiming He也參與其中),FSRCNN是SRCNN作者的改進,主要貢獻在於直接原圖像進行端對端的重建,在速度上也非常快,如圖1。簡單介紹了背景,回到NTIRE2018這個比賽,這次比賽使用的數據集為DIV2K數據集[9],一共包含1000張2K解析度的RGB圖像,其中800張為訓練集,100張為驗證集,100張為測試集。評價標準使用了PSNR、SSIM。這就意味著這個場景下使用感知損失重建並不會是個很好的選擇。大部分隊伍以強化網路特徵學習或者添加模糊運算元先驗為主。以下我將對一些有意思的方法進行簡單的闡述,若有錯誤請指正。
經典的bicubic 8倍放大賽道上,Toyota-TI 提出的deep back-projection networks(DBPN)[10]獲得了第一名,如圖。DBPN本身已經被CVPR2018收錄,NTIRE2018上也證明其在bicubic經典方式上效果的顯著性。DBPN主要思想認為以往的CNN方法中,從LR到SR是一個完全上採用的過程,這過程中沒有完全處理好LR到SR的與HR之間的差異。在高倍放大下更為顯著。所以DBPN提供了一個up-down的映射單元,希望通過迭代上下交替採樣的糾正反饋機制,恢復更好的細節特徵。論文中的結果以及本次NTIRE2018的結果可以看出DBPN在高倍放大下比LapSR、EDSR擁有更好的效果。經典bicubic的第三名rainbow團隊借鑒了EDSR以及SRDenseNet的結構,結合金字塔逐步重建的方式,在增強特徵的同時,使用DenseNet重複利用特徵的特點取得了不錯的效果。如圖9。
個人理解上DenseNet的重複利用特徵的方式在SR上是個非常有用的方式,因為高頻信息在淺層上會更豐富,將淺層信息直接輸送到後面網路會更有利於邊緣細節部分的重建。這一點可以參考ICCV2017上的MemNet[11]。第二點EDSR中移除了batchnorm, 而WDSR則增加了weightsnorm,雖然不會帶來性能上的收益,但能使用更大的學習率加快訓練。
第三點,出於速度上的考慮,WDSR移除了EDSR尾部冗餘的一些卷積。而在現實圖片的三個賽道上,由於LR和HR之間存在偏移的情況。該團隊,使用了預校準來減輕LR和HR之間的偏移。最終WDSR在bicubic上獲得了第七名,而在現實圖片的Mild、Difficult、Wild三個三道上分別取得了第一名、第一名和第二名的好成績。以上引用比賽文章都在如下鏈接中,就不一一列舉出來了:
http://openaccess.thecvf.com/CVPR2018_workshops/CVPR2018_W13.py其中總結性文章可以參考,鏈接中的<<NTIRE 2018 Challenge on Single Image Super-Resolution: Methods and Results>>這篇。最後如果哪裡有問題請幫忙指正,畢竟最重要的是互相學習。Reference
1. Dong C, Chen C L,He K, et al. Image Super-Resolution Using Deep Convolutional Networks[J]. IEEETransactions on Pattern Analysis & Machine Intelligence, 2016,38(2):295-307.
2. Dong C, Chen C L,Tang X. Accelerating the Super-Resolution Convolutional Neural Network[J].2016:391-407.3. Shi W, CaballeroJ, Huszar F, et al. Real-Time Single Image and Video Super-Resolution Using anEfficient Sub-Pixel Convolutional Neural Network[C]// IEEE Conference onComputer Vision and Pattern Recognition. IEEE Computer Society, 2016:1874-1883.4. Kim J, Lee J K,Lee K M. Accurate Image Super-Resolution Using Very Deep ConvolutionalNetworks[C]// IEEE Conference on Computer Vision and Pattern Recognition. IEEEComputer Society, 2016:1646-1654.5. Lim B, Son S, KimH, et al. Enhanced Deep Residual Networks for Single ImageSuper-Resolution[C]// Computer Vision and Pattern Recognition Workshops. IEEE,2017:1132-1140.6. Ledig C, Theis L,Huszar F, et al. Photo-Realistic Single Image Super-Resolution Using aGenerative Adversarial Network[J]. 2016:105-114.7. Johnson J, AlahiA, Li F F. Perceptual Losses for Real-Time Style Transfer andSuper-Resolution[J]. 2016:694-711.
8. Sajjadi M S M,Sch?lkopf B, Hirsch M. EnhanceNet: Single Image Super-Resolution ThroughAutomated Texture Synthesis[J]. 2016.9. E. Agustsson andR. Timofte. NTIRE 2017 challenge on single image super-resolution: Dataset andstudy. In The IEEE Conference on Computer Vision and Pattern Recogni[1]tion(CVPR) Workshops, July 2017. 1, 210. Haris M,Shakhnarovich G, Ukita N. Deep Back-Projection Networks ForSuper-Resolution[J]. 2018.11. Tai Y, Yang J, LiuX, et al. MemNet: A Persistent Memory Network for Image Restoration[J].2017:4549-4557.12. Lai W S, Huang JB, Ahuja N, et al. Deep Laplacian Pyramid Networks for Fast and AccurateSuper-Resolution[C]// IEEE Conference on Computer Vision and PatternRecognition. IEEE Computer Society, 2017:5835-5843.13. Zhang K, Zuo W,Chen Y, et al. Beyond a Gaussian Denoiser: Residual Learning of Deep CNN forImage Denoising.[J]. IEEE Transactions on Image Processing, 2017,26(7):3142-3155.14. Zhang K, Zuo W,Zhang L. Learning a Single Convolutional Super-Resolution Network for MultipleDegradations[J]. 2017.15. Blau Y, MichaeliT. The Perception-Distortion Tradeoff[J]. 2017.16. NTIRE 2018Challenge on Single Image Super-Resolution: Methods and Resultshttp://weixin.qq.com/r/NioZAUbEpRvarQJi938k (二維碼自動識別)
推薦閱讀:
TAG:計算機視覺 | 深度學習DeepLearning | 超解析度 |