该文章参考于: 点击链接

Abstract

图像恢复是一个长期存在的底层视觉问题,旨在从低质量图像(例如,降采样、含噪声和压缩后的图像)中恢复高质量图像。虽然当前最先进的图像恢复方法基于卷积神经网络,但很少有人尝试使用Transformer,而Transformer在高层视觉任务中表现出色。在本文中,我们提出了一种基于Swin Transformer的强大基线模型SwinIR用于图像恢复。SwinIR由三部分组成:浅层特征提取、深层特征提取和高质量图像重建。特别地,深层特征提取模块由几个残差Swin Transformer块(RSTB)组成,每个块都包含几个Swin Transformer层以及一个残差连接。我们在三个有代表性的任务上进行了实验:图像超分辨率(包括经典、轻量级和真实世界图像超分辨率)、图像去噪(包括灰度和彩色图像去噪)以及JPEG压缩伪影减少。实验结果表明,SwinIR在不同任务上比最先进的方法性能提升高达0.14 - 0.45dB,同时参数总数最多可减少67%。

相关链接