|
基于压缩感知理论的图像优化技术
王 钢* 周若飞 邹昳琨
(哈尔滨工业大学电子与信息工程学院 哈尔滨 150001)
摘 要:压缩感知(CS)理论是目前信息工程相关领域研究的前沿热点之一。它打破了传统的奈奎斯特采样定理,相比于其要求的最小采样频率,CS理论证明了能够从更低数目的采样中以高概率完整地恢复原始信号,在保证信息特征不丢失的前提下节省了数据采集和处理的时间成本。压缩感知理论本质上可以视为处理线性信号恢复问题的工具,因此在求解信号和图像的逆问题上有着显而易见的优势。图像退化问题便是其中之一,恢复相应的高质量图像的过程即为图像优化。为推动压缩感知理论的学术研究与实际应用,该文介绍了其基本原理与方法。根据图像优化技术的现存研究工作,分别从去噪、去模糊和超分辨三大主流方面研究了基于CS理论的优化技术。最后探讨了所面临的问题和挑战,分析了未来的发展趋势,为将来研究工作的展开提供借鉴与帮助。
关键词:图像处理;压缩感知;图像去噪;图像去模糊;超分辨
1 引言
随着信息时代的到来和多媒体业务的蓬勃发展,图像和视频作为主流的信息载体,在人类社会信息网络中扮演着越来越重要的角色,图像信号处理也作为科研领域的研究热点经久不衰。而智能手机与互联网的普及,使得人们对高清甚至超清图像与视频的需求越来越大。显而易见,高质量的图像可以携带更多的信息,为工作与生活提供便利,而受到噪声污染或者采集设备问题而获取的低质量图像则丢失了很多重要信息,给生产生活带来诸多不便。因此,如何对图像进行优化以提高图像质量成为了亟待解决的问题。在这样的背景下,图像优化便逐渐成为主流研究方向之一。
图像优化(image optimization)技术主要针对的是图像退化(image degradation)问题[1]。通过分析图像退化的产生原因,图像优化技术主要解决三大类问题:第一,在成像及传输过程中,由于传感器发热或电流变化产生的不同种类的噪声(如高斯白噪声,脉冲噪声等)[2–5];第二,在图像采集过程中,由于采集设备(如照相机、摄像机等)与目标间的相对移动、成像设备未聚焦或曝光不足等造成的模糊效应[6–8];最后,由于成像设备的传感器排列密度不足而导致成像的分辨率较低[9–11]。因此,图像优化技术主要包括图像去噪、图像去模糊和图像超分辨三大方向,并广泛应用于各行各业中,比如摄影、交通、安保、医学、遥感、军事等领域[12–15]。
近几年,压缩感知(Compressed Sensing, CS)理论因其独特的优势在图像处理领域中备受关注。CS理论在2006年由Candes, Tao和Donoho等人[16–18]提出,它证明了使用有效的算法可以从高度不完整的线性测量中恢复原始信号。值得注意的是,原始信号必须是在某个域上是稀疏的,也就是说信号用某种基展开后绝大部分系数为零,常见的如小波变换(Wavelets Transform, WT)[19] 基、离散余弦变换(Discrete Cosine Transform, DCT)基等。而常见的图像信号(或在某个域上的变换)在大部分情况下均满足这种稀疏性,将CS理论应用与图像处理的最根本动机也在于此。此外,CS理论保证了只要得到信息中的上述非零分量,就能够通过求解非线性优化问题来重构原始信号。这对于图像的退化来说,则保证了可以通过少量的有用信息来恢复原始图像,已达到图像优化的目的。因此,基于压缩感知的图像优化技术也应运而生,并迅速发展。
综上,为满足未来对高清图像和视频信号的需求,基于压缩感知理论的图像优化技术成为了未来的突破方向和演进趋势。但是,该技术也面临着新技术的冲击与诸多阻碍,本文旨在对CS图像优化技术及其研究现状、实际应用和发展趋势进行系统的介绍,以期推动该技术的革新突破并为读者提供借鉴与帮助。
2 压缩感知理论
2.1 信号的稀疏表示
信号的稀疏性是压缩感知理论的一个首要前提。通常,信号可以很好地近似为已知的基或字典中若干个元素的线性组合,当组合的表达式唯一时,可以认为信号是稀疏的。高维的稀疏的信号在数学框架下可以认为包含的信息相对较少。因此,合理地选择信号的稀疏基,可以使信号稀疏表示之后保留的信息足够完备,同时信息稀疏解最少。如此选择的动机,本质上可以看作是奥卡姆剃刀原理的一种实例:当面对许多可能的方式来表示一个信号时,最简单的选择往往是最好的。
数学上,设长度为 N 的信号X ∈RN在某组基Ψ =[ψ1,ψ2,···,ψN](ψ 大小为N ×N)下展开,矩阵表示形式为
其中, α=[α1,α2,···,αN], 大小为N ×1, αi(i=1,2,···,N)是 原始信号 X 在基ψ i(i=1,2,···,N)下的变换系数。
如果 α中最多有k 个非零元素(0 <k ≤N),那么则称信号 X 为k-稀疏的。更为严谨的数学表达为∥α∥0 ≤k ,其中∥ ·∥0 为 l0范 数。 Ψ则称为稀疏基,或稀疏矩阵。
按照稀疏矩阵的类型,信号的稀疏表示方法目前主要可分为以下3种:正交变换基方法、多尺度几何分析方法(Multi-scale Geometric Analysis,MGA)和过完备字典方法。正交基方法最为基础,常用的变换包括:傅里叶变换(Fourier Transform,FT)、小波变换和离散余弦变换等等。多尺度几何分析则针对高维函数,因为很多在1维信号处理中表现优异的方法无法充分利用高维信号的几何特征,造成得到的稀疏表示并不是“最稀疏”的。主要的方法包括:脊波(ridgelet)变换、曲波(curvelet)变换、楔波(wedgelet)变换、轮廓波(contourlet)变换和条带波(bandelet)变换等等[20–24]。
而为了覆盖更多信号类型,字典的概念被提出。字典的列数如果大于行数,则称为过完备字典[25]。过完备字典中基元素的数量大于维数,即存在冗余性,相对于完备字典,信号在过完备字典下的表示更加稀疏。过完备字典方法主要包括:固定字典和学习字典,由于学习字典可以更新原子,因此对于信号来讲是自适应的,具有更好的性能。字典学习(Dictionary Learning, DL)也成为信号处理领域的研究热点之一[26]。
2.2 信号的观测矩阵
2.1节讨论了对 X的要求,而在实际应用中X其实是未知的,已知的是低维信号 Y ,而 Y实际上是 X的低维投影。利用一个观测基 Φ(大小为M ×N ,其中M ≪N ),将原始信号 X从高维空间投影到低维空间,得到观测值 Y (大小为M ×1),压缩感知理论证明了在 Y 和 Φ满足一定条件的情况下,就可以从低维观测值 Y中精确恢复原始高维信号 X 。而 Φ称为观测矩阵,或测量矩阵。矩阵表示形式为
其中,Θ =ΦΨ 称为感知矩阵,大小为M ×N。需要注意的是,感知矩阵存在约束等距条件(Restricted Isometry Property, RIP)[27],对于任意一个k-稀疏的信号v ,感知矩阵 Θ均使式(3)成立
则称Θ 满足k 阶RIP条件,其中0 <ε<1, ∥ ·∥2 为l 2范数。感知矩阵必须满足RIP,信号才能精确重构。文献[27,28]给出了详细的解释,这里不做赘述。简单来说,要求观测矩阵 Φ的基与稀疏矩阵 Ψ的基互不相关。由于 Ψ跟信号特征密切相关,通常是固定的,所以观测矩阵的设计指的就是构造 Φ ,使Θ 满足RIP。
高斯随机矩阵几乎与任意 Ψ均不相关,文献[29]也证明了当
成立时(其中 c 为值较小的常数),高斯随机矩阵能够以较大概率使得 Θ满足RIP。因此,观测矩阵一般选择大小为 M ×N 、均值µ =0 、方差σ2 =1/N的高斯随机矩阵。其他常用的观测矩阵包括伯努利矩阵和托普利兹矩阵等等。除了这种随机矩阵,也可以采用一些自相关系数较小的确定性矩阵[30]。它们都可以高概率地保证与绝大部分信号表示空间的基具有较小的互相关系数,避免造成信息干扰。
2.3 信号的重构算法
在式(2)中, Y的维度远小于 X 和α 的维度,线性方程组有无穷个解,无法确定唯一解。本文倾向于寻找最稀疏解作为该问题的唯一解,具体解释见可参考文献[31]。数学形式表示为
式(5)可以转化为式(6)最优化问题进行求解
需要注意的是, l0最小化问题是NP-hard问题,目前并不存在有效的多项式算法可以对其进行求解。但是可以寻找其它解决途径。文献[17]证明了 l0最小化问题可以转化为l 1最小化问题来求解
而该问题是凸优化问题,则可以用合适的方法求得最优解。主流的重构算法包括:以基追踪(Basis Pursuit, BP)为代表的凸优化方法,以正交匹配追踪(Orthogonal Matching Pursuit, OMP)[32]为代表的贪婪算法以及统计优化方法等等。以上方法在重构速度、重建精度和计算复杂度等方面各有优劣,在不同的应用情况下根据需要进行选择。
综上所述,压缩感知理论的主要内容包括信号的稀疏变换、从高维到低维的降维观测和优化问题求解进行信号重构这3个方面。更直观的表达如图1所示。
图 1 压缩感知理论的主要内容
3 基于压缩感知的图像优化技术
从去除噪声到提高分辨率,各种图像优化技术看似不同,但是数学上的思想却是相近的。它们的目的都是从退化的观测值中重构原始信号,而这是一个典型的逆问题(inverse problem)。逆问题的一大特点就是不适定性(ill-posed),即解是不存在的或不是唯一的。压缩感知理论一经问世,便被用来解决各类逆问题,图像优化便是其中一种。本节从去噪、去模糊和超分辨3个主要方面,对基于压缩感知的图像优化技术进行研究。
3.1 基于压缩感知的图像去噪
3.1.1 研究现状与方法
噪声在图像退化中十分常见。通常意义上,认为噪声是高频分量,而图像的主要信息一般是低频,因此传统的图像去噪方式以滤波为主,比较常见的有中值滤波和维纳滤波等等。但是图像的边缘与细节同样属于高频分量,因此普通的滤波方法会使图像模糊并丢失信息。近几年随着机器学习的热潮,出现了基于学习的去噪方法。基于学习的去噪算法主要是通过学习和训练来构建从噪声图像到纯净图像的映射函数,目前已经取得了很多显著的研究成果。但上述两类方法和本文所介绍内容并不相关,因此不做详细展开。
基于压缩感知的图像去噪算法,属于基于先验模型的去噪算法。基于先验模型的去噪算法首先可以追溯到1992年Rudin提出的全变分(Total Variation,TV)模型,文献[33]中作者计算出受到噪声污染的图像的TV明显比纯净图像的TV的大,那么理论上最小化TV就可以将噪声同时最小化。另一个经典模型是高斯混合模型(Gaussian Mixture Model,GMM)[34],该模型利用多个带权重的高斯密度函数来描述信号。在信号的稀疏性被发掘出来之后,稀疏先验模型被提出并广泛应用于图像去噪等信号处理工作。在该模型中,利用图像信息和噪声在稀疏性上的差异,将图像利用稀疏变换展开,收集带有图像主要信息的少量非零系数之后进行图像恢复,得到去噪后的图像。而压缩感知理论证明了这个过程的可行性,并为从信号的稀疏表示到最后的信号重构提供了整体的框架。接下来介绍基于压缩感知的图像去噪算法的主流技术与研究现状。
参考2.1节,不同的稀疏基带来不同的稀疏表示方法,也衍生出不同的去噪算法。首先是基于小波变换的去噪方法。文献[35]将图像内容转换成不同方向和分辨率尺度下的多个子带,大系数代表重要的低频信息,而小系数代表噪声和细节。因此,可以对小系数进行阈值化。最后,将这些小波系数反变换回空间域,对图像进行重构。显而易见,不同的阈值化方法也会得到不同的去噪效果。Donoho在文献[36]和文献[37]中分别提出了SureShrink阈值和VisuShrink阈值。文献[38]中,Portilla等人提出了贝叶斯最小二乘高斯尺度混合(Bayes Least Squares-Gaussian Scale Mixture, BLS-GSM),该方法的直观思想是将相邻位置和尺度的系数邻域建模为高斯尺度混合,而小波系数的更新采用贝叶斯最小二乘估计。在文献[39]中,Dabov等人提出了块匹配3维联合滤波(Block-Matching 3D, BM3D),是比较经典和优秀的算法。首先,2维有噪声的图像块被分割成具有相似局部结构的3维数据组,该过程即块匹配。3维是指3维变换,包括组内的2维变换(离散傅里叶、离散余弦或周期小波)和组间的1维变换(Haar小波)。BM3D在保留图像细节的同时对高斯噪声的去除有显著的效果,十几年来不断有研究者对它进行补充和优化[40–42]。
对于包含大量纹理特征的图像,小波变换无法达到最优逼近。脊波变换作为多尺度变换,具有识别和选择方向的能力,即线奇异性。但是直线奇异性在曲线的表达上仍然有限制,在此基础上又提出曲波变换。文献[43]提出一种基于曲波变换的去噪方法,对于具有光滑奇异性曲线的目标函数,曲波变换可以提供稳定而更加稀疏的表示。
下面给出了基于小波的算法与基于曲波算法的比较,对Lena图像进行去噪实验,在噪声强度σ =20时,峰值信噪比(PSNR)、均方误差(MSE)和平均绝对误差(MAE)的结果如表1所示。
可以看出,基于曲波的方法在去除噪声和抑制失真的方面都有更好的表现。而视觉处理结果如图2所示,可以看出基于小波方法的去噪结果中,曲线和边缘变得模糊,也验证了小波变换无法对曲线特征进行有效描述。基于曲波方法的去噪结果则较好地保留了细节特征。
表 1 基于小波方法和基于曲波方法对比
图 2 基于Wavelet和Curvelet去噪效果直观视觉对比
图像形式复杂多样,而上述的方法中基函数都是固定的,因此很难用其表征大部分图像。此外,当图像的表示系数和像素个数相等时,很容易产生振铃效应。因此利用过完备字典是十分必要的。文献[44]证明了过完备字典在去噪效果上优于以往的方法。而学习字典一经提出,便凭借优秀的性能迅速成为主流的研究方向。
文献[26]中提出的K-SVD方法中,待处理图像的每个图像块都可以由字典中的一系列原子表示,通过字典自适应学习具有良好的去噪效果。在此基础之上,文献[45]提出了局部学习字典(K-Local Learned Dictionary, K-LLD)。在K-SVD中,是对整个图像学习一个字典,但为了避免将不同结构的图像块视为相似的图像块,K-LLD中利用调整核回归(Steering Kernel Regression, SKR)进行局部几何结构的分类。文献[46]中Mairal等人提出了一种结构化字典学习方法:学习同步稀疏编码(Learned Simultaneous Sparse Coding, LSSC)。字典学习部分利用了邻域内的局部稀疏性,非局部均值(Non-Local Means, NLM)框架则利用了非局部稀疏性。在文献[47]中证明了与局部方法相比,使用非局部方法能获得更好的结果。文献[48]中Dong等人提出了另一个类似的框架,称之为基于聚类的稀疏表示
(Clustering-based Sparse Representation, CSR)。它将字典学习和结构聚类结合起来,在某些情况下去噪效果优于LSSC。文献[49]提出了一种非局部集中稀疏表示(Nonlocally Centralized Sparse Representation, NCSR),引入了稀疏编码噪声的概念,将图像优化的目标转化为如何抑制稀疏编码噪声。文献[50]介绍了一种结构化的稀疏编码框架,利用同步稀疏编码对高斯尺度混合模型进行了非局部扩展,提出了SSC-GSM算法。得益于其更好的空间适应能力,去噪效果上要优于以往的算法。文献[51]中Zha等人在组稀疏残差(Group Sparse Residual, GSR)模型的基础上使用非局部样本(Non-Local Samples, NLS)作为残差估计中的参考,提出GSR-NLS算法。该算法首先获得基于图像非局部自相似的组稀疏系数估计,然后通过有效的迭代收缩算法求解GSR模型。实验结果表明GSR-NLS不仅在去噪效果上优于大部分的技术方法,在处理速度上同样具有优势。
以文献[50]中的实验结果为例,在噪声强度σ =15时,比较上述经典算法的PSNR,如表2所示。由于篇幅有限,不再列出直观视觉结果的比较。
表 2 主流稀疏去噪方法PSNR对比(dB)
除了对于信号表示上的研究,重构算法的改进同样有着重要的意义。文献[52]提出压缩采样匹配追踪(Compressive Sampling Matching Pursuit,CoSaMP),文献[53]在OMP的基础上提出了广义匹配追踪(generalized Orthogonal Matching Pursuit, gOMP)。文献[54]提出了路径正交匹配追踪(Path Orthogonal Matching Pursuit, POMP),在每个跟踪迭代的识别阶段增加一个额外的步骤来增强OMP。具体方法是在每次迭代中,在与残差相关性最大的两个字典原子之间生成一条路径,并从这条路径中选择一个新原子,而新原子与残差的相关性比两个原子中的任何一个都大。实验证明该方法改进后的重构算法可以得到更好的稀疏重建和去噪性能。
3.1.2 实际应用
基于CS理论去噪技术的应用十分广泛,此处介绍具有代表性的几种,如图2所示。文献[55]介绍了在侧扫声呐(Side-Scan Sonar, SSS)图像去噪上的应用,主要特点在于针对的是设备和水下干扰结合而成的非均匀噪声以及保留自然海底纹理。文献[56]介绍了在低光(Low Light Level, LLL)图像上的应用,低光图像常见于显微图像和夜间监控上,噪声分布广而复杂。作者提出将空间局部结构约束引入稀疏编码,对LLL图像具有良好的去噪效果。文献[57]介绍了在高光谱图像(Hyper-Spectral Image, HSI)上的应用。HSI为多维信号,作者提出了一种非凸正则化低秩稀疏矩阵分解去噪方法,可以同时去除高斯噪声、脉冲噪声和条纹。文献[58]介绍了在磁共振图像(Magnetic Resonance Image,MRI)中的应用,提出了一种基于字典学习的多对比MRI重建框架,该框架不仅利用了基于图像块的稀疏性,而且利用了不同MRI对比之间的结构相似性具体应用如图3所示。
图 3 基于CS图像去去噪技术的应用
3.2 基于压缩感知的图像去模糊3.2.1 研究现状与方法
图像模糊是由拍摄对象和设备间的移动或者对焦不稳造成的,在图像退化中普遍存在。数学模型可以表示为
其中, B 表示模糊图像, I 表示清晰图像, K是点扩散函数(Point Spread Function, PSF),称之为模糊核。由于在模糊退化过程中可能受到噪声污染,n 代 表均值为0的高斯白噪声。⊗ 表示卷积运算,所以去模糊本质上是一个反卷积过程。根据PSF是否已知,可以把去模糊算法分为非盲去模糊和盲去模糊。
在非盲去模糊算法中,最具代表性的是维纳滤波和理查森露西算法(Richardson Lucy algorithm)[59,60],这两种反卷积方法都具有简单高效的特点,但是会带来明显的振铃效应。值得一提的是,在文献[61]中,Lou等人基于稀疏表示的思想,提出了一种无需反卷积而直接对模糊图像进行操作的方法。给定一组已知的图像稀疏基,不管是否模糊,稀疏系数都保持不变。在模糊核已知的前提下,将图像基与核 K进行卷积,对模糊图像进行稀疏编码,得到清晰图像。
在实际应用中,模糊核通常是未知的,因此盲去模糊的首要工作就是模糊核估计(blur kernel estimation)。文献[6]利用自然图像的梯度分布先验和复杂的机器学习算法进行核估计。然而,模糊图像中包含的丰富而具体的信息并没有被有效利用。在文献[62]中,提出了一种使用成对模糊噪声图像的冗余信息来估计核函数的方法。文献[63]中提出了一种多正则化混合约束的方法,利用TV与Shock滤波器对模糊核和图像进行建模,得到了很好的结果。
基于压缩感知的去模糊算法,其思想主要也体现在模糊核估计上。因为核估计在数学上同样是不适定问题,对其求唯一解就需要加以约束,即正则化。正则项的选择十分多样化,而稀疏约束由于可以得到稀疏解而被广泛使用。文献[64]从单幅模糊图像中学习字典进行稀疏表示,将稀疏系数作为正则项,求解优化问题进行核估计,最后反卷积重构图像,是经典的基于CS的步骤。文献[65]使用了图像块先验的正则化方法,即将图像块在特定字典图像上的稀疏性和多尺度非局部正则化作为约束条件,提出了一种基于稀疏表示和结构自相似性的盲去模糊方法。文献[66]提出了一种利用导数压缩感知的方法,在补偿欠采样伪影的同时,减小了计算复杂度。
除了图像自身内的稀疏性,为了利用多帧图像之间的冗余信息,基于多帧图像信息去模糊算法被提出(目前大部分文章中仅考虑两幅图像)。但是传统的多帧方法所提出的“交叉模糊(cross-blur)”正则项对噪声十分敏感,也容易导致解的不唯一性。为了解决该问题,文献[67]在此基础上加入了稀疏先验和平滑先验,文献[68]提出一种两步法,在得到模糊核后加入稀疏化的步骤来获取更稀疏的核估计。文献[69]利用稀疏先验信息将模糊图像、模糊核和噪声耦合成一个新的耦合正则项,同时达到去噪和去模糊的效果。
3.2.2 实际应用
这里同样举几个具有代表性的例子来介绍基于CS去模糊的应用。文献[70]介绍了在红外(infrared)图像上的CS去模糊算法,在平均结构相似性(Mean Structural SIMilarity, MSSIM)上有较好的表现。文献[71]的研究对象则是目前十分流行的2维码(QR code)图像。针对运动模糊2维码,利用黑白色块的特性,提出基于稀疏先验和 l0正则化的去模糊方法。文献[72]介绍了对文本(text)图像的盲去模糊方法,提出一种基于稀疏表示的文本图像先验模型,构建了基于文本的混合字典,得到显著的文本去模糊效果。具体应用如图4所示。
3.3 基于压缩感知的图像超分辨
3.3.1 研究现状与方法
图 4 基于CS图像模糊技术的应用
图像超分辨是利用低分辨率(Low Resolution,LR)图像的信息得到细节丰富的高分辨率(High Resolution, HR)图像的过程。目前主流的超分辨方法包括:基于插值(interpolation-based)的方法和基于学习(learning-based)的方法。基于插值是利用LR图像中的已知像素点,对重建HR图像未知位置的像素值进行估计,包括线性插值算法和非线性插值算法。该方法的缺点是对高频特征的重建较差。而基于学习的方法需要用大量数据来训练,成本较高而且经常导致过平滑重建。在这里不做过多阐述,感兴趣的读者可以查阅相关文献。
而基于CS的超分辨算法,则是利用了LR图像的稀疏性[73],训练过完备学习字典对LR图像进行稀疏表示,然后通过重构算法进行HR图像重构。文献[74]中作者通过选择合适的稀疏基和CS信号重构算法来获取HR图像,并加入一个模糊矩阵以增强稀疏矩阵和观测矩阵的非相干性,从而更好地保存图像边缘和纹理。文献[75]提出一种基于CS的超分辨方法,将主要过程分为两个阶段:训练阶段和重构阶段。在训练阶段,该算法通过训练一系列HR图像,利用K-SVD算法获得冗余字典进行操作;在重构阶段,利用基于冗余字典和 l1 同伦算法(l 1-homotopy)的CS理论来重建HR图像。文献[76]提出了一种改进的CS超分辨率算法,将SKR和NLM模型作为两个正则化项。采用SKR正则化降低局部平滑度,采用NLM正则化提高鲁棒性。在此基础上,提出了一种聚类子字典学习方案,以代替只学习一个冗余字典。该学习方案不仅提高了学习效率,而且为各种图像结构提供了自适应的子字典选择。文献[77]针对单一字典难以适应复杂多样的图像内容的缺点,提出利用k-均值(k-means)分类学习一组对应于不同内容复杂度的耦合字典,然后在超分辨率重建过程中,自适应地为每个输入的低分辨率图像块选择一个合适的匹配字典。
上述方法都是单图像超分辨。在多帧LR图像描述同一场景的情况下,可以通过亚像素级的位置对齐和配准来进行超分辨,称之为多帧超分辨。传统的多帧超分辨算法性能随着放大倍数的增大而减弱,因此逐渐被单图像方法所替代。但是帧间冗余信息仍然没有被利用起来。本文作者提出了一种基于CS的多帧超分辨算法[78],同时利用了LR图像内和图像间的稀疏性,利用多个LR字典中的原子来融合得到HR字典原子,进而得到完整的HR字典并重构HR图像。列进行基于CS超分辨的结果,对比的是经典的Bicubic插值方法和单帧CS方法。评价指标包括:信息熵和平均梯度。由于超分辨率工作最主要的目的是向图像中引入更多有用的信息,故衡量处理后图像中含有的信息量是一个测量各种方法超分辨能力的方式,因此利用图像的熵对图像中的信息量进行评估。另一种衡量超分辨率效果的评估方法是测量图像中的细节信息是否增加,而这通常用平均梯度来进行评价。可以看出多帧CS超分辨方法具有性能上的优势。
为了分析的全面性,除客观定量结果对比之外,直观视觉效果对比图5所示。
3.3.2 实际应用
基于CS的超分辨方法在许多领域发挥重要作用。文献[79]介绍了在人脸识别中的应用,在基于学习字典的方法基础上,引入非局部相似性(Non-Local Similarity, NLS)提升图像分辨率,提高识别算法性能。文献[80]介绍了在卫星图像中的应用,利用 l1范数正则化保存图像边缘,并使用了一种与TV近似的双侧滤波器来增加算法鲁棒性。文献[81]介绍了在CT图像中的应用,提出了一种基于稀疏编码和随机森林的快速低剂量CT超分辨方法。利用HR训练图像和LR训练图像获取高分辨率字典,并利用反投影保证全局一致性,最后利用稀疏编码提取融合低剂量CT图像中的有用信息,完成随机森林分类。文献[82]介绍了一种基于CS的超分辨率成像技术。将CS与二元纯相位环形滤波器相结合,其中压缩感知理论允许从少量捕获的样本中重建高分辨率的目标图像,而二元纯相位环形滤波器允许光学系统的分辨率提高到超过衍射极限。基于CS的图像超分辨技术的应用实例如图6所示。
表 3 多种超分辨方法的信息熵与平均梯度对比
4 当前存在问题与未来趋势
4.1 当前研究存在的问题
CS理论并不是单一的技术,而是一个整体的数学框架。将CS应用在各种工程技术上时,最终还是受限于理论本身的局限性。从目前的研究来看,基于CS的图像优化技术主要存在以下几个方面的问题:
(1) 先验信息的缺失问题。当缺少信号的先验信息时,CS的应用将遇到瓶颈。根据上文的介绍,CS得以适用的首要条件为待处理信号是具有稀疏性的。在理论分析时,仿真对象都是固定的图像集,但是在实际应用中,当第1次采集某类信号时,很难获取信号的先验信息。那么就要为验证信号的稀疏性付出计算与时间成本。
(2) 信号表示的效率问题。为某一类目标选择表示基时,很少考虑到是否是效率最高的。通过从固定基到过完备学习字典的演变,信号的表示基已经极大地增强了普适性,但是随之而来的问题便是过大的开销。如何在保障可靠性的同时提高有效性,是一个值得研究的问题。
图 5 基于多帧CS图像超分辨结果
图 6 基于CS图像超分辨技术的应用
(3) 观测矩阵的设计问题。现在的CS研究主要侧重点在于信号表示和重构算法的改进,从3.1.1小节的介绍中就可窥知一二。而在观测矩阵的设计上却有巨大的空白需要填补。尽管观测矩阵受到RIP的限制需要对稀疏矩阵进行迁就,但是仍存在不小的研究空间。
(4) 研究力度的消退问题。自深度学习问世以来,几乎得到了全世界学术圈的关注。深度学习的快速发展得益于图形处理器(Graphics Processing Unit, GPU)的强大计算能力,也的确在复杂度很大的任务上有明显的优势。因此,基于深度学习的图像优化技术取得了巨大的成功,深受工业界的欢迎,至今仍保持着相当高的热度。此消彼长,学界对于CS的研究明显放缓了脚步。但是深度学习是一个黑匣子,为什么性能卓越,目前还没有一个明确的数学解释。而且其本质上离不开样本训练,这将迟早约束它自身的发展[83]。希望学界忌浮躁之风,研究更加严谨的具有数学理论保证的算法。
4.2 未来研究的方向与趋势
综上所述,基于CS的图像优化技术在取得巨大进展的同时,也面临着不小的挑战。未来值得关注的研究方向有以下几个方面:
(1) 扩展先验信息。除稀疏性之外,开发其他可被CS接受的先验信息,最好在图形学上是更加直观和易得。因为成像设备和成像技术千差万别,引入更加灵活的先验在数学上和工程上都具有很大意义。
(2) 设计RIP验证系统。在实际的工业应用中,数学上直接验证RIP几乎是不可能的,因此RIP验证系统的设计将是工业CS技术的关键。思路可以是将几何形状、振幅、相位以及频率进行随机编码等等。
(3) 继续在应用场景使用CS理论。目前大部分的研究基于各种图像模型,直接将CS理论用于实际场景的研究只占二到三成。可喜的是,在生物和医学图像(大部分都是直接采集而且成像模式复杂,难以数学归纳)中已经有所突破,继续在其他领域探索仍有巨大价值。
(4) 研究图像处理CS理论。目前的研究只是将图像作为信号的一种,基于CS的图像处理技术与基于CS的很多信号处理技术十分相近。但是图像优化作为逆问题的一种,在求解上存在独特之处,开发图像专用CS分支理论,有望可以进一步提升性能。
5 结束语
纵观计算机技术与电子信息工程技术的发展史,以图像信号为对象的研究已经积累了深厚的底蕴,从图像压缩、图像传输到图像优化,取得了大量的杰出成果,同时也不断与其他领域的技术进行贯通与融合,为研究者们提供了新的灵感与思路。压缩感知是近几年仍活跃在学界研究前沿的理论,基于压缩感知的图像优化作为图像优化重要的组成部分之一,亦取得了长足的进步。本文分别从去噪、去模糊和超分辨3个方面探讨了CS优化技术的研究现状、方法和应用,并分析了存在的问题和下一步的研究思路。尽管面临诸多挑战,但是笔者坚信CS理论将继续在工程和科学领域产生重大影响,同时希望本文对未来的图像优化技术研究起到一定的指导作用。
参 考 文 献
[1]BANHAM M R and KATSAGGELOS A K. Digital image restoration[J]. IEEE Signal Processing Magazine, 1997,14(2): 24–41. doi: 10.1109/79.581363.
[2]JIANG Jielin, ZHANG Lei, and YANG Jian. Mixed noise removal by weighted encoding with sparse nonlocal regularization[J]. IEEE Transactions on Image Processing,2014, 23(6): 2651–2662. doi: 10.1109/TIP.2014.2317985.
[3]RODRÍGUEZ P, ROJAS R, and WOHLBERG B. Mixed Gaussian-impulse noise image restoration via total variation[C]. 2012 IEEE International Conference on Acoustics, Speech and Signal Processing, Kyoto, Japan,2012: 1077–1080. doi: 10.1109/ICASSP.2012.6288073.
[4]ZHANG Jian, XIONG Ruiqin, ZHAO Chen, et al.Exploiting image local and nonlocal consistency for mixed Gaussian-impulse noise removal[C]. 2012 IEEE International Conference on Multimedia and Expo, Melbourne, Australia,2012: 592–597. doi: 10.1109/ICME.2012.109.
[5]CAI Jianfeng, CHAN R H, and NIKOLOVA M. Two-phase approach for deblurring images corrupted by impulse plus Gaussian noise[J]. Inverse Problems and Imaging, 2008,2(2): 187–204. doi: 10.3934/ipi.2008.2.187.
[6]FERGUS R, SINGH B, HERTZMANN A, et al. Removing camera shake from a single photograph[J]. ACM Transactions on Graphics, 2006, 25(3): 787–794. doi:10.1145/1141911.1141956.
[7]SHAN Qi, JIA Jiaya, and AGARWALA A. High-quality motion deblurring from a single image[J]. ACM Transactions on Graphics, 2008, 27(3): 73. doi: 10.1145/1360612.1360672.
[8]ZHENG Shicheng, XU Li, and JIA Jiaya. Forward motion deblurring[C]. 2013 IEEE International Conference on Computer Vision, Sydney, Australia, 2013: 1465–1472. doi:10.1109/ICCV.2013.185.
[9]GLASNER D, BAGON S, and IRANI M. Super-resolution from a single image[C]. The 2009 IEEE 12th International Conference on Computer Vision, Kyoto, Japan, 2009:349–356. doi: 10.1109/ICCV.2009.5459271.
[10]PARK S C, PARK M K, and KANG M G. Super-resolution image reconstruction: A technical overview[J]. IEEE Signal Processing Magazine, 2003, 20(3): 21–36. doi: 10.1109/MSP.2003.1203207.
[11]YANG Jianchao, WRIGHT J, HUANG T S, et al. Image super-resolution via sparse representation[J]. IEEE Transactions on Image Processing, 2010, 19(11): 2861–2873.doi: 10.1109/TIP.2010.2050625.
[12]CHEN Yongyong, GUO Yanwen, WANG Yongli, et al.Denoising of hyperspectral images using nonconvex low rank matrix approximation[J]. IEEE Transactions on Geoscience and Remote Sensing, 2017, 55(9): 5366–5380. doi:10.1109/TGRS.2017.2706326.
[13]MANJÓN J V, CARBONELL-CABALLERO J, LULL J J,et al. MRI denoising using non-local means[J]. Medical Image Analysis, 2008, 12(4): 514–523. doi: 10.1016/j.media.2008.02.004.
[14]PENG Yigang, GANESH A, WRIGHT J, et al. RASL:Robust alignment by sparse and low-rank decomposition for linearly correlated images[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2012, 34(11): 2233–2246.doi: 10.1109/TPAMI.2011.282.
[15]WANG Naiyan and YEUNG D Y. Bayesian robust matrix factorization for image and video processing[C]. 2013 IEEE International Conference on Computer Vision, Sydney,Australia, 2013: 1785–1792. doi: 10.1109/ICCV.2013.224.
[16]DONOHO D L. Compressed sensing[J]. IEEE Transactions on Information Theory, 2006, 52(4): 1289–1306. doi:10.1109/TIT.2006.871582.
[17]CANDES E J, ROMBERG J, and TAO T. Robust uncertainty principles: Exact signal reconstruction from highly incomplete frequency information[J]. IEEE Transactions on Information Theory, 2006, 52(2): 489–509.doi: 10.1109/TIT.2005.862083.
[18]CANDES E J and TAO T. Near-optimal signal recovery from random projections: Universal encoding strategies?[J].IEEE Transactions on Information Theory, 2006, 52(12):5406–5425. doi: 10.1109/TIT.2006.885507.
[19]MALLAT S G. A Wavelet Tour of Signal Processing[M].San Diego, USA: Academic Press, 1999: 263-376.
[20]CANDÈS E J and DONOHO D L. Ridgelets: A key to higher-dimensional intermittency?[J]. Philosophical Transactions of the Royal Society B, 1999, 357(1760):2495–2509. doi: 10.1098/rsta.1999.0444.
[21]CANDES E J and DONOHO D L. Curvelets,multiresolution representation, and scaling laws[J]. SPIE,2000, 4119: 1–12. doi: 10.1117/12.408568.
[22]DONOHO D L. Wedgelets: Nearly minimax estimation of edges[J]. The Annals of Statistics, 1999, 27(3): 859–897. doi:10.1214/aos/1018031261.
[23]DO M N and VETTERLI M. The contourlet transform: An efficient directional multiresolution image representation[J].IEEE Transactions on Image Processing, 2005, 14(12):2091–2106. doi: 10.1109/TIP.2005.859376.
[24]PENNEC L E and MALLAT S. Bandelet representations for image compression[C]. The 2001 International Conference on Image Processing, Thessaloniki, Greece, 2001:12. doi: 10.1109/ICIP.2001.958939.
[25]ELAD M and AHARON M. Image denoising via sparse and redundant representations over learned dictionaries[J]. IEEE Transactions on Image Processing, 2006, 15(12): 3736–3745.doi: 10.1109/TIP.2006.881969.
[26]AHARON M, ELAD M, and BRUCKSTEIN A. K-SVD: An algorithm for designing overcomplete dictionaries for sparse representation[J]. IEEE Transactions on Signal Processing,2006, 54(11): 4311–4322. doi: 10.1109/TSP.2006.881199.
[27]CANDES E J and TAO T. Decoding by linear programming[J]. IEEE Transactions on Information Theory, 2005, 51(12): 4203–4215. doi: 10.1109/TIT.2005.858979.
[28]CANDES E J and WAKIN M B. An introduction to compressive sampling[J]. IEEE Signal Processing Magazine,2008, 25(2): 21–30. doi: 10.1109/MSP.2007.914731.
[29]CANDÈS E J. The restricted isometry property and its implications for compressed sensing[J]. Comptes Rendus Mathematique, 2008, 346(9/10): 589–592. doi: 10.1016/j.crma.2008.03.014.
[30]LIU Xinji, XIA Shutao, and DAI Tao. Deterministic constructions of binary measurement matrices with various sizes[C]. 2015 IEEE International Conference on Acoustics,Speech and Signal Processing, Brisbane, Australia, 2015:3641–3645. doi: 10.1109/ICASSP.2015.7178650.
[31]BRUCKSTEIN A M, DONOHO D L, and ELAD M. From sparse solutions of systems of equations to sparse modeling of signals and images[J]. SIAM Review, 2009, 51(1): 34–81.doi: 10.1137/060657704.
[32]TROPP J A and GILBERT A C. Signal recovery from random measurements via orthogonal matching pursuit[J].IEEE Transactions on Information Theory, 2007, 53(12):4655–4666. doi: 10.1109/tit.2007.909108.
[33]RUDIN L I, OSHER S, and FATEMI E. Nonlinear total variation based noise removal algorithms[J]. Physica D:Nonlinear Phenomena, 1992, 60(1/4): 259–268. doi:10.1016/0167-2789(92)90242-F.
[34]FRIEDMAN N and RUSSELL S. Image segmentation in video sequences: A probabilistic approach[C]. The 13th Conference on Uncertainty in Artificial Intelligence,Providence, USA, 1997: 175–181.
[35]VETTERLI M and KOVACEVIC J. Wavelets and Subband Coding[M]. Englewood Cliffs, USA: Prentice Hall,1995: 414–445.
[36]DONOHO D L. De-noising by soft-thresholding[J]. IEEE Transactions on Information Theory, 1995, 41(3): 613–627.doi: 10.1109/18.382009.
[37]DONOHO D L and JOHNSTONE J M. Ideal spatial adaptation by wavelet shrinkage[J]. Biometrika, 1994, 81(3):425–455. doi: 10.1093/biomet/81.3.425.
[38]PORTILLA J, STRELA V, WAINWRIGHT M J, et al.Image denoising using scale mixtures of Gaussians in the wavelet domain[J]. IEEE Transactions on Image Processing, 2003, 12(11): 1338–1351. doi: 10.1109/TIP.2003.818640.
[39]DABOV K, FOI A, KATKOVNIK V, et al. Image denoising by sparse 3-D transform-domain collaborative filtering[J]. IEEE Transactions on Image Processing, 2007,16(8): 2080–2095. doi: 10.1109/TIP.2007.901238.
[40]SANTOS C A N, MARTINS D L N, and MASCARENHAS N D A. Ultrasound image despeckling using stochastic distance-based BM3D[J]. IEEE Transactions on Image Processing, 2017, 26(6): 2632–2643. doi: 10.1109/TIP.2017.2685339.
[41]LI Yingjiang, ZHANG Jiangwei, and WANG Maoning.Improved BM3D denoising method[J]. IET Image Processing, 2017, 11(12): 1197–1204. doi: 10.1049/ietipr.2016.1110.
[42]SICA F, COZZOLINO D, ZHU Xiaoxiang, et al. InSARBM3D: A nonlocal filter for SAR interferometric phase restoration[J]. IEEE Transactions on Geoscience and Remote Sensing, 2018, 56(6): 3456–3467. doi:10.1109/TGRS.2018.2800087.
[43]QIAO Tong, REN Jinchang, WANG Zheng, et al. Effective denoising and classification of hyperspectral images using curvelet transform and singular spectrum analysis[J]. IEEE Transactions on Geoscience and Remote Sensing, 2017,55(1): 119–133. doi: 10.1109/TGRS.2016.2598065.
[44]MAIRAL J, ELAD M, and SAPIRO G. Sparse representation for color image restoration[J]. IEEE Transactions on Image Processing, 2008, 17(1): 53–69. doi:10.1109/TIP.2007.911828.
[45]CHATTERJEE P and MILANFAR P. Clustering-based denoising with locally learned dictionaries[J]. IEEE Transactions on Image Processing, 2009, 18(7): 1438–1451.doi: 10.1109/TIP.2009.2018575.
[46]MAIRAL J, BACH F, PONCE J, et al. Non-local sparse models for image restoration[C]. The 12th IEEE International Conference on Computer Vision, Kyoto,Japan, 2009: 2272–2279. doi: 10.1109/ICCV.2009.5459452.
[47]KATKOVNIK V, FOI A, EGIAZARIAN K, et al. From local kernel to nonlocal multiple-model image denoising[J].International Journal of Computer Vision, 2010, 86(1): 1.doi: 10.1007/s11263-009-0272-7.
[48]DONG Weisheng, LI Xin, ZHANG Lei, et al. Sparsity-based Image denoising via dictionary learning and structural clustering[C]. CVPR 2011, Providence, USA, 2011: 457–464.doi: 10.1109/CVPR.2011.5995478.
[49]DONG Weisheng, ZHANG Lei, SHI Guangming, et al.Nonlocally centralized sparse representation for image restoration[J]. IEEE Transactions on Image Processing,2013, 22(4): 1620–1630. doi: 10.1109/TIP.2012.2235847.
[50]DONG Weisheng, SHI Guangming, MA Yi, et al. Image restoration via simultaneous sparse coding: Where structured sparsity meets Gaussian scale mixture[J].International Journal of Computer Vision, 2015, 114(2/3):217–232. doi: 10.1007/s11263-015-0808-y.
[51]ZHA Zhiyuan, ZHANG Xinggan, WANG Qiong, et al.Group sparsity residual with non-local samples for image denoising[C]. 2018 IEEE International Conference on Acoustics, Speech and Signal Processing, Calgary, Canada,2018: 1353–1357. doi: 10.1109/ICASSP.2018.8461388.
[52]NEEDELL D and TROPP J A. CoSaMP: Iterative signal recovery from incomplete and inaccurate samples[J]. Applied and Computational Harmonic Analysis, 2009, 26(3):301–321. doi: 10.1016/j.acha.2008.07.002.
[53]WANG Jian, KWON S, and SHIM B. Generalized orthogonal matching pursuit[J]. IEEE Transactions on Signal Processing, 2012, 60(12): 6202–6216. doi:10.1109/tsp.2012.2218810.
[54]EMERSON T H, OLSON C C, and DOSTER T. Pathbased dictionary augmentation: A framework for improving k -sparse image processing[J]. IEEE Transactions on Image Processing, 2020, 29: 1259–1270. doi: 10.1109/TIP.2019.2927331.
[55]JIN Y, KU B, AHN J, et al. Nonhomogeneous noise removal from side-scan sonar images using structural sparsity[J].IEEE Geoscience and Remote Sensing Letters, 2019, 16(8):1215–1219. doi: 10.1109/LGRS.2019.2895843.
[56]HAN Jing, YUE Jiang, ZHNAG Yi, et al. Local sparse structure denoising for low-light-level image[J]. IEEE Transactions on Image Processing, 2015, 24(12): 5177–5192.doi: 10.1109/TIP.2015.2447735.
[57]XIE Ting, LI Shutao, and SUN Bin. Hyperspectral images denoising via nonconvex regularized low-rank and sparse matrix decomposition[J]. IEEE Transactions on Image Processing, 2020, 29: 44–56. doi: 10.1109/TIP.2019.2926736.
[58]SONG Pingfan, WEIZMAN L, MOTA J F C, et al.Coupled dictionary learning for multi-contrast MRI reconstruction[C]. The 25th IEEE International Conference on Image Processing, Athens, Greece, 2018: 2880–2884. doi:10.1109/ICIP.2018.8451341.
[59]RICHARDSON W H. Bayesian-based iterative method of image restoration[J]. Journal of the Optical Society of America, 1972, 62(1): 55–59. doi: 10.1364/JOSA.62.000055.
[60]LUCY L B. An iterative technique for the rectification of observed distributions[J]. Astronomical Journal, 1974, 79:745–754. doi: 10.1086/111605.
[61]LOU Yifei, BERTOZZI A L, and SOATTO S. Direct sparse deblurring[J]. Journal of Mathematical Imaging and Vision,2011, 39(1): 1–12. doi: 10.1007/s10851-010-0220-8.
[62]YUAN Lu, SUN Jian, QUAN Long, et al. Image deblurring with blurred/noisy image pairs[J]. ACM Transactions on Graphics, 2007, 26(3): 1. doi: 10.1145/1276377.1276379.
[63]唐述, 谢显中. 多正则化混合约束的模糊图像盲复原方法[J].电子与信息学报, 2015, 37(4): 770–776. doi: 10.11999/JEIT 140949.TANG Shu and XIE Xianzhong. Multi-regularization hybrid constraints method for blind image restoration[J]. Journal of Electronics & Information Technology, 2015, 37(4):770–776. doi: 10.11999/JEIT140949.
[64]HU Zhe, HUANG Jiabin, and YANG M H. Single image deblurring with adaptive dictionary learning[C]. The 2010 IEEE International Conference on Image Processing, Hong Kong, China, 2010: 1169–1172. doi: 10.1109/ICIP.2010.5651892.
[65]YU Jing, CHANG Zhenchun, XIAO Chuangbai, et al. Blind image deblurring based on sparse representation and structural self-similarity[C]. 2017 IEEE International Conference on Acoustics, Speech and Signal Processing,New Orleans, USA, 2017: 1328–1332. doi: 10.1109/ICASSP.2017.7952372.
[66]ROSTAMI M, MICHAILOVICH O, and WANG Zhou.Image deblurring using derivative compressed sensing for optical imaging application[J]. IEEE Transactions on Image Processing, 2012, 21(7): 3139–3149. doi: 10.1109/TIP.2012.2190610.
[67]CHEN Jia, YUAN Lu, TANG C K, et al. Robust dual motion deblurring[C]. 2008 IEEE Conference on Computer Vision and Pattern Recognition, Anchorage, USA, 2008:1–8. doi: 10.1109/CVPR.2008.4587830.
[68]ZHU Xiang, ŠROUBEK F, and MILANFAR P.Deconvolving PSFs for a better motion deblurring using multiple images[C]. The 12th European Conference on Computer Vision, Florence, Italy, 2012: 636–647. doi:10.1007/978-3-642-33715-4_46.
[69]ZHANG Haichao, WIPF D, and ZHANG Yanning. Multiimage blind deblurring using a coupled adaptive sparse prior[C]. 2013 IEEE Conference on Computer Vision and Pattern Recognition, Portland, USA, 2013: 1051–1058. doi:10.1109/CVPR.2013.140.
[70]XIANG Fengtao, HUANG Yumin, GU Xueqiang, et al. A restoration method of infrared image based on compressive sampling[C]. The 8th International Conference on Intelligent Human-machine Systems and Cybernetics,Hangzhou, China, 2016: 493–496. doi: 10.1109/IHMSC.2016.98.
[71]ZHANG Yan, PU Haitao, and LIAN Jian. Quick response barcode deblurring via l0-regularisation based sparse optimisation[J]. IET Image Processing, 2019, 13(8):1254–1258. doi: 10.1049/iet-ipr.2018.5738.
[72]LEE H, JUNG C, and KIM C. Blind deblurring of text images using a text-specific hybrid dictionary[J]. IEEE Transactions on Image Processing, 2020, 29: 710–723. doi:10.1109/TIP.2019.2933739.
[73]吴敏, 邢孟道, 张磊. 基于压缩感知的二维联合超分辨ISAR成像算法[J]. 电子与信息学报, 2014, 36(1): 187–193. doi:10.3724/SP.J.1300.2012.20093.WU Min, XING Mengdao, and ZHANG Lei. Two dimensional joint super-resolution ISAR imaging algorithm based on compressive sensing[J]. Journal of Electronics &Information Technology, 2014, 36(1): 187–193. doi:10.3724/SP.J.1300.2012.20093.
[74]DEKA B, GORAIN K K, KALITA N, et al. Single image super-resolution using compressive sensing with learned overcomplete dictionary[C]. The 2013 4th National Conference on Computer Vision, Pattern Recognition,Image Processing and Graphics, Jodhpur, India, 2013: 1–5.doi: 10.1109/NCVPRIPG.2013.6776176.
[75]SUN Yicheng, GU Guohua, SUI Xiubao, et al. Single image super-resolution using compressive sensing with a redundant dictionary[J]. IEEE Photonics Journal, 2015, 7(2): 6900411.doi: 10.1109/JPHOT.2015.2409063.
[76]SUN Yicheng, GU Guohua, SUI Xiubao, et al. Compressive superresolution imaging based on local and nonlocal regularizations[J]. IEEE Photonics Journal, 2016, 8(1):
6900112. doi: 10.1109/JPHOT.2016.2516251.
[77]XIAO Aoran, SHAO Zhenfeng, and WANG Zhongyuan.Sparse coding for super-resolution via K-means classification[C]. 2017 IEEE International Conference on Multimedia & Expo Workshops, Hong Kong, China, 2017:363–368. doi: 10.1109/ICMEW.2017.8026254.
[78]ZHOU Ruofei, WANG Gang, ZHAO Donglai, et al. Superresolution of low-quality images based on compressed sensing and sequence information[C]. The 90th IEEE Vehicular Technology Conference, Honolulu, USA,2019: 1–5. doi: 10.1109/VTCFall.2019.8891073.
[79]LIAO Haibin, DAI Wenhua, ZHOU Qianjin, et al. Non-local similarity dictionary learning based face super-resolution[C].The 12th International Conference on Signal Processing,Hangzhou, China, 2014: 88-93. doi: 10.1109/ICOSP.2014.7014975.
[80]RANA S, SINGH H, and KUMAR A. Comparative analysis of single and multi frame super resolution in satellite imagery[C]. 2018 IEEE International Geoscience and Remote Sensing Symposium, Valencia, Spain, 2018:7220–7223. doi: 10.1109/IGARSS.2018.8517329.
[81]GU Peijian and ZHENG Lin. Fast low-dose computed tomography image super-resolution reconstruction via sparse coding and random forests[C]. The 8th IEEE Joint International Information Technology and Artificial Intelligence Conference, Chongqing, China, 2019:1400–1403. doi: 10.1109/ITAIC.2019.8785482.
[82]SUN Yicheng, GU Guohua, SUI Xiubao, et al. Superresolution imaging using compressive sensing and binary pure-phase annular filter[J]. IEEE Photonics Journal, 2017,9(3): 7802409. doi: 10.1109/JPHOT.2017.2696519.
[83]MARCUS G. Deep learning: A critical appraisal[J]. arXiv:1801.00631, 2018.
Research on Image Optimization Technology Based on Compressed Sensing
WANG Gang ZHOU Ruofei ZOU Yikun
(School of Electronics and Information Engineering, Harbin Institute of Technology, Harbin 150001, China)
Abstract: Compressed Sensing (CS) theory is one of the most active research fields in electronic information engineering. CS theory overcomes the limits dictated by Nyquist sampling theorem. Compared to the required minimum sampling quantity, CS proves that the original signal can be restored with high probability by fewer measurements, which saves the time cost of data acquisition and processing without losing information features.CS theory can essentially be regarded as a tool for dealing with linear signal recovery problems, so it has obvious advantages in solving inverse problems of signals and images. Image degradation is one of them, and the process of restoring high-quality images is image optimization. In order to promote the academic research and practical application of CS theory, the basic principle of CS is introduced. Based on the previous research,this paper studies on CS-based image optimization technology in three main aspects: denoising, deblurring and super resolution. Finally, the problems and challenges are discussed, and the current trends are analyzed to provide reference and help for future work.
Key words: Image processing; Compressed Sensing (CS); Image denoising; Image deblurring; Super resolution
中图分类号:TN911.73
文献标识码:A
文章编号:1009-5896(2020)01-0222-12
DOI: 10.11999/JEIT190669
收稿日期:2019-09-02;改回日期:2019-11-19;网络出版:2019-11-28
*通信作者: 王钢 gwang51@hit.edu.cn
基金项目:国家自然科学基金(61671184, 61401120),国家科技重大专项(2015ZX03001041)
Foundation Items: The National Natural Science Foundation of China (61671184, 61401120), The National Science and Technology Major Project (2015ZX03001041)
王 钢:男,1962年生,教授,博士生导师,主要研究方向为数据通信、物理层网络编码、通信网理论与技术.
周若飞:男,1989年生,博士生,研究方向为压缩感知与图像处理、压缩感知与网络编码.
邹昳琨:男,1992年生,博士生,研究方向为多无人机通信网络性能优化.
|
|