张量投票在图像修复中的应用
基于张量秩校正的图像恢复方法

基于张量秩校正的图像恢复方法作者:白敏茹黄孝龙顾广泽赵雪莹来源:《湖南大学学报·自然科学版》2016年第10期摘要:针对医学图像和视频图像的恢复问题,基于张量表示,研究有限样本下的低秩张量数据恢复问题,在张量奇异值分解(t-SVD)理论的基础上,提出了张量秩校正模型和两阶段张量秩校正方法,第一阶段是用张量核范数最小化模型求得预估解,第二阶段,根据预估解,求解张量秩校正模型,获得更高精度的解.构建了求解张量秩校正模型和张量核范数最小化模型的张量近似点算法,使得可以在实数域上对张量直接进行计算,并且从理论上证明了该算法的收敛性.通过对医学图像和视频图像的数值仿真实验,验证了本文所提出模型和方法的有效性,实验结果显示,张量秩校正模型和方法能够取得更高的恢复精度.关键词:图像恢复;张量奇异值分解;张量秩校正;张量近似点算法中图分类号:TP751 文献标识码:A文章编号:1674-2974(2016)10-0148-07Abstract:Tensor-based restoration of medical images and video images was studied with limited samples. On the basis of the theory of tensor singular value decomposition (t-SVD), a tensor rank-correction model (CRTNN) was proposed to correct the tensor nuclear norm minimization model (TNN). A two-stage rank correction method is given as follows: the first stage is used to generate a pre-estimator by solving the TNN model, and the second stage is to solve the CRTNN model to generate a high-accuracy recovery by the pre-estimator. A tensor proximal point algorithm was proposed to solve the CRTNN model and the TNN model, making it possible to calculate tensor directly in the real field. The convergence of the algorithm was proved in theory. Numerical experiments of medical images and video images verify the efficiency of the proposed model and method. The experiment results show that tensor rank-correction model and method can achieve higher-accuracy recovery.Key words:image restoration;t-SVD; tensor rank-correction model; tensor proximal point algorithm随着电子技术和成像技术的发展,从医学图像到遥感图像,从导弹精确制导,到人脸识别及指纹识别再到具有视觉功能的智能机器人,人类活动的方方面面都会产生或涉及到大量的高维图像.高维图像已经成为一种重要的多媒体形式,广泛存在于人们的日常生活中.图像在形成,传输和记录的过程中受多种因素的影响,图像的质量会有所下降,典型表现为色彩模糊和有噪声干扰等.这一降质的过程被称为图像的退化.图像恢复的目的就是尽可能地恢复退化了的高维图像的本来面目.传统的图像处理方法是基于向量和矩阵的表示形式,往往破坏了这些数据的原始空间结构,在分析过程中不能够很好地刻画这些数据的本质和充分挖掘其内部特性.张量作为向量和矩阵表示的高阶推广,能够更好地表达高阶数据复杂的本质结构,已被广泛应用于计算机视觉与图像、人脸识别、医学图像和统计信号处理等研究领域中[1-6].高维图像数据往往具有低维属性,张量完备化问题就是利用张量数据的低秩结构,是一种在有限样本或测量数据下最小化张量的秩的优化问题.最小化张量的秩是NP难问题,通常的处理方法有:1)将张量转化成矩阵,然后求解矩阵完备化问题[7];2)用特殊的张量分解方法来分解张量,如CANDECOMP/PARA-FAC(CP)分解,Tucker分解等方法.由于矩阵的核范数是矩阵秩的紧的凸逼近,因此对矩阵完备化问题的求解一般是将其转化为矩阵核范数最小化问题求解.对矩阵核范数最小化问题的求解有近似点算法(PPA)[8],交替方向方法(ADM),加速近似梯度方法(APG)[9].虽然低秩矩阵完备化问题得到很好发展,但张量完备化问题研究还很不完善.不同于矩阵秩只有一种定义,张量秩有多种定义.传统上主要有两种张量秩的定义,CP秩和Tucker秩,它们分别是基于CP分解和 Tucker分解的.将张量展开成矩阵,利用展开矩阵性质近似逼近张量的秩,是常用的处理方法.例如:Gandy[2]等用各片分别展开矩阵的核范数的和作为张量秩的近似逼近;Liu[5]等进一步将各片分别展开矩阵的核范数通过加权来近似张量的秩,并提出了HaLTRC算法求解该松弛模型(TSN).然而这两种逼近方法并不是张量秩函数的最紧的凸逼近[7].Kilmer等[10]基于快速傅里叶变换可以将块循环矩阵对角化的思想,提出了张量奇异值分解(T-SVD)方法,使得张量可以在傅里叶变换下实现快速分解.基于T-SVD, Semerci等[6]提出张量核范数概念,对于3阶张量,利用张量核范数近似逼近张量的秩,建立了张量核范数最小化模型(TNN),构建了交替方向方法(ADMM)求解该模型,并应用于多线性数据的图像压缩和恢复,通过对比,TNN逼近比TSN逼近效果更好.但是该文没有给出ADMM方法的收敛性结果,文中的ADMM算法一部分在实数域上计算,一部分在复数域上计算.与以往模型不一样,TNN模型的目标变量是定义在复数域即傅里叶域内的矩阵,约束变量是定义在实数域的.因此,根据这个问题的特点,设计更加有效的具有收敛性的优化算法,是亟需解决的一个问题.另外,文献[11]指出,矩阵核范数在某些情况下不是矩阵秩的最紧凸逼近,如对角元素被高度样本化,则矩阵核范数最小化模型求解低秩恢复问题的能力就会高度弱化,而矩阵核范数是张量核范数(TNN)的二阶形式.本文针对以上两个问题开展研究,主要贡献有两个:一是提出了张量秩校正模型(CRTNN)和两阶段张量秩校正方法,二是构建了张量近似点算法,用于求解CRTNN模型和TNN模型,从理论上证明了该算法的收敛性.仿真实验验证了本文所提出模型和方法的有效性.结果显示,在医学图像以及视频图像的恢复问题中,张量秩校正方法能够取得更高的恢复精度.图1为医学图像和视频图像原始图像.图2,图3分别为医学图像和视频图像在样本率为20%(即有效信息只有20%)的情况时用TSN模型,TNN模型,CRTNN模型视觉恢复效果对比,从图2,图3的PSNR值对比和视觉恢复效果对比中,可以发现本文提出的CRTNN模型能得到更好的恢复效果.图4分别为医学图像和视频图像在TSN模型,TNN模型,CRTNN模型下对不同样本率得到的相对误差曲线对比.从中可以明显看出:本文提出的张量秩校正方法对不同的样本率得到的恢复图像的相对误差曲线都是最低的,表明本文提出的CRTNN模型能够取得更高精度的恢复效果.5 结论针对高维图像恢复问题,本文提出了张量秩校正模型和两阶段张量秩校正方法,并提出了求解张量秩校正模型的张量近似点算法,从理论上分析了该算法的收敛性.仿真结果验证了本文所提出模型和方法的有效性,结果表明,张量秩校正方法模型能够取得更高的恢复精度.能否将该模型和算法推广到四阶及以上的图像恢复问题?这个问题值得进一步研究.参考文献[1] ELY G, AERON S, MILLER E L. Exploiting structural complexity for robust and rapid hyper spectral imaging [C]//Proceedings of IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2013:2193-2197.[2] GANDY S, RECHT B, YAMADA I. Tensor completion and low-n-rank tensor recovery via convex optimization [J]. Inverse Problems, 2011, 27(2): 025010.[3] HAO N H, KILMER M E, BRAMAN K, et al. Facial recognition with tensor-tensor decompositions [J]. SIAM Journal on Imaging Sciences, 2013, 6(1): 437-463.[4] KILMER M, BRAMAN K, HAO N,et al. Third-order tensors as operators on matrices: A theoretical and computational framework with applications in imaging [J]. SIAM Journal on Matrix Analysis and Applications, 2013, 34(1):148-172.[5] LIU J, MUSIALSKI P, WONKA P, et al. Tensor completion for estimating missing values in visual data [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2013,35(1): 208-220.[6] SEMERCI O, HAO N, KILMER M E,et al. Tensor-based formulation and nuclear norm regularization for multienergy computed tomography [J]. IEEE Transaction on Image Processing,2014, 23(4): 1678-1693.[7] MU C, HUANG B, WRIGHT J,et al. Square deal: Lower bounds and improved relaxations for tensor recovery [C]//Proceedings of the 31st International Conference on Machine Learning (ICML-14), 2014, 32(1): 73-81.[8] HE B S, YUAN X M, ZHANG W X.A customized proximal point algorithm for convex minimization with linear constraints [J]. Computational Optimization and Applications, 2013, 56(3): 559-572.[9] TOH K C, YUN S. An accelerated proximal gradient algorithm for nuclear norm regularized least squares problems [J]. Pacific Journal of Optimization, 2010, 6(3): 615-640.[10]KILMER M E, MARTIN C D. Factorization strategies for third-order tensors[J]. Linear Algebra and its Applications, 2011, 435(3):641-658.[11]MIAO W, PAN S, SUN D. A rank-corrected procedure for matrix completion with fixed basis coefficients [J]. Math. Programming,2016,159(1):289-338.[12]ZHANG Z, ELY G, AERON S,et al. Novel methods for multilinear data completion and de-noising based on tensor-SVD [C]// In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2014, 3842-3849.[13]CAI J F, CANDES E J, SHEN Z. A singular value thresholding algorithm for matrix completion [J]. SIAM Journal on Optimization, 2010, 20(4): 1956-1982.。
数字图像处理 张量分解的概念、发展及其应用

数字图像处理张量分解的概念、发展及其应用数字图像处理是一项涉及计算机科学、数学和物理学等多个领域的交叉学科,涉及到许多复杂的算法和技术。
其中,张量分解作为一种重要的图像处理技术,已经被广泛应用于各个领域,如医学图像分析、视频处理、图像分类、模式识别等。
本文旨在介绍张量分解的概念、发展及其应用。
1. 张量分解的概念张量是一个多维数组,可以表示一个向量、矩阵及高维矩阵和数组。
在图像处理中,我们可以将图像看作一个三维张量,其中的每个元素对应于该图像上的一个像素。
为了提取图像中的有用信息,我们通常需要对张量进行分解,以获得更高层次的表达。
张量分解是一种用于将高维张量表示为低维张量乘积的数学方法。
通常情况下,我们会将一个张量分解成若干个较低秩的小张量或矩阵的乘积,这被称为张量分解。
2. 张量分解的发展在过去的几十年中,张量分解在图像处理和数据挖掘等领域中得到了广泛的研究和应用。
其中最著名的方法是主成分分析(PCA)和独立分量分析(ICA)等。
但由于这些方法主要针对矩阵,对于高维张量的处理效率和准确性较低。
近年来,随着机器学习和深度学习等技术的发展,张量分解也得到了更加广泛的应用。
相对于传统方法,新的张量分解算法可以更好地处理高维张量,提供更高的分解精度和可解释性。
在这些新的方法中,主要包括基于张量分解的矩阵分解(Tucker分解)、矩阵分解的张量分解(CP分解)和流形学习等。
3. 张量分解的应用在数字图像处理领域,张量分解广泛应用于医学图像的分析和诊断。
例如,使用张量分解对磁共振成像(MRI)和计算机断层扫描(CT)等医学图像数据进行处理,可以获得更准确和可解释的信息,提高疾病的诊断和治疗效果。
此外,张量分解还可以应用于视频处理和图像分类。
在视频处理领域,张量分解被广泛应用于视频的压缩、降噪和去震动等方面,已成为一种很成熟的方法。
在图像分类方面,张量分解可以用于特征提取和处理,识别各种复杂情况下的目标物体以及进行图像检索等。
基于结构张量的图像修复方法

( . co lfC m ue n nom t n ee U i rt f Tcnl y e i n u 3 0 9 hn ; 1Sho o p t adI r ai ,Hfi nv syo ehoo ,Hf h i 00 ,C ia o r f o ei g eA 2 2 Sho o p  ̄ n nom t n nigTahr C lg,A qn n u 4 0 hn) . col C m u radI r ai ,A qn ece ol e nigA h i 6 1,C i f o f o s e 2 1 a
பைடு நூலகம்
0 引言
图像 修复是图像处理 中的一 个重要 课题 , 目的就 是根 其 据 图像 中已知信息 , 照一定 的规 则 自动地修 复图像 中损坏 按 或者 丢失 的部分 , 使修 复后 的图像 接近或 达到原 图 的视 觉效 果… , 在图像缩放 、 文物保护 、 影视 制作 、 虚拟 现实 、 多余 目标
epr e t eut so a tenwme o ,i o pr o i oa V r tn ( V adB C ehd,i rvste x ei n rsl h wt th e t d ncm a snwt T t a ao T ) n S B m tos mpoe m a l s h h i h l ii h
i g n an i g r s l ,a d e fci ey i p i t oo ma e . ma e i p it e u t n s n f t l n a n sc lri g s e v
图像修复研究进展综述

图像修复研究进展综述作者:***来源:《计算机时代》2021年第12期摘要:图像修复是指将信息缺失的图像进行像素填充以达到人类视觉满意的效果。
文章对该领域研究的相关技术进行综述:首先描述了传统的图像修复方法,接着描述了基于深度学习的图像修复方法,介绍各类方法的适用范围及优缺点,最后对未来的研究方向及重点提出展望。
关键词:图像修复; 深度学习; 卷积神经网络; 自编码网络; 生成式对抗网络中图分类号:TP391.4 文献标识码:A 文章编号:1006-8228(2021)12-06-04Abstract: Image restoration is to fill the missing image with pixels to achieve the satisfactory effect of human vision. This paper reviews the related technologies in this field: firstly, it describes the traditional image restoration methods, and then describes the image restoration methods based on deep learning, introduces the application scope, advantages and disadvantages of various methods, and finally puts forward the prospect of future research direction and focus.Key words: image restoration; deep learning; convolutional neural network; self-coding network; generative adversarial network0 引言生活离不开图像,图像作为反映客观世界的重要载体,是人类接收外界信息的重要来源和手段。
基于张量投票的脑CT图像去噪算法研究

恶性 脑肿 瘤是严重危 害人类生命健康 的疾病 , 3 年来 , 近 0 原发性恶性脑肿瘤发生率逐年递增 , 年增长率约为 1 %, . 中老年人群 2
尤为明显n 。脑肿瘤的早期正确诊断 、 及时治疗是减少死亡率的关键 ,T以其快速 、 C 准确 、 无创 等优点成为脑部肿 瘤筛查 的首选检查
a o i m , ih u e e c n i u t fi g lme t a d o e a e d c aa t r t ss c s r x mi , a k i i ci n l r h wh c sst o t i o g t h n y ma e ee n s n v r l t n h r ce i i u h a o i t c n ma ea ds n to lr sc p y t
bew e n vai t nd nos t e ld daaa ie.Fna uaiai e a ua iai e e pe m e t hih u e r a ln c li a e ho e ha he ago i lq l ttv nd q ntttv x r i n sw c s e ci ia m g ss w d t tt l — l i hm ha oo a tc lrs t rt sg d prci a eul . s Ke y wor :tns rvot ;C T m a ; e ii go ihm ds e o i ng I ge D nosng a rt l
h t :ww d z .e .n t / w.n sn t p/ c T h 8 — 5 — 6 0 6 e + 6 5 5 9 93 1 5994 60 6
基 于 张量 投票 的 C T图像 去噪 算 法研 究
李 勋 ,慧 韫 ,建 致 公 玲 啷睿 姜
基于结构张量的图像修复方法

基于结构张量的图像修复方法刘奎;苏本跃;赵晓静【摘要】Because the traditional anisotropic diffusion equation for image restoration only considers the gradient size, and produces false edges in color image inpainting, this paper proposed an image inpainting method based on structure tensor. Structure tensor was used as diffusion coefficient which can implement different diffusion processes in different regions. The experimental results show that the new method, in comparison with Total Variation (TV) and BSCB methods, improves the image inpainting results, and effectively inpaints color images.%针对传统各向异性扩散方程在修复图像时仅考虑梯度模的大小,且在修复彩色图像时易产生虚假边缘等缺陷,提出基于结构张量的图像修复方法.将结构张量作为各向异性扩散方程的扩散系数,实现在不同区域有不同的扩散方式.实验结果显示:该方法与整体变分(TV)和BSCB方法相比,提高了图像修复效果,有效地完成对于彩色图像的修复.【期刊名称】《计算机应用》【年(卷),期】2011(031)010【总页数】3页(P2711-2713)【关键词】图像修复;结构张量;偏微分方程;各向异性扩散【作者】刘奎;苏本跃;赵晓静【作者单位】合肥工业大学计算机与信息学院,合肥230009;安庆师范学院计算机与信息学院,安徽安庆246011;安庆师范学院计算机与信息学院,安徽安庆246011;安庆师范学院计算机与信息学院,安徽安庆246011【正文语种】中文【中图分类】TP391.41;TN911.730 引言图像修复是图像处理中的一个重要课题,其目的就是根据图像中已知信息,按照一定的规则自动地修复图像中损坏或者丢失的部分,使修复后的图像接近或达到原图的视觉效果[1],在图像缩放、文物保护、影视制作、虚拟现实、多余目标移除等领域具有重大应用价值。
张量分解算法在图像处理中的应用

张量分解算法在图像处理中的应用随着科技的不断发展,图像处理技术在现代社会中扮演着越来越重要的角色。
图像处理涉及到很多方面,比如图像去噪、图像增强、图像分割、目标检测、目标跟踪等。
这些应用都需要对大量的图像进行处理和分析。
为了提高图像处理的效率和准确性,需要一种适用于高维数据处理的算法。
张量分解算法正是这样一种运用在高维数据处理任务上的算法。
本文将介绍张量分解算法的基本原理和在图像处理中的应用。
一、张量分解算法的基本原理张量是指一个n维数组,它是一个向量、矩阵、立方体、高维度数据集合的推广。
在图像处理中,图像可以看作一个三维数组或四维数组。
如果将这个数组做张量分解,可以得到一组不同的子数组,这些子数组保留了原数组的部分信息。
由于张量分解算法在处理高维数据时非常高效,因此在图像处理中它也被广泛应用。
具体来说,张量分解算法能够将一个高维矩阵表示为一组低维矩阵的逐点积加和的形式,也就是将张量的高维度映射到低维度。
这样一来,张量分解就可以将复杂的高维数组表达成一个更简单明了的表示。
二、张量分解算法在图像去噪中的应用在图像处理中,图像去噪是一个必不可少的环节。
而张量分解算法在图像去噪中的应用已有比较成熟的方案。
在噪声较少的情况下,可以使用基于校正的张量分解方法。
其基本原理是将输入的张量分解为自然图像的线性组合,从而去除噪声。
在噪声较多的情况下,可以使用基于局部张量分解的方法,将图像分成多个块,每个块独立做张量分解,然后再合并起来。
这样做有利于去除不同块的噪声。
三、张量分解算法在图像增强中的应用图像增强包括对图像的对比度增强、亮度增强、饱和度增强等。
其中,对比度增强是最常见的一种方式。
在对比度增强中,可以令张量分解中的因子张量拥有噪声抵抗能力,从而提高图像的对比度。
另外,张量分解的另一个优点是可以将数据分解成低阶维度的表示,这在图像压缩和储存中也是非常有用的。
四、张量分解算法在目标检测和跟踪中的应用在目标检测和跟踪中,张量分解算法也得到了广泛的应用。
张量分析在图像处理中的应用

张量分析在图像处理中的应用张量是一个描述线性关系的矩阵,可以捕捉到具有方向和大小的二阶多维数据的所有变化。
在图像处理中,张量分析作为一种新兴的数学方法,被广泛应用于图像分割、图像去噪、图像配准、图像压缩等不同领域。
一、张量分析在图像分割中的应用图像分割是将图像中相互独立的区域分离出来的过程,是图像处理中的重要领域之一。
传统的图像分割方法需要对图像进行预处理,如滤波、二值化等,但这些方法往往会导致感兴趣的区域被破坏。
而张量分析则可以在不破坏感兴趣区域的情况下自动分割图像。
以水下图像分割为例,水下图像中常含有大量的噪音和颜色变化,使得传统的方法难以有效地对水下图像进行分割。
而张量分析可以通过对水下图像中的张量场进行分析,自动分辨出不同物体的边界和区域,从而实现高效、准确的图像分割。
二、张量分析在图像去噪中的应用图像噪声是指在图像获取和传输过程中产生的随机噪声,常常降低图像的质量和可读性。
传统的图像去噪方法通常基于线性滤波或非线性滤波,但这些方法往往会导致图像细节被模糊。
张量分析则可以通过计算图像中像素间的梯度变化,自适应地选择不同的滤波模板,进而去除图像中的噪声,保留图像的细节信息。
尤其是在高斯噪声下,张量分析方法的去噪效果更加优秀。
三、张量分析在图像配准中的应用图像配准是指将多幅图像对应的像素点通过变换,使它们在相同坐标系下对齐的过程。
传统的图像配准方法通常基于相似性度量和优化方法,但存在模型偏差和收敛速度慢的问题。
张量分析通过对图像中的像素进行张量分析,求取像素间的变形关系,然后利用运动学模型对其建模,快速、准确地实现图像配准。
在医学影像处理中,张量分析已成为实现病变自动配准的重要方法。
四、张量分析在图像压缩中的应用图像压缩是指通过部分信息的保留,减少图像数据量的过程。
传统的图像压缩方法主要基于频域分析或熵编码,但存在很强的信息损失和复杂度高的问题。
张量分析通过将图像分解为不同大小的块,然后对每个块进行张量分析,从而提取块间的相关性和特征,减少图像数据冗余,实现高效的图像压缩。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2. 方法描述
Jiaya Jia 和 Chi-Keung Tang 在文献[1] [3]中应用张量投票算法进行自然景观图像的目标移除和图像修 复工作,取得了成功。由于没有加入任何先验信息和模型,只是应用了连续律,所以相对于人眼视觉恢 复的效果还有一定局限。 这一方法的最大优点体现在对图像中轮廓曲线的修复上发挥了张量投票的优势, 甚至可以修复主观轮廓。 从图像处理角度来看,图像修复就是根据待修补区域周围的信息,将图像填充到待修补区域中。实 际的做法是通过缺损区域周边信息填充待修补区域的问题对大多数的图像修复问题,数据模型具有以下 形式[4]:
Application of Tensor Voting in Image Inpainting
Xiaofang Shao, Xiaojun Chu
Qingdao Branch of NAEI, Qingdao Shandong Received: Nov. 20th, 2016; accepted: Dec. 5th, 2016; published: Dec. 13th, 2016 Copyright © 2017 by authors and Hans Publishers Inc. This work is licensed under the Creative Commons Attribution International License (CC BY). /licenses/by/4.0/
T M σ= ∇I ∇I ( x, y ) Gσ ( x, y ) ( )( )
{ }
(4)
输入图像
基于纹理的图像分割 基于统计连接
自适应尺度选择
输入数据的 N维张量表示
图像合成
棒形投票域
张量投票
叠加后的张量
修复后的图像
Figure 1. Flowchart of the algorithm 图 1. 算法的流程图
文章引用: 邵晓芳, 初晓军. 张量投票在图像修复中的应用[J]. 图像与信号处理, 2017, 6(1): 1-7. /10.12677/jisp.2017.61001
邵晓芳,初晓军
技制作、图像缩放、图像的有损压缩、视频通信的错误隐匿等方面均有重大应用价值。在分类总结相关 工作的基础上,介绍了张量投票方法在图像修复中的应用,并展示了该方法的实验处理效果。
人工标识 待修复区域 张量投票 确定修复优先级
关键词
图像修复,自适应尺度,张量投票
1. 引言
在数字图像的获取、处理、压缩、传输和解压缩过程中,很多原因都可能造成信息缺损,所谓图像 修复是对图像上信息缺损区域进行填充的过程,其目的是恢复信息的完整性,尽量使观察者无法察觉图 像曾经缺损或已被修复。图像修复与降质图像恢复有本质区别,主要过程是由已知推导未知。这一技术 最初是被用来对中世纪的美术作品进行修复,为修补古老的艺术作品提供了安全便捷的途径;随着图像 修复技术的发展,这项技术还在许多实际应用中为了某种特殊目的移除数字图像上的目标或遮挡物并填 充移除后留下的缺损区域;有时为了提高图像质量,图像修复还与图像压缩、去噪、超分辨处理以及目 标检测等结合使用。 Bertalmio 等[1]在 2000 年的一次学术会议上,首次提出图像修复技术这个术语,他们的研究使得图 像修复的研究和应用达到一个飞跃。随着技术的发展,越来越多的领域期望能够对数字图像进行一些修 改,并且达到人眼察觉不出来的效果。因此,图像修复技术成为计算机图形学和机器视觉中的一个研究 热点,在文物保护、多余目标物体剔除(如视频图像中删除部分人物、文字、小标题等)、影视特技制作、 图像缩放、图像的有损压缩、视频通信的错误隐匿等方面有着重大的应用价值[1]。用户只需选择要修复 区域,计算机便自动完成余下的工作,从而显著减少人工处理的时间和精力。有关图像修复的相关工作 可参考文献[2],在此不加赘述。 本文主要内容安排如下:第二节介绍张量投票用于图像修复的具体过程;第三节是实验结果示例; 最后是结束语。
Pxi 由式(3)所示的原则选出:
= Pxi max Pxi , z j ( λ1 − λ2 ) , 1 ≤ j ≤ n
{
}
(3)
即沿某一方向(上式中设为 z 方向, z j 代表该方向的第 j 个点)搜索特征值之差为局部极大值的点作 为最佳曲线点; xi 表示该点的位置矢量; n 为该方向上的采样密度。当最佳曲线点的集合 Pxi 确定后, 采用 B-Spline 曲线对这些点进行连接形成完整的边界曲线。如果缺失区域较大,则采用高斯金字塔结构 在相继的多个尺度上进行连接。 一般情况下,缺损区会有多条曲线需要连接。因此须设置连接顺序:先根据相似性程度对所有待连 接点对进行排序;然后对所有点对进行处理,如果该点对相邻区域已经被连接,则忽略过去,否则在该 点对连线不与其他任何已有曲线相交的情况下将其连接;处理完所有点对之后,检测是否仍存在非封闭 区域,如果存在,则推导新的曲线将缺口连接。 自适应尺度选择根据下式计算图像各点的结构张量:
Keywords
Image Inpainting, Adaptive Scale, Tensor Voting
张量投票在图像修复中的应用
邵晓芳,初晓军
海军航空工程学院青岛校区,山东 青岛
收稿日期:2016年11月20日;录用日期:2016年12月5日;发布日期:2016年12月13日
摘
要
图像修复技术是计算机图形学和机器视觉中的研究热点之一,在文物保护、多余目标物体剔除、影视特
λ 0 0 2 E u u= 2 ∫ k × u − u dx Ω\ D
(
)
(2)
2
邵晓芳,初晓军
大多数图像修复算法都是在最小化式(2)的能量函数模型的意义下进行图像修复的。 张量投票法先是将图像的色彩信息和纹理信息转换成自适应性 N-D 张量,然后是个投票过程,用来 推断缺损像素点在 N-D 空间中最优的色彩值。N-D 张量投票可以构造粗糙纹理和规则纹理。算法主要分 两步:一是将输入图像进行基于纹理的分割,并通过二维张量投票连接被分割开的曲线来生成图像的完 整分割;二是利用 N-D 张量投票合成丢失的色彩及纹理信息。算法具体流程如图 1 所示。其中,基于纹 理的图像分割和基于统计特征的区域合并属于常规的图像处理方法[1];完成之后就要进行曲线连接,边 界曲线的连接首先通过二维张量投票增强特征点的显著性,同时计算出各点的法向矢量,而最佳曲线点
( λ1 − λ2 ) cos α
式中, λ1 、 λ2 分别为张量投票之后的最大和次大特征值, α 为投票者和接收者之间的矢量角。
(5)
上述方法还可扩展应用于三维遥感图像,不同之处有:1) 数据表示需对每点增加深度信息并进行数 据重采样;2) 边界曲线连接扩展到三维,需采用三维曲线检测算法检测三维表面的不连续点;3) 需对缺 失区域构建网格并进行网格分割,最后在每个网格面片上进行修复。 除了上述方法之外,还有人应用张量投票进行自适应图像修复[5]:对于小区域修复问题,在人工标 记修复区域的基础上,先应用张量投票计算待修复区域的优先级,然后再进行逐级修复;对于大范围修 复问题,先应用张量投票进行结构修复,然后再次应用张量投票对结构内部用类似小区域修复的方法进 行纹理填充,最后输出修复图像。具体计算流程分别如图 2 和图 3 所示。 其中,张量投票方法确定的修复优先级计算公式为:
( λ1 − λ2 )
2
+ λ22
(6)
即为其张量矩阵分解后圆形分量和棒形分量的模。 自适应修复的过程是通过选择一定大小的方形邻域窗口,计算其中有效像素点、缺失或噪声像素点 的比例来进行的:如果有效像素点占比例较大,则用该窗口平均颜色信息修复缺失点;反之,如果缺失 或噪声像素点的比例较大,则用全局平均颜色信息来修复受损点;如果两者的比例均小于设定阈值,则 通过增大窗口大小,直到重新计算的窗口内两者的比例满足前面的比例要求或者窗口大小超过一定限度 (实际运行过程中取经验值 21 × 21)为止。 对于大区域缺失图像的修复,算法包括结构修复和纹理修复两大主要步骤。其中,结构修复算法是 从已经区域中的边缘结构特征,用张量投票方法推测未知区域的边缘结构。修复后完整的结构又可用于
u 0 Ω \ D = [ k × u + n] Ω \ D
(1)
式中,u0 为所获得的观察图像;u 为原始图像;k 为退化函数;n 为加性白噪声;“*”表示卷积,Ω 表示 整个图像区域; D 表示信息丢失的待修补区域;Ω\D 表示没有丢失信息的区域;u0 为 Ω\D 上可利用的图 像部分;u 为需要复原的目标图像。 假设 n 为高斯噪声,那么关于数据模型的能量函数 E,常用最小均方误差定义[4]
3
邵晓芳,初晓军
式中, Gσ ( x, y ) 表示高斯微分算子,I 表示像素灰度,高斯微分算子的尺度可置零以简化计算,因为张量 当 trace ( M σ′ ( x, y ) ) < trace ( M σ ( x, y ) ) 时, 说明 trace ( M σ ( x, y ) ) 为局部极值, 结构张量的迹 trace ( M σ ( x, y ) ) , 选作最佳尺度。 一旦确定了图像的完整分割和最佳尺度,就可以根据图像中已有的颜色和纹理信息对缺失部分的数 据进行合成。这里依据纹理数据之间的 Markov 特性[5]使用 N-D 张量对图像中的像素进行编码,N 代表 邻域尺度的大小,每个像素都被编码成一个 N-D 的棒形张量。在像素 a 上给定一个以为 a 中心的 n × n 的模板窗口,通过产生一个维数为 N 的特征向量,可以把图转变成一个棒形张量,这里 N = n × n + 1; 如果输入为彩色图像,则要转换为灰度图像,相应的灰度等级要与颜色深度相对应。 编码之后就是在像素点的分割区域内,利用颜色和纹理特征的局部相关性,通过 N-D 张量投票在 N-D 空间进行投票,取对该点投票显要性值最大的点的灰度值对缺失部分的填充,从而实现图像修复。 其中,投票显要性的计算公式为: 投票对窗口中心及边界元素是同样对待的。当尺度参数从 1 变化到图像的最大分辨率时,依次计算各点