张量投票在图像修复中的应用
- 格式:pdf
- 大小:1.05 MB
- 文档页数:7
基于张量秩校正的图像恢复方法作者:白敏茹黄孝龙顾广泽赵雪莹来源:《湖南大学学报·自然科学版》2016年第10期摘要:针对医学图像和视频图像的恢复问题,基于张量表示,研究有限样本下的低秩张量数据恢复问题,在张量奇异值分解(t-SVD)理论的基础上,提出了张量秩校正模型和两阶段张量秩校正方法,第一阶段是用张量核范数最小化模型求得预估解,第二阶段,根据预估解,求解张量秩校正模型,获得更高精度的解.构建了求解张量秩校正模型和张量核范数最小化模型的张量近似点算法,使得可以在实数域上对张量直接进行计算,并且从理论上证明了该算法的收敛性.通过对医学图像和视频图像的数值仿真实验,验证了本文所提出模型和方法的有效性,实验结果显示,张量秩校正模型和方法能够取得更高的恢复精度.关键词:图像恢复;张量奇异值分解;张量秩校正;张量近似点算法中图分类号:TP751 文献标识码:A文章编号:1674-2974(2016)10-0148-07Abstract:Tensor-based restoration of medical images and video images was studied with limited samples. On the basis of the theory of tensor singular value decomposition (t-SVD), a tensor rank-correction model (CRTNN) was proposed to correct the tensor nuclear norm minimization model (TNN). A two-stage rank correction method is given as follows: the first stage is used to generate a pre-estimator by solving the TNN model, and the second stage is to solve the CRTNN model to generate a high-accuracy recovery by the pre-estimator. A tensor proximal point algorithm was proposed to solve the CRTNN model and the TNN model, making it possible to calculate tensor directly in the real field. The convergence of the algorithm was proved in theory. Numerical experiments of medical images and video images verify the efficiency of the proposed model and method. The experiment results show that tensor rank-correction model and method can achieve higher-accuracy recovery.Key words:image restoration;t-SVD; tensor rank-correction model; tensor proximal point algorithm随着电子技术和成像技术的发展,从医学图像到遥感图像,从导弹精确制导,到人脸识别及指纹识别再到具有视觉功能的智能机器人,人类活动的方方面面都会产生或涉及到大量的高维图像.高维图像已经成为一种重要的多媒体形式,广泛存在于人们的日常生活中.图像在形成,传输和记录的过程中受多种因素的影响,图像的质量会有所下降,典型表现为色彩模糊和有噪声干扰等.这一降质的过程被称为图像的退化.图像恢复的目的就是尽可能地恢复退化了的高维图像的本来面目.传统的图像处理方法是基于向量和矩阵的表示形式,往往破坏了这些数据的原始空间结构,在分析过程中不能够很好地刻画这些数据的本质和充分挖掘其内部特性.张量作为向量和矩阵表示的高阶推广,能够更好地表达高阶数据复杂的本质结构,已被广泛应用于计算机视觉与图像、人脸识别、医学图像和统计信号处理等研究领域中[1-6].高维图像数据往往具有低维属性,张量完备化问题就是利用张量数据的低秩结构,是一种在有限样本或测量数据下最小化张量的秩的优化问题.最小化张量的秩是NP难问题,通常的处理方法有:1)将张量转化成矩阵,然后求解矩阵完备化问题[7];2)用特殊的张量分解方法来分解张量,如CANDECOMP/PARA-FAC(CP)分解,Tucker分解等方法.由于矩阵的核范数是矩阵秩的紧的凸逼近,因此对矩阵完备化问题的求解一般是将其转化为矩阵核范数最小化问题求解.对矩阵核范数最小化问题的求解有近似点算法(PPA)[8],交替方向方法(ADM),加速近似梯度方法(APG)[9].虽然低秩矩阵完备化问题得到很好发展,但张量完备化问题研究还很不完善.不同于矩阵秩只有一种定义,张量秩有多种定义.传统上主要有两种张量秩的定义,CP秩和Tucker秩,它们分别是基于CP分解和 Tucker分解的.将张量展开成矩阵,利用展开矩阵性质近似逼近张量的秩,是常用的处理方法.例如:Gandy[2]等用各片分别展开矩阵的核范数的和作为张量秩的近似逼近;Liu[5]等进一步将各片分别展开矩阵的核范数通过加权来近似张量的秩,并提出了HaLTRC算法求解该松弛模型(TSN).然而这两种逼近方法并不是张量秩函数的最紧的凸逼近[7].Kilmer等[10]基于快速傅里叶变换可以将块循环矩阵对角化的思想,提出了张量奇异值分解(T-SVD)方法,使得张量可以在傅里叶变换下实现快速分解.基于T-SVD, Semerci等[6]提出张量核范数概念,对于3阶张量,利用张量核范数近似逼近张量的秩,建立了张量核范数最小化模型(TNN),构建了交替方向方法(ADMM)求解该模型,并应用于多线性数据的图像压缩和恢复,通过对比,TNN逼近比TSN逼近效果更好.但是该文没有给出ADMM方法的收敛性结果,文中的ADMM算法一部分在实数域上计算,一部分在复数域上计算.与以往模型不一样,TNN模型的目标变量是定义在复数域即傅里叶域内的矩阵,约束变量是定义在实数域的.因此,根据这个问题的特点,设计更加有效的具有收敛性的优化算法,是亟需解决的一个问题.另外,文献[11]指出,矩阵核范数在某些情况下不是矩阵秩的最紧凸逼近,如对角元素被高度样本化,则矩阵核范数最小化模型求解低秩恢复问题的能力就会高度弱化,而矩阵核范数是张量核范数(TNN)的二阶形式.本文针对以上两个问题开展研究,主要贡献有两个:一是提出了张量秩校正模型(CRTNN)和两阶段张量秩校正方法,二是构建了张量近似点算法,用于求解CRTNN模型和TNN模型,从理论上证明了该算法的收敛性.仿真实验验证了本文所提出模型和方法的有效性.结果显示,在医学图像以及视频图像的恢复问题中,张量秩校正方法能够取得更高的恢复精度.图1为医学图像和视频图像原始图像.图2,图3分别为医学图像和视频图像在样本率为20%(即有效信息只有20%)的情况时用TSN模型,TNN模型,CRTNN模型视觉恢复效果对比,从图2,图3的PSNR值对比和视觉恢复效果对比中,可以发现本文提出的CRTNN模型能得到更好的恢复效果.图4分别为医学图像和视频图像在TSN模型,TNN模型,CRTNN模型下对不同样本率得到的相对误差曲线对比.从中可以明显看出:本文提出的张量秩校正方法对不同的样本率得到的恢复图像的相对误差曲线都是最低的,表明本文提出的CRTNN模型能够取得更高精度的恢复效果.5 结论针对高维图像恢复问题,本文提出了张量秩校正模型和两阶段张量秩校正方法,并提出了求解张量秩校正模型的张量近似点算法,从理论上分析了该算法的收敛性.仿真结果验证了本文所提出模型和方法的有效性,结果表明,张量秩校正方法模型能够取得更高的恢复精度.能否将该模型和算法推广到四阶及以上的图像恢复问题?这个问题值得进一步研究.参考文献[1] ELY G, AERON S, MILLER E L. Exploiting structural complexity for robust and rapid hyper spectral imaging [C]//Proceedings of IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2013:2193-2197.[2] GANDY S, RECHT B, YAMADA I. Tensor completion and low-n-rank tensor recovery via convex optimization [J]. Inverse Problems, 2011, 27(2): 025010.[3] HAO N H, KILMER M E, BRAMAN K, et al. Facial recognition with tensor-tensor decompositions [J]. SIAM Journal on Imaging Sciences, 2013, 6(1): 437-463.[4] KILMER M, BRAMAN K, HAO N,et al. Third-order tensors as operators on matrices: A theoretical and computational framework with applications in imaging [J]. SIAM Journal on Matrix Analysis and Applications, 2013, 34(1):148-172.[5] LIU J, MUSIALSKI P, WONKA P, et al. Tensor completion for estimating missing values in visual data [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2013,35(1): 208-220.[6] SEMERCI O, HAO N, KILMER M E,et al. Tensor-based formulation and nuclear norm regularization for multienergy computed tomography [J]. IEEE Transaction on Image Processing,2014, 23(4): 1678-1693.[7] MU C, HUANG B, WRIGHT J,et al. Square deal: Lower bounds and improved relaxations for tensor recovery [C]//Proceedings of the 31st International Conference on Machine Learning (ICML-14), 2014, 32(1): 73-81.[8] HE B S, YUAN X M, ZHANG W X.A customized proximal point algorithm for convex minimization with linear constraints [J]. Computational Optimization and Applications, 2013, 56(3): 559-572.[9] TOH K C, YUN S. An accelerated proximal gradient algorithm for nuclear norm regularized least squares problems [J]. Pacific Journal of Optimization, 2010, 6(3): 615-640.[10]KILMER M E, MARTIN C D. Factorization strategies for third-order tensors[J]. Linear Algebra and its Applications, 2011, 435(3):641-658.[11]MIAO W, PAN S, SUN D. A rank-corrected procedure for matrix completion with fixed basis coefficients [J]. Math. Programming,2016,159(1):289-338.[12]ZHANG Z, ELY G, AERON S,et al. Novel methods for multilinear data completion and de-noising based on tensor-SVD [C]// In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2014, 3842-3849.[13]CAI J F, CANDES E J, SHEN Z. A singular value thresholding algorithm for matrix completion [J]. SIAM Journal on Optimization, 2010, 20(4): 1956-1982.。
数字图像处理张量分解的概念、发展及其应用数字图像处理是一项涉及计算机科学、数学和物理学等多个领域的交叉学科,涉及到许多复杂的算法和技术。
其中,张量分解作为一种重要的图像处理技术,已经被广泛应用于各个领域,如医学图像分析、视频处理、图像分类、模式识别等。
本文旨在介绍张量分解的概念、发展及其应用。
1. 张量分解的概念张量是一个多维数组,可以表示一个向量、矩阵及高维矩阵和数组。
在图像处理中,我们可以将图像看作一个三维张量,其中的每个元素对应于该图像上的一个像素。
为了提取图像中的有用信息,我们通常需要对张量进行分解,以获得更高层次的表达。
张量分解是一种用于将高维张量表示为低维张量乘积的数学方法。
通常情况下,我们会将一个张量分解成若干个较低秩的小张量或矩阵的乘积,这被称为张量分解。
2. 张量分解的发展在过去的几十年中,张量分解在图像处理和数据挖掘等领域中得到了广泛的研究和应用。
其中最著名的方法是主成分分析(PCA)和独立分量分析(ICA)等。
但由于这些方法主要针对矩阵,对于高维张量的处理效率和准确性较低。
近年来,随着机器学习和深度学习等技术的发展,张量分解也得到了更加广泛的应用。
相对于传统方法,新的张量分解算法可以更好地处理高维张量,提供更高的分解精度和可解释性。
在这些新的方法中,主要包括基于张量分解的矩阵分解(Tucker分解)、矩阵分解的张量分解(CP分解)和流形学习等。
3. 张量分解的应用在数字图像处理领域,张量分解广泛应用于医学图像的分析和诊断。
例如,使用张量分解对磁共振成像(MRI)和计算机断层扫描(CT)等医学图像数据进行处理,可以获得更准确和可解释的信息,提高疾病的诊断和治疗效果。
此外,张量分解还可以应用于视频处理和图像分类。
在视频处理领域,张量分解被广泛应用于视频的压缩、降噪和去震动等方面,已成为一种很成熟的方法。
在图像分类方面,张量分解可以用于特征提取和处理,识别各种复杂情况下的目标物体以及进行图像检索等。
图像修复研究进展综述作者:***来源:《计算机时代》2021年第12期摘要:图像修复是指将信息缺失的图像进行像素填充以达到人类视觉满意的效果。
文章对该领域研究的相关技术进行综述:首先描述了传统的图像修复方法,接着描述了基于深度学习的图像修复方法,介绍各类方法的适用范围及优缺点,最后对未来的研究方向及重点提出展望。
关键词:图像修复; 深度学习; 卷积神经网络; 自编码网络; 生成式对抗网络中图分类号:TP391.4 文献标识码:A 文章编号:1006-8228(2021)12-06-04Abstract: Image restoration is to fill the missing image with pixels to achieve the satisfactory effect of human vision. This paper reviews the related technologies in this field: firstly, it describes the traditional image restoration methods, and then describes the image restoration methods based on deep learning, introduces the application scope, advantages and disadvantages of various methods, and finally puts forward the prospect of future research direction and focus.Key words: image restoration; deep learning; convolutional neural network; self-coding network; generative adversarial network0 引言生活离不开图像,图像作为反映客观世界的重要载体,是人类接收外界信息的重要来源和手段。
基于结构张量的图像修复方法刘奎;苏本跃;赵晓静【摘要】Because the traditional anisotropic diffusion equation for image restoration only considers the gradient size, and produces false edges in color image inpainting, this paper proposed an image inpainting method based on structure tensor. Structure tensor was used as diffusion coefficient which can implement different diffusion processes in different regions. The experimental results show that the new method, in comparison with Total Variation (TV) and BSCB methods, improves the image inpainting results, and effectively inpaints color images.%针对传统各向异性扩散方程在修复图像时仅考虑梯度模的大小,且在修复彩色图像时易产生虚假边缘等缺陷,提出基于结构张量的图像修复方法.将结构张量作为各向异性扩散方程的扩散系数,实现在不同区域有不同的扩散方式.实验结果显示:该方法与整体变分(TV)和BSCB方法相比,提高了图像修复效果,有效地完成对于彩色图像的修复.【期刊名称】《计算机应用》【年(卷),期】2011(031)010【总页数】3页(P2711-2713)【关键词】图像修复;结构张量;偏微分方程;各向异性扩散【作者】刘奎;苏本跃;赵晓静【作者单位】合肥工业大学计算机与信息学院,合肥230009;安庆师范学院计算机与信息学院,安徽安庆246011;安庆师范学院计算机与信息学院,安徽安庆246011;安庆师范学院计算机与信息学院,安徽安庆246011【正文语种】中文【中图分类】TP391.41;TN911.730 引言图像修复是图像处理中的一个重要课题,其目的就是根据图像中已知信息,按照一定的规则自动地修复图像中损坏或者丢失的部分,使修复后的图像接近或达到原图的视觉效果[1],在图像缩放、文物保护、影视制作、虚拟现实、多余目标移除等领域具有重大应用价值。
张量分解算法在图像处理中的应用随着科技的不断发展,图像处理技术在现代社会中扮演着越来越重要的角色。
图像处理涉及到很多方面,比如图像去噪、图像增强、图像分割、目标检测、目标跟踪等。
这些应用都需要对大量的图像进行处理和分析。
为了提高图像处理的效率和准确性,需要一种适用于高维数据处理的算法。
张量分解算法正是这样一种运用在高维数据处理任务上的算法。
本文将介绍张量分解算法的基本原理和在图像处理中的应用。
一、张量分解算法的基本原理张量是指一个n维数组,它是一个向量、矩阵、立方体、高维度数据集合的推广。
在图像处理中,图像可以看作一个三维数组或四维数组。
如果将这个数组做张量分解,可以得到一组不同的子数组,这些子数组保留了原数组的部分信息。
由于张量分解算法在处理高维数据时非常高效,因此在图像处理中它也被广泛应用。
具体来说,张量分解算法能够将一个高维矩阵表示为一组低维矩阵的逐点积加和的形式,也就是将张量的高维度映射到低维度。
这样一来,张量分解就可以将复杂的高维数组表达成一个更简单明了的表示。
二、张量分解算法在图像去噪中的应用在图像处理中,图像去噪是一个必不可少的环节。
而张量分解算法在图像去噪中的应用已有比较成熟的方案。
在噪声较少的情况下,可以使用基于校正的张量分解方法。
其基本原理是将输入的张量分解为自然图像的线性组合,从而去除噪声。
在噪声较多的情况下,可以使用基于局部张量分解的方法,将图像分成多个块,每个块独立做张量分解,然后再合并起来。
这样做有利于去除不同块的噪声。
三、张量分解算法在图像增强中的应用图像增强包括对图像的对比度增强、亮度增强、饱和度增强等。
其中,对比度增强是最常见的一种方式。
在对比度增强中,可以令张量分解中的因子张量拥有噪声抵抗能力,从而提高图像的对比度。
另外,张量分解的另一个优点是可以将数据分解成低阶维度的表示,这在图像压缩和储存中也是非常有用的。
四、张量分解算法在目标检测和跟踪中的应用在目标检测和跟踪中,张量分解算法也得到了广泛的应用。
张量分析在图像处理中的应用张量是一个描述线性关系的矩阵,可以捕捉到具有方向和大小的二阶多维数据的所有变化。
在图像处理中,张量分析作为一种新兴的数学方法,被广泛应用于图像分割、图像去噪、图像配准、图像压缩等不同领域。
一、张量分析在图像分割中的应用图像分割是将图像中相互独立的区域分离出来的过程,是图像处理中的重要领域之一。
传统的图像分割方法需要对图像进行预处理,如滤波、二值化等,但这些方法往往会导致感兴趣的区域被破坏。
而张量分析则可以在不破坏感兴趣区域的情况下自动分割图像。
以水下图像分割为例,水下图像中常含有大量的噪音和颜色变化,使得传统的方法难以有效地对水下图像进行分割。
而张量分析可以通过对水下图像中的张量场进行分析,自动分辨出不同物体的边界和区域,从而实现高效、准确的图像分割。
二、张量分析在图像去噪中的应用图像噪声是指在图像获取和传输过程中产生的随机噪声,常常降低图像的质量和可读性。
传统的图像去噪方法通常基于线性滤波或非线性滤波,但这些方法往往会导致图像细节被模糊。
张量分析则可以通过计算图像中像素间的梯度变化,自适应地选择不同的滤波模板,进而去除图像中的噪声,保留图像的细节信息。
尤其是在高斯噪声下,张量分析方法的去噪效果更加优秀。
三、张量分析在图像配准中的应用图像配准是指将多幅图像对应的像素点通过变换,使它们在相同坐标系下对齐的过程。
传统的图像配准方法通常基于相似性度量和优化方法,但存在模型偏差和收敛速度慢的问题。
张量分析通过对图像中的像素进行张量分析,求取像素间的变形关系,然后利用运动学模型对其建模,快速、准确地实现图像配准。
在医学影像处理中,张量分析已成为实现病变自动配准的重要方法。
四、张量分析在图像压缩中的应用图像压缩是指通过部分信息的保留,减少图像数据量的过程。
传统的图像压缩方法主要基于频域分析或熵编码,但存在很强的信息损失和复杂度高的问题。
张量分析通过将图像分解为不同大小的块,然后对每个块进行张量分析,从而提取块间的相关性和特征,减少图像数据冗余,实现高效的图像压缩。
改进的图像恢复张量扩散模型I. 简介- 引言- 研究背景- 现有方法的缺点- 本文的贡献II. 相关技术- 图像恢复技术- 张量扩散模型- 其他相关技术III. 改进的方法- 对现有方法的分析- 改进方法的提出- 算法流程IV. 实验结果- 实验设置- 实验结果与分析- 与其他方法的比较V. 结论- 结果总结- 研究贡献与不足- 展望未来工作VI. 参考文献第一章节是论文引言,一般要对研究背景进行简要介绍,概述已有方法的不足,同时提出本文的研究贡献。
图像恢复是计算机视觉领域的重要课题之一,其目的是通过一系列算法和技术来修复受损或失真的图像,以恢复其原本的外观、质量和信息。
在实际应用中,很多情况下图像会因各种原因而受到各种干扰和损伤,如静态或动态噪声、变形、模糊或遮挡等因素,这些因素使得图像难以进行后续处理,影响着其在视觉、通信、安全等领域的应用。
目前,常见的图像恢复方法主要包括基于插值、基于去噪、基于边缘保持、基于模型、基于深度学习等多种方法,其中各自存在着一些局限性和问题。
例如,插值方法虽然速度快、计算简单、操作方便,但对于包含较大噪声、模糊等失真的图像,其效果往往不佳。
边缘保持方法能够保留图像边缘,但对于图像中的纹理、细节等信息的恢复能力有所不足。
另外,图像恢复算法也面临一些挑战,如大量的计算量、将损坏图像恢复到原状的不确定性等。
张量扩散模型(TDM)是一种基于偏微分方程的图像恢复方法,具有良好的局部和全局特性。
TDM在图像恢复领域已经得到了广泛的应用,但是由于TDM没有充分考虑图像的纹理、边缘等信息,造成了不平滑、失真等问题,故需要对其进行改进。
本文的研究贡献在于提出一种改进的图像恢复TDM方法,通过添加局部纹理和全局边缘信息,增强了TDM对于图像失真、损伤的修复能力,进一步提高了图像恢复效果。
本文的方法涵盖了多种类型的损坏图像,对于不同类型的图像也有不错的恢复效果。
同时,本文的算法能够较好的解决计算量大、算法收敛慢的问题,具有较高的实用性。
融合改进的张量相关全变分的鲁棒张量修补用于图像修复黄凯;李忠宁
【期刊名称】《人工智能与机器人研究》
【年(卷),期】2024(13)2
【摘要】图像在采集和捕捉过程中,往往存在噪声污染和缺失等退化情况,而鲁棒补全对此发挥着重要作用。
目前这些方法大多利用图像的全局低秩和局部平滑先验来对其进行建模,包括独立编码方法和融合编码方法。
然而,这些方法要么需要对两个以上参数进行繁琐的调整,要么平等地对待梯度矩阵/张量的每个奇异值,从而限制了处理实际问题的灵活性。
在本文中,我们提出了改进的张量相关全变分(ITCTV)范数,以充分利用梯度张量的内在结构特性。
所提出的ITCTV正则化器不需要权衡参数来平衡两个先验,并且进一步有效地利用了梯度张量奇异值的先验分布信息。
我们将提出的方法应用在多种类型的视觉张量数据上,实验结果证明了所提出方法在图像修复上的有效性。
【总页数】10页(P255-264)
【作者】黄凯;李忠宁
【作者单位】西南大学数学与统计学院;银川能源学院基础部银川
【正文语种】中文
【中图分类】TP3
【相关文献】
1.一种融合结构张量与非局域全变分的图像去噪方法
2.基于鲁棒低秩张量恢复的高光谱图像去噪
3.中医药联合红蓝光治疗痤疮的临床疗效分析
4.基于张量鲁棒主成分分析的视网膜眼底图像序列变化检测
5.张量分解和自适应图全变分的高光谱图像去噪
因版权原因,仅展示原文概要,查看原文内容请购买。