基于傅里叶描述子和加权稀疏表示的军事图像分类方法
- 格式:pdf
- 大小:2.08 MB
- 文档页数:5
基于稀疏表示的图像分类字典学习何小卫;张莉【摘要】In order to deal with the weak structure of dictionary in the K-SVD algorithm , an nonlocal classifi-cation dictionary learning method ( NLC-DL) based on sparse representation was proposed by taking advantage of image nonlocal self-similarity.The method clustered image patches with structural similarity by the K-means algorithm, then the dictionaries for each class were learned to reinforce the effectiveness.The sparse coeffi-cients obtained by the Orthogonal Matching Pursuit algorithm ( OMP) were used to optimize all the dictionaries alternately.Both the sparse coefficients and the optimized dictionaries were used for reconstructing the true im -age.Experimental results showed that the obtained dictionaries achieved a better effect with less error on re -presenting the training sample and maintained the structural informationeffectively.Furthermore , the proposed method for reconstructing images performed better than the traditional ones in terms of PSNR and visual effect.%针对K-SVD算法学习得到的字典结构性不强的问题,利用图像的非局部自相似性,提出了基于稀疏表示的图像分类字典学习方法( NLC-DL).该方法利用K-means对图像块进行聚类并对每个子类进行字典学习,增强字典的有效性.根据正交匹配追踪算法( OMP)求得稀疏系数,迭代优化字典,最终利用优化后字典和稀疏系数矩阵重构图像.实验结果表明:生成的学习字典对训练样本的表达误差更小,能够有效地保持图像的结构信息,重构后的图像在峰值信噪比和视觉效果方面均优于传统方法.【期刊名称】《浙江师范大学学报(自然科学版)》【年(卷),期】2015(038)004【总页数】8页(P402-409)【关键词】非局部;自相似性;稀疏表示;字典学习;K-均值【作者】何小卫;张莉【作者单位】浙江师范大学数理与信息工程学院,浙江金华 321004;浙江师范大学数理与信息工程学院,浙江金华 321004【正文语种】中文【中图分类】TP391图像的稀疏表示是通过引入过完备冗余字典,实现对信号的最优逼近.基于图像稀疏表示的过完备信号稀疏表示理论最早是由Mallat等[1]提出的,使用Gabor字典并引入匹配追踪算法,通过逐步逼近的方法对信号进行稀疏表示.近年来,基于过完备冗余字典的信号稀疏表示被广泛应用于图像处理的各个领域:利用形状自适应字典块对三维医学图像进行去噪处理[2];通过抑制噪声的稀疏编码进行图像恢复[3];基于位置分类选择合适加权分解人脸词典并进行稀疏编码用于人脸识别[4];利用稀疏表示进行目标检测实现背景分离进而实现目标跟踪[5];基于压缩感知构造超完备稀疏字典进行稀疏降维[6];强调任务驱动字典学习算法以提高高光谱分类的效果[7].文献[8]提出K-SVD字典学习算法,将观测图像作为训练原子库进行字典学习,能够较好地保护图像的细节信息.但在初始字典选择不当的情况下,由于字典某些列可能不被更新,降低了字典原子的有效利用率,可能导致算法陷入局部最小值,并且算法在处理高维数据及运算复杂度上都有一定的局限性[9].为解决这些问题,近年来,有学者在K-SVD算法的基础上进行了一些改进.在降低字典大小的问题上,Mazhar等[10]提出了增强K-SVD算法(EK-SVD),在不影响逼近精度的前提下,从大量的字典原子中逐步修剪掉类似的原子,进而产生一个较小尺寸的优化字典,从一定程度上降低了K-SVD算法运算的复杂度;在对选择合适大小的字典问题上,文献[11]进行了探索并提出子聚类K-SVD算法,采用子聚类的方法保留最重要的原子,同时去除多余原子,通过引入错误驱动机制完成字典的更新;在提高字典原子参与图像重构的使用率问题上,Ribhu等[12]提出了稀疏贝叶斯学习方法,在K-SVD算法最初的几次迭代过程中,使用稀疏贝叶斯学习方法进行稀疏编码完成信号从非稀疏表示逐步收敛到稀疏表示,从而解决了字典原子的利用不足问题.上述基于K-SVD的图像处理方法在字典大小、字典原子利用率和算法时间复杂度方面进行了改善,但这并没有有效解决K-SVD算法对初始字典的随机选取问题.文献[3]指出,用K-SVD方法得到的稀疏编码系数并不是随机分布的,它们之间存在高度的相关性,提出了非局部中心化稀疏表示模型,并取得了非常好的图像恢复效果.考虑到各图像块之间可能存在的几何结构相似性[13],对需要处理的图像块进行聚类,再对聚类后的图像块进行字典学习.一方面,使得各个子字典更有针对性,每类子字典只恢复与之相对应的图像块信息,增强了字典学习的有效性;另一方面,聚类使得并行计算成为可能,加快了图像处理速度.在过完备稀疏表示问题的求解方面,贪婪追踪算法在求解优化问题时不需要考虑整体最优性,总在当前的最好结果的条件下做选择.主要算法有:匹配追踪(MP)算法[1]、正交匹配追踪(OMP)算法[14]等.OMP算法是对MP算法的一种改进,在分解的每一步对所选择的全部原子进行正交化处理,使得在精度要求相同的情况下,OMP算法的收敛速度更快.利用图像的非局部自相似性,本文提出了基于稀疏表示的图像分类字典学习方法(NLC-DL):用K-means方法对图像块进行聚类,利用主成分分析(PCA)具有很好方向性的特性,对子类图像块进行子字典学习;对于每一子类图像,利用OMP算法得出对应稀疏系数,迭代计算所得图像与原始图像之间的差距,优化字典直至达到优化条件;并通过实验方法完成算法的相关参数设定和字典类数选择,利用优化字典和稀疏系数实现图像重构.1.1 基于稀疏分解理论的图像表示稀疏分解是将信号或图像在过完备的字典下分解,寻找最匹配的原子重构信号或图像.图像的稀疏表示理论研究主要分为稀疏分解重建算法和字典的设计,而字典的设计将直接影响到图像是否能有效地进行稀疏表示.稀疏编码是对训练字典进行线性组合,从而最大限度地逼近给定数据集[15].已知过完备字典D∈Rn×K(K≥n)是由K列原子组成,信号y∈Rn可以由稀疏线性组合表示.即:信号可以近似表达为y≈Da,且满足‖y-Da‖p≤ξ,其中a为信号y 在字典D下的系数,p一般取值为1,2或∞.因为K≥n,D是满秩矩阵,所以信号y具有无穷多解,即有无穷多种表示系数[16].如何找到非零元素个数最少的系数向量是信号在稀疏分解问题中的关键,模型可表示为或者式(1)和式(2)中,范数‖\5‖0表示向量非零元素的个数.由于l0的最小化是NP-hard问题,所以在a足够稀疏的条件下,可用l1范数对其进行凸放松[17].模型(1)等价于式(3)中:‖是保真项,用来约束重构图像和原始图像之间的误差;‖a‖1是稀疏正则项,用来约束图像的稀疏度;参数λ用于调节保真项与稀疏项的约束权重.文献[18]给出了一种贝叶斯方法以解决参数λ的优化取值问题.1.2 图像分类字典学习模型由于自然图像在结构上存在自相似性[19],即图像上很多信息是相似的、冗余的,并且它们不是局部分布的,可以在整个图像的任意位置,所以不同图像块之间也会存在结构上的相似性.图像块之间的相似性可以通过它们的灰度值的欧式距离来度量,欧式距离越小,结构越相似.将图像块利用K-means聚类后的原始图像可表述为:Y=[y1,y2,…,yk],其中yi={y(1),y(2),…,y(j)}表示聚类后每一类数据,再对每一子类数据块进行稀疏编码和字典学习,以实现图像恢复的目的.在式(3)的基础上引入分类的思想,模型可表述为式(4)中:‖是类内保真项,用来约束每一类重构图像和原始子类图像之间的误差;‖ai‖1是稀疏正则项,用来约束每一类图像的稀疏度;参数λ用于调节保真项与稀疏项的约束权重;yi表示第i类数据;Di表示第i类图像块所对应的过完备字典.在对图像进行稀疏表示时,假定字典是确定不变的,那么稀疏分解算法的性能直接影响着能否对信号实现最优的逼近.所以,模型的实现可分步迭代实现:固定字典Di进行类内稀疏表示,然后固定稀疏系数ai完成子类字典的更新.依据文献[8]的思想,对观测图像Y∈RN进行大小为×的可重复取块操作,则各图像块可表示为: y(i)=RiY.其中:y(i)∈Rn;Ri∈Rn×N表示位置i对应像素点参与取块操作的贡献程度.并通过式(4)得到的Di,ai对第i类图像块进行重构xi=Diai.若用X表示重构图像,k表示图像的类数,则图像重构模型可表示为利用图像非局部自相似性对图像进行聚类,最终获得的子类字典之间可能包含有相似的原子信息,比如图像的边缘、轮廓、纹理等特征信息,都有可能出现在不同子类字典的原子信息中.因此,通过计算不同子类字典之间的相似度,把相似度较高的子字典合成一个特征字典,再用特征字典对相关图像块进行重构以实现对图像特征信息的保护,可以进一步提高本文方法对图像恢复的效果.利用图像的非局部自相似性,充分考虑图像块间的相互联系,对图像块进行结构聚类,并对聚类后的图像块做类内字典学习,有效地捕捉了图像的内部结构特征,增强了字典的有效性,加快了收敛速度,从而更好地实现图像的重构.具体的类字典学习过程如下:NLC-DL算法输入:训练样本Y1)利用K-means对训练样本进行聚类Y=[y1,y2,…,yk],yi={y(1),y(2),…,y(j)}.①随机选取k个聚类质心点π1,π2,…,πk;②重复下面过程直至收敛: .其中,当样本点y(i)被归类到类c(i)时rij=1,否则为0.2)利用PCA方法对每一类样本进行降维处理,得出初始特征类字典Dk.①将每一类训练图像变换得到一组列向量{yi},并计算均值向量其中N为每一类图像块个数;②计算协方差矩阵投影矩阵A取ST的前k个最大特征值所对应的特征向量;③对原图像进行降维处理,得到Dk=(Y-υ)Ak.3)利用OMP算法计算第i类样本的稀疏系数ai.4)通过以下步骤进行J次迭代:对于字典D中的每一列l=1,2,…,m,①计算残差El=yi-Diai;②利用SVD算法分解得El=UΛVT;③矩阵U的第1列将作为字典第l列升级后的更新Di;④矩阵V的第1列乘以Λ(1,1)后所得的结果更新系数ai.5)如果不能达到停止迭代的标准,那么返回第4步.6)更新第i类图像块xi=Diai.7)重构图像).输出:第i类数据对应的子字典Di及恢复图像X.算法的重点在于构造子类字典,以获得对图像信号更加准确的稀疏表示.首先,对图像块信息利用K-means方法,即通过计算它们的灰度值之间的欧式距离进行聚类,并对子类图像块利用PCA方法进行降维处理作为初始子类字典,可有效地避免传统K-SVD算法对初始字典随机选取不当情况下可能陷入局部最小值的问题.然后,采用OMP算法根据每一子类对应的PCA字典进行图像信号的稀疏分解,分解过程的每一步均将图像信号投影到特征子字典所构成的空间上,获取信号的各个已选原子上的投影分量和残余分量,再循环对残差分量进行分解.在每次迭代时,在字典中选择与残余信号最相关的原子,再将信号残余正交投影到所选的原子上;然后重新计算稀疏系数并更新信号残余,重复计算直到信号残余小于设定的阈值;最后,利用类特征字典Di获得相应稀疏系数重构图像X.3.1 分类子字典为了验证上述字典学习方法的有效性,使用一些经典的图像作为实验用例.以512×512像素的灰度图像Lena为例,在加入σ=20的高斯噪声之后,定义图像块大小为8×8像素,并按不同步长(step=1,2,4,6,8和10),共生成424 204个图像块进行训练,其中类数cls=15,迭代结束条件(即设定的误差阈值)T=1.15σ,最大迭代次数num=10.按照本文算法得到的子类字典如图1和图2所示,图3是相同图像数据利用K-SVD算法得到的字典,视觉上看字典块信息排列杂乱无章,字典的维数相对较高,列字典原子之间表现出一定的相似性,在一定程度上降低了字典的有效性,不利于对图像结构特征进行保护,可能影响到图像的恢复效果.图1是图像Lena利用本文算法生成的15类子字典.由图1~3观察比较可知,本文NLC-DL算法对图像整体信息进行分类细化,由于不同类数据信息具有一定的差异性,最终获得的n个分类字典与传统算法获得的一个字典相比,能够更有效地捕捉图像不同结构的细节纹理特征,如图1中第4,5类字典及图2中第1,2,14类字典虽然看起来极其相似,但是字典内部数据块的纹理结构倾斜度又有一定的差别,能够表现出图像不同结构间的差异性.本文利用图像非局部自相似性对图像整体进行K-means聚类,用欧式距离衡量图像块间的相似性,由于每一类图像块数量不固定,使得类内图像块数量相对较少,且结构相对简单的子类图像构造的类内字典块存在一些冗余信息,如图1中第7,12,13,14类字典和图2中第1,2,4,12类字典.3.2 图像去噪效果自然图像的多样性使得同一算法可能会在不同图像上表现出不同的性能,为了克服这一问题,笔者使用大量具有代表性的图像进行测试.选取大小为512×512的Lena,Barbara,Cameraman,Boat,Peppers及Bridge图像,并叠加不同标准差σ=10,20和30的高斯噪声,利用DCT[20],Global[16],K-SVD[8]及本文NLC-DL算法分别进行测试,去噪结果如表1所示.表1显示所选图像在不同噪声水平下的PSNR值.通过对比可知,本文方法在图像去噪方面优于DCT,Global算法0.27~2.69 dB,优于与本文框架结构类似的K-SVD算法0.11~0.76 dB.并且对于纹理丰富的Lena,Barbara及Boat图像,通过不同方法的比较结果可见,对所选图像施加的噪声越大,本文算法的PSNR值增加得越多.说明本文利用结构聚类进行字典学习的方法更有利于保护图像的纹理特征,在图像恢复方面更为成功.为了更加形象、直观地表述本文算法在图像恢复方面的效果,以细节纹理比较丰富的图像Barbara为例,施加σ=20的高斯噪声并运用不同方法进行图像去噪,效果对比如图4所示.从图4中的具体细节放大信息来看,其他3种算法将图像整体化处理使得图像的明暗对比度减低,而本文算法在图像对比度方面更接近原始图像;对于一些细小纹理特征,其他算法都丢失了部分纹理信息,但本文方法恢复的纹理信息明显比传统算法更多、更清晰;在边缘保护方面,其他算法均将边缘平滑掉了,而本文方法基本上保持了边缘的原有特征.由此说明,本文利用分类字典学习方法对图像进行分类处理有助于保护图像的纹理、边缘等结构特征.本文算法不论是从PSNR值还是细节结构特征方面,都优于其他3种方法.本文利用非局部的思想对图像进行结构聚类和字典学习,提出了基于稀疏表示的图像分类字典学习方法.一方面,利用图像的非局部自相似性对图像块进行结构聚类,有效地保持了图像的结构信息;另一方面,对聚类后的图像块单独进行字典学习,使得字典更有针对性,可以提高图像的重构效果.实验结果表明,本文算法与其他传统算法相比,随着图像噪声逐渐增大,无论是从平滑效果,还是对于边缘、纹理等结构信息,本文算法所产生的学习字典结构性更强,能较好地表示训练样本,在峰值信噪比和视觉效果方面都优于传统方法.【相关文献】[1]Mallat S G,Zhang Z.Matching pursuits with time-frequency dictionaries[J].IEEE Transactions on Signal Processing,1993,41(12):3397-3415.[2]Thilagavathi M,Deepa P.An efficient dictionary learning algorithm for 3d medical image denoising based on sadct [C]//2013 International Conference onICICES.Chennai:IEEE,2013:442-447.[3]Dong Weisheng,Zhang Lei,Shi Guangming,et al.Nonlocally centralized sparse representation for image restoration[J].IEEE Transactions on ImageProcessing,2013,22(4):1620-1630.[4]Thavalengal S,Mandal S,Sao A K.Significance of dictionary for sparse coding based pose invariant face recognition[C]//2014 Tewentieth National Conference on Communications.Kanpur:IEEE,2014:1-5.[5]Lu Weizhi,Bai Cong,Kpalma K,et al.Multi-object tracking using sparse representation[C]//2013 IEEE International Conference onICASSP.Vancouver:IEEE,2013:2312-2316.[6]Tang Yufang,Li Xueming,Liu Yang,et al.Sparse dimensionality reduction based on compressed sensing[C]//2014 IEEE WCNC.Istanbul:IEEE,2014:3373-3378.[7]Sun X,Nasrabadi N M,Tran T D.Task-driven dictionary learning for Hyperspectral Image classification with structured sparsity constraints[C]//2015 IEEE Geoscience and Remote Sensing an:IEEE,2015:1-15.[8]Aharon M,Elad M,Bruckstein A.K-SVD:An algorithm for designing overcomplete dictionary for sparse representation[J].IEEE Transactions on SingalProcessing,2006,54(11):4311-4322.[9]Sahoo S K,Makur A.Enhancing image denoising by controlling noise incursion in learned dictionaries[J].IEEE Signal Processing Letters,2015,22(8):1123-1126.[10]Mazhar R,Gader P D.EK-SVD:Optimized dictionary design for sparserepresentations[C]//19th ICPR.Valparaiso:IEEE,2008:1-4.[11]Feng Jianzhou,Song Li,Yang XiaoKang,et al.Sub clustering K-SVD:Size variable dictionary learning for sparse representations[C]//2009 16th IEEE ICIP.Cairo:IEEE,2009:7-10.[12]Ribhu R,Ghosh D.Dictionary design for sparse signal representations using K-SVD with sparse Bayesian learning[C]//2012 IEEE 11th ICSP.Beijing:IEEE,2012:21-25.[13]Gu Shuhang,Zhang Lei,Zuo Wangmeng,et al.Weighted nuclear norm minimization with application to image denoising[C]//2014 IEEE CVPR.Columbus:IEEE,2014:2862-2869.[14]Pati Y C,Rezaiifar R,Krishnaprasad P S.Orthonormal matching pursuit:Recursive function approximation with applications to wavelet decomposition[C]//1993 Conference Record of The Twenty-Seventh Asilomar Conference on Signals,Systems and Computers.Pacific Grove:IEEE,1993:40-44.[15]Tillmann A M.On the computational Intractability of exact and approximate dictionary learning[J].IEEE Signal Processing Letters,2015,22(1):45-49.[16]Elad M.Sparse and pedundant representations:From theory to applications in signal and image processing[M].London:Springer,2010:227-244.[17]Donoho D L,Huo X.Uncertainty principles and ideal atomic decomposition[J].IEEE Transactions on Information Theory,2001,47(7):2845-2862.[18]Lin Y,Lee D.Bayesian L1-norm sparse learning[C]//2006 IEEEICASSP.Toulouse:IEEE,2006:605-608.[19]Ram I,Elad M,Cohen I.Image denosing using NL-means via smooth patchordering[C]//2013 IEEE ICASSP.Vancouver:IEEE,2013:1350-1354.[20]Srivastava V K.A DCT based algorithm for blocking artifact reduction from DCT coded images[C]//2006 IEEE ICIT.Mumbai:IEEE,2006:2815-2820.。
基于空间-光谱特征和稀疏表达的高光谱图像分类算法(英文)杨京辉;王立国;钱晋希【期刊名称】《应用地球物理:英文版》【年(卷),期】2014(11)4【摘要】针对传统的高光谱数据分类方法分类精度不高、没有充分地利用空间信息等缺陷,提出一种基于Gabor空间纹理特征(Gabor spatial texture features)及无参数加权光谱特征(Nonparametric weighted spectral features)和稀疏表达分类(Sparse representation classification)的高光谱图像分类算法,可以简写为Gabor-NW SF和SRC,即GNWSF-SRC。
所提出的GNWSF-SRC分类方法首先通过融合高光谱的Gabor空间特征和无参数加权光谱特征来更好地描述高光谱图像,然后通过其进行稀疏表达,最终通过对比其重构误差获得分类结果。
在训练集比例不同的情况下,用所提出的方法对两组典型的高光谱数据进行处理,理论研究和仿真结果表明:与传统的分类方法相比,所提出算法能够提高分类精度、Kappa系数等,取得了较好的分类效果。
【总页数】12页(P489-499)【关键词】高光谱;分类;稀疏表达;空间特征;光谱特征【作者】杨京辉;王立国;钱晋希【作者单位】哈尔滨工程大学信息与通信工程学院;中国空间技术研究院通信卫星事业部;北京邮电大学电子工程学院【正文语种】中文【中图分类】P【相关文献】1.基于光谱与空间特征结合的改进高光谱数据分类算法 [J], 李娜;李咏洁;赵慧洁;曹扬2.联合核稀疏多元逻辑回归和TV-L1错误剔除的高光谱图像分类算法 [J], 徐金环;沈煜;刘鹏飞;肖亮3.基于空谱特征的核极端学习机高光谱遥感图像分类算法 [J], 宋雯琦;闫德勤;刘德山;王军浩4.基于多任务联合稀疏表示的高光谱图像分类算法 [J], 贾立丽;张升伟;何杰颖;李娜5.基于高光谱图像稀疏表示的彩色可视化模型(英文) [J], 王立国;刘丹凤;赵亮因版权原因,仅展示原文概要,查看原文内容请购买。
基于二维图像矩阵的稀疏表示分类方法
程广涛;宋占杰;陈雪
【期刊名称】《天津大学学报》
【年(卷),期】2014(047)006
【摘要】利用稀疏表示对图像分类时,需要将二维图像转换为一维特征向量,这大大增加了计算复杂度和忽略了图像矩阵中固有的局部结构信息.为了解决上述问题,设计了完全基于二维特征矩阵的稀疏表示人脸分类方法.首先将二维图像转为2D Fisherface矩阵,然后直接利用二维矩阵求解稀疏表示和进行分类.整个识别过程中,不需要将二维图像转换为一维向量.实验结果表明,二维特征矩阵在稀疏表示分类中是十分有效的,设计的方法可以更快的运算速度达到更高的识别率.在ORL人脸数据库和Extended Yale B人脸数据库上的识别率分别达到97.5%和99.3%.
【总页数】5页(P541-545)
【作者】程广涛;宋占杰;陈雪
【作者单位】天津大学电子信息工程学院,天津300072;北华航天工业学院基础部,廊坊065000;天津大学理学院,天津300072;北京中医药大学东方学院基础部,廊坊065000
【正文语种】中文
【中图分类】TP391.41
【相关文献】
1.基于二维图像矩阵的ICA人脸识别 [J], 黄璞;陈才扣
2.基于稀疏带状矩阵的二维图像重建 [J], 杨海蓉;方红;张成;潘根安
3.基于傅里叶描述子和加权稀疏表示的军事图像分类方法 [J], 谢泽奇;张会敏;张善文
4.基于半监督子空间迁移的稀疏表示遥感图像场景分类方法 [J], 周国华;蒋晖;顾晓清;殷新春
5.基于L_(2,p)矩阵范数稀疏表示的图像分类方法 [J], 时中荣;王胜;刘传才
因版权原因,仅展示原文概要,查看原文内容请购买。
基于稀疏表示的高光谱图像分类
稀疏表示是一种对数据的编码方法,它将数据表示为若干个基函数的线性组合。
在高光谱图像分类中,每个像素点可以看作是一个多维向量,表示该点在不同波段下的反射光谱信息。
因此,可以对每个像素点进行稀疏表示编码,将其表示为若干个基函数的线性组合。
在实际应用中,可以使用字典学习方法学习一组基函数,用于对高光谱图像进行稀疏表示编码。
具体来说,通过对训练样本进行字典学习,得到一组基函数,然后使用稀疏编码方法对每个像素点进行编码,得到一个稀疏系数向量。
最后,将每个像素点的稀疏系数向量作为特征,使用分类器进行分类。
该方法的优点在于可以保留原始数据的光谱信息,同时能够利用稀疏表示的特性减少特征维数,提高分类效果。
同时,该方法还能够很好地处理高光谱图像中的噪声和光照变化等问题,提高分类结果的鲁棒性。
基于深度学习和稀疏表示的图像分类与检索方法研究图像分类和图像检索技术是当前计算机科学飞速发展和数字图像资源爆发式增长形势下智能信息处理领域研究的热点问题。
如何对图像内容进行有效的表示是图像分类和图像检索技术中一个关键问题。
目前,在图像分类与图像检索技术中,特征描述是图像表示的主要形式,存在着高维度与复杂性等问题。
图像的稀疏表示模型作为一种新兴的特征表示方法,能够有效解决实际应用中所存在的存储量、计算复杂度与图像解译性等方面的问题。
此外,深度学习技术的出现使得图像特征提取不再依赖于受人为主观因素影响的人工设计方法,而是着眼于通过大量数据来发掘数据中所隐含的深层次关系,使得图像特征的描述能力得到进一步的提升。
本文主要针对图像分类和图像检索中图像特征表示问题,研究了基于稀疏表示的图像表示方法和基于层次化特征提取的深度学习模型,以达到提升图像分类与检索性能的目的。
本文的主要工作包括:(1)提出一种基于稀疏表示和特征融合的图像检索方法:针对目前图像局部特征表达所存在的高维度与复杂性等问题,以“稀疏编码”为核心,通过字典学习、系数学习、特征池化等一系列操作,构建了基于稀疏表示的稀疏特征学习模型,所获得的特征描述相较于局部特征更具稀疏性与可区分性。
同时,根据人类视觉系统在认知过程中先整体而后局部的特性,结合Gist特征描述子在进行事物初划分上的高效性,构建了一种基于稀疏表示和特征融合的分阶段图像检索算法。
该算法的主要优点在于,一是传统的局部特征描述存在数量不等及高维度等问题,在图像检索应用领域局限性较大。
因此,采用基于局部特征的稀疏特征学习模型能够有效解决图像局部特征在图像检索领域的应用问题。
二是采用了结合全局特征和局部特征的分阶段检索结构,从而可以对图像进行全面的描述,进而提高了图像检索的性能。
在Coil20和改进的Caltech256数据集上进行的实验测试,验证了本文提出算法的有效性。
(2)提出一种基于卷积深度置信网络的图像分类与检索方法:首先,结合CNN中“局部感受野”的思想,在DBN模型中引入卷积操作,构建了一个由3个CRBM堆叠而成的卷积深度置信网络(CDBN),从而可以较好地获取到图像数据邻域的空间信息,获得到具备良好局部不变性和高层次的特征描述。
一种基于稀疏表示声纳图像识别方法
郝燕玲;王梁;张振兴
【期刊名称】《中国航海》
【年(卷),期】2011(034)003
【摘要】提出了一种基于灰度-梯度共生矩阵的稀疏表示声纳图像识别方法.该方法采用灰度-梯度共生矩阵对声纳图像进行特征提取,特征提取结果相比全局的特征提取包含了声纳图像的重要的纹理信息;并结合稀疏表示的分类方法对声纳图像进行识别.实验表明,该方法既满足了对声纳图像进行识别实时性,又提高了识别的准确性.【总页数】4页(P1-4)
【作者】郝燕玲;王梁;张振兴
【作者单位】哈尔滨工程大学自动化学院,哈尔滨150001;哈尔滨工程大学自动化学院,哈尔滨150001;哈尔滨工程大学自动化学院,哈尔滨150001
【正文语种】中文
【中图分类】U666.73;TP391.41
【相关文献】
1.基于多特征融合和稀疏表示的农业害虫图像识别方法 [J], 张永玲;姜梦洲;俞佩仕;姚青;杨保军;唐健
2.基于多重稀疏表示的声纳图像超分辨率重建方法 [J], 王梁;郝燕玲;张振兴
3.基于局部字典块稀疏表示的SAR图像目标识别方法 [J], 郭敦; 吴志军
4.基于稀疏表示的电力设备图像识别方法 [J], 刘树吉; 刘颖; 刘为; 同东辉; 刘雪松
5.基于稀疏表示的焊缝视觉图像缺陷识别方法 [J], 王飞;张素兰
因版权原因,仅展示原文概要,查看原文内容请购买。
基于稀疏表示和决策融合的图像分类方法Chu Yuezhong;Li Jiahao;Zhang Xuefeng;Ji Bing【摘要】利用多个稀疏表示分类器融合的决策信息对图像进行分类,可避免单个特征对图像分类的影响.提出一种自适应调节权重的多稀疏分类器融合图像分类方法.对原始图像分别提取3组不同特征,并训练出各自稀疏表示分类器;根据各个子分类器的准确率,通过迭代计算自适应确定各分类器最终权重;融合各子分类器的输出结果进行最终类别判断.基于Cifar-10图像数据集进行多组实验,结果表明,相对仅提取单特征的图像分类方法,该方法有效提高了图像分类准确率.【期刊名称】《计算机应用与软件》【年(卷),期】2019(036)007【总页数】6页(P249-253,326)【关键词】图像分类;决策融合;稀疏表示【作者】Chu Yuezhong;Li Jiahao;Zhang Xuefeng;Ji Bing【作者单位】;;;【正文语种】中文【中图分类】TP30 引言图像分类是当前计算机视觉、深度学习和人工智能等领域的研究热点。
在图像分类这一研究课题下,文献[1]对该课题近些年的发展作出总结和展望,表示多特征融合这一策略对图像分类具有非常关键的研究意义,并且在选取特征与分类器这两个关键环节的处理对最终分类效果具有深远影响,往往多特征伴随着高维度数据且伴有各类噪声影响。
压缩感知技术研究的热潮下,文献[2]提出稀疏表示下的人脸识别算法,通过训练样本来计算稀疏系数与字典,然后计算残差来获得最终分类的方法,取得很高的识别率。
从字典学习的角度,文献[3]提出KSVD字典学习算法,通过k次迭代,每步计算SVD分解来更新字典原子与对应系数的方法,从而获得优化的解。
文献[4]在其基础上改进并提出LC-KSVD算法,通过整合构建字典与优化线性分类器到重建的目标函数中,联合获取更优化的学习字典。
近些年各类基于稀疏表示的改进方法被不断提出[5],但很少有多特征融合结合稀疏表示分类器展开研究的方法,由于单一特征对图像描述不足以及分类器性能存在的差异性,导致传统的分类方法在最后的分类效果上性能的局限性较大。
基于傅里叶描述子的实装战技图像典型特征相似度检测方法赵莉;张克旺
【期刊名称】《南京理工大学学报》
【年(卷),期】2022(46)4
【摘要】实装战技图像典型特征目标提取精度较差,存在相似度检测准确率较低、耗时长等问题,该文提出一种基于傅里叶描述子的实装战技图像典型特征相似度检测方法。
通过Canny算子对实装战技图像进行典型特征检测,采用复合加权算法在频域与时域上提取实装战技图像的典型特征,并对傅里叶描述子进行初步归一化处理,使其具备尺度变换、平移、旋转不变性的特征,通过傅里叶变换与坐标逆变换,采集实装战技图像典型特征的全部相似区域节点,实现实装战技图像典型特征的相似度识别,并对实装战技图像典型特征的相似度进行检测。
试验证明,该文方法的检测耗时和准确率远优于现有检测方法,大幅提升了检测效果。
【总页数】6页(P406-411)
【作者】赵莉;张克旺
【作者单位】信阳农林学院信息工程学院
【正文语种】中文
【中图分类】TP391.4
【相关文献】
1.基于傅里叶描述子的形状特征匹配方法在机场掩体目标检测中的应用
2.基于分割区域及特征相似度的玉米田遥感图像分类方法
3.基于特征点群相似度计算模型的
图像表示方法4.一种新的彩色图像特征检测中相似度计算方法5.基于模糊颜色特征和模糊相似度的图像检索方法
因版权原因,仅展示原文概要,查看原文内容请购买。
基于稀疏表示和深度学习的图像识别算法研究
吕焦盛
【期刊名称】《新乡学院学报(自然科学版)》
【年(卷),期】2018(035)009
【摘要】针对传统的图像稀疏表示方法只注重提高特征的提取率而忽略了图像的多尺度信息,在对图像稀疏表示的过程中易受噪声干扰,及系统鲁棒性不高等问题,提出了多尺度稀疏表示方法.针对图像底层像素特征不稳定,易受环境影响,且不能反映语义信息等问题,提出利用深度网络具有的高层特征抽取这一能力,将多尺度稀疏表示和深度学习网络结合起来,构建完善的学习框架.实验结果表明,该算法可以提高图像的识别性能,同时增强系统的鲁棒性.
【总页数】4页(P31-34)
【作者】吕焦盛
【作者单位】郑州工业应用技术学院信息工程学院,河南郑州451100
【正文语种】中文
【中图分类】TP391.4
【相关文献】
1.基于深度学习的图像识别算法研究 [J], 屈薇
2.基于稀疏表示和深度学习的图像识别算法研究 [J], 吕焦盛
3.基于深度学习的图像识别算法研究 [J], 屈薇
4.基于深度学习的图像识别算法研究 [J], 李沛然
5.基于深度学习的图像识别算法研究 [J], 李沛然
因版权原因,仅展示原文概要,查看原文内容请购买。