基于稀疏表示的人脸识别算法研究
- 格式:doc
- 大小:352.50 KB
- 文档页数:12
基于稀疏表示的字符识别方法
张卫彬;陈雪
【期刊名称】《科技信息》
【年(卷),期】2013(000)006
【摘要】稀疏表示在模式识别的研究中已经得到广泛的关注。
本文提出了一种基于稀疏表示的字符识别方法。
我们首先求解测试字符图像在训练字符图像矩阵下的稀疏表示系数,然后通过估计最小重建误差来完成字符识别。
实验结果显示提到的方法在准确率和有效性方面都达到了满意的性能。
【总页数】2页(P273-274)
【作者】张卫彬;陈雪
【作者单位】廊坊职业技术学院;北京中医药大学东方学院基础部
【正文语种】中文
【相关文献】
1.基于RPCA的群稀疏表示人脸识别方法
2.基于l2-范数重构样本约束的稀疏表示人脸识别方法
3.基于小波分析和复矩阵稀疏表示的人脸识别方法
4.基于小波分析和复矩阵稀疏表示的人脸识别方法
5.基于稀疏表示的焊缝视觉图像缺陷识别方法
因版权原因,仅展示原文概要,查看原文内容请购买。
基于低秩矩阵恢复的群稀疏表示人脸识别方法胡静; 陶洋; 郭坦; 孙雨浩; 胡昊; 王进【期刊名称】《《计算机工程与设计》》【年(卷),期】2019(040)012【总页数】6页(P3588-3593)【关键词】人脸识别; 群稀疏; 低秩恢复; 低秩映射矩阵; 重构残差【作者】胡静; 陶洋; 郭坦; 孙雨浩; 胡昊; 王进【作者单位】重庆邮电大学通信与信息工程学院重庆400065【正文语种】中文【中图分类】TP391.40 引言人脸识别有着广泛的应用前景。
但人脸数据类别多,每类数据少,不同人脸结构相似,是众多从事人脸识别研究的学者所面临的挑战。
稀疏表示(sparse representation based classification,SRC)[1]是目前人脸识别领域的热门研究方向,该方法实质上是最近邻(nearest neighbor,NN)[2]类内表示策略分类器的扩展。
SRC激发了一系列算法的提出,如模糊稀疏表示方法[3]、自适应加权空间稀疏表示方法[4]以及基于稀疏稠密混合表示的方法[5]等。
SRC方法要求训练样本是在较为理想的情况下采集的,而当训练图像中存在由遮挡、表情等引起的变化时,会破坏人脸图像样本。
另外,由于不同人脸间的相似性,SRC所得的表示系数虽然是稀疏的,但往往分布在多个类别,易导致误分类。
针对SRC方法的第一个问题,可以从训练集中分离出鉴别性的信息,如文献[6]中的鲁棒主成分分析算法(robust principal component analysis,RPCA),可将受污染的样本矩阵分解为低秩逼近矩阵和稀疏误差矩阵。
Chen等将低秩表示与低秩矩阵恢复(low rank matrix recovery,LR)[7]技术结合起来用于恢复数据中潜在的低秩结构,提出一种结构非相关性约束(low-rank matrix recovery with structural incoherence,LRSI)的思想[8]。
机器学习中的稀疏表示及其应用研究近年来,随着机器学习技术的发展,越来越多的注意力被集中在了稀疏表示技术上。
稀疏表示是一种在高维数据上进行特征提取的方法,它可以将原始数据压缩到一个更小的子空间中,从而提高了机器学习的效率和准确度。
在本文中,我们将主要介绍机器学习中的稀疏表示技术及其应用研究。
一、稀疏表示的基本原理在机器学习中,稀疏表示通常是指使用少量基函数来表示原始数据。
这些基函数通常由奇异值分解(SVD)或主成分分析(PCA)等方法提取得到。
假设我们有一个数据向量x,其稀疏表示y可以通过以下公式计算得到:y=argmin||x-Dy||2+λ||y||1其中,D是一个基函数矩阵,y是一个系数向量,λ是正则化系数。
最终得到的稀疏系数y可以用来表示原始数据向量x,因为大部分系数都为0,只有很少的非零系数才有实际意义。
二、稀疏表示的优点及应用领域与传统的特征提取方法相比,稀疏表示有以下优点:1. 高效性:稀疏表示可以将高维数据压缩到一个更小的子空间中,从而提高了机器学习的效率和准确度。
2. 鲁棒性:稀疏表示具有良好的鲁棒性,即使在存在较大的噪声或缺失数据的情况下,也能提取出有效的特征,从而提高机器学习的准确度。
3. 可解释性:稀疏表示可以提取出少量有实际意义的特征,使其更易于解释和理解。
稀疏表示在很多领域都有应用,例如:1. 图像处理:稀疏表示可以用来减少图像的噪声,同时提取出重要的特征,例如图像的边缘和纹理。
2. 语音识别:稀疏表示可以用来识别语音中的重要特征,例如音量和音调,并且可以减少语音中的噪声。
3. 数据挖掘:稀疏表示可以用来提取数据中的重要特征,从而帮助数据挖掘和统计分析。
三、稀疏表示的应用案例在机器学习中,稀疏表示已经成功应用于很多实际问题中。
以下是几个例子:1. 图像去噪稀疏表示可以用来去除图像中的噪声。
一般情况下,利用稀疏表示,可以将原始图像表示为一些基函数的线性组合,其中大部分系数都为0。
人脸识别调研报告(共20篇)人脸识别调研报告(共20篇)第1篇人脸识别小结人脸识别总结一.概述生物特征识别技术包括人脸识别.指纹识别.语音识别.表情分析及理解.虹膜识别等人脸识别的实质就是借助计算机工具来分析人脸面部图像,采用不同的特征表示方法提取有效地人脸特征,是可用来辨识身份的一门自动处理技术,常见重要应用案例包括银行和军事重地的自动门禁系统.智能人脸监控系统.用于公共交通体系中安检系统的嫌疑人自动识别系统.网络服务中的在线验证系统等。
产生不同个体较大差异性的内在因素主要有种族.性别.年龄.心理等。
外在因素主要有光照变化.角度偏转.姿态.噪声千扰.遮挡.以及化妆遮挡物等。
18世纪,就有一篇依据人脸特征信息进行身份鉴别的文章发表在Nature上,开启了近代最早的人脸识别研宄,最早的自动人脸识别系统是由Chan和Bledsoe创于1965年人脸识别包括四个主要步骤图像预处理.人脸检测.面部特征提取和分类识别。
二.研究领域1.身份验证领域通过人脸识别技术来判断和鉴别当前用户是否合法或者具备相应的功能权限,例如年__奥运所采用的人脸识别系统。
2.智能视频监控领域,例如车站安装智能监控系统,该系统中加入了人脸识别技术以捕捉人群中的可疑罪犯。
3.人机交互领,例如人脸面部为视觉系统提供了最为主要的特征信息。
三.人脸识别方法及其算法(一)方法分类可以分为基于几何特征的人脸识别.基于弹性图匹配的人脸识别.基于子空间分析的人脸识别.基于神经网络的人脸识别.基于隐马尔可夫模型等。
经典的特征脸“Eigenface”就是该时期由麻省理工学院的M.Turk和A.Pentlaiid提出的,采用PCA变换对原始图像进行降维处理,然后再进行分类识别。
P .Belhumeur等提出的Fisherfaces人脸也被广泛应用在人脸识别中。
90年代中后期,出现了一种基于动态连接结构Dynamic Link Architecture的弹性图匹配Elastic GraphMatching识别方法。
目录1 绪论 (2)1.1 背景及意义 (2)1.2 发展状况 (2)2 人脸识别 (3)2.1 人脸识别概念 (3)2.2 影响因素及相应解决方法 (4)2.2.1 光照问题 (4)2.2.2 姿态问题 (4)2.2.3 数据库大小问题 (4)2.2.4 遮挡、年龄、表情等问题 (5)3 稀疏表示 (5)3.1 稀疏表示的意义 (5)3.2 稀疏表示的概念 (5)4 基于稀疏表示的人脸识别 (6)4.1 基于稀疏表示的人脸识别原理 (6)4.2 基于稀疏表示的人脸识别算法 (8)4.2.1 正交匹配追踪算法 (8)3.2.2 快速正交匹配追踪 (9)5 实验结果与分析 (9)5.1 有表情变化的实验 (10)5.2 不同光照条件的实验 (11)6 结束语 (11)基研究摘要:稀疏表示的数学实质就是在超完备字典下对给定信号的线性分解。
本文研究了一种基于稀疏表示的正交匹配追踪(orthogonal marching pursuit,简称OMP)算法,递归的对所选原子集合进行正交化,并且利用矩阵cholesky分解简化迭代过程中矩阵求逆的计算。
在人脸识别的实际应用中,利用实验样本构建冗余字典,将待检测样本表示成试验样本的线性组合。
通过在不同人脸库上的实验证明了该算法的有效性。
关键字: 稀疏表示;稀疏编码;人脸识别;正交匹配追踪ABSTRACT1 绪论1.1 背景及意义随着科技的迅猛发展,人类社会已经进入信息时代,信息安全问题日益得到高度重视。
钥匙、密码、证件等传统形式的身份认证技术已经远远不能完全满足现代社会中对信息安全有高质量要求的部门的需要。
因此,新一代的身份认证技术应运而生。
人的生物特征具有唯一性、稳定性等多种优点,已逐渐成为新一代的身份认证技术的主要依据。
在众多的基于生物特征的身份识别技术中,人脸识别技术因其自然性、友好性等显著优势而受到广泛关注,目前已经被应用到模式识别、人工智能、计算机视觉、认知科学等多个领域中。
然而,由于人脸图像易受到光照、姿态、遮挡和表情等多种因素的影响,识别效果也易受图像数据库大小的干扰,计算机智能识别课题的研究仍然具有较高的挑战性。
目前一些学者将稀疏表示用于人脸识别,得到了国内外学者的广泛关注,其基本思想是将待分类图像表示为以训练图像本身作为基原子的字典的稀疏线性组合。
1.2 发展状况1888年,《Nature》上发表了第一篇利用人脸进行身份识别的文章,由此开启了近代对人脸识别技术的研究。
1965年,Chan和Bledsoe共同创建了世界上第一个自动人脸识别系统。
随着计算机技术的迅猛发展和相关理论的日益成熟,人脸识别技术的到了快速的发展与广泛的应用,其发展过程大致可以划分为以下三个阶段:起步阶段早期人脸识别技术主要利用人脸的几何结构特性(Geometric Feature Based)以及它们之间的角度、距离和区域形状等参数作为识别依据。
在这一阶段,很多参数的测定需要人工标定,因此只能称之为半自动人脸识别系统,但是这种方法的提出为后续其他方法的提出提供了理论参考。
发展阶段90年代初,研究人员发现人脸图像之间存在很强的相关性,人脸图像本身只是高维图像空间中的一个子空间,若直接使用,会因维数过高而产生“维数灾难”等问题。
因此,各种降维方法陆续产生。
本阶段主要产生了线性判别分析(Linear Disriminant Analysis,简称LDA)算法、主成分分析(principa l component analysis,简称PCA)算法以及统计模式识别方法等多种算法。
攻坚阶段进入二十一世纪,人脸识别技术进入攻坚阶段。
在前两个阶段的发展过程中,人脸识别技术已经积累了丰富的理论和大量的算法,基本能够解决可控条件下的身份识别问题。
但是,非理想条件、大规模人脸数据库等问题下的人脸识别仍有待解决。
针对这些问题,产生了等距离映射(Isometrical Mapping,简称ISOMAP)、局部线性嵌入(Locally Linear Embedding,简称LLE)、最大方差展开(Maximum Variance Unfolding ,简称MUV)等多种方法,基于稀疏表示的人脸识别方法也生在这一阶段脱颖而出。
2 人脸识别2.1 人脸识别概念人脸识别就是利用人脸的生物特征对身份进行判别,这些生物特征可分为眼、鼻、嘴的几何形状或关系等外部特征以及人脸的结构关系等内部特征两个方面。
2.2 影响因素及相应解决方法2.2.1 光照问题人脸识别系统的性能与人脸识别算法的设计以及人脸图像的质量等有密切的关系。
在影响人脸图像质量的众多因素之中,光照问题不容忽视。
一般将人脸识别中处理光照问题的方法分为三类:基于图像处理技术的方法;基于子空间的方法;基于光照不变特征提取算法。
基于图像处理技术的方法主要从图像本身出发,利用对光照变化不敏感或无变化的特征进行图像处理。
基于子空间的方法原理是同一物体在不同光照下的图像属于一个低维度的线性子空间,通过寻求与输入图像最为接近的子空间进行识别。
基于光照不变特征提取方法的算法可以分为传统光照不变特征提取和基于人脸反射系数的光照不变特征提取两大类。
2.2.2 姿态问题姿态问题同样也是人脸识别中亟待解决的一个难点。
目前多数的人脸识别算法仅适用于正面或准正面的人脸图像条件下的人脸识别,对于其他姿态下的人脸图像,识别率相对较低。
针对这一问题,目前已经提出了局部线性回归(Locally Linear Regression,简称LLR)算法、基于神经网络的方法和光度立体分析等方法。
2.2.3 数据库大小问题在人脸识别技术中,人脸图像数据库的大小存在两种极端情况:①人脸图像数据库过大;②单样本或少样本人脸数据库。
如果人脸图像数据库过大,则对相关算法的运算速度要求较高,如果人脸图像数据库样本过少,则会影响人脸识别的正确率。
针对数据库过大问题,目前主要提出了主成分分析、线性辨别分析和隐马尔可夫模型等方法来提高效率。
针对单样本问题,主要的解决方法有样本扩张法、图像增强法和特征子空间扩张法等。
2.2.4 遮挡、年龄、表情等问题喜怒哀乐,生老病死是所有人类都不可避免的人生成长经历。
然而,伴随而来的表情表情年龄、遮挡等问题给自动人脸识别系统的设计增加了很大的难度。
目前,针对表情及年龄问题,已提出了基于多分类融合的3D 算法、利用三维数据对图像进行重构等方法;针对遮挡问题,也已提出了带遮挡人脸的支持向量机、尺度不变特征变换(Scale Invariant Feature Transform ,简称SIFT )、随机非均匀局部Gabor 二值模式(Random Nonuniform Local GaborBinary Pattern ,简称RNLGBP )等算法。
3 稀疏表示3.1 稀疏表示的意义香农定理表明,模拟信号可以用一定采样频率的周期函数来表示。
然而,这种表示方法对信号的分析带来了一些不便。
对于压缩问题,希望用较少的系数表示较多的信息;对于识别问题,希望信号的主要特征突出;对于去噪问题,希望将有用信号与噪声进行有效分离。
这些应用都有一个共同的特点,就是简化信号的表示(稀疏化)。
稀疏表示是压缩感知中的关键理论,数据的稀疏表示,可以从本质上降低数据处理的所需成本,有效提高压缩效率。
目前,稀疏表示已经被广泛地用于人脸识别算法中。
与传统的算法相比较,基于稀疏表示的人脸识别算法具有识别率高、鲁棒性强的突出特点。
3.2 稀疏表示的概念研究人员发现,通过使用原子库(过完备冗余函数体系)取代传统完备正交函数集,可有效从原子库中找到具有最佳线性组合的n 项原子信号来表示一个给定信号,而这些组合的系数大部分为0或接近于0,即稀疏表示。
稀疏表示主要采用稀疏逼近原理即高度非线性逼近原理。
对于一个给定集合S ={i u ;i=1,2,…,I },其元素i u 是张成整个Hilert 空间H =M R 的单位矢量,I ≥M 。
集合S 称为原子库,元素i u 称为原子。
对于任意给定的信号f H ,预想在S 中自适应的选取n 个原子对信号做n 项逼近:n f =nr r r K c u ∈∑ (1)其中n K 是r u 的下标集,card (n K )=n , 则B=span (r u ,r ∈ n K )就是由n个原子在原子库S 中张成的最佳子集。
我们定义逼近误差为:n σ(f ,S )=int nn f f f -P P (2) 由于n 远小于空间的维数M ,所以这种逼近也被称作稀疏逼近。
由于原子库存在定的冗余性,知上式存在多组解。
稀疏表示的目的就是从中选取解的系数最为稀疏的或使n 取值最小的解。
这个问题等同于下述问题:Min imize 0c P P subject to f =0Ik k i c u =∑ (3)稀疏表示的最初目的是为了以低于香农定理的采样频率表示和压缩信号,事上,在去噪方面,小波变换和平以不变小波也开发出许多有效算法;稀疏表示已成功应用与图像动态范围的压缩,图像卡通和纹理成分的分离等。
在这些应用中,算法的性能取决于表示的稀疏性是否忠实于原始信号。
4 基于稀疏表示的人脸识别4.1 基于稀疏表示的人脸识别原理训练集图像图像预处理特征提取图像预处理特征提取 识别结束稀疏表示分类图1 基于稀疏表示的人脸识别框图稀疏表示人脸识别算法主要建立在压缩感知理论的基础之上。
假设每个用户的注册图像都可以在图像空间中划分出一个相对独立的子空间,且任意一张人脸图像都可以由同一用户自身的注册图像集的线性组合来表示,通过计算计算待检测图像相对于所有注册图像集的稀疏表示系数来揭示该待测试图像所属的用户类别。
设给定的注册图像集A 中有i 类已标记好的注册用户,其中第k 类中含有kn 个样本。
则属于第k 类的图像集合可以用矩阵k A =[1k a ,2k a ,...,k kn a ]∈k m n R ⨯来表示,且每个图像对应于矩阵的一个列向量,m 为人脸图像的维数。
为了提高效率,现假定每个注册用户的矩阵对应于用于稀疏表示的训练字典。
对于任意给定的测试图像y ,若其属于某一注册图像集所包含的类别j A ,那么便可以用jA 的线性组合来表示。
为便于理解, 现假设第k 类中有足够多的训练图像构成矩阵k A ,且待测试图像1y 属于第k 类,则可以用具有相同类别属性的第k 类训练图像的线性组合近似表示待测试图像1y ,即1y =1k x 1k a +2k x 2k a +...+k kn x k kn a 其中kj x ∈R ,j=1,2,…,k n (4)然而,一般情况下的待测试图像所属类别并不知晓,因此用于实验的图像字典是由i 类训练图像集的所有样本共同构成的,即:A=[1A ,2A ,...,i A ]=[11a ,12a ,...,11n a ,...,1i a ,...,i in a ] (5)因此,任意待测试图像y 就可以用字典线的性表示,即:Y =Ax (6) 其中x =[0,0,…,0, 1k x ,2k x ...,k kn x ,0,0,...,0]T ∈R m 是一个很稀疏的系数矢量。