基于压缩感知的人脸识别算法
- 格式:doc
- 大小:24.50 KB
- 文档页数:3
0 引言人体生物特征识别技术包括人脸、指纹、手掌纹、虹膜、声音、体型等,其中,人脸识别是最容易被用户接受的身份认证方式之一。
目前,高精度的人脸验证模型多是以对计算资源要求高的深度卷积神经网络为基础建立的,这些模型使用大量的数据进行训练,模型复杂且具有非常多的参数,需要消耗大量计算资源,难以在移动设备和嵌入式设备中运行。
因此,低内存占用、低计算资源消耗的轻量级神经网络成为当前的研究热点。
非轻量级人脸识别网络具有较高的识别精度,但是参数量较大,如DeepFace、DeepFR等。
本文提出了一种基于压缩激活机制的轻量级人脸识别网络,减少了MobileFaceNet网络头部卷积核的数量,降低模型的复杂度;并且引入squeeze-and-excitation结构[1],增加网络的感受野和学习特征的能力,使得网络具备从整个图像更多地关注人脸关键部位的能力,进而提高网络的识别精度。
1 基于压缩激活机制的轻量级人脸识别网络1.1 网络结构设计基于压缩激活机制的轻量级人脸识别网络(Squeeze and Excitation Mobile Face Net,SEMFN)结构见表1。
每一行代表网络的一层,每一列的含义依次为:输入流,具体操作,输出通道数量,瓶颈层中扩展的通道数,卷积核的大小,卷积计算的步长,重复次数,NL表示使用的非线性变换函数,本文使用PReLU[2]作为非线性激活函数。
表1 基于压缩激活机制的轻量级人脸识别网络输入操作输出通道扩展通道卷积核步长重复次数NL 1122×3conv3*316-311prelu 1122×16SE-DW Conv16-311prelu 1122×16bottleneck3264321prelu 562×32bottleneck64128331prelu 282×64bottleneck64128311prelu 282×64bottleneck128256321prelu 142×128bottleneck128256314prelu 142×128bottleneck128512321prelu基于压缩激活机制的轻量级人脸识别网络设计黄伦文(安徽四创电子股份有限公司,安徽 合肥 230031)摘要:基于深度卷积神经网络的人脸识别算法具有较高的识别精度,但是计算复杂度高,难以在移动设备或离线环境下运行。
基于压缩感知和图像分块的遮挡人脸识别张近;夏凌;李光瑞【摘要】针对基于压缩感知的SRC算法对遮挡人脸识别效果不够理想的问题,提出一种先将图像分块再进行识别的方法.将遮挡分散在尽可能少的分块中以降低遮挡对人脸识别的不利影响,从而提高识别率.在AR人脸数据库上的实验结果表明,使用该方法的遮挡人脸识别率可超过80%,显著高于基本SRC算法40%~ 50%的识别率.【期刊名称】《西华大学学报(自然科学版)》【年(卷),期】2015(034)003【总页数】5页(P13-16,45)【关键词】遮挡人脸识别;压缩感知;图像分块;SRC算法【作者】张近;夏凌;李光瑞【作者单位】西华大学电气与电子信息学院,四川成都610039;西华大学电气与电子信息学院,四川成都610039;西华大学电气与电子信息学院,四川成都610039【正文语种】中文【中图分类】TP391.41人脸识别技术是将静态图像或视频中检测出的人脸图像与数据库中的人脸图像进行对比,并从中找出与之匹配的人脸的技术,其目的是进行身份的识别与鉴定。
人脸识别技术以其方便、友好、非侵犯性等优点,被广泛应用于各种场合;但是,人脸识别技术依然存在光照、姿势、遮挡等问题需要解决,其识别精度还远不及指纹等其他生物特征识别技术[1-4]。
压缩感知(compressed sensing,CS)理论,是近几年被提出的革命性理论[5]。
其基本思想是如果信号在某个变换域是稀疏的,就可以用一个与变换矩阵不相关的测量矩阵将变换域的高维信号投射到低维空间中,得到压缩后的信号,然后再对这个压缩信号求最优解,就能够基本无失真地重建出原始信号。
压缩感知理论已被应用于信号处理和图像处理等领域,并取得了丰富的应用成果。
压缩感知同样也被应用于人脸识别,最典型的应用是基于稀疏表示的分类算法[6](sparse representation-based classification,SRC)。
SRC算法在人脸识别上具有很多优势,尤其是对噪声有着很好的鲁棒性,但对遮挡人脸的识别却不够理想。
一种2DDCT与压缩感知结合的人脸识别路翀1,3 ,刘晓东1 ,刘万泉2(1)大连理工大学电信学部,辽宁,大连 116024;2)澳大利亚科庭大学,西澳,佩斯市 6102;3)伊犁师范学院,新疆,伊宁 835000)摘要: 针对压缩感知(Compressed Sensing,CS)方法需将图像矩阵转化为向量后进行特征提取,导致数据维数很大,计算复杂等缺点,提出二维离散余弦变换(2DDCT)和压缩感知(Compressed Sensing,CS)相结合的人脸识别方法。
新方法首先利用2DDCT将图像变换到频域,压缩人脸图像以去掉人眼不敏感的中频分量与高频分量,这样有效降低了所需特征的维数,减少了计算量;然后通过感知算法进行特征提取得到人脸识别特征,最后运用最近邻分类器完成人脸的识别。
在ORL、Yale及Feret人脸数据库的实验结果证明了该算法的有效性与稳健性,特别是在YaleB人脸数据库运用该方法得到了很好的试验结果。
关键词: 人脸识别;特征提取; 压缩感知; 离散余弦变换文章编号:文献标识码: A 中图法分类号:TP391.4A face recognition algorithm based on combination 2DDCT andCompressed SensingLU Chong1,3,LIU xiaodong1,LIU wanquan31 School of Electronic and Information Engineering DLUT, Dalian, 116024, China2 Curtin University, Perth WA, 6102, Australia ,3 YiLi Normal College, Yining, 835000, ChinaAbstract: In this paper an improved face recognition algorithm is proposed based on the combination of 2D discrete cosine transform (2DDCT) and Compressed Sensing(CS)because of CS. CS first transforms an image matrix to a vector which caused high dimensionality and computational complexity. In this paper the original face image is processed by 2DDCT to reduce the character dimensions effectively. Then, the image is processed by CS to obtain the face recognition features. Finally, the nearest neighbor (NN) classifier is selected to perform face recognition. The experimental results on ORL , Yale and Feret face databases show that this method is robust and effective in the face recognition , especially in the face database YaleB.Key words: Face Recognition; feature extraction; Compressed Sensing(CS); 2DDCTl 引言人脸识别技术在国内外许多领域得到了广泛应用[1],研究者们为提高识别率提出了许多人脸识别方法。
基于压缩感知的红外人脸识别作者:杜梅曹蔚然来源:《软件工程》2019年第01期摘; 要:压缩感知理论是一种全新的数据采集技术,其采用非自适应线性投影来保持信号的原始结构,通过数值最优化问题准确重构原始信号。
本文利用压缩感知的优秀特性,采用基于稀疏表示的模式分类方法,通过提取红外人脸图像的全部信息作为特征并建立特征矩阵,将待识别人脸作为压缩感知测量值,并通过正交匹配追踪算法进行重构,根据重构的稀疏系数所属类别进行红外人脸识别。
实验表明,基于压缩感知的红外人脸识别结果准确率高。
实验验证了本算法的有效性。
关键词:压缩感知;稀疏表示;红外人脸识别中图分类号:TP751.1; ; ;文献标识码:AInfrared Face Recognition Based on Compressed SensingDU Mei,CAO Weiran(Software Institute,Shenyang Normal University,Shenyang 110034,China)Abstract:As a new data acquisition technology,compressed sensing theory uses non-adaptive linear projection to maintain the original structure of the signal,and accurately reconstructs the original signal through numerical optimization.In this paper,a pattern classification method based on sparse representation is used.By extracting all the information of the infrared face image as the features and establishing feature matrix,the face to be recognized is taken as compressed sensing measurement value,which is reconstructed through the orthogonal matching pursuitalgorithm.Finally,the face is recognized according to the category of the reconstructed sparse coefficient.Experiment results prove the high accuracy and effectiveness of the infrared face recognition based on compressed sensing.Keywords:compressed sensing;sparse representation;infrared face recognition1; ;引言(Introduction)压缩感知理论[1-6]为数据采集技术带来了革命性的突破,得到了研究人员的广泛关注。
一种基于压缩感知的单样本人脸识别方法周建华【摘要】针对人脸姿态、光照和表情等各方面原因引起人脸识别率不高的问题,提出了一种基于单样本特征点形变成冗余样本的压缩传感人脸识别方法.将人脸图像信号进行小波变换得到系数的稀疏表示,采用高斯随机测量矩阵进行测量得到离散人脸单样本,基于特征点形变人脸三维模型生成冗余样本,通过稀疏特征点正交匹配追踪非线性重建算法重建冗余图像进行人脸识别.仿真实验结果表明,所提出的算法相对于同类算法,时间复杂度较低、精确度较高、鲁棒性较强,且随复杂环境变化,其优势更明显.【期刊名称】《佳木斯大学学报(自然科学版)》【年(卷),期】2015(033)006【总页数】3页(P855-857)【关键词】压缩感知;稀疏特征;单样本;冗余样本;人脸识别【作者】周建华【作者单位】湖南警察学院,湖南长沙410138;湖南大学信息科学与工程学院,湖南长沙410082【正文语种】中文【中图分类】TN912.340 引言近年来,压缩感知在图像处理理论与实践方面均匀重大突破,作为一种全新的信号采样理论,采用非线性重建模型以较高质量地重构原始信号,在压缩感知框架下进行人脸识别能利用信号的稀疏结构和不相关性,可以大大提高识别效率.1 人脸图像压缩感知过程将人脸图像一维化成n 的离散信号x,记作x(n),n ∈[1,2,…,N][1].根据信号表示变换理论,X 用一组基ΨT=[Ψ1,Ψ2,…,Ψn,…,ΨN]的线性组合表示,则式中,λp=<X,Ψp >假设人脸图像信号X 在某个变换基Ψ 上有且仅有K 个大系数(其他系数等于零或者接近于零),则认为变换基是X 上的其中一个稀疏基(可以找到图像信号多个稀疏基).如果只有k 项非零系数,而其他系数均为零,定义其图像信号为严格稀疏信号,但在复杂背景、光照及表情变化下导致拍摄人脸图像信号基本上满足不了其要求,若信号在某变换基下系数快速衰减,并呈指数级变化趋向于零,则认为该图像信号是广义上的稀疏信号(有时定义为可压缩信号),则(1)式经压缩观测变换表示为式中:Φ 称为测量矩阵,大小为M×N,y 为观测所得向量M×1,x 为原信号N×1(M <<N),但x 一般不是稀疏的,但在某个变换域Ψ 是稀疏的,即x=Ψθ,其中θ 为K 稀疏的,Ψ 称为变换矩阵,大小为N×N,是信号x 在Ψ 变换域的稀疏表示,即θ 只有K 项非零项.此时y=ΦΨθ,令A=ΦΨ,A 称为CS信息算子,大小为M×N,则y=Aθ.Ψ 在对拍摄的原始人脸图像进行小波变换或小波包变换得到稀疏系数按照低频、横向高频、纵向高频和斜向高频分块处理之后,在满足约束等距性RIP 条件下构建一个与小波正交基线性不相关的观测矩阵Φ,RIP性质能保证观测矩阵Φ 把两个不同的K 稀疏信号映射到同一个集合中(保证原空间到稀疏空间的一一映射关系)的概率为零,构成的条件为观测矩阵中抽取的任意M 个列向量构成的矩阵是非奇异的[2].将人脸图像信号矩阵与观测矩阵Φ 乘积运算,经过降维计算后得到与观测矩阵维度相同的观测测量值Y 矩阵,对其小波域系数以特征点为中心进行重新排列分块,通过块稀疏的正交匹配算法BOMP 求解最优化重建恢复,其问题核心是获取测量矩阵值y 和给定观测矩阵Φ 的基础上,通过变换求解上式(2)得到原人脸图像信号矩阵X,重建过程是求解下式最优问题为上式可通过匹配追踪算法BP、正交匹配追踪算法OMP、梯度投影算法GP 等来实现人脸模糊图像信号重建,本文考虑人脸图像分块特性,采用基于图像小波域特征点为中心的分块采样策略,分块分频率重建.上式中但我们常对将0 范数转化为1范数问题进行求解,使病态问题具体化求解[3].2 基于稀疏特征的冗余样本定义三角网络人脸模型中前额、眉毛、瞳孔、眼白、耳朵、面颊、鼻子、嘴唇、下颚等特征点,通过文献[3]算法在三维网络人脸模型定位后确定其N个特征点的三维坐标并创建特征点数据库.令其对象N 个特征点υ1,υ2,…,υN,设π(υi)(i=1,2,…,M)是从输入源空间到特征目标空间的映射,设其均值为Ψ,即=Ψ(其中Ψ →0),假定在特征目标空间中的协方差矩阵ζ =通过λσ=ζσ 来计算ζ 的特征值λ,可变换成由(4)、(5)、(6)综合,可得令k ij=π(υi)π(υj),可将(4)式化简为Mλa=ka,求出其特征点特征值和向量[4].设λ1 ≥λ2≥,…,≥λn 按照特征显著性排列表示其m 个光照、姿态、纹理综合三维特征值,a1,a2,…,am 表示其对应的三维特征向量,那么第i 个输入特征矢量在三维人脸模型空间中的降维变换表示为将原始人脸的N 个顶点的三维模型特征点样本集表示为图1 同一张人脸在q 取不同的值时重构的人脸图像图2 实验选取的ORL 库人脸图像其中X 表示其特征点光照特征向量,Y 表示其特征点姿态特征向量,Z 表示其特征点纹理特征向量.令γ 为变换组合系数,从而可以冗余生成出多个光照、表情及姿态的人脸特征表示为令kij=π(υi)π(υj),可将上式化简为Mλa=ka,可求出其特征点特征值和特征向量.构造训练样本为人脸样本的超完备字典,对其进行稀疏化特征表示为测试样本,寻找最佳稀疏表示自然能区分出训练样本中的不同类别[5].取前k 个最大特征值对应的特征向量构成稀疏变换矩阵P =[p1,p2,…,pk],根据确定K 的,其中为样本协方差矩阵的特征值.q 的取值范围为0 至1 之间,q 越大,其变换在光照、姿态、纹理等方面相似性越大,对原始人脸图像经过上述稀疏变换、块分解作为稀疏训练样本q 取不同值,对应不同特征人脸图像,如图1 所示.3 实验过程及结果分析本文根据上述方法,从ORL 人脸数据库中选择五个人其中任意一张人脸图像为训练样本,ORL库中剩下的其他的人脸图像(包括本人和他人的)为测试样本进行实验.选取的ORL 库人脸图像如图2 所示.在单样本情况下,基于压缩感知和稀疏特征点,获取了更多的细节信息生成多样本人脸,通过多样本多特征匹配进行识别分类.通过10 副图像进行识别平均计算,本文所提的算法在时间复杂度上有所降低,在识别精度上大大提高,如表1 所示.表1 几种人脸识别算法在复杂度、精确度及耗时的比较Algorithm time complexity Accuracy Identification time(ms )PCA O(n3)94.27% 148.9 HMM O(n3) 94.71% 101.4 Bayes O(n3) 95.12% 151.7本文 O(nlogn)97.74% 107.9 4 结论本文利用压缩感知在图像处理上的优势提出的基于压缩感知单样本人脸识别方法,对原始人脸图像进行小波变换或小波包变换得到稀疏系数按照低频、横向高频、纵向高频和斜向高频分块处理之后,将人脸图像信号矩阵与观测矩阵乘积运算,得到与观测矩阵维度相同的观测测量值矩阵,在三维网络人脸模型定位后确定其显著性特征点的三维坐标,以坐标为中心点重新排列分块,通过块稀疏的正交匹配算法求解最优化重建恢复,该方法充分利用信号的稀疏结构和不相关性,大大提高人脸识别效率.参考文献:[1] Gross R,Matthews I,Cohn J.Multi-PIE[J].Image and Vision Computing,2010,28(5):807-813.[2] Chang Xueping,Zheng Zhonglong,Duan Xiaohui,et al.Sparse Representation -based Face Recognition for one Training Image Per Person[A].Advanced Intelligent Computing Theories and Applications [C].Berlin Heidelberg:Springer,2010:407-414.[3] Lu Jiwen,Tan Yap-peng,Wang Gang.Discriminative time Analysis for Face Recognition From a Single Training Sample Per Person[J].IEEE Transactions on Pattern Analysis and Machine Intelligence.2013,35(1):39-51.[4]方红,章权兵,韦穗.基于非常稀疏随机投影的图像重建方法[J].计算机工程与应用,2007,43(22):25-27.[5]周建华.一种PCA 和SVM 多生物特征融合的视频人脸识别[J].佳木斯大学学报(自然科学版),2010,28(4):1-4.。
一种基于压缩域模板匹配的快速人脸检测算法王剑峰【期刊名称】《计算机技术与发展》【年(卷),期】2011(021)006【摘要】The face detection and tracking is the key technology in the field of face information processing,it widely applied in the fields of automated face recognition system,content based image retrieval, video monitoring,shortcut detection and human-machine alternative technology. Firstly,detect the skin area of one image with the statistics theory, next, convert these area into compress domain through discrete Walsh transform, lastly,propose the new eight directions chain code template and angle template to judge whether the face region or not. The experimental results show the superiority of the proposed algorithm in terms of human face retrieval precision and speed, it also very suitable for face detection system that requires the timeliness highly.%人脸的检测是人脸信息处理领域中的一项关键技术,在自动人脸识别系统、基于内容的图像检索、视觉监测、场景检测、新一代人机交互技术等领域具有广阔的应用前景.通过在压缩域利用DC系数重构图像,提出了改进的链码模板和通过训练产生角度模板来对候选区域进行搜索匹配和检测.实验结果显示,本方法在检测人脸的过程中速度快,漏检率较低,非常适合实时性要求高的人脸检测系统.【总页数】3页(P116-118)【作者】王剑峰【作者单位】重庆航天职业技术学院,重庆400021【正文语种】中文【中图分类】TP301.6【相关文献】1.一种用于DCT压缩域的人脸检测算法 [J], 田巍;黄祥林;沈兰荪2.一种基于特征提取和模板匹配的人脸检测算法 [J], 孔潇;沈兰荪;毋立芳3.一种基于多级梯度能量特征的DCT压缩域人脸检测算法 [J], 李晓光;李晓华;沈兰荪4.一种基于肤色模型和模板匹配的人脸检测算法 [J], 顾伟;刘文杰;朱忠浩;许凯5.基于改进的链码模板匹配的压缩域人脸检测算法 [J], 王剑峰因版权原因,仅展示原文概要,查看原文内容请购买。
基于压缩感知的分块法人脸识别
党婵娟;曹继华;孙金超
【期刊名称】《无线电通信技术》
【年(卷),期】2013(039)005
【摘要】基于压缩感知的人脸识别算法(SRC)利用了高维数据分布的稀疏性进行建模,能够很好地解决图像高维处理问题,有效地避免维数灾难.对基于压缩感知的人脸识别算法的基本原理进行了深入地分析和研究,并对SRC算法进行了改进,提出了基于分块思想的压缩感知人脸识别算法,解决了人脸图像识别中存在的遮挡问题,避免了特征提取过程所造成的图像信息丢失,也避免了图像中局部信息的损坏对整体识别效果的影响.通过仿真实验表明改进算法的识别率比SRC算法的识别率提高了7%~8%.
【总页数】4页(P93-96)
【作者】党婵娟;曹继华;孙金超
【作者单位】天津职业技术师范大学,天津300222;天津职业技术师范大学,天津300222;天津职业技术师范大学,天津300222
【正文语种】中文
【中图分类】TN911.7
【相关文献】
1.基于压缩感知和图像分块的遮挡人脸识别 [J], 张近;夏凌;李光瑞
2.基于自适应中值滤波的分块压缩感知人脸识别 [J], 党婵娟;高海;杨磊;孙彩锋
3.基于压缩感知理论的分块压缩感知算法 [J], 黄超;吴亚娟
4.一种基于分块压缩感知的红外成像方法 [J], 刘晓宇;于洵;丁良华;韩峰;龚昌妹
5.基于物联网技术的小波域分块压缩感知算法的图像重构系统设计 [J], 赵勃因版权原因,仅展示原文概要,查看原文内容请购买。
基于压缩感知的鲁棒性人脸表情识别施徐敢;张石清;赵小明【摘要】为了有效提高噪声背景下的人脸表情识别性能,提出一种基于压缩感知的鲁棒性人脸表情识别方法。
先通过对腐蚀的测试样本表情图像进行稀疏表示,再利用压缩感知理论寻求其最稀疏的解,然后采用求得的最稀疏解信息实现人脸表情的分类。
在标准的Cohn-Kanade表情数据库的实验测试结果表明,该方法取得的人脸表情识别性能优于最近邻法、支持向量机以及最近邻子空间法。
可见,该方法用于人脸表情识别,识别效果较好,鲁棒性较高。
%In order to effectively improve the performance of facial expression recognition under the noisy background, a method of robust facial expression recognition based on compressed sensing is proposed. Firstly, the sparse representation of corrupted expression images of the identified test sample is sought, then the compressed sensing theory is used to solve its sparsest solution. Finally, according to the sparsest solution, facial expression classification is performed. Experimental results on benchmarking Cohn-Kanade database show that facial expression performance obtained by this method is better than the nearest neighbor (NN), support vector machine (SVM) and the nearest subspace (NS). Therefore, the proposed method shows both good recognition performance and high robustness on facial expression recognition tasks.【期刊名称】《计算机系统应用》【年(卷),期】2015(000)002【总页数】4页(P159-162)【关键词】压缩感知;稀疏表示;表情识别;鲁棒性;腐蚀【作者】施徐敢;张石清;赵小明【作者单位】浙江理工大学机械自动控制学院,杭州 310018; 台州学院图像处理与模式识别研究所,临海 317000;台州学院图像处理与模式识别研究所,临海317000;浙江理工大学机械自动控制学院,杭州 310018; 台州学院图像处理与模式识别研究所,临海 317000【正文语种】中文人脸表情是人们观察情感的重要标志, 如何使得机器能够认识人脸表情, 是一个既实用又有趣的研究方向. 如何让机器自动、高效、准确地来识别人类的情绪状态, 比如高兴、悲伤、愤怒、恐惧等, 即所谓的“人脸表情识别”[1]方面的研究, 是当前信号处理、模式识别、计算机视觉等领域的热点研究课题. 该研究在智能人机交互、人工智能等方面有着重要的应用价值.尽管人脸表情识别经过了多年的发展, 已经取得了较多的研究成果, 但现有的人脸表情识别研究[2-10]大多没有考虑表情图像受到噪声的影响. 在自然环境中, 人脸表情图像的获取、传输和存贮过程中常常也会受到各种噪声(如姿态、光照、腐蚀、遮挡等)的干扰而使图像降质, 从而导致人脸表情识别的性能会随之下降. 因此, 如何提高人脸表情识别的鲁棒性仍然是一个亟需解决的问题.压缩感知(Compressed sensing)或压缩采样(Compressive sampling)[11,12], 是近年来新出现的一种信号采样理论, 它可以在远小于Nyquist采样率的条件下获得信号的离散样本, 然后通过非线性重建无失真的完美信号. 压缩感知理论指出, 采样速率由信号中的内容和结构所决定, 而不再决定于信号的带宽. 目前, 压缩感知理论在图像处理[13]、人脸识别[14]、视频追踪[15]等领域受到了研究者的高度关注, 并表现出了极其强大的生命力, 但在人脸表情识别领域, 尤其针对鲁棒性的人脸表情识别问题, 国内外相关的文献报道甚少.压缩感知理论研究的初衷主要用于信号的压缩和表示, 但其最稀疏的表示具有很好的判别性. 本文利用压缩感知理论中的稀疏表示分类(Sparse Representation-based Classification, SRC)思想[14], 提出一种基于压缩感知的鲁棒性人脸表情识别方法. 先通过对腐蚀的测试样本表情图像进行稀疏表示, 再利用压缩感知理论寻求其最稀疏的解, 然后采用求得的最稀疏解信息实现人脸表情的分类. 在标准的Cohn-Kanade表情数据库[16]的实验结果表明了该方法的可行性.设A=[A1,A2,…,AC]是一组训练样本集, 总数量为n, 其中为第i类训练样本,y∈Rm是第i类的测试样本, 它可以由线性表示为:然而在实际情况中, 由于测试样本的类别一般是未知的, 所以式1可以写为式中, .由矩阵原来可知, m>n时, 矩阵(2)有唯一解; 但是在大多数情况下, m≤n, 此时矩阵(2)有无穷多个解. 为了使测试样本能够用自身所在类的训练样本进行线性表示, 这样的话系数向量x0中的非零向量应该尽可能少些. 所以对矩阵(2)求解可转换对矩阵(3)进行求解式中, ||·||0 表示l0范数, 它的作用是计算向量中非零元素的个数. 但是, 式(3)的求解非常困难, 这是个NP难题.由压缩感知理论可知: 当所求的系数足够稀疏时,可以把最小化l1范数的NP难题转化成最小化l1范数问题来求解.因此, 把式(3)改写为:然而在实际情况中, 获得的数据中经常含有噪声, 因此y很难由A进行比较准确的线性表示, 因此, 把式(4)改写为式(5)可以通过以下的式(6)来求解SRC算法可归纳如下:1)对训练样本集A中的每一个列向量进行归一化.2)求解最小化l1范数问题:或者求解3) 计算残差4) . 是的标记.本文采用标准的Cohn-Kanade[16]数据库进行实验. 通过对Cohn-Kanade数据库的原始图像采样得到32×32像素图像, 然后分别采用稀疏表示分类方法SRC、最近邻法(Nearest neighbor, NN), 支持向量机(Support Vector Machine, SVM), 以及近年来流行的最近邻子空间法(Nearest subspace, NS)[17]进行人脸表情识别实验, 并比较它们的性能.除了SRC方法, 使用的其它分类方法的基本思想表述如下: 最近邻法(NN)是基于样本学习的K近邻分类器(KNN), 当K=1时的一种情况. 支持向量机(SVM)是一种基于统计学习理论的分类器. 本文SVM采用“一对一”多类分类算法, 核函数为径向基函数, 并对核函数参数值进行最优化, 即在训练样本数据上使用交叉验证方法实现. 最近邻子空间法(NS)是一种基于信号重构的无参数分类器, 其分类思想是将测试样本表示为各类所有训练样本的线性组合, 从中选择最优解来进行分类. 2.1 表情数据库Cohn-Kanade数据库含有210个对象的大约2000个左右的具有充足的正面光照的灰度图像序列. 图像序列的分辨率都是640×490. 该数据库总共含有七种基本的表情, 如生气, 高兴、悲伤、惊奇、讨厌、害怕以及中性, 如图1所示. 我们从数据库中选用来自96个对象的320图像序列用于实验测试. 选择图像序列的标准是能够标记出除中性之外的六种表情. 然后对每个选择的图像序列中提取出一帧中性表情图像以及一帧含六种表情之一的图像. 最后我们提取出包括七种表情的470幅图像, 其中生气32个, 高兴100个, 悲伤55个, 惊奇75个, 害怕47个, 讨厌45个和中性116个.2.2 无腐蚀的人脸表情识别实验在该实验中, 直接使用32×32像素大小的图像样本用于表情识别, 图像中不存在任何腐蚀现象. 表1列出了SRC、NN, SVM和NS四种不同方法所取得的人脸表情识别性能. 由表1可知, 在无任何腐蚀图像的条件下, 稀疏表示分类方法SRC取得的人脸表情识别性能最好, 达到94.76%的识别率. 这表明了SRC用于人脸表情识别具有优越的分类性能.为了进一步给出七种表情中不同表情的具体识别性能, 表2给出了在Cohn-Kanade数据库上SRC方法采用32×32像素所取得的不同表情的识别结果. 从表2的实验结果可见, 在Cohn-Kanade数据库上七种表情中大部分表情的正确识别率达到了100%.2.3 有腐蚀的人脸表情识别实验为了检验SRC的鲁棒性人脸表情识别性能, 对32×32像素大小的测试图像随机添加像素腐蚀(Pixel Corruption). 随机添加像素腐蚀就是从测试图像中随机选择一定比例的像素, 采用范围之内的随机值进行替代, 其中表示第个测试图像的最大像素值. 实验中, 像素腐蚀比例从0%到90%, 依次递增10%. 图2展示了Cohn-Kanade数据库中一副原始图像从采样到腐蚀的过程, 其中图(a)为原始640×490像素的图像, 图(b)为采样之后的32×32像素的图像, 图(c)对32×32像素图像添加50%的腐蚀比例之后的图像.图3列出了NN、SVM、NS和SRC四种方法在Cohn-Kanade数据库上随机添加像素腐蚀比例从0%到90%取得的识别结果. 由图3实验结果可见, 随着图像腐蚀比例的增大, 图像越来越模糊, 人脸表情识别率也随之下降. 在图像腐蚀比例由0%增长到30%为止, SRC的正确识别率下降速度缓慢, 而其他三种方法的识别率下降非常快. 随之腐蚀比例的不断增大(30%至90%), 各种方法的识别率都一致下降, 但是SRC方法的识别率平均超过其它三种方法10%以上. 显然, 我们看到了SRC方法在处理人脸表情问题上有着良好的鲁棒性. 这主要是SRC方法提取了信号的稀疏结构, 并利用l1范数来作为来求解信号的稀疏表示系数. 由于采用正则化技术, SRC 的稀疏表示系数具有非常稳定的数值解.本文通过考虑测试图像是否存在像素腐蚀的现象, 对基于压缩感知理论的稀疏表示分类方法SRC的鲁棒性人脸表情识别性能进行了探讨. 在无任何像素腐蚀的人脸表情识别实验中, SRC取得的人脸表情识别性能比其他方法高出2%左右, 而在有像素腐蚀图像的人脸表情识别实验中, SRC展示出了良好的鲁棒性性能, 尤其在像素腐蚀比例30%至90%之间, SRC比其他方法的识别率平均高出10%以上. 这表明本文采用的基于压缩感知理论的稀疏表示分类方法SRC用于鲁棒性人脸表情识别时, 拥有良好的分类性能和鲁棒性.1 Tian Y, Kanade T, Cohn JF. Facial expression recognition. Handbook of Face Recognition, 2011: 487–519.2 刘晓旻,章毓晋.基于Gabor直方图特征和MVBoost的人脸表情识别.计算机研究与发展,2007,44(7):1089–1096.3 刘帅师,田彦涛,万川.基于Gabor多方向特征融合与分块直方图的人脸表情识别方法.自动化学报,2012,37(12): 1455–1463.4 易积政,毛峡,薛雨丽.基于特征点矢量与纹理形变能量参数融合的人脸表情识别.电子与信息学报,2013,35(10): 2403–2410.5 朱晓明,姚明海.基于局部二元模式的人脸表情识别.计算机系统应用,2011,20(6):151–154.6 Aleksic PS, Katsaggelos AK. Automatic facial expression recognitionusing facial animation parameters and multistream HMMs. IEEE Trans. on Information Forensics and Security, 2006, 1(1): 3–11.7 Zheng W, Zhou X, Zou C, et al. Facial expression recognition using kernel canonical correlation analysis (KCCA). IEEE Trans. on Neural Networks, 2006, 17(1): 233–238.8 Zhao G, Pietikainen M. Dynamic texture recognition using local binary patterns with an application to facial expressions. IEEE Trans. on Pattern Analysis and Machine Intelligence, 2007, 29(6): 915–928.9 Zhao X, Zhang S. Facial expression recognition using local binary patterns and discriminant kernel locally linear embedding. EURASIP Journal on Advances in Signal Processing, 2012, (1): 20.10 Yurtkan K, Demirel H. Feature selection for improved 3D facial expression recognition. Pattern Recognition Letters, 2014, 38: 26–33.11 Candes EJ, Wakin MB. An introduction to compressive sampling. IEEE Signal Processing Magazine, 2008, 25(2): 21–30.12 Donoho DL. Compressed sensing. IEEE Trans. on Information Theory, 2006, 52(4): 1289–1306.13 Yang J, Wright J, Huang TS, et al. Image super-resolution via sparse representation. IEEE Trans. on Image Processing, 2010, 19(11): 2861–2873.14 Wright J, Yang AY, Ganesh A, et al. Robust face recognition via sparse representation. IEEE Trans. on Pattern Analysis and Machine Intelligence, 2009, 31(2): 210–227.15 Mei X, Ling H. Robust Visual Tracking and Vehicle Classification via Sparse Representation. IEEE Trans. on Pattern Analysis and MachineIntelligence, 2011, 33(11): 2259–2272.16 Kanade T, Tian Y, Cohn J. Comprehensive database for facial expression analysis. International Conference on Face and Gesture Recognition. Grenoble, France. 2000. 46–53.17 Lee KC, Ho J, Kriegman DJ. Acquiring linear subspaces for face recognition under variable lighting. IEEE Trans. on Pattern Analysis and Machine Intelligence, 2005, 27(5): 684–698.。
基于压缩感知的人脸识别算法
1 压缩感知介绍
过去的几十年间,各种传感系统获取数据的能力不断地增强,这就对系统的采集和处理能力提出了更高的要求。
如果仍然采用传统的Nyquis T采样定理,就需要二倍于信号带宽的采样率,这给采样硬件设备带来了极大的挑战。
压缩感知理论是由Donoho与Candes等人提出的一个新的理论框架,其在线性模型的基础上,核心是只要信号是稀疏的,低维信号就能很好的恢复到高维信号。
2 理论简介
传统的信息处理主要由采样、压缩、传输和解压缩四个部分组成。
在这个传统过程中,采样率必须高于信号模拟信号中最高频率的二倍,随着图像数据的越来越大,这给采样设备提出了更高的要求。
传统的信号压缩是通过对信号进行一些变换(如:小波变换、离散余弦变换),然后剔除掉变换后为零或近似为零的数据,通过对少数绝对这大的新书进行压缩编码,从而实现大数据的压缩。
在传统信号获取过程中,将采样和压缩分开,是否可以将压缩和采样过程合并呢?于是有人就尝试着将采样和压缩过程合并,这不仅能够大大缓解香农定理对于采样率和传输处理的要求,也能够大大提高数据采集的效率和性能。
2.1 信号稀疏表示
通常,大部分自然信号并不是稀疏的,但是通过实验发现大部分自然信号都可以通过某些映射变将其变换为稀疏的根据调和分析理论,一个一维离散信号f,可以通过一组标准正交基线性表出:
或(3.1)
其中,N为信号长度,为标准正交基,为正交基的第i列的向量,系数矩阵。
如果系数矩阵x是稀疏的,那么原始信号f就是可稀疏表示的。
如果说系数矩阵x为信号f的K稀疏表示,则向量x中只有K个非零分量。
2.2信号重构
在压缩感知中,信号的稀疏表示和重构是其核心。
现在我们考虑一个信号重构问题,它的测量矩阵为,原始信号为x,x在上的线性测量值为,即:
(3.2)
方程(3.2)展示了原始信号x在测量矩阵变换下的线性投影,现在我们考
虑如何由信号y重构出原始信号x来。
原始信号x可以通过对测量值y的最优L 0范数问题的求解来实现重构:
s.t (3.3)
由于常见信号并不是稀疏的,但是可以通过某种变换变换为稀疏信号,即f=x,f为信号x在变换域的稀疏表示:
(3.4)
另外有:
s.t (3.5)
重构原始信号:
(3.6)
3 压缩感知
压缩感知理论出现后,它以其优异的性能已经迅速地被应用到各个领域中了。
在人脸识别领域中,最具代表性的是A.y.yang等人提出的基于稀疏表示的人脸识别算法(即“SRC方法”)。
其核心是信号的稀疏表示,简单的说,就是从信号集合中提取若干基础信号进行线性组合,并用组合结果来表征原信号的大部分信息。
3.1 基于稀疏表示人脸识别算法
压缩感知人脸识别算法主要通过在人脸识别过程中加入压缩感知的思想,算法主要思想是通过将每个人脸图像看成一个个体,同时将人脸图像库作为一个矩阵(训练集A)看待,然后通过对此矩阵的线性变化Ax和测试图像y进行基追踪算法并获得残差e,最后通过公式 3.7(公式 3.5 的变形)取得x的值,然后由于x的稀疏性就可以得到目标人脸图像对应于人脸库中的对象了,从而达到识别结果。
公式3.7 如下:
s.t.(3.7)
这是一个L 0范数问题,所以可以采用L1范数(基追踪算法)求解范数的次优解公式如下:
s.t.(3.8)
其中y为加噪或加遮挡的图像,e为残留值,A为数据库中的原始图像,x 为系数矩阵。
3.2算法步骤和流程图
①输入训练集,k为训练集的类别数和测试图像y其中,i为图像像素数目。
②对训练集图像和测试图像进行特征提取等预处理,从而达到最小化计算量的效果。
③求解样本集的最小L1范数问题,本文中用到了识别率较高的基追踪(BP)算法来实现,算法会得到测试图像与训练集中图像之间的残差,之后为区分每个残差的不同我们记为
s.t. AX=y (3.9)
④计算样本集中每个类别的残差,它记录着目标图像i与库中图像之间的区分度,这也是区分两人脸图像间差别的指标。
i=1,2,…,k(3.10)
⑤输出识别结果,通过寻找最小残差:
(3.11)
⑥获得与目标图像最匹配的图像,实现人脸识别。
3.3SRC的优势和不足
在传统的特征提取算法PCA、LDA、和LPP算法中,运算时间也较长,而且在特征提取的过程中图像特征的丢失也在所难免。
基于压缩感知的人脸识别这类算法不用考虑感知矩阵的阶数,不仅回避了图像特征提取时的难题。
而且通过实验我们发现基于压缩感知人脸识别算法在特征数较多时,识别率也相对较高。