基于奇异值分解的人脸识别
- 格式:pptx
- 大小:756.61 KB
- 文档页数:12
线性代数在人脸识别中的应用人脸识别作为一种生物识别技术,近年来得到了广泛的应用和发展。
它通过对人脸图像进行特征提取和匹配,可以进行身份验证、门禁管理以及安全监控等方面的应用。
而在人脸识别的技术实现中,线性代数扮演着重要的角色。
本文将探讨线性代数在人脸识别中的应用。
一、特征向量与特征值在人脸识别中,对人脸图像进行特征提取是关键的一步。
而特征向量和特征值是线性代数中的重要概念,它们也在人脸识别中发挥着重要作用。
通过将每个人脸图像转化为一个向量,并将所有人脸图像的向量组成一个矩阵,我们可以使用线性代数中的特征向量和特征值的求解方法来获取这个矩阵的主要特征。
通过求解这个矩阵的特征值和特征向量,我们可以得到数据中的主要变化模式,从而进一步提取人脸图像的特征。
二、线性变换和线性映射在人脸识别中,线性变换和线性映射也是常用的方法之一。
线性代数提供了求解线性变换和线性映射的工具和方法。
假设我们有一个人脸图像的矩阵,我们可以通过线性变换来对图像进行处理,例如平移、旋转和缩放等操作。
这些线性变换可以通过矩阵乘法来表示,其中矩阵中的元素代表相应的变换参数。
通过对人脸图像进行线性变换,可以对图像进行修正和调整,从而提高人脸识别的准确度。
线性映射也是人脸识别中常用的方法之一。
它通过将高维特征空间映射到低维特征空间来实现人脸识别。
线性代数中的特征值分解和奇异值分解方法可以帮助我们实现这种线性映射。
三、矩阵运算与矩阵分解在人脸识别中,矩阵运算和矩阵分解是线性代数的常见应用。
通过矩阵运算,可以对人脸图像进行处理和计算。
例如,可以通过矩阵乘法来计算两个人脸图像之间的距离,从而判断它们的相似度。
矩阵分解是将一个矩阵分解为更简单形式的矩阵的过程。
在人脸识别中,常用的矩阵分解方法有奇异值分解(SVD)和特征值分解。
通过矩阵分解,我们可以提取出人脸图像的主要特征,从而对人脸图像进行匹配和识别。
四、线性代数模型的建立线性代数提供了建立人脸识别模型的基础。
人脸识别算法的优化及改进方法详解人脸识别技术是近年来快速发展的一项人工智能技术,其在安全领域、人机交互领域和智能监控领域有着广泛的应用。
然而,目前的人脸识别算法仍然存在一些问题,如准确率、鲁棒性和计算效率等方面的限制。
本文将详细介绍人脸识别算法的优化和改进方法,以提高识别的准确性和效率。
一、特征提取算法的优化特征提取是人脸识别算法的核心步骤之一,直接影响到最终的识别效果。
常用的特征提取算法包括主成分分析(PCA)、线性判别分析(LDA)和局部二值模式(LBP)等。
为了提高识别准确率,可以通过以下方法对特征提取算法进行优化:1.降低维度:PCA算法通常会产生高维特征向量,导致计算复杂度高。
可以使用基于SVD(奇异值分解)的快速PCA算法进行降维,以减少计算量和存储空间。
2.增强鲁棒性:LDA算法在处理非线性数据时性能较差,针对这个问题可以采用核技巧,如核主成分分析(KPCA)和核线性判别分析(KLDA),来提高算法的鲁棒性和非线性拟合能力。
3.结合时空信息:人脸识别算法除了可以利用静态图像进行识别,还可以结合视频序列的时空信息。
通过使用光流估计算法提取视频序列中的运动信息,并将其融合到静态特征中,可以提高识别的准确性。
二、人脸对齐算法的改进人脸对齐是人脸识别算法中的重要步骤,其目的是将输入的图像中的人脸对齐到一个标准姿态。
传统的人脸对齐算法通常使用刚体变换,如欧拉变换和仿射变换。
然而,这些算法对姿态变化较大的人脸无法获得良好的对齐效果。
为了改进人脸对齐算法,可以考虑以下方法:1.采用非刚体变换:使用非刚体变换模型,如Thin-Plate Spline(TPS)变换和Active Shape Model(ASM),可以更好地处理人脸的非刚体形变问题。
这些变换模型能够根据局部特征点的位置和形状变化来实现非刚体变换,从而提高对齐的准确性。
2.结合深度信息:近年来,深度学习技术的发展为人脸对齐提供了新的思路。
基于SVD和LDA的人脸识别方法第24卷第l2期2007年12月V o1.24No.12Dee.2007基于SVD和LDA的人脸识别方法术郝红卫,张蕾(北京科技大学信息工程学院,北京100083)摘要:提出了一种基于奇异值分解与改进的LDA相结合的人脸识别方法.首先利用奇异值分解方法获得图像的有效特征;然后经过改进的LDA处理,这样不仅可以有效降低维数,而且使抽取特征的判别能力得到了有效增强;最后对压缩后的特征向量进行排序,将排序后的特征送入BP网络进行识别.实验结果表明,该方法在低维特征向量下取得了很高的识别率,达到99%,效果优于传统方法.关键词:人脸识别;奇异值分解;线性鉴别分析;反向传播神经网络中图分类号:TP391文献标志码:A文章编号:1001—3695(2007)12—0377—02 FacerecognitionbasedonSVDandLDAHAOHong—wei,ZHANGLei(SchoolofInformationEngineering,UniversityofScience&TechnologyBelting,Beij ing100083,China)Abstract:Thispaperproposedamethodoffacerecognitionbasedonsingularvaluedecompos itionandimprovedLDA.First—ly,effectivefeaturecouldbeobtainedusingsingularvaluedecomposition,andthenimproved LDAwasusednotonlytodepressthefeaturedimensioneffectively,butalsotoenhancethediscriminatorypowerofextractedfe atures.Finally,theshortfeaturevectorwassortedandthesortedfeatureswereinputintotheback—propagationnetworkforrecognition.Experimentalresults demonstratethathighrecognitionratecanbeachievedusinglOWdimensionalfeaturevector andachieved99%.Thismethodoutperformstraditionalmethods.Keywords:facerecognition;SVD(singularvaluedecomposition);LDA(1ineardiscrimina ntanalysis);BPnetwork近些年来,人脸识别技术在诸多领域得到了广泛应用,日渐成为计算机视觉和模式识别领域的研究热点.人脸识别的有效性依赖于特征表示与特征匹配,良好的特征应具有数据量少且识别率高的特点.1991年z.Hong提出了基于奇异值分解(SVD)的人脸识别方法,错误识别率为42.67%.文献[2]提出了一种基于奇异值分解和数据融合的人脸识别方法,对ORL(olivettiresearchlaboratory)人脸数据库的正确识别率达到96%以上,但识别过程较繁琐.文献[3]用奇异值分解法与神经网络法对ORL作了分类识别实验.其处理过程是依次对奇异值进行能量降维压缩,标准化,排序处理;最后用BP分类器识别.图像的奇异值分解是一种有效的代数特征提取方法,LDA(1ineardiscriminantanalysis,线性鉴别分析)不仅使得投影后的模式样本在新的特征空间中有最大的类问距离和最小的类内距离,而且能有效地降低特征向量的维数.本文巧妙结合了SVD与LDA两种技术的优点,提出了SVD—LDA—BP方法.通过这种方法提取出数量较少的人脸特征,并将特征输入到神经网络分类器进行识别.基于ORL的实验结果表明,本文方法优于传统方法,具有特征维数少,识别率高的特点.1基于奇异值分解和LDA的神经网络识别方法本文提出的SVD—LDA—BP方法包括三部分.首先对人脸图像库进行奇异值分解,将奇异值向量作为图像特征矩阵;再用LDA获得降低维数的最佳分类特征;最后将降维后的特征送人BP进行训练,得出识别结果.图l是人脸识别的整个系统框架..图1人脸识别算法框架下面对奇异值分解和线性鉴别分析两个重点内容分别加以介绍.1.1预处理首先对图像用适当的阈值进行二值化处理;然后对二值化图像进行水平方向和垂直方向的积分投影.根据投影曲线,结合人脸几何结构,可以分割出图像中的人脸部分.笔者使用的ORL人脸库,原始图像大小是112X92,经分割和其他一系列的预处理得到大小为48X48的图像.数据量得到了很大压缩,并且保留了绝大部分的信息,如图2所示.1.2图像的奇异值特征奇异值分解是一种有效的代数特征提取方法.由于奇异值特征在描述图像数值上比较稳定且具有转置不变,旋转不变,位移不变,比例不变性等重要性质,可以作为人脸图像的一种有效的代数特征描述.若矩阵A…代表一幅图像,则存在正交矩阵U=[".-,收稿日期:2006—09—07;修返日期:2006—11—11基金项目:国家自然科学基金资助项目(60475003);北京科技大学基金资助项目作者简介:郝红卫(1967),男,河北邯郸人,教授,博士后,主要研究方向为模式识别,人工智能;张蕾(1984一),女,硕士研究生,主要研究方向为模式识别,图像处理(*******************).378?计算机应用研究第24卷u],=[I,…,],使得UAV=diag[盯.,?-.,]=W,p=rain(m,n),即A=UWV,该式称为A的奇异值分解.其中:l>Io2≥…>Io>10;(i=1,2,…,P)为的奇异值,是AA"或AA的特征值A的平方根,即=/A(i=1,2,…,P).对于任意一个实矩阵A,它的奇异值分解值是惟一的.当奇异值排列分解成≥≥…≥≥0时,奇异值向量_『1f以作为描述灰度矩阵A的一种数值特征.预处理后的图像是48×48,经奇异值分解后得到48×1维的特征向量,得刮特征向量X=lAI,A2,A3,…,A48J.1.3改进的LDA经过奇异值分解得到的数据量仍然很大.传统的处理方法是通过能量降维,即将奇异值从大到小排列,然后将取最大的前几个奇异值作为特征向量,而将后面的数值舍去.在本文中采用改进的线性判别分析.这样不仅能够有效地降低维数,而且能够将同一个类别的所有样本聚集在一起,类别的样本尽量分开.因此得到的特征更具类别可分性.图像矩阵集}A},i=1,2,…,Ⅳ;A=OL,…,Fisher线性鉴别分析的准则函数定义为(g/)=argiil..ax(1WW1/1WWL).其中:是样本类间离散度矩阵;是样本类内离散度矩阵.由于训练样本的数量一般小于每个样本所包含的像素个数,线性鉴别分析得到的样本类内离散度矩阵通常是奇异的;另一种情况是,fisher线性鉴别定义的离散度矩阵使得所有样本均值和各个类均值尽量分开,但_u『能造成相邻类的大鼙样本的重叠.这是由于边缘类主导了特征分解,导致最后实现降维的转换矩阵过分强调了那些本来已经较好分开的类.考虑到以上两种情况,本文中采用了文献[6,7]中提剑的改进LDA方法,即改变样本类间离散度矩阵为一l~S6=∑.PP』埘(△)(一,)(~一)…,…,——————一—————————_△:~/(一一)'(/xl一/x) 其中:是i类图像特征向量的均值;P,Jp,分别是类别i,的先验概率;△是两个均值之间的欧式距离;()足』J口权函数. 为了降低边缘类对特征分解的主导作刚,加权函数定义为(△)=1/△;.这样相当于在样本类间离散度的定义中只考虑样本类问距离的方向,而忽略其距离的大小.所有的类别均被公平地对待.样本类内离散度矩阵为:∑ps其中:s=E[(x一)(X—)IXEA];p是先验概率.1.4降维后的奇异值矢量排序奇异值特征空间矢量中的特征均为从大到小排列,经过LDA变换得到最佳分类特征后,所有的类别样本的特,征矢量具有结构相似的模式特征.这种特征虽然具有独立性,但不具有可分性和稳定性.如果直接将该矢量输入神经网络训练,则网络的学习能力和推广能力都很差.因此,必须要对基于奇异值特征向量的最佳分类特征进行重新排序,以解决相列类别图像具有相同的结构特征和不同类别图像具有不同结构特征的问题.这个过程称为奇异值矢量排序J.实现过程如下:a)在整数1与降维后奇异值个数之『日J,产生一个随机整数序列.该随机整数序列由整数1到降维后的特征个数之I的所有自然数组成,H保证每个自然数仅随机出现一次.I)如果随机整数序列为n(i):即第i个位置元素为,则先将奇异值矢量的第个特征储存起来;然后用其第i个特征更新第.个特征;再将储存起来的第个特征根据随机整数序列"()值,更新第n()个特征.依此类推,直至所有的最佳分类特征重新排完为j卜..2实验及结果分析本文实验对象取自ORI人脸数据库.该数据库由40人,每人10幅,大小为112×92,灰度级为256,共400幅人脸图像组成;图像背景为黑色;某些图像是分期拍摄的,光照条件及人脸脸部表情,细节,姿态均有变化.它是目前使用最广泛的基准性人脸数据库,如3所爪.竖图2人脸图像的罔3ORL数据库中的部分实例预处理过在进行实验前首先婴对图片进行一系列的预处理,将图片归一化为48×48像素大小.归一一化后提取得到48个奇异值, 经过LDA雎缩降维后得刮9个最佳分类特征;然后经过奇异值矢量排序,得到9×1维的输入列矢量.BP网络用于人脸识别时,每一个输入节点对应样本的一个特征,输出节点数等于类别数.在训练阶段,如果训练样本的类别标号是i,则假设训练时的期望输出第i个输出节点为1,而其余输出节点均为0.设■层BP网络输入层节点数为9(与输入的特征个数相同),输出层节点数取4O,最大训练次数取5000次,误差容限是0001,动量因子为0.95.为了充分号令汪SVD—IDA—BP方法的优越性,实验将ORL 数据库分成两个数据集,并分别在其上进行了实验.方案一ORL中的图片全部进行实验,共4O类.训练集山每人前5幅共200幅图像组成;测试集由每人后5幅共200幅像组成;训练集和测试集中的图像互不重叠.训练集的样本结构为第1类别样本的5幅图像;第2类别样本的5幅图像;等等.测试集的样本结构与训练集相同.实验结果如表1所示.表i方案一VSVD一1.DA—BP方法与传统方法的识别率及相应的隐节点数方案二在ORL数据库中任意挑选20类人脸图像进行实验.圳练集由每人前5幅共100幅图像组成;测试集由每人后5幅共100幅图像组成;训练集与测试集中的图像互不重叠.测试集和训练集的样本结构相同.实验结果如表2所示.表2方案二FSVI)一1DA—BP方法传统方法的识别率及相应的隐节点数由以上实验结果可以看出,相同特征维数的情况下,SVD.I,DA—BP方法识别率高于传统的奇异值分解方(下转第392页)392?计算机应用研究第24卷像进行目标识别;若当互相关运算极大值小于设定I刭值时,则在原图像中以当前识别位置对目标进行采样,更新卜一帧的模板,从而使得当检测图像中目标形态不再近似于初始模板时,系统可以实时更新模板,使模板与当前目标形态保持一致,保证了识别的准确性,提高了识别精度.2仿真结果实验视频画面解析度为320x240像素,共130帧,硬件资源为2.0GHzCPU,256MB内存的PC机.当模板大小为32x32像素时,全局互相关检测的离线仿真共需38s.应用本文算法,时间缩减至30s,检测时问减少21.05%.图5为应用本文算法所实现的移动日标检测.通过比较网格可以看到,视频中目标与场景均存在较大位移.应用本文算法,最后都实现了准确的目标检测.图6是分别应用固定模板与可变模板的互相关极大值曲线.实验中应用两种方法对同~段视频分别进行130次互相关极大值计算.图中虚线代表固定模板实验;实线反映了可变模板实验情况;水平折线是实验数据经Haar小波离散分解得到的第四层近似系数,反映了实验数据变化的趋势.不同算法性能比较如表1所示.图4多层次搜索及建立紧凑ROIj璺-_(a)第1帧检测结果(b)第l0帧检测结果一_t,)第45帧榆测结粜(d)第130帧检测结果闭5图像序列检测结果视频帧数图6固定模板与可变模板130帧像互相关检测极大值曲线表1不同算法性能比较3结束语本文通过提升小波对模板与检测图像进行整数变换,降低了模板与检测图像的分辨率,大幅度减少了互相关检测的计算量,从而使全局检测成为可能.建立高分辨率图像紧凑ROI以及模板更新环节均保证了物体识别定位的精度水平.经过实验证明,本算法可以准确地对跟踪目标进行识别定位,定位精度较之固定模板,单次互相关检测方法有较大提高,参考文献:[1]CLERENTINA,DELAHOCHEL,BRASSARTE,eta1.Selflocali. zation:aHewuncertaintypropagationarchitecture[J】.Roboticsand AutonomousSystem,2005,51(2.3):151.166.[2]HANYJ,HAHNH.Visualtrackingofamovingtargetusingactive contourbasedSSDalgorithm[J].RoboticsandAutonomousSys—tern,2005,53(3—4):265—281.[3]车立新,杨汝清,顾毅220/330kV变电设备高压带电清扫机器人设计[J]机器人,2005,27(2):102107.[4]李桂芝,安成万,杨国胜,等.基于场景识别的移动机器人定位方法研究[J].机器人,2005,27(2):123—127[5]吴树峰,傅卫平,杨静,等.基于核心区域信息和经验知识的道路理解算法[JJ.机器人,2005,27(4):296—300.[6]李青,郑南宁,马琳,等基于主元神经网络的非结构化道路跟踪[J]机器人,2005,27(3):247—251.[7]余天洪,王荣本,郭烈,等.不同光照条件下直线型车道标志识别方法研究[J].汽车工程,2005,27(5):510—513.[8]施华,李翠华,韦凤梅,等.基于像素可信度和空间位置信息的目标跟踪[J].计算机研究与发展,2005,42(1O):1726—1732.[9]唐德成,宗德祥,邓宗全,等.涂胶机器人视觉系统的应用研究[J].机器人,2006,28(1):14.[1O]张鹏,王润生.静态图像中的感兴趣区域检测技术[J].中国图象图形,2005,10(2):142—147.[¨]孙延奎.小波分析及其应用[M].北京:机械工业出版社,2005. [12]高广春,姚庆栋.应用于图像的基于提升方法的双自适应,1,波变换[J]中国图象图形,2006,11(2):169—174.(上接第378页)法;并且两个方案中SVD—LDA.BP均是在特征向量维数为9的情况下,分别取得99%和96%的识别率.因此可以看出,SVD—LDA—BP方法是一种可靠有效的方法.3结束语本文利用SVD与LDA相结合的方法进行人脸识别.该方法不仅充分利用了奇异值分解的稳定性,比例不变性,旋转不变性,而且使用改进的LDA进行特征维数压缩,比传统的能量降维取得更具有判别能力的特征;最后用BP分类器进行识别.实验结果表明,该方法具有识别率高,特征维数少的特点,其性能优于传统奇异值分解方法.参考文献:f11HONGZ.Algebraicfeatureextractionofimagetorrecognition[J]. PatternRecognition,1991,24(3):211—219.[2]王蕴红,谭铁牛,朱勇.基于奇异值分解和数据融合的脸像鉴别[J]计算机,2000,23(6):649—653.[3]甘俊英,张有为.一种基于奇异值特征的神经网络人脸识别新途径[J]电子,2004,32(1):170—173.[4】周德龙,高文,赵德斌.基于奇异值分解和判别式KL投影的人脸识别[J].软件,2003,14(4):783—789.[5】LOOGM,DUINRPW,HAEB—UMBACHR.Multiclasslineardimensionreductionbyweightedpairwisefishercriteria[J】.IEEE TransactionsonPatternAnalysisandMachineIntelligence,2001,23(7):762—766.[6】余冰,金连甫,陈平.利用标准LDA进行人脸识别[J].计算机辅助设计和图形学,2003,15(3):302.306.[7]于海征.基于奇异值分解的数字图像的特征提取[J].工程数学学报.2004,21(8):131.134.。
浅析矩阵分解的原理及其在人脸识别中的应用摘要:矩阵分解方法有多种,本文首先对矩阵的分解方法做了简单的介绍,这些分解在数值代数和最优化问题的解决中都有着十分重要的角色以及在其它领域方面也起着必不可少的作用。
人脸识别是指采用机器对人脸图像进行分析,进而提取有效的识别信息从而达到身份辨认的目的。
近年来因其在安全、认证、人机交互、视频电话等方面的广泛应用前景而越来越成为计算机模式识别领域的热点。
本文在分析矩阵分解的原理后详细针对其在人脸识别中的应用做了一些初步认识的总结。
关键词:矩阵分解QR分解奇异值分解非负矩阵分解人脸识别矩阵是数学中最重要的基本概念之一,是代数学的一个主要研究对象,也是数学研究及应用的一个重要工具。
在近代数学、工程技术、信息处理、经济理论管理科学中,也大量涉及到矩阵理论的知识,矩阵分解是指根据一定的原理用某种算法将一个矩阵分解成若干个矩阵的乘积或者一些矩阵之和。
这些分解式的特殊形式,一是能明显地反映出原矩阵的某些特征;二是分解的方法与过程提供了某些有效的数值计算方法和理论分析依据。
人脸识别是指采用机器对人脸图像进行分析 ,进而提取有效的识别信息从而达到身份辨认的目的。
虽然人类能轻松地识别出人脸,但人脸的自动机器识别却是一个难度极大的课题,它涉及到图像处理、模式识别、计算机视觉和神经网络等学科,也和对人脑的认识程度紧密相关。
现在矩阵分解在人脸识别中应用很广泛,有不同的算法来实现,本文将对现有的算法做总结和比较。
1 矩阵的分解方法矩阵分解 (decomposition, factorization)是将矩阵拆解为数个矩阵的乘积,可分为三角分解、满秩分解、QR分解、Jordan分解和SVD(奇异值)分解等,常见的有三种:1)三角分解法 (Triangular Factorization),2)QR 分解法 (QR Factorization),3)奇异值分解法 (Singular Value Decomposition)。