基于点匹配的多姿态人脸图像的识别技术
- 格式:pdf
- 大小:402.03 KB
- 文档页数:4
《基于深度学习的人脸识别方法研究综述》篇一一、引言随着科技的进步,人脸识别技术已经成为了人工智能领域的研究热点。
基于深度学习的人脸识别方法以其高精度、高效率的特点,在众多领域得到了广泛应用。
本文旨在全面梳理和总结基于深度学习的人脸识别方法的研究现状、主要技术、应用领域及未来发展趋势。
二、人脸识别技术的发展历程人脸识别技术自诞生以来,经历了从传统的手工特征提取方法到基于深度学习方法的演变。
早期的人脸识别主要依靠人工设计的特征提取算法,如主成分分析(PCA)、线性判别分析(LDA)等。
随着深度学习技术的崛起,卷积神经网络(CNN)等人脸识别算法得到了广泛应用。
三、基于深度学习的人脸识别方法(一)深度卷积神经网络(Deep Convolutional Neural Network, DCNN)DCNN是目前应用最广泛的人脸识别方法之一。
通过训练大量的数据,DCNN可以自动学习和提取人脸特征,从而提高识别的准确性。
同时,DCNN具有较好的泛化能力,可以应对不同的人脸表情、光照、姿态等变化。
(二)深度学习与特征融合在人脸识别中,特征提取是关键的一步。
通过将深度学习与其他特征提取方法相结合,如基于局部二值模式(LBP)的特征提取方法,可以进一步提高人脸识别的准确性和鲁棒性。
此外,多模态特征融合技术也可以提高人脸识别的性能。
(三)基于深度学习的无约束人脸识别无约束人脸识别是近年来研究的热点。
由于实际应用中的人脸图像往往存在光照、姿态、表情等变化,因此基于深度学习的无约束人脸识别技术显得尤为重要。
该技术通过训练大量的无约束人脸数据,使得模型能够适应各种复杂的人脸变化。
四、主要技术应用领域(一)安防领域基于深度学习的人脸识别技术在安防领域得到了广泛应用。
例如,公安系统可以通过该技术对犯罪嫌疑人进行快速检索和比对,提高破案效率。
此外,该技术还可以应用于门禁系统、监控系统等场景。
(二)金融领域在金融领域,基于深度学习的人脸识别技术可以用于身份验证、支付等方面。
人脸识别的技术原理人脸识别技术是一种通过计算机系统对人脸图像进行分析和识别的技术。
它利用计算机视觉和模式识别的方法,通过提取人脸图像中的特征信息,然后与已知的人脸模板进行比对和匹配,从而实现对人脸的准确识别。
本文将介绍人脸识别的技术原理。
一、人脸图像采集与预处理在进行人脸识别之前,首先需要采集人脸图像,并对图像进行预处理。
采集人脸图像通常使用摄像头或者监控摄像头等设备。
预处理包括图像的裁剪、归一化、滤波等操作,以提高后续特征提取和匹配的准确性和鲁棒性。
二、人脸特征提取人脸特征提取是人脸识别的关键步骤,通过该步骤可以将人脸图像中的特征信息提取出来。
常见的人脸特征提取方法包括局部二值模式(Local Binary Patterns, LBP)、主成分分析(Principal Component Analysis, PCA)和线性判别分析(Linear Discriminant Analysis, LDA)等。
这些方法可以从人脸图像中提取出具有识别能力的特征向量。
三、人脸特征匹配在人脸特征提取之后,需要将提取到的人脸特征与已知的人脸模板进行匹配。
这一步骤通常使用比较函数对提取到的人脸特征与数据库中的人脸特征进行相似度计算,找出与之最匹配的人脸模板。
常用的相似度计算方法包括欧氏距离、曼哈顿距离和余弦相似度等。
四、人脸特征更新与识别一旦找到与提取到的人脸特征最匹配的人脸模板,就可以进行人脸识别。
此时,人脸识别系统会将待识别的人脸特征与已知的人脸模版进行比对,通过相似度计算来判断待识别人脸是否属于已知人脸的范畴。
如果匹配成功,则认为该人脸已被识别出来,并给出相应的识别结果。
五、应用领域人脸识别技术在各个领域都有广泛应用。
在安全领域,人脸识别技术可以用于门禁系统、边境检查等场景,提供快速准确的身份确认;在金融领域,人脸识别技术可以应用于移动支付和ATM机的认证等;在公安领域,人脸识别技术可用于刑侦破案和人员布控等;在智能家居领域,人脸识别技术可以应用于智能门锁和智能摄像机等设备,提供个性化的服务和保障。
人脸识别技术的应用场景及使用方法详解人脸识别技术是一种通过计算机视觉和模式识别技术来识别和验证人脸的技术。
它具有快速、准确、非接触等特点,因此在各个领域都有广泛的应用。
本文将详细介绍人脸识别技术的应用场景以及使用方法。
一、应用场景1. 安全领域:人脸识别技术在安全领域的应用是最为广泛的。
它可以用于身份识别与验证,例如在边境安全控制、机场安检、银行系统中,通过人脸识别来确认身份,提高安全性。
此外,人脸识别还可以用于犯罪侦查,通过与数据库中的犯罪嫌疑人照片比对,协助警方追踪犯罪嫌疑人。
2. 出入管理:人脸识别技术在出入管理方面也有重要的应用。
传统的刷卡或密码方式容易被冒用,而人脸识别技术通过与注册的人脸图像比对,可以实现更加安全的出入管理。
这在企业、学校、公共场所等都有广泛的应用,可以提高出入安全性、减少人力成本。
3. 金融领域:人脸识别技术也在金融领域得到了广泛应用。
例如,可以用于人脸支付,用户无需携带银行卡或手机,通过人脸识别技术即可完成付款。
此外,人脸识别还可以用于ATM机的安全认证,提高提款的安全性。
4. 教育领域:人脸识别技术在教育领域也逐渐得到应用。
例如,可以用于学生考勤系统,通过人脸识别技术可以准确记录学生的出勤情况,提高教学管理效率。
另外,人脸识别还可用于学生监控系统,通过人脸识别来确保学生的安全,避免校园欺凌等问题。
5. 智能家居:人脸识别技术还可以应用于智能家居,例如通过人脸识别来实现智能门锁的自动开关。
家庭成员只需通过人脸识别即可进出门,提高家庭安全性,免去了使用钥匙、刷卡等的麻烦。
二、使用方法1. 数据采集与预处理:首先,需要采集一定数量的人脸图像作为训练样本。
采集时应充分考虑不同人的不同面部表情、角度和光照等因素。
采集的图像需要进行预处理,包括去除噪声、对齐姿态、人脸检测等操作。
2. 特征提取与建模:接下来,需要提取人脸图像中的特征信息。
常用的特征提取方法包括主成分分析(PCA)和局部二值模式(LBP)等。
人脸识别中的多模态融合识别方法是一种结合了多种模态信息(如图像、视频、语音、姿态等)进行识别的技术。
这种方法能够提高识别的准确性和鲁棒性,同时也能更好地适应复杂的应用场景。
多模态融合识别方法的基本思路是将不同模态的信息进行融合,从而得到更丰富、更准确的人脸特征。
具体来说,这种方法通常包括以下步骤:1. 数据采集:首先,需要采集不同模态的人脸数据,包括图像、视频、语音、姿态等。
这些数据应该尽可能覆盖各种不同的面部表情、光照条件、角度和姿态等。
2. 特征提取:对每个模态的数据进行特征提取,可以使用各种机器学习算法(如卷积神经网络、支持向量机等)来提取特征。
这些特征应该能够反映人脸的特性和差异。
3. 融合算法:选择合适的融合算法将不同模态的特征进行融合,常见的融合算法包括加权融合、核融合、神经网络融合等。
这些算法可以根据各个模态的特征权重和相似性进行融合,从而得到更全面、更准确的人脸特征。
4. 分类器:选择合适的分类器对融合后的特征进行分类识别,常见的分类器包括支持向量机、神经网络等。
这些分类器可以根据融合后的特征进行分类,从而实现对人脸的识别。
多模态融合识别方法相比于单一模态的方法具有以下优势:* 更全面的信息:多模态融合识别方法能够从多个角度获取人脸信息,从而得到更全面的人脸特征,提高了识别的准确性和鲁棒性。
* 更强的适应性:多模态融合识别方法能够适应各种不同的应用场景,包括光照变化、面部遮挡、姿态变化等,从而提高了识别的鲁棒性和实用性。
然而,多模态融合识别方法也存在一些挑战和限制,例如数据收集和标注的成本较高、不同模态之间的信息冲突和冗余问题等。
为了解决这些问题,可以采取以下措施:* 优化数据采集和标注方式:可以采用自动化标注和半监督学习等方法来降低数据收集和标注的成本。
* 优化融合算法和分类器:可以采用深度学习等方法来优化融合算法和分类器,提高识别的准确性和鲁棒性。
* 考虑多模态之间的信息冲突和冗余问题:可以采用信息融合等方法来处理不同模态之间的信息冲突和冗余问题,提高识别的准确性和鲁棒性。
基于人脸识别技术的研究谷冰(沈阳职业技术学院辽宁沈阳110045)露■似器N E YV A LL E工应用科学[摘要]随着计算机技术的迅猛发展,人们期望计算机能具有人的视觉功能,然而除了一蝗专用的视觉系统外,迄今为止,还没有较为成功的通用视觉系统。
人脸识别目前的社会需求巨大,几乎各行各业都迫切需要。
主要针对人脸识别技术进行综述,并展望其未来的发展前景。
[关键词】人脸识别特征识别人工神经网络中图分类号:TP3文献标识码:^文章编号:1671--7597(2008)1120127一01牛物特征识别技术是指人体生物特征识别技术,这是一一种利用人体生物特征来进行身份识别的技术。
人体生物特征包括生理特征和行为特征,生理特征包括D N A、指纹、掌纹、人脸、虹膜等特征,行为特征包括语音、笔迹、步态等特征。
生物特征识别技术为身份识别提供了一个解决方案,同时,生物识别技术也是目前最方便最安全的识别技术。
利用生物特征技术来识别人的身份,i E成为I T行业的一项重要革新。
与其他生物特征识别技术相比,人脸识别具有三个优点:后验识别性能优越:人脸图像的普遍性:非接触式的操作方式。
人脸图像由于年龄、姿态、表情、光照等阏素而具有“一人千面”的特点,因此,人腧识别面临多方面的挑战。
一、人赡识尉的发晨过程早在I:世纪60年代术,人脸识别即引起了研究者的强烈兴趣。
但早期的人脸识别一般都需要人的某些先验知识,无法摆脱人的干预。
进入上世纪90年代,由于高速度、高性能计算机的出现。
人脸识别的方法有了重大突破。
进入了真正的机器自动识别阶段,人脸识别研究得到了前所未有的重视。
虽然我们人类可以毫小困难地通过人脸来辨别一个人,但是利用计算机进行完全自动的人脸识别仍存在许多嗣难.其表现在:人脸是t I i H,J体,存在表情变化:人脸随年龄的增长而有所改变:发型、眼镜对人脸造成遮挡:人脸所成I冬I像受光照、成像角、成像距离等影响。
此外,人脸识别技术研究与相关学科的发展及人脑的认识程度紧密联系。
面部特征点对比原理
面部特征点对比原理是人脸识别技术中的一种方法。
其原理是通过比对人脸图像中的特征点,来判断两张人脸图像是否属于同一个人。
具体来说,面部特征点对比的原理包括以下几个步骤:
1. 特征点提取:首先,对两张人脸图像进行特征点提取。
这些特征点通常包括眼睛、鼻子、嘴巴、眉毛等在图像中的位置和形状。
2. 特征点对比:将两张人脸图像中提取到的特征点进行对比。
这通常涉及计算特征点之间的距离或角度等几何关系。
3. 相似度计算:根据特征点对比的结果,计算两张人脸图像之间的相似度。
这可以使用一些相似度度量方法,如欧氏距离、曼哈顿距离、余弦相似度等。
4. 判定结果:根据相似度的阈值,判断两张人脸图像是否属于同一个人。
如果相似度超过了设定的阈值,则判定为同一个人;否则,判定为不同的人。
需要注意的是,面部特征点对比只是人脸识别技术中的一种方法,还有其它方法如基于纹理、特征向量等的人脸识别方法。
不同的方法有不同的优势和适用场景。
面部特征点对比的优点是提取特征点的过程相对简单、计算代价较小,但也存在一些
缺点,比如对于人脸姿态变化较大的图像可能不适用。
因此,在实际应用中需要根据具体情况选择合适的人脸识别方法。
基于深度学习技术的人脸识别算法研究随着科技的不断进步和人们对便捷生活的需求,人脸识别技术已经被广泛应用于各种领域,例如人脸解锁、人脸支付、人脸考勤等等。
而其中最核心的技术便是人脸识别算法。
目前,基于深度学习技术的人脸识别算法已经成为主流,并且在准确度和稳定性上都有了极大的提升。
一、人脸识别算法的基本原理人脸识别算法主要包含三个步骤:人脸检测、人脸对齐、人脸识别。
其中,人脸检测指的是在一张图像中检测到可能存在的人脸位置;人脸对齐是将检测到的人脸进行对齐,使得不同姿态、光照下的人脸能够比较精确地在同一平面上;人脸识别则是基于人脸的特征向量进行比对和识别。
其中,深度学习技术在人脸识别中扮演了至关重要的角色。
深度学习是一种基于人工神经网络的机器学习技术,通过对大量数据进行训练,可以让计算机自动学习和提取数据中的特征。
在人脸识别领域,深度学习技术通过构建卷积神经网络(CNN)和循环神经网络(RNN)等模型,不断优化人脸识别算法的准确性和稳定性。
二、基于深度学习的人脸识别算法的优缺点相对于传统的人脸识别算法,基于深度学习技术的人脸识别算法具有以下优点:1. 鲁棒性更强:基于深度学习的算法对光照、姿态、遮挡等因素的鲁棒性更强,同时也不容易受到攻击和欺骗。
2. 准确性更高:由于深度学习算法能够自动提取并学习图像中的特征,因此可以得到更为准确的人脸匹配结果。
3. 处理速度更快:基于深度学习的人脸识别算法可以借助GPU等技术进行加速,处理速度更快。
而基于深度学习的人脸识别算法同样存在一些不足之处,比如:1. 数据要求高:深度学习的训练需要大量的数据,而且数据质量也会影响算法的准确性。
2. 隐私问题:由于人脸识别技术的应用范围很广,大量的人脸数据会涉及到隐私问题,因此需要加强人脸数据的保护。
三、当前主流的深度学习人脸识别算法目前,几款主流的基于深度学习的人脸识别算法包括:1. DeepFace:由Facebook于2014年提出,这个算法采用了神经网络模型和3D面部重建等技术,准确率达到了97.35%。
人脸比对技术的算法和实现方法人脸比对技术是一种通过计算机视觉和模式识别技术对人脸图像进行分析和匹配的技术。
它在现代生活中得到了广泛的应用,如人脸识别解锁手机、人脸支付等。
本文将介绍人脸比对技术的算法和实现方法。
首先,人脸比对技术的算法是其核心。
常见的人脸比对算法包括特征提取算法和相似度计算算法。
特征提取算法是将人脸图像转化为一组特征向量的过程。
其中,最常用的特征提取算法是主成分分析(PCA)算法。
PCA算法通过对人脸图像进行降维处理,得到一组主成分,从而实现对人脸特征的提取。
相似度计算算法是根据特征向量的差异程度来计算人脸之间的相似度。
常见的相似度计算算法有欧氏距离算法和余弦相似度算法。
欧氏距离算法是计算两个特征向量之间的欧氏距离,距离越小表示两个人脸越相似。
余弦相似度算法是计算两个特征向量之间的夹角余弦值,值越接近1表示两个人脸越相似。
其次,实现人脸比对技术需要一系列的步骤。
首先是人脸检测,即从图像中提取出人脸区域。
常见的人脸检测算法有Viola-Jones算法和卷积神经网络(CNN)算法。
Viola-Jones算法是一种基于特征级联分类器的快速人脸检测算法,它通过对图像进行多尺度滑动窗口的检测来提高检测速度。
CNN算法是一种基于深度学习的人脸检测算法,它通过多层卷积神经网络的运算来提取图像中的人脸区域。
接下来是人脸对齐,即将检测到的人脸图像进行标准化处理,使得人脸的位置、大小和姿态一致。
常见的人脸对齐算法有基于特征点的对齐算法和基于纹理的对齐算法。
特征点对齐算法是通过检测人脸图像中的关键点,如眼睛、鼻子和嘴巴等,来实现对齐。
纹理对齐算法是通过将人脸图像映射到一个标准模板上,使得人脸的纹理分布一致。
最后是人脸比对,即通过比对两个人脸图像的特征向量来计算相似度。
比对结果可以通过设定一个阈值来判断两个人脸是否匹配。
人脸比对技术的实现还需要考虑一些问题。
首先是数据集的选择和构建。
一个好的数据集对于算法的训练和测试至关重要。
第1篇随着科技的发展,人脸识别技术在各个领域得到了广泛应用,尤其在游戏行业,人脸识别技术为游戏提供了新的互动体验。
本文将针对游戏人脸识别解决方案进行详细阐述,包括技术原理、应用场景、解决方案及其优势。
一、技术原理1. 人脸检测人脸检测是人脸识别的基础,通过对图像进行预处理,提取出人脸区域。
常用的方法有基于传统图像处理的方法、基于深度学习的方法和基于多尺度特征的方法等。
2. 人脸关键点定位在人脸检测的基础上,进一步对人脸关键点进行定位,如眼睛、鼻子、嘴巴等。
关键点定位的准确性直接影响到人脸识别的精度。
3. 人脸特征提取人脸特征提取是人脸识别的核心环节,通过提取人脸的纹理、形状、光照等特征,构建人脸特征向量。
常用的特征提取方法有LBP(局部二值模式)、HOG(直方图梯度方向)、Eigenface、Fisherface、LBP-SURF等。
4. 人脸比对将待识别的人脸与数据库中的人脸特征进行比对,根据相似度判断是否为同一人。
常用的比对算法有欧氏距离、余弦相似度、加权余弦相似度等。
二、应用场景1. 游戏角色定制用户可以通过人脸识别技术,将自己的面部特征映射到游戏角色身上,实现个性化角色定制。
用户在游戏中扮演的角色将更加贴近自己,提升游戏体验。
2. 游戏社交互动人脸识别技术可以应用于游戏社交场景,如好友识别、情侣匹配等。
用户可以通过人脸识别快速找到自己的好友,实现实时互动。
3. 游戏安全认证人脸识别技术可以应用于游戏账号安全认证,提高账号安全性。
用户在登录游戏时,需要通过人脸识别验证身份,防止他人冒用账号。
4. 游戏场景互动人脸识别技术可以应用于游戏场景互动,如NPC(非玩家角色)识别、表情识别等。
NPC可以根据玩家的面部表情进行互动,提高游戏沉浸感。
5. 游戏营销推广人脸识别技术可以应用于游戏营销推广,如虚拟形象代言、人脸海报等。
通过用户的人脸识别,生成个性化游戏海报,提高用户参与度。
三、解决方案1. 硬件设备游戏人脸识别解决方案需要高性能的硬件设备支持,包括摄像头、处理器等。
© 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net 第12卷第4期 2009年12月
上海电机学院学报
JOURNALOFSHANGHAIDIANJIUNIVERSITYVol.12No.4
Dec.2009
收稿日期:2009209202
作者简介:王耀明(19452),男,教授,专业方向为图像处理,E2mail:wangym@sdju.edu.cn
文章编号 167122730(2009)0420306204
基于点匹配的多姿态人脸图像的识别技术
王耀明(上海电机学院电子信息学院,上海200240)
摘 要:基于点匹配的三维运动图像分析原理,分析对多姿态人脸图像匹配点之间的几何关系,不需要直接计算出它们的值,能找出2幅图像之间的最佳的变换函数,从而得到一种计算量不大而效果较好的人脸识别方法。 关键词:多姿态;人脸识别;图像匹配;变换函数 中图分类号:TP391.41 文献标识码:A
FaceRecognitionBasedonPoint2matchingforMulti2poseFace2imagesWANGYaoming(SchoolofElectronicsandInformation,ShanghaiDianjiUniversity,Shanghai200240,China)
Abstract:Basedonthepointmatchingthree2dimensionalmotionimageanalysisprinciple,and
throughtheanalysisofthegeometryrelationshipbetweenamulti2posefaceimagematchingpoints,thebesttransformationfunctionbetweenthetwoimagescanbefoundwithoutadirectcalculationoftheirvalues.Hence,amethodforface2imagerecognitionwithlowcomputationalcomplexityandbet2terperformancecanbeobtained. Keywords:multi2pose;facerecognition;image2matching;transformfunction
人脸识别的研究始于20世纪60年代末。常用的计算机人脸图像自动识别方法由2个方面组成[1]:人脸特征抽取和识别技术。人脸特征抽取的研究包括人脸的几何特征、统计特征和频谱特征等。人脸识别的目标是提高识别率,目前的一种趋势是将人脸的整体识别和特征分析的方法结合起来,如Lam提出的基于分析和整体的方法[2],Lanitis提出的利用可变形模型来对人脸进行解释和编码的方法[3],王守觉提出的仿生神经网络[4,5]等。提高人脸识别率的一个瓶颈问题是人脸图像的多姿态性,因为人脸图像在拍摄过程中,不是人脸在空间中运动,
就是摄像机(照相机)在运动,故任何2个时刻或在2个地点所拍摄的人脸图像在大小、方位、姿态等方面都有或多或少的不同,这样就形成了人脸图像的匹配点在整个人脸图像中的几何位置的变迁,匹配点间距离和比率产生了变化。基于此,近年来对多姿态人脸图像的识别研究在国际和国内掀起了一个研究热潮。基于几何特征的方法包括人脸部件归一化的点间距离和比率以及人脸的一些特征点,如眼角、嘴© 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
角、鼻尖等部位所构成的二维拓扑结构。可变形模板法被视为几何特征方法的一种改进[3],其基本思想是:设计一个参数可调的器官模型,定义一个能量函数,通过调整模型参数使能量函数最小化,此时的模型参数即作为该器官的几何特征。这种方法想法很好,但存在2个问题:①能量函数中,各种代价的加权系数只能由经验确定,难以推广;②能量函数优化过程十分耗时,难以实际应用。之所以这样,是因为人脸图像的多姿态性。而最近Nam和Carcas2soni提出的基于单视图的多姿态人脸识别方法[628]就是将多姿态人脸图像通过某种变换,使各种姿态变换为一个相同姿态图像。一个典型的代表是多项式拟合变换,常用2个二元二次多项式拟合方程,通过对12个参数的求解进行姿态间的变换。但这些变换毕竟是近似的,在理论上存在一定的误差,同时12个参数的求解消耗一定的时间,但与能量函数的方法相比已有相当大的进步。本文以摄像机成像的原理(仿射变换)为基础,通过对多姿态人脸图像匹配点之间的几何关系分析,找出2幅图像之间的最佳的变换函数(不需要直接计算出它的值),从而得到一种计算量不大而效果较好的人脸识别方法。1 基于点匹配的三维运动图像分析原理设一个摄像机在静态的环境中移动,运动前的坐标系为Cxyz,运动后的坐标系为C′x′y′z′,假设通过一个旋转R和一个平移t可以将运动后的坐标架带回到运动前的坐标架。若空间的一点M在运动前的坐标系下为M,在运动后的坐标系下为M′,则M′=RM+t,如图1所示。图1中,M,M′分别为M在投影机上的投影点。图1 运动前后的坐标系关系Fig.1 Therelationshipbetweenthecoordinatesbeforeandaftermoving 在数学上以下2个问题是等价的:①2幅图像是由一个固定的摄像机在一个动态的环境中的2个不同时刻摄取的;②2幅图像是由2个不同的摄像机在同一时刻或2个不同时刻摄取的。因此,可以把同一物体的2幅不相同的图像都认为是由2个摄像机摄取的,这样三维运动物体的图像分析就都可归结为解决问题②。设一个物体上的n个三维点在第1个坐标系下的坐标为Mi=(xi,yi,z
i)
,
投影到第1幅图像上其
像点坐标为mi=(ui,v
i)
T,归一化的齐次坐标为m
i
=(ui,vi,1)T;在第2个坐标系下的坐标为M′i=
(x′i,y′i,z′i),投影到第2幅图像上其像点坐标为m
′
i=
(u′i,v′i)T,归一化的齐次坐标为m′i=(u′i,v′i,
1)T;其中,u,v与u′,v′分别是运动前后的摄像机内
的图像坐标系。那么,可得mi=Mi/z
i
m′i=M′i/z′i
M′i=RMi+t
(1)
由此,经过运算,可得m′i(t×Rmi)=0(2)
令E=t×R(它是一个3×3的矩阵),则有m′iEmi=0(3)
矩阵E有一个重要的性质:
‖E‖2=2‖t‖2(4)
式中,‖・‖是矩阵的Frobenius范数。假设第1幅图像其像点mi=(ui,vi)T与第2幅图像其像点m′i=(u′i,v′i)T匹配,并设2个9维向量x=(e
T1,eT2,eT3)T,其中,eT
i是E的第i行向量;ai=
(u′imTi,v′imTi,mTi)T,则式(3)可写为aTix=0(5)若有n个点匹配,可将n个线性方程堆积得Anx=0(6)式中,An=[aT1,aT2,…,aTn]T是一个n×9的矩阵。式(6)是本文算法的基础。一般情况下,向量x只有5个自由度,因此当n>5时,有唯一解。同时,在实际图像分析的应用中,式(6)的等式一般不能成立,这是因为点的匹配是不能精确达到的,故可用最小二乘法求解式(6)。在n≥8时,其中一种最基本的方法是基于对向量Anx的模的最小化,同时在归一化的情况下,可令‖t‖=1,则由式(4)得‖x‖2=2,
故有
minx‖Anx‖2,约束条件‖x‖2=2(7)
703 2009年第4期
王耀明:基于点匹配的多姿态人脸图像的识别技术 © 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net根据拉格朗日不定乘子法,上述极值条件对应于拉格朗日函数的最小值:Φ(x)=xTATnAnx+λ(2-xTx)(8)式中,λ是对称矩阵ATnAn的特征值;x是对应的特征向量。将式(8)对x微分并设为0,可得ATnAnx=λx(9) λ共有9个值,设其最小值为λ1,将式(9)代入式(8),其最小值为Φ(x)=2λ1(10)而相应的式(7)的解x为对应于ATnAn的最小特征值的、模为2的特征向量。2 在多姿态人脸图像识别中的应用人脸在不同时刻、不同位置上所拍摄的大小不同的图像,可对应于同一固定摄像机拍摄的人脸在三维空间中运动时的图像,也可对应于2个不同位置的摄像机拍摄的固定不动的人脸图像,这些人脸图像称为多姿态人脸图像。因此,上述分析的结论可用于多姿态人脸图像识别中,即对于不同大小、不同方位等所拍摄的人脸图像,只要把人脸图像库中的每个图像与待识别人脸图像的某些点相匹配,则根据式(10)都可计算出它们之间的值,并选择该值最小的库中的人脸图像为待识别图像的匹配图像。本文选择人脸的4个眼角点、1个鼻尖点、2个嘴角点及鼻尖点到2个嘴角点连线的垂线交点作为人脸图像的匹配点,共有8个匹配点。如图2所示。(a)原图 (b)二值骨架化(c)8点 图2 头部姿势Fig.2 Theheadposture 图2中,8点的坐标(u,v)分别为:左眼左点(19,59);左眼右点(47,62);右眼左点(57,57);右眼右点(81,52);嘴巴左点(40,92);嘴巴右点(70,87);鼻点(51,85);鼻嘴垂直交点(51,90)。具体匹配步骤如下:①对具有m幅不同人的人脸图像库中的每一幅图像,分别计算出它们的8个匹配点坐标;②对待识别人脸图像(可能与库中的任一幅图像在不同时刻、不同位置上所拍摄的、大小不同的图像)计算出它的8个匹配点坐标;③根据式(5)和式(6),分别计算出对待识别人脸图像与库中的每一幅图像的对应的8个匹配点之间的A8,i,
其中i是人脸图像库中该图像的编号,即i=1,2,
…,m;④计算每个A
T
8,iA8,i
的最小特征值,并根据式
(10)计算它们的Φi(x);⑤选择Φi(x)中值最小的i
相应的人脸图像库中的图像作为待识别人脸图像的匹配图像。
3 实验及其结果为了验证本算法的有效性,在实验中选择了中、外100名不同人的人脸图像(它们的大小可能不同),每人2幅;2幅图像一般是不同的,即它们是在不同时刻、不同位置上所拍摄的大小不同的图像。其中一幅作为人脸图像库中的人脸图像,另一幅作为待识别人脸图像。它们中的某些图像如图3所示,图3(a)为原图像,图3(b)为8个匹配点。根据步骤①和②分别计算出这200幅图像的8个匹配点的坐标,由这些坐标构成人脸图像库中的具体数据。然后,完成以下2个实验。实验1 直接从人脸图像库中依次抽出一幅图像的数据,与库中的所有图像按步骤③~⑤进行匹配运算,再比较、识别(共100次)。其结果如表1