人脸检测研究综述
- 格式:pdf
- 大小:320.64 KB
- 文档页数:10
人脸识别技术研究综述人脸识别技术是一种通过图像或视频来识别人脸的技术。
其应用场景广泛,包括但不限于安防监控、社交娱乐、手机解锁等,因其高效、便捷、精确的特点,已成为当今信息技术领域的一个热门话题。
人脸识别技术的发展历程:人脸识别技术的历史可以追溯到上世纪60年代,在当时的条件下,该技术存在着诸多局限;进入21世纪,随着数字图像处理和计算能力的快速发展,人脸识别技术得到了长足的发展。
2017年,人脸识别技术在国际学术界已经达到了一个新的高度,准确率得到了显著提升。
人脸识别技术的构成:人脸识别技术主要由以下几个部分组成:数据采集:通过摄像头等设备采集人脸图像或视频。
数据预处理:对采集到的图像或视频进行去噪、对齐等处理。
特征提取:对预处理后的数据提取特征向量,用于后续的分类判别。
分类识别:将特征向量与已有的人脸库进行比对,最终确定输入图像或视频中人脸对应的身份。
应用领域:人脸识别技术在现实生活中有着广泛的应用。
在安防领域,人脸识别技术可以快速准确地识别目标人物,并实现报警、跟踪等功能;在社交娱乐领域,人脸识别技术可以实现人脸识别游戏、人脸变换等应用;在移动互联网领域,人脸识别技术可以实现快速安全的手机解锁、身份验证等功能。
人脸识别技术的挑战:人脸识别技术在实际应用中,还存在着一些挑战,例如:光照条件:光照不充分或过强时,可能会导致图像中出现阴影或高光,从而影响了人脸识别的准确度。
姿势变化:人的头部可以做出多种不同的姿势,如低头、仰头、转头等,这也会对人脸识别的准确度产生影响。
遮挡问题:某些情况下,人脸可能会被遮挡,如戴口罩、戴帽子等,这也会影响到人脸识别的准确度。
数据量:人脸识别技术的准确度和鲁棒性很大程度上依赖于训练数据,因此需要大量的数据集来进行训练,这对于一些独立研发者来说是一个难点。
隐私问题:人脸识别技术在应用过程中,涉及到大量的个人隐私信息,如何保护隐私成为了人脸识别技术亟待解决的问题。
结语:随着人工智能和计算机技术的飞速发展,人脸识别技术的准确率和应用场景也在不断拓展。
人脸识别研究综述人脸识别技术是一种通过计算机分析和识别人脸特征的技术。
近年来,随着硬件设备的进步和算法的不断改进,人脸识别技术得到了广泛的应用和研究。
本文将综述人脸识别技术的发展历程、应用领域、算法方法以及存在的问题和挑战。
人脸识别技术的发展历程可以追溯到上世纪六十年代。
当时,人们开始尝试使用计算机来识别人脸。
随着研究的深入,人脸识别技术逐渐被应用到安全领域。
现在,人脸识别已经广泛应用于人脸解锁、人脸支付、公共安全监控等领域。
在人脸识别的应用领域中,其中一个重要的应用领域是安全领域。
人脸识别可以用于身份验证和辨识,提高安全性。
另一个重要的应用领域是智能手机和电脑的解锁功能,使得用户可以通过人脸进行解锁,提高了使用的便利性。
此外,人脸识别也可以用于大众交通卡的自动售卡和复检等领域,实现了自动化和智能化。
人脸识别的算法方法有很多种,包括特征提取、特征匹配和分类等。
其中,特征提取是人脸识别算法的关键步骤。
过去常用的特征提取方法包括基于统计的方法、基于模型的方法和基于深度学习的方法。
而特征匹配是将提取得到的特征与已知特征进行比对,确定其是否属于同一个人。
最后,分类是通过训练分类器来对人脸进行分类,将其归类到已知的人脸类别中。
然而,人脸识别技术也存在一些问题和挑战。
首先,光线、角度和遮挡等环境因素对人脸识别的准确度有很大的影响。
此外,个体之间的差异导致同一个人的不同照片可能会有很大的差异,增加了识别的难度。
此外,人脸识别技术还可能被滥用,侵犯隐私。
为了解决这些问题,需要进一步研究和改进人脸识别的算法和系统,提高其准确度和安全性。
总的来说,人脸识别技术是一种有广泛应用前景的技术。
通过综述人脸识别技术的发展历程、应用领域、算法方法以及存在的问题和挑战,我们可以看出,人脸识别技术在安全领域和生活领域都有很大的潜力。
随着技术的不断进步和完善,人脸识别技术将会变得更加准确、便捷和安全。
人脸检测算法综述人脸检测算法是计算机视觉领域中一个重要的研究课题,其目标是将输入的图像中的人脸位置准确地定位和标记出来。
人脸检测算法在人脸识别、人脸表情分析、姿态估计等领域有着广泛的应用。
本文将对人脸检测算法进行综述,主要包括Viola-Jones算法、基于特征的分类器算法、基于深度学习的算法以及一些最新的研究成果。
Viola-Jones算法是人脸检测领域的经典算法之一,该算法在2001年提出,基于Haar-like特征和Adaboost分类器。
Haar-like特征是一种有效的特征描述方法,通过矩形区域的亮度差值来描述人脸的特征。
Adaboost算法通过迭代训练一系列简单的弱分类器来构建一个强分类器。
Viola-Jones算法的优点是速度快,适用于实时人脸检测,但其性能在复杂背景和姿态变化较大的情况下表现较差。
基于特征的分类器算法是一类常见的人脸检测方法,其中最典型的是Haar特征和HOG特征。
Haar特征是一种基于灰度图像的矩形区域亮度差值的描述方法,而HOG特征是一种基于图像梯度统计的特征描述方法。
这些方法的关键在于选择合适的特征和训练分类器。
这些算法在一些特定场景中表现较好,但在复杂场景中仍然面临一些困难。
近年来,基于深度学习的人脸检测算法取得了显著的进展。
深度学习方法通过神经网络模型自动学习特征和分类器,可以较好地处理复杂背景和姿态变化。
其中最经典的算法是基于卷积神经网络(CNN)的方法,如DPM、R-CNN、Faster R-CNN等。
这些算法通过多层卷积、池化和全连接等操作,逐层提取图像特征,并通过分类器判断是否为人脸。
CNN具有较强的表示能力和自适应性,使得其在人脸检测中表现出色。
最近一些研究成果进一步提高了人脸检测的性能。
例如,YOLOv3算法采用了特征融合和多尺度检测方法,通过将不同层的特征进行融合和整合,提高了检测的准确性和速度。
RetinaFace算法结合了多尺度和多任务学习,通过对不同尺度的特征进行检测和回归,实现了更精准的人脸检测。
基于深度学习的人脸识别方法研究综述基于深度学习的人脸识别方法研究综述人脸识别作为一种重要的生物特征识别技术,在诸多领域得到了广泛应用,如安全监控、电子支付、社交网络等。
随着深度学习技术的快速发展,基于深度学习的人脸识别方法逐渐成为研究热点。
本文将综述近年来基于深度学习的人脸识别方法的研究进展,包括人脸特征提取、人脸检测与对齐、人脸验证和人脸识别等方面。
一、人脸特征提取人脸特征提取是人脸识别中的核心环节,其目标是将人脸图像中的信息转化为具有辨识能力的特征向量。
目前,基于深度学习的人脸特征提取方法主要包括基于卷积神经网络(CNN)和基于生成对抗网络(GAN)的方法。
其中,CNN主要通过在多层次上提取人脸图像的局部以及全局特征,并将它们融合到最终的特征向量中。
GAN则通过生成器和鉴别器的博弈过程,生成逼真的人脸图像,并从中提取有用的特征向量。
二、人脸检测与对齐人脸检测与对齐是在人脸图像中精确定位出人脸并对其进行标准化的过程。
基于深度学习的人脸检测与对齐方法主要有两种思路,一种是基于Proposal的方法,如R-CNN、Fast R-CNN 和Faster R-CNN等,另一种是基于单阶段的方法,如YOLO和SSD等。
这些方法通过学习图像中人脸的特征模式,实现高效且准确的人脸检测与对齐。
三、人脸验证人脸验证是指判断两个给定的人脸图像是否属于同一个人。
基于深度学习的人脸验证方法主要通过学习一个特征空间,将输入的人脸图像映射到特征向量上,并计算两个特征向量之间的距离来判断是否属于同一个人。
常用的深度学习模型包括Siamese网络和Triplet网络等,它们都具有较好的特征区分能力和鲁棒性。
四、人脸识别人脸识别是指从多个候选人中识别出给定的人脸图像所属的身份。
基于深度学习的人脸识别方法主要借鉴人脸验证的思想,通过学习一个更大的特征空间,实现多个人脸图像之间的比对和识别。
在大规模人脸识别任务中,深度学习模型如Inception-ResNet和VGG等被广泛应用,并取得了显著的性能提升。
第1篇一、引言人脸作为人类身份的重要标识,在生物识别技术中占据着核心地位。
随着计算机视觉和人工智能技术的飞速发展,人脸特征提取与分析已成为计算机视觉领域的一个重要研究方向。
本报告旨在对人脸特征提取技术进行总结,包括其基本原理、主要方法、应用领域和发展趋势。
二、人脸特征提取的基本原理人脸特征提取是指从人脸图像中提取出能够表征人脸身份和特征的参数或模式。
这些特征可以是人脸的几何特征、纹理特征、外观特征等。
人脸特征提取的基本原理如下:1. 图像预处理:对原始人脸图像进行预处理,包括灰度化、去噪、人脸定位、人脸旋转等,以提高后续特征提取的准确性和鲁棒性。
2. 特征提取:根据不同的特征提取方法,从预处理后的人脸图像中提取出表征人脸身份和特征的参数或模式。
3. 特征选择:对提取出的特征进行筛选,去除冗余和不重要的特征,保留对识别贡献大的特征。
4. 特征融合:将多个特征融合成一个综合特征,以提高识别的准确性和鲁棒性。
三、人脸特征提取的主要方法目前,人脸特征提取方法主要分为以下几类:1. 基于特征的提取方法:- 几何特征:包括人脸轮廓、五官位置、人脸对称性等。
这类特征对人脸的旋转、光照和表情变化具有较好的鲁棒性。
- 纹理特征:通过分析人脸图像的纹理信息,提取出表征人脸纹理的特征。
常用的纹理特征有LBP(局部二值模式)、HOG(方向梯度直方图)等。
- 外观特征:通过分析人脸图像的灰度分布,提取出表征人脸外观的特征。
常用的外观特征有PCA(主成分分析)、LDA(线性判别分析)等。
2. 基于模板的提取方法:- 基于模板匹配:将人脸图像与已知的人脸模板进行匹配,找到最佳匹配位置,从而提取出人脸特征。
- 基于活动表观模型:通过建立人脸模型,将人脸图像映射到模型上,从而提取出人脸特征。
3. 基于深度学习的提取方法:- 卷积神经网络(CNN):通过训练一个深度神经网络,自动学习人脸特征,具有较高的识别准确率和鲁棒性。
- 循环神经网络(RNN):通过分析人脸图像的时间序列信息,提取出人脸特征。
近年来人脸识别技术相关研究进展综述近年来,随着人工智能技术的快速发展,人脸识别技术也在不断提高。
人脸识别技术是一种基于人脸图像进行身份信息认证的技术,其主要应用场景包括安保、金融、物流、智能家居等领域。
本文将综述近年来人脸识别技术的相关研究进展。
一、人脸特征提取技术人脸特征提取技术是人脸识别技术的核心。
近年来,研究人员主要从两个方面进行探索:一是如何提高人脸特征提取的准确率,二是如何提高人脸特征提取的效率。
目前,主流的人脸特征提取技术包括传统的基于LBP、HOG、SIFT等算法的特征提取方法和基于深度学习的特征提取方法。
深度学习技术的出现一定程度上解决了传统方法无法解决的问题,如尺度、光照、遮挡等。
但深度学习需要大量的样本数据支持,同时也会出现过拟合等问题。
因此,如何在保证准确率的同时提高效率成为研究的热点。
二、人脸检测技术人脸识别技术的基础是人脸检测技术。
人脸检测技术是指从图像或视频中自动检测出人脸的技术,是实现人脸识别的必要前提。
近年来,随着互联网、物联网、智能硬件行业的快速发展,人脸检测技术已成为研究热点。
主流人脸检测技术有三种:传统的基于Haar cascade和HOG的算法、基于深度学习的算法和基于联合检测的算法。
传统算法具有速度快、准确率高的特点,但在识别复杂环境、姿态变化、遮挡等方面的效果有限;基于深度学习的算法可以有效克服传统算法的缺陷,但需要大量样本数据进行训练并具有很高的算力要求;基于联合检测算法将分别检测和对检测结果进行联合得到一个较为准确的人脸检测结果。
三、人脸图像增强技术人脸图像增强技术是指对人脸图像进行处理,从而提高人脸识别的准确率。
传统的人脸图像增强技术包括高斯滤波、中值滤波等,但这些方法准确率不高且难以处理直方图均衡化的问题。
近年来,研究人员提出了一些新的人脸图像增强技术,如基于GAN的图像增强技术和基于Attention机制的图像增强技术。
基于GAN的图像增强技术可以在保留人脸特征的情况下对图像进行增强,提高了人脸识别的准确率;基于Attention机制的图像增强技术可以对不同部位的图像特征进行不同的处理,提高了对光照、噪声、遮挡等影响的容忍度。
人脸识别文献综述
人脸识别技术的文献综述可以从以下几个方面展开:
1.人脸识别技术的发展历程:介绍人脸识别技术的起源、发展历程以及各个阶段的技术特
点和应用领域。
2.人脸识别的基本原理:阐述人脸识别的基本原理,包括人脸检测、特征提取和匹配识别
等关键技术。
3.人脸识别的应用领域:介绍人脸识别技术在各个领域的应用情况,如安全、金融、交通、
教育等。
4.人脸识别的技术挑战和解决方案:分析人脸识别技术面临的技术挑战,如光照、角度、
面部朝向、面部表情等,并介绍各种解决方案和技术进展。
5.人脸识别的未来展望:预测人脸识别技术的发展趋势和未来发展方向,包括深度学习、
多模态融合、隐私保护等方面的技术发展。
6.在撰写人脸识别技术的文献综述时,需要全面收集和阅读相关文献,包括学术论文、专
利、技术报告等,并对各种文献进行分类和整理。
同时,需要对各种技术和方法进行比较和分析,总结出它们的优缺点和应用场景。
最后,需要结合自己的理解和见解,对人脸识别技术的未来发展进行预测和展望。
需要注意的是,人脸识别技术是一个跨学科的领域,涉及到计算机视觉、机器学习、模式识别等多个学科。
因此,在撰写文献综述时需要有一定的专业背景和技术基础,以便更好地理解和分析相关文献。
人脸识别技术的综述与分析人脸识别技术是一种基于计算机视觉和模式识别的技术,通过对人脸图片或视频进行分析和比对,实现身份识别、人脸检索和行为跟踪等功能。
近年来,随着计算机性能的提升和人工智能技术的不断发展,人脸识别技术得到了广泛的应用和研究。
一、技术发展历程人脸识别技术的发展可以分为三个阶段:传统算法、深度学习算法和端到端深度学习算法。
传统算法比较早期的人脸识别技术,主要采用几何、统计等方法对人脸特征进行提取和匹配。
这类算法主要应用于人脸检测和识别方面,但受限于特征的多样性和不足,其效果和鲁棒性和欠佳。
深度学习算法采用深层神经网络对人脸进行特征提取和学习,可以有效地提高人脸识别的准确率和鲁棒性。
近年来,深度学习算法在人脸识别方面取得了显著的进展,如FaceNet、DeepID、DeepFace和VGGFace等算法。
端到端深度学习算法将人脸识别过程从特征提取到匹配都交给深度神经网络处理,大大简化了流程和提高了效率。
目前,基于卷积神经网络的端到端人脸识别算法已成为主流,并在多种场景下实现了高效的人脸检测和识别。
二、技术原理与应用场景人脸识别技术的基本原理是通过对人脸图像进行分析和比对,从中提取出人脸的特征向量,并将其与数据库中已有的特征向量进行比对,来匹配出以前存在的人脸图像。
人脸识别技术可以应用于身份认证、门禁管理、智能安防、人脸支付等多种场景。
1.身份认证人脸识别技术可以通过对个人脸特征进行比对,验证身份的真实性。
在银行、机场、政府部门等各类场所中,可以通过人脸识别技术来确定个人身份,提高身份认证的准确性和效率。
2.门禁管理通过安装人脸识别设备,可以实现非接触式身份验证。
在进出人员相对固定的场所,如企事业单位、小区、学校等,可以使用人脸识别技术来管理和控制门禁,增强安全性和便利性。
3.智能安防结合人脸识别技术和视频监控设备,可以实现智能安防功能。
在银行、商场、车站等安保领域中,可以通过人脸识别技术来对可疑人员进行识别和报警,并及时采取相应的措施。
《基于深度学习的人脸识别方法综述》篇一一、引言随着人工智能技术的飞速发展,人脸识别技术已成为当今社会关注的热点。
作为计算机视觉领域的重要分支,人脸识别技术在安全监控、身份认证、智能交互等多个领域得到了广泛应用。
深度学习技术的出现为人脸识别提供了新的解决方案,使得人脸识别的准确性和效率得到了显著提升。
本文旨在综述基于深度学习的人脸识别方法,分析其原理、技术特点及发展趋势。
二、深度学习在人脸识别中的应用深度学习是一种模拟人脑神经网络结构的机器学习方法,通过构建多层神经网络来提取数据的深层特征。
在人脸识别领域,深度学习主要应用于特征提取和分类识别两个阶段。
1. 特征提取特征提取是人脸识别的关键步骤,其目的是从原始图像中提取出能够表征人脸特征的有效信息。
深度学习通过构建卷积神经网络(CNN)等模型,自动学习从原始图像中提取出高维度的特征表示,这些特征对于人脸识别任务具有较好的鲁棒性和区分性。
2. 分类识别分类识别是利用已提取的特征进行人脸匹配和识别的过程。
深度学习通过构建全连接层、支持向量机(SVM)等模型,对提取的特征进行分类和识别。
在人脸识别任务中,深度学习可以有效地提高识别的准确性和效率。
三、基于深度学习的人脸识别方法基于深度学习的人脸识别方法主要包括基于深度神经网络的人脸识别方法和基于深度学习的三维人脸识别方法。
1. 基于深度神经网络的人脸识别方法该方法通过构建多层神经网络模型,对人脸图像进行特征提取和分类识别。
常见的模型包括卷积神经网络(CNN)、深度置信网络(DBN)等。
这些模型能够自动学习和提取出高维度的特征表示,提高了人脸识别的准确性和鲁棒性。
2. 基于深度学习的三维人脸识别方法该方法利用三维信息来提高人脸识别的准确性和鲁棒性。
通过构建三维模型来获取人脸的立体信息,再结合深度学习技术进行特征提取和分类识别。
这种方法对于姿态变化、表情变化等复杂场景具有较好的适应性和鲁棒性。
四、技术特点及发展趋势基于深度学习的人脸识别方法具有以下技术特点:1. 高效性:深度学习能够自动学习和提取出高维度的特征表示,提高了人脸识别的效率和准确性。
人脸识别及身份验证技术研究综述人脸识别及身份验证技术是一种基于人脸生物特征进行识别的技术,其应用越来越广泛,涵盖安全监控、支付系统、手机解锁等多个领域。
在当前社会信息化和智能化的发展趋势下,人脸识别及身份验证技术也得到了更多的关注和研究。
在这篇文章中,将对人脸识别及身份验证技术的研究现状进行综述。
一、人脸识别技术的发展历程人脸识别技术起源于20世纪60年代,但直至80年代才开始引起学术界和工业界的关注。
早期的人脸识别系统主要采用几何和模式识别方法,通过比对面部特征进行识别。
然而,由于这类方法在复杂环境下的准确率较低,人脸识别技术一直未能实现在实际应用中的广泛普及。
随着深度学习和计算机视觉技术的快速发展,基于深度学习的人脸识别技术得到了极大的提升。
2024年,Google提出了一种基于卷积神经网络的人脸识别模型FaceNet,其在LFW数据集上的准确率高达99.63%,开创了人脸识别技术的新纪元。
之后,各大公司纷纷投入人脸识别领域,推动了该技术的飞速发展。
二、人脸识别技术的原理与方法人脸识别技术主要包括人脸检测、人脸对齐、特征提取和特征匹配等几个步骤。
其中,人脸检测是最关键的一步,其目的是在图像中准确地定位人脸区域。
人脸对齐用于修正人脸图像中的姿态和尺度,以便后续的特征提取和匹配。
特征提取是人脸识别的核心,常用的方法包括局部二值模式(LBP)、主成分分析(PCA)、线性判别分析(LDA)等。
特征匹配通过计算待识别人脸图像与数据库中已知人脸的相似性,从而实现识别目标。
目前,人脸识别技术主要分为传统方法和深度学习方法两大类。
传统方法包括主成分分析、线性判别分析、支持向量机等,在一定程度上能够取得较好的效果。
而深度学习方法则以卷积神经网络为代表,结构更加复杂,训练过程更为复杂,但在人脸识别准确率上表现更为出色。
三、人脸识别技术的应用领域人脸识别技术在许多领域都得到了广泛应用。
在安防监控领域,人脸识别技术能够帮助监控系统实现实时识别和追踪目标,提高监控效率和准确性。
第25卷 第5期2002年5月计 算 机 学 报CH INESE PUT ERSV o l.25N o.5M ay 2002人脸检测研究综述梁路宏 艾海舟 徐光 张 钹(清华大学计算机科学与技术系 北京100084)(清华大学智能技术与系统国家重点实验室 北京100084)收稿日期:2001-03-07;修改稿收到日期:2002-01-31.本课题得到国家“八六三”高技术研究发展计划(863-805-512-9805-11)和清华大学研究支持基金(百005)资助.梁路宏,男,1973年生,博士,现工作于Intel 中国研究院.艾海舟,男,1964年生,博士,副教授.研究方向为计算机视觉、模式识别、移动机器人.E-mail:ahz @m ail.tsinghu .徐光,男,1940年生,教授,博士生导师.研究方向为计算机视觉、人机交互技术和多媒体技术.张 钹,男,1935年生,教授,博士生导师,中国科学院院士.研究方向为人工智能的理论与应用.摘 要 人脸检测问题最初作为自动人脸识别系统的定位环节被提出,近年来由于其在安全访问控制、视觉监测、基于内容的检索和新一代人机界面等领域的应用价值,开始作为一个独立的课题受到研究者的普遍重视.该文从人脸检测问题的分类、人脸模式的分析、特征提取与特征综合、性能评价等角度,系统地整理分析了人脸检测问题的研究文献,将人脸检测方法主要划分为基于知识的人脸验证方法和基于统计的学习方法,指出统计学习方法优于启发式验证方法.关键词 人脸检测,人脸识别,模式识别,计算机视觉中图法分类号:T P 391A Survey of Human Face DetectionLIANG Lu-Hong AI Hai-Zhou XU Guang -You ZHANG Bo(De p artment of Compu ter S cienc e and T echnology ,T sing hua Unive rsity ,Be i j ing 100084)(S tate K e y L aboratory of I ntelligent T echnology and Systems ,Tsing hua Univ ersity ,B eij ing 100084)Abstract T his paper pr esents a surv ey on the state of the art of face detection research based on sy stematic analysis of related papers .Fir stly face detection pro blem is divided into sev eral classes according to the ty pe of input im ages,backg round com plex ity ,po se variance,application dom ain etc.,and then face pattern is analyzed based on various features and their possible fusion metho d fo r the purpose of face detection .The literature is r eview ed in tw o parts :feature ex traction and featur e fusion for face detection.Feature extraction includes skin-color segm entation and variousgray lev el features such as the o utline o f face ,gr ay lev el distribution ,org anic feature ,sy mme-tr y,tem plate etc.Feature fusion m ethods include kno wledge-based heuristic face verification,statistical learning appro aches (Eigenface,Clustering ,A NN,SVM ,HM M ,EM pro babilistic model ).Perfo rmance comparison of so me w ell know n metho ds is g iven on M IT +CM U test set .In conclusion,statistical learning metho ds are superio r to those know ledge based metho ds,and in all those lear ning based methods,the key pro blem is the training complexity,even by bootstr ap metho d it remains a g reat challeng e due to the div ersity o f non -face samples co mpar ed w ith facesam ples.We suggest a subspace method for dow nsizing the training space by designing a filter (such as template matching filter )that excludes m ost of non face candidates and then training in the dow nsized subspace .It is pointed out that statistical learning m ethods depend on the accor-dance of sample patterns (syntactic information),w hich canno t take into considerations of much important semantic information .T his differs m uch from hum an beings in face cog nition .T here is a limit for statistical only appr oaches and the help of know ledg e based m ethods is needed .Keywords face detectio n ,face reco gnition ,pattern recog nition ,computer vision1 引 言人脸检测(face detection)是指在输入图像中确定所有人脸(如果存在)的位置、大小、位姿的过程.人脸检测作为人脸信息处理中的一项关键技术,近年来成为模式识别与计算机视觉领域内一项受到普遍重视、研究十分活跃的课题.人脸检测问题最初来源于人脸识别(face recog-nition).人脸识别的研究可以追溯到20世纪60—70年代,经过几十年的曲折发展已日趋成熟[1,2].人脸检测是自动人脸识别系统中的一个关键环节,但是早期的人脸识别研究主要针对具有较强约束条件的人脸图像(如无背景的图像),往往假设人脸位置已知或很容易获得,因此人脸检测问题并未受到重视.近几年随着电子商务等应用的发展,人脸识别成为最有潜力的生物身份验证手段,这种应用背景要求自动人脸识别系统能够对一般环境图像具有一定的适应能力,由此所面临的一系列问题使得人脸检测开始作为一个独立的课题受到研究者的重视.今天,人脸检测的应用背景已经远远超出了人脸识别系统的范畴,在基于内容的检索、数字视频处理、视觉监测等方面有着重要的应用价值.人脸检测研究具有重要的学术价值.人脸是一类具有相当复杂的细节变化的自然结构目标,此类目标的检测问题的挑战性在于[3]:(1)人脸由于外貌、表情、肤色等不同,具有模式的可变性;(2)一般意义下的人脸上,可能存在眼镜、胡须等附属物;(3)作为三维物体的人脸的影像不可避免地受由光照产生的阴影的影响.因此,如果能够找到解决这些问题的方法,成功构造出人脸检测与跟踪系统,将为解决其它类似的复杂模式检测问题提供重要的启示.目前,国外对人脸检测问题的研究很多,比较著名的有M IT,CM U等;国内的清华大学[4—8]、北京工业大学[9,10]、中国科学院计算技术研究所[11]和中国科学院自动化研究所[12]等都有人员从事人脸检测相关的研究.而且,M PEG7标准组织已经建立了人脸识别草案小组,人脸检测算法也是一项征集的内容.随着人脸检测研究的深入,国际上发表的有关论文数量也大幅度增长,如IEEE的FG(IEEE In-ternational Conference o n Automatic Face and Ges-ture Recog nition)、ICIP(Internatio nal Co nfer ence o n Imag e Pr ocessing)、CVPR(Conference on Com-puter Vision and Pattern Recognition)等重要国际会议上每年都有大量关于人脸检测的论文,占有关人脸研究论文的近1/3之多.有关人脸检测的内容在人脸识别研究的综述中有所涉及[1,2],但仅仅侧重于人脸识别系统的输入环节,目前较为详尽的人脸检测与跟踪综述为文献[13],着重于介绍各种方法所使用的特征和模型,本文则系统地整理分析了相关的研究文献,按照人脸检测的问题分类与模式分析、人脸特征的提取与综合等线索对近年来的研究进行了综述.2 人脸检测问题的分类与人脸模式分析人脸检测问题所包含的内容十分广泛,从不同的角度可以有多种分类方法(表1).本文主要讨论静止图像中的人脸检测问题.动态图像中单帧内的人脸检测与静止图像的情况基本相同,若考虑动态信息则属于人脸跟踪(face tracking)问题,将不在本文讨论.表1 人脸检测问题的分类分类依据类别图像类型图像来源静止图像(包括如数字化的照片、数码相机拍摄的图片等,目前考虑的主要问题是算法的适应性和鲁棒性,算法速度在其次)动态图像(即视频序列,包括工作台前的人脸序列、保安监控录像、影视资料等,往往与人脸的跟踪问题交织在一起,对算法的速度有很高的要求)颜色信息彩色灰度图像前景镜头类型头肩部图像半身/全身图像人脸姿态正面(包括端正及平面内旋转)侧面(包括俯仰、侧影及旋转)人脸数目单人(又可以称为人脸定位,是人脸检测问题在已知人脸数目情况下的特例)未知(需要判定图像中是否存在人脸,人脸的数目以及各个人脸的尺度和位置,即是完全的检测问题)图像背景复杂程度简单背景(指无背景或背景的特征被严格约束,在该条件下只利用人脸的轮廓、颜色、运动等少量特征,就能够进行准确检测)复杂背景(指背景的类型和特征不受约束,某些区域可能在色彩、纹理等特征上与人脸相似,必须利用较多的人脸特征才能做到准确检测)应用领域人脸信息处理(验证、识别、表情分析等)系统、视频会议或远程教育系统、视觉监视与跟踪、基于内容的图像与视频检索等等.人脸图像所包含的模式特征十分丰富,如图1所示.这些特征中哪些是最有用的、如何利用这些特450计 算 机 学 报 2002年征,是人脸检测要研究的一个关键问题.人脸模式具有复杂而细致的变化,因此一般需要采用多种模式特征综合的方法,如图2所示.归纳起来,根据利用特征的色彩属性可以将人脸检测方法分为基于肤色特征的方法和基于灰度特征的方法两类.前者适用于构造快速的人脸检测和人脸跟踪算法,后者利用了人脸区别于其它物体的更为本质的特征,是人脸检测领域研究的重点.根据特征综合时采用的不同模型,可以将基于灰度特征的方法分为两大类:基于启发式(知识)模型的方法和基于统计模型的方法.由于人脸检测问题的复杂性,无论哪一类方法都无法适应所有的情况,一般都针对人脸检测领域内某个或某些特定的问题.3 人脸模式的特征提取人脸模式的特征包括肤色特征和灰度特征.3.1 肤色特征肤色是人脸的重要信息,不依赖于面部的细节特征,对于旋转、表情等变化情况都能适用,具有相对的稳定性并且和大多数背景物体的颜色相区别.因此肤色特征在人脸检测中是最常用的一种特征.肤色特征主要由肤色模型描述.使用何种形式的肤色模型与色度空间(chrom i-nance space )的选择密切相关.可以从两个方面考察某种色度空间:(1)在该色度空间中能否用给定的模型描述“肤色”区域的分布;(2)色度空间中“肤色”与“非肤色”区域的重叠有多少[14].人脸检测常用的色度空间主要有RGB (红、绿、蓝三基色)[5,15]、rgb (亮度归一化的三基色)[11]、SHI (饱和度、色调、亮度)[16]、YIQ (NTSC 制的光亮度和色度模型)[17]、YU V (PAL 制的光亮度和色度模型)[18]、YCbCr (CCIR 601编码方式的色度模型,与YUV 在数学上具有等价性)[19]、CIEL *a *b(国际照明委员会提出的基于色度学的彩色模型)[20—23]等.常用的肤色模型有高斯模型、混合高斯模型和直方图模型.T errillon 等[14]考察了归一化的r -g 、CIE-xy 、归一化的TSL 、CIE-DSH 、HSV 、YIQ 、YES 、CIE-L *u *v 和CIE-L *a *b 9种色度空间,比较了高斯模型和混合高斯模型在不同色度空间中的性能,发现除了少数情况外,一般需要使用混合高斯模型才能较好地描述肤色区域的分布.T er rillon 等同时指出,最终限制检测性能的因素是不同色度空间中“肤色”与“非肤色”区域的重叠程度.Jones 等[15]研究了RGB 空间中“肤色”与“非肤色”像素的分布,根据标定出肤色区域的近2万幅图片(包含约20亿个像素)建立了三维直方图,在此基础上比较了直方图模型和混合高斯模型,发现前者的性能略好于后者.除上述3种肤色模型外,还有直接利用几何参数描述肤色区域分布范围的模型[24]、三维投影模型[18]、基于神经网的肤色模型[19,25]等.此外也有同时考虑“肤色”与“非肤色”像素分布的基于贝叶斯方法的模型[26].3.2 灰度特征灰度特征包括人脸轮廓特征、人脸灰度分布特征(镶嵌图特征、直方图特征等)、器官特征(对称性等)、模板特征等.轮廓是人头部的重要特征.Craw 等[27]首先在低分辨率图像中使用一个轮廓模板匹配出人脸的大致范围,然后在高分辨率图像中使用Sobel 算子获得边缘的位置和方向,并连接出完整的人脸轮廓.W ang 等[12]提取边缘特征并根据广义Houg h 变换抽取椭圆形状信息.人脸核心区域(眼睛、鼻子、嘴区域)具有独特的灰度分布特征.Yang 等[28]首先提出了人脸的镶嵌图(mo saic im age,又称为马赛克图)特征.所谓镶嵌图就是将图像划分为一组大小相同的方格,每个方格的灰度为格中各个像素的平均值.镶嵌图特征是4515期梁路宏等:人脸检测研究综述指这些块的值应满足的约束规则.Lu等[4]依据人脸的左右对称性,通过提取投影直方图特征检测人脸的旋转角度,再提取镶嵌图特征.Dai等[29]提取空间灰度共现矩阵(SGLD)特征等等.人脸区域内的各个器官(如双眼、鼻子、嘴等)是人脸的重要特征.Kouzani等[30]使用人工神经网分别检测眼睛、鼻子、嘴以及人脸的整体特征.人脸区域的灰度本身可以作为模板特征,通常取仅包含双眼、鼻子和嘴的面部中心区域作为共性的人脸模板特征[3],排除掉头发、脸颊两侧变化很大的部分.被广泛地用于基于统计学习的人脸检测方法中.4 人脸模式的特征综合人脸的检测过程实际上就是对人脸模式特征的综合判断过程,包括多种方法.4.1 肤色区域分割与人脸验证方法对于彩色图像,在确定肤色模型之后,首先可以进行肤色检测.在检测出肤色像素后,需要根据它们在色度上的相似性和空间上的相关性分割出可能的人脸区域,同时利用区域的几何特征或灰度特征进行是否是人脸的验证,以排除其它色彩类似肤色的物体.区域分割与验证在很多方法中是密切结合、统一考虑的.在一些情况下,仅根据肤色像素的聚积特性即可完成区域分割.Yoo等[16]利用肤色像素的连通性分割出区域,使用椭圆拟合各个区域,根据椭圆长短轴的比率判断其是否为人脸.Cai等[23]根据肤色模型提供的像素的似然度,采用从局部最大值处逐渐扩展的方法得到肤色区域,然后使用灰度平均脸模板匹配的方法验证区域内是否有人脸.对于较为复杂的情况,则需要考虑两方面的问题:(1)由于光照和脸部器官的影响,人脸可能被割裂为若干互不连通的肤色区域;(2)人脸区域可能与其它类肤色区域连接在一起.聚类-归并-验证策略是较常用的解决方法:首先将肤色像素按照较为严格的颜色一致性和几何约束条件聚类为区域,然后按照一定规则进行归并,归并后或归并过程中利用其它特征进行验证.Garcia 等[31]按照色度的差异将肤色进一步量化为不同的类型,将类型相同且相邻的肤色像素聚类为区域,根据几何位置、形状和色调相容性进行归并,归并过程中利用区域的小波特征进行验证.Yang等[20]根据色度的一致性和空间距离将肤色像素聚类成区域,然后逐步归并直到得到符合一定先验知识的椭圆区域为止,最后检查区域中由眼睛、嘴巴等特征形成的暗区或空洞,以确定是否为人脸.Abdel-M ottaleb 等[18]首先排除了局部邻域内亮度变化较大的肤色像素,对其余肤色像素进行聚类,从而得到色度一致的区域;然后使用基于邻接图的方法归并不连通的区域,并且检查区域内亮度在邻域中变化较大的像素(可能对应于眼睛、嘴等特征)所占的比率,对归并结果进行验证.另一种策略是先用较弱的条件将肤色像素聚类为区域,再将符合一定条件的区域分裂开.W ei 等[17]根据区域的大小和形状找出可能的人脸,剩下的区域按照一定规则不断分裂,以便找出与类肤色背景连接在一起的人脸,最后利用亮度信息对各个区域进行验证.还有一些方法使用肤色模板进行搜索匹配. Karlekar等[19]对YCbCr格式的彩色图像进行了小波变换,训练一个多层感知器在C b,C r平面的低通色度子图中检测肤色像素,然后使用一个“人脸-背景”二值人脸模板匹配搜索,最后利用亮度分量的小波变换系数验证搜索结果.Wu等[21,22]采用了模糊模板匹配方法,该方法不仅建立了肤色模型,同时也建立了头发颜色的模型.根据人脸位姿的不同,构造了5种“肤色-发色”模板,并定义了相应的隶属度函数和模糊匹配规则,对所有可能尺度和位置的区域进行搜索.此外,还有在分割之前就将肤色检测的结果与其它特征融合在一起的方法,如Sun等[32]提出的基于肤色与对称信息的方法、Kim等[33]提出的肤色信息与深度信息相结合的方法等.4.2 基于启发式模型的方法基于启发式模型的方法首先抽取几何形状、灰度、纹理等特征,然后检验它们是否符合人脸的先验知识.Gov indaraju等[34]使用变形模板(deform able template)匹配头顶轮廓线和左右两条面颊轮廓线,实现人脸定位.Yang等[28]提出了基于镶嵌图(m osaic im age,又称为马赛克图)的人脸检测方法.Yang等将人脸的五官区域分别划分为4×4个和8×8个马赛克块,使用一组规则进行检验,并且利用边缘特征进一步验证.卢春雨等[6]对镶嵌图方法进行了改进,按照人脸器官的分布将人脸划分为3×3个马赛克块,在452计 算 机 学 报 2002年检测中自适应地调整各块的大小,使用一组基于各块灰度和梯度统计特征的知识规则检验该区域是否为人脸,取得了较好的实验结果.人脸区域内的各个器官也具有较为恒定的模式,因此一些方法首先检测器官(如双眼、鼻子、嘴等)或局部特征,然后根据它们的相对位置关系判断整个区域是否为人脸.Kouzani等[30]将使用人工神经网分别检测出来的眼睛、鼻子、嘴以及人脸的整体特征及相互间的位置关系输入一个模糊神经元网络,根据其中的领域知识判断被检测的区域是否为人脸.M iao等[9]从输入图像中提取可能对应于眉毛、眼睛、嘴等器官的水平方向的马赛克边缘(mo-saic edg e),计算各段边缘的“重心”(g ravity center)后,使用“重心”模板进行匹配,最后使用灰度和边缘特征验证匹配的结果.该方法对人脸位姿的变化具有较强的适应能力.采用局部特征检测方法的还有基于双眼检测的方法[35]、基于概率框架的局部特征聚类方法[36]以及结构模型、纹理模型和特征模型相结合的方法[37]等.人脸灰度模板也可以看作是一种启发式模型.梁路宏等[7]使用了直接的平均脸模板匹配方法.与Cai 等[23]的方法不同,该方法考虑到眼睛在人类辨识人脸过程中的特殊作用,使用双眼模板首先进行粗筛选,然后使用不同长宽比的人脸模板进行匹配,最后使用马赛克规则进行验证.使用的模板参见图3.此外还有Lu等[4]根据投影直方图分析首先确定人脸的旋转角度,然后使用基于镶嵌图的方法检测人脸;Dai等[29]根据空间灰度共现矩阵特征检测人脸等等.其它基于知识模型的方法可以参见文献[2].利用人脸的轮廓、对称性等少量特征的方法适用于较强约束条件下(如简单背景、头肩图像)的人脸检测.由于使用的特征较少,此类算法可以达到较高的检测速度,实现实时检测与跟踪.利用人脸五官分布特征的知识模型方法能够在一定程度上适用于复杂背景图像中的人脸检测,同时达到较高的检测速度,如文献[9,28]等.但是需要看到,要想进一步提高知识模型的适应能力,需要综合更多的特征,这实际上涉及到图像理解这一困难的问题.这是此类方法进一步发展遇到的主要障碍.4.3 基于统计模型的方法由于人脸图像的复杂性,显式地描述人脸特征具有一定困难,因此另一类方法——基于统计模型的方法越来越受到重视.此类方法将人脸区域看作一类模式,即模板特征,使用大量的“人脸”与“非人脸”样本训练、构造分类器,通过判别图像中所有可能区域属于哪类模式的方法实现人脸的检测.实际上,人脸检测问题被转化为统计模式识别的二分类问题.4.3.1 基于特征空间的方法此类方法将人脸区域图像变换到某一特征空间,根据其在特征空间中的分布规律划分“人脸”与“非人脸”两类模式.主分量分析(Principal-Com ponent Analysis, PCA)是一种常用的方法.它根据图像的统计特性进行正交变换(K-L变换),以消除原有向量各个分量间的相关性.变换得到对应特征值依次递减的特征向量,即特征脸[38].Mo ghaddam等[38]发现人脸在特征脸空间的投影聚集比较紧密,因此利用前若干张特征脸将人脸向量投影到主元子空间F和与其正交的补空间F-,相应的距离度量分别称为DIFS (Distance In Feature Space)和DFFS(Distance From Featur e Space).对于人脸检测问题,由于没有考虑“非人脸”样本的分布,需要同时使用DIFS 和DFFS才能取得较好的效果.M IT的Sung等[3]提出了基于事例学习的方法,同时使用了19×19像素分辨率的“人脸”和“非人脸”样本.样本预处理后按行列顺序展开为样本向量进行主分量分解.采用k-均值聚类方法在特征空间中建立6个“人脸”簇(Clusters),同时建立包围“人脸”簇的6个“非人脸”簇,以使“人脸”与“非人脸”模式的边界更为清晰.Sung等使用样本到各个簇中心的距离训练一个多层感知器进行分类.需要指出的是,人脸检测中“非人脸”样本的选取是一个较为困难的问题.Sung等使用了“自举”(bootstrap)方法加以解决:首先建立一个仅使用“人脸”簇的初始分类器对一组图像进行检测,将所有的错误报警(不是人脸而被错检为“人脸”的结果)加入“非人脸”样本库,构造新的使用“人脸”与“非人脸”簇的分类器重新检测.以上过程不断迭代,直到收集了足够的“非人脸”样本.属于特征空间方法的还有因子分解方法(Fac-tor Analy sis,FA)和Fisher准则方法(Fisher Lin-ear Discriminant,FLD).Yang等[39]在混合线性子空间(m ix tur es of linear subspaces)中对“人脸”和4535期梁路宏等:人脸检测研究综述“非人脸”样本的分布进行建模,分别使用基于EM 算法[40]的扩展FA 方法和基于自组织映射(Self-Organizing M ap,SOM )[41]的FLD 方法构造检测器.此外,小波变换也被用于人脸检测,如文献[42,43]中使用了小波变换提取人脸的多分辨率特征作为分类的依据.4.3.2 基于人工神经网的方法人工神经网(ANN )方法是把模式的统计特性隐含在ANN 的结构和参数之中,对于人脸这类复杂的、难以显式描述的模式,基于ANN 的方法具有独特的优势.CMU 的Row ley 等[44—46]使用了多个ANN 检测多姿态的人脸,算法的框架如图4所示.图中显示了两类ANN :1个位姿检测器(pose estim ato r)用于估计输入窗口中人脸的位姿、3个检测器(detector )分别检测正面(frontal )、半侧面(half profile )和侧面(profile )的人脸.使用经过对准和预处理的“人脸”样本以及采用“自举”(bootstr ap)方法收集分类器错分的样本作为“非人脸”样本训练各个ANN,进一步修正分类器.检测时对输入图像中所有可能位置和尺度的区域首先使用位姿检测器估计人脸位姿,经校准和预处理后送入3个检测器中,最后对检测器的分类结果进行仲裁.在上述框架下,Ro w ley 等对正面端正人脸和正面旋转人脸的检测单独进行了研究[44,45,46].对于正面端正的人脸,仅使用了正面人脸检测ANN ,是一种三层前向网:输入层对应20×20像素的图像区域;隐层节点分为对应不同人脸区域的若干组,与输入层部分连接;ANN 输出1到-1区间的值表示这个区域是否为人脸.Ro w ley 等使用相同的“人脸”样本和不同“自举”过程收集的“非人脸”样本训练了多个正面人脸检测ANN ,对它们的检测结果进行仲裁,以进一步减少错误报警.对于正面旋转人脸的检测使用了旋转角度检测器及正面人脸检测ANN ,并使用相似的多AN N 仲裁方法降低错误报警.基于人工神经网的方法还有Juell 等[47]和Kou-zani 等[30]提出的基于人脸器官检测的多级网络方法、Anifantis 等[48]提出的双输出人工神经网的检测算法等.4.3.3 基于概率模型的方法基于概率模型方法的一种思路是计算输入图像区域r egion 属于人脸模式obj ect 的后验概率p (ob -j ect ûregion ),据此对所有可能的图像窗口进行判别.CMU 的Schneider man 等[49,50]提出一种基于后验概率估计的人脸检测方法.该方法利用贝叶斯原理将后验概率估计转化为一个似然度求解问题:P (r egion ûobj ect )P (region ûobj ect ) object ><objectK =P (obj ect )P (obj ect ),将难以估计的先验概率P (obj ect )和P (obj ect )用一个比率参数K 代替,作为调节检测器敏感度的参量.Schneiderman 等采用64×64像素的模式区域,将其分为16个子区域,通过子区域独立性等假设降低“人脸”和“非人脸”模式分布表达式P (region ûobj ect )和P (region ûobj ect )的复杂性,最后转化为稀疏编码的直方图,通过计算训练样本的频度求得两种模式的概率分布.Schneiderm an 等还将概率估计的方法用于检测正面旋转人脸和侧面人脸,同时使用多分辨率信息复用和由粗到精搜索的策略提高检测的速度[50].属于这一类的还有Weber [51]等提出的视点不变性学习(View point-Invariant Learning)的方法等.另一种概率模型是用于描述信号统计特性的隐马尔可夫模型(Hidden Markov Mo dels ,HMM ),目前也被应用于人脸检测与识别.Nefian 等[52]根据正面人脸由上到下各个区域(头发、额头、双眼、鼻子、嘴)具有自然不变的顺序这一事实,使用一个包含五个状态的一维连续HM M 加以表示.将头部图像按454计 算 机 学 报 2002年。