超全的最新的人脸识别特征点定位方法
- 格式:docx
- 大小:26.30 KB
- 文档页数:6
yolo 人脸特征点提取欧式距离计算轻松聊聊 YOLO 人脸特征点提取与欧式距离计算最近我参加了一个有趣的科技爱好者聚会,大家都在分享自己在技术领域的新奇发现和有趣经历。
其中有个小伙伴提到了 YOLO 人脸特征点提取和欧式距离计算,这一下子引起了我的兴趣。
咱们先来聊聊 YOLO 人脸特征点提取。
这一特征点提取的方式啊,就像是给人脸来了一次细致的“测绘”。
它的出现呢,是因为计算机视觉技术的不断发展,研究人员想要更精准地理解和处理人脸信息。
那它有啥作用和表现呢?比如说,在人脸识别系统中,通过提取人脸的特征点,能够快速准确地判断是不是同一个人。
我就曾经在一个智能门禁系统中体验过,刷脸就能开门,那叫一个方便!而且在一些美颜相机里,它也能精准定位五官,让美颜效果更加自然。
不过呢,它也有优缺点。
优点就是准确性高,能处理各种复杂的人脸情况。
但缺点嘛,就是计算量相对较大,对硬件设备的要求比较高。
再来说说欧式距离计算这个特征。
它就像是一把尺子,用来衡量特征点之间的“距离”。
这个特征的来源是数学中的距离概念,被巧妙地应用到了人脸特征处理中。
它的作用可不小,比如在人脸匹配中,通过计算欧式距离,可以判断两张脸的相似程度。
我朋友在做一个人脸识别的小项目时就用到了这个,效率还挺高。
但它也有局限性,如果特征点的选取不够合理,计算结果可能就不准确啦。
这两个特征对事物性质和使用体验的影响那可大了去了。
就拿人脸识别来说,YOLO 人脸特征点提取让识别更精准,而欧式距离计算则让比较和匹配更有依据。
但在实际应用中,如果环境光线不好,或者人脸有遮挡,可能就会影响特征点的提取效果,导致识别错误。
安全性和潜在问题也得重视。
比如说,如果这些数据被不法分子获取,那可就有隐私泄露的风险。
还有,如果算法出现错误,可能会出现误识别的情况,给人们带来麻烦。
总结一下,YOLO 人脸特征点提取和欧式距离计算在人脸识别等领域有着重要的作用,但也有各自的优缺点和潜在问题。
dlib的landmark算法摘要:一、dlib 简介1.dlib 的背景和作用2.dlib 的主要模块和功能二、landmark 算法概述ndmark 算法的定义ndmark 算法的作用和应用三、dlib 中的landmark 算法实现1.dlib 中的landmark 算法原理2.dlib 中的landmark 算法流程3.dlib 中的landmark 算法应用示例四、landmark 算法与其他算法的比较ndmark 算法与传统特征点匹配算法的比较ndmark 算法与深度学习算法的比较五、dlib 的landmark 算法在实际应用中的优势和局限1.dlib 的landmark 算法在实际应用中的优势2.dlib 的landmark 算法在实际应用中的局限正文:一、dlib 简介dlib 是一个开源的计算机视觉库,它包含了大量的图像处理和计算机视觉方面的算法。
这些算法被广泛应用于人脸识别、物体识别、姿态估计、文本识别等领域。
dlib 库提供了丰富的函数和接口,方便开发人员快速实现图像处理和计算机视觉方面的功能。
dlib 的主要模块包括:1.特征提取模块:包括HOG、LBP、LRE 等特征提取算法。
2.分类器模块:包括SVM、Ridge、Lasso 等分类器算法。
3.物体检测模块:包括基于深度学习的物体检测算法。
4.姿态估计模块:包括基于关键点和基于轮廓的的姿态估计算法。
5.文本识别模块:包括基于模板匹配和基于深度学习的文本识别算法。
二、landmark 算法概述landmark 算法是一种用于人脸关键点定位的方法。
它通过定位面部特征点,如眼睛、鼻子、嘴巴等,来确定人脸的姿态和形状。
landmark 算法可以用于人脸识别、人脸跟踪、表情识别等领域。
landmark 算法的主要步骤如下:1.提取图像特征:通过提取图像中的特征点,如眼睛、鼻子、嘴巴等,来确定人脸的位置和姿态。
2.建立模型:通过训练模型,来学习特征点和人脸姿态之间的关系。
摘要面部特征点定位是指在输入人脸图像上自动检测面部关键特征(如眼睛中心点,眼角点,嘴角点等)的技术,可以用于对齐待匹配的人脸图像,因而是全自动人脸识别中的关键步骤之一。
此外,精确的面部特征点定位也是实现人脸合成、人脸驱动卡通、人脸跟踪、人脸姿态分析以及人脸表情分析等众多视觉任务的重要步骤。
本文调研面部特征点定位的国内外的研究现状,尤其详细介绍了基于点分布模型(PDM)的主动形状模型(ASM)方法,并对ASM的模型建立以及迭代搜索调整进行了深入的分析和讨论。
发现面部特征点定位的难点主要在于人脸变化的多样性以及图像采集环境的复杂性。
具体在ASM中,前者主要表现为主成分分析(PCA)模型不足以描述姿态、表情导致的面部形状显著变化,而后者则主要表现为光照、噪声和部分遮挡等导致的低层图像信息的不确定性问题。
针对前者,本文分别首先采用了混合概率主成分分析(MPPCA)方法替换传统PCA模型的方法,并进一步提出了基于约束回归的方法。
针对后者,本文采用了前端搜索时生成多候选点的方法。
另外,为了尽量避免ASM 迭代优化调整陷入局部极小,我们采用了更加精确的形状初始化方法和预先进行眼嘴状态估计的方案。
具体的,本文的主要研究成果如下:(1)针对ASM定位结果严重依赖初始形状的问题,提出了利用少量关键点(如眼睛中心、鼻尖、嘴角等)设置更精确初始形状的方法。
本文介绍了利用少数关键点和主成分分析(PCA)模型计算相似变换系数以及PCA投影参数的方法,并以此设置初始形状,实验证明了该方法的有效性。
同时,针对表情变化问题,本文设计了一种利用眼嘴状态估计增强ASM的方法。
该方法通过支持向量分类法(SVC)预测眼睛状态;而通过支持向量回归(SVR)来估计嘴巴的张开程度。
由此得到的眼睛和嘴巴的状态,不仅可用于更优的初始形状设置,还可以用于指导、修正前端的局部纹理搜索,以提升定位效果。
(2)研究并实现了基于混合概率主成分分析(MPPCA)改进ASM的面部特征点定位方法,以更好地处理表情、遮挡以及复杂背景变化。
人脸关键点检测经典算法人脸关键点检测经典算法是计算机视觉领域的一个重要研究方向,它旨在识别和定位人脸图像中的关键点,如眼睛、鼻子、嘴巴等。
本文将介绍人脸关键点检测的基本原理以及三种经典算法:传统机器学习方法、深度学习方法和级联回归方法。
通过分析比较这些算法的优劣势,我们能够更好地理解人脸关键点检测技术的发展和应用。
一、人脸关键点检测基本原理人脸关键点检测的基本原理是将人脸图像中的关键点位置信息映射到特定的坐标系中。
这样一来,我们就可以通过机器学习或深度学习算法来训练模型,使其能够自动识别和定位这些关键点。
具体来说,人脸关键点检测的基本步骤包括以下几个方面:1. 数据准备:从人脸图像或视频中收集一系列标注好的训练样本,其中包含了关键点的位置信息。
2. 特征提取:将人脸图像转换成计算机可以理解的特征向量。
常用的特征包括灰度直方图、梯度直方图和局部二值模式等。
3. 模型训练:使用机器学习或深度学习算法对提取的特征进行训练,以建立关键点检测模型。
4. 模型测试和优化:使用测试集评估模型的性能,并根据需要对模型进行调整和优化。
二、传统机器学习方法传统机器学习方法在人脸关键点检测中有着较长的历史。
常用的传统机器学习方法包括支持向量机(SVM)、随机森林(RandomForest)和神经网络等。
在传统机器学习方法中,特征提取是一个关键问题。
基于传统机器学习方法的人脸关键点检测通常使用手工设计的特征表示,如HOG(Histogram of Oriented Gradients)、SIFT(Scale-Invariant Feature Transform)和SURF(Speeded Up Robust Features)等。
其中,HOG是一种常用的特征表示方法,它通过计算图像中不同方向上梯度的直方图来描述图像的纹理和边缘信息。
SIFT和SURF 则是基于图像局部特征的表示方法,它们可以在尺度、旋转和光照变化下保持特征的稳定性。
MATLAB中的人脸检测与人脸关键点定位技术人脸检测与人脸关键点定位是计算机视觉中一个重要的课题,它在许多应用领域都有着广泛的应用,如人脸识别、人机交互、表情分析等。
MATLAB作为一种非常强大的科学计算软件,也提供了丰富的工具和函数来实现这些功能。
在本文中,将探讨MATLAB中的人脸检测与人脸关键点定位技术,并介绍其原理和具体实现方式。
一、人脸检测技术人脸检测是计算机视觉中的一项基础任务,其目标是在给定的图像中准确地识别出人脸的位置。
在MATLAB中,人脸检测通常基于基于统计模型的方法,如Haar特征和级联分类器。
1. Haar特征Haar特征是一种用于物体检测的特征描述方法,它通过计算图像中不同区域的灰度差异来表示目标物体的特征。
在人脸检测中,Haar特征可以用来检测人脸的各种细节,如眼睛、鼻子、嘴巴等。
MATLAB提供了一系列函数和工具箱来计算和提取Haar特征,以及构建Haar特征分类器。
2. 级联分类器级联分类器是一种常用的目标检测方法,它通过级联多个简单的分类器来实现对复杂目标的检测。
在人脸检测中,级联分类器可以用来筛选候选区域,并排除一些不可能是人脸的区域,从而提高检测的准确率。
MATLAB中的人脸检测函数通常会使用级联分类器进行初步筛选,以减少计算量。
二、人脸关键点定位技术人脸关键点定位是在检测到人脸后,进一步定位人脸的关键特征点,如眼睛、眉毛、鼻子、嘴巴等。
在MATLAB中,人脸关键点定位主要基于形状模型和特征点回归方法。
1. 形状模型形状模型是一种用于描述人脸形状变化的数学模型,它通过学习和建模一组训练数据的形状变化,从而能够对新的输入数据进行形状预测。
在人脸关键点定位中,形状模型可以用来对给定的人脸进行局部形状的估计,从而进一步定位关键点。
MATLAB提供了一些函数和工具箱来实现形状模型的训练和预测。
2. 特征点回归特征点回归是一种常用的人脸关键点定位方法,它通过学习一个回归函数,将图像中的像素坐标映射到关键点的位置坐标。
一种基于局部信息的脸部特征定位方法脸部特征定位,即在图像或图像序列的给定区域内搜索部分或所有人脸特征(如眼、鼻、嘴、耳等)的位置、关键点或轮廓线。
其中包括眼睛、鼻子、嘴巴、下颌、耳朵以及人脸外轮廓等所有需要提取特征点的位置。
脸部特征定位可以为人脸识别、姿态表情分析、人脸跟踪等研究工作提供重要的几何信息,特征定位的准确与否直接关系到后续应用的可靠性因而具有举足轻重的地位。
ASM(Active Shape Models)是基于几何形状信息的方法之一,由脸部特征定位,即在图像或图像序列的给定区域内搜索部分或所有人脸特征(如眼、鼻、嘴、耳等)的位置、关键点或轮廓线。
其中包括眼睛、鼻子、嘴巴、下颌、耳朵以及人脸外轮廓等所有需要提取特征点的位置。
脸部特征定位可以为人脸识别、姿态表情分析、人脸跟踪等研究工作提供重要的几何信息,特征定位的准确与否直接关系到后续应用的可靠性因而具有举足轻重的地位。
ASM(Active Shape Models)是基于几何形状信息的方法之一,由Cootes等于1992年提出。
它采用点分布模型(Point Distribution Model,PDM)描述形状变化,另一方面计算各特征点法线方向上灰度值的一阶偏导,并建立局部纹理模型。
在搜索时通过纹理模型得到当前点的最佳匹配位置,然后调节形状模型,最终达到对特征的精确定位。
由于匹配准则的问题ASM容易陷入局部极小点,对于初始位置要求比较高。
Wiskott等将Gabor小波用于人脸识别领域,提出了弹性图的概念并用于脸部特征的定位。
该方法可以适用于一定程度的姿态及表情变化,实践证明是有效的。
由于该方法在搜索时需要在整幅图上寻找特征点的最佳匹配位置,这一过程十分费时,计算量也很大。
Jiao等使用Gabor小波提取局部纹理特征,Gabor特征的幅值与相位包含了丰富的人脸局部纹理信息,在搜索时可以提供指导。
由进一步的研究分析可知,不仅特征点的Gabor系数特征包含局部纹理的有用信息,特征点周围邻域中各点的Gabor系数特征也是很有用的。
一种快速人脸定位算法人脸定位是计算机视觉领域中的一个重要任务,广泛应用于人脸识别、人脸表情分析、人脸检测等多个领域。
快速人脸定位算法就是指在保证准确率的前提下,能够在短时间内对图像中的人脸进行定位的算法。
目前,快速人脸定位算法主要有以下几种:1. Haar特征及级联检测器Haar特征是一种基于图像亮度差异的特征,通过计算图像中各个区域的亮度和,可以快速判断是否存在人脸。
级联检测器是一种级联的分类器,可以快速过滤掉图像中明显不是人脸的区域,从而提高定位速度。
这种方法的优势在于速度快,但对于光照变化、旋转、遮挡等情况的适应性相对较差。
2.基于特征点的人脸定位这种方法首先在训练集中标注人脸的关键特征点,如眼睛、鼻子、嘴巴等,然后通过计算待定位图像中的特征点位置来进行人脸定位。
这种方法的优势在于能够对光照变化、旋转等情况具有较好的适应性,但相对于Haar特征方法来说速度会稍慢一些。
3.深度学习方法近年来,深度学习方法在人脸定位领域取得了巨大的突破。
通过使用卷积神经网络等深度学习结构,可以直接从图像中学习到人脸的特征表示,从而实现准确率和速度的双重提升。
深度学习方法的优势在于可以自动学习特征,适应性较好,但需要较大的训练集和计算资源。
以上是一些常见的快速人脸定位算法,不同算法在准确率和速度上有所权衡。
根据具体应用场景的需求,可以选择合适的算法。
此外,人脸定位算法的性能还受到图像质量、人脸姿态、光照条件、遮挡等因素的影响,需要综合考虑各种因素来选择最合适的算法。
在实际应用中,也可以采用多种算法进行融合,以进一步提高人脸定位的准确率和速度。
人脸识别中人脸检测与识别方法的使用教程人脸识别作为一种现代化的生物识别技术,广泛应用于安全领域、金融行业和社交媒体等各个领域。
而人脸识别的核心技术就是人脸检测与识别。
本文将介绍人脸识别中人脸检测与识别的方法和使用教程。
一、人脸检测方法的使用教程人脸检测是人脸识别的第一步,它主要是通过算法从图像或视频中识别出人脸的位置和大小。
以下是几种常见的人脸检测方法及其使用教程:1. Haar特征分类器法Haar特征分类器法是一种基于Haar小波特征的检测方法,其优点是速度快、准确率高。
使用OpenCV库中的HaarCascadeClassifier类可以轻松实现人脸检测。
首先,导入必要的库和模型文件,然后加载图像或视频,创建HaarCascadeClassifier对象,使用detectMultiScale方法进行人脸检测,最后将检测结果绘制在图像或视频上即可。
2. 基于深度学习的方法深度学习在人脸检测中取得了巨大的突破,例如使用卷积神经网络(CNN)进行人脸检测。
可以使用开源深度学习框架如TensorFlow、Keras等来构建和训练CNN模型,并使用该模型对图像或视频进行人脸检测。
使用教程较复杂,需要具备一定的深度学习知识和编程技巧,但可以获得更高的检测准确率。
3. 基于特征点的方法基于特征点的方法使用一组关键的面部特征点(如眼睛、鼻子、嘴巴等)进行人脸检测。
这些特征点通常是通过机器学习算法训练得到的。
使用dlib库可以实现基于特征点的人脸检测。
首先导入必要的库和模型文件,加载图像或视频,使用dlib.get_frontal_face_detector检测人脸的位置,使用dlib.shape_predictor获取特征点,最后将检测结果和特征点绘制在图像或视频上。
二、人脸识别方法的使用教程人脸检测完成后,下一步就是对检测到的人脸进行识别。
以下是几种常见的人脸识别方法及其使用教程:1. Fisherfaces算法Fisherfaces算法是一种基于线性判别分析(LDA)的人脸识别算法,其优点是对光照和表情变化具有较好的鲁棒性。
证件照面部关键点定位识别一、证件照面部关键点定位识别概述在当今数字化时代,证件照在众多领域中都扮演着至关重要的角色,如身份识别、护照申请、驾驶证办理等。
而证件照面部关键点定位识别技术作为其中的关键环节,正逐渐成为计算机视觉领域的研究热点。
面部关键点定位识别,简单来说,就是通过算法在证件照中精确找到人脸的关键特征点,例如眼睛、鼻子、嘴巴、眉毛等部位的位置。
这些关键点的准确定位是后续一系列应用的基础,包括但不限于人脸识别、表情分析、姿态校正以及虚拟化妆等。
其重要性不言而喻。
在身份识别方面,准确的面部关键点定位能够提高识别的准确率,有效防止身份冒用等安全问题。
在一些需要严格身份验证的场景,如机场安检、金融业务办理等,该技术的可靠性直接关系到公共安全和金融安全。
同时,在美颜、美妆等娱乐应用中,面部关键点定位识别也为用户提供了更加个性化、精准的服务体验。
二、证件照面部关键点定位识别的技术原理(一)基于传统方法的原理传统的面部关键点定位识别方法主要依赖于手工设计的特征和模型。
例如,利用灰度信息、纹理特征等进行人脸检测,再通过特征匹配或几何模型来定位关键点。
其中,基于主动形状模型(ASM)和主动外观模型(AAM)的方法较为经典。
ASM通过建立人脸形状模型,利用点分布模型来描述人脸关键点的形状变化,然后通过迭代搜索的方式使模型与图像中的人脸匹配,从而确定关键点位置。
AAM则在ASM的基础上,不仅考虑形状信息,还融入了外观信息,通过最小化模型与图像之间的差异来优化关键点定位。
然而,传统方法存在一定局限性。
手工设计的特征对于复杂环境和多样化的人脸姿态、表情等适应性较差,在面对光照变化、遮挡等情况时,定位准确率会明显下降。
(二)基于深度学习的原理随着深度学习技术的发展,卷积神经网络(CNN)在面部关键点定位识别领域取得了巨大突破。
深度学习方法通过构建深度神经网络,自动从大量数据中学习特征表示,从而实现对关键点的定位识别。
1.2 人脸特征点定位方法综述 目前为止,国内外学者们已经提出了人脸特征点定位的方法[3],依据定位所需要的基本信息的类型,人脸特征点定位的方法可以大致分为以下六类:(1)灰度信息的方法;(2)先验规则的方法;(3)几何形状的方法;(4)统计模型的方法;(5)小波的方法;(6)3D 方法。
1.2.1 基于灰度信息的方法 几何投影法:几何投影方法是利用人脸特征灰度与其他部分的差异,先统计出不同方向上的灰度值和,根据和的变化找出特定的变化点,然后利用投影灰度值基于统计的方法将不同方向上的变化点位置相结合,找到人脸特征点的位置。投影的方法计算量较低,但当姿态变化较大或者背景较复杂时容易失效。 谷分析:图像中亮度比周围像点暗的区域就称作谷,通过亮度比较的方法,就可以对人脸的各个关键部位如眼睛、眉毛、鼻子、嘴巴等相对较暗的区域进行定位。虽然其受光照影响比较大,但考虑到计算量低的优势也在定位方法中常见。
1.2.1先验规则的方法 根据人脸特征的一般特点总结出一些经验规则就称作基于先验规则的方法。人脸图像有一些明显的基本特征,比如人脸的长度比例,满足“三庭五眼”,脸部区域的双眼、鼻子和嘴巴等脸部特征处的亮度一般低于其周边区域;两眼间的对称以及眼睛与鼻子的三角分布规律,都是人脸识别的重要根据。此方法虽然简单,但是远远不能满足复杂的人脸结构的正确定位,于是该方法一般只用于粗定位,精定位还要结合其他的方法来实现。 镶嵌图法:我们可以用一组相同大小的方格去划分图像,每个方格的灰度取格中各像素灰度的均值,根据一定的规则确定哪些可能是人脸的方格区域,将确定的可能存在人脸的方格的变长减半,重新构建镶嵌图,重复第一步的工作,找到眼睛,鼻子,嘴巴等脸部特征所在的位置,然后对这两次得到的脸部区域二值化,利用边缘检测最终精确定位各个特征的位置。 二值化定位:得到图像的直方图,选择合适的阀值将图像二值化,二值化后区域的相对位置和面积形状等几何信息就可以用来确定瞳孔的位置,再通过眼睛与其他特征点的位置关系和几何关系等对其他的人脸特征点进行定位。显然该方法受光照和图像质量等的影响较大。 广义对称法:显然,在人脸图像中,眼睛眼、眉毛、鼻子等都具有较强的点对称性。为我们通过定义广义对称变换来描述点对称性,通过考察人眼中心点的强对称性和脸部特征的几何分布来对人脸的特征点进行定位,该方法仅仅利用了各点的对称性,计算量很大,而且也会因为光照表情等影响产生大量的候选点,大大影响到定位精度。
1.2.3 基于几何形状的方法 Shake 算法:该方法利用一条由几个控制点组成的闭合曲线,再利用一个进行匹配的能量函数来作为评价标准,当不断迭代最后使得能量函数最小化时就定位到人脸特征点。Snake是主动的,总是最小化能量函数,因此表现出一种动态特性。但是由于人脸的多样性和复杂性以及图像中的噪声等复杂因素的影响,在使用刚性模型分割人脸轮廓时遇到了很大的困难。另外,Snake模型也没有利用关于对象的知识,所以过于灵活,很难做到精确的特征点提取。 可变形模板方法:把眼睛特征为有两条抛物线(上下眼睑)和一个圆(虹膜)构成的几何图形,通过优化的方法来调整其参数以达到最佳的匹配,嘴巴、下巴等也可以采用类似的几何图形建模。但是,固定的几何图形并不能很好地建模实际上会千差万别的眼睛形状,而光照、姿态和表情的变化更使得采用这种固定的简单数学模型难以适应这些复杂的变化,因此很难实现鲁棒的特征提取。优化速度慢、容易陷入局部极小也阻止了该算法的进一步发展。 基于点分布模型算法:ASM和AAM都是基于点分布模型(Point Distribution Model,PDM)的算法在PDM中,外形相似的特定类别物体,比如人脸、人手的形状通过若干关键的特征点的坐标串接成原始形状向量。对训练集中的所有形状向量进行对齐操作后,对它们进行PCA分析建模,保留的主成分形成最终的形状模型,形状模型的参数反映了形状的主要可变化模式,ASM搜索则首先通过局部纹理模型匹配得到各个特征点的更佳的位置,经过相似变换对齐后,通过 统计形状模型对其进行约束,而后再进行局部纹理模型的匹配,形成一个迭代过程,以期形状模型最终匹配到输入的形状模式上去。在ASM中,仅使用了特证点局部纹理特证作为启发式信息,没有使用全局的纹理约束,实践中发现ASM很容易陷入局部极小。 而在AAM中,则采用了形状和纹理二者融合的统计约束,即所谓的统计表观模型。AAM搜索借鉴了基于合成的分析技术的思想,通过模型参数的优化调整使得模型能够不断逼近实际输入模式,模型参数的更新则放弃了ASM中的局部纹理搜索过程,仅使用一个线性预测模型根据当前模型和输入模式之间的差别来预测和更新模型参数。AAM尽管利用了全局纹理,但却抛弃了局部纹理匹配过程,因此会在一定程度上降低关键特证点配准的精度,而且其线性预测模型也有较大的局限性,在初始位置偏离目标位置过大时,则很难收敛到正确位置。
1.2.4 基于统计模型的方法 肤色唇色分割法:该方法是使用统计方法建立起人脸特征的色彩模型,定位时遍历候选区域,根据被测点的色彩与模型的匹配度筛选出候选的人脸特征点。该方法主要是对人脸面部特征的色彩信息进行研究,构造人脸特征的色彩模型,利用人脸肤色的色彩信息进行特征点定位。基于色彩信息实现简单,但容易受环境的影响,定位的可靠性不高。 特征脸法:该方法利用K-L变换将表征人脸的高维向量映射到由若干个特征向量(也称Eigenface特征脸)张成的子空间中,先用主成分分析模型重构被检区域,求出重构图与原图之间的距离,当距离小于一定阈值时,即被认定为候选区域。该方法的缺点是针对不同脸型要分别建模,搜索时采用金字塔策略,算法复杂度高。另外,主成分分析着重优化和解析图像,而没有着重于特征点的定位。 支持向量机:支持向量机(Support Vector Machines,SVM)是Vapnik等提出的基于风险最小化原理的统计学习理论,用于分类与回归问题。将SVM 方法用于脸部特征检测,使用了方形扫描窗口,将眉毛与眼睛作为一个整体作为定位的对象,从而减少了眉毛对定位的干扰。Jefrey Huang则采用该方法来检测眼睛。但是由于训练需要求解计算复杂度极高的二次规划问题,内存需求量大,其次是训练样本个数较大时,会得到大量的支持向量,使分类器计算量过高。 模板匹配法:模板匹配法是较早用于面部特征点定位的方法之一,也是使用范围较广的一种。这是由于模板匹配法具有比较直观、易于构造等优点。在对图像进行预处理的基础上产生特征的候选区域,之后通过一个具有几何约束(五官模板的相关量)的模板对特征加以定位。Sako等人采用彩色直方图方法分割脸部区域和嘴唇区域,并根据眼睛的结构和灰度信息特点预先构造了眼睛模板,利用此模板进行搜索以确定眼睛的位置匹配的过程是利用事先建立的面部特征的模板在候选窗口逐点滑动进行特征匹配定位。模板匹配需要考虑面部特征的尺寸缩放、方向旋转等变化,所以计算量很大,并且由于光照的不均匀变化往往引起模板匹配的失败,所以基于模板匹配的人脸检测方法较适合于人脸尺寸、方向、光照等有一定的约束条件或者先前已确定的情况。该方法虽然速度较慢,但正确率较高。 人工神经网络:人工神经网络(ANN)在模式识别中有着广泛的应用,特别适合研究非线性问题。完整的人脸图像受个体差异、眼睛状态和目标对象姿态等变化的影响较大,而子特征点(包括左右眼角和上下眼眶顶点)附近区域相对稳定,根据这一特点,Waite 等以各子特征点附近的灰度图像为输入,分别建立神经网络。检测时,先用各个神经网络对目标区域进行遍历搜索,再结合先验知识对搜索结果进行筛选和结合。这个算法训练过程比较简单,有较强的鲁棒性。但缺点是区分度不足。 贝叶斯概率网络方法:Kin 和 Cipolla 使用一个 3 层的概率网络来对脸型建模,其网络结构如图1。他们在搜索中采用了自底向上的搜索策略,结合使用高斯滤波器和边缘检测算法找出双眉、鼻和嘴的候选点(对应于网络中的第1层),据邻近候选点之间的相对关系两两配对为水平或垂直组合(对应于网络中的第2层),并进一步归入脸部的上、下、左、右 4 个区域(对应于网络中的第3层),从而筛去虚警点。
1.2.5 基于小波的方法 弹性图匹配法:该方法是面部关键特证定位的另一个重要算法,该方法将人脸面部关键特证点的属性及其他们之间的位置关系通过一个属性图进行描述,图的顶点对关键特征点的局部纹理建模(通过Gabor特征),图的边则反映了特征 点之间的距离等位置关系。对新输入的图像,其特征点则通过基于相位预测的位移估计结合图匹配技术来定位。通过属性图的形变,一方面匹配顶点处的Gabor局部特征,另一方面匹配全局几何结构特征。尽管弹性图匹配可以达到较高的定位精度,但速度较慢。 DWN(Gabor小波网络):Krüger等将Gabor小波引入图像处理领域,使用一组同源派生的Gabor小波函数取代RBF神经网络的基函数,通过训练,可以将目标图像分解为若干个小波函数的线性组合。GWN 的训练中同时对相关权值和小波函数本身的参数作优化,这使得GWN模型可以用很小数量的小波函数实现对目标对象的解析和重构。Feris使用两层的GWN树模型来定位脸部特征,两层GWN分别用于表征全脸和各个脸部特征。在训练中,他们为每幅训练图建立一个GWN树模型,并标定出各脸部特征的位置,存入人脸库中。实际搜索的时候,他们首先通过全脸比对从库中找出与目标图像最接近的一个模型,然后以该模型的标定位置为搜索起点,在小范围内,通过与该模型中相应的脸部特征信息的比对求出脸部特征的精确位置。
1.2.6 3D方法 光流向量化技术:光流指的是灰度值图案在整个图像范围内的运动。首先,在每个点对各自的灰度值计算位移向量;然后计算一个连续的向量场,该向量场能充分地再现光流。两个步骤的执行都需要某些限制性假设,而结果也做不到完全无误差。然而,可以获得重要的时域信息,无论是由有利位置产生的连续变化,还是单个物体的不连续变化。因为变化的连续与否并不重要。无论怎样都应该清楚,孤立地考虑单幅图像是没有意义的。检测对象必须是至少包括两幅连续图像的图像序列。 采用光流迭代的方法建立输入人脸与参考人脸之间的稠密的像素级对应关系;Beymer等人提出的基于光流的向量化技术,是计算不同人脸图像之间的密集对应的一个典型算法。在此方法中,2D的形状由测试图像和参考图像之间的光流域来描述。由于此算法很大精度的限制,因此在实际应用中很难精确求解。也存在计算复杂、计算速度慢的问题。 3D形变模型:迄今为止,最成功的姿态和光照不变的人脸识别是3D变形模