当前位置:文档之家› 基于Gabor小波变换的人脸表情特征提取

基于Gabor小波变换的人脸表情特征提取

基于Gabor小波变换的人脸表情特征提取
基于Gabor小波变换的人脸表情特征提取

—172

基于Gabor 小波变换的人脸表情特征提取

叶敬福,詹永照

(江苏大学计算机科学与通信工程学院,镇江 212013)

摘 要:提出了一种基于Gabor 小波变换的人脸表情特征提取算法。针对包含表情信息的静态灰度图像,首先对其预处理,然后对表情子区域执行Gabor 小波变换,提取表情特征矢量,进而构建表情弹性图。最后分析比较了在不同光照条件下不同测试者做出6种基本表情时所提取的表情特征,结果表明Gabor 小波变换能够有效地提取与表情变化有关的特征,并能有效地屏蔽光照变化及个人特征差异的影响。关键词:模式识别;表情特征提取;Gabor 小波变换

Facial Expression Features Extraction Based on

Gabor Wavelet Transformation

YE Jingfu, ZHAN Yongzhao

(School of Computer Science and Communications Engineering, Jiangsu University, Zhenjiang 212013)

【Abstract 】This paper introduces a facial expression features extraction algorithm. Given a still image containing facial expression information,preprocessors are executed firstly. Secondly, expression feature vectors of the expression sub-regions are extracted by Gabor wavelet transformation to form expression elastic graph. Different expression features are extracted and compared while different subjects display six basic expressions with illumination variety. Experiment shows that expression features can be extracted effectively based on Gabor wavelet transformation, which is insensitive to illumination variety and individual difference.

【Key words 】Pattern recognition; Expression feature extraction; Gabor wavelet transformation

计 算 机 工 程Computer Engineering 第31卷 第15期

Vol.31 № 15 2005年8月

August 2005

·人工智能及识别技术·文章编号:1000—3428(2005)15—0172—03

文献标识码:A

中图分类号:TP37

人脸表情识别是指从给定的表情图像或者视频序列中分析检测出特定的表情状态,进而确定被识别对象的心理情绪。人脸表情识别技术在许多领域有着潜在的应用价值,这些领域包括心理学研究、图像理解、合成脸部动画、视频检索、机器人技术、虚拟现实技术以及新型人机交互环境等[1]。

典型的人脸表情识别系统包括人脸检测、表情特征提取、表情特征分类识别3个阶段。人脸检测要能够从复杂的背景中检测出人脸的存在并确定其位置,对于图像序列,还要能精确跟踪人脸区域,国内外在人脸检测方面已做了大量的研究,且已有相关的有效方法及成果报道。而对于表情特征的提取和分类识别算法的研究目前还处于探索之中,国外学者已做了一定的研究工作,国内关于这方面的研究则相对较少。

针对处理图像的性质,可将表情特征提取方法分为两类:基于静态图像的表情特征提取和基于视频序列的动态表情特征提取。前者处理的是单帧静态表情图像,一般要求该图像反映的表情处于夸张或极大状态,使得提取的表情特征更为典型,这类方法主要包括主成份分析、奇异值分解以及基于小波变换的方法等。后者处理的是表情图像序列,目标是提取表情特征的变化过程。光流模型(Optical Flow Models)是提取动态表情特征的典型方法。比较而言,静态方法处理的数据量少,方法简单可靠,且提取的特征较为典型,能获得较高的识别率,但待处理的图像所包含的表情信息需处于夸张状态。而动态方法处理视频序列中的每一帧图像,因此计算量较大,难以满足实时性要求。

1表情图像的预处理

表情图像的预处理包括表情图像子区域的分割以及表情图像的归一化处理。前者指从表情图像中分割出与表情最相关的子区域,而后者包括图像的灰度均衡和尺度归一。图像预处理的好坏直接影响表情特征提取的效果和计算量。

(a)

(b)

图1 分割人脸表情图像以提取特征区域

人脸表情特征可分为两类:持久性表情特征和瞬态表情特征,前者包括嘴巴、眼睛和眉毛,决定了基本表情状态,后者包括脸颊和额角皱纹的瞬间变化,能在一定程度上揭示表情状态。实验表明[3],嘴角形状对表情的影响最大,其次是眼睛和眉毛,而皱纹变化属于动态特征,且受年龄等因素影响较大,对表情的贡献不大,甚至会对表情识别产生不利影响。因此表情识别应重点提取嘴巴、眼睛和眉毛等局部表情特征,并忽略皱纹的变化。图像分割算法的目标就是要精确定位和分离出持久表情特征子区域。对于样本图像,可以人工框出这些区域,也可以根据眼睛的灰度特征并结合先验知识采用特定的定位算法实现特征区域的自动分割。分割结

基金项目:国家自然科学基金资助项目(60273040);江苏省高校自然科学基金资助项目(02KJB520003)

作者简介:叶敬福(1980—),男,硕士生,研究方向:多媒体技术,CSCW ;詹永照,教授、博导

定稿日期:2004-06-26 E-mail :yejingfu@https://www.doczj.com/doc/4e15639421.html,

—173—

果如图1所示。

从表情图像中分割出与表情有关的子区域后,需要对子图像进行灰度均衡化和尺寸归一化处理。灰度均衡化的目的是消除光照变化的影响,还可以消除不同人种的肤色差异,虽然Gabor 小波变换所提取的表情特征对光照变化不敏感,但进行灰度均衡化处理可优化特征提取结果。通过对表情子图像灰度直方图的修正从而调整图像的均值和方差来完成图像的均衡化处理。直方图修正的公式为

()00

σ

I(x,y)=I(x,y)-μ+μσ

) (1) 其中I(x,y)I(x,y))

、分别为均衡前后的灰度图像,00μσ、分别为均衡后的均值和方差,可以选定一对标准值,μ、σ为各个图像均衡前的均值和方差。经均衡化处理后所有图像有相同的均值和方差。尺寸归一化的目的是将表情子图像变换为标准尺寸图像以便于表情特征的提取,可采用双线性插值算法实现该操作。本文经尺寸归一化处理后的眼睛区域的大小为90×30个像素,嘴巴区域为40×30个像素。

2基于Gabor 小波变换的表情特征提取

二维Gabor 小波变换是在时频域进行信号分析处理的重要工具,其变换系数有着良好的视觉特性和生物学背景,因此被广泛应用于图像处理、模式识别等领域。与传统的傅立叶变换相比,Gabor 小波变换有以下几个优点:(1)具有良好的时频局部化特性。即非常容易地调整Gabor 滤波器的方向、基频带宽及中心频率从而能够最好地兼顾信号在时空域和频域中的分辩能力。(2)多分辨率特性及变焦能力。即采用多通道滤波技术,将一组具有不同时频域特性的Gabor 小波应用于图像变换,每个通道都能够得到输入图像的某种局部特征,这样可以根据需要在不同粗细粒度上分析图像。此外,在表情特征提取方面,Gabor 小波变换与其他几种典型方法(如主成分分析法及光流模型)相比,一方面其处理的数据量较少,能满足系统的实时性要求,另一方面,小波变换对光照变化不敏感,且能容忍一定程度的图像旋转和变形,当采用基于欧氏距离进行识别时,表情模板和待识别表情不需要严格的对应,故能够提高系统的鲁棒性。总体而言,Gabor 小波变换优于其他图像处理方法,这也是本文采用Gabor 小波变换提取表情特征的原因所在。表情特征提取可分为两步:归一化后的表情图像的网格化和弹性图(Elastic Graph)的构造。 2.1 归一化后表情图像的网格化

为了较好地识别人脸表情,需要精确地提取反映表情变化的关键点特征,这些关键点一般分布在眼角、眉毛、嘴角等处,且其小波变换后生成的特征矢量模较大。针对上面分割及归一化后的表情子图像,首先对表情子图像进行网格化处理,即使用固定尺寸的网格进一步分割表情子图像。网格的大小主要取决于对特征图像的细化程度以及计算的实时性要求,分割过细虽然能更精确提取表情特征,在一定程度上提高系统的识别率,但会极大地增加计算量。本文采用10×10个像素的网格对特征区域网格化,其结果如图2(a)所示。

网格应尽量反映表情关键点信息,使得关键点包含于某几个网格中,特别是构造表情模板时,可以手工选择几个关键点构成离散的网格,网格结点间的距离动态变化。这样,表情模板与待识别的表情图像的维数不需要相同,甚至远小于待识别的表情图像维数,识别时采用弹性图匹配算法,通过适当改变表情模板的网格结点间距离,找到表情模板与待识别表情图像的最佳匹配,从而实现表情的分类与识别。

(a)表情子图像的网格化 (b)表情弹性图的构造 图2 眼睛区域的网格化及Gabor 变换后的表情弹性图

2.2 表情图像的特征弹性图的构造

本阶段的任务是将经网格化后的表情子图像转换为表情特征弹性图 (或称作表情属性拓扑图)。即对表情子图像的每一个网格进行Gabor 小波变换,取变换后的小波系数作为该网格的特征矢量,所有网格的特征矢量则构成了表情特征弹性图,如图2(b)所示。

二维Gabor 小波核函数定义为

()

()

222j

j

j j

k k x σψk,x =

exp -exp ik gx -exp -σ2σ2v v v v v v

v ????

???????????????

?

(2)

其中,i 为复数算子,σ定义了小波滤波器的带宽,可取

σ=2π。j k v

为小波的波矢量,其不同取值构成了该小波族中

不同小波函数,j k v 定义为:()T j v k =k cosj,sinj v

,其中

(

)-v+2v k =2π,表示小波的不同核频率,由于人脸表情表现为

高频特征,因此可取较高频率的小波函数与表情图像卷积,以提取高频信息并屏蔽掉与表情变化无关的低频信息。本文取v =0,1,2。φ表示小波的不同方向,每种核频率的小波可进一步衍生出6个方向的小波,即

π2π3π4π5πj=

,,,,,π

66666。这

样定义了由3×6个Gabor 小波组成的小波族用于提取表情 特征。

第j 个Gabor 小波核函数j ψ(这里j 的取值为1~18)与图像的卷积定义为

()()()

()j j j G =ψk,x *I x =ψk,x I x dxdy v v v v v v

∫∫ (3)

其中,(),x x y =v

为像素坐标,()I x v

为对应坐标的像素值。

小波变换后结果是复数,可取复数的模作为小波变换的结果。 对每一个网格,按式(3)使用18个不同频率和方向的Gabor 小波对其变换,并构造表情弹性图。令S 表示经网格化后的表情子图像,则其表情属性拓扑图可表示为{},m X X m S =∈,其中m X 是网格S 中在m 点处的特征矢量,其取值为:()T

m 1218X =G ,G ,L,G 。需要指出的是,在表情信息明显的关键点处,其特征矢量的模X m 较大。

此外,表情模板弹性图的构造与待识别表情图像的弹性图的构造稍有区别,由于表情模板仅需人工选择几个显著反映表情信息的关键点作为网格,关键点网格不连续,因此由关键点网格生成的弹性图不仅要保存关键点处的特征向量,而且还要保存结点间的距离,这样才能在后继的识别阶段有效地使用弹性图匹配算法以识别人脸表情。

3实验结果及分析

本文采用式(2)定义的Gabor 小波族提取灰度图像中的表情特征。分别提取高兴、愤怒、悲哀、惊讶、厌恶、恐惧等6种基本表情对应的表情特征。为了分析Gabor 小波矢量与不同表情状态的关系,研究表情特征与光照条件、个人特征等因素间的联系,在不同的光照环境及不同测试者的条件下提取与表情有关的Gabor 小波特征,并对这些特征作直观的比较和分析。

提取表情特征时,首先对灰度表情图像采用人工方式框

出左眼、右眼、嘴角等区域作为表情特征的关键点,然后对

—174

—这些区域进行尺寸归一化处理,缩放为10×10的正方形网格,最后对该网格根据式(3)进行Gabor 变换,从而提取由小波系数组成的一维特征矢量,该特征矢量由18个分量组成,分别对应3个高频小波在6个不同方向上的小波变换系数。

比较两个特征矢量时,可简单地采用欧氏距离作为两特征矢量的相似性度量,定义如下:

i,j

i

j

D =c -x (4)

其中,c i 表示表情特征模板,x i 为待识别的表情特征,当待识别的表情特征与某表情特征模板最相似时,其间的欧氏距离达到最小。

(1)同一个人在相同的光照条件下做不同表情时的表情特征比较

在光照不变的条件下,对同一个人提取出不同表情所对应的左眼特征矢量,如图3(a)所示,图中的4条特征曲线分别对应于同一个人的高兴、生气、悲伤、惊讶4种表情。从图中的表情特征矢量的比较可以看出,即使在相同光照及相同的测试者条件下,不同表情图像所对应的表情特征差异也非常明显,其间的欧氏距离较大。

(2)不同人在不同光照条件下做相同表情时的表情特征比较

分别在明暗程度不同的光照环境中,对不同测试者做相同表情时提取其对应的左眼特征矢量,如图3(b)所示,图中的4条曲线分别表示4名测试者在两种不同光照条件下做高兴表情时的左眼特征矢量。从图中可以看出,不同人做相同表情时所对应的表情特征有着相似的变化趋势,其特征间的欧氏距离较小,且受光照变化的影响不明显。

图3 表情特征的提取及比较

本文通过对更多测试者的表情特征进行提取和比较,并

进一步分析比较其他几种基本表情的特征矢量,可以得出结论:Gabor 小波变换能够有效地提取与表情变化有关的特征,这种特征对光照变化不敏感,且能屏蔽个人特征差异的影响,做到与人无关的表情特征提取。

4结论

人脸表情识别的研究是富有挑战性的研究课题,其研究涉及心理学等多个学科。表情特征的提取在整个研究中占据重要的位置,其特征提取的好坏直接决定了表情识别的效果。本文首先针对静态表情图像进行子区域分割和灰度、尺寸归一化,并在此基础上提出了一种基于Gabor 小波变换的人脸表情特征提取算法,实验表明,该算法能够有效地提取与表情变化有关的特征矢量,且能有效屏蔽光照变化及个人特征差异的影响,做到与人无关的表情特征提取,为后继的表情识别打好基础。

参考文献

1 Fasel B, Luettin J. Automatic Facial Expression Analysis:a Survey. Pattern Recognition, 2003, 36: 259-275

2 Wiskott L, Fellous J M, Kruger N. Face Recognition by Elastic Bunch Graph Matching. IEEE Trans. on PAMI, 1997,19(7)

3 Pardas M, Bonafonte A. Facial Animation Parameters Extraction and Expression Recognition Using Hidden Markov Models. Signal Processing: Image Communication, 2002, 17: 675-688

4 Lien J J J, Kanade T, Cohn J F. Detection,Ttracking, and Classification of Action Units in Facial Expression. Robotics and Autonomous Systems, 2000, 31: 131-146

5 Hu Tianming, Liyanage C, Silva D, et al. A Hybrid Approach of NN and HMM for Facial Emotion Classifaication. Pattern Recognition Letters, 2002, 23: 1303-1310

6 Wiskott L, Fellous J M,Kruger N. Face Recognition by Elastic Bunch Graph Matching. Intelligent Biometric Techniques in Fingerprint and Face Recognition, 1999: 355-396

7 Zhu Y , De Silva L C,Ko C C. Using Moment Invariants and HMM in Facial Expression Recognition. Patter Recognition Letters, 2002, 23: 83-91

8 金 辉, 高 文.人脸面部混合表情识别系统. 计算机学报, 2000, 23(6): 602-608

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (上接第166页)

特征的权值。指定权值时,可以简单地选择m ω=e ω,也可

以根据不同特征识别结果的准确性来确定特征相应的权值。

实验中,根据边界方向直方图距离和几何矩距离的数量级,

把几何矩距离的系数设为1,而边界直方图距离的系数为10。

4实验结果

实验使用了汉语手势字母的全部30个手势,共采集了3

套手势库,两套作为学习样本,按上述算法,计算各手势的

几何矩和边界方向直方图,并取其平均值作为标准值,依此

建立手势库。另取第3组手势作为测试。实验得到字母手势

一次识别率达到90%。

5结论

单独采用几何矩法,对于一些外形很相似的手势不能有效地识别,这和几何矩善于描述对象的整体形状的特性分不开。在几何矩特征的基础上,再加上一个图像的方向直方图特征,有效地利用了在几何矩中被忽略的边界信息,实验证明,大大提高了算法的识别率,是一种有效的识别方法。但是图像的明暗变化的,使得手势的边界产生凌乱,也降低了手势的识别率。今后研究重点是提高算法的鲁棒性。

参考文献

1 张良国, 吴江琴. 基于Hausdorff 距离的手势识别.中国图像图形

学报(A 辑), 2002,7(11)

2 刘江华, 陈佳品. 用于人机交互的静态手势识别系统.红外与激光

工程, 2002,31(6)

3 郭 丽, 黄元元, 孙兴华. 基于方向特征的二值商标图像检索方法. 计算机应用, 2003,23(7):77-79

4 陈岩松, 郑师海, 李德华. 二维光学几何矩变换.物理学报, 1991,40(10):1601-1606

(a) 同一个人在光照条件不变时做出4种表情(高兴、生气、悲伤、惊讶)时的左眼特征比较

(b) 不同人(4名测试者)在不

同光照下做相同表情(高兴表情)时的左眼特征比较

人脸识别流程

概述 本项目的主要目的是身份证照片与摄像头获取的人脸照片进行比对,确定身份证和目标对象是不是同一个人。 本文项目主要分三个方面,首先是人脸的检测定位;其次是对照片中定位好的人脸进行预处理,处理到适合提取特征值的水平;最后提取特征值比对识别是不是同一个人。系统的大框架如下: 第一步人脸检测定位 确定是否包含人脸,如果包含人脸,则需要确定脸部所在的位置和尺寸。因为获取的都是彩色图像,首先可以进行肤色检测。在检测出肤色像素后,需要根据它们在色度上的相似性和空间上的相关性分割出可能的人脸区域,同时利用区域的几何特征或灰度特征进行是否是人脸的验证,以排除其它色彩类似肤色的物体。这一步流程图如下:

页脚内容 第二步人脸图像预处理 图像处理的目的是为了方便提取人脸的特征值,进而才能比对识别,所以这一步也至关 重要。第一,对于分割出的人脸,由于噪声带来失真和降质,在特征提取之前采用滤波的方式来去除噪声是必须的步骤。第二尺度归一化,其思想是将尺寸各不相同的人脸图像变换为统一的标准尺寸图像以便于人脸特征的提取。第三灰度归一化,人脸识别的研究一般以灰度图像为研究对象,对于彩色的脸像,可对其首先进行灰度化处理。第四灰度均衡化,由于在图像采集中光照的改变容易导致图像呈现不同的明暗程度,因此需要对人脸图像进行灰度均衡化处理。灰度均衡化,其作用是增强人脸图像的整体对比度,并使灰度分布均匀,以消除光照变化的影响。流程图如下: 第三步特征提取对比识别 人脸特征提取与识别是人脸识别研究中最为关键的两个问题。人脸特征提取又称人脸描 述,是在基于人脸检测定位、归一化等图像预处理的基础上进行的人脸各特征提取的过程,为人脸识别分类打下基础。

图像特征提取及识别过程

纹理特征是一种重要的视觉线索,是图像中普遍存在而又难以描述的特征。纹理分类与分割是图像处理领域一个经久不衰的热点研究领域,纹理特征提取作为纹理分类与分割的首要问题,一直是人们关注的焦点,各种纹理特征提取方法层出不穷。 本文在广泛文献调研的基础上,回顾了纹理特征提取方法的发展历程,分析了其研究现状,对纹理特征提取方法进行了较为全面的综述和分类,最后重点研究了基于灰度共生矩阵的图像纹理提取方法,研究如何有效地提取图像纹理特征来对图像进行描述,通过特征值来对图像进行识别。 灰度共生矩阵是一种简单有效的图像纹理特征描述方法,该方法的优势在于:它能利用了图像中像素相对位置的空间信息更加准确地描述图像的纹理,本 文就是利用图像灰度共生矩阵的这一特性,从该矩阵中提取相应的统计参量作为纹理特征来实现对图像的识别。 关键字:灰度共生矩阵,纹理特征提取,图像识别

ABSTRACT Texture is a kind of importa nt visual clues in images , it is widespread but cannot easy to be described . Texture classification and segmentation is a enduring popular research field in image process ing area. Texture feature extract ion has bee n the focus of attention,due to its priority to texture classification and image segmentation. all sorts of texture feature extracti on methods has bee n emerged in en dlessly. On the basis of exte nsive literature inv estigati on, we review the texture feature extract ion methods, an alyze the developme nt of the research status of the texture feature extracti on methods and make a comprehe nsive review of its classificati on . Fin ally ,based on gray symbiotic matrix image problem extracti on methods,we research how to effectively extract image texture feature described by the image characteristic value to image recog niti on. Graylevel co-occurre nee matrix is a simple and effective image texture descripti on method.This method's advantage is: it can use the image pixels relative positions of the spatial in formatio n more to accurately describe the texture image.This paper use the graylevel co-occurre nee matrix of the properties to extract statistics from the matrix corresp onding as texture feature parameters to realize image recog niti on. KEY WORDS : graylevel co-occurrenee matrix, texture feature extraction, image recog niti on

人脸识别介绍

人脸识别技术是生物识别技术的一种,它结合了图像处理、计算机图形学、模式识别、可视化技术、人体生理学、认知科学和心理学等多个研究领域。从二十世纪六十年代末至今,人脸识别算法技术的发展共经历了如下四个阶段: 1. 基于简单背景的人脸识别 这是人脸识别研究的初级阶段。通常利用人脸器官的局部特征来描述人脸。但由于人脸器官没有显著的边缘且易受到表情的影响,因此它仅限于正面人脸(变形较小)的识别。 2. 基于多姿态/表情的人脸识别 这是人脸识别研究的发展阶段。探索能够在一定程度上适应人脸的姿态和表情变化的识别方法,以满足人脸识别技术在实际应用中的客观需求。 3. 动态跟踪人脸识别 这是人脸识别研究的实用化阶段。通过采集视频序列来获得比静态图像更丰富的信息,达到较好的识别效果,同时适应更广阔的应用需求。 4. 三维人脸识别 为了获得更多的特征信息,直接利用二维人脸图像合成三维人脸模型进行识别,即将成为该领域的一个主要研究方向。 人脸识别技术的研究范围主要包括以下几个方面: 1. 人脸检测:在输入的图像中寻找人脸区域。 2. 人脸的规范化:校正人脸在尺度、光照和旋转等方面的变化。 3. 特征提取:从人脸图像中映射提取一组能反映人脸特征的数值表示样本。 4. 特征匹配:将待识别人脸与数据库中的已知人脸比较,得出相关信息。 人脸识别流程 1图像预处理 1.1 图像去噪 一般来说,自然界中的噪声可以看成是一种随机信号。根据图像获取的途径人脸图像获取 人脸检测 定位人脸区域 预处理 特征抽取 人脸特征 对比识别 结果 人脸特征库

不同,噪声的融入也有多种方式: 1. 图像是直接以数字形式获取的,那么图像数据的获取机制会不可避免地 引入噪声信号; 2. 在图像采集过程中,物体和采集装置的相对运动。或采集装置的抖动, 也会引入噪声,使图像变的模糊不清; 3. 在图像数据的电子传输过程中,也不同程度的引入噪声信号。 这些噪声信号的存在,严重的情况会直接导致整幅图像的不清晰,图象中的景物和背景的混乱。对于用于人脸识别的图像。由于噪声的引入,将不可避免地造成识别率的下降。对图像噪声的消除可以通过两个途径:空间域滤波或频率域滤波。消除噪声的方法很多,对于不同的噪声应该采用不同的除噪方法。主要的方法是:线性滤波、中值滤波、维纳滤波以及小波去噪等。 1.2 增强对比度 为了使人脸在图像中更为突出以便于下一步的特征提取,增强图像对比度是很有必要的。增强对比度有很多种方法,常见的有直方图均衡化和“S ”形变换等方法。 “S ”形变换方法将灰度值处于某一范围(人脸特征范围)内的像素灰度分布差距拉开,从而保证了对比度的提高,但此方法降低了其他灰度值的对比度。而直方图均衡化则是将像素的灰度分布尽量展开在所有可能的灰度取值上,这样的方法同样能使得图像的对比度提高。 将彩色图像转化成灰度图像是人脸识别方法中常见的处理过程,虽然转化过程丢失了一部分色彩信息,但是灰度图像拥有更小的存储空间和更快的计算速度。文献[1]给出了一种能够将RGB 色彩转换成灰度级且适于突出人脸区域对比度的转换模型:()5.0144.0587.0299.0,+?+?+?=b g r y x f ;其中f 代表灰度值,r ,g ,b 分别表示Red,Green,Blue 分量的值。 文献[2]通过将人脸彩色图像从RGB 色彩空间转换到RIQ 色彩空间,得到了更适于频谱分析的特征分量。

模式识别特征选择与提取

模式识别特征选择与提取 中国矿业大学计算机科学与技术学院电子信息科学系 班级:信科11-1班,学号:08113545,姓名:褚钰博 联系方法(QQ或手机):390345438,e-mail:390345438@https://www.doczj.com/doc/4e15639421.html, 日期:2014 年06月10日 摘要 实际问题中常常需要维数约简,如人脸识别、图像检索等。而特征选择和特征提取是两种最常用的维数约简方法。特征选择是从某些事物中提取出本质性的功能、应用、优势等,而特征提取是对特征空间进行变换,将原始特征空间映射到低维空间中。 本文是对主成分分析和线性判别分析。 关键词:特征选择,特征提取,主成分分析,线性判别分析 1.引言 模式识别的主要任务是利用从样本中提取的特征,并将样本划分为相应的模式类别,获得好的分类性能。而分类方法与分类器设计,都是在d(变量统一用斜体)维特征空间已经确定的前提下进行的。因此讨论的分类器设计问题是一个选择什么准则、使用什么方法,将已确定的d维特征空间划分成决策域的问题。对分类器设计方法的研究固然重要,但如何确定合适的特征空间是设计模式识别系统另一个十分重要,甚至更为关键的问题。如果所选用的特征空间能使同类物体分布具有紧致性,即各类样本能分布在该特征空间中彼此分割开的区域内,这就为分类器设计成功提供良好的基础。反之,如果不同类别的样本在该特征空间中混杂在一起,再好的设计方法也无法提高分类器的准确性。本文要讨论的问题就是特征空间如何设计的问题。 基于主成分分析的特征选择算法的思想是建立在这样的基础上的:主成分分析方法将原始特征通过线性变换映射到新的低维空间时,获得的主成分是去了新的物理意义,难以理解,并且主成分是所有原始特征的线性组合。所以将主成分分析与特征选择相结合,设计多种相似性度量准则,通过找到与主成分相关的关键特征或者删除冗余、不相关以及没有意义的特征,将主成分又重新映射到原始空间,来理解成主成分的实际意义。 基于线性判别分析的高维特征选择将单个特征的Fisher准则与其他特征选择算法相结合,分层消除不相关特征与冗余特征。不相关特征滤波器按照每个特征的Fisher评价值进行特征排序,来去除噪音和不相关特征。通过对高维数据特征关联性的分析,冗余特征滤波器选用冗余度量方法和基于相关性的快速过滤器算法。分别在不同情境下进行数据分类实验,验证其性能。

基于matlab的人脸识别算法(PCA)

3.基于matlab的人脸识别算法 3.1 问题描述 对于一幅图像可以看作一个由像素值组成的矩阵,也可以扩展开,看成一个矢量,如一幅 N*N 象素的图像可以视为长度为N2 的矢量,这样就认为这幅图像是位于N2 维空间中的一个点,这种图像的矢量表示就是原始的图像空间,但是这个空间仅是可以表示或者检测图像的许多个空间中的一个。不管子空间的具体形式如何,这种方法用于图像识别的基本思想都是一样的,首先选择一个合适的子空间,图像将被投影到这个子空间上,然后利用对图像的这种投影间的某种度量来确定图像间的相似度,最常见的就是各种距离度量。因此,本次试题采用PCA算法并利用GUI实现。 对同一个体进行多项观察时,必定涉及多个随机变量X1,X2,…,Xp,它们都是的相关性, 一时难以综合。这时就需要借助主成分分析来概括诸多信息的主要方面。我们希望有一个或几个较好的综合指标来概括信息,而且希望综合指标互相独立地各代表某一方面的性质。 任何一个度量指标的好坏除了可靠、真实之外,还必须能充分反映个体间的变异。如果有一项指标,不同个体的取值都大同小异,那么该指标不能用来区分不同的个体。由这一点来看,一项指标在个体间的变异越大越好。因此我们把“变异大”作为“好”的标准来寻求综合指标。3.1.1 主成分的一般定义 设有随机变量X1,X2,…,Xp,其样本均数记为,,…,,样本标准差记为S1,S2,…,Sp。首先作标准化变换,我们有如下的定义: (1) 若C1=a11x1+a12x2+ … +a1pxp,…,且使 Var(C1)最大,则称C1为第一主成分; (2) 若C2=a21x1+a22x2+…+a2pxp,…,(a21,a22,…,a2p)垂直于(a11,a12,…,a1p),且使Var(C2)最大,则称C2为第二主成分; (3) 类似地,可有第三、四、五…主成分,至多有p个。 3.1.2 主成分的性质 主成分C1,C2,…,Cp具有如下几个性质: (1) 主成分间互不相关,即对任意i和j,Ci 和Cj的相关系数 Corr(Ci,Cj)=0 i j (2) 组合系数(ai1,ai2,…,aip)构成的向量为单位向量, (3) 各主成分的方差是依次递减的,即 Var(C1)≥Var(C2)≥…≥Var(Cp)

特征提取在人脸识别中的应用.pdf

特征提取在人脸识别中的应用 刘磊,2014080008 一、 人脸识别研究现状 人脸识别的研究早已展开,Calton等早在1888年和1910年就分别在Nature杂志上发表过两篇关于利用人脸特征进行身份识别的文章,提出检测人脸特征或是关键点的方法。自动人脸识别的研究论文最早出现在1965年Chan和Bledsoe在Panoramic Research Inc上发表的技术报告中至今已有四十多年的历史。学者们一般将AFR的研究历史按照研究内容、技术方法等划分为以下三个阶段。 第一阶段(1964—1990年)。这一阶段人脸识别刚刚起步,还只是被作为一个一般性的模式识别问题进行研究,所釆用的方法主要是比较人脸的几何结构。总体而言,这一阶段可以看做是人脸识别研究的初级阶段,代表性的成果没有很多,也没有得到实际应用。 第二阶段(1991一1997年)。尽管第二阶段的时间比较短暂,但却是人脸识别研究的发展高峰期,不仅涌现出大量重量级研究成果,而且出现了若干商业化运作的人脸识别系统。这一阶段的人脸识别技术发展非常之快,所提出的算法在较理想图像采集条件下的中小规模正面人脸数据库上可以达到令人满意的性能。 第三阶段(1998—现在)。20世纪90年代以来,对人脸识别方法的研究变得非常热门,吸引了大量的研究人员和基金支持。由于主流的人脸识别技术对于光照、姿态等非理想采集条件,以及用户不配合造成的人脸变化等条件下的鲁棒性比较差。目前非理想成像条件下(尤其是光照和姿态)、对象不配合、大规模人脸数据库上的人脸识别问题逐渐成为研究的热点问题。而非线性建模方法、统计学习理论、基于Boosting的学习技术、基于3D模型的人脸建模与识别方法等逐渐成为备受重视的技术发展趋势。 二、人脸识别系统 人脸识别系统是提取人脸的相关特征信息,并根据这些特征信息进行身份识别的生物识别技术,它利用计算机对人脸静态图像或动态视频流进行分析,提取出对识别有用的信息,从而进行身份认证,它是人类用来进行身份确认最直接、最自然、最友好的生物特征识别方法,而且与其他身份识别方法相比,人脸识别具有采集过程的非侵犯性、釆集的便捷性等优点,特别是使用者不会产生任何心理障碍,通过对人脸表情与姿态进行分析,还能获得其他识别系统难以获得的一些信息。 三、人脸识别的描述分类 1、人脸检测

模式识别特征提取

特征提取 SIFT算法提取步骤 SIFT算法提取特征点的主要步骤: (1)检测尺度空间极值点 检测尺度空间极值的目的是确定特征点位置和所在尺度组。即先使用高斯过滤器对原始图像进行若干次连续滤波建立第一个尺度组,再把图形减小到原来的一半,进行同样的高斯滤波形成第二个尺度组。之后,重复操作直到图像小于某一个给定阀值为止。接下来对每个尺度组中的高斯图像进行差分,形成高斯差分尺度组(DoG尺度图像)。

图3-1 尺度空间的构造 在上面建立的DoG尺度空间金字塔中,为了检测到DoG空间的最大值和最小值,DoG尺度空间中中间层(最底层和最顶层除外)的每个像素点需要跟同一层的相邻8个像素点以及它上一层和下一层的9个相邻像素点总共26个相邻像素点进行比较,以确保在尺度空间和二维图像空间都检测到局部极值,如图3-2所示 图3-2 DoG空间局部极值检测 在图3-2中,标记为叉号的像素若比相邻26个像素的DoG值都大或都小,则该点将作为一个局部极值点。被检测工件的高斯滤波图像如图3-3所示。

图3-3 原始图像和部分高斯滤波图像 (2)精确定位极值点 由于DoG值对噪声和边缘较敏感,因此,在上面DoG尺度空间中检测到局部极值点还要经过进一步的检验才能精确定位为特征点。一般通过二阶Taylor 展开式计算极值点的偏移量,获得亚像素定位精度,同时通过阈值设置剔除差异小的点。最终保留下来的点称为特征点,特征点的检测是在尺度空间中进行的,特征点保持为尺度不变量。各层图像特征点如图3-4所示。

图3-4 各层图像的特征点 (3)为每个关键点指定方向参数 σ—尺度空间坐标 O —组(octave)数 S —组内层数 在上述尺度空间中,O 和S ,σ的关系如下: ()[][]2,...,0,1,...,02 ,0+∈-∈=+S s O o s o S s o σσ (3-10)

人脸识别主要算法原理

人脸识别主要算法原理 主流的人脸识别技术基本上可以归结为三类,即:基于几何特征的方法、基于模板的方法和基于模型的方法。 1. 基于几何特征的方法是最早、最传统的方法,通常需要和其他算法结合才能有比较好的效果; 2. 基于模板的方法可以分为基于相关匹配的方法、特征脸方法、线性判别分析方法、奇异值分解方法、神经网络方法、动态连接匹配方法等。 3. 基于模型的方法则有基于隐马尔柯夫模型,主动形状模型和主动外观模型的方法等。 1. 基于几何特征的方法 人脸由眼睛、鼻子、嘴巴、下巴等部件构成,正因为这些部件的形状、大小和结构上的各种差异才使得世界上每个人脸千差万别,因此对这些部件的形状和结构关系的几何描述,可以做为人脸识别的重要特征。几何特征最早是用于人脸侧面轮廓的描述与识别,首先根据侧面轮廓曲线确定若干显著点,并由这些显著点导出一组用于识别的特征度量如距离、角度等。Jia 等由正面灰度图中线附近的积分投影模拟侧 面轮廓图是一种很有新意的方法。 采用几何特征进行正面人脸识别一般是通过提取人眼、口、鼻等重要特征点的位置和眼睛等重要器官的几何形状作为分类特征,但Roder对几何特征提取的精确性进行了实验性的研究,结果不容乐观。

可变形模板法可以视为几何特征方法的一种改进,其基本思想是: 设计一个参数可调的器官模型(即可变形模板),定义一个能量函数,通过调整模型参数使能量函数最小化,此时的模型参数即做为该器官的几何特征。 这种方法思想很好,但是存在两个问题,一是能量函数中各种代价的加权系数只能由经验确定,难以推广,二是能量函数优化过程十分耗时,难以实际应用。基于参数的人脸表示可以实现对人脸显著特征的一个高效描述,但它需要大量的前处理和精细的参数选择。同时,采用一般几何特征只描述了部件的基本形状与结构关系,忽略了局部细微特征,造成部分信息的丢失,更适合于做粗分类,而且目前已有的特征点检测技术在精确率上还远不能满足要求,计算量也较大。 2. 局部特征分析方法(Local Face Analysis) 主元子空间的表示是紧凑的,特征维数大大降低,但它是非局部化的,其核函数的支集扩展在整个坐标空间中,同时它是非拓扑的,某个轴投影后临近的点与原图像空间中点的临近性没有任何关系,而局部性和拓扑性对模式分析和分割是理想的特性,似乎这更符合神经信息处理的机制,因此寻找具有这种特性的表达十分重要。基于这种考虑,Atick提出基于局部特征的人脸特征提取与识别方法。这种方法在实际应用取得了很好的效果,它构成了FaceIt人脸识别软件的 基础。 3. 特征脸方法(Eigenface或PCA)

小波变换详解

基于小波变换的人脸识别 近年来,小波变换在科技界备受重视,不仅形成了一个新的数学分支,而且被广泛地应用于模式识别、信号处理、语音识别与合成、图像处理、计算机视觉等工程技术领域。小波变换具有良好的时频域局部化特性,且其可通过对高频成分采取逐步精细的时域取样步长,从而达到聚焦对象任意细节的目的,这一特性被称为小波变换的“变聚焦”特性,小波变换也因此被人们冠以“数学显微镜”的美誉。 具体到人脸识别方面,小波变换能够将人脸图像分解成具有不同分辨率、频率特征以及不同方向特性的一系列子带信号,从而更好地实现不同分辨率的人脸图像特征提取。 4.1 小波变换的研究背景 法国数学家傅立叶于1807年提出了著名的傅立叶变换,第一次引入“频率”的概念。傅立叶变换用信号的频谱特性来研究和表示信号的时频特性,通过将复杂的时间信号转换到频率域中,使很多在时域中模糊不清的问题,在频域中一目了然。在早期的信号处理领域,傅立叶变换具有重要的影响和地位。定义信号(t)f 为在(-∞,+∞)内绝对可积的一个连续函数,则(t)f 的傅立叶变换定义如下: ()()dt e t f F t j ωω-? ∞ -∞ += (4-1) 傅立叶变换的逆变换为: ()()ωωπ ωd e F t f t j ? +∞ ∞ -= 21 (4-2) 从上面两个式子可以看出,式(4-1)通过无限的时间量来实现对单个频率

的频谱计算,该式表明()F ω这一频域过程的任一频率的值都是由整个时间域上的量所决定的。可见,式(4-1)和(4-2)只是同一能量信号的两种不同表现形式。 尽管傅立叶变换可以关联信号的时频特征,从而分别从时域和频域对信号进行分析,但却无法将两者有效地结合起来,因此傅立叶变换在信号的局部化分析方面存在严重不足。但在许多实际应用中,如地震信号分析、核医学图像信号分析等,研究者们往往需要了解某个局部时段上出现了哪个频率,或是某个频率出现在哪个时段上,即信号的时频局部化特征,傅立叶变换对于此类分析无能为力。 因此需要一种如下的数学工具:可以将信号的时域和频域结合起来构成信号的时频谱,描述和分析其时频联合特征,这就是所谓的时频局部化分析方法,即时频分析法。1964年,Gabor 等人在傅立叶变换的基础上引入了一个时间局部化“窗函数”g(t),改进了傅立叶变换的不足,形成窗口化傅立叶变换,又称“Gabor 变换”。 定义“窗函数”(t)g 在有限的区间外恒等于零或很快地趋于零,用函数(t )g -τ乘以(t)f ,其效果等同于在t =τ附近打开一个窗口,即: ()()()dt e t g t f G t j f ωττω-+∞ ∞--=?, (4-3) 式(4-3)即为函数f(t)关于g(t)的Gabor 变换。由定义可知,信号(t)f 的Gabor 变换可以反映该信号在t =τ附近的频谱特性。其逆变换公式为: ()()()ττωτωπ ωd G t g e d t f f t j ,21 ? ?+∞ ∞ --- = (4-4) 可见()τω,f G 的确包含了信号(t)f 的全部信息,且Gabor 窗口位置可以随着 τ的变化而平移,符合信号时频局部化分析的要求。 虽然Gabor 变换一定程度上克服了傅立叶变换缺乏时频局部分析能力的不

基于MATLAB的人脸识别

基于MATLAB的人脸识别

————————————————————————————————作者: ————————————————————————————————日期:

图像识别 题目:基于MATLAB的人脸识别 院系:计算机科学与应用系 班级: 姓名: 学号: 日期:

设计题目基于MATLAB的人脸识别设 计技术参数 测试数据库图片10张训练数据库图片20张图片大小1024×768 特征向量提取阈值 1 设计要求综合运用本课程的理论知识,并利用MATLAB作为工具实现对人脸图片的预处理,运用PCA算法进行人脸特征提取,进而进行人脸匹配识别。 工作量 两周的课程设计时间,完成一份课程设计报告书,包括设计的任务书、基本原理、设计思路与设计的基本思想、设计体会以及相关的程序代码; 熟练掌握Matlab的使用。 工作计划第1-2天按要求查阅相关资料文献,确定人脸识别的总体设计思路; 第3-4天分析设计题目,理解人脸识别的原理同时寻求相关的实现算法;第5-8天编写程序代码,创建图片数据库,运用PCA算法进行特征提取并编写特征脸,上机进行调试; 第9-12天编写人脸识别程序,实现总体功能; 第13-14天整理思路,书写课程设计报告书。 参考资料1 黄文梅,熊佳林,杨勇编著.信号分析与处理——MATALB语言及应用.国防科技大学出版社,2000 2 钱同惠编著.数字信号处理.北京:机械工业出版社,2004 3 姚天任,江太辉编著.数字信号处理.第2版.武汉:武汉理工大学出版社,2000 4 谢平,林洪彬,王娜.信号处理原理及应用.机械工业出版社,2004 5刘敏,魏玲.Matlab.通信仿真与应用.国防工业出版社,2005 6 楼顺天.基于Matlab7.x 的系统分析与设计.西安电子科技大学,2002 7孙洪.数字信号处理.电子工业出版社,2001 目录 引言?错误!未定义书签。 1 人脸识别技术?错误!未定义书签。 1.1人脸识别的研究内容?错误!未定义书签。 1.1.1人脸检测(Face Detection)........... 错误!未定义书签。

指纹的特征提取与识别

指纹的特征提取与识别 摘要 随着社会的发展,计算机技术的进步,人们对身份认证技术提出了更高的要求。传统的身份认证方法存在的种种弊端让人们将目光投向了生物特征识别这个崭新的领域。而指纹识别技术凭借其独有的优势在众多生物特征识别技术中脱颖而出,得到了广泛的关注和应用。现今,自动指纹识别技术已经广泛地应用于公安、海关、银行、网络安全等需要进行身份识别和鉴定的领域。因此,进行指纹识别技术方面的研究,具有较高的现实意义和理论意义。 本文综合运用图像处理和模式识别的技术,对自动指纹识别系统的若干问题进行了探讨和研究,实现了指纹图像的预处理、特征提取和指纹匹配等算法,并在指纹分割、指纹增强这两个方面进行了改进和创新。 关键词:指纹识别,指纹分割,指纹增强,特征点提取,指纹匹配

第1章绪论 1.1 指纹识别系统的结构 本文主要是对指纹识别系统中图像处理方面的相关算法进行研究,本文的指纹识别系统的基本框架如图1-1所示。 图1-1指纹识别系统的基本结构 1.1.1指纹的预处理 由于各种原因的影响,指纹取像设备所获得的原始图像是一幅含有较多噪声的灰度图像,预处理的目的就是改善输入指纹图像的质量,增强脊和谷的对比度,将它变成一幅清晰的点线图,以便于进行特征提取。本文预处理过程主要步骤如下: 图1-2指纹预处理的基本结构 指纹分割是把指纹的背景区域从图像中分离出去,减少对指纹图像进行处理时的计算量;指纹增强的目的是对输入的噪音较多的灰度图像进行滤波,去除图像中的叉连、断点及模糊不清的部分,得到一幅较清晰的灰度图像;二值化就是把灰度指纹图像变成0-1取值的二值图像,这样就使图像的灰度层次由原来的256级(8-bits)降为2级(1-bits),从而大大减少了需要存储和处理的数据量。由于指纹的特征仅包含在纹线的形状结构中,所以为了提高处理速度和识别精度,应该在不破坏图像连通性的情况下去掉多余的信息,也就是进行图像的细化。细化是指删除指纹纹线的边缘像素,使之只有一个像素宽度。细化时应保持纹线的连接性、方向性以及特征点位置不变,还应保持纹线的中心基本不变。 1.1.2特征提取 由于指纹通常是用按压的方式得到的,按压位置和方向的不同、手指的状况以及皮肤的形变等都会导致指纹图像不理想。因此,采集到的指纹灰度图像不宜直接用来匹配,

人脸识别论文(基于特征脸)陈立

人脸识别论文(基于特征脸) 学生姓名:陈立学号: 20107977 专业年级: 10级计算机科学与技术一班

摘要 生物特征识别技术使用了人体本身所固有的生物特征,与传统的身份识别方法完全不同,具有更高的安全性、可靠性、和有效性,越来越受到人们的重视。人脸识别技术作为生物特征识别技术的重要组成部分,在近三十年里得到了广泛的关注和研究,已经成为计算机视觉、模式识别领域的研究热点。人脸识别在公共安全、证件验证、门禁系统、视频监视等领域中都有着广泛的应用前景。 本文是在人脸数据库的基础上做人脸特征提取和识别研究,主要内容如下: (1)对人脸识别研究的内容、相关技术、主要实现方法及发展历程作了详细介绍。 (2)介绍主成分分析法(PCA)、K-L变换,并利用特征脸方法实现了人脸识别。 (3)给出了基于matlab环境的编程及实验结果,并对结果进行分析。 关键词:人脸识别,特征脸,K-L变换,主成分分析

第一章人脸识别概述 1.1 生物特征识别技术 生物特征识别技术是通过计算机利用人体所固有的生理特征或行为特征来进行个人身份鉴定。生理特征与生俱来多为先天性的;行为特征则是习惯使然,多是后天性的。我们将生理和行为特征统称为生物特征。常用的生物特征包括:指纹、掌纹、虹膜、视网膜、脸像、声音、笔迹等。 那么,生物特征识别技术是如何进行个人特征识别的呢? 生物鉴别的过程分成三个步骤:生物特征数据采样,生物特征提取和特征匹配。数据采样过程是通过各种传感器对生物特征进行原始数据采集的过程,生物特征提取过程则从传感器采集的数据中抽取出反映个体特性的信息(通常是某种数学上的编码过程),匹配阶段则是计算生物特征之间的相似性并进行排序和一致性判断的过程。 生物特征识别技术主要有人脸识别、指纹识别、语音识别、虹膜识别等。生物识别技术在上个世纪己经有了一定的发展,其中指纹识别技术己经趋近成熟,但人脸识别技术的研究目前还处于起步阶段。指纹、虹膜、掌纹等识别技术都需要被识别者的配合,有的识别技术还需要添置复杂昂贵的设备。人脸识别则可以用已有的照片或是摄像头远距离捕捉图像,无须特殊的采集设备,系统的成本低。并且自动人脸识别可以在当事人毫无察觉的情况下即完成身份确认识别工作,这对反恐怖活动等有非常重大的意义。由于人脸识别技术具有如此之多的优势,因此它的应用前景非常广阔,已成为最具潜力的生物特征识别技术之一。 1.2 人脸识别技术 所谓人脸识别,是指对输入的人脸图像或者视频,判断其中是否存在人脸,如果存在人脸,则进一步给出每张人脸的位置、大小和各个面部主要器官的位置信息,并且依据这些信息,进一步提取每张人脸蕴含的身份特征,并将其与已知人脸库中的人脸进行对比,从而识别每张人脸的身份。其研究内容包括以下五个方面:

基于Gabor小波变换的人脸表情特征提取

—172 — 基于Gabor 小波变换的人脸表情特征提取 叶敬福,詹永照 (江苏大学计算机科学与通信工程学院,镇江 212013) 摘 要:提出了一种基于Gabor 小波变换的人脸表情特征提取算法。针对包含表情信息的静态灰度图像,首先对其预处理,然后对表情子区域执行Gabor 小波变换,提取表情特征矢量,进而构建表情弹性图。最后分析比较了在不同光照条件下不同测试者做出6种基本表情时所提取的表情特征,结果表明Gabor 小波变换能够有效地提取与表情变化有关的特征,并能有效地屏蔽光照变化及个人特征差异的影响。关键词:模式识别;表情特征提取;Gabor 小波变换 Facial Expression Features Extraction Based on Gabor Wavelet Transformation YE Jingfu, ZHAN Yongzhao (School of Computer Science and Communications Engineering, Jiangsu University, Zhenjiang 212013) 【Abstract 】This paper introduces a facial expression features extraction algorithm. Given a still image containing facial expression information,preprocessors are executed firstly. Secondly, expression feature vectors of the expression sub-regions are extracted by Gabor wavelet transformation to form expression elastic graph. Different expression features are extracted and compared while different subjects display six basic expressions with illumination variety. Experiment shows that expression features can be extracted effectively based on Gabor wavelet transformation, which is insensitive to illumination variety and individual difference. 【Key words 】Pattern recognition; Expression feature extraction; Gabor wavelet transformation 计 算 机 工 程Computer Engineering 第31卷 第15期 Vol.31 № 15 2005年8月 August 2005 ·人工智能及识别技术·文章编号:1000—3428(2005)15—0172—03 文献标识码:A 中图分类号:TP37 人脸表情识别是指从给定的表情图像或者视频序列中分析检测出特定的表情状态,进而确定被识别对象的心理情绪。人脸表情识别技术在许多领域有着潜在的应用价值,这些领域包括心理学研究、图像理解、合成脸部动画、视频检索、机器人技术、虚拟现实技术以及新型人机交互环境等[1]。 典型的人脸表情识别系统包括人脸检测、表情特征提取、表情特征分类识别3个阶段。人脸检测要能够从复杂的背景中检测出人脸的存在并确定其位置,对于图像序列,还要能精确跟踪人脸区域,国内外在人脸检测方面已做了大量的研究,且已有相关的有效方法及成果报道。而对于表情特征的提取和分类识别算法的研究目前还处于探索之中,国外学者已做了一定的研究工作,国内关于这方面的研究则相对较少。 针对处理图像的性质,可将表情特征提取方法分为两类:基于静态图像的表情特征提取和基于视频序列的动态表情特征提取。前者处理的是单帧静态表情图像,一般要求该图像反映的表情处于夸张或极大状态,使得提取的表情特征更为典型,这类方法主要包括主成份分析、奇异值分解以及基于小波变换的方法等。后者处理的是表情图像序列,目标是提取表情特征的变化过程。光流模型(Optical Flow Models)是提取动态表情特征的典型方法。比较而言,静态方法处理的数据量少,方法简单可靠,且提取的特征较为典型,能获得较高的识别率,但待处理的图像所包含的表情信息需处于夸张状态。而动态方法处理视频序列中的每一帧图像,因此计算量较大,难以满足实时性要求。 1表情图像的预处理 表情图像的预处理包括表情图像子区域的分割以及表情图像的归一化处理。前者指从表情图像中分割出与表情最相关的子区域,而后者包括图像的灰度均衡和尺度归一。图像预处理的好坏直接影响表情特征提取的效果和计算量。 (a) (b) 图1 分割人脸表情图像以提取特征区域 人脸表情特征可分为两类:持久性表情特征和瞬态表情特征,前者包括嘴巴、眼睛和眉毛,决定了基本表情状态,后者包括脸颊和额角皱纹的瞬间变化,能在一定程度上揭示表情状态。实验表明[3],嘴角形状对表情的影响最大,其次是眼睛和眉毛,而皱纹变化属于动态特征,且受年龄等因素影响较大,对表情的贡献不大,甚至会对表情识别产生不利影响。因此表情识别应重点提取嘴巴、眼睛和眉毛等局部表情特征,并忽略皱纹的变化。图像分割算法的目标就是要精确定位和分离出持久表情特征子区域。对于样本图像,可以人工框出这些区域,也可以根据眼睛的灰度特征并结合先验知识采用特定的定位算法实现特征区域的自动分割。分割结 基金项目:国家自然科学基金资助项目(60273040);江苏省高校自然科学基金资助项目(02KJB520003) 作者简介:叶敬福(1980—),男,硕士生,研究方向:多媒体技术,CSCW ;詹永照,教授、博导 定稿日期:2004-06-26 E-mail :yejingfu@https://www.doczj.com/doc/4e15639421.html,

人脸识别主要算法原理doc资料

人脸识别主要算法原 理

人脸识别主要算法原理 主流的人脸识别技术基本上可以归结为三类,即:基于几何特征的方法、基于模板的方法和基于模型的方法。 1. 基于几何特征的方法是最早、最传统的方法,通常需要和其他算法结合才能有比较好的效果; 2. 基于模板的方法可以分为基于相关匹配的方法、特征脸方法、线性判别分析方法、奇异值分解方法、神经网络方法、动态连接匹配方法等。 3. 基于模型的方法则有基于隐马尔柯夫模型,主动形状模型和主动外观模型的方法等。 1. 基于几何特征的方法 人脸由眼睛、鼻子、嘴巴、下巴等部件构成,正因为这些部件的形状、大小和结构上的各种差异才使得世界上每个人脸千差万别,因此对这些部件的形状和结构关系的几何描述,可以做为人脸识别的重要特征。几何特征最早是用于人脸侧面轮廓的描述与识别,首先根据侧面轮廓曲线确定若干显著点,并由这些显著点导出一组用于识别的特征度量如距离、角度等。Jia 等由正面灰度图中线附近的积分投影模拟侧面轮廓图是一种很有新意的方法。 采用几何特征进行正面人脸识别一般是通过提取人眼、口、鼻等重要特征点的位置和眼睛等重要器官的几何形状作为分类特征,但

Roder对几何特征提取的精确性进行了实验性的研究,结果不容乐观。 可变形模板法可以视为几何特征方法的一种改进,其基本思想是:设计一个参数可调的器官模型(即可变形模板),定义一个能量函数,通过调整模型参数使能量函数最小化,此时的模型参数即做为该器官的几何特征。 这种方法思想很好,但是存在两个问题,一是能量函数中各种代价的加权系数只能由经验确定,难以推广,二是能量函数优化过程十分耗时,难以实际应用。基于参数的人脸表示可以实现对人脸显著特征的一个高效描述,但它需要大量的前处理和精细的参数选择。同时,采用一般几何特征只描述了部件的基本形状与结构关系,忽略了局部细微特征,造成部分信息的丢失,更适合于做粗分类,而且目前已有的特征点检测技术在精确率上还远不能满足要求,计算量也较大。 2. 局部特征分析方法(Local Face Analysis) 主元子空间的表示是紧凑的,特征维数大大降低,但它是非局部化的,其核函数的支集扩展在整个坐标空间中,同时它是非拓扑的,某个轴投影后临近的点与原图像空间中点的临近性没有任何关系,而局部性和拓扑性对模式分析和分割是理想的特性,似乎这更符合神经信息处理的机制,因此寻找具有这种特性的表达十分重要。基于这种考虑,Atick提出基于局部特征的人脸特征提取与识

人脸识别技术的几个主要研究方向

人脸识别技术的几个主要研究方向 1 引言 计算机人脸识别是指基于已知的人脸样本库,利用计算机分析图像和模式识别技术从静态或动态场景中,识别或验证一个或多个人脸。通常识别处理后可得到的基本信息包括人脸的位置、尺度和姿态信息。利用特征提取技术还可进一步抽取出更多的生物特征(如:种族、性别、年龄..) 。计算机人脸识别是目前一个非常活跃的研究课题,它可以广泛应用于保安系统、罪犯识别以及身份证明等重要场合。虽然人类对于人脸的识别能力很强,能够记住并辨识上千个不同的人脸,可是对于计算机则困难多了,其表现在:人脸表情丰富;人脸随年龄的增长而变化;发型、胡须、眼镜等装饰对人脸造成的影响;人脸所成图像受光照、成像角度以及成像距离等影响。 计算机人脸识别技术是近20年发展起来的,90年代更成为科研热点,仅从1990 年到1999年之间,EI 可检索到的相关文献多达数千篇,关于人脸识别的综述也屡屡可见[1] 。自动人脸识别系统包括两个主要技术环节首先是人脸检测和定位,然后是对人脸进行特征提取和识别(匹配)。本文着重介绍人脸识别技术的各类方法,通过对比指出各类方法的优缺点及今后的发展方向。 2 人脸检测和定位 人脸检测和定位即对于给定的一幅图像检测图像中是否有人脸,若有则确定其在图像中的位置,并从背景中分割出来。这是个极富挑战性的问题,因为人脸是非刚体,且人脸在图像中的大小和方向以及人的肤色和纹理等方面有很大的可变形。人脸检测问题主要有四种:(1)对于给定的一幅人脸图像,将其中的人脸定位并给出其位置;(2)在一幅混乱的单色场景图中检测出所有的人脸;(3)在彩色图像中检测(定位)所有人脸;(4)在某一视频序列中,检测和定位出所有人脸。文献[2]对人脸检测进行了较为详细的综述,指出常用的人脸检测方法有四种:(1)基于知识的方法;(2)基于人脸固定特征的方法;(3)基于模板匹配的方法;(4)基于外貌的方法(Appearance-based methods),在基于模板匹配的方法中所采用的是预先确定的模板,而在基于外貌的方法中其模板的选择是通过对一系列图像的学习而确定的。一般来说,基于外貌的方法依靠统计和学习技术来找出人脸和非人脸图像的相关特征。在该方法中有特征脸法、基于聚类的方法、神经网络方法和支持向量机的方法。CMU库是常用的人脸检测库,主要的算法评定指标为错误接受率(FAR)和错误拒绝率(ARR)。 3 人脸特征提取和识别 目前大部分研究主要是针对二维正面人脸图像,也有基于三维人脸模型的方法,还有一种所谓的混合系统的身份鉴定系统。 3.1 二维正面人脸识别 在对人脸图像进行特征提取和分类之前一般需要做几何归一化和灰度归一化。几何归一化是指根据人脸定位结果将图像中人脸变换到同一位置和同样大

图像特征提取及识别过程

摘要 纹理特征是一种重要的视觉线索,是图像中普遍存在而又难以描述的特征。纹理分类与分割是图像处理领域一个经久不衰的热点研究领域,纹理特征提取作为纹理分类与分割的首要问题,一直是人们关注的焦点,各种纹理特征提取方法层出不穷。 本文在广泛文献调研的基础上,回顾了纹理特征提取方法的发展历程,分析了其研究现状,对纹理特征提取方法进行了较为全面的综述和分类,最后重点研究了基于灰度共生矩阵的图像纹理提取方法,研究如何有效地提取图像纹理特征来对图像进行描述,通过特征值来对图像进行识别。 灰度共生矩阵是一种简单有效的图像纹理特征描述方法,该方法的优势在于:它能利用了图像中像素相对位置的空间信息更加准确地描述图像的纹理,本文就是利用图像灰度共生矩阵的这一特性,从该矩阵中提取相应的统计参量作为纹理特征来实现对图像的识别。 关键字:灰度共生矩阵,纹理特征提取,图像识别

ABSTRACT Texture is a kind of important visual clues in images , it is widespread but cannot easy to be described . Texture classification and segmentation is a enduring popular research field in image processing area. Texture feature extraction has been the focus of attention,due to its priority to texture classification and image segmentation. all sorts of texture feature extraction methods has been emerged in endlessly. On the basis of extensive literature investigation, we review the texture feature extraction methods, analyze the development of the research status of the texture feature extraction methods and make a comprehensive review of its classification . Finally ,based on gray symbiotic matrix image problem extraction methods,we research how to effectively extract image texture feature described by the image characteristic value to image recognition. Graylevel co-occurrence matrix is a simple and effective image texture description method.This method's advantage is: it can use the image pixels relative positions of the spatial information more to accurately describe the texture image.This paper use the graylevel co-occurrence matrix of the properties to extract statistics from the matrix corresponding as texture feature parameters to realize image recognition. KEY WORDS: graylevel co-occurrence matrix, texture feature extraction, image recognition

相关主题
文本预览
相关文档 最新文档