当前位置:文档之家› 虹膜识别特征提取及鉴别

虹膜识别特征提取及鉴别

虹膜识别特征提取及鉴别
虹膜识别特征提取及鉴别

摘要

随着信息社会的快速发展,对安全的需求也日益增长。虹膜识别技术作为一种身份识别,以其很高的可靠性得到人们的重视。虹膜识别系统核心一般由图像采集、虹膜定位、归一化、特征提取及编码和训练识别五部分构成。本文介绍了目前虹膜识别的现状,简单阐述了一些经典的虹膜识别算法和技术,并完成识别系统。

在虹膜的定位阶段,首先对图像进行缩放,在不影响后续处理的情况下减小了处理的数据量,然后采用梯度加权的Canny算法进行边缘检测,再对边缘图像,采用圆Hough定位方法,分别定位了虹膜的外边界。接着采用Radon变换检测直线的方法分割上下眼睑,阈值法除去睫毛干扰。同时也研究了一些文献中分割眼睑和睫毛的方法。

归一化阶段,采用了文献中普遍使用的“Rubber-Sheet”模型,将虹膜归一化为64512

大小的矩形,以利于特征比对。

在虹膜的特征提取及编码阶段,基于信号处理中的空间/频域技术,采用一维Log Gabor滤波器提取虹膜的纹理信息,对滤波结果的实部和虚部分别进行相位量化和编码,同时也对噪声进行处理,获得相应的掩码。

训练识别阶段,采用海明距离度量虹膜之间的相似度,选取最小距离分类器和具有最小错误率的分类阈值形成组合的分类决策规则。整个识别系统主要在中科院V3.0虹膜数据库上进行了测试。

关键词:虹膜识别;虹膜定位;圆Hough变换;Log Gabor小波

ABSTRACT

With the rapid growth of information technology, the demands of information security are ever-growing. As the technology of identification, iris recognition, for its high reliability, gets great attention. Iris recognition system consists of image capturing, iris location, iris normalization, feature extraction and coding and decision training. In this dissertation, the situation of iris recognition is presented. Some practical algorithms and technique are briefly introduced. A system of iris recognition is fulfilled.

In iris location stage, image is zoomed to reduce the data volume with less influence on post processing. Afterword, the algorithm of Canny edge detection, with weighted gradient, is adopted. In the edge image, Circular Hough transform is applied to locate the inside and out boundary of iris. Then, linear Radon transform is put to use to detect the eyelids. Eyelashes are eliminated by threshold.

In normalization stage, “rubber-sheet”model, in general us e, is used t-o unwrap iris image into a rectangle of the same s ize, for the comparison of characteristics.

In feature extraction and coding stage. 1D Log Gabor filter s are used to filter the iris texture features in the space-frequen cy domain. Then, the real part and the image part is quantize d by phase encoding respectively. Besides, the processing of n

oise to generates mask.

In decision training stage, the Hamming distance is employed to measure the similarity of two iris. The minimum distance classifier combining with the threshold with minimum error ratio are used as the decision rules. The experiments implemented on CASIA iris database V3.0 show that the system performs well.

Key Words: Iris Recognition; Iris Location; Circular Hough Transform; Log Gabor Wavelets

目录

第一章绪论 (1)

1.1 生物特征识别 (1)

1.1.1 非生物特征身份鉴别方法 (1)

1.1.2 生物特征识别技术的提出 (2)

1.1.3 研究生物特征识别技术的意义 (3)

1.2 虹膜识别研究 (3)

1.2.1 虹膜识别的机理 (3)

1.2.2 虹膜识别的发展与现状 (6)

1.2.3 虹膜库 (9)

1.3 本文研究的容 (9)

第二章虹膜图像预处理 (11)

2.1 虹膜外边界的定位 (11)

2.1.1 Canny算子和Hough变换的基本原理 (11)

2.1.2 本文采用的Canny算子 (14)

2.1.3 本文采用的Hough变换圆检测算法 (16)

2.1.4 虹膜外边界的定位 (17)

2.2 眼睑的分割 (18)

2.2.1 抛物线检测眼睑 (19)

2.2.2 Radon变换法分割眼睑 (19)

2.3 剔除睫毛 (21)

2.3.1 阈值法剔除睫毛 (21)

2.4 小结 (22)

第三章虹膜图像归一化及特征提取 (23)

3.1 虹膜纹理归一化 (23)

3.1.1 平移 (23)

3.1.2 旋转 (24)

3.1.3 伸缩 (24)

3.1.4 分辨率 (24)

3.2 虹膜的Rubber-Sheet模型 (25)

3.2.1 虹膜边界表示 (26)

3.2.2 虹膜区域的表示 (27)

3.2.3 虹膜区域规化 (28)

3.2.4 灰度级插值 (29)

3.2.5 具体实现 (31)

3.3 小结 (31)

第四章虹膜特征编码 (32)

4.1 图像纹理分析的基本理论 (32)

4.2 虹膜特征编码方案 (33)

4.3 基于Log Gabor小波的特征编码 (35)

4.3.1 Log Gabor函数性能分析 (35)

4.3.2 Log Gabor小波的构造 (39)

4.3.3 特征编码 (40)

4.4 小结 (42)

第五章虹膜模式匹配 (43)

5.1 识别判决 (43)

5.2 虹膜模式匹配 (44)

5.2.1 海明距离匹配 (44)

5.2.2 最小距离分类器 (46)

5.3 统计分析 (49)

5.4 小结 (52)

第六章总结 (53)

6.1 论文容总结与展望 (53)

6.2 系统演示 (54)

参考文献 (61)

致 (63)

第一章绪论

1.1 生物特征识别

生物特征识别有时也被称为生物测定技术。生物特征识别是指利用人体所固有的生理特征或行为特征,进行个人身份识别的技术[19,21,22]。近年来在维护国家安全、航空安全、金融安全、社会安全、网络安全等应用领域,身份识别和认证变得越来越重要,对身份的有效认证要求更精确、更安全、更实用的鉴别方法,生物技术的发展和进步为身份鉴别提供了新的方法和手段,基于生物特征的身份识别方法成了近年身份识别领域研究的热点。1.1.1 非生物特征身份鉴别方法

个人身份鉴别可以分为:认证和识别。认证是指验证用户是否是他所声明的身份,识别指的是确定用户的身份。目前,身份鉴别大多采用、钥匙、密码、用户名等等,通过验证这些标识身份的身外之物来识别个人身份,这些身份鉴别方法是把身份识别问题转化为鉴别一些标识个人身份的事物。

这些均为“身外之物”,而不是生物特征,这类方法统称为非生物特征身份鉴别方法。这些身份鉴别方法确实在一定程度上提供了简单有效的身份鉴别,给人们的生活带来了方便,但是随着信息安全性和身份鉴别可靠性要求的提高,这些非生物特征的身份鉴别方法很难满足要求。

采用钥匙、证件的门禁系统和采用用户名和密码的网上交易,其安全性容易受到攻击。对于日益增加的计算机网络用户,登陆不同的,可能需要注册不同的用户名,相当多的用户为了便于记忆而设定的用户名和密码容易被猜出和破译,而非生物特征的身份鉴别方法很难识别真正的拥有者和取得身份标识物品的冒充者,所以一旦他人获得了这些身份标识事物,那么就拥有了相应的权利,造成的后果会很严重的。防伪性和防欺骗性差是非生物特征身份鉴别方法安全性低的另一个缺点。犯罪分子伪造证件的手段越来越高

明,这使目前广泛使用的依靠证件、个人识别码、口令或钥匙等来确认个人身份的技术安全性降低。

1.1.2 生物特征识别技术的提出

二十一世纪是网络化、信息化时代,随之而来的一大特征就是身份的数字化和隐性化,如何准确鉴别一个人的身份、保护信息的安全是当今信息化时代必须解决的问题。随着网络的日益普及,社会信息化程度越来越高,对安全、可靠的身份识别技术需求变得越来越迫切。人们希望有一种更安全、更可靠、携带使用更方便且不会被遗忘的事物来表示个人身份,显然个体本身的生物特征将是一种可行的、比较理想的选择。生物特征识别技术利用人类的生理或者行为特征进行身份识别和认证,认证的是人身之物,而不是“身外之物”。人们可能会遗忘或丢失标识他们身份的证件物品或用户名及密码,但是人们绝不会遗忘或者丢失他们的生物特征(如人脸、指纹、虹膜、掌纹等),另外,个人的生物特征也不会被分享,所以生物识别系统很难被欺骗或欺骗成本很高。

目前,生物特征识别采用的生理特征主要有:指纹、掌纹、眼睛(视网膜和虹膜)、人体气味、脸型、皮肤毛孔、手腕/手的血管纹理和DNA等,是先天具有的,采用的行为特征主要包括:签名、声音、行走的步态、击打键盘的力度等,是后天习惯养成的。

基于生物特征的识别利用计算机技术很容易实现身份自动识别,它们的基本工作原理相同,如图1-1所示。

首先是从独立个体采集生物样本,这些样本可以是虹膜图像、指纹图像、人脸图像,声音的数字化描述,步态时序图像等;接着是进行预处理,主要进行特征区域定位或者去噪处理;然后进行特征提取,并将提取的特征与数据库存储的身份特征进行比对,最后输出比对结果,做出身份判断。在基于生物特征的身份认证领域,身份信息全部是以数字形式存储于数据库或者智

能IC卡中,鉴别身份时,能够对持有者合法性进行验证。

图1-1 生物识别系统原理

理想的生物特征识别系统应满足:

(1)所有人都拥有这一生物特征,并且不同人的生物特征是可以区分的;

(2)生物特征的采集不随采集的条件而不同;

(3)系统能够区分冒充者。

近年来,随着计算机技术和信息处理与识别技术的不断进步,生物识别技术得到了迅猛的发展,并逐渐被大众所认可。

1.1.3 研究生物特征识别技术的意义

利用人类个体生理和行为特征进行个人身份识别己经取得了许多可喜成果。目前,国外许多高新技术公司用眼睛虹膜、指纹、面貌特征等取代人们手中的信用卡或密码,并且已经开始在机场、银行和各种电子器具上进行了实际应用。

1.2 虹膜识别研究

1.2.1 虹膜识别的机理

1.虹膜结构

虹膜识别是最具潜力的生物识别方法之一,是识别率高、非接触、仿欺骗性好的识别方法。虹膜是人眼受保护的部组织,位于角膜和水样液后面、晶状体前面,如图1-2。虹膜是外部可见的,环绕瞳孔的有色圆环,是一个肌肉组织,虹膜直径约12mm,厚约0.5mm,根部最薄。虹膜表面高低不平坦,有皱缓和凹陷,凹陷又称隐窝。由于虹膜血管分布不匀,使虹膜表面

语音识别发展现状与展望

中国中文信息学会第七次全国会员代表大会 暨学会成立30周年学术会议 语音识别发展现状与展望中科院自动化研究所徐波 2011年12月4日

报告提纲 ?语音识别技术现状及态势?语音识别技术的行业应用?语音识别技术研究方向?结论与展望

2010年始语音识别重新成为产业热点?移动互联网的兴起成为ASR最重要的应用环境。在Google引领下,互联网、通信公司纷纷把语音识别作为重要研究方向 –Android系统内嵌语音识别技术,Google语音 翻译等; –iPhone4S 上的Siri软件; –百度、腾讯、盛大、华为等都进军语音识别领 域; –我国语音技术领军企业讯飞2010年推出语音云识别、讯飞口讯 –已有的QQ2011版语音输入等等

成熟度分析-技术成熟度曲线 ?美国市场调查咨询公司Gartner于2011年7月发布《2011新兴技术成熟度曲线》报告:

成熟度分析-新兴技术优先矩阵?Gartner评出了2011年具有变革作用的技术,包括语音识别、语音翻译、自然语言问答等。其中语音翻译和自然语言问答有望在5-10年内获得大幅利用,而语音识别有望在2-5年内获得大幅利用;

三十年语音识别技术发展 ---特征提取与知识方面?MFCC,PLP,CMS,RASTA,VTLN;?HLDA, fMPE,neural net-based features ?前端优化 –融入更多特征信息(MLP、TrapNN、Bottle Neck Features等) ?特征很大特点有些是跟模型的训练算法相匹配?大规模FSN图表示,把各种知识源集中在一起–bigram vs. 4-gram, within word dependencies vs. cross-word

人脸识别流程

概述 本项目的主要目的是身份证照片与摄像头获取的人脸照片进行比对,确定身份证和目标对象是不是同一个人。 本文项目主要分三个方面,首先是人脸的检测定位;其次是对照片中定位好的人脸进行预处理,处理到适合提取特征值的水平;最后提取特征值比对识别是不是同一个人。系统的大框架如下: 第一步人脸检测定位 确定是否包含人脸,如果包含人脸,则需要确定脸部所在的位置和尺寸。因为获取的都是彩色图像,首先可以进行肤色检测。在检测出肤色像素后,需要根据它们在色度上的相似性和空间上的相关性分割出可能的人脸区域,同时利用区域的几何特征或灰度特征进行是否是人脸的验证,以排除其它色彩类似肤色的物体。这一步流程图如下:

页脚内容 第二步人脸图像预处理 图像处理的目的是为了方便提取人脸的特征值,进而才能比对识别,所以这一步也至关 重要。第一,对于分割出的人脸,由于噪声带来失真和降质,在特征提取之前采用滤波的方式来去除噪声是必须的步骤。第二尺度归一化,其思想是将尺寸各不相同的人脸图像变换为统一的标准尺寸图像以便于人脸特征的提取。第三灰度归一化,人脸识别的研究一般以灰度图像为研究对象,对于彩色的脸像,可对其首先进行灰度化处理。第四灰度均衡化,由于在图像采集中光照的改变容易导致图像呈现不同的明暗程度,因此需要对人脸图像进行灰度均衡化处理。灰度均衡化,其作用是增强人脸图像的整体对比度,并使灰度分布均匀,以消除光照变化的影响。流程图如下: 第三步特征提取对比识别 人脸特征提取与识别是人脸识别研究中最为关键的两个问题。人脸特征提取又称人脸描 述,是在基于人脸检测定位、归一化等图像预处理的基础上进行的人脸各特征提取的过程,为人脸识别分类打下基础。

模式识别研究进展-刘成林and谭铁牛

模式识别研究进展 刘成林,谭铁牛 中国科学院自动化研究所 模式识别国家重点实验室 北京中关村东路95号 摘要 自20世纪60年代以来,模式识别的理论与方法研究及在工程中的实际应用取得了很大的进展。本文先简要回顾模式识别领域的发展历史和主要方法的演变,然后围绕模式分类这个模式识别的核心问题,就概率密度估计、特征选择和变换、分类器设计几个方面介绍近年来理论和方法研究的主要进展,最后简要分析将来的发展趋势。 1. 前言 模式识别(Pattern Recognition)是对感知信号(图像、视频、声音等)进行分析,对其中的物体对象或行为进行判别和解释的过程。模式识别能力普遍存在于人和动物的认知系统,是人和动物获取外部环境知识,并与环境进行交互的重要基础。我们现在所说的模式识别一般是指用机器实现模式识别过程,是人工智能领域的一个重要分支。早期的模式识别研究是与人工智能和机器学习密不可分的,如Rosenblatt的感知机[1]和Nilsson的学习机[2]就与这三个领域密切相关。后来,由于人工智能更关心符号信息和知识的推理,而模式识别更关心感知信息的处理,二者逐渐分离形成了不同的研究领域。介于模式识别和人工智能之间的机器学习在20世纪80年代以前也偏重于符号学习,后来人工神经网络重新受到重视,统计学习逐渐成为主流,与模式识别中的学习问题渐趋重合,重新拉近了模式识别与人工智能的距离。模式识别与机器学习的方法也被广泛用于感知信号以外的数据分析问题(如文本分析、商业数据分析、基因表达数据分析等),形成了数据挖掘领域。 模式分类是模式识别的主要任务和核心研究内容。分类器设计是在训练样本集合上进行优化(如使每一类样本的表达误差最小或使不同类别样本的分类误差最小)的过程,也就是一个机器学习过程。由于模式识别的对象是存在于感知信号中的物体和现象,它研究的内容还包括信号/图像/视频的处理、分割、形状和运动分析等,以及面向应用(如文字识别、语音识别、生物认证、医学图像分析、遥感图像分析等)的方法和系统研究。 本文简要回顾模式识别领域的发展历史和主要方法的演变,介绍模式识别理论方法研究的最新进展并分析未来的发展趋势。由于Jain等人的综述[3]已经全面介绍了2000年以前模式分类方面的进展,本文侧重于2000年以后的研究进展。

模式识别特征选择与提取

模式识别特征选择与提取 中国矿业大学计算机科学与技术学院电子信息科学系 班级:信科11-1班,学号:08113545,姓名:褚钰博 联系方法(QQ或手机):390345438,e-mail:390345438@https://www.doczj.com/doc/fd1163726.html, 日期:2014 年06月10日 摘要 实际问题中常常需要维数约简,如人脸识别、图像检索等。而特征选择和特征提取是两种最常用的维数约简方法。特征选择是从某些事物中提取出本质性的功能、应用、优势等,而特征提取是对特征空间进行变换,将原始特征空间映射到低维空间中。 本文是对主成分分析和线性判别分析。 关键词:特征选择,特征提取,主成分分析,线性判别分析 1.引言 模式识别的主要任务是利用从样本中提取的特征,并将样本划分为相应的模式类别,获得好的分类性能。而分类方法与分类器设计,都是在d(变量统一用斜体)维特征空间已经确定的前提下进行的。因此讨论的分类器设计问题是一个选择什么准则、使用什么方法,将已确定的d维特征空间划分成决策域的问题。对分类器设计方法的研究固然重要,但如何确定合适的特征空间是设计模式识别系统另一个十分重要,甚至更为关键的问题。如果所选用的特征空间能使同类物体分布具有紧致性,即各类样本能分布在该特征空间中彼此分割开的区域内,这就为分类器设计成功提供良好的基础。反之,如果不同类别的样本在该特征空间中混杂在一起,再好的设计方法也无法提高分类器的准确性。本文要讨论的问题就是特征空间如何设计的问题。 基于主成分分析的特征选择算法的思想是建立在这样的基础上的:主成分分析方法将原始特征通过线性变换映射到新的低维空间时,获得的主成分是去了新的物理意义,难以理解,并且主成分是所有原始特征的线性组合。所以将主成分分析与特征选择相结合,设计多种相似性度量准则,通过找到与主成分相关的关键特征或者删除冗余、不相关以及没有意义的特征,将主成分又重新映射到原始空间,来理解成主成分的实际意义。 基于线性判别分析的高维特征选择将单个特征的Fisher准则与其他特征选择算法相结合,分层消除不相关特征与冗余特征。不相关特征滤波器按照每个特征的Fisher评价值进行特征排序,来去除噪音和不相关特征。通过对高维数据特征关联性的分析,冗余特征滤波器选用冗余度量方法和基于相关性的快速过滤器算法。分别在不同情境下进行数据分类实验,验证其性能。

图像特征提取及识别过程

纹理特征是一种重要的视觉线索,是图像中普遍存在而又难以描述的特征。纹理分类与分割是图像处理领域一个经久不衰的热点研究领域,纹理特征提取作为纹理分类与分割的首要问题,一直是人们关注的焦点,各种纹理特征提取方法层出不穷。 本文在广泛文献调研的基础上,回顾了纹理特征提取方法的发展历程,分析了其研究现状,对纹理特征提取方法进行了较为全面的综述和分类,最后重点研究了基于灰度共生矩阵的图像纹理提取方法,研究如何有效地提取图像纹理特征来对图像进行描述,通过特征值来对图像进行识别。 灰度共生矩阵是一种简单有效的图像纹理特征描述方法,该方法的优势在于:它能利用了图像中像素相对位置的空间信息更加准确地描述图像的纹理,本 文就是利用图像灰度共生矩阵的这一特性,从该矩阵中提取相应的统计参量作为纹理特征来实现对图像的识别。 关键字:灰度共生矩阵,纹理特征提取,图像识别

ABSTRACT Texture is a kind of importa nt visual clues in images , it is widespread but cannot easy to be described . Texture classification and segmentation is a enduring popular research field in image process ing area. Texture feature extract ion has bee n the focus of attention,due to its priority to texture classification and image segmentation. all sorts of texture feature extracti on methods has bee n emerged in en dlessly. On the basis of exte nsive literature inv estigati on, we review the texture feature extract ion methods, an alyze the developme nt of the research status of the texture feature extracti on methods and make a comprehe nsive review of its classificati on . Fin ally ,based on gray symbiotic matrix image problem extracti on methods,we research how to effectively extract image texture feature described by the image characteristic value to image recog niti on. Graylevel co-occurre nee matrix is a simple and effective image texture descripti on method.This method's advantage is: it can use the image pixels relative positions of the spatial in formatio n more to accurately describe the texture image.This paper use the graylevel co-occurre nee matrix of the properties to extract statistics from the matrix corresp onding as texture feature parameters to realize image recog niti on. KEY WORDS : graylevel co-occurrenee matrix, texture feature extraction, image recog niti on

人脸识别主要算法原理

人脸识别主要算法原理 主流的人脸识别技术基本上可以归结为三类,即:基于几何特征的方法、基于模板的方法和基于模型的方法。 1. 基于几何特征的方法是最早、最传统的方法,通常需要和其他算法结合才能有比较好的效果; 2. 基于模板的方法可以分为基于相关匹配的方法、特征脸方法、线性判别分析方法、奇异值分解方法、神经网络方法、动态连接匹配方法等。 3. 基于模型的方法则有基于隐马尔柯夫模型,主动形状模型和主动外观模型的方法等。 1. 基于几何特征的方法 人脸由眼睛、鼻子、嘴巴、下巴等部件构成,正因为这些部件的形状、大小和结构上的各种差异才使得世界上每个人脸千差万别,因此对这些部件的形状和结构关系的几何描述,可以做为人脸识别的重要特征。几何特征最早是用于人脸侧面轮廓的描述与识别,首先根据侧面轮廓曲线确定若干显著点,并由这些显著点导出一组用于识别的特征度量如距离、角度等。Jia 等由正面灰度图中线附近的积分投影模拟侧 面轮廓图是一种很有新意的方法。 采用几何特征进行正面人脸识别一般是通过提取人眼、口、鼻等重要特征点的位置和眼睛等重要器官的几何形状作为分类特征,但Roder对几何特征提取的精确性进行了实验性的研究,结果不容乐观。

可变形模板法可以视为几何特征方法的一种改进,其基本思想是: 设计一个参数可调的器官模型(即可变形模板),定义一个能量函数,通过调整模型参数使能量函数最小化,此时的模型参数即做为该器官的几何特征。 这种方法思想很好,但是存在两个问题,一是能量函数中各种代价的加权系数只能由经验确定,难以推广,二是能量函数优化过程十分耗时,难以实际应用。基于参数的人脸表示可以实现对人脸显著特征的一个高效描述,但它需要大量的前处理和精细的参数选择。同时,采用一般几何特征只描述了部件的基本形状与结构关系,忽略了局部细微特征,造成部分信息的丢失,更适合于做粗分类,而且目前已有的特征点检测技术在精确率上还远不能满足要求,计算量也较大。 2. 局部特征分析方法(Local Face Analysis) 主元子空间的表示是紧凑的,特征维数大大降低,但它是非局部化的,其核函数的支集扩展在整个坐标空间中,同时它是非拓扑的,某个轴投影后临近的点与原图像空间中点的临近性没有任何关系,而局部性和拓扑性对模式分析和分割是理想的特性,似乎这更符合神经信息处理的机制,因此寻找具有这种特性的表达十分重要。基于这种考虑,Atick提出基于局部特征的人脸特征提取与识别方法。这种方法在实际应用取得了很好的效果,它构成了FaceIt人脸识别软件的 基础。 3. 特征脸方法(Eigenface或PCA)

语音信号特征的提取

语音信号特征的提取 摘要 随着计算机技术的发展,语音交互已经成为人机交互的必要手段,语音特征参数的精确度直接影响着语音合成的音质和语音识别的准确率。因此语音信号参数提取是语音信号处理研究中一项非常有意义的工作。 本文采用Matlab软件提取语音信号特征参数,首先对语音信号进行数字化处理,其次,进行预处理,包括预加重、加窗和分帧,本文讨论了预处理中各种参数的选择,以使信号特征提取更加准确。第三,讨论了各种时域特征参数的算法,包括短时能量、短时过零率等。 关键词:语音信号, 特征参数, 提取, Matlab 目录 第一章绪论 1.1语音信号特征提取概况 1.1.1研究意义 语音处理技术广泛应用于语音通信系统、声控电话交换、数据查询、计算机控制、工业控制等领域,带有语音功能的计算机也将很快成为大众化产品,语音将可能取代键盘和鼠标成为计算机的主要输入手段,为用户界面带来一次飞跃。 语音信号特征的提取是语音信号处理的前提和基础,只有分析出可表示语音信号本质特征的参数,才有可能利用这些参数进行高效的语音通信和准确的语音识别,才能建立语音合成的语音库。因此语音信号参数提取是语音信号处理研究中一项非常有意义的工作。 1.1.2 发展现状 语音信号处理是一门综合性的学科,包括计算机科学、语音学、语言学、声学和数学等诸多领域的内容。它的发展过程中,有过两次飞跃。第一次飞跃是1907年电子管的发明和1920年无线电广播的出现,电子管放大器使很微弱的声

音也可以放大和定量测量,从而使电声学和语言声学的一些研究成果扩展到通信和广播部门;第二次飞跃是在20世纪70年代初,电子计算机和数字信号处理的发展使声音信号特别是语音信号,可以通过模数转换器(A/D)采样和量化转换为数字信号,这样就可以用数字计算方法对语音信号进行处理和加工,提高了语音信号处理的准确性和高效性。 语音信号处理在现代信息科学中的地位举足轻重,但它仍有些基础的理论问题和技术问题有待解决,这些难题如听觉器官的物理模型和数学表示及语音增强的技术理论等,目前还有待发展。 1.2 本课题研究内容 本文主要介绍语音信号处理的理论及Matlab的相关内容,然后从Matlab仿真角度验证了录音、预处理、提取语音信号时域特征参数,主要讨论了预处理中各种参数的选择,以使信号特征提取更加准确。再次讨论了各种时域特征参数的算法,包括短时能量、短时过零率等,介绍了各环节的不同软件实现方法。最后对基于Matlab的语音信号特征参数提取进行总结。 第二章Matlab简介 MATLAB是国际上仿真领域最权威、最实用的计算机工具。它是MathWork 公司于1984年推出,它以强大的科学计算与可视化功能、简单易用、开放式可扩展环境,特别是所附带的30多种面向不同领域的工具箱支持,使得它在许多科学领域中成为计算机辅助设计和分析、算法研究和应用开发的基本工具和首选平台。 2.1 发展概况 Matlab是Matrix Laboratory(矩阵实验室的缩写),最初由美国Cleve Moler 博士在70年代末讲授矩阵理论和数据分析等课程时编写的软件包Linpack与Eispack组成,旨在使应用人员免去大量经常重复的矩阵运算和基本数学运算等繁琐的编程工作。1984年成立的Math Works公司正式把Matlab推向市场,并从事Matlab的研究和开发。1990年,该公司推出了以框图为基础的控制系统仿真工具Simulink,它方便了系统的研究与开发,使控制工程师可以直接构造系统框图进行仿真,并提供了控制系统中常用的各种环节的模块库。1993年,Math Works 公司推出的Matlab4.0版在原来的基础上又作了较大改进,并推出了Windows版,

人脸识别介绍

人脸识别技术是生物识别技术的一种,它结合了图像处理、计算机图形学、模式识别、可视化技术、人体生理学、认知科学和心理学等多个研究领域。从二十世纪六十年代末至今,人脸识别算法技术的发展共经历了如下四个阶段: 1. 基于简单背景的人脸识别 这是人脸识别研究的初级阶段。通常利用人脸器官的局部特征来描述人脸。但由于人脸器官没有显著的边缘且易受到表情的影响,因此它仅限于正面人脸(变形较小)的识别。 2. 基于多姿态/表情的人脸识别 这是人脸识别研究的发展阶段。探索能够在一定程度上适应人脸的姿态和表情变化的识别方法,以满足人脸识别技术在实际应用中的客观需求。 3. 动态跟踪人脸识别 这是人脸识别研究的实用化阶段。通过采集视频序列来获得比静态图像更丰富的信息,达到较好的识别效果,同时适应更广阔的应用需求。 4. 三维人脸识别 为了获得更多的特征信息,直接利用二维人脸图像合成三维人脸模型进行识别,即将成为该领域的一个主要研究方向。 人脸识别技术的研究范围主要包括以下几个方面: 1. 人脸检测:在输入的图像中寻找人脸区域。 2. 人脸的规范化:校正人脸在尺度、光照和旋转等方面的变化。 3. 特征提取:从人脸图像中映射提取一组能反映人脸特征的数值表示样本。 4. 特征匹配:将待识别人脸与数据库中的已知人脸比较,得出相关信息。 人脸识别流程 1图像预处理 1.1 图像去噪 一般来说,自然界中的噪声可以看成是一种随机信号。根据图像获取的途径人脸图像获取 人脸检测 定位人脸区域 预处理 特征抽取 人脸特征 对比识别 结果 人脸特征库

不同,噪声的融入也有多种方式: 1. 图像是直接以数字形式获取的,那么图像数据的获取机制会不可避免地 引入噪声信号; 2. 在图像采集过程中,物体和采集装置的相对运动。或采集装置的抖动, 也会引入噪声,使图像变的模糊不清; 3. 在图像数据的电子传输过程中,也不同程度的引入噪声信号。 这些噪声信号的存在,严重的情况会直接导致整幅图像的不清晰,图象中的景物和背景的混乱。对于用于人脸识别的图像。由于噪声的引入,将不可避免地造成识别率的下降。对图像噪声的消除可以通过两个途径:空间域滤波或频率域滤波。消除噪声的方法很多,对于不同的噪声应该采用不同的除噪方法。主要的方法是:线性滤波、中值滤波、维纳滤波以及小波去噪等。 1.2 增强对比度 为了使人脸在图像中更为突出以便于下一步的特征提取,增强图像对比度是很有必要的。增强对比度有很多种方法,常见的有直方图均衡化和“S ”形变换等方法。 “S ”形变换方法将灰度值处于某一范围(人脸特征范围)内的像素灰度分布差距拉开,从而保证了对比度的提高,但此方法降低了其他灰度值的对比度。而直方图均衡化则是将像素的灰度分布尽量展开在所有可能的灰度取值上,这样的方法同样能使得图像的对比度提高。 将彩色图像转化成灰度图像是人脸识别方法中常见的处理过程,虽然转化过程丢失了一部分色彩信息,但是灰度图像拥有更小的存储空间和更快的计算速度。文献[1]给出了一种能够将RGB 色彩转换成灰度级且适于突出人脸区域对比度的转换模型:()5.0144.0587.0299.0,+?+?+?=b g r y x f ;其中f 代表灰度值,r ,g ,b 分别表示Red,Green,Blue 分量的值。 文献[2]通过将人脸彩色图像从RGB 色彩空间转换到RIQ 色彩空间,得到了更适于频谱分析的特征分量。

模式识别期末试题

一、填空与选择填空(本题答案写在此试卷上,30分) 1、模式识别系统的基本构成单元包括:模式采集、特征提取与选择 和模式分类。 2、统计模式识别中描述模式的方法一般使用特真矢量;句法模式识别中模式描述方法一般有串、树、网。 3、聚类分析算法属于(1);判别域代数界面方程法属于(3)。 (1)无监督分类 (2)有监督分类(3)统计模式识别方法(4)句法模式识别方法 4、若描述模式的特征量为0-1二值特征量,则一般采用(4)进行相似性度量。 (1)距离测度(2)模糊测度(3)相似测度(4)匹配测度 5、下列函数可以作为聚类分析中的准则函数的有(1)(3)(4)。 (1)(2) (3) (4) 6、Fisher线性判别函数的求解过程是将N维特征矢量投影在(2)中进行。 (1)二维空间(2)一维空间(3)N-1维空间 7、下列判别域界面方程法中只适用于线性可分情况的算法有(1);线性可分、不可分都适用的有(3)。 (1)感知器算法(2)H-K算法(3)积累位势函数法 8、下列四元组中满足文法定义的有(1)(2)(4)。 (1)({A, B}, {0, 1}, {A→01, A→ 0A1 , A→ 1A0 , B→BA , B→ 0}, A) (2)({A}, {0, 1}, {A→0, A→ 0A}, A) (3)({S}, {a, b}, {S → 00S, S → 11S, S → 00, S → 11}, S) (4)({A}, {0, 1}, {A→01, A→ 0A1, A→ 1A0}, A) 9、影响层次聚类算法结果的主要因素有(计算模式距离的测度、(聚类准则、类间距离门限、预定的 类别数目))。 10、欧式距离具有( 1、2 );马式距离具有(1、2、3、4 )。 (1)平移不变性(2)旋转不变性(3)尺度缩放不变性(4)不受量纲影响的特性 11、线性判别函数的正负和数值大小的几何意义是(正(负)表示样本点位于判别界面法向量指向的 正(负)半空间中;绝对值正比于样本点到判别界面的距离。)。 12、感知器算法1。 (1)只适用于线性可分的情况;(2)线性可分、不可分都适用。

人脸识别算法都有哪些

主流的人脸识别技术基本上可以归结为三类,即:基于几何特征的方法、基于模板的方法和基于模型的方法。 1. 基于几何特征的方法 人脸由眼睛、鼻子、嘴巴、下巴等部件构成,正因为这些部件的形状、大小和结构上的各种差异才使得世界上每个人脸千差万别,因此对这些部件的形状和结构关系的几何描述,可以做为人脸识别的重要特征。几何特征最早是用于人脸侧面轮廓的描述与识别,首先根据侧面轮廓曲线确定若干显著点,并由这些显著点导出一组用于识别的特征度量如距离、角度等。Jia 等由正面灰度图中线附近的积分投影模拟侧面轮廓图是一种很有新意的方法。 采用几何特征进行正面人脸识别一般是通过提取人眼、口、鼻等重要特征点的位置和眼睛等重要器官的几何形状作为分类特征,但Roder对几何特征提取的精确性进行了实验性的研究,结果不容乐观。 可变形模板法可以视为几何特征方法的一种改进,其基本思想是:设计一个参数可调的器官模型(即可变形模板),定义一个能量函数,通过调整模型参数使能量函数最小化,此时的模型参数即做为该器官的几何特征。 2. 局部特征分析方法(Local Face Analysis) 主元子空间的表示是紧凑的,特征维数大大降低,但它是非局部化的,其核函数的支集扩展在整个坐标空间中,同时它是非拓扑的,某个轴投影后临近的点与原图像空间中点的临

近性没有任何关系,而局部性和拓扑性对模式分析和分割是理想的特性,似乎这更符合神经信息处理的机制,因此寻找具有这种特性的表达十分重要。基于这种考虑,Atick提出基于局部特征的人脸特征提取与识别方法。这种方法在实际应用取得了很好的效果,它构成了FaceIt人脸识别软件的基础。 3. 特征脸方法(Eigenface或PCA) 特征脸方法是90年代初期由Turk和Pentland提出的目前最流行的算法之一,具有简单有效的特点, 也称为基于主成分分析(principal component analysis,简称PCA)的人脸识别方法。 特征子脸技术的基本思想是:从统计的观点,寻找人脸图像分布的基本元素,即人脸图像样本集协方差矩阵的特征向量,以此近似地表征人脸图像。这些特征向量称为特征脸(Eigenface)。 实际上,特征脸反映了隐含在人脸样本集合内部的信息和人脸的结构关系。将眼睛、面颊、下颌的样本集协方差矩阵的特征向量称为特征眼、特征颌和特征唇,统称特征子脸。特征子脸在相应的图像空间中生成子空间,称为子脸空间。计算出测试图像窗口在子脸空间的投影距离,若窗口图像满足阈值比较条件,则判断其为人脸。 基于特征分析的方法,也就是将人脸基准点的相对比率和其它描述人脸脸部特征的形状参数或类别参数等一起构成识别特征向量,这种基于整体脸的识别不仅保留了人脸部件之间的拓扑关系,而且也保留了各部件本身的信息,而基于部件的识别则是通过提取出局部轮廓信息及灰度信息来设计具体识别算法。

语音识别技术文献综述

语音识别技术综述 The summarization of speech recognition 张永双 苏州大学 摘要 本文回顾了语音识别技术的发展历史,综述了语音识别系统的结构、分类及基本方法,分析了语音识别技术面临的问题及发展方向。 关键词:语音识别;特征;匹配 Abstact This article review the courses of speech recognition technology progress ,summarize the structure,classifications and basic methods of speech recognition system and analyze the direction and the issues which speech recognition technology development may confront with. Key words: speech recognition;character;matching 引言 语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别是一门交叉学科,所涉及的领域有信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等,甚至还涉及到人的体态语言(如人民在说话时的表情手势等行为动作可帮助对方理解)。其应用领域也非常广,例如相对于键盘输入方法的语音输入系统、可用于工业控制的语音控制系统及服务领域的智能对话查询系统,在信息高度化的今天,语音识别技术及其应用已成为信息社会不可或缺的重要组成部分。 1.语音识别技术的发展历史 语音识别技术的研究开始二十世纪50年代。1952年,AT&Tbell实验室的Davis等人成功研制出了世界上第一个能识别十个英文数字发音的实验系统:Audry系统。

特征提取在人脸识别中的应用.pdf

特征提取在人脸识别中的应用 刘磊,2014080008 一、 人脸识别研究现状 人脸识别的研究早已展开,Calton等早在1888年和1910年就分别在Nature杂志上发表过两篇关于利用人脸特征进行身份识别的文章,提出检测人脸特征或是关键点的方法。自动人脸识别的研究论文最早出现在1965年Chan和Bledsoe在Panoramic Research Inc上发表的技术报告中至今已有四十多年的历史。学者们一般将AFR的研究历史按照研究内容、技术方法等划分为以下三个阶段。 第一阶段(1964—1990年)。这一阶段人脸识别刚刚起步,还只是被作为一个一般性的模式识别问题进行研究,所釆用的方法主要是比较人脸的几何结构。总体而言,这一阶段可以看做是人脸识别研究的初级阶段,代表性的成果没有很多,也没有得到实际应用。 第二阶段(1991一1997年)。尽管第二阶段的时间比较短暂,但却是人脸识别研究的发展高峰期,不仅涌现出大量重量级研究成果,而且出现了若干商业化运作的人脸识别系统。这一阶段的人脸识别技术发展非常之快,所提出的算法在较理想图像采集条件下的中小规模正面人脸数据库上可以达到令人满意的性能。 第三阶段(1998—现在)。20世纪90年代以来,对人脸识别方法的研究变得非常热门,吸引了大量的研究人员和基金支持。由于主流的人脸识别技术对于光照、姿态等非理想采集条件,以及用户不配合造成的人脸变化等条件下的鲁棒性比较差。目前非理想成像条件下(尤其是光照和姿态)、对象不配合、大规模人脸数据库上的人脸识别问题逐渐成为研究的热点问题。而非线性建模方法、统计学习理论、基于Boosting的学习技术、基于3D模型的人脸建模与识别方法等逐渐成为备受重视的技术发展趋势。 二、人脸识别系统 人脸识别系统是提取人脸的相关特征信息,并根据这些特征信息进行身份识别的生物识别技术,它利用计算机对人脸静态图像或动态视频流进行分析,提取出对识别有用的信息,从而进行身份认证,它是人类用来进行身份确认最直接、最自然、最友好的生物特征识别方法,而且与其他身份识别方法相比,人脸识别具有采集过程的非侵犯性、釆集的便捷性等优点,特别是使用者不会产生任何心理障碍,通过对人脸表情与姿态进行分析,还能获得其他识别系统难以获得的一些信息。 三、人脸识别的描述分类 1、人脸检测

模式识别特征提取

特征提取 SIFT算法提取步骤 SIFT算法提取特征点的主要步骤: (1)检测尺度空间极值点 检测尺度空间极值的目的是确定特征点位置和所在尺度组。即先使用高斯过滤器对原始图像进行若干次连续滤波建立第一个尺度组,再把图形减小到原来的一半,进行同样的高斯滤波形成第二个尺度组。之后,重复操作直到图像小于某一个给定阀值为止。接下来对每个尺度组中的高斯图像进行差分,形成高斯差分尺度组(DoG尺度图像)。

图3-1 尺度空间的构造 在上面建立的DoG尺度空间金字塔中,为了检测到DoG空间的最大值和最小值,DoG尺度空间中中间层(最底层和最顶层除外)的每个像素点需要跟同一层的相邻8个像素点以及它上一层和下一层的9个相邻像素点总共26个相邻像素点进行比较,以确保在尺度空间和二维图像空间都检测到局部极值,如图3-2所示 图3-2 DoG空间局部极值检测 在图3-2中,标记为叉号的像素若比相邻26个像素的DoG值都大或都小,则该点将作为一个局部极值点。被检测工件的高斯滤波图像如图3-3所示。

图3-3 原始图像和部分高斯滤波图像 (2)精确定位极值点 由于DoG值对噪声和边缘较敏感,因此,在上面DoG尺度空间中检测到局部极值点还要经过进一步的检验才能精确定位为特征点。一般通过二阶Taylor 展开式计算极值点的偏移量,获得亚像素定位精度,同时通过阈值设置剔除差异小的点。最终保留下来的点称为特征点,特征点的检测是在尺度空间中进行的,特征点保持为尺度不变量。各层图像特征点如图3-4所示。

图3-4 各层图像的特征点 (3)为每个关键点指定方向参数 σ—尺度空间坐标 O —组(octave)数 S —组内层数 在上述尺度空间中,O 和S ,σ的关系如下: ()[][]2,...,0,1,...,02 ,0+∈-∈=+S s O o s o S s o σσ (3-10)

语音识别方法及发展趋势分析

语音识别改进方法及难点分析 ——《模式识别》结课小论文 学院:化工与环境学院 学号:2120151177 姓名:杜妮

摘要:随着计算机技术的不断发展,人工智能程度也越来越高,作为人工智能的一部分——模式识别也在模型和算法上愈发成熟。本文根据近105年文献,分析最新声音识别的方法和应用。 关键字:模式识别声音识别方法应用 随着人工智能的迅速发展,语音识别的技术越来越成为国内外研究机构的焦点。人们致力于能使机器能够听懂人类的话语指令,并希望通过语音实现对机器的控制。语音识别的研究发展将在不远的将来极大地方便人们的生活。 语音识别大致的流程包括:特征提取、声学模型训练、语音模型训练以及识别搜索算法。作为一项人机交互的关键技术,语音识别在过去的几十年里取得了飞速的发展,人们在研究和探索过程中针对语音识别的各部流程进行了各种各样的尝试和改造,以期发现更好的方法来完成语音识别流程中的各步骤,以此来促进在不同环境下语音识别的效率和准确率。本文通过查阅近10年国内外文献,分析目前语音识别流程中的技术进展和趋势,并在文章最后给出几项语音识别在日常生活中的应用案例,从而分析语音识别之后的市场走势和实际利用价值。 一、语音识别的改进方法 (一)特征提取模块改进 特征提取就是从语音信号中提取出语音的特征序列。提取的语音特征应该能完全、准确地表达语音信号,特征提取的目的是提取语音信号中能代表语音特征的信息,减少语音识别时所要处理的数据量。语音信号的特征分析是语音信号处理的前提和基础,只有分析出可以代表语音信号本质特征的参数,才能对这些参数进行高效的语音通信,语音合成,和语音识别等处理,并且语音合成的好坏,语音识别率的高低,也都取决于语音特征提取的准确性和鲁棒性。目前,针对特定应用的中小词汇量、特定人的语音识别技术发展已较为成熟,已经能够满足通常应用的要求,并逐步投入了实用。而非特定人、大词汇量、连续语音识别仍是

图像模式识别的方法介绍

2.1图像模式识别的方法 图像模式识别的方法很多,从图像模式识别提取的特征对象来看,图像识别方法可分为以下几种:基于形状特征的识别技术、基于色彩特征的识别技术以及基于纹理特征的识别技术。其中,基于形状特征的识别方法,其关键是找到图像中对象形状及对此进行描述,形成可视特征矢量,以完成不同图像的分类,常用来表示形状的变量有形状的周长、面积、圆形度、离心率等。基于色彩特征的识别技术主要针对彩色图像,通过色彩直方图具有的简单且随图像的大小、旋转变换不敏感等特点进行分类识别。基于纹理特征的识别方法是通过对图像中非常具有结构规律的特征加以分析或者则是对图像中的色彩强度的分布信息进行统计来完成。 从模式特征选择及判别决策方法的不同可将图像模式识别方法大致归纳为两类:统计模式(决策理论)识别方法和句法(结构)模式识别方法。此外,近些年随着对模式识别技术研究的进一步深入,模糊模式识别方法和神经网络模式识别方法也开始得到广泛的应用。在此将这四种方法进行一下说明。 2.1.1句法模式识别 对于较复杂的模式,如采用统计模式识别的方法,所面临的一个困难就是特征提取的问题,它所要求的特征量十分巨大,要把某一个复杂模式准确分类很困难,从而很自然地就想到这样的一种设计,即努力地把一个复杂模式分化为若干

较简单子模式的组合,而子模式又分为若干基元,通过对基元的识别,进而识别子模式,最终识别该复杂模式。正如英文句子由一些短语,短语又由单词,单词又由字母构成一样。用一组模式基元和它们的组成来描述模式的结构的语言,称为模式描述语言。支配基元组成模式的规则称为文法。当每个基元被识别后,利用句法分析就可以作出整个的模式识别。即以这个句子是否符合某特定文法,以判别它是否属于某一类别。这就是句法模式识别的基本思想。 句法模式识别系统主要由预处理、基元提取、句法分析和文法推断等几部分组成。由预处理分割的模式,经基元提取形成描述模式的基元串(即字符串)。句法分析根据文法推理所推断的文法,判决有序字符串所描述的模式类别,得到判决结果。问题在于句法分析所依据的文法。不同的模式类对应着不同的文法,描述不同的目标。为了得到于模式类相适应的文法,类似于统计模式识别的训练过程,必须事先采集足够多的训练模式样本,经基元提取,把相应的文法推断出来。实际应用还有一定的困难。 2.1.2统计模式识别 统计模式识别是目前最成熟也是应用最广泛的方法,它主要利用贝叶斯决策规则解决最优分类器问题。统计决策理论的基本思想就是在不同的模式类中建立一个决策边界,利用决策函数把一个给定的模式归入相应的模式类中。统计模式识别的基本模型如图2,该模型主要包括两种操作模型:训练和分类,其中训练主要利用己有样本完成对决策边界的划分,并采取了一定的学习机制以保证基于样本的划分是最优的;而分类主要对输入的模式利用其特征和训练得来的决策函数而把模式划分到相应模式类中。 统计模式识别方法以数学上的决策理论为基础建立统计模式识别模型。其基本模型是:对被研究图像进行大量统计分析,找出规律性的认识,并选取出反映图像本质的特征进行分类识别。统计模式识别系统可分为两种运行模式:训练和分类。训练模式中,预处理模块负责将感兴趣的特征从背景中分割出来、去除噪声以及进行其它操作;特征选取模块主要负责找到合适的特征来表示输入模式;分类器负责训练分割特征空间。在分类模式中,被训练好的分类器将输入模式根据测量的特征分配到某个指定的类。统计模式识别组成如图2所示。

指纹的特征提取与识别

指纹的特征提取与识别 摘要 随着社会的发展,计算机技术的进步,人们对身份认证技术提出了更高的要求。传统的身份认证方法存在的种种弊端让人们将目光投向了生物特征识别这个崭新的领域。而指纹识别技术凭借其独有的优势在众多生物特征识别技术中脱颖而出,得到了广泛的关注和应用。现今,自动指纹识别技术已经广泛地应用于公安、海关、银行、网络安全等需要进行身份识别和鉴定的领域。因此,进行指纹识别技术方面的研究,具有较高的现实意义和理论意义。 本文综合运用图像处理和模式识别的技术,对自动指纹识别系统的若干问题进行了探讨和研究,实现了指纹图像的预处理、特征提取和指纹匹配等算法,并在指纹分割、指纹增强这两个方面进行了改进和创新。 关键词:指纹识别,指纹分割,指纹增强,特征点提取,指纹匹配

第1章绪论 1.1 指纹识别系统的结构 本文主要是对指纹识别系统中图像处理方面的相关算法进行研究,本文的指纹识别系统的基本框架如图1-1所示。 图1-1指纹识别系统的基本结构 1.1.1指纹的预处理 由于各种原因的影响,指纹取像设备所获得的原始图像是一幅含有较多噪声的灰度图像,预处理的目的就是改善输入指纹图像的质量,增强脊和谷的对比度,将它变成一幅清晰的点线图,以便于进行特征提取。本文预处理过程主要步骤如下: 图1-2指纹预处理的基本结构 指纹分割是把指纹的背景区域从图像中分离出去,减少对指纹图像进行处理时的计算量;指纹增强的目的是对输入的噪音较多的灰度图像进行滤波,去除图像中的叉连、断点及模糊不清的部分,得到一幅较清晰的灰度图像;二值化就是把灰度指纹图像变成0-1取值的二值图像,这样就使图像的灰度层次由原来的256级(8-bits)降为2级(1-bits),从而大大减少了需要存储和处理的数据量。由于指纹的特征仅包含在纹线的形状结构中,所以为了提高处理速度和识别精度,应该在不破坏图像连通性的情况下去掉多余的信息,也就是进行图像的细化。细化是指删除指纹纹线的边缘像素,使之只有一个像素宽度。细化时应保持纹线的连接性、方向性以及特征点位置不变,还应保持纹线的中心基本不变。 1.1.2特征提取 由于指纹通常是用按压的方式得到的,按压位置和方向的不同、手指的状况以及皮肤的形变等都会导致指纹图像不理想。因此,采集到的指纹灰度图像不宜直接用来匹配,

人脸识别主要算法原理doc资料

人脸识别主要算法原 理

人脸识别主要算法原理 主流的人脸识别技术基本上可以归结为三类,即:基于几何特征的方法、基于模板的方法和基于模型的方法。 1. 基于几何特征的方法是最早、最传统的方法,通常需要和其他算法结合才能有比较好的效果; 2. 基于模板的方法可以分为基于相关匹配的方法、特征脸方法、线性判别分析方法、奇异值分解方法、神经网络方法、动态连接匹配方法等。 3. 基于模型的方法则有基于隐马尔柯夫模型,主动形状模型和主动外观模型的方法等。 1. 基于几何特征的方法 人脸由眼睛、鼻子、嘴巴、下巴等部件构成,正因为这些部件的形状、大小和结构上的各种差异才使得世界上每个人脸千差万别,因此对这些部件的形状和结构关系的几何描述,可以做为人脸识别的重要特征。几何特征最早是用于人脸侧面轮廓的描述与识别,首先根据侧面轮廓曲线确定若干显著点,并由这些显著点导出一组用于识别的特征度量如距离、角度等。Jia 等由正面灰度图中线附近的积分投影模拟侧面轮廓图是一种很有新意的方法。 采用几何特征进行正面人脸识别一般是通过提取人眼、口、鼻等重要特征点的位置和眼睛等重要器官的几何形状作为分类特征,但

Roder对几何特征提取的精确性进行了实验性的研究,结果不容乐观。 可变形模板法可以视为几何特征方法的一种改进,其基本思想是:设计一个参数可调的器官模型(即可变形模板),定义一个能量函数,通过调整模型参数使能量函数最小化,此时的模型参数即做为该器官的几何特征。 这种方法思想很好,但是存在两个问题,一是能量函数中各种代价的加权系数只能由经验确定,难以推广,二是能量函数优化过程十分耗时,难以实际应用。基于参数的人脸表示可以实现对人脸显著特征的一个高效描述,但它需要大量的前处理和精细的参数选择。同时,采用一般几何特征只描述了部件的基本形状与结构关系,忽略了局部细微特征,造成部分信息的丢失,更适合于做粗分类,而且目前已有的特征点检测技术在精确率上还远不能满足要求,计算量也较大。 2. 局部特征分析方法(Local Face Analysis) 主元子空间的表示是紧凑的,特征维数大大降低,但它是非局部化的,其核函数的支集扩展在整个坐标空间中,同时它是非拓扑的,某个轴投影后临近的点与原图像空间中点的临近性没有任何关系,而局部性和拓扑性对模式分析和分割是理想的特性,似乎这更符合神经信息处理的机制,因此寻找具有这种特性的表达十分重要。基于这种考虑,Atick提出基于局部特征的人脸特征提取与识

相关主题
文本预览
相关文档 最新文档