当前位置:文档之家› 模式识别及其在图像处理中的应用_张新峰

模式识别及其在图像处理中的应用_张新峰

模式识别及其在图像处理中的应用_张新峰
模式识别及其在图像处理中的应用_张新峰

收稿日期:2004-01-05基金项目:国家自然科学基金资助项目(60301003,60227101)作者简介:张新峰(1974—),山东宁津人,在读博士,主要研究方

向为智能化信息处理。

文章编号:1000-8829(2004)05-0028-05

模式识别及其在图像处理中的应用

Pattern Recognition and Its Application in Image Processin g

(北京工业大学信号与信息处理研究室,北京 100022) 张新峰,

沈兰荪

摘要:随着计算机和人工智能技术的发展,模式识别在图像处理中的应用日益广泛。综述了模式识别在图像处理中特征提取、主要的识别方法(统计决策法、句法识别、模糊识别、神经网络)及其存在的问题,并且对近年来模式识别的新进展———支持向量机与仿生模式识别做了分析和总结,最后讨论了模式识别亟待解决的问题并对其发展进行了展望。关键词:模式识别;图像处理;特征提取;识别方法中图分类号:T P391文献标识码:A

A bstract :With the development of computer and artificial intelli -gence ,pattern recognition is w idely used in the image processing in -creasing ly .T he feature extraction and the main methods of pattern recognition in the image processing ,w hich include statistical deci -sion ,structural method ,fuzzy method ,artificial neural netw ork are summarized .T he suppor t vecto r and bionic pattern recog nition w hich are the new developments o f the pattern recognition are also analyzed .At last ,the problems to be solved and development trends are discussed .

Key words :pattern recognition ;image processing ;feature extrac -tion ;recog nition methods 模式识别诞生于20世纪20年代,随着计算机的出现和人工智能的发展,模式识别在60年代初迅速发展成一门学科。它所研究的理论和方法在很多学科和领域中得到广泛的重视,推动了人工智能系统的发展,扩大了计算机应用的可能性。图像处理就是模式识别方法的一个重要领域,目前广泛应用的文字识别(OCR )就是模式识别在图像处理中的一个典型应用。

1 模式识别的基本框架[1~3]

模式识别在不同的文献中给出的定义不同。一般认为,模式是通过对具体的事物进行观测所得到的具有时间与空间分布的信息,模式所属的类别或同一类中模式的总体称为模式类,其中个别具体的模式往往称为样本。模式识别就是研究通过计算机自动地(或者人为进行少量干预)将待识别的模式分配到各个模式类中的技术。模式识别的基本框架如图1所示。

图1 模式识别的基本框架

根据有无标准样本,模式识别可分为监督识别方法和非监督识别方法。监督识别方法是在已知训练样本所属类别的条件

下设计分类器,通过该分类器对待识样本进行识别的方法。如图1,标准样本集中的样本经过预处理、选择与提取特征后设计分类器,分类器的性能与样本集的大小、分布等有关。待检样本经过预处理、选择与提取特征后进入分类器,得到分类结果或识别结果。非监督模式识别方法是在没有样本所属类别信息的情况下直接根据某种规则进行分类决策。应用于图像处理中的模式识别方法大多为有监督模式识别法,例如人脸检测、车牌识别等。无监督的模式识别方法主要用于图像分割、图像压缩、遥感图像的识别等。

模式识别过程可以看作从样本空间到类别空间的一个映射过程。如果把一个具有n 个特征作为参量的n 维特征空间划分为不同的区域,那么每个区域与一类模式类相对应。其中,特征选择与提取是模式识别的一个重要环节,如果所选取的特征能够比较全面反映类的本质特征,那么分类器就比较容易设计;否则,分类器设计的难度就增加。因此特征选择和提取是模式识别研究的一项重要内容。

2 特征提取和特征选择[1~2]

原始样本往往处于一个高维空间,特征提取指的是通过映射的方法用低维空间来表示样本的过程。特征提取后样本的可分性应该更好,分类器更易设计。常用的方法有主元分析法(PCA )、线性判别分析、核函数主元分析(Kernel PCA )、独立主元分析法(ICA )、自组织映射(SO M )方法等。文献[2]对上述方法的性质进行了详细的比较,并指出各种方法适合解决的问题。特征提取在图像处理(例如图像分割、图像识别、图像检索等)中得到了广泛的应用,文献[8]采用K ernel PCA 方法进行人脸识别,结果表明比直接的特征脸方法获得更小的错识率。在人脸识别或人脸认证中,文献[9~11]采用了DCT 变换降低原始特

征的维数后进一步利用DCT变换的一些系数作为特征向量进行识别。另外在图像压缩中也广泛应用到DCT变换以去除图像的空间冗余。文献[12]综述了字符识别中的各种特征提取方法的性质,并指出字符特征提取方法的选择与具体的识别系统有关,只有在大数据样本集的情况下测试各种方法才能选出最优的特征提取方法。文献[13]采用基于分型的特征提取方法对手写签名进行识别。

以上文献均说明,不同的模式识别问题特征差别可能很大,因而特征提取方法也不尽相同。每一种特征提取方法只适合解决某些特定范围的问题,例如对于服从高斯型分布的线性相关特征,采用PCA方法比较好,用其他方法提取特征结果可能不是“最优”。特征提取的优劣要根据一定的判据来衡量,由于模式识别中没有一个统一的衡量特征优劣的判据,所谓的最优是在特定准则下取得的,是相对的最优。

特征提取后的各个特征的物理意义有时不是很直观,往往很难看出各个特征对分类的影响,有的特征可能无助于分类器的设计,甚至会降低分类器的性能。因此要在这些特征中选出最适合分类器设计的特征。换句话说,特征选择就是从一组特征D中挑选出一些对分类最有效特征d(D>d)的过程。实际中特征选择和提取往往结合使用。

为了判断提取和选择的特征对分类的有效性,人们提出各种衡量特征分类性能的判据。最直接最有效的判据是计算分类器错误概率,但一般情况下,错误概率的计算很复杂,有时甚至无法计算。因此人们提出一些其他的判据。最简单的判据是用于可分性判据的类内类间距离判据,其基本原则是类内距离最小、类间距离最大的特征为最优特征。一方面,这一判据物理意义明显,计算方便,但是距离的定义不同,得到的特征不同;另一方面,它和概率分布没有直接关系。为此人们提出基于概率分布的可分性判据(例如Bhattacharyya距离、Chernoff界限、散度),这类判据计算比较复杂,也很难得到和错误概率的直接解析关系式。另外还有基于熵函数的可分性判据等,这些判据在特征提取中都得到了广泛的应用。

选定可分性判据后,通过穷举法可以得到特征选择的最优解,但是当特征个数比较多时,这种方法由于计算量太大而难以实现。常用的方法有分支和定界(branch and bound)算法、顺序前进法(SF S,sequential forward selection)、顺序后退法(SBS,se-quential backw ard selection)等,相对于穷举法,这些方法都不同程度地减小了计算量,但是都不能保证得到最优解,往往得到的是次优解。由于特征选择是在进行相应的特征组合后判断其分类能力的,因此可以采用解决优化问题的方法来解决。常用的算法如遗传算法、模拟退火算法,但它们计算都比较复杂。

以上提到的判据在大多情况下和错误概率没有直接关系,用以这些度量为基础的某个判据的最优化对特征进行变换后所设计的分类器的错误概率未必最小;同一个问题特征采用的判据不同得到最优解也不完全相同;此外,特征选择结果的可靠性和训练样本个数有关[2]。如果样本个数太少,根据某种判据得出的最优解和实际的最优特征有时差别很大,这是因为训练样本集中包含的分类信息不足。由此可见,选择最优特征需要具备3个条件:样本个数足够能够覆盖样本集的分类信息;有一种比较好的分类判据;一个切实可行的选择算法。实际中,这3个条件很难完全满足。因此,针对具体的模式识别问题选择最优特征仍是一件比较困难的事,这些问题仍需要进一步的研究。

提取和选择特征之后,分类和识别效果的优劣取决于所设计的分类器的性质。设计分类器的主要方法也就是模式识别的主要方法。

3 模式识别的主要方法及其在图像处理中的应用

模式识别方法大致可以分为4类:统计决策法、结构模式识别方法、模糊模式识别方法与基于人工智能方法。其中基于人工智能的方法本文主要介绍人工神经网络模式识别方法。前两种方法发展得比较早,理论相对也比较成熟,在早期的模式识别中应用较多。后两种方法目前的应用较多,由于模糊方法更合乎逻辑、神经网络方法具有较强的解决复杂模式识别的能力,因此日益得到人们的重视。

3.1 统计决策法[1~5,14]

统计决策法以概率论和数理统计为基础,它包括参数方法和非参数方法。

参数方法主要以Bayes决策准则为指导。其中最小错误率和最小风险贝叶斯决策是最常用的两种决策方法。假定特征对于给定类的影响独立于其他特征,在决策分类的类别N已知与各类别的先验概率P(ωi)及类条件概率密度p(xωi)已知的情况下,对于一特征矢量x根据式(1)计算待检模式在各类中发生的后验概率P(ωi x),后验概率最大的类别即为该模式所属类别。在这样的条件下,模式识别问题转化为一个后验概率的计算问题。

P(ωi|x)=

p(x|ωi)P(ωi)

∑N

i=1

p(x|ωi)P(ωi)

(1)

在贝叶斯决策的基础上,根据各种错误决策造成损失的不同,人们提出基于贝叶斯风险的决策,即计算给定特征矢量x 在各种决策中的条件风险大小,找出其中风险最小的决策。

实际上对于具体的模式识别问题,先验概率和类条件概率密度很难精确知道。先验概率根据样本总数可大致估计,类条件概率密度可采用统计学中的最大似然估计法、Bayes估计法等进行估计。这类方法应用于图像分割、图像复原以及图像识别等方面。在图像分割中,假定图中的数据是服从K个概率密度混合分布的样本,然后估计概率密度函数的参数,最后计算后验概率或风险,对像素进行归类,从而达到分割图像的目的。一般情况下,往往假定概率密度函数是高斯型的,这一方面很多情况下样本的分布接近高斯分布,另一方面是数学上处理相对比较简单。和图像分割的原理类似,图像识别也是对图像的某些特征采用贝叶斯决策的方法设计分类器,根据分类器对未知图像的特征进行识别。

参数估计方法的理论基础是样本数目趋近于无穷大时的渐进理论。在样本数目很大时,参数估计的结果才趋近于真实的模型。然而实际样本数目总是有限的,很难满足这一要求。另外参数估计的另一个前提条件是特征独立性,这一点有时和实际差别较大。

实际上在样本数量不是很大的情况下,往往根据样本直接

设计分类器,这就是非参数方法。这类方法物理意义直观,但所得的结果和错误率往往没有直接联系,所设计的分类器不能保证最优。比较典型的方法如线性分类器、最近邻方法、K均值聚类法等。在图像压缩领域的矢量量化编码算法中,码书的训练就是一个典型的聚类过程,压缩的效果和聚类的结果关系很大。在图像分割中,采用对像素或图像的其他特征进行聚类,达到图像分割的目的。

然而,统计决策理论主要集中在数量的统计关系上而忽略了刻画模式的结构特征。图像处理往往与图像的结构信息有关,对于很复杂的图像,要求的特征量非常巨大,要把某一模式准确分类很困难,这时采用统计分类方法很难实现,因此设法分割出图像的基元子模式,将基元按照一定句法关系组合来代替原图像进行分类,这就涉及到结构模式识别的问题。

3.2 结构模式识别[1~5]

结构模式识别是利用模式的结构描述与句法描述之间的相似性对模式进行分类。每个模式由它的各个子部分(称为子模式或模式基元)的组合来表示。对模式的识别常以句法分析的方式进行,即依据给定的一组句法规则来剖析模式的结构。当模式中每一个基元被辨认后,识别过程就可通过执行语法分析来实现。选择合适的基元是结构模式识别的关键。

基元应具有“结构简单、含义明确、能方便地描述数据、易于抽取、结构信息少”等特点。由于基元选择的不确定性以及基元特征的多样性,实际应用中有时很难同时满足以上特点,所以有必要在基元的复杂性和易识别性之间取一个恰当的折衷。

结构模式识别主要用于文字识别、遥感图形的识别与分析、纹理图像的分析中。该方法的特点是识别方便,能够反映模式的结构特征,能描述模式的性质,对图像畸变的抗干扰能力较强。如何选择基元是本方法的一个关键问题,尤其是当存在干扰及噪声时,抽取基元更困难,且易失误。

基于统计决策和结构模式识别在早期的模式识别中应用比较多,随着人们对模式识别要求的提高,在解决一些复杂的模式识别问题时,上述方法的局限性越来越明显。模糊逻辑思想和神经网络的提出,为人们解决模式识别问题提供了新的思路。3.3 模糊模式识别[15~19]

1965年Z adeh提出了他著名的模糊集理论,使人们认识事物的传统二值0,1逻辑转化为[0,1]区间上的逻辑,这种刻画事物的方法改变了人们以往单纯地通过事物内涵来描述其特征的片面方式,并提供了能综合事物内涵与外延性态的合理数学模型———隶属度函数。对于A、B两类问题,传统二值逻辑认为样本C要么属于A,要么属于B,但是模糊逻辑认为C既属于A,又属于B,二者的区别在于C在这两类中的隶属度不同。所谓模糊模式识别就是解决模式识别问题时引入模糊逻辑的方法或思想。同一般的模式识别方法相比较,模糊模式识别具有客体信息表达更加合理,信息利用充分,各种算法简单灵巧,识别稳定性好,推理能力强的特点。

模糊模式识别在图像处理中也被广泛应用,文献[15]还将模糊K近邻(FK N N)方法用于盲图像的反卷积,实验结果证明了这种方法的有效性;文献[16]将模糊技术同K均值聚类结合用于矢量量化编码中,这种方法消除了聚类初始化对结果码书的依赖性,提高了聚类结果的鲁棒性;文献[17]将模糊方法同K 近邻(K-N N)结合,对图像进行分类,取得比传统K-N N方法更好的效果。文献[18]将模糊逻辑同BP神经网络相结合对手写字符识别,取得接近100%的效果。文献[19]将模糊方法运用到图像增强中,首先通过模糊隶属度函数对原始图像做模糊变换,然后对变换后的图像做增强处理,以提高图像的对比度。尔后对图像做模糊逆变换,得到增强后的图像。以上方法在获得比较好的效果的同时,往往增加一定的计算量,但是有些算法本身比较简单,在同其他算法的结合中,模糊思想运用引入的计算开销有时同整个算法的计算量相比并不大,计算速度通常是可以接受的。

模糊模式识别的关键在隶属度函数的建立,目前主要的方法有模糊统计法、模糊分布法、二元对比排序法、相对比较法和专家评分法等。虽然这些方法具有一定的客观规律性与科学性,但同时也包含一定的主观因素,准确合理的隶属度函数很难得到,如何在模糊模式识别方法中建立比较合理的隶属度函数是需要进一步解决的问题。

3.4 人工神经网络模式识别[20~27]

早在20世纪50年代,研究人员就开始模拟动物神经系统的某些功能,他们采用软件或硬件的办法,建立了许多以大量处理单元为结点,处理单元间实现(加权值的)互联的拓扑网络,进行模拟。称之为人工神经网络。这种方法可以看作是对原始特征空间进行非线性变换,产生一个新的样本空间,使得变换后的特征线性可分。同传统统计方法相比,其分类器是与概率分布无关的。

人工神经网络的主要特点在于其具有信息处理的并行性、自组织和自适应性、具有很强的学习能力和联想功能以及容错性能等,在解决一些复杂的模式识别问题中显示出其独特的优势。近年来,在图像处理中应用也很多。文献[20]采用自组织网络对医学图像进行分割,并能够将CT图像中的病灶分割出来。文献[21]~[27]介绍了利用各种神经网络方法识别图像的情况,取得一些令人满意的结果。

人工神经网络是一种复杂的非线性映射方法,其物理意义比较难解释,在理论上还存在一系列亟待解决的问题。例如在设计上,网络层数的确定和节点个数的选取带有很大的经验性和盲目性,缺乏理论指导,网络结构的设计仍是一个尚未解决的问题。在算法复杂度方面,神经网络计算复杂度大,在特征维数比较高时,样本训练时间比较长;在算法稳定性方面,学习过程中容易陷入局部极小,并且存在欠学习与过学习的现象,范化能力不容易控制。这些也是制约人工神经网络进一步发展的关键问题。

近些年来基于统计学习理论的支撑向量机在模式识别方法表现出出色的学习性能和范化能力,同神经网络相比,其可有效地克服局部极小、维数灾难等问题,因而成为目前模式识别领域中又一个研究热点。

4 模式识别的新进展及其在图像处理中的应用

4.1 支撑向量机[28~42]

前面提到,在有限样本尤其是小样本的情况下,采用统计决策法中的很多方法都难以取得理想的效果。Vapnik早在20世纪60年代开始研究有限样本情况下的机器学习问题,直至90

年代才形成一个较完善的理论体系———统计学习理论。该理论定义了衡量函数集性能的指标———VC 维

[28]

,V C 维越大,函数

的推广能力越差,VC 维越小,函数的推广能力越强。在该理论的框架下,经验风险最小化原则下学习机器的实际风险由两部分组成

R (w )≤R emp (w )+ (n

h

)

式中第一项为训练样本的经验风险;第二项为置信范围,在训练样本数目n 一定的情况下,函数集的V C 维越大,其置信范围越大。因此,在设计分类器时,不但要使经验风险最小,同时也要使VC 维尽量小,缩小置信范围,从而提高分类器的预测能力。统计学习理论提出了结构风险最小化的原则:即把函数集分解为一个函数集序列,使各个子集能够根据VC 维的大小排列,在每个子集中寻找最小经验风险。选择最小经验风险和置信范围之和最小的子集,即达到期望风险最小,这个子集中使期望风险最小的函数也即所求的最优函数。这种思想称为结构风险最小化SRM (structural risk minimization ),如图2所示

图2 结构风险最小化示意图

实现结构风险最小化有两种方法:一是在函数集的每一子集中求最小经验风险,然后选择最小经验风险和置信范围最小的子集。这种方法类似穷举法,计算量比较大,当子集数目很大时几乎无法实现。另一种方法是设计函数集的某种结构,使每个子集中都能取得最小的经验风险,然后选择适当的子集使置信范围最小,这个子集中使经验风险最小的函数就是最优函数。

支撑向量机SVM (suppo rt vector machine )是结构风险最小化的第二种实现方法的体现。其基本思想是:首先通过非线性变换将输入空间变换到一个高维空间,甚至是一个无限维空间,然后在这个高维空间求取最优分类面,其中非线性变换是通过核函数的方法来实现的。SV M 方法通过内积计算比较有效地解决了维数灾难问题,通过在高维空间设计最优分类面,比较好地实现了VC 维最小的问题;在数学上支撑向量机的训练问题可转化为一个求解受约束的二次型规划(QP )问题,这个问题存在惟一解,避免了神经网络训练结果不稳定、容易陷入局部极小的问题,因而SV M 方法是一种比较好的模式识别方法。

SV M 最初用来解决两类问题,表现出优越的性能,一个很自然的想法就是将其推广到多类识别问题。多类SVM 的分类和识别主要有两种方法,一是根据多类样本集直接设计分类器,此时分类器的设计问题可转化为一个考虑所有样本的优化问

题。在样本比较多时,这种方法求解比较复杂;另一种是分解法,将多类样本分类器的设计转化为多个两类问题的分类器设

计问题,由于这类方法比直接法求解简单,在实际中应用很广。比较有代表性的训练和预测多类SV M 的方法有一对一OA O (o ne against one )、一对多OAA (one against all )和有向无回路图DAG (directed acy clic g raph )方法和决策树(decisiv e tree )方法[35]等。SVM 的优越性能引起人们极大的研究兴趣,它被越来越多的图像处理研究者和工作者所应用。文献[30]~[33]、[36~40]介绍了SV M 的应用情况。由于SVM 的范化能力比较好,因而常常获得比其他方法更好的识别效果。4.2 仿生模式识别[41~43]

前面介绍的各种模式识别方法都是假定分类信息是完全包含在训练样本内,以两类或多类样本的最优划分为基础,分类器的训练过程实际上可以看作对样本的划分过程。文献[43]提出把模式识别问题看成是模式的“认识”,而不是分类划分,不是模式分类;是一类一类样本的“认识”,而不是多类样本的划分。为了强调与传统模式识别在概念上的不同,文献[41]中采用“仿生模式识别”这一概念,“仿生”的含义只是在模式识别的功能和数学模型上强调了“认识”的概念,更接近于人类的认识。

传统模式识别从特征空间中不同类样本的划分出发设计分类器。而仿生模式识别就在引入特征空间同类样本的连续性规律,对一类事物的“认识”,实际上是对这类事物的全体在特征空间中形成的无穷点集合的“形状”的分析和认识,文中根据这种规律性建立起“多维空间中非超球复杂几何形体覆盖”的识别原理。文献[42]根据这一思想,采用神经网络覆盖的方法训练样本,对8种实物模型进行训练与识别,取得了比较好的识别效果,全部识别样本没有一次误识。文献[43]基于仿生模式识别的多镜头人脸身份确认系统研究中,采用多权值神经网络算法,同样得到比较好的识别率。这种高的识别率显示了这一思想在模式识别方面的潜力。

仿生模式识别提出了一种新的模式识别思想,为模式识别的研究开辟了一个崭新的研究方向。文献[41~43]采用神经网络覆盖来实现该思想,不可避免地遇到训练速度慢、网络结构参数、节点个数选择等选择问题,因此这种思想的实现模型有待于进一步的研究。

以上的各种模式识别方法都有其特点和适用范围。研究表明,不同的分类器错误率所覆盖的范围不同,多个分类器之间既存在一定的冗余性,同时也存在一定的信息互补性。多个分类器联合应用,可以提高正确识别率。文献[44]对多种分类器联合的最终决策的多种方法进行了分析和比较,并且给出了各种决策方法的适用条件。文献[45]采用了7个分类器,用模式识别中常用的不同数据集对每一个分类器单独做实验,然后根据各自的结果对分类器进行组合决策,从中选出效果最优的组合作为最终分类器的组合,结果表明这种识别效果比较理想。当然,这种方法提高识别率的同时,牺牲了一部分计算代价。模式识别发展到今天,已经提出了200多种[46]分类和识别方法,如何进行已有分类器的组合,解决具体的模式识别问题也是一个值得注意的问题。

5 展望

随着计算机和人工智能技术的发展,人们对计算机图像处

理中自动处理图像的要求越来越高,因此对模式识别技术提出更高的要求。到目前为止,虽然模式识别在图像处理中的应用取得了一些可喜的成就,但是它还存在一系列亟待解决问题,例如支撑向量机中核函数的选择问题、VC维的计算和估计问题,神经网络节点选择和结构设计问题、仿生模式识别新思想的建模和实现问题、多种方法综合运用中的分类器选择问题等,这些问题的解决将直接推动模式识别领域的发展,进而推动其在图像处理领域的应用。

同时,模式识别是一门综合性学科,它涉及和利用到数学、计算机科学等多学科的知识,如何将这些学科的新方法新成就综合应用到模式识别中,提出更加符合人类认识的识别方法也是进一步值得研究的问题。

参考文献:

[1] 边肇祺,张学工,等.模式识别(第二版)[M].北京:清华大学出版

社,2000-01.

[2] Jain A K,Duin Robert P W,M ao Jianchang.S tatistical pattern recog-

nition:areview[J].IEEE Trans actions on pattern analysis and ma-chine intelligence,2000,22(1):4-37.

[3] Kanal L.Pattern in pattern actions recognition:1968-1974[J].IEEE

Transon IT,1974,20(6):697-722.

[4] 沈清,汤森.模式识别导论[M].长沙:国防科技大学出版社,1991.

[5] 戚飞虎.模式识别与图象处理[M].上海:上海科学技术出版社,

1989.

[6] 吴传孙.汽车牌照自动识别技术研究[D].江西师范大学,2003.

[7] 黄宁.遥感图像中模式分类技术的研究[D].中国科学院,2003.

[8] Yang M H,Ahuja N.Kriegman D.Face recognition using kernel

eigenfaces[A].IEEE International Conference on Image Process ing,

2000-01:37-40.

[9] Zobel M,Gebhard A,Paulus D,et al.Robust facial feature localization

by coupled features,Proceedings[A].Fourth IEEE International Con-ferenceon Automatic Faceand Gesture Recognition,2000-03:2-7.

[10] Kohir V V,Desai U B.Face recognition[A].IEEE International

Sympos iumon Circuits and Systems,2000-05:305-308. [11] Sanderson C,Paliwal K K.Fast feature extraction method for robust

face verification[J].Electronics Letters,2002,38(25).

[12] ivind Due Trier,Anil K.Jain,Torfinn Tax t.Featu re extraction

methods for character recognition———a survey[J].Pattern Recogni-

tion,1996,29(4):641-662.

[13] Tang Yuan Y,Tao Yu,Lam Ernest C M.New method for feature

extraction based on fractal behavior[J].Pattern Recognition,2002,

55(5):1071-1081.

[14] 苏芳,洪文,等.贝叶斯融合在SAR图像分类中的应用[J].电子

学报,2003,31(7):1107-1101.

[15] Chen Li,Yap Kim-Hui.A fuzzy K-nearest-neighbor algorithm to

blind image deconvolution[A].IEEE International Conference on

Systems,M an and Cybernetics,2003-03:2049-2054. [16] Karayiannis N B,Pai P I.Fuzzy vector quantization algorithms and

their application in image comp res sion[J].IEEE T ransactions on Im-

age Processing,1995,4(9):1193-1201.

[17] Han J H,Kim Y K.A fuzzy K-NN algorithm using w eights from the

variance of membership values[A].IEEE Computer Society Conference

on Computer Vis ion and Pattern Recognition,1999-02:394-399. [18] Hanmandlu M,M ohan K R M,Chakraborty S.Fuzzy logic based

handw ritten character recognition[A].International Conference on

Image Proces sing,2001-03:42-45.

[19] 朱俊株,郭立,王宁.一种基于模糊增强的图像分割方法[J].微机

发展,1999,(6):33-35.

[20] 杜干,孙肖子.医学图像分割的神经网络方法[J].西安电子科技

大学学报,1998,25(5):602-605.

[21] M aciel B D,Peters R A.A comparison of neural and statistical tech-

niques in object recognition[A].IEEE International Conference on

Systems,M an and Cybernetics,2000-04:2833-2838.

[22] Koffi R,Sol aiman B,Mouchot M C.Contribution of Canny-Deriche filter

and artificial neural networks to image segmentati on[A].IEEE Worl d

Congress on Computational Intelligence,1994-6:4044-4048. [23] Liang M in,M a Qiu-M ing,Xu Guo-Dong.A new neural netw ork

m odel for image segmentation[A].Proceedings of the I EEE1994

National Aerospace and Electronics Conference,1994-02:791-

794.

[24] Reddick W E,Glass J Q,Cook E N,et al.Automated s egmentation

and classification of multispectral m agnetic res onance images of brain

using artificial neural netw orks[J].IEEE T ransactions on M edical

Imaging,1997,16(6):911-918.

[25] Bao Pao,W ang Dianhui.Edge-preserving neural netw ork model for

image restoration[A].Proceeding of the First International w orkshop

on.Image and S ignal Processing and Anal ysis,2000:29-34. [26] Fadzil M A Ahmad,Bakar H Abu.Human face recognition using neu-

ral networks[A].Proceedings of IEEE International Conference on

Image Process ing,1994-03:936-939.

[27] 王爱民,赵忠旭,沈兰荪.中医舌像自动分析中舌色、苔色分类方

法的研究[J].北京生物医学工程,2000,19(3):136-142. [28] 统计学习理论的本质[M].张学工,译.北京:清华大学出版社,

2000.

[29] 范昕炜.支持向量机算法的研究及其应用[D].浙江大学,2003.

[30] 孙丽华.中文文本自动分类的研究[D].哈尔滨工程大学,2002.

[31] Guo Guodong,Li S Z,C han Kapluk.Face recognition by s upport vec-

tor machines[A].Proceedings of Fourth IEEE International Confer-

ence on Automatic Face and Gesture Recognition,2000,196-201.

[32] 吴艳冬.复杂背景的人脸检测与定位[D].大连理工大学,2002.

[33] Zhao Bin,Liu Yong,Xia S hao-Wei.Support vector machine and its

appl ication in handw ritten numeral recognition[A].Proceedings of

15th International Conference on Pattern Recognition,2000-02.

[34] Hsu Chinw ei,Lin C hinJen.A comparison of M ethods for M ulti-class

Support Vector M achines[EB/OL].http://ww w.csic.ntu.cdu.tw/

cjlin/papcrs.html.

[35] 卫保国,王爱民,沈兰荪.一种新的多类模式识别支撑矢量机[J].

模式识别与人工智能,2002,15(2):178-181.

[36] Shen Lansun,Wei Baoguo,Cai Yiheng,et al.Image analysis for

tongue characterization[J].Chinese Journal of Electronics,2003,12

(3):317-323.

[37] 沈兰荪,等.中医舌象分析技术的研究[J].世界科学技术-中医

药现代化,2003,5(1):15-19.

[38] 沈兰荪,王爱民,卫保国,等.图像分析技术在舌诊客观化中的应

用[J].电子学报,2001,29(12A):1762-1765.

[39] 王爱民.用于舌诊客观化的图像分析技术的研究[D].北京工业

大学,2001.

[40] Osuna E,Freund R,Girosit F.Training support vector machines:an

application to face detection[A].Proceedings of IEEE Computer So-

ciety Conference on Computer Vision and Pattern Recognition,1997.

[41] 王守觉.仿生模式识别(拓扑模式识别)———一种模式识别新模型

的理论与应用[J].电子学报,2002,30(10):1417-1420. [42] 王守觉,徐健,王宪保,等.基于仿生模式识别的多镜头人脸身份

确认系统研究[J].电子学报,2003,31(1):1-3.

[43] 王宪保.基于仿生模式识别的人脸身份确认研究[D].浙江工业

大学,2003-05.

[44] Kittler J,Hatef M,Duin R P W,and M atas J.On combining classi-

fiers[J].IEEE Trans.Pattern Analysis and M achine Intelligence,

1998,20(3):226-239.

[45] Corona-Nakamu ra M A,Ruelas R.Im proving cl ass ification with auto-

mated s election of a combined cl ass ifier[A].Proceedings of the5th

Biannual,2002,13:443-448.

[46] Raudys S J,Jain A L.Small s ample size effects in statistical pattern

recognition:recommendations for practitioners[J].IEEE Transac-

tions on pattern analysis and machine intelligence,1991,13(3).◆

计算机视觉与图像处理、模式识别、机器学习学科之间的关系

计算机视觉与图像处理、模式识别、机器学习学科之间的关系 在我的理解里,要实现计算机视觉必须有图像处理的帮助,而图像处理倚仗与模式识别的有效运用,而模式识别是人工智能领域的一个重要分支,人工智能与机器学习密不可分。纵观一切关系,发现计算机视觉的应用服务于机器学习。各个环节缺一不可,相辅相成。 计算机视觉(computer vision),用计算机来模拟人的视觉机理获取和处理信息的能力。就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,用电脑处理成为更适合人眼观察或传送给仪器检测的图像。计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。计算机视觉的挑战是要为计算机和机器人开发具有与人类水平相当的视觉能力。机器视觉需要图象信号,纹理和颜色建模,几何处理和推理,以及物体建模。一个有能力的视觉系统应该把所有这些处理都紧密地集成在一起。 图像处理(image processing),用计算机对图像进行分析,以达到所需结果的技术。又称影像处理。基本内容图像处理一般指数字图像处理。数字图像是指用数字摄像机、扫描仪等设备经过采样和数字化得到的一个大的二维数组,该数组的元素称为像素,其值为一整数,称为灰度值。图像处理技术的主要内容包括图像压缩,增强和复原,匹配、描述和识别3个部分。常见的处理有图像数字化、图像编码、图像增强、图像复原、图像分割和图像分析等。图像处理一般指数字图像处理。 模式识别(Pattern Recognition)是指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。模式识别又常称作模式分类,从处理问题的性质和解决问题的方法等角度,模式识别分为有监督的分类(Supervised Classification)和无监督的分类(Unsupervised Classification)两种。模式还可分成抽象的和具体的两种形式。前者如意识、思想、议论等,属于概念识别研究的范畴,是人工智能的另一研究分支。我们所指的模式识别主要是对语音波形、地震波、心电图、脑电图、图片、照片、文字、符号、生物传感器等对象的具体模式进行辨识和分类。模式识别研究主要集中在两方面,一是研究生物体(包括人)是如何感知对象的,属于认识科学的范畴,二是在给定的任务下,如何用计算机实现模式识别的理论和方法。应用计算机对一组事件或过程进行辨识和分类,所识别的事件或过程可以是文字、声音、图像等具体对象,也可以是状态、程度等抽象对象。这些对象与数字形式的信息相区别,称为模式信息。模式识别与统计学、心理学、语言学、计算机科学、生物学、控制论等都有关系。它与人工智能、图像处理的研究有交叉关系。 机器学习(Machine Learning)是研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎。机器学习在人工智能的研究中具有十分重要的地位。一个不具有学习能力的智能系统难以称得上是一个真正的智能系统,但是以往的智能系统都普遍缺少学习的能力。随着人工智能的深入发展,这些局限性表现得愈加突出。正是在这种情形下,机器学习逐渐成为人工智能研究的核心之一。它的应用已遍及人工智能的各个分支,如专家系统、自动推理、自然语言理解、模式识别、计算机视觉、智能机器人等领域。机器学习的研究是根据生理学、认知科学等对人类学习机理的了解,建立人类学习过程的计算模型或认识模型,发展各种学习理论和学习方法,研究通用的学习算法并进行理论上的分析,建立面向任务的具有特定应用的学习系统。这些研究目标相互影响相互促进。

机器视觉与图像处理方法

图像处理及识别技术在机器人路径规划中的一种应用 摘要:目前,随着计算机和通讯技术的发展,在智能机器人系统中,环境感知与定位、路径规划和运动控制等功能模块趋向于分布式的解决方案。机器人路径规划问题是智能机器人研究中的重要组成部分,路径规划系统可以分为环境信息的感知与识别、路径规划以及机器人的运动控制三部分,这三部分可以并行执行,提高机器人路径规划系统的稳定性和实时性。在感知环节,视觉处理是关键。本文主要对机器人的路径规划研究基于图像识别技术,研究了图像处理及识别技术在路径规划中是如何应用的,机器人将采集到的环境地图信息发送给计算机终端,计算机对图像进行分析处理与识别,将结果反馈给机器人,并给机器人发送任务信息,机器人根据接收到的信息做出相应的操作。 关键词:图像识别;图像处理;机器人;路径规划 ABSTRACT:At present, with the development of computer and communication technology, each module, such as environment sensing, direction deciding, route planning and movement controlling moduel in the system of intelligent robot, is resolved respectively. Robot path planning is an part of intelligent robot study. The path planning system can be divided into three parts: environmental information perception and recognition, path planning and motion controlling. The three parts can be executed in parallel to improve the stability of the robot path planning system. As for environment sensing, vision Proeessing is key faetor. The robot path planning of this paper is based on image recognition technology. The image processing and recognition technology is studied in the path planning is how to apply, Robots will sent collected environment map information to the computer terminal, then computer analysis and recognize those image information. After that computer will feedback the result to the robot and send the task information. The robot will act according to the received information. Keywords: image recognition,image processing, robot,path planning

模式识别与图像处理习题及解答

1. 判断题(在题目后面的括号中填入T或F,分别代表正确或错误)。 (1) 灰度直方图是灰度级的函数,描述的是图像中具有该灰度级像素的个数,其纵坐标是灰度级,横坐标是该灰度出现的频率。( F ) (2) 中值滤波是一种线性滤波,它在实际应用中需要图像的统计特性。(F ) (3) 图像经频域变换后其特点是变换结果能量分布向高频成分方向集中,图像上的边缘、线条等信息在低频成分上得到反映。( F ) (4) 观察直方图可以看出不适合的数字化。(T ) 2. 单选题(每题只有一个选项是正确的) (1) 锐化(高通)滤波器的作用:A A 能减弱或削除傅立叶空间的低频分量,但不影响高频分量。 B 能减弱或削除傅立叶空间的高频分量,但不影响低频分量。 C 对傅立叶空间的低、高频分量均有减弱或削除作用。 D 对傅立叶空间的低、高频分量均有增强作用。 (2) 下列说法不正确的是 C A 点运算是对一副图像的灰度级进行变换。 B 线性点运算仅能拉伸或压缩直方图,以及使之左移或右移。 C 点运算可以改变图形内的空间关系。 D 点运算以预定的方式改变一幅图像的灰度直方图。 (3) 在所有颜色模型中,最常用于彩色图像的是:D A GMY B YIQ C HSV D HSI (4) 以下说法正确的是:B A 用数学形态学处理一些图像时,膨胀运算会收缩图像,腐蚀运算会扩大图像。 B 用数学形态学处理一些图像时,开运算和闭运算都可以平滑图像的轮廓。 C 在形态算法设计中,结构元的选择非常重要,它可以在几何上比原图像复杂,且 无界。 D 在形态算法设计中,用非凸子集作为结构元也是可以的。 (5) 数字图像的灰度直方图的横坐标表示:A A 灰度级 B 出现这种灰度的概率 C 像素数 D 像素值 (6) 以下说法正确的是 C A 先膨胀后腐蚀的运算称为开运算。 B 先腐蚀后膨胀的运算称为闭运算。 C 细化是将一个曲线型物体细化为一条单像素宽的线,从而图形化的显示出其拓扑 性质。 D 消除连续区域内的小噪声点,可以通过连续多次使用开闭运算。 (7) 下列描述正确的有 D A 只有傅立叶变换才能够完成图像的频率变换。 B 图像经频域变换后,变换结果是能量分布向高频方向集中,图像上的边缘、线条

上海交通大学图象处理与模式识别专业考研

上海交通大学图象处理与模式识别专业 考研 本学科创建于80年代初,是国内首批有权授予硕士学位、博士学位并设有博士后流动站的重点学科,也是国家“211工程”资助学科。1998年该学科改名为模式识别与智能系统。本学科点的创建人是我国著名图像处理和模式识别专家、美国匹兹堡大学访问学者李介谷教授。他的研究方向是模式识别和计算机视觉。 本学科依托图象处理与模式识别研究所,主要从事数字图象(图形)分析、文本信息处理、模式识别、机器视觉、自然语言理解、智能技术和系统等信息技术领域中前沿性的应用基础研究,具有基于数字信号处理器的硬件开发工具和网络环境下的工作站,个人机及专用的图象输入输出设备。包括序列图像分析,三维图像重构理论及应用,远程医疗和诊断;模式识别和计算机视觉是该学科的一个研究特色,已取得重大研究成果的项目有动态目标识别,字符和人脸识别,机器人视觉;计算机图形学和虚拟现实,多媒体技术和计算可视化;智能中文信息处理,中(英)文全文检索,基于内容的网上检索;人工智能和智能系统,主要从事人工神经网理论及应用,机器学习和推理、智能交通指挥系统等。目前正在进行的科研项目有国家高科技863项目,国家自然科学基金,国家教委博士点科研基金项目。省、部、市重大科技开发和国际合作项目。 模式识别和智能系统学科拥有设备先进的图像工程实验室。1978年恢复招收研究生来,已培养硕士、博士生216名,主要在国内外大学、科研机构和高新技术产业从事教学、科研及高新技术的开发研究工作。该学科有广泛的国际合作和交流,招收国内外访问学者和国外留学生。本学科所从事的研究项目曾多次荣获过国家科技进步一等奖、省部级的奖励,并有着广泛的国际合作和交流。 研究方向 a.数字图象处理 b.计算机模式识别 c.计算机图形学与CAD技术 d.人工智能与专家系统 e.计算机视觉 f.语音识别及机器翻译 g.人工神经网络 h.虚拟现实 i.算法理论与分析 j.网络信息处理 k.文本信息处理 l.网上三维图象重建 m.城市交通监控与管理系统 n.生物信息特征识别 o.网络信息智能处理 p.自然语言理解与人机界面 q.成像光谱技术与遥感 r.三维空间信息处理与分析 s.多媒体与网络信息智能处理 t.智能理论与系统。 本学科依托图象处理与模式识别研究所,主要从事数字图象(图形)分析、文本信息处理、模式识别、机器视觉、自然语言理解、智能技术和系统等信息技术领域中前沿性的应用基础研究,具有基于数字信号处理器的硬件开发工具和网络环境下的工作站,个人机及专用的图象输入输出设备。包括序列图像分析,三维图像重构理论及应用,远程医疗和诊断;模式识别和计算机视觉是该学科的一个研究特色,已取得重大研究成果的项目有动态目标识别,字符和人脸识别,机器人视觉;计算机图形学和虚拟现实,多媒体技术和计算可视化;

数字图像处理的就业前景

数字图像处理的就业前景收藏 最近版上有不少人在讨论图像处理的就业方向,似乎大部分都持悲观的态度。我想结合我今年找工作的经验谈谈我的看法。 就我看来,个人觉得图像处理的就业还是不错的。首先可以把图像看成二维、三维或者更高维的信号,从这个意义上来说,图像处理是整个信号处理里面就业形势最好的,因为你不仅要掌握(一维)信号处理的基本知识,也要掌握图像处理(二维或者高维信号处理)的知识。其次,图像处理是计算机视觉和视频处理的基础,掌握好了图像处理的基本知识,就业时就可以向这些方向发展。目前的模式识别,大部分也都是图像模式识别。在实际应用场合,采集的信息很多都是图像信息,比如指纹、条码、人脸、虹膜、车辆等等。说到应用场合,千万不能忘了医学图像这一块,如果有医学图像处理的背景,去一些医疗器械公司或者医疗软件公司也是不错的选择。图像处理对编程的要求比较高,如果编程很厉害,当然就业也多了一个选择方向,并不一定要局限在图像方向。 下面谈谈我所知道的一些公司信息,不全,仅仅是我所了解到的或者我所感兴趣的,实际远远不止这么多。 搜索方向 基于内容的图像或视频搜索是很多搜索公司研究的热点。要想进入这个领域,必须有很强的编程能力,很好的图像处理和模式识别的背景。要求高待遇自然就不错,目前这方面的代表公司有微软、google、yahoo和百度,个个鼎鼎大名。 医学图像方向 目前在医疗器械方向主要是几个大企业在竞争,来头都不小,其中包括Simens、GE、飞利浦和柯达,主要生产CT和MRI等医疗器材。由于医疗器械的主要功能是成像,必然涉及到对图像的处理,做图像处理的很有机会进入这些公司。它们在国内都设有研发中心,simens 的在上海和深圳,GE和柯达都在上海,飞利浦的在沈阳。由于医疗市场是一个没有完全开发的市场,而一套医疗设备的价格是非常昂贵的,所以在这些地方的待遇都还可以,前景也看好。国内也有一些这样的企业比如深圳安科和迈瑞 计算机视觉和模式识别方向 我没去调研过有哪些公司在做,但肯定不少,比如指纹识别、人脸识别、虹膜识别。还有一个很大的方向是车牌识别,这个我倒是知道有一个公司高德威智能交通似乎做的很不错的样子。目前视频监控是一个热点问题,做跟踪和识别的可以在这个方向找到一席之地。 上海法视特位于上海张江高科技园区,在视觉和识别方面做的不错。北京的我也知道两个公司:大恒和凌云,都是以图像作为研发的主体。 视频方向 一般的高校或者研究所侧重在标准的制定和修改以及技术创新方面,而公司则侧重在编码解码的硬件实现方面。一般这些公司要求是熟悉或者精通MPEG、H.264或者AVS,选择了这个方向,只要做的还不错,基本就不愁饭碗。由于这不是我所感兴趣的方向,所以这方面的公司的信息我没有收集,但平常在各个bbs或者各种招聘网站经常看到。 我所知道的两个公司:诺基亚和pixelworks 其实一般来说,只要涉及到成像或者图像的基本都要图像处理方面的人。比方说一个成像设备,在输出图像之前需要对原始图像进行增强或者去噪处理,存储时需要对图像进行压缩,成像之后需要对图像内容进行自动分析,这些内容都是图像处理的范畴。下面列举一些与图像有关或者招聘时明确说明需要图像处理方面人才的公司:上海豪威集成电路有限公司(https://www.doczj.com/doc/0b17151619.html,)、中芯微、摩托罗拉上海研究院、威盛(VIA)、松下、索尼、清华同方、三星。

图像处理与模式识别实验手册

图像处理与模式识别 实验手册 统计与计算科学系 2012年2月

实验一Matlab图像处理工具箱 实验目的与要求: 1. 回顾Matlab开发环境; 2. 初步熟悉Matlab图像处理工具箱函数。 作业: 在6.28.22:22/download/图像素材下载图像,熟悉图像工具箱中各命令并能完成matlab的基本编程。 实验二BMP位图的读写 实验目的与要求: 1. 初步熟悉VC++6.0开发环境; 2. 了解VC++6.0环境下BMP图像的读写过程,进而了 解BMP图像的文件结构。 作业: 在 6.28.22:22/download/图像素材下载图像,在VC++6.0中读入BMP图像,熟悉其全部过程,将上面读入的图像进行反色等常用图像处理操作后保存。 实验三图像的几何变换 实验目的与要求:

1. 熟悉Matlab图像处理工具箱中有关几何变换的函数; 2. 通过具体的应用实例进一步理解和熟悉图像的几何变换。 作业: 在6.28.22:22/download/图像素材下载图像,自己编写算法完成图像的平移、旋转、放大和缩小,并与图像工具箱命令结果作比较。 实验四图像的频域变换 实验目的与要求: 1. 通过实例熟悉和理解图像的傅立叶变换和逆变换; 2. 通过实例熟悉和理解图像的离散余弦变换和逆变换。 作业: 在6.28.22:22/download/图像素材下载图像,自己编写算法完成图像的Fourier变换、反变换快速、Fourier变换和其他可分离变换算法,并与图像工具箱命令结果作比较。 1237a63231126edb6f1a103a.html 实验五图像增强与平滑 实验目的与要求: 1. 熟悉图像的直方图,了解图像的直方图均衡化;

模式识别及其在图像处理中的应用

武汉理工大学 模式识别及其在图像处理中的应用 学院(系):自动化学院 课程名称:模式识别原理 专业班级:控制科学与工程1603班 任课教师:张素文 学生姓名:王红刚 2017年1月3日

模式识别及其在图像处理中的应用 摘要:随着计算机和人工智能技术的发展,模式识别在图像处理中的应用日益广泛。综述了模式识别在图像处理中特征提取、主要的识别方法(统计决策法、句法识别、模糊识别、神经网络)及其存在的问题, 并且对近年来模式识别的新进展———支持向量机与仿生模式识别做了分析和总结, 最后讨论了模式识别亟待解决的问题并对其发展进行了展望。 关键词:模式识别;图像处理;特征提取;识别方法 Pattern Recognition and Its Application in Image Processing Abstract:With the development of computer and artificial intelli-gence , pattern recognition is w idely used in the image processing in-creasingly .T he feature extraction and the main methods of pattern recognition in the image processing , w hich include statistical deci-sion, structural method , fuzzy method , artificial neural netw ork aresummarized.T he support vector and bionic pattern recognition w hich are the new developments of the pattern recognition are also analyzed .At last, the problems to be solved and development trends are discussed. Key words:pattern recognition ;image processing ;feature extrac-tion;recognition methods

模式识别及其在图像处理中的应用

模式识别及其在图像处理中的应用 摘要:随着计算机和人工智能技术的发展,模式识别在图像处理中的应用日益广泛。综述了模式识别在图像处理中特征提取、主要的识别方法(统计决策法、句法识别、模糊识别、神经网络)及其存在的问题,并且对近年来模式识别的新进展——支持向量机与仿生模式识别做了分析和总结,最后讨论了模式识别亟待解决的问题并对其发展进行了展望。 关键词:模式识别;图像处理;特征提取;识别方法

模式识别诞生于20世纪20年代,随着计算机的出现和人工智能的发展,模式识别在60年代初迅速发展成一门学科。它所研究的理论和方法在很多学科和领域中得到广泛的重视,推动了人工智能系统的发展,扩大了计算机应用的可能性。图像处理就是模式识别方法的一个重要领域,目前广泛应用的文字识别( MNO)就是模式识别在图像处理中的一个典型应用。 1.模式识别的基本框架 模式识别在不同的文献中给出的定义不同。一般认为,模式是通过对具体的事物进行观测所得到的具有时间与空间分布的信息,模式所属的类别或同一类中模式的总体称为模式类,其中个别具体的模式往往称为样本。模式识别就是研究通过计算机自动地(或者人为进行少量干预)将待识别的模式分配到各个模式类中的技术。模式识别的基本框架如图1所示。 根据有无标准样本,模式识别可分为监督识别方法和非监督识别方法。监督识别方法是在已知训练样本所属类别的条件下设计分类器,通过该分类器对待识样本进行识别的方法。如图1,标准样本集中的样本经过预处理、选择与提取特征后设计分类器,分类器的性能与样本集的大小、分布等有关。待检样本经过预处理、选择与提取特征后进入分类器,得到分类结果或识别结果。非监督模式识别方法是在没有样本所属类别信息的情况下直接根据某种规则进行分类决策。应用于图像处理中的模式识别方法大多为有监督模式识别法,例如人脸检测、车牌识别等。无监督的模式识别方法主要用于图像分割、图像压缩、遥感图像的识别等。

中国50年的图像处理和模式识别发展

中国50年的图像处理和模式识别发展我们感知的信息超过80%来自于我们的视野。随着需求和信息可用性的日益增加,执行图像分析和理解也就更为紧迫。因此,图像识别,已演变成人工智能的一个重要分支。它涉及分析、描述、认识和解释模式,对象或嵌入图像中的行为。在中国,图像识别研究开始在20世纪60年代(一个图像识别的历史一般概述,请参见侧栏的“一个图像识别的历史概述”)。在其早期阶段,在美国普渡大学教授国王孙富,在他的资助下发展很大。20世纪80年代,中国著名学者,如蔡资兴、戴汝为、徐光佑下工作富asvisiting学者。1981年,中国成为国际协会模式识别(IAPR)的正式成员,并举行了第一次模式识别和机器情报全国会议。1984年,中国的研究人员着手建立模式识别国家重点实验室。中国出版模式识别与人工智能的第一个问题是在1987年出版。从那时起,中国许多关于物体识别和模式分析的教科书出版,大大提高了中国人的图像识别研究。例子包括民德程图像识别、模式识别、圻扁和他的的同事们;计算机视觉与模式识别,郑南宁计算机视觉松德马云和他的的同事们。中国研究人员赶上国际同行仍然有很长的路要走。然而,在过去的50年,中国取

得了许多进展,尤其在基础研究和实际应用方面。基础研究图像识别的基本理论来源于模式识别。在20世纪80年代,戴汝为和石青云在中国进行了综合统计和句法模式识别方法的研究。他们的研究已经使得模式识别在中国的研究普遍起来。在20世纪80年代中期,戴相龙介绍了人工神经网络知识和工程应用研究。运用人工神经网络的学习,模式识别、联想记忆和形象思维,他提出一个统一的模式描述和知识表示。此外,他提出了一个集成基于物理符号处理,定性物理,知识可视化,和人工神经网络的各种模型的知识系统设计。20世纪90年代以来,中国科研人员在高维数据判别分析方面已取得显著成效,尤其是小的数据集,包括线性判别分析(LDA)和判别分析的Kullback- Leibler距离(KLDA)。与此同时,中国研究人员在立体视觉摄像机标定和立体匹配问题方面取得重要进展。此外,2DPCA(主成分分析)和2DLDA2D功能,如提取方法在中国起源于本世纪初。一些研究人员很快就适应了这些方法。在2002年,在高维空间点分布分析,提出仿生模式识别。模式不同于传统的基于数据分区的识别,仿生模式识别集中模式的理解。 应用在图像识别的初期,中国这一领域的研究应用

图像模式识别方法

2.1图像模式识别的方法 图像模式识别的方法很多,从图像模式识别提取的特征对象来看,图像识别方法可分为以下几种:基于形状特征的识别技术、基于色彩特征的识别技术以及 基于纹理特征的识别技术。其中,基于形状特征的识别方法,其关键是找到图像中对象形状及对此进行描述,形成可视特征矢量,以完成不同图像的分类,常用来表示形状的变量有形状的周长、面积、圆形度、离心率等。基于色彩特征的识 别技术主要针对彩色图像,通过色彩直方图具有的简单且随图像的大小、旋转变换不敏感等特点进行分类识别。基于纹理特征的识别方法是通过对图像中非常具 有结构规律的特征加以分析或者则是对图像中的色彩强度的分布信息进行统计 来完成。 从模式特征选择及判别决策方法的不同可将图像模式识别方法大致归纳为 两类:统计模式(决策理论)识别方法和句法(结构)模式识别方法。此外,近些年随 着对模式识别技术研究的进一步深入,模糊模式识别方法和神经网络模式识别方 法也开始得到广泛的应用。在此将这四种方法进行一下说明。 2.1.1句法模式识别 对于较复杂的模式,如采用统计模式识别的方法,所面临的一个困难就是特 征提取的问题,它所要求的特征量十分巨大,要把某一个复杂模式准确分类很困难,从而很自然地就想到这样的一种设计,即努力地把一个复杂模式分化为若干 较简单子模式的组合,而子模式又分为若干基元,通过对基元的识别,进而识别子模式,最终识别该复杂模式。正如英文句子由一些短语,短语又由单词,单词 又由字母构成一样。用一组模式基元和它们的组成来描述模式的结构的语言,称为模式描述语言。支配基元组成模式的规则称为文法。当每个基元被识别后,利用句法分析就可以作出整个的模式识别。即以这个句子是否符合某特定文法,以判别它是否属于某一类别。这就是句法模式识别的基本思想。 句法模式识别系统主要由预处理、基元提取、句法分析和文法推断等几部 分组成。由预处理分割的模式,经基元提取形成描述模式的基元串(即字符串)。句法分析根据文法推理所推断的文法,判决有序字符串所描述的模式类别,得到判决结果。问题在于句法分析所依据的文法。不同的模式类对应着不同的文法, 描述不同的目标。为了得到于模式类相适应的文法,类似于统计模式识别的训练

模式识别—车牌号码识别-图像处理

车牌号码识别 第一部分引言 现代智能交通系统(ITS)中,车牌号码自动识别是计算机视觉与模式识别技术在智能交通领域应用的重要研究课题之一,是实现交通管理智能化的重要环节。车辆牌照识别技术可应用于道路交通监控、交通事故现场勘察、交通违章自动纪录、高速公路自动收费系统、停车场自动安全管理、小区智能化管理等方面,具有巨大的经济价。因此车牌号码自动识别技术已经得到了广泛应用。汽车牌照自动识别整个处理过程分为预处理、边缘提取、车牌定位、字符分割、字符识别五大模块,其中字符识别过程主要由以下3个部分组成:①正确地分割文字图像区域;②正确的分离单个文字;③正确识别单个字符。用MATLAB软件编程来实现每一个部分,最后识别出汽车牌照。在研究的同时对其中出现的问题进行了具体分析,处理。 第二部分对采集图像的预处理 数字图像处理(Digital Image Processing)又称为计算机图像处理,它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。数字图像处理最早出现于20世纪50年代,当时的电子计算机已经发展到一定水平,人们开始利用计算机来处理图形和图像信息。数字图像处理作为一门学科大约形成于20世纪60年代初期。早期的图像处理的目的是改善图像的质量,它以人为对象,以改善人的视觉效果为目的。图像处理中,输入的是质量低的图像,输出的是改善质量后的图像,常用的图像处理方法有图像增强、复原、编码、压缩等。首次获得实际成功应用的是美国喷气推进实验室(JPL)。他们对航天探测器徘徊者7号在1964年发回的几千张月球照片使用了图像处理技术,如几何校正、灰度变

换、去除噪声等方法进行处理,并考虑了太阳位置和月球环境的影响,由计算机成功地绘制出月球表面地图,获得了巨大的成功。随后又对探测飞船发回的近十万张照片进行更为复杂的图像处理,以致获得了月球的地形图、彩色图及全景镶嵌图,获得了非凡的成果,为人类登月创举奠定了坚实的基础,也推动了数字图像处理这门学科的诞生。在以后的数字图像处理技术一般来讲,对图像进行处理(或加工、分析)的主要目的有三个方面: (1)提高图像的视感质量,如进行图像的亮度、彩色变换,增强、抑制某些成分,对图像进行几何变换等,以改善图像的质量。 (2)提取图像中所包含的某些特征或特殊信息,这些被提取的特征或信息往往为计算机分析图像提供便利。提取特征或信息的过程是模式识别或计算机视觉的预处理。提取的特征可以包括很多方面,如频域特征、灰度或颜色特征、边界特征、区域特征、纹理特征、形状特征、拓扑特征和关系结构等。 (3)图像数据的变换、编码和压缩,以便于图像的存储和传输。图像是人类获取和交换信息的主要来源,因此,图像处理的应用领域必然涉及到人类生活和工作的方方面面。随着人类活动范围的不断扩大,图像处理的应用领域也将随之不断扩大。 1、图象的采集与转换(代码及截图) I=imread('car.jpg'); figure(1),imshow(I);title('原图') I1=rgb2gray(I); figure(2),subplot(1,2,1),imshow(I1);title('灰度图'); figure(2),subplot(1,2,2),imhist(I1);title('灰度图直方图');

模式识别及其在数字图像处理中的应用

模式识别及其在数字图像处理中的应用 摘要:模式识别是人工智能领域的基础,随着计算机和人工智能技术的发展,模式识别在图像处理中的应用日益广泛。近年来,模式识别也去的了很多让人瞩目的成就,有很多不可忽视的进展。数字图像处理又称为计算机图像处理,它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。图像是人类获取和交换信息的主要来源,图像处理的应用领域必然涉及到人类生活和工作的方方面面。随着人类活动范围的不断扩大,图像处理的应用领域也将随之不断扩大。基于模式识别的图像处理随着当今计算机和人工智能技术的发展,已经成为了图像识别领域的踪影研究方向。本文首先介绍了图像模式识别的基本理论和基本方法,然后阐述了模式识别在图像处理中应用理论,最后举例说明了模式识别在图像处理中的具体应用。 关键字:模式识别;人工智能;图像处理;特征提取;识别方法 1 模式识别技术的基本理论 1.1 模式识别的基本框架 模式识别是通过计算机对信息进行处理、判别的一种分类过程,是信号处理与人工智能的一个重要分支。人工智能是专门研究用机器人模仿人的动作、感觉和思维过程与规律的一门学科,而模式识别就是通过计算机用数学技术方法来研究模式的自动处理和判读。我们把环境与客体统称为“模式”。随着计算机技术和人工智能的发展,人类有可能研究复杂的信息处理过程。信息处理过程的一个重要形式是生命体对环境及客体的识别。对人类来说,特别重要的是对光学信息(通过视觉器官来获得)和声学信息(通过听觉器官来获得)的识别。这是模式识别的两个重要方面。 在图像处理中,识别场景中的对象或区域是一个重要课题。图像模式识别的任务是从策略对象集的场景中识别对象。每个对象都是一种模式,并且策略值是模式的特征,同特征的相似对象集属于具体的模式类,测量特征的技术称为特征提取。模式识别的基本框架如图1所示: 图1 模式识别的基本框架 1.2 模式识别的方法

相关主题
文本预览
相关文档 最新文档