第二节 模糊模式识别
- 格式:ppt
- 大小:425.50 KB
- 文档页数:3
模糊模式识别1 模糊模式识别的原则(1) 最大隶属原则当模式是模糊的,被识别对象是明确的,问题可以描述如下:设有n 个模式,它们分别表示成某论域X (X 可以是多个集合的笛卡儿乘积集)的n 个模糊子集12,,,n A A A,而0x X ∈是一个具体被识别的对象,若有},2,1{n i ∈,使得12()m ax{(),(),,()}inA o A o A o A o x x x x μμμμ=则认为0x 相对属于模式i A。
对事物进行直接识别时,所依据的是最大隶属原则。
这种方法适合处理具有如下特点的问题:a 用作比较的模式是模糊的;b 被识别的对象本身是确定的。
(2) 贴近度原则当模式及被识别对象都是模糊的,问题可以描述如下:设论域X 的模糊子集12,,,n A A A代表n 个模糊模式,被识别的对象可以表示成X 的子集B,若有},2,1{n i ∈,使得12(,)max{(,),(,),,(,)}i n B A B A B A B A σσσσ=则认为B相对合于模式A。
在模糊模式识别的具体应用中,关键是模式或被识别对象的模糊集合的构造,即如何建立刻画模式或对象的模糊集合。
根据实际应用来看,通常有三种主要方法,简单模式的识别方法,语言模式的识别方法和统计模式的识别方法。
2 模糊模式识别方法(一)简单模式的模糊模式识别具体的模糊模式识别工作可分为如下三个步骤:1)选取模式的特征因子集合},,,{21n X X X =X,被识别的对象表示为nni i XXX X ⨯⨯⨯∆∏= 211上的向量(),,,21n x x x ,,1,2,,,i i x X i n ∈= 或者表示为∏=ni i X 1上的模糊子集;2)建立模糊模式的隶属函数()A X μ,1()ni i A F X =∈∏;3)利用最大隶属度原则或贴近度原则对被识别的对象进行归属判决。
特征因子(1,2,,)i X i n = 的选取直接影响识别的效果,它取决于识别者的知识和技巧,很难做一般性讨论,而模式识别中最困难的是建立模式的隶属函数,人们还没有从理论上彻底解决隶属函数的确定问题。
蝙蝠的雷达系统、螳螂的视觉的灵敏度都是非常高的。
这些动物通过这些特异的功能来识别各式各样的东西并赖以生存。
识别也是人类的一项基本技能。
当人们看到某事物或现象时,人们会先收集该事物或现象的信息,然后将其与头脑中已有的相关信息相比较,如果找到一个相同或相似的匹配,人们就可以将该事物或现象识别出来。
随着计算机的出现以及人工智能的兴起,将人类的识别技能赋予计算机成为一项新兴课题。
1.模式识别的基本概念1.1 模式与模式识别一般认为,模式是通过对具体的事物进行观测所得到的具有时间与空间分布的信息,模式所属的类别或同一类中的模式的总体称为模式类,其中个别具体的模式往往称为样本。
模式识别就是研究通过计算机自动的(或人为进行少量干预)将待识别的模式分配到各个模式类中的技术。
图 1 模式识别的基本框架模式识别的研究主要集中在两方面,一是研究生物体(包括人)是如何感知对象的,二是在给定的任务下,如何用计算机实现模式识别的理论和方法。
前者是生理学家的研究内容,属于认知科学的范畴;后者通过数学家、信息学专家和计算机科学工作者近几十年的努力,已经取得了系统的研究成果。
1.2 模式识别的特点从模式识别的起源、目的、方法、应用、现状及发展和它同其他领域的关系来考察,可以把他的特点概括的描述如下:(1)模式识别是用机器模仿大脑的识别过程的,设计很大的数据集合,并自动的以高速度作出决策。
(2)模式识别不象纯数学,而是抽象加上实验的一个领域。
它的这个性质常常导致不平凡的和比较有成效的应用,而应用又促进进一步的研究和发展。
由于它和应用的关系密切,应此它又被认为是一门工程学科。
(3)学习(自适应性)是模式识别的一个重要的过程和标志。
但是,编制学习程序比较困难,而有效地消除这种程序中的错误更难,因为这种程序是有智能的。
(4)同人的能力相比,现有模式识别的能力仍然是相当薄弱的(对图案和颜色的识别除外),机器通常不能对付大多数困难问题。
采用交互识别法可以在较大程度上克服这一困难,当机器不能做出一个可靠的决策时,它可以求助于操作人。
模糊模式识别1模糊数学基本理论9.1 模糊集合•模糊"一词来自英文fuzzy,意思是"模糊的"、"(形状或轮廓)不淸楚"等等.•模糊数学是运用数学方法研究和处理带有模糊性现象的一门新兴学科,它的创始人是美国加利福尼亚大学著名的控制论专家扎德(L.A.zadah)•所谓的模糊性,是指事物的亦此亦彼性,反映在概念形成过程中外延的不分明性•1965年,美国加利福尼亚大学控制论专家扎德(L, A. Zadeh〉教授在《信息与控制》杂志上发表了一箱开创性论文《模糊集》,这标志着模糊数学的诞生。
•在人类社会和各个科学领域中,人们所遇到的各种量大体上可以分成两大类:•确定性的与不确定性的,而不确定性又可分为随机性和模糊性.人们正是用三种数学来分别研究客观世界中不同的量,即在这种框架内,数学模型分为三大类.•第一类是确定性数学模型。
这类模型研究的对象具有确定性,对象之间具有必然的关系,最典型的就是用微分法、微分方程、差分方程所建立的数学模型.•第二类是随机性数学模型。
这类模型研究的对象具有随机性,对象之间具有偶然的关系,如用概率分布方法、马尔可夫(Markov〉链所建立的数学模型。
•第三类是模糊性数学模型。
这类模型所研究的对象与对象之间的关系具有模糊性.两种不确定性之间的区别:•随机性的不确定性,也就是概率的不确定性。
例如,“明天有雨”,“掷一骰子出现6点”等,它们的发生是一种偶然现象,具有不确定性.•在这里,事件本身是确定的,而事件的发生不确定。
只要时间过去,到了明天,“明天有雨”是否发生就变成确定的了。
“掷一骰子出现6点”,只要实际做一次实验,它就变成确定的了.•而模糊性的不确定性,即使时间过去了,或者实际做了一次实验,它们仍然是不确定的。
这主要是因为事件本身( 如“青年人”、“高个子”等) 是不确定的,具有模糊性,是由概念、语言的模糊性产生的。
模糊数学在实际中的应用•几乎涉及国民经济的各个领域,尤其在科学技术、经济管理、社会科学方面得到了广泛而又成功的应用.比如:•在生物学发展史上,由于科学技术的不断进步,人们发现在动物与植物之间存在着“中介状态”,于是又分出张将生物分为五类、六类.这一现象用模糊集合就可得到合理的解释.•对某个领域的经济发展水平的评价,往往划分为富裕型、小康型、温饱型、贫困型,这些都是模糊的,只有通过模糊数学模型才能得到合乎实际的评价。
§2 小麦品种的模糊模式识别把一批来自同一品种的小麦称为一个小麦亲本。
小麦有各种不同的品种,某一品种的小麦有它自己的很多特性,如抽穗期、株高、有效穗数、主穗粒数和百粒重量等数量性质。
然而对于小麦的一个亲本,我们不能凭其中某一粒或某一株小麦去鉴定它的品种。
实际上,同一品种的小麦中,各株小麦的抽穗期显然是不完全相同的。
在同一种小麦中,百粒重量的每一次样本也是不完全相同的,但总是在各自的均值附近摆动。
这样我们就可以把某一品种的小麦看成是一个模糊集。
不同品种的小麦就对应着不同的模糊集。
如果能肯定待识别小麦亲本的模糊集与某一已知品种小麦的模糊集最贴近,那就可以断言它属于该种小麦了。
由于模糊集合是用隶属函数来表示的,而隶属函数又不同于普通的函数,怎样来度量模糊集的模糊性以及怎样比较两个模糊集是否相贴近还是差别很大,这就要引入一些有关模糊集度量的概念。
一、单个模糊集度量 1、模糊度在论域U 上的任意模糊子集~A 的模糊度)(~A D 应满足:(ⅰ)对任意的U x ∈,当且仅当x 对~A 的隶属度)(~x A μ只取0和1时,)(~A D =0 ;(ⅱ)当)(~x A μ=0.5时,)(~A D 应取最大值,即)(~A D =1;(ⅲ)对任意的U x ∈,设U 的两个模糊子集~A 和~B ,若5.0)()(~~≥≥x x B A μμ或5.0)()(~~≤≤x x B A μμ,则有)()(~~A D B D ≥。
2、模糊熵在模糊数学中,用模糊熵描述模糊度,是模糊集合所含模糊性大小的一种度量,这里仅介绍较其它方法为好的仙农函数引出的模糊熵定义。
设~A 是论域U 上的任意模糊子集,当U x ∈时,记))((2ln 1)(~1~i Ai x S n A H μ∑∞==叫做模糊集~A 的熵,此处)1ln()1(ln )(x x x x x S ----=。
容易验证,上述模糊熵满足模糊度的三个条件。
二、多个模糊集度量 1、海明距离设论域U 上的两个模糊子集~A 和~B ,它们之间的海明距离定义为∑=-=ni i B i A x x B A d 1~~)()(),(~~μμ这个定义适用于论域为有限集时,n 是论域中元素的个数,它又称为绝对海明距离。
绪言任何新生事物的产生和发展,都要经过一个由弱到强,逐步成长壮大的过程,一种新理论、一种新学科的问世,往往一开始会受到许多人的怀疑甚至否定。
模糊数学自1965年L.A.Zadeh教授开创以来所走过的道路,充分证实了这一点,然而,实践是检验真理的标准,模糊数学在理论和实际应用两方面同时取得的巨大成果,不仅消除了人们的疑虑,而且使模糊数学在科学领域中,占有了自己的一席之地。
经典数学是适应力学、天文、物理、化学这类学科的需要而发展起来的,不可能不带有这些学科固有的局限性。
这些学科考察的对象,都是无生命的机械系统,大都是界限分明的清晰事物,允许人们作出非此即彼的判断,进行精确的测量,因而适于用精确方法描述和处理。
而那些难以用经典数学实现定量化的学科,特别是有关生命现象、社会现象的学科,研究的对象大多是没有明确界限的模糊事物,不允许作出非此即彼的断言,不能进行精确的测量。
清晰事物的有关参量可以精确测定,能够建立起精确的数学模型。
模糊事物无法获得必要的精确数据,不能按精确方法建立数学模型。
实践证明,对于不同质的矛盾,只有用不同质的方法才能解决。
传统方法用于力学系统高度有效,但用于对人类行为起重要作用的系统,就显得太精确了,以致于很难达到甚至无法达到。
精确方法的逻辑基础是传统的二值逻辑,即要求符合非此即彼的排中律,这对于处理清晰事物是适用的。
但用于处理模糊性事物时,就会产生逻辑悖论。
如判断企业经济效益的好坏时,用“年利税在100万元以上者为经济效益好的企业” 表达,否则,便是经济效益不好的企业。
根据常识,显而易见:“比经济效益好的企业年利税少1元的企业,仍是经济效益好的企业”,而不应被划为经济效益不好的企业。
这样,从上面的两个结论出发,反复运用经典的二值逻辑,我们最后就会得到,“年利税为0者仍为经济效益好的企业”的悖论。
类似的悖论有许多,历史上最著名的有“罗素悖论”。
它们都是在用二值逻辑来处理模糊性事物时产生的。