模式识别
- 格式:doc
- 大小:319.99 KB
- 文档页数:13
蝙蝠的雷达系统、螳螂的视觉的灵敏度都是非常高的。
这些动物通过这些特异的功能来识别各式各样的东西并赖以生存。
识别也是人类的一项基本技能。
当人们看到某事物或现象时,人们会先收集该事物或现象的信息,然后将其与头脑中已有的相关信息相比较,如果找到一个相同或相似的匹配,人们就可以将该事物或现象识别出来。
随着计算机的出现以及人工智能的兴起,将人类的识别技能赋予计算机成为一项新兴课题。
1.模式识别的基本概念1.1 模式与模式识别一般认为,模式是通过对具体的事物进行观测所得到的具有时间与空间分布的信息,模式所属的类别或同一类中的模式的总体称为模式类,其中个别具体的模式往往称为样本。
模式识别就是研究通过计算机自动的(或人为进行少量干预)将待识别的模式分配到各个模式类中的技术。
图 1 模式识别的基本框架模式识别的研究主要集中在两方面,一是研究生物体(包括人)是如何感知对象的,二是在给定的任务下,如何用计算机实现模式识别的理论和方法。
前者是生理学家的研究内容,属于认知科学的范畴;后者通过数学家、信息学专家和计算机科学工作者近几十年的努力,已经取得了系统的研究成果。
1.2 模式识别的特点从模式识别的起源、目的、方法、应用、现状及发展和它同其他领域的关系来考察,可以把他的特点概括的描述如下:(1)模式识别是用机器模仿大脑的识别过程的,设计很大的数据集合,并自动的以高速度作出决策。
(2)模式识别不象纯数学,而是抽象加上实验的一个领域。
它的这个性质常常导致不平凡的和比较有成效的应用,而应用又促进进一步的研究和发展。
由于它和应用的关系密切,应此它又被认为是一门工程学科。
(3)学习(自适应性)是模式识别的一个重要的过程和标志。
但是,编制学习程序比较困难,而有效地消除这种程序中的错误更难,因为这种程序是有智能的。
(4)同人的能力相比,现有模式识别的能力仍然是相当薄弱的(对图案和颜色的识别除外),机器通常不能对付大多数困难问题。
采用交互识别法可以在较大程度上克服这一困难,当机器不能做出一个可靠的决策时,它可以求助于操作人。
人工智能中的模式识别
模式识别是人工智能中的一项重要的技术,它是一种从观察或测量值
中发现模式、特征或规律的方法,是分类、聚类和降维等多种任务的基础。
因此,它广泛应用于计算机视觉、语音识别、自然语言理解、生物信息处
理等领域。
模式识别包含了一系列分析、提取和确定观测数据的过程。
它通常包
括两个主要步骤:特征提取和识别。
特征提取技术指的是从海量的不同数
据中筛选出具有代表能力的属性,以简化问题的处理,为下一步识别做准备。
特征提取主要有信号分析、熵分析、图像处理等,比如,熵分析可以
用来衡量信号的复杂性,而图像处理则可用来提取图片中的特征,如纹理、轮廓、块等等。
识别技术是模式识别的核心部分,它包括分类、聚类和识别等,可以
用来识别物体、分析图像、识别文本、识别语音等,它一般包括可视化分类、支持向量机和贝叶斯分类器等技术。
机器学习的分类技术可以用来自
动为物体进行分类,贝叶斯分类器可以根据已知样本的特征和可能性来识
别对象的类别,支持向量机则是建立一个面域,使其所能识别的对象具有
最大面域的特点,以此来判断对象的类型。
此外,模式识别技术还可以用来进行降维处理。
1、什么叫模式?什么叫模式识别?
模式主要有两重含义,一是代表事物(个体或一组事物)的模板或原型,二是表征事物特点的特征或性状的组合。
识别就是把对象分门别类地认出来。
识别就是再认知的过程。
模式识别就是对模式的区分和认识,把对象根据其特征归到若干类别中适当的一类。
2、模式识别的主要方法?
模板匹配:首先对每个类别建立一个或多个模版
输入样本和数据库中每个类别的模版进行比较,求相关或距离
根据相关性或距离大小进行决策
优点:直接、简单
缺点:适应性差
形变模版
统计方法:根据训练样本,建立决策边界(decision boundary)
统计决策理论——根据每一类总体的概率分布决定决策边界
判别式分析方法——给出带参数的决策边界,根据某种准则,由训练样本决定“最
优”的参数
句法方法:许多复杂的模式可以分解为简单的子模式,这些子模式组成所谓“基元”
每个模式都可以由基元根据一定的关系来组成
基元可以认为是语言中的词语,每个模式都可以认为是一个句子,关系可以认
为是语法
模式的相似性由句子的相似性来决定
优点:适合结构性强的模式
缺点:抗噪声能力差,计算复杂度高
神经网络:进行大规模并行计算的数学模型
具有学习、推广、自适应、容错、分布表达和计算的能力
优点:可以有效的解决一些复杂的非线性问题
缺点:缺少有效的学习理论
3、监督模式识别与非监督模式识别的区别?。
二○一二~二○一三学年第一学期信息科学与工程学院模式识别小论文课程名称:模式识别专业:学号:姓名:指导教师:二○一三年一月四日遗传算法摘要:PID调节器是最早发展起来的控制策略之一,遗传算法是一种借鉴生物界自然选择和自然遗传学机理上的迭代自适应概率性搜索算法。
本文提出了一种基于遗传算法的PID控制器参数优化设计。
遗传算法模仿生物进化的步骤,在优化过程中引入了选择,交叉,变异等算子,选择是从父代种群中将适应度较高的个体选择出来,以优化种群;交叉是从种群中随机地抽取一对个体,并随机地选择多位进行交叉,生成新样本,达到增大搜索空间的目的;变异是为了防止选择和交叉丢失重要的遗传信息,它对个体按位进行操作,以提高GA的搜索效率和全局搜索能力。
通过适应度函数来确定寻优方向,与其他一些常规整定方法相比,遗传算法比较简便,整定精度较高。
本文用遗传算法对柴油机调速系统的PID 参数进行了优化,对该系统进行了仿真,实验结果表明该种算法的有效性,也表明遗传算法是一种简单高效的寻优算法,与传统的寻优方法相比明显地改善了控制系统的动态性能。
关键词:遗传算法;PID控制器;参数优化2. 遗传算法的发展及历史遗传算法(Genetic Algorithm,简称GA)起源于对生物系统所进行的计算机模拟研究。
美国Michigan大学的Ho11and教授及其学生受到生物模拟技术的启发,创造出了一种基于生物遗传和进化机制的适合于复杂系统优化的自适应概率优化技术——遗传算法。
1967年,Holland的学生Bagley在其博士论文中首次提出了“遗传算法”一词,他发展了复制、交叉、变异、显性、倒位等遗传算子,在个体编码上使用双倍体的编码方法。
Holland教授用遗传算法的思想对自然和人工自适应系统进行了研究,提出了遗传算法的基本定理——模式定理(Schcma Theorem),并于1975年出版了第一本系统论述遗传算法和人工自适应系统的专著《Adaptation in Natural and Artificial Systems》。
20世纪80年代,Holland教授实现了第一个基于遗传算法的机器学习系统,开创了遗传算法的机器学习的新概念。
1975年DeJong基于遗传算法的思想在计算机上进行了大量的纯数值函数优化计算实验,建立了遗传算法的工作框架,得到了一些重要且具有指导意义的结论。
1989年Goldberg出版了专著《Genetic Algorithm in Search Optimization and Machine Learning》,系统地总结了遗传算法的主要研究成果,全面完整地论述了遗传算法的基本原理及其应用。
1991年,Davis出版了《Handbook of Genetic Algorithms》一书,介绍了遗传算法在科学计算、工程技术和社会经济中的大量实例。
1992年,Koza将遗传算法应用于计算机程序的优化设计及自动生成,提出了遗传编程(Genetic Programming,简称GP)的概念。
在控制系统的离线设计方面遗传算法被众多的使用者证明是有效的策略。
例如,Krishnakumar和Goldberg以及Bramlette和Cusin已证明使用遗传优化方法在太空应用中导出优异的控制器结构比使用传统方法如LQR 和Powell(鲍威尔)的增音机设计所用的时间要少(功能评估)。
Porter 和Mohamed 展示了使用本质结构分派任务的多变量飞行控制系统的遗传设计方案。
与此同时,另一些人证明了遗传算法如何在控制器结构的选择中使用。
从遗传算法的整个发展过程来看,20世纪70年代是兴起阶段,20世纪80年代是发展阶段,20世纪90年代是高潮阶段。
遗传算法作为一种实用、高效、鲁棒性强的优化技术,发展极为迅速,已引起国内外学者的高度重视。
3. 遗传算法的计算步骤及关键3.1遗传算法的计算步骤(1)初始化选择一个群体,即选择一个串或个体的集合n i b i ,,2,1 =。
这个初始的群体也就是问题假设解的集合。
一般取6030-=n 。
通常以随机方法产生串或个体的集合n i b i ,,2,1 =问题的最优解将通过这些初始假设解进化而求出。
(2)选择根据适者生存原则选择下一代的个体。
在选择时,以适应度为选择原则。
适应度准则体现了适者生存,不适应者淘汰的自然法则。
给出目标函数f ,则)(i b f 称为个体i b 的适应度。
以n b f b f b P nj ji i ∑==1)()(}{选中为选中i b 是下一代个体的次数。
显然,从上式可知:①适应度较高的个体,繁殖下一代的数目较多。
②适应度较小的个体,繁殖下一代的数目较少;甚至被淘汰。
这样,就产生了对环境适应能力较强的后代。
从问题求解角度来讲,就是选择出和最优解较接近的中间解。
(3)交叉对于选中用于繁殖下一代的个体,随机地选择两个个体的相同位置 ,按交叉概率P 。
在选中位置实行交换。
这个过程反映了随机信息交换;目的在于产生新的基因组合,也即产生新的个体。
交叉时,可实行单点交叉或多点交叉。
例如有个体01011121001011==S S 选择它们的左边3位进行交叉操作,则有 10011120101011==S S 。
一般而言,交叉概率P ,取值为0.25~0.75。
(4)变异根据生物遗传中基因变异的原理,以变异概率Pm 对某些个体的某些位执行变异。
在变异时,对执行变异的串的对应位求反,即把1变为0,把0变为1。
变异概率Pm 与生物变异极小的情况一致,所以,Pm 的取值较小,一般取0.01~0.2。
例如有个体101011=S ,对其的第1,4位置的基因进行变异,则有101011='S 。
单靠变异不能在求解中得到好处。
但是,它能保证算法过程不会产生无法进化的单一群体。
因为在所有的个体一样时,交叉是无法产生新的个体的,这时只能靠变异产生新的个体。
也就是说,变异增加了全局优化的特质(5)全局最优收敛当最优个体的适应度达到给定的阈值,或者最优个体的适应度和群体适应度不再上升时,则算法的迭代过程收敛,算法结束。
否则,用经过选择、交叉、变异得到的新一代群体取代上一代群体,并返回到第2步即选择操作处继续循环执行。
3.2遗传算法的关键遗传算法在应用中最关键的问题有如下3个:(1)串的编码方式它本质是问题编码。
一般把问题的各种参数用二进制编码,构成子串;然后把子串拼接构成“染色体”串。
串长及编码形式对算法收敛影响极大。
(2)适应函数的确定适应函数也称对象函数,这是问题求解品质的测量函数;往往也称为问题的“环境”。
一般可以把问题的模式函数作为对象函数;但有时需要另行构造。
(3)遗传算法自身参数设定遗传算法自身参数有3个,即群体大小n ,交叉概率和变异概率。
群体大小n 太小时难以求出最优解,太大则增长收敛时间。
一般n=30~160。
交叉概率太小时难以向前搜索,太大则容易破坏高适应值的结构。
一般取Pc=0.25~0.75。
变异概率太小时难以产生新的基因结构,太大使遗传算法成了单纯的随机搜索。
一般取Pm=0.01~0.2。
3.3遗传算法的程序设计遗传算法模拟了自然选择和遗传中发生的复制、交叉和变异等现象,如图1所示,从任一初始种群(Population )出发,通过随机选择、交叉和变异操作,产生一群更适应环境的个体,使群体进化到搜索空间中越来越好的区域,这样一代一代地不断繁衍进化,最后收敛到一群最适合环境的个体(Individual ),求得问题的最优解。
图1 遗传算法流程图(1)编码解空间中的解数据,作为遗传算法的表现型形式。
从表现型到基因型的映射称为编码。
遗传算法在进行搜索之前先将解空间的解数据表示成遗传空间的基因型串结构数据,这些串结构数据的不同组合就构成了不同的点。
(2)初始群体的生成随机产生N 个初始串结构数据,每个串结构数据称为一个个体,N 个个体构成了一个群体。
遗传算法以这N 个串结构作为初始点开始迭代。
设置进化代数计数器0 t ;设置最大进化代数T ;随机生成M 个个体作为初始群体)0(P 。
(3)适应度值评价检测适应度函数表明个体或解的优劣性。
对于不同的问题,适应度函数的定义方式不同。
根据具体问题,计算群体中各个个体的适应度。
实际问题参数集编码成为串计算适应值统计结果种群二经过优化的一个或多个参数集(有解码得到)种群一选择与遗传 改善或解决实际问题 种群一→种群二随机算子(4)选择将选择算子作用于群体。
(5)交叉将交叉算子作用于群体。
(6)变异将变异算子作用于群体。
群体)(t P 经过选择、交叉、变异运算后得到下一代群体)1(+t P 。
(7)终止条件判断若T t ≤,则1+←t t ,转到步骤(2);若T t >,则以进化过程中所得到的具有最大适应度的个体作为最优解输出,终止运算。
从遗传算法运算流程可以看出,进化操作过程简单,容易理解,它给其他各种遗传算法提供了一个基本框架。
一个简单的遗传算法被Goldberg 用来进行轮廓描述并用来举例说明遗传算法的基本组成。
t 代种群用变量)(t P 表示,初始群体)0(P 是随机设计的。
4.遗传算法的应用——PID 参数优化设计4.1柴油机调速系统的PID 参数优化设计及仿真柴油机调速系统可近似为二阶惯性纯滞后模型,简化后的柴油机传递函数为:)/()(2s T s ke s G s ατ+=-时间常数T a 是表征柴油机动力装置的一个主要参数,它对动态过程影响极大。
T a 减小时,超调量会加大,过渡过程加长。
T a =2~4s 时,动态过程基本良好,对于6缸柴油发动机,其T a 值一般在3s 左右,本仿真试验T a 取3.2s 。
柴油机的传递函数为:ss e s G s2.36.0200)(276.0+=- 4.2基于遗传算法优化柴油机调速系统PID 参数本文运用遗传算法对柴油机调速系统的PID 参数进行优化,遗传算法是一种简单高效的寻优算法,与传统的寻优方法相比明显地改善了控制系统的动态性能。
具体的优化步骤如下:①、编码:本文采用的是二进制编码。
②、适应度函数的选择:适应度函数表明个体对环境适应能力的强弱,它与所选取的目标函数有关。
本文采用了绝对误差积分模型: J=⎰xo dt t e t )( 定义适应度函数f 为: f=J 1=dtt e t x ⎰0)(1③、设计遗传算子。
选择运算采用比例选择算子,交叉运算采用双点交叉算子 ④、选取遗传算法的控制参数。
如群体大小,各遗传操作概率,最大迭代次数等,并随机产生初始群体;⑤、进行遗传算法搜索过程,即采用随机采样的方法选择个体、通过交叉和变异产生新个体、再计算新个体的目标函数值;⑥、中止循环的条件:确定个体评价方法。
如果收敛条件满足,则结束算法。