模式识别02-特征矢量和特征空间
- 格式:pdf
- 大小:4.61 MB
- 文档页数:39
蝙蝠的雷达系统、螳螂的视觉的灵敏度都是非常高的。
这些动物通过这些特异的功能来识别各式各样的东西并赖以生存。
识别也是人类的一项基本技能。
当人们看到某事物或现象时,人们会先收集该事物或现象的信息,然后将其与头脑中已有的相关信息相比较,如果找到一个相同或相似的匹配,人们就可以将该事物或现象识别出来。
随着计算机的出现以及人工智能的兴起,将人类的识别技能赋予计算机成为一项新兴课题。
1.模式识别的基本概念1.1 模式与模式识别一般认为,模式是通过对具体的事物进行观测所得到的具有时间与空间分布的信息,模式所属的类别或同一类中的模式的总体称为模式类,其中个别具体的模式往往称为样本。
模式识别就是研究通过计算机自动的(或人为进行少量干预)将待识别的模式分配到各个模式类中的技术。
图 1 模式识别的基本框架模式识别的研究主要集中在两方面,一是研究生物体(包括人)是如何感知对象的,二是在给定的任务下,如何用计算机实现模式识别的理论和方法。
前者是生理学家的研究内容,属于认知科学的范畴;后者通过数学家、信息学专家和计算机科学工作者近几十年的努力,已经取得了系统的研究成果。
1.2 模式识别的特点从模式识别的起源、目的、方法、应用、现状及发展和它同其他领域的关系来考察,可以把他的特点概括的描述如下:(1)模式识别是用机器模仿大脑的识别过程的,设计很大的数据集合,并自动的以高速度作出决策。
(2)模式识别不象纯数学,而是抽象加上实验的一个领域。
它的这个性质常常导致不平凡的和比较有成效的应用,而应用又促进进一步的研究和发展。
由于它和应用的关系密切,应此它又被认为是一门工程学科。
(3)学习(自适应性)是模式识别的一个重要的过程和标志。
但是,编制学习程序比较困难,而有效地消除这种程序中的错误更难,因为这种程序是有智能的。
(4)同人的能力相比,现有模式识别的能力仍然是相当薄弱的(对图案和颜色的识别除外),机器通常不能对付大多数困难问题。
采用交互识别法可以在较大程度上克服这一困难,当机器不能做出一个可靠的决策时,它可以求助于操作人。
第 1 页第二讲 线性分类器一、 判别函数1、 决策论方法在模式识别中,如果根据模式特征信息,按照决策论的思路,以一定的数量规则来采取不同的分类决策,将待识别的模式划分到不同的类别中去,就称为模式识别的决策论方法。
在决策论方法中,特征空间被划分成不同的区域,每个区域对应一个模式类,称为决策区域(Decision Region )。
当我们判定待识别的模式位于某个决策区域时,就判决它可以划归到对应的类别中。
图1 决策区域需要注意的是:决策区域包含模式类中样本的分布区域,但不等于模式类的真实分布范围。
2、 判别函数如果特征空间中的决策区域边界(Decision Boundary )可以用一组方程0)( x i G来表示,则将一个模式对应的特征向量x 代入边界方程中的)(x i G ,确定其正负符号,就可以确定该模式位于决策区域边界的哪一边,从而可以判别其应当属于的类别,)(x i G 称为判别函数(Discriminant Function )。
判别函数的形式可以是线性的(Linear )或非线性(Non-linear)的。
第 2 页例如图2就显示了一个非线性判别函数,当G (x )>0时,可判别模式x ∈ω1;当G (x )<0时,可判别x ∈ω2。
图2 非线性判别函数非线性判别函数的处理比较复杂,如果决策区域边界可以用线性方程来表达,则决策区域可以用超平面(Hyperplane )来划分,无论在分类器的学习还是分类决策时都比较方便。
例如图3中的特征空间可以用两个线性判别函数来进行分类决策:当G 21(x )>0且G 13(x )>0时,x ∈ω2; 当G 13(x )<0且G 21(x )<0时,x ∈ω3; 当G 21(x )<0 且 G 13(x )>0时,x ∈ω1;当G 21(x )>0且G 13(x )<0时,x 所属类别无法判别。
特征矢量▼矢量 ·矩阵 ·行列式 ·线性空间查•论•编•历特征值与特征矢量。
在A变换的作用下,矢量ξ仅仅在尺度上变为原来的λ倍。
称ξ是A的一个特征矢量,λ是对应的特征值。
图1.当蒙娜丽莎的图像左右翻转时,中间垂直的红色矢量方向保持不变。
而水平方向上黄色的矢量的方向完全反转,因此它们都是左右翻转变换的特征矢量。
红色矢量长度不变,其特征值为1。
黄色矢量长度也不变但方向变了,其特征值为-1。
橙色矢量在翻转后和原来的矢量不在同一条直线上,因此不是特征矢量。
在数学上,特别是线性代数中,对于一个给定的线性变换,它的特征矢量(本征矢量或称正规正交矢量)是这样一个非零的矢量v:当v经过这个线性变换[1]的作用之后,得到的新矢量(长度也许改变)仍然与原来的v保持在同一条直线上。
一个特征矢量的长度在该线性变换下缩放的比例称为其特征值(本征值)。
如果特征值为正,则表示v在经过线性变换的作用后方向也不变;如果特征值为负,说明方向会反转;如果特征值为0,则是表示缩回零点。
但无论怎样,仍在同一条直线上。
图1给出了一个以著名油画《蒙娜丽莎》为题材的例子。
在一定条件下(如矩阵形式为实对称矩阵的线性变换),一个变换可以由其特征值和特征矢量完全表述。
一个特征空间是相同特征值的特征矢量的集合,可以表明该集合是一个线性子空间。
这些概念在纯数学和应用数学的众多领域中都有重要的应用。
在线性代数和泛函分析之外,甚至在一些非线性的情况下,这些概念都是十分重要的。
“特征”一词来自德语的eigen,由希尔伯特在1904年首先在这个意义下使用(亥尔姆霍尔兹在更早的时候也在类似意义下使用过这一概念)。
eigen一词可翻译为“自身的”,“特定于...的”,“有特征的”或者“个体的”—这强调了特征值对于定义特定的变换被认为是很重要的。
目录[隐藏]∙ 1 定义∙ 2 例子o 2.1 线性变换o 2.2 其他例子∙ 3 特征值方程∙ 4 谱定理∙ 5 矩阵的特征值和特征矢量o 5.1 计算矩阵的特征值和特征矢量▪ 5.1.1 形式计算▪ 5.1.2 数值计算o 5.2 性质▪ 5.2.1 代数重次▪ 5.2.2 一般矩阵分解定理▪ 5.2.3 特征值的一些另外的属性o 5.3 共轭特征矢量o 5.4 广义特征值问题o 5.5 系数为环中元素∙ 6 无穷维空间∙7 应用o7.1 薛定谔方程o7.2 分子轨域o7.3 因子分析o7.4 振动分析o7.5 特征脸o7.6 惯性张量o7.7 应力张量o7.8 图的特征值∙8 注释∙9 参考来源∙10 参考书籍∙11 外部链接[编辑] 定义参见:特征平面给定一个矢量空间,从到自身的线性变换是—个保持矢量加法和标量乘法的函数,例如旋转、反射、拉伸压缩,或者这些变换的组合等等[1]。
特征空间定义特征空间是机器学习中一个非常重要的概念,它是指将样本的特征表示为一个向量,并将这些向量组成的空间称为特征空间。
在特征空间中,每个样本都可以用一个向量来表示,向量的每个维度对应于一个特征。
特征空间的定义使得机器学习算法可以对样本进行有效的处理和分析。
通过将样本映射到特征空间中,我们可以利用特征之间的关系来推断未知样本的特征。
在特征空间中,我们可以进行各种机器学习算法,包括分类、聚类、回归等。
特征空间的维度决定了样本的特征数量。
通常情况下,特征空间的维度越高,算法的复杂度就越高。
因此,在实际应用中,我们需要根据问题的复杂度和计算资源的限制来选择合适的特征空间维度。
在特征空间中,不同的特征可以有不同的重要性。
有些特征可能对于样本分类或回归更加关键,而另一些特征可能对结果的影响较小。
因此,在选择特征空间时,我们需要对每个特征进行权重的评估和选择。
特征空间的选择也与问题的性质密切相关。
在某些问题中,特征空间的选择可能会受到特征之间相关性的限制。
例如,在图像识别问题中,特征空间可能需要考虑像素之间的位置关系。
特征空间的选择还要考虑到特征的可解释性。
有些特征可能对于机器学习算法来说很难解释,因此在实际应用中可能需要选择更具可解释性的特征。
在实际应用中,特征空间的选择往往是一个复杂的过程。
我们需要根据问题的性质、数据的特点和算法的要求来选择合适的特征空间。
同时,我们还需要考虑特征选择的方法和算法的效率。
特征空间是机器学习中一个非常重要的概念。
通过将样本映射到特征空间中,我们可以利用特征之间的关系来进行机器学习算法。
在实际应用中,选择合适的特征空间对于算法的性能和结果都有重要影响。
因此,我们需要在问题的性质、数据的特点和算法的要求之间进行权衡和选择。
模式识别(Pattern Recognition)是人类的一项基本智能,在日常生活中,人们经常在进行“模式识别”。
随着20世纪40年代计算机的出现以及50年代人工智能的兴起,人们当然也希望能用计算机来代替或扩展人类的部分脑力劳动。
(计算机)模式识别在20世纪60年代初迅速发展并成为一门新学科。
模式识别(Pattern Recognition)是指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。
什么是模式呢?广义地说,存在于时间和空间中可观察的事物,如果我们可以区别它们是否相同或是否相似,都可以称之为模式。
但模式所指的不是事物本身,而是我们从事物获得的信息。
因此,模式往往表现为具有时间或空间分布的信息。
模式还可分成抽象的和具体的两种形式。
前者如意识、思想、议论等,属于概念识别研究的范畴,是人工智能的另一研究分支。
我们所指的模式识别主要是对语音波形、地震波、心电图、脑电图、图片、照片、文字、符号、生物的传感器等对象进行测量的具体模式进行分类和辨识。
模式识别研究主要集中在两方面,一是研究生物体(包括人)是如何感知对象的,属于认识科学的范畴,二是在给定的任务下,如何用计算机实现模式识别的理论和方法。
前者是生理学家、心理学家、生物学家和神经生理学家的研究内容,后者通过数学家、信息学专家和计算机科学工作者近几十年来的努力,已经取得了系统的研究成果。
应用计算机对一组事件或过程进行鉴别和分类。
所识别的事件或过程可以是文字、声音、图像等具体对象,也可以是状态、程度等抽象对象。
这些对象与数字形式的信息相区别,称为模式信息。
模式识别所分类的类别数目由特定的识别问题决定。
有时,开始时无法得知实际的类别数,需要识别系统反复观测被识别对象以后确定。
模式识别与统计学、心理学、语言学、计算机科学、生物学、控制论等都有关系。