模式识别试题及总结
- 格式:docx
- 大小:26.11 KB
- 文档页数:17
模式识别与机器学习期末考查试卷研究生姓名:入学年份:导师姓名:试题1:简述模式识别与机器学习研究的共同问题和各自的研究侧重点。
答:(1)模式识别是研究用计算机来实现人类的模式识别能力的一门学科,是指对表征事物或现象的各种形式的信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程。
主要集中在两方面,一是研究生物体(包括人)是如何感知客观事物的,二是在给定的任务下,如何用计算机实现识别的理论和方法。
机器学习则是一门研究怎样用计算机来模拟或实现人类学习活动的学科,是研究如何使机器通过识别和利用现有知识来获取新知识和新技能。
主要体现以下三方面:一是人类学习过程的认知模型;二是通用学习算法;三是构造面向任务的专用学习系统的方法。
两者关心的很多共同问题,如:分类、聚类、特征选择、信息融合等,这两个领域的界限越来越模糊。
机器学习和模式识别的理论和方法可用来解决很多机器感知和信息处理的问题,其中包括图像/视频分析(文本、语音、印刷、手写)文档分析、信息检索和网络搜索等。
(2)机器学习和模式识别是分别从计算机科学和工程的角度发展起来的,各自的研究侧重点也不同。
模式识别的目标就是分类,为了提高分类器的性能,可能会用到机器学习算法。
而机器学习的目标是通过学习提高系统性能,分类只是其最简单的要求,其研究更侧重于理论,包括泛化效果、收敛性等。
模式识别技术相对比较成熟了,而机器学习中一些方法还没有理论基础,只是实验效果比较好。
许多算法他们都在研究,但是研究的目标却不同。
如SVM 在模式识别中研究所关心的就是其对人类效果的提高,偏工程。
而在机器学习中则更侧重于其性能上的理论证明。
试题2:列出在模式识别与机器学习中的常用算法及其优缺点。
答:(1) K近邻法KNN算法作为一种非参数的分类算法,它已经广泛应用于分类、回归和模式识别等。
在应用KNN算法解决问题的时候,要注意的两个方面是样本权重和特征权重。
优缺点:非常有效,实现简单,分类效果好。
《模式识别》试题库一、基本概念题1.1 模式识别的三大核心问题是: 、。
1.2、模式分布为团状时,选用 聚类算法较好。
1.3 欧式距离具有 。
马式距离具有 。
(1)平移不变性 (2)旋转不变性 (3)尺度缩放不变性 (4)不受量纲影响的特性 1.4 描述模式相似的测度有: 。
(1)距离测度 (2)模糊测度 (3)相似测度 (4)匹配测度1.5 利用两类方法处理多类问题的技术途径有:(1) ;(2) ;(3) 。
其中最常用的是第 个技术途径。
1.6 判别函数的正负和数值大小在分类中的意义是: , 。
1.7 感知器算法 。
(1)只适用于线性可分的情况;(2)线性可分、不可分都适用。
1.8 积累位势函数法的判别界面一般为 。
(1)线性界面;(2)非线性界面。
1.9 基于距离的类别可分性判据有: 。
(1)1[]wB Tr S S - (2)B W S S (3)BW BS S S + 1.10 作为统计判别问题的模式分类,在( )情况下,可使用聂曼-皮尔逊判决准则。
1.11 确定性模式非线形分类的势函数法中,位势函数K(x,x k )与积累位势函数K(x)的关系为( )。
1.12 用作确定性模式非线形分类的势函数法,通常,两个n 维向量x 和x k 的函数K(x,x k )若同时满足下列三个条件,都可作为势函数。
①( ); ②( ); ③ K(x,x k )是光滑函数,且是x 和x k 之间距离的单调下降函数。
1.13 散度J ij 越大,说明ωi 类模式与ωj 类模式的分布( )。
当ωi 类模式与ωj 类模式的分布相同时,J ij =( )。
1.14 若用Parzen 窗法估计模式的类概率密度函数,窗口尺寸h1过小可能产生的问题是( ),h1过大可能产生的问题是( )。
1.15 信息熵可以作为一种可分性判据的原因是: 。
1.16作为统计判别问题的模式分类,在( )条件下,最小损失判决规则与最小错误判决规则是等价的。
计算机视觉与模式识别考试试题一、选择题1.下列哪个是计算机视觉的核心任务?A. 图像去噪B. 物体分类C. 文字识别D. 光流估计2.在计算机视觉中,以下哪种方法可以用于目标检测?A. 模板匹配B. 直方图均衡化C. 边缘检测D. 彩色空间转换3.图像分割是指将图像分割成哪些部分?A. 目标和背景B. 目标和噪声C. 前景和背景D. 前景和噪声4.在模式识别中,以下哪个是特征提取的常用方法?A. 主成分分析B. 图像增强C. 图像去噪D. 图像重建5.以下哪种方法常用于人脸识别?A. 支持向量机B. 卡方检验C. 高斯模型D. 卷积神经网络二、简答题1.请解释图像对比度是什么,并简要说明如何增加图像对比度。
图像对比度指的是图像中灰度级之间的差异程度,即图像中亮度的变化程度。
增加图像对比度可以通过以下方法实现:- 直方图均衡化:通过将图像的灰度级重新分布,使得灰度级更均匀地覆盖整个灰度范围,从而增加图像的对比度。
- 对比度拉伸:通过线性或非线性变换,将图像的灰度级重新映射到一个更大的范围,从而增强图像的对比度。
- 局部对比度增强:根据图像的局部特性,使用不同的增强方法对不同的区域进行处理,以增加图像的局部对比度。
2.请解释模板匹配算法的原理,并简要说明其在计算机视觉中的应用。
模板匹配算法是一种基于相似度的图像匹配方法,其原理是通过计算图像中不同位置与给定模板之间的相似度,找到与模板最相似的位置。
模板匹配算法的步骤如下:- 定义相似度度量标准:通常使用均方差、相关性等指标来度量图像之间的相似度。
- 将模板与图像进行滑动窗口匹配:在图像中使用一个固定大小的窗口滑动,并计算窗口内的图像与模板之间的相似度。
- 找到最相似的位置:记录每个窗口位置的相似度值,找到相似度最高的位置,即为与模板最匹配的位置。
模板匹配算法在计算机视觉中的应用广泛,例如目标检测、人脸识别、手势识别等领域。
通过与已知模板进行匹配,可以实现对图像中目标物体的识别和定位。
模式识别习题及答案模式识别习题及答案模式识别是人类智能的重要组成部分,也是机器学习和人工智能领域的核心内容。
通过模式识别,我们可以从大量的数据中发现规律和趋势,进而做出预测和判断。
本文将介绍一些模式识别的习题,并给出相应的答案,帮助读者更好地理解和应用模式识别。
习题一:给定一组数字序列,如何判断其中的模式?答案:判断数字序列中的模式可以通过观察数字之间的关系和规律来实现。
首先,我们可以计算相邻数字之间的差值或比值,看是否存在一定的规律。
其次,我们可以将数字序列进行分组,观察每组数字之间的关系,看是否存在某种模式。
最后,我们还可以利用统计学方法,如频率分析、自相关分析等,来发现数字序列中的模式。
习题二:如何利用模式识别进行图像分类?答案:图像分类是模式识别的一个重要应用领域。
在图像分类中,我们需要将输入的图像分为不同的类别。
为了实现图像分类,我们可以采用以下步骤:首先,将图像转换为数字表示,如灰度图像或彩色图像的像素矩阵。
然后,利用特征提取算法,提取图像中的关键特征。
接下来,选择合适的分类算法,如支持向量机、神经网络等,训练模型并进行分类。
最后,评估分类结果的准确性和性能。
习题三:如何利用模式识别进行语音识别?答案:语音识别是模式识别在语音信号处理中的应用。
为了实现语音识别,我们可以采用以下步骤:首先,将语音信号进行预处理,包括去除噪声、降低维度等。
然后,利用特征提取算法,提取语音信号中的关键特征,如梅尔频率倒谱系数(MFCC)。
接下来,选择合适的分类算法,如隐马尔可夫模型(HMM)、深度神经网络(DNN)等,训练模型并进行语音识别。
最后,评估识别结果的准确性和性能。
习题四:如何利用模式识别进行时间序列预测?答案:时间序列预测是模式识别在时间序列分析中的应用。
为了实现时间序列预测,我们可以采用以下步骤:首先,对时间序列进行平稳性检验,确保序列的均值和方差不随时间变化。
然后,利用滑动窗口或滚动平均等方法,将时间序列划分为训练集和测试集。
一、填空与选择填空(本题答案写在此试卷上,30分)1、模式识别系统的基本构成单元包括:模式采集、特征提取与选择和模式分类。
2、统计模式识别中描述模式的方法一般使用特真矢量;句法模式识别中模式描述方法一般有串、树、网。
3、聚类分析算法属于(1);判别域代数界面方程法属于(3)。
(1)无监督分类 (2)有监督分类(3)统计模式识别方法(4)句法模式识别方法4、若描述模式的特征量为0-1二值特征量,则一般采用(4)进行相似性度量。
(1)距离测度(2)模糊测度(3)相似测度(4)匹配测度5、下列函数可以作为聚类分析中的准则函数的有(1)(3)(4)。
(1)(2)(3)(4)6、Fisher线性判别函数的求解过程是将N维特征矢量投影在(2)中进行。
(1)二维空间(2)一维空间(3)N-1维空间7、下列判别域界面方程法中只适用于线性可分情况的算法有(1);线性可分、不可分都适用的有(3)。
(1)感知器算法(2)H-K算法(3)积累位势函数法8、下列四元组中满足文法定义的有(1)(2)(4)。
(1)({A, B}, {0, 1}, {A→01, A→ 0A1 , A→ 1A0 , B→BA , B→ 0}, A)(2)({A}, {0, 1}, {A→0, A→ 0A}, A)(3)({S}, {a, b}, {S → 00S, S → 11S, S → 00, S → 11}, S)(4)({A}, {0, 1}, {A→01, A→ 0A1, A→ 1A0}, A)9、影响层次聚类算法结果的主要因素有(计算模式距离的测度、(聚类准则、类间距离门限、预定的类别数目))。
10、欧式距离具有( 1、2 );马式距离具有(1、2、3、4 )。
(1)平移不变性(2)旋转不变性(3)尺度缩放不变性(4)不受量纲影响的特性11、线性判别函数的正负和数值大小的几何意义是(正(负)表示样本点位于判别界面法向量指向的正(负)半空间中;绝对值正比于样本点到判别界面的距离。
模式识别试题二答案问答第1题答:在模式识别学科中,就“模式”与“模式类”而言,模式类是一类事物的代表,概念或典型,而“模式”则是某一事物的具体体现,如“老头”是模式类,而王先生则是“模式”,是“老头”的具体化。
问答第2题答:Mahalanobis距离的平方定义为:其中x,u为两个数据,是一个正定对称矩阵(一般为协方差矩阵)。
根据定义,距某一点的Mahalanobis距离相等点的轨迹是超椭球,如果是单位矩阵Σ,则Mahalanobis距离就是通常的欧氏距离。
问答第3题答:监督学习方法用来对数据实现分类,分类规则通过训练获得。
该训练集由带分类号的数据集组成,因此监督学习方法的训练过程是离线的。
非监督学习方法不需要单独的离线训练过程,也没有带分类号(标号)的训练数据集,一般用来对数据集进行分析,如聚类,确定其分布的主分量等。
就道路图像的分割而言,监督学习方法则先在训练用图像中获取道路象素与非道路象素集,进行分类器设计,然后用所设计的分类器对道路图像进行分割。
使用非监督学习方法,则依据道路路面象素与非道路象素之间的聚类分析进行聚类运算,以实现道路图像的分割。
问答第4题答:动态聚类是指对当前聚类通过迭代运算改善聚类;分级聚类则是将样本个体,按相似度标准合并,随着相似度要求的降低实现合并。
问答第5题答:在给定观察序列条件下分析它由某个状态序列S产生的概率似后验概率,写成P(S|O),而通过O求对状态序列的最大似然估计,与贝叶斯决策的最小错误率决策相当。
问答第6题答:协方差矩阵为,则1)对角元素是各分量的方差,非对角元素是各分量之间的协方差。
2)主分量,通过求协方差矩阵的特征值,用得,则,相应的特征向量为:,对应特征向量为,对应。
这两个特征向量即为主分量。
3) K-L变换的最佳准则为:对一组数据进行按一组正交基分解,在只取相同数量分量的条件下,以均方误差计算截尾误差最小。
4)在经主分量分解后,协方差矩阵成为对角矩阵,因而各主分量间相关消除。
《模式识别》试题答案及评分标准(B卷)姓名:学号:成绩:一、填空与选择填空(本题答案写在此试卷上,30分)1、模式识别系统的基本构成单元包括:模式采集、特征提取与选择和模式分类。
2、统计模式识别中描述模式的方法一般使用特真矢量;句法模式识别中模式描述方法一般有串、树、网。
3、聚类分析算法属于(1);判别域代数界面方程法属于(3)。
(1)无监督分类 (2)有监督分类(3)统计模式识别方法(4)句法模式识别方法4、若描述模式的特征量为0-1二值特征量,则一般采用(4)进行相似性度量。
(1)距离测度(2)模糊测度(3)相似测度(4)匹配测度5、下列函数可以作为聚类分析中的准则函数的有(1)(3)(4)。
(1)(2) (3)(4)6、Fisher线性判别函数的求解过程是将N维特征矢量投影在(2)中进行。
(1)二维空间(2)一维空间(3)N-1维空间7、下列判别域界面方程法中只适用于线性可分情况的算法有(1);线性可分、不可分都适用的有(3)。
(1)感知器算法(2)H-K算法(3)积累位势函数法8、下列四元组中满足文法定义的有(1)(2)(4)。
(1)({A, B}, {0, 1}, {A→01, A→ 0A1 , A→ 1A0 , B→BA , B→ 0}, A)(2)({A}, {0, 1}, {A→0, A→ 0A}, A)(3)({S}, {a, b}, {S → 00S, S → 11S, S → 00, S → 11}, S)(4)({A}, {0, 1}, {A→01, A→ 0A1, A→ 1A0}, A)二、(15分)简答及证明题(1)影响聚类结果的主要因素有那些?(2)证明马氏距离是平移不变的、非奇异线性变换不变的。
(1)(5分)答:分类准则,模式相似性测度,特征量的选择,量纲。
(2)(10分)证明:(2分)(2分)(1分)设,有非奇异线性变换:(1分)(4分)三、(8分)说明线性判别函数的正负和数值大小在分类中的意义并证明之。
1、模式识别系统的基本构成单元,并对各单元简要解释• 数据获取:用计算机可以运算的符号来表示所研究的对象– 二维图像:文字、指纹、地图、照片等– 一维波形:脑电图、心电图、季节震动波形等– 物理参量和逻辑值:体温、化验数据、参量正常与否的描述• 预处理单元:去噪声,提取有用信息,并对输入测量仪器或其它因素所造成的退化现象进行复原• 特征提取和选择:对原始数据进行变换,得到最能反映分类本质的特征– 测量空间:原始数据组成的空间 – 特征空间:分类识别赖以进行的空间– 模式表示:维数较高的测量空间->维数较低的特征空间• 分类决策:在特征空间中用模式识别方法把被识别对象归为某一类别– 基本做法:在样本训练集基础上确定某个判决规则,使得按这种规则对被识别对象进行分类所造成的错误识别率最小或引起的损失最小2、写出K-均值聚类算法的基本步骤, 例子见布置的作业题.算法:第一步:选K个初始聚类中心,z 1(1),z 2(1),…,z K(1),其中括号内的序号为寻找聚类中心的迭代运算的次序号。
聚类中心的向量值可任意设定,例如可选开始的K 个模式样本的向量值作为初始聚类中心。
第二步:逐个将需分类的模式样本{x}按最小距离准则分配给K 个聚类中心中的某一个z j(1)。
假设i=j 时,}K ,2,1i ,)k (z x min{)k (D i j =-=,则)k (S x j ∈,其中k为迭代运算的次序号,第一次迭代k=1,Sj表示第j 个聚类,其聚类中心为z j。
第三步:计算各个聚类中心的新的向量值,zj(k+1),j=1,2,…,K求各聚类域中所包含样本的均值向量:()1(1),1,2,,j j x S k jz k x j KN ∈+==∑其中N j 为第j个聚类域S j 中所包含的样本个数。
以均值向量作为新的聚类中心,可使如下聚类准则函数最小:在这一步中要分别计算K 个聚类中的样本均值向量,所以称之为K -均值算法。
《模式识别》试题库一、基本概念题1.1 模式识别的三大核心问题是:、、。
1.2、模式分布为团状时,选用聚类算法较好。
1.3 欧式距离具有。
马式距离具有。
(1)平移不变性(2)旋转不变性(3)尺度缩放不变性(4)不受量纲影响的特性1.4 描述模式相似的测度有:。
(1)距离测度(2)模糊测度(3)相似测度(4)匹配测度1.5 利用两类方法处理多类问题的技术途径有:(1);(2);(3)。
其中最常用的是第个技术途径。
1.6 判别函数的正负和数值大小在分类中的意义是:,。
1.7 感知器算法。
(1)只适用于线性可分的情况;(2)线性可分、不可分都适用。
1.8 积累位势函数法的判别界面一般为。
(1)线性界面;(2)非线性界面。
1.9 基于距离的类别可分性判据有:。
(1)1[]w BTr S S-(2)BWSS(3)BW BSS S+1.10 作为统计判别问题的模式分类,在()情况下,可使用聂曼-皮尔逊判决准则。
1.11 确定性模式非线形分类的势函数法中,位势函数K(x,x k)与积累位势函数K(x)的关系为()。
1.12 用作确定性模式非线形分类的势函数法,通常,两个n维向量x和x k的函数K(x,x k)若同时满足下列三个条件,都可作为势函数。
①();②( ); ③ K(x,x k )是光滑函数,且是x 和x k 之间距离的单调下降函数。
1.13 散度J ij 越大,说明ωi 类模式与ωj 类模式的分布( )。
当ωi 类模式与ωj 类模式的分布相同时,J ij =( )。
1.14 若用Parzen 窗法估计模式的类概率密度函数,窗口尺寸h1过小可能产生的问题是( ),h1过大可能产生的问题是( )。
1.15 信息熵可以作为一种可分性判据的原因是: 。
1.16作为统计判别问题的模式分类,在( )条件下,最小损失判决规则与最小错误判决规则是等价的。
1.17 随机变量l(x )=p( x |ω1)/p( x |ω2),l( x )又称似然比,则E {l( x )|ω2}=( )。
模式识别试题及总结一、填空与选择填空(本题答案写在此试卷上,30分)1、模式识别系统的基本构成单元包括:模式采集、特征提取与选择和模式分类。
2、统计模式识别中描述模式的方法一般使用特真矢量;句法模式识别中模式描述方法一般有串、树、网。
3、聚类分析算法属于(1);判别域代数界面方程法属于(3)。
(1)无监督分类 (2)有监督分类(3)统计模式识别方法(4)句法模式识别方法4、若描述模式的特征量为0-1二值特征量,则一般采用(4)进行相似性度量。
(1)距离测度(2)模糊测度(3)相似测度(4)匹配测度5、下列函数可以作为聚类分析中的准则函数的有(1)(3)(4)。
(1)(2) (3) (4)6、Fisher线性判别函数的求解过程是将N维特征矢量投影在(2)中进行。
(1)二维空间(2)一维空间(3)N-1维空间7、下列判别域界面方程法中只适用于线性可分情况的算法有(1);线性可分、不可分都适用的有(3)。
(1)感知器算法(2)H-K算法(3)积累位势函数法8、下列四元组中满足文法定义的有(1)(2)(4)。
(1)({A, B}, {0, 1}, {A?01, A ? 0A1 , A ? 1A0 , B ? BA , B ? 0}, A) (2)({A}, {0, 1}, {A?0, A ? 0A}, A)(3)({S}, {a, b}, {S ? 00S, S ? 11S, S ? 00, S ? 11}, S)(4)({A}, {0, 1}, {A?01, A ? 0A1, A ? 1A0}, A)9、影响层次聚类算法结果的主要因素有(计算模式距离的测度、(聚类准则、类间距离门限、预定的类别数目))。
10、欧式距离具有( 1、2 );马式距离具有(1、2、3、4 )。
(1)平移不变性(2)旋转不变性(3)尺度缩放不变性(4)不受量纲影响的特性11、线性判别函数的正负和数值大小的几何意义是(正(负)表示样本点位于判别界面法向量指向的正(负)半空间中;绝对值正比于样本点到判别界面的距离。
)。
12、感知器算法 1 。
(1)只适用于线性可分的情况;(2)线性可分、不可分都适用。
13、积累势函数法较之于H-K算法的优点是(该方法可用于非线性可分情况(也可用于线性可分情况));K(x)?位势函数K(x,xk)与积累位势函数K(x)的关系为(?~xk?XkK(x,xk))。
14、在统计模式分类问题中,聂曼-皮尔逊判决准则主要用于(某一种判决错误较另一种判决错误更为重要)情况;最小最大判决准则主要用于(先验概率未知的)情况。
15、“特征个数越多越有利于分类”这种说法正确吗?(错误)。
特征选择的主要目的是(从n个特征中选出最有利于分类的的m个特征(m<n),以降低特征维数)。
一般在(可分性判据对特征个数具有单调性)和(Cn>>n )的条件下,可以使用分支定界法以减少计算量。
16、散度Jij越大,说明?i类模式与?j类模式的分布(差别越大);当?i类模式与?j类模式的分布相同时,Jij=(0)。
17、已知有限状态自动机Af=(?,Q,?,q0,F),?={0,1};Q={q0,q1};?:?(q0,0)= q1,?(q0,1)= q1,?(q1,0)=q0,?(q1,1)=q0;q0=q0;F={q0}。
现有输入字符串:(a) 00011101011,(b) 1100110011,(c) 101100111000,(d)0010011,试问,用Af对上述字符串进行分类的结果为(ω1:{a,d};ω2:{b,c} )。
18、影响聚类算法结果的主要因素有(②③④ )。
①已知类别的样本质量;②分类准则;③特征选取;④模式相似性测度。
19、模式识别中,马式距离较之于欧式距离的优点是(③④ )。
①平移不变性;②旋转不变性;③尺度不变性;④考虑了模式的分布。
20、基于二次准则函数的H-K算法较之于感知器算法的优点是(①③ )。
①可以判别问题是否线性可分;②其解完全适用于非线性可分的情况;③其解的适应性更好;④计算量小。
21、影响基本C均值算法的主要因素有(④①② )。
①样本输入顺序;②模式相似性测度;③聚类准则;④初始类心的选取。
22、位势函数法的积累势函数K(x)的作用相当于Bayes判决中的(②④ )。
①先验概率;②后验概率;③类概率密度;④类概率密度与先验概率的乘积。
23、在统计模式分类问题中,当先验概率未知时,可以使用(②④ )。
①最小损失准则;②最小最大损失准则;③最小误判概率准则;④N-P判决。
24、在(①③ )情况下,用分支定界法做特征选择计算量相对较少。
①Cn>>n,(n为原特征个数,d为要选出的特征个数);②样本较多;③选用的可分性判据J对特征数目单调不减;④选用的可分性判据J具有可加性。
dm25、散度JD是根据(③ )构造的可分性判据。
①先验概率;②后验概率;③类概率密度;④信息熵;⑤几何距离。
26、似然函数的概型已知且为单峰,则可用(①②③④⑤ )估计该似然函数。
①矩估计;②最大似然估计;③Bayes估计;④Bayes学习;⑤Parzen窗法。
27、Kn近邻元法较之Parzen窗法的优点是(② )。
①所需样本数较少;②稳定性较好;③分辨率较高;④连续性较好。
28、从分类的角度讲,用DKLT做特征提取主要利用了DKLT的性质:(①③ )。
①变换产生的新分量正交或不相关;②以部分新的分量表示原矢量均方误差最小;③使变换后的矢量能量更趋集中;29、一般,剪辑k-NN最近邻方法在(① )的情况下效果较好。
①样本数较大;②样本数较小;③样本呈团状分布;④样本呈链状分布。
30、如果以特征向量的相关系数作为模式相似性测度,则影响聚类算法结果的主要因素有(②③ )。
①已知类别样本质量;②分类准则;③特征选取;④量纲。
二、(15分)简答及证明题(1)影响聚类结果的主要因素有那些?(2)证明马氏距离是平移不变的、非奇异线性变换不变的。
答:(1)分类准则,模式相似性测度,特征量的选择,量纲。
(2)证明:(2分)(2分)(1分) (1分) 设,有非奇异线性变换:(4分)三、(8分)说明线性判别函数的正负和数值大小在分类中的意义并证明之。
答:(1)(4分)的绝对值正比于到超平面的距离平面的方程可以写成式中。
于是是平面的单位法矢量,上式可写成设是平面中的任一点,是特征空间在中任一点,点到平面的距离为差矢量上的投影的绝对值,即(1-1)上式中利用了在平面中,故满足方程式(1-1)的分子为判别函数绝对值,上式表明,的值的距离,正比于到超平面一个特征矢量代入判别函数后所得值的绝对值越大表明该特征点距判别界面越远。
(2)(4分)两矢量和的正(负)反映在超平面的数积为显然,当和和夹角大于和空间中,夹角小于(2分) >0;反之,当<0。
由于,故的正(负)侧时,即在指向的那个半空间中,时,即在背向的那个半空间中,同号。
所以,当在指向的半空间中时,;当在背向的半。
判别函数值的正负表示出特征点位于哪个半空间中,或者换句话说,表示特征点位于界面的哪一侧。
五、(12分,每问4分) 在目标识别中,假定有农田和装甲车两种类型,类型?1和类型?2分别代表农田和装甲车,它们的先验概率分别为0.8和0.2,损失函数如表1所示。
现在做了三次试验,获得三个样本的类概率密度如下::0.3,0.1,0.6:0.7,0.8,0.3(1)试用贝叶斯最小误判概率准则判决三个样本各属于哪一个类型;(2)假定只考虑前两种判决,试用贝叶斯最小风险准则判决三个样本各属于哪一类;(3)把拒绝判决考虑在内,重新考核三次试验的结果。
表1进行分类器设计,然后用所设计的分类器对道路图像进行分割。
使用非监督学习方法,则依据道路路面象素与非道路象素之间的聚类分析进行聚类运算,以实现道路图像的分割。
2.动态聚类是指对当前聚类通过迭代运算改善聚类;分级聚类则是将样本个体,按相似度标准合并,随着相似度要求的降低实现合并。
3. 线性分类器三种最优准则:Fisher准则:根据两类样本一般类内密集, 类间分离的特点,寻找线性分类器最佳的法线向量方向,使两类样本在该方向上的投影满足类内尽可能密集,类间尽可能分开。
该种度量通过类内离散矩阵Sw 和类间离散矩阵Sb实现。
感知准则函数:准则函数以使错分类样本到分界面距离之和最小为原则。
其优点是通过错分类样本提供的信息对分类器函数进行修正,这种准则是人工神经元网络多层感知器的基础。
支持向量机:基本思想是在两类线性可分条件下,所设计的分类器界面使两类之间的间隔为最大, 它的基本出发点是使期望泛化风险尽可能小。
一、试问“模式”与“模式类”的含义。
如果一位姓王的先生是位老年人,试问“王先生”和“老头”谁是模式,谁是模式类?答:在模式识别学科中,就“模式”与“模式类”而言,模式类是一类事物的代表,概念或典型,而“模式”则是某一事物的具体体现,如“老头”是模式类,而王先生则是“模式”,是“老头”的具体化。
二、试说明Mahalanobis距离平方的定义,到某点的Mahalanobis距离平方为常数的轨迹的几何意义,它与欧氏距离的区别与联系。
答:Mahalanobis距离的平方定义为:其中x,u为两个数据,是一个正定对称矩阵(一般为协方差矩阵)。
根据定义,距某一点的Mahalanobis距离相等点的轨迹是超椭球,如果是单位矩阵Σ,则Mahalanobis距离就是通常的欧氏距离。
三、试说明用监督学习与非监督学习两种方法对道路图像中道路区域的划分的基本做法,以说明这两种学习方法的定义与它们间的区别。
答:监督学习方法用来对数据实现分类,分类规则通过训练获得。
该训练集由带分类号的数据集组成,因此监督学习方法的训练过程是离线的。
非监督学习方法不需要单独的离线训练过程,也没有带分类号(标号)的训练数据集,一般用来对数据集进行分析,如聚类,确定其分布的主分量等。
就道路图像的分割而言,监督学习方法则先在训练用图像中获取道路象素与非道路象素集,进行分类器设计,然后用所设计的分类器对道路图像进行分割。
使用非监督学习方法,则依据道路路面象素与非道路象素之间的聚类分析进行聚类运算,以实现道路图像的分割。
四、试述动态聚类与分级聚类这两种方法的原理与不同。
答:动态聚类是指对当前聚类通过迭代运算改善聚类;分级聚类则是将样本个体,按相似度标准合并,随着相似度要求的降低实现合并。
第 7 页共 22 页五、如果观察一个时序信号时在离散时刻序列得到的观察量序列表示为状态序列表示成,而该时序信号的内在。
如果计算在给定O条件下出现S的概率,试问此概率是何种概率。
如果从观察序列来估计状态序列的最大似然估计,这与Bayes决策中基于最小错误率的决策有什么关系。