(完整word版)中科院-模式识别考题总结(详细答案)
- 格式:doc
- 大小:711.50 KB
- 文档页数:13
模式识别期末考试题及答案一、选择题(每题2分,共20分)1. 以下哪一项不是模式识别的主要任务?A. 分类B. 回归C. 聚类D. 预测答案:B2. 以下哪一种方法不属于统计模式识别方法?A. 最小二乘法B. 感知机C. 支持向量机D. 决策树答案:A3. 在模式识别中,以下哪种技术用于降低特征维度?A. 主成分分析(PCA)B. 线性判别分析(LDA)C. 神经网络D. K-均值聚类答案:A4. 以下哪一种模式识别方法适用于非线性问题?A. 线性判别分析(LDA)B. 支持向量机(SVM)C. 主成分分析(PCA)D. K-最近邻(K-NN)答案:B5. 以下哪一项不是模式识别的评价指标?A. 准确率B. 精确率C. 召回率D. 信息熵答案:D二、填空题(每题2分,共20分)6. 模式识别的主要任务包括分类、回归、聚类和________。
答案:预测7. 统计模式识别方法包括最小二乘法、感知机、________和决策树。
答案:支持向量机8. 主成分分析(PCA)的主要目的是________特征。
答案:降低维度9. 在模式识别中,________用于将样本分为不同的类别。
答案:分类器10. 支持向量机(SVM)的基本思想是找到一个________,使得不同类别的样本之间的间隔最大化。
答案:最优分割超平面三、简答题(每题10分,共30分)11. 请简述模式识别的主要步骤。
答案:(1)数据预处理:对原始数据进行清洗、标准化和降维等处理。
(2)特征提取:从原始数据中提取有助于分类的特征。
(3)模型训练:使用训练集对分类器进行训练。
(4)模型评估:使用测试集对分类器的性能进行评估。
(5)模型优化:根据评估结果对模型进行调整和优化。
12. 请简述支持向量机(SVM)的基本原理。
支持向量机是一种二分类模型,其基本思想是找到一个最优分割超平面,使得不同类别的样本之间的间隔最大化。
SVM通过求解一个凸二次规划问题来寻找最优分割超平面,从而实现分类任务。
模式识别习题及答案模式识别习题及答案【篇一:模式识别题目及答案】p> t,方差?1?(2,0)-1/2??11/2??1t,第二类均值为,方差,先验概率??(2,2)?122???1??1/21??-1/2p(?1)?p(?2),试求基于最小错误率的贝叶斯决策分界面。
解根据后验概率公式p(?ix)?p(x?i)p(?i)p(x),(2’)及正态密度函数p(x?i)?t(x??)?i(x??i)/2] ,i?1,2。
(2’) i?1基于最小错误率的分界面为p(x?1)p(?1)?p(x?2)p(?2),(2’) 两边去对数,并代入密度函数,得(x??1)t?1(x??1)/2?ln?1??(x??2)t?2(x??2)/2?ln?2(1) (2’)1?14/3-2/3??4/32/3??1由已知条件可得?1??2,?1,?2??2/34/3?,(2’)-2/34/31设x?(x1,x2)t,把已知条件代入式(1),经整理得x1x2?4x2?x1?4?0,(5’)二、(15分)设两类样本的类内离散矩阵分别为s1??11/2?, ?1/21?-1/2??1tt,各类样本均值分别为?1?,?2?,试用fisher准(1,0)(3,2)s2-1/21??(2,2)的类别。
则求其决策面方程,并判断样本x?解:s?s1?s2??t20?(2’) ??02?1/20??-2??-1?*?1w?s()?投影方向为12?01/22?1? (6’) ???阈值为y0?w(?1??2)/2??-1-13 (4’)*t2?1?给定样本的投影为y?w*tx??2-1?24?y0,属于第二类(3’) ??1?三、(15分)给定如下的训练样例实例 x0 x1 x2 t(真实输出) 1 1 1 1 1 2 1 2 0 1 3 1 0 1 -1 4 1 1 2 -1用感知器训练法则求感知器的权值,设初始化权值为w0?w1?w2?0;1 第1次迭代2 第2次迭代(4’)(2’)3 第3和4次迭代四、(15分)i. 推导正态分布下的最大似然估计;ii. 根据上步的结论,假设给出如下正态分布下的样本,估计该部分的均值和方差两个参数。
第5章:线性判别函数第一部份:计算与证明1.有四个来自于两个类别的二维空间中的样本,其中第一类的两个样本为(1,4)T和(2,3)T,第二类的两个样本为(4,1)T和(3,2)T。
那个地址,上标T表示向量转置。
假设初始的权向量a=(0,1)T,且梯度更新步长k固定为1。
试利用批处置感知器算法求解线性判别函数g(y)=a T y的权向量。
解:第一对样本进行标准化处置。
将第二类样本更改成(4,1)T和(3,2)T. 然后计算错分样本集:g(y1) = (0,1)(1,4)T = 4 > 0 (正确)g(y2) = (0,1)(2,3)T = 3 > 0 (正确)g(y3) = (0,1)(-4,-1)T = -1 < 0 (错分)g(y4) = (0,1)(-3,-2)T = -2 < 0 (错分)因此错分样本集为Y={(-4,-1)T , (-3,-2)T }.接着,对错分样本集求和:(-4,-1)T+(-3,-2)T = (-7,-3)T第一次修正权向量a,以完成一次梯度下降更新:a=(0,1)T+ (-7,-3)T=(-7,-2)T再次计算错分样本集:g(y1) = (-7,-2)(1,4)T = -15 < 0 (错分)g(y2) = (-7,-2)(2,3)T = -20 < 0 (错分)g(y3) = (-7,-2)(-4,-1)T = 30 > 0 (正确)g(y4) = (-7,-2)(-3,-2)T = 25 > 0 (正确)因此错分样本集为Y={(1,4)T , (2,3)T }.接着,对错分样本集求和:(1,4)T +(2,3)T = (3,7)T第二次修正权向量a ,以完成二次梯度下降更新:a=(-7,-2)T + (3,7)T =(-4,5)T 再次计算错分样本集:g(y 1) = (-4,5)(1,4)T = 16 > 0 (正确) g(y 2) = (-4,5)(2,3)T = 7 > 0 (正确) g(y 3) = (-4,5)(-4,-1)T = 11 > 0 (正确) g(y 4) = (-4,5)(-3,-2)T = 2 > 0 (正确)现在,全数样本均被正确分类,算法终止,所得权向量a=(-4,5)T 。
模式识别期末试题及答案正文:模式识别期末试题及答案1. 选择题1.1 下列关于机器学习的说法中,正确的是:A. 机器学习是一种人工智能的应用领域B. 机器学习只能应用于结构化数据C. 机器学习不需要预先定义规则D. 机器学习只能处理监督学习问题答案:A1.2 在监督学习中,以下哪个选项描述了正确的训练过程?A. 通过输入特征和预期输出,训练一个模型来进行预测B. 通过输入特征和可能的输出,训练一个模型来进行预测C. 通过输入特征和无标签的数据,训练一个模型来进行预测D. 通过输入特征和已有标签的数据,训练一个模型来进行分类答案:D2. 简答题2.1 请解释什么是模式识别?模式识别是指在给定一组输入数据的情况下,通过学习和建模,识别和分类输入数据中的模式或规律。
通过模式识别算法,我们可以从数据中提取重要的特征,并根据这些特征进行分类、聚类或预测等任务。
2.2 请解释监督学习和无监督学习的区别。
监督学习是一种机器学习方法,其中训练数据包含了输入特征和对应的标签或输出。
通过给算法提供已知输入和输出的训练样本,监督学习的目标是学习一个函数,将新的输入映射到正确的输出。
而无监督学习则没有标签或输出信息。
无监督学习的目标是从未标记的数据中找到模式和结构。
这种学习方法通常用于聚类、降维和异常检测等任务。
3. 计算题3.1 请计算以下数据集的平均值:[2, 4, 6, 8, 10]答案:63.2 请计算以下数据集的标准差:[1, 3, 5, 7, 9]答案:2.834. 综合题4.1 对于一个二分类问题,我们可以使用逻辑回归模型进行预测。
请简要解释逻辑回归模型的原理,并说明它适用的场景。
逻辑回归模型是一种用于解决二分类问题的监督学习算法。
其基本原理是通过将特征的线性组合传递给一个非线性函数(称为sigmoid函数),将实数值映射到[0,1]之间的概率。
这个映射的概率可以被解释为某个样本属于正类的概率。
逻辑回归适用于需要估计二分类问题的概率的场景,例如垃圾邮件分类、欺诈检测等。
模式识别期末考试题及答案一、选择题(每题2分,共20分)1. 以下哪项不属于模式识别的主要任务?A. 分类B. 回归C. 聚类D. 降维答案:B2. 以下哪种方法不属于模式识别的监督学习方法?A. 支持向量机B. 决策树C. 神经网络D. K-均值聚类答案:D3. 在模式识别中,特征选择和特征提取的主要目的是什么?A. 提高模型的泛化能力B. 减少模型的计算复杂度C. 提高模型的准确率D. 所有以上选项答案:D4. 以下哪种距离度量方法不适用于模式识别?A. 欧几里得距离B. 曼哈顿距离C. 余弦相似度D. 切比雪夫距离答案:C5. 以下哪种算法不属于模式识别中的分类算法?A. K-最近邻B. 支持向量机C. 线性回归D. 决策树答案:C二、填空题(每题2分,共20分)1. 模式识别的主要任务包括分类、回归、聚类和__________。
答案:降维2. 监督学习算法包括线性判别分析、__________、神经网络等。
答案:支持向量机3. 无监督学习算法包括K-均值聚类、层次聚类、__________等。
答案:DBSCAN4. 特征选择和特征提取的主要目的是降低数据的__________和__________。
答案:维度、计算复杂度5. 模式识别中常用的距离度量方法有欧几里得距离、曼哈顿距离、余弦相似度和__________。
答案:切比雪夫距离三、判断题(每题2分,共20分)1. 模式识别是人工智能领域中一个重要的分支,主要研究如何使计算机能够自动识别和处理模式。
()答案:√2. 监督学习算法和无监督学习算法在模式识别中具有相同的作用。
()答案:×3. 支持向量机是一种基于最大间隔的分类算法。
()答案:√4. K-均值聚类算法是一种基于距离度量的聚类算法。
()答案:√5. 特征选择和特征提取的主要目的是提高模型的泛化能力。
()答案:√四、简答题(每题10分,共30分)1. 简述模式识别的基本流程。
一、填空与选择填空(本题答案写在此试卷上,30分)1、模式识别系统的基本构成单元包括:模式采集、特征提取与选择和模式分类。
2、统计模式识别中描述模式的方法一般使用特真矢量;句法模式识别中模式描述方法一般有串、树、网。
3、聚类分析算法属于(1);判别域代数界面方程法属于(3)。
(1)无监督分类 (2)有监督分类(3)统计模式识别方法(4)句法模式识别方法4、若描述模式的特征量为0-1二值特征量,则一般采用(4)进行相似性度量。
(1)距离测度(2)模糊测度(3)相似测度(4)匹配测度5、下列函数可以作为聚类分析中的准则函数的有(1)(3)(4)。
(1)(2) (3)(4)6、Fisher线性判别函数的求解过程是将N维特征矢量投影在(2)中进行。
(1)二维空间(2)一维空间(3)N-1维空间7、下列判别域界面方程法中只适用于线性可分情况的算法有(1);线性可分、不可分都适用的有(3)。
(1)感知器算法(2)H-K算法(3)积累位势函数法8、下列四元组中满足文法定义的有(1)(2)(4)。
(1)({A, B}, {0, 1}, {A→01, A→ 0A1 , A→ 1A0 , B→BA , B→ 0}, A)(2)({A}, {0, 1}, {A→0, A→ 0A}, A)(3)({S}, {a, b}, {S → 00S, S → 11S, S → 00, S → 11}, S)(4)({A}, {0, 1}, {A→01, A→ 0A1, A→ 1A0}, A)9、影响层次聚类算法结果的主要因素有(计算模式距离的测度、(聚类准则、类间距离门限、预定的类别数目))。
10、欧式距离具有( 1、2 );马式距离具有(1、2、3、4 )。
(1)平移不变性(2)旋转不变性(3)尺度缩放不变性(4)不受量纲影响的特性11、线性判别函数的正负和数值大小的几何意义是(正(负)表示样本点位于判别界面法向量指向的正(负)半空间中;绝对值正比于样本点到判别界面的距离。
一、(15分)设有两类正态分布的样本集,第一类均值为T1μ=(2,0),方差11⎡⎤∑=⎢⎥⎣⎦11/21/2,第二类均值为T2μ=(2,2),方差21⎡⎤∑=⎢⎥⎣⎦1-1/2-1/2,先验概率12()()p p ωω=,试求基于最小错误率的贝叶斯决策分界面。
解 根据后验概率公式()()()()i i i p x p p x p x ωωω=, (2’)及正态密度函数11/21()exp[()()/2]2T i i i i nip x x x ωμμπ-=--∑-∑ ,1,2i =。
(2’) 基于最小错误率的分界面为1122()()()()p x p p x p ωωωω=, (2’) 两边去对数,并代入密度函数,得1111112222()()/2ln ()()/2ln T T x x x x μμμμ----∑--∑=--∑--∑ (1) (2’)由已知条件可得12∑=∑,114/3-⎡⎤∑=⎢⎥⎣⎦4/3-2/3-2/3,214/3-⎡⎤∑=⎢⎥⎣⎦4/32/32/3,(2’)设12(,)Tx x x =,把已知条件代入式(1),经整理得1221440x x x x --+=, (5’)二、(15分)设两类样本的类内离散矩阵分别为11S ⎡⎤=⎢⎥⎣⎦11/21/2, 21S ⎡⎤=⎢⎥⎣⎦1-1/2-1/2,各类样本均值分别为T 1μ=(1,0),T2μ=(3,2),试用fisher 准则求其决策面方程,并判断样本Tx =(2,2)的类别。
解:122S S S ⎡⎤=+=⎢⎥⎣⎦200 (2’) 投影方向为*112-2-1()211/2w S μμ-⎡⎤⎡⎤⎡⎤=-==⎢⎥⎢⎥⎢⎥--⎣⎦⎣⎦⎣⎦1/200 (6’)阈值为[]*0122()/2-1-131T y w μμ⎡⎤=+==-⎢⎥⎣⎦(4’)给定样本的投影为[]*0-12241T y w x y ⎡⎤===-<⎢⎥-⎣⎦, 属于第二类 (3’)三、 (15分)给定如下的训练样例实例 x0 x1 x2 t(真实输出) 1 1 1 1 1 2 1 2 0 1 3 1 0 1 -1 4 1 1 2 -1用感知器训练法则求感知器的权值,设初始化权值为0120w w w ===;1 第1次迭代(4’)2 第2次迭代(2’)3 第3和4次迭代四、 (15分)i. 推导正态分布下的最大似然估计;ii. 根据上步的结论,假设给出如下正态分布下的样本{}1,1.1,1.01,0.9,0.99,估计该部分的均值和方差两个参数。
模式识别期末考试题及答案一、填空题1. 模式识别是研究通过_________从观测数据中自动识别和分类模式的一种学科。
答案:计算机算法2. 在模式识别中,特征选择的主要目的是_________。
答案:降低数据的维度3. 支持向量机(SVM)的基本思想是找到一个最优的超平面,使得两类数据的_________最大化。
答案:间隔4. 主成分分析(PCA)是一种_________方法,用于降低数据的维度。
答案:线性降维5. 隐马尔可夫模型(HMM)是一种用于处理_________数据的统计模型。
答案:时序二、选择题6. 以下哪种方法不属于模式识别的监督学习方法?()A. 线性判别分析B. 支持向量机C. 神经网络D. K-means聚类答案:D7. 在以下哪种情况下,可以使用主成分分析(PCA)进行特征降维?()A. 数据维度较高,且特征之间存在线性关系B. 数据维度较高,且特征之间存在非线性关系C. 数据维度较低,且特征之间存在线性关系D. 数据维度较低,且特征之间存在非线性关系答案:A8. 以下哪个算法不属于聚类算法?()A. K-meansB. 层次聚类C. 判别分析D. 密度聚类答案:C三、判断题9. 模式识别的目的是将输入数据映射到事先定义的类别中。
()答案:正确10. 在模式识别中,特征提取和特征选择是两个不同的概念,其中特征提取是将原始特征转换为新的特征,而特征选择是从原始特征中筛选出有用的特征。
()答案:正确四、简答题11. 简述模式识别的主要任务。
答案:模式识别的主要任务包括:分类、回归、聚类、异常检测等。
其中,分类和回归任务属于监督学习,聚类和异常检测任务属于无监督学习。
12. 简述支持向量机(SVM)的基本原理。
答案:支持向量机的基本原理是找到一个最优的超平面,使得两类数据的间隔最大化。
具体来说,SVM通过求解一个凸二次规划问题来确定最优超平面,使得训练数据中的正类和负类数据点尽可能远离这个超平面。
题1:在一个10类的模式识别问题中,有3类单独满足多类情况1,其余的类别满足多类情况2。
问该模式识别问题所需判别函数的最少数目是多少?答:将10类问题可看作4类满足多类情况1的问题,可将3类单独满足多类情况1的类找出来,剩下的7类全部划到4类中剩下的一个子类中。
再在此子类中,运用多类情况2的判别法则进行分类,此时需要7*(7-1)/2=21个判别函数。
故共需要4+21=25个判别函数。
题2:一个三类问题,其判别函数如下:d1(x)=-x1, d2(x)=x1+x2-1, d3(x)=x1-x2-11.设这些函数是在多类情况1条件下确定的,绘出其判别界面和每一个模式类别的区域。
2.设为多类情况2,并使:d12(x)= d1(x), d13(x)= d2(x), d23(x)= d3(x)。
绘出其判别界面和多类情况2的区域。
3.设d1(x), d2(x)和d3(x)是在多类情况3的条件下确定的,绘出其判别界面和每类的区域。
答:三种情况分别如下图所示:1.2.3.题3:两类模式,每类包括5个3维不同的模式,且良好分布。
如果它们是线性可分的,问权向量至少需要几个系数分量?假如要建立二次的多项式判别函数,又至少需要几个系数分量?(设模式的良好分布不因模式变化而改变。
)答:(1)若是线性可分的,则权向量至少需要14N n =+=个系数分量; (2)若要建立二次的多项式判别函数,则至少需要5!102!3!N ==个系数分量。
题4:用感知器算法求下列模式分类的解向量w : ω1: {(0 0 0)T, (1 0 0)T, (1 0 1)T, (1 1 0)T} ω2: {(0 0 1)T, (0 1 1)T, (0 1 0)T, (1 1 1)T}解:将属于2w 的训练样本乘以(1)-,并写成增广向量的形式x1=[0 0 0 1]',x2=[1 0 0 1]',x3=[1 0 1 1]',x4=[1 1 0 1]';x5=[0 0 -1 -1]',x6=[0 -1 -1 -1]',x7=[0 -1 0 -1]',x8=[-1 -1 -1 -1]';迭代选取1C =,(1)(0,0,0,0)w '=,则迭代过程中权向量w 变化如下:(2)(0 0 0 1)w '=;(3)(0 0 -1 0)w '=;(4)(0 -1 -1 -1)w '=;(5)(0 -1 -1 0)w '=;(6)(1 -1 -1 1)w '=;(7)(1 -1 -2 0)w '=;(8)(1 -1 -2 1)w '=;(9)(2 -1 -1 2)w '=; (10)(2 -1 -2 1)w '=;(11)(2 -2 -2 0)w '=;(12)(2 -2 -2 1)w '=;收敛所以最终得到解向量(2 -2 -2 1)w '=,相应的判别函数为123()2221d x x x x =--+。
1.简述模式的概念及其直观特性,模式识别的分类,有哪几种方法.(6’)答(1):什么是模式?广义地说,存在于时间和空间中可观察的物体,如果我们可以区别它们是否相同或是否相似,都可以称之为模式.模式所指的不是事物本身,而是从事物获得的信息,因此,模式往往表现为具有时间和空间分布的信息。
模式的直观特性:可观察性;可区分性;相似性.答(2):模式识别的分类:假说的两种获得方法(模式识别进行学习的两种方法):●监督学习、概念驱动或归纳假说;●非监督学习、数据驱动或演绎假说。
模式分类的主要方法:●数据聚类:用某种相似性度量的方法将原始数据组织成有意义的和有用的各种数据集。
是一种非监督学习的方法,解决方案是数据驱动的。
●统计分类:基于概率统计模型得到各类别的特征向量的分布,以取得分类的方法。
特征向量分布的获得是基于一个类别已知的训练样本集。
是一种监督分类的方法,分类器是概念驱动的.●结构模式识别:该方法通过考虑识别对象的各部分之间的联系来达到识别分类的目的。
(句法模式识别)●神经网络:由一系列互相联系的、相同的单元(神经元)组成。
相互间的联系可以在不同的神经元之间传递增强或抑制信号。
增强或抑制是通过调整神经元相互间联系的权重系数来(weight)实现。
神经网络可以实现监督和非监督学习条件下的分类。
2.什么是神经网络?有什么主要特点?选择神经网络模式应该考虑什么因素?(8’)答(1):所谓人工神经网络就是基于模仿生物大脑的结构和功能而构成的一种信息处理系统(计算机)。
由于我们建立的信息处理系统实际上是模仿生理神经网络,因此称它为人工神经网络。
这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的。
人工神经网络的两种操作过程:训练学习、正常操作(回忆操作).答(2):人工神经网络的特点:●固有的并行结构和并行处理;●知识的分布存储;●有较强的容错性;●有一定的自适应性;人工神经网络的局限性:●人工神经网络不适于高精度的计算;●人工神经网络不适于做类似顺序计数的工作;●人工神经网络的学习和训练往往是一个艰难的过程;●人工神经网络必须克服时间域顺序处理方面的困难;●硬件限制;●正确的训练数据的收集.答(3):选取人工神经网络模型,要基于应用的要求和人工神经网络模型的能力间的匹配,主要考虑因素包括:●网络大小;●所需输出类型;●联想记忆类型;●训练方法;●时间的限定.3.画出句法模式识别的框图,并解释其工作原理。
(8’)答(1):句法模式识别框图如下:答(2):句法模式识别系统的组成:图像预处理,图像分割,基元及其关系识别,句法分析.基于描述模式的结构信息,用形式语言中的规则进行分类,可以更典型地应用于景物图片的分析。
因为在这类问题中,所研究的模式通常十分复杂,需要的特征也很多,仅用数值上的特征不足以反映它们的类别.句法模式识别系统处理过程:基元本身包含的结构信息已不多,仅需少量特征即可识别。
如果用有限个字符代表不同的基元,则由基元按一定结构关系组成的子图或图形可以用一个有序的字符串来代表。
假如事先用形式语言的规则从字符串中推断出能生成它的文法,则可以通过句法分析,按给定的句法(文法)来辨识由基元字符组成的句子,从而判别它是否属于由该给定文法所能描述的模式类,达到分类的目的.4。
(1)解释线性判别函数进行模式分类的概念;(2)既然有了线性判别函数,为什么还要用非线性判别函数进行模式分类?(3)两类模式,每类包括5个3维不同的模式,且良好分布。
如果它们是线性可分的,问权向量至少需要几个系数分量?假如要建立二次的多项式判别函数,又至少需要几个系数分量?(设模式的良好分布不因模式变化而改变。
)(8’)答(1):模式识别系统的主要作用是判别各个模式所属的类别.线性判别函数分类就是使用线性判别函数将多类样本模式分开。
一个n 维线性判别函数的一般形式:1122101()Tn n n n d x w x w x w x w w x w ++=++++=+其中012(,,...,)T n w w w w =称为权向量(或参数向量),12(,,...,)T n x x x x =.()d x 也可表示为:()T d x w x =其中,12(,,...,,1)T n x x x x =称为增广模式向量,0121(,,...,,)T n n w w w w w +=称为增广权向量。
两类情况:判别函数()d x :120()0Tif x d x w x if x ωω>∈==≤∈⎧⎨⎩多类情况:设模式可分成12,,...,M ωωω共M 类,则有三种划分方法:● 多类情况1用线性判别函数将属于i ω类的模式与不属于i ω类的模式分开,其判别函数为:0()0iTi iiif x d x w x if x ωω>∈==≤∉⎧⎨⎩这种情况称为/i i ωω两分法,即把M 类多类问题分成M 个两类问题,因此共有M 个判别函数,对应的判别函数的权向量为,1,2,...,n 1i w i =+.● 多类情况2采用每对划分,即|i j ωω两分法,此时一个判别界面只能分开两种类别,但不能把它与其余所有的界面分开.其判别函数为:()Tij ij d x w x =若()0ij d x >,j i ∀≠,则i x ω∈重要性质:ij ji d d =-要分开M 类模式,共需M(M-1)/2个判别函数。
不确定区域:若所有()ij d x ,找不到j i ∀≠,()0ij d x >的情况.● 多类情况3(多类情况2的特例)这是没有不确定区域的|i j ωω两分法.假若多类情况2中的ij d 可分解成:()()()()T ij i j i j d x d x d x w w x =-=-,则0ij d >相当于()()i j d x d x >,j i ∀≠。
这时不存在不确定区域。
此时,对M 类情况应有M 个判别函数:(),1,2,,Tk k d x w x k M ==即()()i j d x d x >,j i ∀≠,,1,2,...i j M =,则i x ω∈,也可写成,若()max{(),1,2,...,}i k d x d x k M ==,则i x ω∈。
该分类的特点是把M 类情况分成M-1个两类问题。
模式分类若可用任一个线性函数来划分,则这些模式就称为线性可分的,否则就是非线性可分的。
一旦线性函数的系数wk 被确定,这些函数就可用作模式分类的基础。
对于M 类模式的分类,多类情况1需要M 个判别函数,而多类情况2需要M*(M-1)/2个判别函数,当M 较大时,后者需要更多的判别式(这是多类情况2的一个缺点)。
采用多类情况1时,每一个判别函数都要把一种类别的模式与其余M —1种类别的模式分开,而不是将一种类别的模式仅与另一种类别的模式分开.由于一种模式的分布要比M-1种模式的分布更为聚集,因此多类情况2对模式是线性可分的可能性比多类情况1更大一些(这是多类情况2的一个优点)。
答(2)广义线性判别函数出发点:● 线性判别函数简单,容易实现; ● 非线性判别函数复杂,不容易实现;● 若能将非线性判别函数转换为线性判别函数,则有利于模式分类的实现。
采用广义线性判别函数的概念,可以通过增加维数来得到线性判别,但维数的大量增加会使在低维空间里在解析和计算上行得通的方法在高维空间遇到困难,增加计算的复杂性。
所以某些情况下使用非线性判别函数或分段线性判别函数效果更好.解(3)假设该两类模式是线性可分的,则在三维空间中一个线性平面可以将这两类模式分开,所以判别函数可以写成:1234()d x w x w x w x w =+++所以权向量需要4个系数。
对于n 维x 向量,采用r 次多项式,d (x )的权系数w 的项数为:()!!!rw n r n r N C r n ++==当r=2,n=3时,(2)!(2)(1)102!!2W n n n N n +++===所以,此时权向量需要10个系数分量。
5. 设一有限态自动机01202({0,1},{,,},,,}A q q q q q δ=,δ定义如下:021222011021(,0),(,0),(,0)(,1),(,1),(,1)q q q q q q q q q q q q δδδδδδ======试求等价的正则文法,使得L (G)=T (A)。
(10')解:设由A 得一正则文法(,,),N T G V V P S =,则12{,,}N V S x x =,{0,1}T V =,0S q =由01(,1)q q δ=,得生成式11S x −−→ 由02(,0)q q δ=,得生成式20,0S S x −−→−−→ 由10(,1)q q δ=,得生成式11x S −−→ 由12(,0)q q δ=,得生成式1120,0x x x −−→−−→ 由21(,1)q q δ=,得生成式211x x −−→ 由22(,0)q q δ=,得生成式2220,0x x x −−→−−→ 对比实例:当扫描字符串1110时,A 按以下状态序列接受该字符串201101110q q q q q −→−−→−−→−−→−用对应的正则文法G 推导,得:111111111110S x S x ⇒⇒⇒⇒按有限态自动机确定正则文法给定一个有限态自动机0(,,,,)A Q q F δ=∑,可确定一个正则文法(,,,)N T G V V P S =,使得L(G) = T(A).由0111{,,...,,},n n n Q q q q q q F ++=∈ ,可确定:121{,,,...,x ,}N n n V S x x x +=,0S q =,i i x q =,T V =∑. 从δ求G 中的生成式P 可按如下原则: (1) 若(,)i j q a q δ=,则i j x ax → (2)若1(,)i n q a q δ+=,则1,i i n x a x ax +→→6. K-均值算法聚类:K=2,初始聚类中心为12,x x ,数据为:(10’)12345678910{(0,0),(1,0),(0,1),(1,1),(8,7)(9,7),(8,8),(9,8),(8,9),(9,9)}x x x x x x x x x x ==========算法:第一步:选K 个初始聚类中心,12(1),z (1),...,(1)k z z ,其中括号内的序号为寻找聚类中心的迭代运算的次序号。
可选开始的K 个模式样本的向量值作为初始聚类中心。
第二步:逐个将需分类的模式样本{}x 按最小距离准则分配给K 个聚类中心中的某一个(1)j z .即()min{(),1,2,}j i D k x z k i K =-=,则()j x S k ∈,其中k 为迭代运算的次序号,第一次迭代1k =,j S 表示第j 个聚类,其聚类中心为j z 。