武科大2012级模式识别试卷
- 格式:docx
- 大小:15.10 KB
- 文档页数:1
模式识别试卷及答案一、选择题(每题5分,共30分)1. 以下哪一项不是模式识别的主要任务?A. 分类B. 回归C. 聚类D. 预测答案:B2. 以下哪种算法不属于监督学习?A. 支持向量机(SVM)B. 决策树C. K最近邻(K-NN)D. K均值聚类答案:D3. 在模式识别中,以下哪一项是特征选择的目的是?A. 减少特征维度B. 增强模型泛化能力C. 提高模型计算效率D. 所有上述选项答案:D4. 以下哪种模式识别方法适用于非线性问题?A. 线性判别分析(LDA)B. 主成分分析(PCA)C. 支持向量机(SVM)D. 线性回归答案:C5. 在神经网络中,以下哪种激活函数常用于输出层?A. SigmoidB. TanhC. ReLUD. Softmax答案:D6. 以下哪种聚类算法是基于密度的?A. K均值聚类B. 层次聚类C. DBSCAND. 高斯混合模型答案:C二、填空题(每题5分,共30分)1. 模式识别的主要任务包括______、______、______。
答案:分类、回归、聚类2. 在监督学习中,训练集通常分为______和______两部分。
答案:训练集、测试集3. 支持向量机(SVM)的基本思想是找到一个______,使得不同类别的数据点被最大化地______。
答案:最优分割超平面、间隔4. 主成分分析(PCA)是一种______方法,用于降维和特征提取。
答案:线性变换5. 神经网络的反向传播算法用于______。
答案:梯度下降6. 在聚类算法中,DBSCAN算法的核心思想是找到______。
答案:密度相连的点三、简答题(每题10分,共30分)1. 简述模式识别的基本流程。
答案:模式识别的基本流程包括以下几个步骤:(1)数据预处理:对原始数据进行清洗、标准化和特征提取。
(2)模型选择:根据问题类型选择合适的模式识别算法。
(3)模型训练:使用训练集对模型进行训练,学习数据特征和规律。
一、填空与选择填空(本题答案写在此试卷上,30分)1、模式识别系统的基本构成单元包括:模式采集、特征提取与选择和模式分类。
2、统计模式识别中描述模式的方法一般使用特真矢量;句法模式识别中模式描述方法一般有串、树、网。
3、聚类分析算法属于(1);判别域代数界面方程法属于(3)。
(1)无监督分类 (2)有监督分类(3)统计模式识别方法(4)句法模式识别方法4、若描述模式的特征量为0-1二值特征量,则一般采用(4)进行相似性度量。
(1)距离测度(2)模糊测度(3)相似测度(4)匹配测度5、下列函数可以作为聚类分析中的准则函数的有(1)(3)(4)。
(1)(2) (3)(4)6、Fisher线性判别函数的求解过程是将N维特征矢量投影在(2)中进行。
(1)二维空间(2)一维空间(3)N-1维空间7、下列判别域界面方程法中只适用于线性可分情况的算法有(1);线性可分、不可分都适用的有(3)。
(1)感知器算法(2)H-K算法(3)积累位势函数法8、下列四元组中满足文法定义的有(1)(2)(4)。
(1)({A, B}, {0, 1}, {A→01, A→ 0A1 , A→ 1A0 , B→BA , B→ 0}, A) (2)({A}, {0, 1}, {A→0, A→ 0A}, A)(3)({S}, {a, b}, {S → 00S, S → 11S, S → 00, S → 11}, S)(4)({A}, {0, 1}, {A→01, A→ 0A1, A→ 1A0}, A)9、影响层次聚类算法结果的主要因素有(计算模式距离的测度、(聚类准则、类间距离门限、预定的类别数目))。
10、欧式距离具有( 1、2 );马式距离具有(1、2、3、4 )。
(1)平移不变性(2)旋转不变性(3)尺度缩放不变性(4)不受量纲影响的特性11、线性判别函数的正负和数值大小的几何意义是(正(负)表示样本点位于判别界面法向量指向的正(负)半空间中;绝对值正比于样本点到判别界面的距离。
大学模式识别考试题及答案详解Document number:PBGCG-0857-BTDO-0089-PTT1998一、填空与选择填空(本题答案写在此试卷上,30分)1、模式识别系统的基本构成单元包括:模式采集、特征提取与选择和模式分类。
2、统计模式识别中描述模式的方法一般使用特真矢量;句法模式识别中模式描述方法一般有串、树、网。
3、聚类分析算法属于(1);判别域代数界面方程法属于(3)。
(1)无监督分类 (2)有监督分类(3)统计模式识别方法(4)句法模式识别方法4、若描述模式的特征量为0-1二值特征量,则一般采用(4)进行相似性度量。
(1)距离测度(2)模糊测度(3)相似测度(4)匹配测度5、下列函数可以作为聚类分析中的准则函数的有(1)(3)(4)。
(1)(2) (3)(4)6、Fisher线性判别函数的求解过程是将N维特征矢量投影在(2)中进行。
(1)二维空间(2)一维空间(3)N-1维空间7、下列判别域界面方程法中只适用于线性可分情况的算法有(1);线性可分、不可分都适用的有(3)。
(1)感知器算法(2)H-K算法(3)积累位势函数法8、下列四元组中满足文法定义的有(1)(2)(4)。
(1)({A, B}, {0, 1}, {A?01, A? 0A1 , A? 1A0 , B?BA , B? 0}, A)(2)({A}, {0, 1}, {A?0, A? 0A}, A)(3)({S}, {a, b}, {S ? 00S, S ? 11S, S ? 00, S ? 11}, S)(4)({A}, {0, 1}, {A?01, A? 0A1, A? 1A0}, A)二、(15分)简答及证明题(1)影响聚类结果的主要因素有那些?(2)证明马氏距离是平移不变的、非奇异线性变换不变的。
答:(1)分类准则,模式相似性测度,特征量的选择,量纲。
(2)证明:(2分)(2分)(1分)设,有非奇异线性变换:(1分)(4分)三、(8分)说明线性判别函数的正负和数值大小在分类中的意义并证明之。
二、(15分)简答及证明题(1)影响聚类结果的主要因素有那些?(2)证明马氏距离是平移不变的、非奇异线性变换不变的。
答:(1)分类准则,模式相似性测度,特征量的选择,量纲。
(2)证明:(2分)(2分)(1分)设,有非奇异线性变换:(1分)(4分)三、(8分)说明线性判别函数的正负和数值大小在分类中的意义并证明之。
答:(1)(4分)的绝对值正比于到超平面的距离平面的方程可以写成式中。
于是是平面的单位法矢量,上式可写成设是平面中的任一点,是特征空间中任一点,点到平面的距离为差矢量在上的投影的绝对值,即(1-1)上式中利用了在平面中,故满足方程式(1-1)的分子为判别函数绝对值,上式表明,的值正比于到超平面的距离,一个特征矢量代入判别函数后所得值的绝对值越大表明该特征点距判别界面越远。
(2)(4分)的正(负)反映在超平面的正(负)侧两矢量和的数积为(2分)显然,当和夹角小于时,即在指向的那个半空间中,>0;反之,当和夹角大于时,即在背向的那个半空间中,<0。
由于,故和同号。
所以,当在指向的半空间中时,;当在背向的半空间中,。
判别函数值的正负表示出特征点位于哪个半空间中,或者换句话说,表示特征点位于界面的哪一侧。
五、(12分,每问4分)在目标识别中,假定有农田和装甲车两种类型,类型ω1和类型ω2分别代表农田和装甲车,它们的先验概率分别为0.8和0.2,损失函数如表1所示。
现在做了三次试验,获得三个样本的类概率密度如下::0.3,0.1,0.6:0.7,0.8,0.3(1)试用贝叶斯最小误判概率准则判决三个样本各属于哪一个类型;(2)假定只考虑前两种判决,试用贝叶斯最小风险准则判决三个样本各属于哪一类;(3)把拒绝判决考虑在内,重新考核三次试验的结果。
表1类型损失判决1ω1α 1 45 11 1解:由题可知:,,,,(1)(4分)根据贝叶斯最小误判概率准则知:,则可以任判;,则判为;,则判为;(2)(4分)由题可知:则,判为;,判为;,判为;(3)(4分)对于两类问题,对于样本,假设已知,有则对于第一个样本,,则拒判;,则拒判;,拒判。
模式识别试卷专业: 班级: 姓名: 学号:一、计算题1、样本n=10,样本空间维数为3,计算线性超平面的二分能力,并指出在3维特征空间线性分类器的))(sgn(),(310∑=+=i i iw x w w x f 的VC 维是多少? 2、已知有两类样本 ω1=(x1,x2)={(1,0,1),(0,1,1)}; ω2=(x3,x4)={(1,1,0),(0,1,0)}试用感知器算法来设计线性分类器3.})5,6()6,5(,)5,4(,)4,5(,)5,5{(1T T T T T w ----------=})5,4()4,5(,)5,6(,)6,5(,)5,5{(2T T T T T w =试使用K-L 变换做一维特征提取。
4. 二维正态分布1(1,0)T u =-,2(1,0)T u =,12()()P P ωω=。
试分别写出以下两种情况的负对数似然比决策规则(负对数似然比定义为()ln[()]h l =-x x ):(1)12I ==ΣΣ(2)1112112⎡⎤⎢⎥=⎢⎥⎢⎥⎢⎥⎣⎦Σ,2112112⎡⎤-⎢⎥=⎢⎥⎢⎥-⎢⎥⎣⎦Σ 5. 设总体分布密度为(,1),N μμ-∞<<+∞,并设12{,,,}N x x x χ= ,分别用最大似然估计和贝叶斯估计计算ˆμ。
已知ˆμ的先验概率分布()~(0,1)p N μ。
二、程序设计题从/download.html 数据中任选一题;要求如下:1、 试卷上写明使用的方法原理,分类结果(错误率),所用方法的优缺点等2、 源程序发送到xudong1118@ (注:源程序不要打印在卷面上)三、综合题1、结合自己的课题方向谈谈模式识别的应用。
《模式识别》期末考试试题(B )一、填空题(15个空,每空2分,共30分)1.基于机器学习的模式识别系统通常由两个过程组成, 即分类器设计和( )。
2.统计模式识别把( )表达为一个随机向量(即特征向量), 将模式类表达为由有穷或无穷个具有相似数值特性的模式组成的集合。
3.特征一般有两种表达方法:(1)将特征表达为数值;(2)将特征表达为( )。
4.特征提取是指采用( )实现由模式测量空间向特征空间的转变。
5.同一类模式类样本的分布比较集中,没有或临界样本很少,这样的模式类称为( )。
6.加权空间的所有分界面都通过( )。
7.线性多类判别: 若每两个模式类间可用判别平面分开, 在这种情况下,M 类有( )个判别函数,存在有不确定区域。
8.当取0-1损失函数时, 最小风险贝叶斯判决准则等价于( )判决准则。
9.Neyman-Pearson 决策的基本思想是( )某一错误率,同时追求另一错误率最小。
10.聚类/集群:用事先不知样本的类别,而利用样本的先验知识来构造分类器属于( )学习。
11.相似性测度、聚类准则和( )称为聚类分析的三要素。
12.K/C 均值算法使用的聚类准则函数是误差平方和准则,通过反复迭代优化聚类结果,使所有样本到各自所属类别的中心的( )达到最小。
13.根据神经元的不同连接方式,可将神经网络分为分层网络和相互连接型网络两大类。
其中分层网络可细分为前向网络、( )和层内互连前向网络三种互连方式。
14.神经网络的特性及能力主要取决于网络拓扑结构及( )。
15.BP 神经网络是采用误差反向传播算法的多层前向网络,其中,神经元的传输函数为S 型函数,网络的输入和输出是一种( )映射关系。
二、简答题(2题,每小题10分,共20分)1.两类问题的最小风险Bayes 决策的主要思想是什么? 2.已知一组数据的协方差矩阵为11/21/21⎡⎤⎢⎥⎣⎦,试问: (1)协方差矩阵中各元素的含义是什么? (2)K-L 变换的最佳准则是什么?(3)为什么说经K-L 变换后消除了各分量之间的相关性?三、 计算题(2题,每小题13分,共26分)1.已知有两类样本集,分别为ω1={x 1, x 2}={(1,2)T , (-1,0)T }; ω2={x 3, x 4} ={(-1,-2)T , (1,-1)T } 设初始权值w 1=(1,1,1)T , ρk =1,试用感知器固定增量法求判别函数,画出决策面。
大学模式识别考试题及答案详解HUA system office room 【HUA16H-TTMS2A-HUAS8Q8-HUAH1688】一、填空与选择填空(本题答案写在此试卷上,30分)1、模式识别系统的基本构成单元包括:模式采集、特征提取与选择和模式分类。
2、统计模式识别中描述模式的方法一般使用特真矢量;句法模式识别中模式描述方法一般有串、树、网。
3、聚类分析算法属于(1);判别域代数界面方程法属于(3)。
(1)无监督分类 (2)有监督分类(3)统计模式识别方法(4)句法模式识别方法4、若描述模式的特征量为0-1二值特征量,则一般采用(4)进行相似性度量。
(1)距离测度(2)模糊测度(3)相似测度(4)匹配测度5、下列函数可以作为聚类分析中的准则函数的有(1)(3)(4)。
(1)(2) (3)(4)6、Fisher线性判别函数的求解过程是将N维特征矢量投影在(2)中进行。
(1)二维空间(2)一维空间(3)N-1维空间7、下列判别域界面方程法中只适用于线性可分情况的算法有(1);线性可分、不可分都适用的有(3)。
(1)感知器算法(2)H-K算法(3)积累位势函数法8、下列四元组中满足文法定义的有(1)(2)(4)。
(1)({A, B}, {0, 1}, {A01, A 0A1 , A 1A0 , B BA , B 0}, A)(2)({A}, {0, 1}, {A0, A 0A}, A)(3)({S}, {a, b}, {S 00S, S 11S, S 00, S 11}, S)(4)({A}, {0, 1}, {A01, A 0A1, A 1A0}, A)二、(15分)简答及证明题(1)影响聚类结果的主要因素有那些?(2)证明马氏距离是平移不变的、非奇异线性变换不变的。
答:(1)分类准则,模式相似性测度,特征量的选择,量纲。
(2)证明:(2分)(2分)(1分)设,有非奇异线性变换:(1分)(4分)三、(8分)说明线性判别函数的正负和数值大小在分类中的意义并证明之。
一、填空与选择填空(本题答案写在此试卷上,30分)1、模式识别系统的基本构成单元包括:模式采集、特征提取与选择和模式分类。
2、统计模式识别中描述模式的方法一般使用特真矢量;句法模式识别中模式描述方法一般有串、树、网。
3、聚类分析算法属于(1);判别域代数界面方程法属于(3)。
(1)无监督分类 (2)有监督分类(3)统计模式识别方法(4)句法模式识别方法4、若描述模式的特征量为0-1二值特征量,则一般采用(4)进行相似性度量。
(1)距离测度(2)模糊测度(3)相似测度(4)匹配测度5、下列函数可以作为聚类分析中的准则函数的有(1)(3)(4)。
(1)(2)(3)(4)6、Fisher线性判别函数的求解过程是将N维特征矢量投影在(2)中进行。
(1)二维空间(2)一维空间(3)N-1维空间7、下列判别域界面方程法中只适用于线性可分情况的算法有(1);线性可分、不可分都适用的有(3)。
(1)感知器算法(2)H-K算法(3)积累位势函数法8、下列四元组中满足文法定义的有(1)(2)(4)。
(1)({A, B}, {0, 1}, {A→01, A→ 0A1 , A→ 1A0 , B→BA , B→ 0}, A)(2)({A}, {0, 1}, {A→0, A→ 0A}, A)(3)({S}, {a, b}, {S → 00S, S → 11S, S → 00, S → 11}, S)(4)({A}, {0, 1}, {A→01, A→ 0A1, A→ 1A0}, A)9、影响层次聚类算法结果的主要因素有(计算模式距离的测度、(聚类准则、类间距离门限、预定的类别数目))。
10、欧式距离具有( 1、2 );马式距离具有(1、2、3、4 )。
(1)平移不变性(2)旋转不变性(3)尺度缩放不变性(4)不受量纲影响的特性11、线性判别函数的正负和数值大小的几何意义是(正(负)表示样本点位于判别界面法向量指向的正(负)半空间中;绝对值正比于样本点到判别界面的距离。
模式识别期末考试题及答案一、填空题1. 模式识别是研究通过_________从观测数据中自动识别和分类模式的一种学科。
答案:计算机算法2. 在模式识别中,特征选择的主要目的是_________。
答案:降低数据的维度3. 支持向量机(SVM)的基本思想是找到一个最优的超平面,使得两类数据的_________最大化。
答案:间隔4. 主成分分析(PCA)是一种_________方法,用于降低数据的维度。
答案:线性降维5. 隐马尔可夫模型(HMM)是一种用于处理_________数据的统计模型。
答案:时序二、选择题6. 以下哪种方法不属于模式识别的监督学习方法?()A. 线性判别分析B. 支持向量机C. 神经网络D. K-means聚类答案:D7. 在以下哪种情况下,可以使用主成分分析(PCA)进行特征降维?()A. 数据维度较高,且特征之间存在线性关系B. 数据维度较高,且特征之间存在非线性关系C. 数据维度较低,且特征之间存在线性关系D. 数据维度较低,且特征之间存在非线性关系答案:A8. 以下哪个算法不属于聚类算法?()A. K-meansB. 层次聚类C. 判别分析D. 密度聚类答案:C三、判断题9. 模式识别的目的是将输入数据映射到事先定义的类别中。
()答案:正确10. 在模式识别中,特征提取和特征选择是两个不同的概念,其中特征提取是将原始特征转换为新的特征,而特征选择是从原始特征中筛选出有用的特征。
()答案:正确四、简答题11. 简述模式识别的主要任务。
答案:模式识别的主要任务包括:分类、回归、聚类、异常检测等。
其中,分类和回归任务属于监督学习,聚类和异常检测任务属于无监督学习。
12. 简述支持向量机(SVM)的基本原理。
答案:支持向量机的基本原理是找到一个最优的超平面,使得两类数据的间隔最大化。
具体来说,SVM通过求解一个凸二次规划问题来确定最优超平面,使得训练数据中的正类和负类数据点尽可能远离这个超平面。
《模式识别》试题库一、基本概念题1.1 模式识别的三大核心问题是:、、。
1.2、模式分布为团状时,选用聚类算法较好。
1.3 欧式距离具有。
马式距离具有。
(1)平移不变性(2)旋转不变性(3)尺度缩放不变性(4)不受量纲影响的特性1.4 描述模式相似的测度有:。
(1)距离测度(2)模糊测度(3)相似测度(4)匹配测度1.5 利用两类方法处理多类问题的技术途径有:(1);(2);(3)。
其中最常用的是第个技术途径。
1.6 判别函数的正负和数值大小在分类中的意义是:,。
1.7 感知器算法。
(1)只适用于线性可分的情况;(2)线性可分、不可分都适用。
1.8 积累位势函数法的判别界面一般为。
(1)线性界面;(2)非线性界面。
1.9 基于距离的类别可分性判据有:。
(1)1[]w BTr S S-(2)BWSS(3)BW BSS S+1.10 作为统计判别问题的模式分类,在()情况下,可使用聂曼-皮尔逊判决准则。
1.11 确定性模式非线形分类的势函数法中,位势函数K(x,x k)与积累位势函数K(x)的关系为()。
1.12 用作确定性模式非线形分类的势函数法,通常,两个n维向量x和x k的函数K(x,x k)若同时满足下列三个条件,都可作为势函数。
①();②( ); ③ K(x,x k )是光滑函数,且是x 和x k 之间距离的单调下降函数。
1.13 散度J ij 越大,说明ωi 类模式与ωj 类模式的分布( )。
当ωi 类模式与ωj 类模式的分布相同时,J ij =( )。
1.14 若用Parzen 窗法估计模式的类概率密度函数,窗口尺寸h1过小可能产生的问题是( ),h1过大可能产生的问题是( )。
1.15 信息熵可以作为一种可分性判据的原因是: 。
1.16作为统计判别问题的模式分类,在( )条件下,最小损失判决规则与最小错误判决规则是等价的。
1.17 随机变量l(x ρ)=p( x ρ|ω1)/p( x ρ|ω2),l( x ρ)又称似然比,则E {l( x ρ)|ω2}=( )。
简答题:
1.一个模式识别系统由哪几部分组成?画出其原理框图。
2.什么是模式?作为统计判别问题的模式分类,在什么条件下,最小损失判决规则与最小错误判决是等价的?在什么情况下,可使用聂曼-皮尔逊判决准则?
3.描述模式相似的测度有哪些?模式识别中,马氏距离、欧氏距离各具有什么特性?马氏距离较之于欧式距离优点是什么?基于距离的类别可分性判据有哪些?
4.影响聚类算法结果的主要因素有哪些?模式分布为团状时,选用哪种聚类算法较好?
5.Kn近邻元法与Parzen窗法相比较的优势是什么?这两种算法的共同弱点是什么?
计算分析题:
1.假设在某个地区的细胞识别中正常w1和异常w2两类的先验概率分别为:正常状态:P(w1)=0.9,异常状态:P(w2)=0.1。
现有一待识的细胞,其观测值为x,从类条件概率密度分布曲线上查得:P(x/w1)=0.2,P(x/w2)=0.4,并且已知损失系数为λ11=0,λ12=1,λ21=6,λ22=0。
试对该细胞以以下两种方法进行分类:(1)基于最小错误概率准则的贝叶斯判决;(2)基于最小损失准则的贝叶斯判决。
请分析两种分类结果的异同及原因。
2.已知两类模式样本:w1:x1=(-1,0)T,x2=(1,0)T;w2:x3=(0,0)T,x4=(0,-1)T,试用LMSE算法判断其线性可分性。
并给出LMSE算法(H-K算法)的算法流程图。
(T是“矩阵转置”的意思)
3.已知以下两类模式:w1:{(0,0,0)T,(1,0,0)T,(1,0,1)T,(1,1,0)T},w2:{(0,0,1)T,(0,1,0)T,(0,1,1)T,(1,1,1)T}。
试用K-L变换分别把特征空间维数降到d=2和d=1,并做图画出样本在该特征空间中的位置。
综合分析题
1在描述一个完整的模式识别系统的基础上,给出你所了解的一种模式识别应用实例,并对其中可能用到的模式识别典型理论和方法进行简要说明。
2.举出日常生活和技术、小椰树领域中应用模式识别理论解决问题的实例(包括问题模型,解决的方法,体会)。
若要实现汽车车牌自动识别,你认为应该有哪些处理步骤?分别需要哪些模式识别方法?使用流程图予以说明。