第四章 线性判别函数
- 格式:ppt
- 大小:1.42 MB
- 文档页数:78
1、线性判别函数的正负和数值大小的几何意义2、支持向量机的判别函数,adaboost的判别函数3、什么是聂曼-皮尔逊判决准,什么是最小最大判决准则4、感知器算法特点5、什么是特征,什么是特征提取,什么是特征选择?6、分类和聚类有何区别?分别说出2-3种代表性算法7、Fisher算法的特点?8、数据预处理主要有哪些工作?9、什么是大数据,大数据有何特点?10、聚类中距离度量的方式有哪些,连续性数据和和二值数据分别怎么度量9、什么是Gini指数,其作用是什么?10、马式距离较之于欧式距离的优点11、关联规则的经典算法有哪些,各自的优缺点?12、什么是分类,什么是回归?分类的过程或步骤13、分类评价标准,怎么评价分类的优劣14、什么是数据,样本、什么是抽样15、什么是机器学习以及机器学习的一般步骤16. 样本属性的主要类型17.人工神经网络的激活函数有哪些?18.信息增益,在ID3算法中怎么用,表示什么含义19.二维数据三个混合项的高斯模型的概率密度方程20、什么是聚类?聚类分析有哪些主要距离度量方法21、什么是频繁项集22、关联规则的2大指标,支持度,可信度,(名词解释)23、什么是关联规则?怎样通过频繁K项集产生关联规则24、什么是贝叶斯网络及作用25、ID3算法及步骤26、神经网络的优缺点,bp网络的优缺点27、分工神经网络主要是模拟人脑的哪些能力?单层感知器有什么缺点?28、什么是过拟合,怎么解决过拟合?29、衡量模式识别与机器学习算法优劣的标准30、什么是有监督学习、什么无监督学习31、基于最小错误率的贝叶斯决策及基于最小风险的贝叶斯决策解决实际问题。
32、贝叶斯决策算法,最小风险贝叶斯、感知器算法、Apriori 算法、、K-中心算法、k-均值算法,等算法,步骤及伪代码。
实际问题示例:1、支持度20%,置信度20%,用Apriori 算法找出所有关联规则(要求完整步骤,写出所有的候选集,k 项集,及所有关联规则)2、识别鲈鱼和鲑鱼,其先验概率分别为 P(w 1)=0.9,P(w 2)=0.1,现有一待识别的鱼,其观察值为x ,从类条件概率密度分布曲线上查得1()0.6P x w =,4.0)(2=w x P ,并且已知011=λ,123λ=,121=λ,022=λ,分别写出自小风险和最小错误率的贝叶斯决策过程。
模式识别习题及答案第⼀章绪论1.什么是模式具体事物所具有的信息。
模式所指的不是事物本⾝,⽽是我们从事物中获得的___信息__。
2.模式识别的定义让计算机来判断事物。
3.模式识别系统主要由哪些部分组成数据获取—预处理—特征提取与选择—分类器设计/ 分类决策。
第⼆章贝叶斯决策理论1.最⼩错误率贝叶斯决策过程答:已知先验概率,类条件概率。
利⽤贝叶斯公式得到后验概率。
根据后验概率⼤⼩进⾏决策分析。
2.最⼩错误率贝叶斯分类器设计过程答:根据训练数据求出先验概率类条件概率分布利⽤贝叶斯公式得到后验概率如果输⼊待测样本X ,计算X 的后验概率根据后验概率⼤⼩进⾏分类决策分析。
3.最⼩错误率贝叶斯决策规则有哪⼏种常⽤的表⽰形式答:4.贝叶斯决策为什么称为最⼩错误率贝叶斯决策答:最⼩错误率Bayes 决策使得每个观测值下的条件错误率最⼩因⽽保证了(平均)错误率最⼩。
Bayes 决策是最优决策:即,能使决策错误率最⼩。
5.贝叶斯决策是由先验概率和(类条件概率)概率,推导(后验概率)概率,然后利⽤这个概率进⾏决策。
6.利⽤乘法法则和全概率公式证明贝叶斯公式答:∑====m j Aj p Aj B p B p A p A B p B p B A p AB p 1)()|()()()|()()|()(所以推出贝叶斯公式7.朴素贝叶斯⽅法的条件独⽴假设是(P(x| ωi) =P(x1, x2, …, xn | ωi)= P(x1| ωi) P(x2| ωi)… P(xn| ωi))8.怎样利⽤朴素贝叶斯⽅法获得各个属性的类条件概率分布答:假设各属性独⽴,P(x| ωi) =P(x1, x2, …, xn | ωi) = P(x1| ωi) P(x2| ωi)… P(xn| ωi)后验概率:P(ωi|x) = P(ωi) P(x1| ωi) P(x2| ωi)… P(xn| ωi)类别清晰的直接分类算,如果是数据连续的,假设属性服从正态分布,算出每个类的均值⽅差,最后得到类条件概率分布。
第二章:贝叶斯决策理论 主要考点:1. 最小错误率贝叶斯分类器;2. 最小风险贝叶斯分类器;3. 多元正态分布时的最小错误率贝叶斯分类器。
典型例题:P45,2.23,2.24。
例题1:在一个一维模式两类分类问题中,设12()1/3,()2/3p p ωω==,两类的类概率密度分别为2212(/)(1)),(/)(1))p x x p x x ωω=-+=--1)求最小错误率贝叶斯分类器的阈值。
2)设损失为0310L ⎛⎫= ⎪⎝⎭,求最小风险贝叶斯分类器的阈值。
解:由于p(w1)=1/3, p(w2)=2/3,则最小错误率贝叶斯分类器的阈值θ=p(w2)/p(w1)=2其相应的决策规则为:,)1()2()2/()1/(w p w p w x p w x p >< 则21{w w x ∈2>< 即 12ln 24ln 24w x x w x ⎧<-⎪⎪∈⎨⎪>-⎪⎩ (2) 当L=0310时,122221113,01,0λλλλ====从而最小风险贝叶斯决策规则的阈值为:1222221111()()(30)*1/3.3/2()()(10)*2/3p w p w λλλλλ--===--判决规则为:12(/)(/)p x w p x w λ><,则21{w w x ∈23/2==>exp(4)3/2x -= 12ln(3/2)4ln(3/2)4w x x w x ⎧<-⎪⎪∈⎨⎪>-⎪⎩例2p45,2.23解:这里两类协方差矩阵相等。
负对数似然比判别规则为111222(/)()lnln 0(/)()x p x p x p x p ωωωωωω∈<⎧--=⇒⎨∈>⎩ ()()()()11111/2112221/2111122112211exp(()())(/)2||2ln ln11(/)exp(()())2||2[()()(11())()]/21111exp ,222020T i i i i nT T T T ix x p x p x x x x x x x x x p x x x x x x μμωπωμμπωμμπμμμμ------⎡⎤=---⎢∑--∑-∑-=---∑-∑=-∑---∑-+⎛⎫=+-- ⎪-⎝⎭⎥⎣⎦∑∑=I.故()1111202021x x x x -⎛⎫-- ⎪-⎝⎭=例32.24 解:()()()112111211111/211122221/2221112/34/32/34/311exp(()())(11()exp ,22/)2||2ln ln11(/)exp(()())2||2[()(T T T i i i i nT ix x p x p x p x x x x x x x μμωπωμμπμωμμπ------⎛⎫⎛⎫∑∑ ⎪ ⎪-⎝⎭⎝⎭--∑-∑-=--⎡⎤=---⎢⎥-∑-∑=-⎣⎦∑-∑∑4/3-2/34/32/3=,=故()()1121221122)()()]/211111120112020202/34/32/34/381ln213/4ln234433/T x x x x x x x x x x x x x μμμ---∑-++-⎛⎫⎛⎫⎛⎫⎛⎫=+----+ ⎪ ⎪ ⎪ ⎪---⎝⎭⎝⎭⎝⎭⎝⎭=-∑∑4/3-2/34/32/3例4:假设两类二维正态分布参数如下,试给出负对数似然比判别规则。
第四章 判别分析4、1 简述欧几里得距离与马氏距离得区别与联系。
答: 设p 维欧几里得空间中得两点X =与Y =。
则欧几里得距离为。
欧几里得距离得局限有①在多元数据分析中,其度量不合理。
②会受到实际问题中量纲得影响。
设X,Y 就是来自均值向量为,协方差为得总体G 中得p 维样本。
则马氏距离为D(X,Y)=。
当即单位阵时,D(X,Y)==即欧几里得距离。
因此,在一定程度上,欧几里得距离就是马氏距离得特殊情况,马氏距离就是欧几里得距离得推广。
4、2 试述判别分析得实质。
答:判别分析就就是希望利用已经测得得变量数据,找出一种判别函数,使得这一函数具有某种最优性质,能把属于不同类别得样本点尽可能地区别开来。
设R1,R2,…,Rk 就是p 维空间R p 得k 个子集,如果它们互不相交,且它们得与集为,则称为得一个划分。
判别分析问题实质上就就是在某种意义上,以最优得性质对p 维空间构造一个“划分”,这个“划分”就构成了一个判别规则。
4、3 简述距离判别法得基本思想与方法。
答:距离判别问题分为①两个总体得距离判别问题与②多个总体得判别问题。
其基本思想都就是分别计算样本与各个总体得距离(马氏距离),将距离近得判别为一类。
①两个总体得距离判别问题设有协方差矩阵∑相等得两个总体G 1与G 2,其均值分别就是μ1与μ 2,对于一个新得样品X ,要判断它来自哪个总体。
计算新样品X 到两个总体得马氏距离D 2(X,G 1)与D 2(X,G 2),则X ,D 2(X ,G 1)D 2(X ,G 2)X ,D 2(X ,G 1)> D 2(X ,G 2, 具体分析,111122111111111222111211122()()()()2(2)2()-----------''=-----''''''=-+--+'''=-+-X μΣX μX μΣX μX ΣX X ΣμμΣμX ΣX X ΣμμΣμX ΣμμμΣμμΣμ记 则判别规则为X ,W(X) X ,W(X)<0②多个总体得判别问题。