模式识别第三章 感知器算法
- 格式:pdf
- 大小:163.43 KB
- 文档页数:4
人工智能之模式识别_北京理工大学中国大学mooc课后章节答案期末考试题库2023年1.采用非线性激活函数可以实现感知器解决非线性分类问题。
参考答案:错误2.下列关于最大池化的说法中错误的是?参考答案:LeNet采用的是最大池化方法3.填充树法由顶向底的方法和由底向顶填充相反。
参考答案:正确4.语言可以是无限的但是句子必须是有限的。
参考答案:正确5.文法是由下列哪些参数构成的?参考答案:起始符S_终止符V_T_非终止符V_N_产生式P6.感知器算法应用什么方法求解准则函数的最优值?参考答案:梯度下降法7.下列关于对比散度算法的说法中错误的是?参考答案:深度信念网中多层受限玻尔兹曼机同时通过对比散度算法完成预训练8.下列选项中,属于模式识别系统的环节是?参考答案:分类器训练_模式采集_分类决策_预处理与特征生成9.分类器函数的VC维h越大,将使下列选项中的哪些数据发生变化?参考答案:置信风险越大_结构风险越大_分类器泛化能力越差10.利用SVM将低维空间中的非线性问题映射到高维空间,存在哪些问题?参考答案:不确定需要映射到多少维的空间上,非线性问题才会转化为线性问题_如何找到合适的映射函数φ_增加计算量,可能会因为维数灾难无法解决11.本课程中介绍的与句法模式识别相关的基本概念有?参考答案:字母表_句子(链)_文法_语言12.下列选项中属于贝叶斯分类器的特点的是?参考答案:分类决策存在错误率_先验概率已知,以新获得的信息对先验概率进行修正13.贝叶斯分类器的训练,是从样本集数据中估计出____。
参考答案:类条件概率_先验概率14.下列选项中属于特征降维的优点的是?参考答案:降低模式识别任务的复杂度_提升分类决策的正确率_用更少的代价设计出更加优秀的模式识别系统15.下列说法中正确的是?参考答案:聚类结果受特征选取和聚类准则的影响_数据聚类没有预先分好类的样本集_聚类结果受各特征量纲标尺的影响_数据聚类没有已知的分类决策规则16.设计一个组合分类器需要满足什么要求?参考答案:每个基分类器的训练集和训练结果要有差异_组合分类器需要重点考虑方差和偏差_基分类器的分类正确率大于50%17.下列选项中属于决策树分类器的特点的是?参考答案:需选择分支后两个子节点纯度最高的特征作为一个节点的测试特征_速度快,分类决策规则明确_未考虑特征间的相关性_有监督学习方法18.下列选项中属于Adaboost算法的特点的是?参考答案:异常数据(离群点)影响大_不易实现并行化训练_只能解决二分类问题_算法的组合过程能减小偏差19.下列选项中属于反馈型神经网络的是?参考答案:Hopfield网络_受限玻尔兹曼机20.调节以下哪些部分可以对神经网络的性能造成影响?参考答案:权值_激活函数_隐层单元_阈值21.下列选项中关于前馈网络和反馈网络的说法中正确的是?参考答案:前馈网络输出不作用在网络的输入中_前馈网络为静态网络_反馈网络下一时刻的输出与上一时刻的输出有关_反馈网络为动态网络22.下列选项中属于BP网络的不足的是?参考答案:容易陷入局部极小值_全连接网络计算大_隐层神经元数量难以确定_无法做到深度很深,会产生梯度消失23.下列选项中属于深度学习的特点的是?参考答案:需要大量样本进行训练_逐层抽象,发现数据集的特征_是层数较多的大规模神经网络_需要大规模并行计算能力的支持24.利用链式求导法则需要哪些信息?参考答案:损失函数与网络输出向量之间的函数关系_激活函数输出对净激励的导数25.深度信念网不能用于图像识别的原因是?参考答案:深度信念网为一维向量输入,不能直接用于二位图像_需要进行认知-重构的双向计算,学习速度不够快_受限玻尔兹曼机的层间全连接,权值数量太多26.Jp作为类内、类间可分性的概率距离度量时应该满足下列选项中哪些条件?参考答案:当两类完全不可分时,Jp等于0_当两类完全可分时,Jp取得最大值27.特征选择的算法包括以下哪些?参考答案:分支定界法_顺序后退法_穷举法_顺序前进法28.特征降维的方法包括特征选择和特征提取。
一、感知器算法流程图:二、矩阵分解的方法:所谓矩阵分解,就是将一个矩阵写成结构比较简单的或性质比较熟悉的另一些矩阵的乘积。
其分解的方法有很多种,常用的有三角分解、QR 分解、奇异值分解。
三角分解定义:如果方阵A 可分解成一个下三角形矩阵L 和上三角形矩阵U 的的乘积,则称A 可作三角分解或LU 分解。
QR 分解(正交分解)定义:如果实(复)非奇异矩阵A 能化成正交(酉)矩阵Q 与实(复)非奇异上三角矩阵R 的乘积,即A=QR ,则称上式为A 的QR 分解。
奇异值分解定理:设A 是一个m n ⨯的矩阵, 且()r A r =,则存在m 阶酉矩阵U 和n 阶酉矩阵V ,使得000H U AV ⎛⎫⎪= ⎪ ⎪⎝⎭∑ (2), 其中,1()rdiag σσ=∑L ,且120r σσσ≥≥≥≥L 。
由(2)知000H A U V ⎛⎫⎪= ⎪ ⎪⎝⎭∑ (3), 该式称为A 的奇异值分解,(1,2,)i i r σ=L ,称为A 的奇异值,U 的第i 列称为A 对应i σ的左奇异向量,V 的第i 列称为A 对应的i σ右奇异向量。
三、非负矩阵分解:在NMF 中要求原始的矩阵V 的所有元素的均是非负的,那么矩阵V 可以分解为两个更小的非负矩阵的乘积,这个矩阵V 有且仅有一个这样的分解,即满足存在性和唯一性。
分解方法:已知数据举矩阵V 和所能忍受的误差e ,求非负分解矩阵W ,H 。
(1) 随机初始化矩阵,要求非负;(2) 应用迭代公式进行迭代。
如果噪声服从高斯分布,则根据式()()Tik ik ikTikVH W W WHH ←g和式()()T kjkj kj TkjW V H H W WH ←g进行,如果噪声服从Poisson 分布,则根据式()kj ijij jik ik kjjH VWH W W H⎡⎤⎣⎦←∑∑g和 ()ik ikijikj kjik iW V WH H H W⎡⎤⎣⎦←∑∑g进行;(3)当||||V WH -误差小于e 时,或者达到最大迭代次数时,停止迭代。
模式识别(山东联盟)智慧树知到课后章节答案2023年下青岛大学青岛大学第一章测试1.关于监督模式识别与非监督模式识别的描述正确的是答案:非监督模式识别对样本的分类结果是唯一的2.基于数据的方法适用于特征和类别关系不明确的情况答案:对3.下列关于模式识别的说法中,正确的是答案:模式可以看作对象的组成成分或影响因素间存在的规律性关系4.在模式识别中,样本的特征构成特征空间,特征数量越多越有利于分类答案:错5.在监督模式识别中,分类器的形式越复杂,对未知样本的分类精度就越高答案:错第二章测试1.下列关于最小风险的贝叶斯决策的说法中正确的有答案:条件风险反映了对于一个样本x采用某种决策时所带来的损失;最小风险的贝叶斯决策考虑到了不同的错误率所造成的不同损失;最小错误率的贝叶斯决策是最小风险的贝叶斯决策的特例2.我们在对某一模式x进行分类判别决策时,只需要算出它属于各类的条件风险就可以进行决策了。
答案:对3.下面关于贝叶斯分类器的说法中错误的是答案:贝叶斯分类器中的判别函数的形式是唯一的4.当各类的协方差矩阵相等时,分类面为超平面,并且与两类的中心连线垂直。
答案:错5.当各类的协方差矩阵不等时,决策面是超二次曲面。
答案:对第三章测试1.概率密度函数的估计的本质是根据训练数据来估计概率密度函数的形式和参数。
答案:对2.参数估计是已知概率密度的形式,而参数未知。
答案:对3.概率密度函数的参数估计需要一定数量的训练样本,样本越多,参数估计的结果越准确。
答案:对4.下面关于最大似然估计的说法中正确的是答案:在最大似然函数估计中,要估计的参数是一个确定的量。
;在最大似然估计中要求各个样本必须是独立抽取的。
;最大似然估计是在已知概率密度函数的形式,但是参数未知的情况下,利用训练样本来估计未知参数。
5.贝叶斯估计中是将未知的参数本身也看作一个随机变量,要做的是根据观测数据对参数的分布进行估计。
答案:对第四章测试1.多类问题的贝叶斯分类器中判别函数的数量与类别数量是有直接关系的。
模式识别感知器算法求判别函数
y = sign(w · x + b)
其中,y表示分类结果(1代表一个类别,-1代表另一个类别),x 表示输入特征向量,w表示权重向量,b表示偏置项,sign表示取符号函数。
判别函数的求解过程主要包括以下几个步骤:
1.初始化权重向量和偏置项。
一般可以将它们设置为0向量或者随机向量。
2.遍历训练集中的所有样本。
对于每个样本,计算判别函数的值。
4.如果分类错误,需要调整权重和偏置项。
具体做法是使用梯度下降法,通过最小化误分类样本到超平面的距离来更新权重和偏置项。
对于权重向量的更新,可以使用如下公式:
w(t+1)=w(t)+η*y*x
对于偏置项的更新,可以使用如下公式:
b(t+1)=b(t)+η*y
5.重复步骤2和步骤4,直到所有样本都分类正确或达到停止条件。
需要注意的是,如果训练集中的样本不是线性可分的,则判别函数可能无法达到100%的分类准确率。
此时,可以通过增加特征维度、使用非线性变换等方法来提高分类效果。
总结起来,模式识别感知器算法通过判别函数将输入数据分类为两个类别。
判别函数的求解过程是通过调整权重向量和偏置项,使用梯度下降法最小化误分类样本到超平面的距离。
这个过程是一个迭代的过程,直到所有样本都分类正确或达到停止条件。
模式识别试题及总结一、填空与选择填空(本题答案写在此试卷上,30分)1、模式识别系统的基本构成单元包括:模式采集、特征提取与选择和模式分类。
2、统计模式识别中描述模式的方法一般使用特真矢量;句法模式识别中模式描述方法一般有串、树、网。
3、聚类分析算法属于(1);判别域代数界面方程法属于(3)。
(1)无监督分类 (2)有监督分类(3)统计模式识别方法(4)句法模式识别方法4、若描述模式的特征量为0-1二值特征量,则一般采用(4)进行相似性度量。
(1)距离测度(2)模糊测度(3)相似测度(4)匹配测度5、下列函数可以作为聚类分析中的准则函数的有(1)(3)(4)。
(1)(2) (3) (4)6、Fisher线性判别函数的求解过程是将N维特征矢量投影在(2)中进行。
(1)二维空间(2)一维空间(3)N-1维空间7、下列判别域界面方程法中只适用于线性可分情况的算法有(1);线性可分、不可分都适用的有(3)。
(1)感知器算法(2)H-K算法(3)积累位势函数法8、下列四元组中满足文法定义的有(1)(2)(4)。
(1)({A, B}, {0, 1}, {A?01, A ? 0A1 , A ? 1A0 , B ? BA , B ? 0}, A) (2)({A}, {0, 1}, {A?0, A ? 0A}, A)(3)({S}, {a, b}, {S ? 00S, S ? 11S, S ? 00, S ? 11}, S)(4)({A}, {0, 1}, {A?01, A ? 0A1, A ? 1A0}, A)9、影响层次聚类算法结果的主要因素有(计算模式距离的测度、(聚类准则、类间距离门限、预定的类别数目))。
10、欧式距离具有( 1、2 );马式距离具有(1、2、3、4 )。
(1)平移不变性(2)旋转不变性(3)尺度缩放不变性(4)不受量纲影响的特性11、线性判别函数的正负和数值大小的几何意义是(正(负)表示样本点位于判别界面法向量指向的正(负)半空间中;绝对值正比于样本点到判别界面的距离。
第三章作业3.5 已知两类训练样本为设,用感知器算法求解判别函数,并绘出判别界面。
解:matlab程序如下:clear%感知器算法求解判别函数x1=[0 0 0]';x2=[1 0 0]';x3=[1 0 1]';x4=[1 1 0]';x5=[0 0 1]';x6=[0 1 1]';x7=[0 1 0]';x8=[1 1 1]';%构成增广向量形式,并进行规范化处理x=[0 1 1 1 0 0 0 -1;0 0 0 1 0 -1 -1 -1;0 0 1 0 -1 -1 0 -1;1 1 1 1 -1 -1 -1 -1];plot3(x1(1),x1(2),x1(3),'ro',x2(1),x2(2),x2(3),'ro',x3(1),x3(2),x3( 3),'ro',x4(1),x4(2),x4(3),'ro');hold on;plot3(x5(1),x5(2),x5(3),'rx',x6(1),x6(2),x6(3),'rx',x7(1),x7(2),x7( 3),'rx',x8(1),x8(2),x8(3),'rx');grid on;w=[-1,-2,-2,0]';c=1;N=2000;for k=1:Nt=[];for i=1:8d=w'*x(:,i);if d>0w=w;t=[t 1];elsew=w+c*x(:,i);t=[t -1];endendif i==8&t==ones(1,8)w=wsyms x yz=-w(1)/w(3)*x-w(2)/w(3)*y-1/w(3);ezmesh(x,y,z,[0.5 1 2]);axis([-0.5,1.5,-0.5,1.5,-0.5,1.5]); title('感知器算法')break;elseendend运行结果:w =3-2-31判别界面如下图所示:若有样本;其增广;则判别函数可写成:若,则,否则3.6 已知三类问题的训练样本为试用多类感知器算法求解判别函数。
机器学习算法--Perceptron(感知器)算法概括Perceptron(感知器)是⼀个⼆分类线性模型,其输⼊的是特征向量,输出的是类别。
Perceptron的作⽤即将数据分成正负两类的超平⾯。
可以说是机器学习中最基本的分类器。
模型Perceptron ⼀样属于线性分类器。
对于向量X=x1,x2,...x n,对于权重向量(w)相乘,加上偏移(b),于是有:f(x)=N∑i=1w i x i+b设置阈值threshold之后,可以的到如果f(x)>threshold,则y(标签)设为1如果f(x)<threshold,则y(标签)设为0即,可以把其表⽰为:y=sign(w T x+b)参数学习我们已经知道模型是什么样,也知道Preceptron有两个参数,那么如何更新这两个参数呢?⾸先,我们先Preceptron的更新策略:1. 初始化参数2. 对所有数据进⾏判断,超平⾯是否可以把正实例点和负实例点完成正确分开。
3. 如果不⾏,更新w,b。
4. 重复执⾏2,3步,直到数据被分开,或者迭代次数到达上限。
那么如何更新w,b呢?我们知道在任何时候,学习是朝着损失最⼩的地⽅,也就是说,我的下⼀步更新的策略是使当前点到超平⾯的损失函数极⼩化。
在超平⾯中,我们定义⼀个点到超平⾯的距离为:(具体如何得出,可以⾃⾏百度~~~ ),此外其中1|w|是L2范数。
意思可表⽰全部w向量的平⽅和的开⽅。
1‖w‖w T x+b 这⾥假设有M个点是误差点,那么损失函数可以是:L(w,b)=−1‖w‖∑x i∈M yi(w T x+b)当然,为了简便计算,这⾥忽略1|w|。
1|w|不影响-y(w,x+b)正负的判断,即不影响学习算法的中间过程。
因为感知机学习算法最终的终⽌条件是所有的输⼊都被正确分类,即不存在误分类的点。
则此时损失函数为0,则可以看出1|w|对最终结果也⽆影响。
既然没有影响,为了简便计算,直接忽略1|w|。
3.5 感知器算法对于线性判别函数,当模式的维数已知时判别函数的形式实际上就已经定了下来,如二维 121122T()x x d w x w x w ==++(,),X X三维123112233T,()+x x x d w x w x w x w==++(,),X X剩下的问题也就是确定权向量W ,只要求出权向量,分类器的设计即告完成。
非线性判别函数也有类似的问题。
本章的后续部分将主要讨论一些基本的训练权向量的算法,或者说学习权向量的算法,它们都是都是用于设计确定性分类器的迭代算法。
1. 概念理解在学习感知器算法之前,首先要明确几个概念。
1)训练与学习训练是指利用已知类别的模式样本指导机器对分类规则进行反复修改,最终使分类结果与已知类别信息完全相同的过程。
从分类器的角度来说,就是学习的过程。
学习分为监督学习和非监督学习两大类。
非监督学习主要用于学习聚类规则,没有先验知识或仅有极少的先验知识可供利用,通过多次学习和反复评价,结果合理即可。
监督学习主要用于学习判别函数,判别函数的形式已知时,学习判别函数的有关参数;判别函数的形式未知时,则直接学习判别函数。
训练与监督学习方法相对应,需要掌握足够的与模式类别有关的先验信息,这些先验信息主要通过一定数量的已知类别的模式样本提供,这些样本常称作训练样本集。
用训练样本集对分类器训练成功后,得到了合适的判别函数,才能用于分类。
前面在介绍线性判别函数的同时,已经讨论了如何利用判别函数的性质进行分类,当然,前提是假定判别函数已知。
2)这种分类器只能处理确定可分的情况,包括线性可分和非线性可分。
只要找到一个用于分离的判别函数就可以进行分类。
由于模式在空间位置上的分布是可分离的,可以通过几何方法把特征空间分解为对应不同类别的子空间,故又称为几何分类器。
当不同类别的样本聚集的空间发生重叠现象时,这种分类器寻找分离函数的迭代过程将加长,甚至振荡,也就是说不收敛,这时需要用第4章将要介绍的以概率分类法为基础的概率分类器进行分类。
一、填空与选择填空(本题答案写在此试卷上,30分)1、模式识别系统的基本构成单元包括:模式采集、特征提取与选择和模式分类。
2、统计模式识别中描述模式的方法一般使用特真矢量;句法模式识别中模式描述方法一般有串、树、网。
3、聚类分析算法属于(1);判别域代数界面方程法属于(3)。
(1)无监督分类(2)有监督分类(3)统计模式识别方法(4)句法模式识别方法4、若描述模式的特征量为0-1二值特征量,则一般采用(4)进行相似性度量。
(1)距离测度(2)模糊测度(3)相似测度(4)匹配测度5、下列函数可以作为聚类分析中的准则函数的有(1)(3)(4)。
(1)(2)(3)(4)6、Fisher线性判别函数的求解过程是将N维特征矢量投影在(2)中进行。
(1)二维空间(2)一维空间(3)N-1维空间7、下列判别域界面方程法中只适用于线性可分情况的算法有(1);线性可分、不可分都适用的有(3)。
(1)感知器算法(2)H-K算法(3)积累位势函数法8、下列四元组中满足文法定义的有(1)(2)(4)。
(1)({A, B}, {0, 1}, {A01, A 0A1 , A 1A0 , B BA , B 0}, A)(2)({A}, {0, 1}, {A0, A 0A}, A)(3)({S}, {a, b}, {S 00S, S 11S, S 00, S 11}, S)(4)({A}, {0, 1}, {A01, A 0A1, A 1A0}, A)9、影响层次聚类算法结果的主要因素有(计算模式距离的测度、(聚类准则、类间距离门限、预定的类别数目))。
10、欧式距离具有(1、2 );马式距离具有(1、2、3、4 )。
(1)平移不变性(2)旋转不变性(3)尺度缩放不变性(4)不受量纲影响的特性11、线性判别函数的正负和数值大小的几何意义是(正(负)表示样本点位于判别界面法向量指向的正(负)半空间中;绝对值正比于样本点到判别界面的距离。
模式识别第四版Pattern Recognition Fourth EditionSergios Teodoridis / Konstantinos Koutroumbas第1章导论1.1 模式识别重要性1.2 特征、特征向量和分类器1.3 有监督、无监督和半监督学习1.4 MATLAB程序1.5 本书内容安排第2至10章有监督模式识别第2章估计未知概率密度函数的贝叶斯分类技术——重点关注:贝叶斯分类、最小距离、最近邻分类器、朴素贝叶斯分类器、贝叶斯网络。
第3章线性分类器的设计——均方理论的概率、偏差-方差、支持向量机(SVM Support Vector Machines)、线性可分性感知器算法均方和最小二乘法理论第4章非线性分类器的设计——反射传播算法基本原理、Cover定理、径向基函数(RBF Radial Basis Function)网络、非线性支持向量机、决策树、联合分类器第5章特征选择(介绍现有的知名技术)——t检验、发散、Bhattacharrya距离、散布矩阵、(重点)两类的Fisher线性判别方法(Fisher’s linear discriminant method LDA)第6章如何利用正交变换进行特征提取——KL变换、奇异值分解、DFT\DCT\DST\Hadamard\Haar变换、离散小波变换、第7章图像和声音分类中的特征提取一阶和二阶统计特征以及行程长度方法第8章模板匹配动态规划和Viterbi算法(应用于语音识别),相关匹配和可变形模板匹配的基本原理第9章上下文相关分类隐马尔可夫模型,并应用于通信和语音识别第10章系统评估和半监督学习第11章至第16章无监督模式识别第2章基于贝叶斯决策理论的分类器2.1 引言模式识别系统中的分类器设计共三章,这是其中的第1章以特征值的统计概率为基础。
设计分类器是将未知类型的样本分类到最可能的类别中。
现在的任务是定义什么是“最可能”首先要完成的任务是条件概率的计算,而贝叶斯规则条件概率是非常有用的2.2 贝叶斯决策理论BAYES DECISION THEORY概率中的贝叶斯规则P(x)是x的概率密度函数贝叶斯分类规则bayes classification rule结论等价表示为:若先验概率相等,上式可表示为:错误率Pe的计算公式最小化分类错误率Minimizing the Classification Error Probability:要证明贝叶斯分类器在最小化分类错误率上是最优的the Bayesian classifier is optimal with respect to minimizing the classification error probability.最小平均风险Minimizing the Average Risk用惩罚Penalty来衡量每一个错误it is more appropriate to assign a penalty term to weigh each error2.3 判别函数和决策面下面的主要讨论在高斯密度函数的情况下,与贝叶斯分类决策面有关的情况。
模式识别感知器算法求判别函数模式识别感知器算法(Perceptron Algorithm)是一种二分类的线性分类器算法。
它通过训练集中的数据样本来学习一组权重,将输入数据映射到一些特定类别。
判别函数是这组权重与输入数据的线性组合。
具体来说,假设我们有一个包含n个特征的输入向量x,模式识别感知器算法的判别函数可以表示为:f(x) = sign(w · x)其中,w是一组权重向量,·表示向量的内积,sign是符号函数,即如果内积结果大于等于0,结果为1,否则为-1算法的目标是找到一组权重w,使得对于所有的输入样本x,f(x)能够准确地将其分类为正类(+1)或者负类(-1),从而实现分类任务。
具体求解判别函数的过程分为两个步骤:初始化和更新权重。
1.初始化:初始权重可以设置为0向量或者一个随机的小值向量。
2.更新权重:通过迭代训练样本来逐步调整权重,直到达到收敛的条件。
a. 对于每个样本x,计算预测输出值y_pred = sign(w · x)。
c. 对于不同的特征i,更新权重w_i = w_i + η * (y - y_pred) * x_i,其中η是学习率(learning rate),控制权重的调整速度。
d.重复以上步骤直到达到收敛条件。
收敛条件可以是预先设定的最大迭代次数或者当所有的样本分类正确时停止。
在实际应用中,算法通常需要对输入数据进行预处理,例如特征缩放、特征选择等,以提高算法的性能和效果。
此外,模式识别感知器算法只能解决线性可分的问题,对于线性不可分的问题,需要使用更加复杂的算法或者进行数据转换处理。
总结起来,模式识别感知器算法的判别函数是通过一组权重与输入数据的线性组合来实现的。
该算法通过迭代训练样本来更新权重,直到达到收敛条件。
虽然该算法在处理线性可分问题中表现优秀,但对于线性不可分问题需要使用其他算法。
模式识别试题及总结⼀、填空与选择填空(本题答案写在此试卷上, 30分)1、模式识别系统的基本构成单元包括:模式采集、特征提取与选择 _________和模式分类。
2、统计模式识别中描述模式的⽅法⼀般使⽤特真⽮量 ;句法模式识别中模式描述⽅法⼀般有串树、⽹。
3、聚类分析算法属于(1);判别域代数界⾯⽅程法属于(3)。
(1)⽆监督分类(2)有监督分类(3)统计模式识别⽅法(4)句法模式识别⽅法4、若描述模式的特征量为0-1⼆值特征量,则⼀般采⽤(4)进⾏相似性度量。
(1)距离测度(2)模糊测度(3)相似测度(4)匹配测度3 = 2 (函-两》(函-m )⑷⼆6、 Fisher 线性判别函数的求解过程是将N 维特征⽮量投影在(2)中进⾏。
(1)⼆维空间(2) —维空间(3) N-1维空间7、下列判别域界⾯⽅程法中只适⽤于线性可分情况的算法有(1);线性可分、不可分都适⽤的有(3)8、下列四元组中满⾜⽂法定义的有(1)( 2)( 4)(1) ({ A ,B },{0, , A >01, A 0 A 1 , A-. 1 A0 , B-. BA , B )0}, A )(2) ({ A }, {0, 1}, {A >0, A —; 0 A }, A )(3) ({ S }, { a, b }, { S — 00 S , S 11 S , S-00,S > 11},S )(4) ({A }, {0, 1}, {A >01, A > 0A 1, A > 1 A 0}, A )9、影响层次聚类算法结果的主要因素有(计算模式距离的测度、(聚类准则、类间距离门限、预定的类别数⽬))。
10、欧式距离具有(1、2 );马式距离具有(1、2、3、4)。
(1)平移不变性(2)旋转不变性(3)尺度缩放不变性(4)不受量纲影响的特性11、线性判别函数的正负和数值⼤⼩的⼏何意义是(正(负)表⽰样本点位于判别界⾯法向量指向的正(负)半空间中;绝对值正⽐于样本点到判别界⾯的距离。