C4：近邻分类.ppt

格式：ppt
大小：195.51 KB
文档页数：22

下载文档原格式

近邻法

N A1
（2）采用抽样的办法，使之能自适应选择k；
“科研反哺教学”，将自己的研究工作融入课堂；
6.3.2 核近邻法（续）
贝叶斯决策器
学习方法
4 3 2
分类错误率 5.5% 4.6% 4.1%
KNN （k=3） BKNN 贝叶斯决策器
KNN
1 0 -1
三种方法的分类错误率比较
BKNN
-2 -3 -4 -4
本人解决方案：
NN (Fix, 1951)
KNN (Yu,2002) (Peng,2004) BNN (Homes,2002)
定义最优核距离 (本章) 核化 (本章)
BKNN (本章)
（1）推导出“最优核距离”：
1 rko x , xl rko x, xl N A1 1 NA B x, xi , xl B x, xi , xl N i 1 A i 1
J. Peng. Adaptive Quasiconformal Kernel Nearest Neighbor Classification. IEEE Trans PAMI[J]. 2004, 26(5): 656 - 661.
Rd
x1 , t1 1 x5 , t5 1 1
6.1.1 关于近邻法
1951年Fix和Hodges首次提出
第 w1 类
第 w2 类
最经典的模式识别方法之一方法简单，便于理论分析
x
x1
x4
是其它模式识别方法的标尺
“距离”的度量方式有很多种
近邻法原理示意图
6.1.2 近邻法应用实例：人脸表情识别
欲解决的问题：
七类表情

用近邻函数法进行聚类与分类

用近邻函数法进行聚类与分类汤宁SC08023110一．实验原理对应一个样本集中的任意两个样本xi和xj如果xi是xj的第I个近邻点，则定义xi对xj的近邻系数为I，记为d(i,j)=I.定义xi和xj简的近邻函数值为aij=d(i,j)+d(j,i)-2.样本间的近邻函数值越小，彼此越靠近，越相似。

算法步骤如下：1.对于给定待分类的样本集合，计算距离矩阵D：D(i,j)=d(xi,xj)d(xi,xj)为xi和xj的欧式距离。

2.用D计算近邻系数矩阵M，元素Mij为xi对xj的近邻系数。

3.生成近邻函数矩阵L：L(i,j)=Mij+Mji-2并置L对角线上元素为2*N，如果xi和xj有连接，则L(i,j)为连接损失。

4.搜索矩阵L，将每个点与和它有最小近邻函数值的点连接起来，形成初始聚类。

5.对已经分类的各类，计算各类的类内最大距离maxd，类间最小距离mind,如果maxd<mind,则考虑合并类，反之聚类结果合理。

当类数不变时，结束，反之，继续步骤5。

二．结果及分析在给定的样本集合的情况下，由matlab计算得到的初始聚类结果如下图：由图可见，直观上感觉1、2、3、4、5号样本应该归为一类，10、11、12、13、14也应该归为一类，二事实上也是如此，对类进行合并后得到的聚类图示如下：此为最终聚类结果，连在一起的点表示同为一类。

三．附件Matlab程序文件prexp.m,直接运行，按照对话框的提示，返回matlab命令行模式按任意键就可以进行第二步的类合并，结果仍在figure1显示。

Figure1相继显示上述图示结果，程序包含了必要注释。

第6章_近邻法

i
K近邻法
(1)已知N个已知类别样本X
(2)输入未知类别样本x
(3)计算x到 xiX，(i=1, 2,…,N)的距离di(x)
(6) 判xω2 (4)找出x的k个最近邻元Xk={xi,i=1,2,…,k} (5)看Xk中属于哪一类的样本最多k1=3<k2=4

讨论k为奇数时的两类问题
xi X p
第二阶段用搜索算法
检验未知样本x的最近邻是否在X p中的两个规则。规则1:如果存在 B rp D x, M p 则xi X p 不可能是x的最近邻。其中B是在算法执行过程中，对于已涉及到的那些样本集X p中的样本到x 的最近距离。初始B可置为，以后的B在算法中求得。
c * P P P 2 P c 1 * 其中P 为贝叶斯错误率，c为类数。
* *
可以证明，当样本数相当多时，近邻法错误率与贝叶斯错误率存在以下关系：
• 上式表明，当样本数相当多时，近邻法的错误率在贝叶斯错误率和两倍的贝叶斯错误率之间。
最近邻法错误率上下界与贝叶斯错误率的关系
５在目录表中选择最近节点p, 它使D x, M p 最小化，并
称该p为当前执行节点，从目录表中去掉p。如果当前的水平L是最终水平，则转步骤6。否则置L L 1，转步骤2。
６对现在执行节点p中的每个x，利用规则２作如下检验。
如果
D x, M p D xi , M p B
规则2:如果存在
B xi , M p D x, M p
其中xi X p，则xi 不是x的最近邻。 D x, xi D x, M p D xi , M p B D xi , M p 在计算rp中已用到，并可存储在机器中。

5近邻法

17
5.4 讨论
近邻法是典型的非参数法在原理上最直观，方法上也十分简单，明显的缺点就是计算量大，存储量大
第五章近邻法
18
习题
1.
设在一个二维空间，A类有三个训练样本，图中用红点表示，B类四个样本，图中用蓝点表示。试问：
（1）按近邻法分类，这两类最多有多少个分界面（2）画出实际用到的分界面
gi ( x ) = min x − x i , k = 1,..., N i
k k
‖·‖表示某种距离（相似性）度量，常用欧氏距离作为相似性度量。
第五章近邻法
5
决策规则
NNC
if g j ( x ) = min gi ( x ) then x ∈ ω j
i
最近邻法在原理上最直观，方法上也十分简最近邻法在原理上最直观，方法上也十分简单。明显的缺点就是计算量大，存储量大。明显的缺点就是计算量大，存储量大。
B2 A2 B4 B1 A1 A3 B3
第五章近邻法
19
解答
按近邻法，对任意两个由不同类别的训练样本构成的样本对，如果它们有可能成为测试样本的近邻，则它们构成一组最小距离分类器，它们之间的中垂面就是分界面，因此由三个A类与四个B类训练样本可能构成的分界面最大数量为3×4＝12。实际分界面如下图所示，由9条线段构成。
B2 A2 B4 B1 A1 A3 B3
第五章近邻法
20
改进方法
1. 初始化初始化。Store是空集，原样本集存入Grabbag；从 Grabbag中任意选择一样本放入Store中作为新样本集的第一个样本。 2. 样本集生成。在Grabbag中取出第i个样本用Store中的当样本集生成 i 前样本集按最近邻法分类。若分类错误，则将该样本从 Grabbag转入Store中，若分类正确，则将该样本放回 Grabbag中。 3. 结束过程结束过程。若Grabbag中所有样本在执行第二步时没有发生转入Store的现象，或Grabbag已成空集，则算法终止，否则转入第二步。第五章近邻法

清华大学模式识别课件-07_近邻法

(6 20)
因为 P 与
P 2 i | x 有关，若寻求 P 与 P* 的关系，首先可以寻求 P 2 i | x 与 P* 的关
i 1 i 1
系。现利用式(6-18)，式(6-20)的结果来推导，有
P | x P
2 2 i 1 i
c
m
| x P i | x 1 P e | x
以上两式对我们的启发是：对已知的 P m | x 而言，
*
P | x 的最小值对应着 P 的最大值。
2 i 1 i
c
如能求出 P 的最大值，就把贝叶斯错误率 P 和最近邻法错误率 P 联系起来了。若记
P | x P
2 2 i 1 i
c
m
| x P 2 i | x

x's
p x' dx'
N
(6 8)
P x1 , x2 , …,x N 1 Ps
当 N→∞时，这一概率趋于零。由于 s 可以任意小，所以 N→∞时， x' 落在以 x 为中心无限小区域
中的概率趋于 1。就是说 x' 以概率为 1 收敛于 x，从而
N
lim p x' | x x' - x
(6 9)
现在来计算条件错误概率 PN e | x, x' 。当我们说有 N 个独立抽取并有类别标记的样本时，意思是说有 N 对随机变量 x1 , 1 , x2 , 2 , …， x N , N ，其中 xi 是独立抽取的样本，i 是 xi 的类别标记，且 i 是 c 个类别状态 1 , 2 …,c 之一。现在假定抽取一对 x, ，并假定标以 ' 的 x' 是 x 的最近邻。由于抽出 x' 时，它的类别状态和 x 无关。因此有

近邻分类器-四川大学

2012-2013春学期第六讲模式识别引论近邻分类器赵启军四川大学计算机学院分类器•贝叶斯决策（第2、3讲）–随机模式分类；最小错误率、最小风险•判别函数法（第4、5讲）–确定模式分类；线性、非线性•近邻分类器（第6讲）–无参数分类器•支持向量机（第11、12讲）–统计学习理论2基于均值的分段线性判别函数•根据测试样本到各类均值的距离远近来分类如果基于测试样本到各类所有样本的距离远近来分类呢？3近邻分类器•基于距离的分段线性判别函数的极端情况–将各类中的全部样本都作为“代表点”•典型的近邻分类器–最近邻分类器–K近邻分类器–针对计算速度和存储量的改进的近邻分类器45最近邻分类器•问题定义–c 类，第i 类有N i 个样本–对测试样本x 进行分类•决策规则i ki k i N k x x x g ,,2,1||,||min )(L =−=x 到第i 类样本的最小距离ji i j x c i x g x g ω∈==则如果},,2,1|)({min )(L 欧氏距离是最常用的距离度量，其它的如余弦距离、马氏距离、测地距离等6最近邻分类器的错误率•当训练样本数趋向于无穷大时，最近邻分类器的错误率为•上述错误率是渐进意义下的错误率。

实际操作中，样本数总是有限的，最近邻分类器的错误率并不容易计算其中，P *为贝叶斯错误率，c 为类别数)12(***P c c P P P −−≤≤7K 近邻分类器•问题定义–c 类，第i 类有N i 个样本–对测试样本x 进行分类•决策规则类的样本个数个近邻中属于第表示i c i k x g i i K ),,2,1()(L ==j i i j x c i x g x g ω∈==则如果},,2,1|)({max )(L K=1时，就是最近邻分类器K>1时，相当于K 个近邻投票决定测试样本的类别8K 近邻分类器•两类问题中，K一般取奇数，以避免近邻中属于两类的样本数目相等•两类问题K近邻分类器在样本数趋于无穷大时的错误率)1(2***P P P P −≤≤K近邻分类器•K个近邻在投票过程中的重要性相同？•如果用K个近邻到测试样本的距离对其投票进行加权，使得越近的样本权重越大，这就是“模糊K近邻分类器”9近邻分类器的优缺点•近邻分类器是典型的非参数法，其优点是–实现简单–分类结果比较好•近邻分类器的主要缺点是–对计算机的存储量和计算量的要求很大，耗费大量测试时间–没有考虑决策的风险–对其错误率的分析都是建立在渐进理论基础上的10改进的近邻分类器•针对近邻分类器的计算量和存储量比较大的缺点，从两个思路改进近邻分类器•快速搜索近邻–对样本进行组织和整理，搜索近邻只在某些子集中进行，避免对每个样本进行距离计算•剪辑和压缩样本–在原有样本集中挑选出对分类计算有效的样本，使样本总数合理地减少，达到既减少计算量又减少存储量的效果11快速搜索近邻法•算法分成两个阶段–第一阶段：将样本集按照邻近关系分组，每一组再进一步分组，如此形成树状结构–第二阶段：利用搜索算法找到待识别样本的最近邻（或K近邻）•要实现快速搜索近邻，需要快速判断某个样本子集是否是测试样本的可能近邻集，从而可将无关的样本子集尽快排除•在某个样本子集内寻找哪个样本是近邻时，需要快速排除不可能为近邻的样本1213快速搜索近邻法•第一阶段：样本分组（聚类分析）中的样本数结点p N p :中的样本均值结点p M p :其均值的最大距离中的样本到结点 :),(max p M x D r p i X x p p i ∈=中的样本集结点p X p :快速搜索近邻法•第二阶段：搜索近邻–根据两条规则快速排除不含近邻的子集和非近邻样本–规则一：如果子集X p满足B＋r p<D(x,M p)，则该子集中不可能含有测试样本x的近邻–规则二：如果子集X p中的样本x i满足B+D(xi ,Mp)<D(x,Mp)，则该样本不可能是x的近邻–上述规则中B表示测试样本在搜索近邻过程中的当前近邻距离，B在搜索过程中不断改变与缩小。

近邻法

i

则有Bayes条件错误率
P * (e | x) 1 P(m | x)
因此 P* P * (e | x) p ( x) dx

对于两类问题，由前面公式
N
lim PN (e | x) 1 P (i | x)
2 i 1
2
4.5.1最近邻法二、最近邻法的错误率分析
4.5.1最近邻法二、最近邻法的错误率分析
图4.14示出近邻法的上下界。一般地，最近邻法的错误率落在图中的阴影区域中。 c类别最近邻
分类器可能渐近误差率
4.5.1最近邻法二、最近邻法的错误率分析

4.5.1最近邻法二、最近邻法的错误率分析

可以证明以下关系式成立
c P* P P * (2 P*) c 1

其中P*为贝叶斯错误率，c为类数。
上式实际上给出了最近邻法渐近平均错误率P的范围，指出它在Bayes错误率P* c 和 P * (2 P*) 之间。 c 1

4.5.1最近邻法二、最近邻法的错误率分析
c i 1
知样本x，只要比较x与 N N i 个已知类别的样本之间的欧氏距离，并决策x与离它最近的样本同类。
4.5.1最近邻法
二、最近邻法的错误率分析

近邻法的错误率很难计算，因为训练样本集的数量总是有限的，有时多一个少一个训练样本对测试样本分类的结果影响很大。如图中所示
4.5.1最近邻法二、最近邻法的错误率分析
P* P * (e | x) p(x)dx [1 P(m | x)] p(x)dx 0
此时P = P*。
4.5.1最近邻法二、最近邻法的错误率分析

近邻分类分类器设计

近邻分类分类器设计一、设计任务对“data3.m”数据，采用剪辑法、压缩法生成参考集，近似描绘其决策面，并用所有数据测试其分类效果。

二、设计原理1、最近邻法最近邻分类器(nearest neighborhood classifier, nnc): 最小距离分类器的一种极端的情况，以全部训练样本作为代表点，计算测试样本与所有样本的距离，并以最近邻者的类别作为决策。

最初的近邻法是由Cover 和Hart 于1968年提出的，随后得到理论上深入的分析与研究，是非参数法中最重要的方法之一。

最近邻法：将与测试样本最近邻样本的类别作为决策的结果。

对一个C 类别问题，每类有 i N 个样本,1,2,i C =，则第i 类i ω的判别函数为：()min ||||,1,2,,k i i i k g x x x k N =-= (1)因此，最近邻决策规则：若 ()min (),1,2,j i i g x g x i c ==(2)则决策 j x ω∈由上可以看出最近邻法在原理上最直观，方法上也十分简单，但明显的缺点就是计算量大，存储量大。

2、k -近邻法k -近邻法即为最近邻法的扩展，其基本规则是，在所有 N 个样本中找到与测试样本的k 个最近邻者，其中各类别所占个数表示成i k ,1,2,i C =，定义判别函数为：(),1,2,i i g x k i c == (3)因此，k -近邻决策规则：若 ()max j i ig x k = (4)则决策 j x ω∈k -近邻一般采用k 为奇数，跟投票表决一样，避免因两种票数相等而难以决策。

决策规则为：arg (),1,,i i j maxg x i c ==3、改进的近邻法近邻法的一个严重问题是需要存储全部训练样本，以及繁重的距离计算量。

从而提出了两类改进的方法：一种是对样本集进行组织与整理，分群分层，尽可能将计算压缩到在接近测试样本邻域的小范围内，避免盲目地与训练样本集中每个样本进行距离计算。

模式识别第3章近邻法

如果样本足够多，就可以重复地执行剪辑程序，以进一步提高分类性能，称为重复剪辑最近邻法（MultiEdit算法）。
26
27
近邻法
重复剪辑近邻法
原始样本集（不同均矢和协方差阵的两类正态分布随机样本）28
近邻法
重复剪辑近邻法
第一次剪辑后留下的样本
29
近邻法
重复剪辑近邻法
第三次剪辑后留下的样本

36
近邻法
压缩近邻法
基本方法：
• 将样本集XN分为XS 和XG ，开始时XS 中只有一个样本， XG中为其余样本
• 考查XG 中每个样本，若用XS 可正确分类则保留，否则移入XS
• 最后用XS作最近邻法的比较样本集。
37
近邻法
压缩近邻法
算法步骤（Condensing算法）：
1. 设置两个存储器，分别为STORE和GRABBAG，将第一个样本放入STORE中，把其他样本放入GRABBAG中；
i1
如果
则 x m
5
近邻法
最近邻决策规则—k-NN
k的取值选择很重要！ 6
近邻法
最近邻决策规则—k-NN
特点：思想简单，计算方便需要存储所有样本，每次决策都要计算待识
别样本与全部训练样本之间的距离并进行比较，存储量和计算量都很大
7
近邻法例子：
最近邻决策规则—k-NN
8
近邻法
最近邻决策规则—k-NN
主要内容
第一章第二章第三章第四章第五章第六章第七章
绪论非监督学习方法近邻法线性判别函数人工神经网络贝叶斯决策理论模式识别应用
1
第三章近邻法
• 最近邻决策规则 • 推广—K近邻决策规则 • 改进算法

模式识别课件(第六章 NO1)(最近邻法)

二. 剪辑近邻法
此类方法的基本思想是：剪掉(清理)两类间的边界，取掉类别混杂的样本，使两类边界更清晰。
1. 两分剪辑近邻法(亦称剪辑最近邻法) 基本过程为：设N个样本分成c类
æ
N
N , N ,……, = { æ1 æ2 æcN }
1
2
c
(N1+N2+……,+Nc= N)
N
step1：剪辑。利用已知样本集æ 中的样本进行预分类，并剪辑掉被错分类的样本，留下的样本构成 NE æ 剪辑样本集 step2：分类。利用 æ
6.3 近邻法的改进算法
共同特点是如何尽快地找出最近邻可能存在的小的空间，减少搜索的范围，从而达到减少近邻法中的计算量和存储量的问题。一. 快速近邻算法该算法对最近邻法和k-近邻法都适用。下面以最近邻法为例来讨论。 1. 基本思想将全部已知样本按级分成一些不相交的子集，并在子集的基础上进行搜索。也就是说，该算法由两个阶段组成：第一阶段：将样本集按级分解，形成树状结构。
二. 最近邻法的决策规则设有c类模式样本， ω1, ω2,……, ωc 每类有Ni个样本(i=1,2,……,c)，则最近邻法的(ωi类)判别函数为:
gi ( X ) min X X ik
k
(k 1,2,...... , Ni )
式中X ik 表示ωi类中的第k个样本。
对应的决策规则为：如果则决策
X i 。
具体就是：设k1,k2,......,kc分别为X的k个最近邻样本中属于
1 , 2 ,......, c
类的样本数，
则定义 i (i 1,2,......,c) 类的判别函数为：
g i ( X ) ki

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

n
d (xi , x j )
ar (xi ) ar (x j ) 2
r 1
2020/4/18
10
伪代码（离散）
• 考虑离散目标函数f: RnV，V={v1,...,vs} • 逼近离散值函数f: RnV的k-近邻算法
– 训练算法
• 将每个训练样例<x,f(x)>加入到列表 training_examples
• 与其他方法相比，基于实例的学习方法的一个关键差异是：可以为不同的待分类查询实例建立不同的目标函数逼近。
2020/4/18
5
基于实例的学习概述
• 许多技术不建立目标函数在整个实例空间上的逼近，只建立局部逼近，并将其用于与新实例邻近的实例。
• 这样做的好处是：有时目标函数很复杂，但具有不太复杂的局部逼近描述。
2020/4/18
13
距离加权的k-近邻算法（连续）
• 对k-近邻算法的一个改进是对k个近邻的贡
献加权，越近的距离赋予越大的权值，比
如：
k
wi f (xi )
f (xq ) i1 k
wi
i 1
其中
wi
1 d (xq , xi )2
• 为了处理查询点xq恰好匹配某个训练样例xi，从的而f (x导q) 等致于d(xf(qx,xi)，i)2为如0果的有情多况个，这令样这的种训情练况样下例，则用它们的平均值来预测。
• K-近邻方法的学习过程分两部：1）找到要预测新实例的K个邻居；2）根据这K个邻居来预测新实例的目标值。
2020/4/18
9
k-近邻算法
• k-近邻算法假定所有的实例对应于n维空间 Rn中的点，任意的实例表示为一个特征向量<a1(x), ..., an(x)>
• 根据欧氏距离定义实例间的距离。两个实例xi和xj的距离d(xi,xj)定义为
2020/4/18
7
基于实例的学习概述
• K-近邻算法和它的几个变体。
• 局部加权回归法，这是一种建立目标函数的局部逼近的学习方法，被看作k-近邻算法的一般形式。
• 基于案例的推理，是一种使用符号表示和基于知识的推理的方法。
• 径向基函数网络，为基于实例的学习算法和神经网络学习算法提供了一个有趣的桥梁。
– 分类算法
• 给定一个要分类的查询实例xq
– 在training_examples中选出最靠近xq的k个实例，并用
–
x1...xk表示
返回 fˆ (xq ) arg max
vV
k
(v,
i 1
f (xi )) 其中
(a,
b)
1 0
ab ab
2020/4/18
11
伪代码（连续）
• 逼近连续值目标函数f: RnR的k-近邻算法
– 训练算法
• 将每个训练样例<x,f(x)>加入到列表
training_examples
– 分类算法
• 给定一个要分类的查询实例xq
– 在training_examples中选出最靠近xq的k个实例，并用x1...xk表示 k
– 返回
f (xi )
fˆ (xq ) i1 k
2020/4/18
第4讲近邻分类
2020/4/18
1
基于实例的学习概述
• 已知一系列的训练样例，许多学习方法为目标函数建立起明确的一般化描述。
• 基于实例的学习方法只是简单地把训练样例存储起来，从这些实例中泛化的工作被推迟到必须分类新实例的时候。
• 每当学习器遇到一个新的查询实例，它分析这个新实例与以前存储的实例的关系，并据此把一个目标函数值赋给新实例。
• 这种延迟的学习方法有一个优点：不是在整个实例空间上一次性地估计目标函数，而是针对每个待分类新实例作出局部的和相异的估计。
2020/4/18
4
基于实例的学习概述
• 基于实例的学习方法的学习过程只是简单地存储已知的训练数据，当遇到新的查询实例时，一系列相似的实例从存储器中取出，用来分类新的查询实例。
2020/4/18
2
基于实例的学习概述
• 基于实例的学习方法包括： –假定实例可以表示成欧氏空间中的点 •最近邻法 •局部加权回归法 –对实例采用更复杂的符号表示 •基于案例的推理
2020/4/18
3
基于实例的学习概述
• 基于实例的学习方法有时被称为消极学习法，它把处理工作延迟到必须分类新的实例时。
2020/4/18
15
k-近邻算法的优点
• K-近邻算法不是在整个实例空间上一次性地预测
目标函数值，而是针对每个待预测的新实例，建立不同的目标函数逼近，作出局部的和相异的预测。这样做的好处是：有时目标函数很复杂，但具有不太复杂的局部逼近。
• 消极学习方法和积极学习方法之间的差异。
2020/4/18
8
K-近邻学习概述
• 不同于eager学习算法，K-近邻方法在训练阶段只是简单地把训练样例存储起来，把建模过程推迟到了要预测新实例的工作阶段。因此， K-近邻方法是一种典型的lazy学习算法。
• k-近邻方法既可以用于目标函数值是离散的情况，也可以用于是连续的情况。离散的情况就是分类，连续的情况就是回归。
2020/4/18
14
对k-近邻算法的的说明
• k-近邻算法的所有变体都只考虑k个近邻用以预测查询点，如果使用按距离加权，那么可以允许所有的训练样例影响对xq的预测，因为非常远的实例的影响很小。唯一不足之处：使得预测的速度变得更慢。
• 如果预测一个新实例时，考虑所有的训练样例，我们称为全局法；如果仅考虑靠近的训练样例，称为局部法。
2020/4/18
6
基于实例的学习概述
• 基于实例的方法的不足：
–分类新实例的开销可能很大。
•几乎所有的计算都发生在分类时，而不是在第一次遇到训练样例时。如何有效地索引训练样例是一个重要的问题。
–当从存储器中检索相似的训练样例时，一般考虑实例的所有属性，如果目标概念仅依赖于很多属性中的几个，那么真正最 “相似”的实例之间可能相距甚远。
12
距离加权的k-近邻算法（离散）
• 对k-近邻算法的一个改进是对k个近邻的贡献加权，越近的距离赋予越大的权值，比如：
其中
k
f (xq ) arg max wi (v, f (xi ))
vV
i 1
wi
1 d (xq , xi )2

• 为导了致d处(x理q,查xi)询2为点0的xq恰情好况匹，配令某这个种训情练况样下例的xfi，(xq从) 等而于f(xi)，如果有多个这样的训练样例，我们使用它们占多数的分类。

四年级数学上册《角的分类和画角》PPT课件

页数:93
新苏教版四年级数学上册《角的分类和画角》优质公开课课件.ppt

页数:9
角的分类和画角教学PPT苏教版四年级数学上册

页数:24
苏教版四年级上册数学《角的分类和画角》课件

页数:20
北师大版数学四年级上册《角的度量、角的分类和画角》课件

页数:20
四年级上册数学课件-8.4 角的分类和画角丨苏教版 (共32张PPT)

页数:33
四年级上册数学角的分类和画角优秀课件.ppt

页数:16
角的度量角的分类和画角课件人教新课标小学数学四年级上册

页数:18
角的分类和画角知识课件

页数:11
人教版小学数学四年级上册第三单元第三课时《角的分类和画角》教学课件

页数:62

C4：近邻分类.ppt

合集下载

近邻法

用近邻函数法进行聚类与分类

第6章_近邻法

5近邻法

清华大学模式识别课件-07_近邻法

近邻分类器-四川大学

近邻法

近邻分类分类器设计

模式识别第3章近邻法

模式识别课件(第六章 NO1)(最近邻法)

文档推荐

最新文档

C4：近邻分类.ppt

合集下载

近邻法

用近邻函数法进行聚类与分类

第6章_近邻法

5近邻法

清华大学模式识别课件-07_近邻法

近邻分类器-四川大学

近邻法

近邻分类分类器设计

模式识别第3章 近邻法

模式识别课件(第六章 NO1)(最近邻法)

文档推荐

最新文档

模式识别第3章近邻法