基于Fisher的分类器设计

  • 格式:ppt
  • 大小:680.50 KB
  • 文档页数:17

下载文档原格式

  / 17
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
F
Fisher分类器设计
最好投影方向 w S (m m ) 阈值点 y m m 2 N m N m y N N m m ln( P( ) / P( )) y 2 N N 2
* 1 w 1 2
1 2 0
1
1ቤተ መጻሕፍቲ ባይዱ
2
2
0
1
2
1
2
1
2
0
1
2
对于任意未知类别的样本x,计算它的投影点 y w x 决策规则为: y y , x
Fisher判别法的基本原理
Fisher 判别法基本原理是:对于 d维空间的样本,投影到一维坐标上,样 本特征将混杂在一起,难以区分。 Fisher判别法的目的,就是要找到一个最合 适的投影轴w,使两类样本在该轴上投影的交迭部分最少,从而使分类效果为 最佳。如何寻找一个投影方向,使得样本集合在该投影方向上最易区分,这就 是Fisher判别法所要解决的问题。Fisher投影原理如下所示。 Fisher准则函数的基本思路: 即向量w的方向选择应能使两类样本投影的均 值之差尽可能大些,而使类内样本的离散程度尽可能小。
i
w
S ( y m ) , i 1,2
2 i yyi i
S S S
w 1
2
Fisher分类器设计
Fisher准则函数定义原则为:希望投影后,在一维空间中样本类别区 分清晰,即两类样本的距离越大越好,也就是 (m m ) 均值之差越大
1 2
越好;各类样本内部密集,即类内离散度 S S S 越小越好,根据
基于Fisher的分类器设计
主 单 讲:周润景 教授 位:电子信息工程学院
目 录
Fisher判别法简介
Fisher判别法的基本原理
分类器设计
算法实现 识别待测样本类别 结论
Fisher判别法简介
Fisher判别法作为一种分类方法是1936年由 首先提出的。 判别法是一种 线性判别法,线性判别又称线性准则,与线性准则相对应的还有非线性准则, 其中一些在变换条件下可以化为线性准则,因此对应于 维特征空间,线性判别 函数虽然最简单,但是在应用上却具有普遍意义,便于对分类问题理解与描述。 基于线性判别函数的线性分类方法,虽然使用有限样本集合来构造,从严 格意义上来讲属于统计分类方法。也就是说,对于线性分类器的检验,应建立 在样本扩充的条件下,以基于概率的尺度来评价才是有效的评价。尽管线性分 类器的设计在满足统计学的评价下并不严格与完美,但是由于其简单性与实用 性,在分类器设计中还是获得了广泛的应用。
w 1 2
上述两条原则,构造Fisher准则函数
(m m ) J ( w) S S
1 2 F 1 2
F
2
使得 J ( w) 为最大值的w 即为要求的投影向量 w 。 进一步化为w的显
*
函数,得到Fisher准则函为:
wSw J ( w) wSw
T b F T w
*
求解Fisher准则函数的条件极值,即可解得使J ( w)为极值的 w 。
识别待测样本类别
数 据 编 号 原 始 分 类 预 测 分 类 数 据 编 号 原 始 分 类 预 测 分 类 数 据 编 号 原 始 分 类 预 测 分 类 数 据 编 号 原 始 分 类 预 测 分 类 数 据 编 号 原 始 分 类 预 测 分 类
1
2 3 4 5 6
3
3 1 3 4 2
3
3 1 3 4 2


y0
Fisher投影原理
Fisher分类器设计
样本在d维特征空间的一些描述量 (1)各类样本均值 m 1 m i 1,2 x N (2)样本类内离散度矩阵 S 与总类内离散度矩阵 S
i
i X i i
i
w
S ( X m )( X m )
i X wi i i
T
识别待测样本类别
◆ 选择分类方法
识别待测样本类别
种类 分类方法
第一种
第12类作为第一类,第34类作为第二类
第二种
第13类作为第一类,第24类作为第二类
第三种
第14类作为第一类,第23类作为第二类
识别待测样本类别

观察训练样本分布图可知,如果 将第 1 、 2 类分在一起作为第一类, 第 3 、 4 类分在一起作为第二类, 显然,这样很难将其分开。因此, 排除这种分类方法。选择第二、 三种分类方法。
算法实现
◆ 阈值点
本设计器采用 y w (m m ) / 2 来确定阈值点,由于它既考
* T 0 1 2
虑了样本均值之间的平均距离,又考虑了两类样本的容量大小
作阈值位置的偏移修正,因此,采用它可以使得分类误差尽可
能小。
算法实现
◆ 输出分类结果



for i=1:22 y=W*x(i,:)' %确定投影点y if y>y0 %当y>y0时,测试样本属于第一类 disp('一') hold on,plot3(x(i,1),x(i,2),x(i,3),'r+','MarkerSize',6,'LineWidth',2) else disp('二') %当y<y0时,测试样本属于第二类 hold on,plot3(x(i,1),x(i,2),x(i,3),'b+','MarkerSize',6,'LineWidth',2) end end
T
0 1
y y , x
0
2
算法实现
◆ 流程图
算法实现
◆ 样本均值



clear,close all; N=29; %N为训练样本总个数 X = [1495.18 1957.44 3498.02 %X为训练样本 1125.17 1594.39 2937.73 1269.07 1910.72 2701.97 …… ……] m1=mean(X(1:11,:)); %求得第一类样本均值 m2=mean(X(12:29,:)); %求得第二类样本均值
7
8 9 10 11 12
2
3 4 1 3 3
2
3 4 1 3 3
13
14 15 16 17 18
1
2 4 2 4 3
1
2 4 2 4 2
19
20 21 22 23 24
4
2 2 3 3 1
4
2 3 3 3 1
25
26 27 28 29 30
1
4 1 3 3 3
1
4 1 3 3 3
结果分析:从表中可以看出有2个分类结果是错的,正确率为93.3%。
i 1,2
S S S
w 1
2
(3)样本类间离散度矩阵
S (m m )(m m )
b 1 2 1 2
T
Fisher分类器设计
在一维上投影,则有: (1)各类样本均值 m 1 m y,2i 1,2 N (2)样本类内离散度矩阵 S 与总类内离散度矩阵 S
i
i yyi i
四、总结
◆文章主要论述了分类法的内容、特点以及其分类器设计,重点
讨论了利用Fisher分类法设计分类器的全过程。在设计该种分类器过 程中,首先利用训练样本求得最佳投影方向,并确定阈值点。接着通 过分析归纳给定样本数据的分类情况,最后利用Matlab中的相关函数、 工具设计了基于分类法的分类器,并将测试数据进行了成功分类。