最小错误概率贝叶斯(2章)
- 格式:pdf
- 大小:1.29 MB
- 文档页数:52
第二章贝叶斯决策理论与统计判别方法课前思考1、机器自动识别分类,能不能避免错分类,如汉字识别能不能做到百分之百正确?怎样才能减少错误?2、错分类往往难以避免,因此就要考虑减小因错分类造成的危害损失,譬如对病理切片进行分析,有可能将正确切片误判为癌症切片,反过来也可能将癌症病人误判为正常人,这两种错误造成的损失一样吗?看来后一种错误更可怕,那么有没有可能对后一种错误严格控制?3、概率论中讲的先验概率,后验概率与概率密度函数等概念还记得吗?什么是贝叶斯公式?4、什么叫正态分布?什么叫期望值?什么叫方差?为什么说正态分布是最重要的分布之一?学习目标这一章是模式识别的重要理论基础,它用概率论的概念分析造成错分类和识别错误的根源,并说明与哪些量有关系。
在这个基础上指出了什么条件下能使错误率最小。
有时不同的错误分类造成的损失会不相同,因此如果错分类不可避免,那么有没有可能对危害大的错分类实行控制。
对于这两方面的概念要求理解透彻。
这一章会将分类与计算某种函数联系起来,并在此基础上定义了一些术语,如判别函数、决策面(分界面),决策域等,要正确掌握其含义。
这一章会涉及设计一个分类器的最基本方法——设计准则函数,并使所设计的分类器达到准则函数的极值,即最优解,要理解这一最基本的做法。
这一章会开始涉及一些具体的计算,公式推导、证明等,应通过学习提高这方面的理解能力,并通过习题、思考题提高自己这方面的能力。
本章要点1、机器自动识别出现错分类的条件,错分类的可能性如何计算,如何实现使错分类出现可能性最小——基于最小错误率的Bayes决策理论2、如何减小危害大的错分类情况——基于最小错误风险的Bayes决策理论3、模式识别的基本计算框架——制定准则函数,实现准则函数极值化的分类器设计方法4、正态分布条件下的分类器设计5、判别函数、决策面、决策方程等术语的概念6、 Bayes决策理论的理论意义与在实践中所遇到的困难知识点§2.1 引言在前一章中已提到,模式识别是一种分类问题,即根据识别对象所呈现的观察值,将其分到某个类别中去。
模式识别第一章1.模式识别的类型(1)确定模式(2)非确定模式(3)随机模式2.模式的统计特性a)相似性-先验概率:P (v i)b)类条件概率密度:p (x|v i)3.模式的主要过程a)数据处理b)模式类的模型假设c)选择最优的模型并分类4.模式识别的定义Def:依据一定的规则,将模式进行分类的过程。
5.模式识别的典型应用(掌握5个以上)1)语音识别(例如:IBM ViaV oice系统)2)表情分析、年龄、种族、性别分类3)OCR: 车牌照、集装箱号码…4)手写体识别:汉王5)手势识别:基于视觉的,基于数据手套6)人脸识别、指纹识别、虹膜识别…7)军事目标识别8)生物信息、医学图像6.统计模式识别的基本思想模式被描述为一组测量值组成的随机特征向量,用概率统计理论对其进行建模,用统计决策理论划分特征空间来进行分类。
7.统计模式识别的一般过程(主要掌握测试模式)考察会细化,如具体分析汽车牌照识别过程第二章一、基于最小错误率的贝叶斯决策Note:考查公式,主要考计算题Example1:假设在某地区切片细胞中正常(ω1)和异常(ω2)两类的先验概率分别为P(ω1)=0.9,P(ω2)=0.1。
现有一待识别细胞呈现出状态x,由其类条件概率密度分布曲线查得p(x|ω1)=0.2,p(x|ω2)=0.4,试对细胞x进行分类。
解:利用贝叶斯公式,分别计算出状态为x时ω1与ω2的后验概率而根据贝叶斯决策(2-2)则有P(ω1|x)=0.818>P(ω2|x)=0.0182因此判定该细胞为正常细胞比较合理。
请用公式(2-3)与(2-5)计算,检查一下结果是否一样?二、基于最小风险的贝叶斯决策Note:将X判为何类则应依据所有Ri,(i=1,…,c)中的最小值,即最小风险来定。
Example2:在Example1条件的基础上,并且已知λ11=0,(λ11表示λ(α1|ω的简写),λ12=6,λ21=1,λ22=0,按最小风险贝叶斯决策进行分类。