图像识别实验报告

  • 格式:doc
  • 大小:291.00 KB
  • 文档页数:16

下载文档原格式

  / 16
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

图像识别实验报告

学院:信息工程学院

专业:信号与信息处理******

学号:**********

授课教师:**

2010年7 月5 日

一 实验内容:

采用基于二值数据的Bayes 分类方法,基于最小错误率的Bayes 分类方法和基于最小风险的Bayes 分类方法三种算法,完成字符(0-9,A-Z )的识别:

二 实验方法

1、 Bayes 公式

若已知总共有M 类物体,以及各类在这d 维特征空间的统计分布,具体说来是已知各类别w i =1,2,…,M 的先验概率P (w i )及类条件概率密度函数P (X| w i )。对于待测样品,Bayes 公式可以计算出该样品分属各类别的概率,叫做后验概率,看X 属于哪个类的可能性最大,就把X 归于可能性最大的那个类,后验概率作为识别对象归属的依据。Bayes 公式如下:

∑==

n

j j j

i i i P X P P X P X P 1

)

()|()

()|()|(ωω

ωωω

类别的状态是一个随机变量,而某种状态出现的概率是可以估计的Bayes 公式体现了先验概率、类概率密度函数、后验概率三者之间的关系。

(1)先验概率P (w i )

先验概率P (w i )针对M 个事件出现的可能性而言,不考虑其他任何条件。例如由统计资料表明总药品数为n ,其中正常药品数为n 1 异常药品数为n 2 则

2

1

1)(n n p =

ω

n

n P 22)(=

ω

称P (w i )及P(w 2 )为先验概率。显然在一般情况下正常药品占比例大,即P(w i )> P(w 2 ),仅按先验概率来决策,就会把所有药品都划归为正常药品,并没有达到将正常药品与异常药品区分开的目的。这表明由先验概率所提供的信息太少。

(2)类条件概率密度函数P (X| w i )

类条件概率密度函数P (X| w i )是指在已知某类别的特征空间中,出现特征值X 的概率密度。即第w i 类样品它的属性X 是如何分布的。假定只有其一个特征进行分类,即d=1,并已知这两类的类条件概率密度函数分布,如图1所示,概率密度函数P (X| w i )是正常药品的属性分布,概率密度函数P (X| w 2)是

异常药品的属性分布。

图1、类条件概率

(3) 后验概率

后验概率是指呈现状态X 时,该样品分属各类别的概率,这个概率值可以作为识别对象归属的依据。由于属于不同类的待识别对象存在着呈现相同观察值的可能,即所观察到的某一样品的特征向量为X ,而在M 类中又有不止一类可能呈现这一X 值,它属于各类的概率又是多少呢?这种可能性可用P (X| w i )表示。可以利用Bayes 公式来计算这种条件概率,称之为状态的后验概率P (w i |X )。

∑==

n

j j j

i i i P X P P X P X P 1

)

()|()

()|()|(ωω

ωωω

P (w i |X )是表示在X 出现条件下,样品为w i 类的概率。 2、 基于最小错误率的Bayes 决策

假定得到一个待识别量的特征X 后,每个样品X 有N 个特征,即X=(x 1,x 2,…,x N )通过样品库,计算先验概率P (w i )及类条件概率密度函数P (w i |X ),得到呈现状态X 时,该样品分属各类别的概率,显然这个概率值可以作为识别对象判属的依据。从后验概率分布图可见,在X 值小时,药品被判为正常是比较合理的,判断错误的可能性小。基于最小错误概率的贝叶斯决策就是按后验概率的大小做判决的。这个规则又可以根据判别数目,写成不同的几种等价形式。

两类问题

若每个样品属于w i ,w 2 类中的一类,已知两类的先验概率分别为 P (w i )和P (w 2 )两类的类条件概率密度分别为P (X| w i )和P (X| w 2)。则任给一X ,判断X 的类别。由Bayes 公式可知:

)(/)()|()|(X P P X P X P j j j ωωω=

由全概率公式可知:

)()|()(1j M

j j P X P X P ωω∑==

其中M 为类别。 对于两类问题

)()|()()|()(2211ωωωωP X P P X P X P +=

所以用后验概率来判别为:

判别函数还有另外两种形式,即似然比形式:

其中L (x )在统计学中称为似然比,而 P (w i )/ P (w 2 )称为似然比阈值,其对数形式:

3、 基于最小风险的Bayes 决策

上面讨论了使错误率最小的Bayes 决策规则。然而当接触到实际问题是,可以发现使错误率最小并不一定是一个普遍适用的最佳选择,如图2所示:

图2、 基于最小错误率和基于最小风险分类比较

直线B 的划分把正常药品误判为异常药品,这样会扩大总错误率,给企业带来一些损失:直线A 的划分将异常药品误判为正常药品,虽然是错误分类最小,但会使病人因失去正确的治疗而遭受极大地损失。可见使错误率最小并不一定是最佳选择。

实践中,从根据不同性质的错误会引起不同程度的损失考虑出发,宁肯扩大一些总的错误率,但也要使总的损失减少。这时直线B 的划分为最实用。这会引进一个与损失有关联的概念——风险,在做出决策时,要考虑所承担的风险。基于最小风险的Bayes 决策规则正是为了体现这一点而产生的。

基于最小错误率,在分类时取决于观测值X 对各类的后验概率中之最大值,因而也就无法估计做出错误决策所带来的损失。为此不妨将做出判决的依据,从单纯