图像识别实验报告

格式：doc
大小：291.00 KB
文档页数：16

下载文档原格式

/ 16

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

图像识别实验报告

学院：信息工程学院

专业：信号与信息处理******

学号：**********

授课教师：**

2010年7 月5 日

一实验内容：

采用基于二值数据的Bayes 分类方法，基于最小错误率的Bayes 分类方法和基于最小风险的Bayes 分类方法三种算法，完成字符（0-9，A-Z ）的识别：

二实验方法

1、 Bayes 公式

若已知总共有M 类物体，以及各类在这d 维特征空间的统计分布，具体说来是已知各类别w i =1,2,…,M 的先验概率P （w i ）及类条件概率密度函数P （X| w i ）。对于待测样品，Bayes 公式可以计算出该样品分属各类别的概率，叫做后验概率，看X 属于哪个类的可能性最大，就把X 归于可能性最大的那个类，后验概率作为识别对象归属的依据。Bayes 公式如下：

∑==

j j j

i i i P X P P X P X P 1

)

()|()

()|()|(ωω

ωωω

类别的状态是一个随机变量，而某种状态出现的概率是可以估计的Bayes 公式体现了先验概率、类概率密度函数、后验概率三者之间的关系。

（1）先验概率P （w i ）

先验概率P （w i ）针对M 个事件出现的可能性而言，不考虑其他任何条件。例如由统计资料表明总药品数为n ，其中正常药品数为n 1 异常药品数为n 2 则

1)(n n p =

n P 22)(=

称P （w i ）及P(w 2 )为先验概率。显然在一般情况下正常药品占比例大，即P(w i )> P(w 2 ),仅按先验概率来决策，就会把所有药品都划归为正常药品，并没有达到将正常药品与异常药品区分开的目的。这表明由先验概率所提供的信息太少。

（2）类条件概率密度函数P （X| w i ）

类条件概率密度函数P （X| w i ）是指在已知某类别的特征空间中，出现特征值X 的概率密度。即第w i 类样品它的属性X 是如何分布的。假定只有其一个特征进行分类，即d=1，并已知这两类的类条件概率密度函数分布，如图1所示，概率密度函数P （X| w i ）是正常药品的属性分布，概率密度函数P （X| w 2）是

异常药品的属性分布。

图1、类条件概率

（3）后验概率

后验概率是指呈现状态X 时，该样品分属各类别的概率，这个概率值可以作为识别对象归属的依据。由于属于不同类的待识别对象存在着呈现相同观察值的可能，即所观察到的某一样品的特征向量为X ，而在M 类中又有不止一类可能呈现这一X 值，它属于各类的概率又是多少呢？这种可能性可用P （X| w i ）表示。可以利用Bayes 公式来计算这种条件概率，称之为状态的后验概率P （w i |X ）。

∑==

j j j

i i i P X P P X P X P 1

)

()|()

()|()|(ωω

ωωω

P （w i |X ）是表示在X 出现条件下，样品为w i 类的概率。 2、基于最小错误率的Bayes 决策

假定得到一个待识别量的特征X 后，每个样品X 有N 个特征，即X=（x 1,x 2,…,x N ）通过样品库，计算先验概率P （w i ）及类条件概率密度函数P （w i |X ），得到呈现状态X 时，该样品分属各类别的概率，显然这个概率值可以作为识别对象判属的依据。从后验概率分布图可见，在X 值小时，药品被判为正常是比较合理的，判断错误的可能性小。基于最小错误概率的贝叶斯决策就是按后验概率的大小做判决的。这个规则又可以根据判别数目，写成不同的几种等价形式。

两类问题

若每个样品属于w i ，w 2 类中的一类，已知两类的先验概率分别为 P （w i ）和P （w 2 ）两类的类条件概率密度分别为P （X| w i ）和P （X| w 2）。则任给一X ，判断X 的类别。由Bayes 公式可知：

)(/)()|()|(X P P X P X P j j j ωωω=

由全概率公式可知：

)()|()(1j M

j j P X P X P ωω∑==

其中M 为类别。对于两类问题

)()|()()|()(2211ωωωωP X P P X P X P +=

所以用后验概率来判别为：

判别函数还有另外两种形式，即似然比形式：

其中L （x ）在统计学中称为似然比，而 P （w i ）/ P （w 2 ）称为似然比阈值，其对数形式：

3、基于最小风险的Bayes 决策

上面讨论了使错误率最小的Bayes 决策规则。然而当接触到实际问题是，可以发现使错误率最小并不一定是一个普遍适用的最佳选择，如图2所示：

图2、基于最小错误率和基于最小风险分类比较

直线B 的划分把正常药品误判为异常药品，这样会扩大总错误率，给企业带来一些损失：直线A 的划分将异常药品误判为正常药品，虽然是错误分类最小，但会使病人因失去正确的治疗而遭受极大地损失。可见使错误率最小并不一定是最佳选择。

实践中，从根据不同性质的错误会引起不同程度的损失考虑出发，宁肯扩大一些总的错误率，但也要使总的损失减少。这时直线B 的划分为最实用。这会引进一个与损失有关联的概念——风险，在做出决策时，要考虑所承担的风险。基于最小风险的Bayes 决策规则正是为了体现这一点而产生的。

基于最小错误率，在分类时取决于观测值X 对各类的后验概率中之最大值，因而也就无法估计做出错误决策所带来的损失。为此不妨将做出判决的依据，从单纯

图像识别实验报告

相关主题

文档推荐

最新文档