贝叶斯决策理论的Matlab实现

  • 格式:doc
  • 大小:1.27 MB
  • 文档页数:8

下载文档原格式

  / 10
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第二章

1、简述基于最小错误率的贝叶斯决策理论;并分析在“大数据时代”,使用贝叶斯决策理论需要解决哪些问

题,贝叶斯决策理论有哪些优缺点,贝叶斯决策理论适用条件和范围是什么?举例说明风险最小贝叶斯决策理论的意义。

答:在大数据时代,我们可以获得很多的样本数据,并且是已经标记好的;要使用贝叶斯决策理论最重要的是确定类条件概率密度函数和相关的参数。

优缺点:贝叶斯决策的优点是思路比较简单,大数据的前提下我们可以得到较准确的先验概率,

因此如果确定了类条件概率密度函数,我们便可以很快的知道如何分类,但是在大数据的前提下,类条件概率密度函数的确定不是这么简单,因为参数可能会增多,有时候计算量也是很大的。

适用条件和范围:

(1) 样本(子样)的数量(容量)不充分大,因而大子样统计理论不适宜的场合。

(2) 试验具有继承性,反映在统计学上就是要具有在试验之前已有先验信息的场合。用这种方法进

行分类时要求两点:

第一,要决策分类的参考总体的类别数是一定的。例如两类参考总体(正常状态Dl和异常状态D2),或L类参考总体D1,D2,…,DL(如良好、满意、可以、不满意、不允许、……)。

第二,各类参考总体的概率分布是已知的,即每一类参考总体出现的先验概率P(Di)以及各类概率

密度函数P(x/Di)是已知的。显然,0≤P(Di)≤1,(i=l,2,…,L),∑P(Di)=1。

说明风险最小贝叶斯决策理论的意义:

那股票举例,现在有A、B两个股票,根据市场行情结合最小错误率的风险选择A股(假设为0.55),而B股(0.45);但是选着A股必须承担着等级为7的风险,B股风险等级仅为4;这时因遵循最

小风险的贝叶斯决策,毕竟如果A股投资的失败带来的经济损失可能获得收益还大。

2、教材中例2.1-2.2的Matlab实现.

2.1:结果:

3、利用Matlab提供的正态分布函数,产生d(=1,2,3)维的随机数据(可考虑类别数目为2,各类的先验概

率自定或随机产生,类条件概率由正态分布密度函数确定),编写Matlab代码实现最小错误率的贝叶斯决策。

根据所给的1维代码可推出2维情况:

运行结果:

同理,将三维参数自定义为:

运行结果为:

4、从最小错误率贝叶斯决策规则出发,讨论在类条件密度服从正态分布时,推导出不同情况下的判别函数

表达式。

5、补充的实验验证题:分别用最小距离分类器(书P.32,图2-8)和马氏距离分类器(书P.32,式2-82)对下

列数据(Fisher's Iris Data)进行分析, 对比两种分类器的识别率有什么不同,并分析原因。

关于Fisher's Iris Data: Fisher's iris data consists of measurements on the sepal length, sepal width, petal length, and petal width of 150 iris specimens. There are 50 specimens from each of three species.

在Matlab中调用load fisheriris可以得到该数据,meas为150×4的数据矩阵,species为150×1的cell 矩阵,含有类别信息。

程序为:

运行结果:

原因:

最小距离分类器忽略了各类的协方差矩阵,将类内的个特征认为是相互独立的,马氏距离分离器则将其考虑

在内,只是各类的将协方差矩认为是相等的,并没有忽略内部特征的相互影响。

相关主题