Bayes分类器设计实验报告
- 格式:doc
- 大小:243.00 KB
- 文档页数:7
bayes 分类器设置实验总结Bayes 分类器设置实验总结在机器学习领域中,分类算法是一个常见的任务之一。
Bayes 分类器是一种基于概率统计的分类算法,它基于贝叶斯定理对样本进行分类。
在本次实验中,我们将对Bayes 分类器的设置进行实验,并总结实验结果。
一、实验目的Bayes 分类器是一种简单但有效的分类算法,通过实验设置我们的目的是验证Bayes 分类器在不同参数下的分类效果,并探索如何对其进行优化。
我们希望通过实验的设计和分析,能够决定最佳的参数设置,并对Bayes 分类器的性能有更深入的了解。
二、数据集选择在进行实验之前,我们需要选择一个合适的数据集作为实验对象。
数据集应具备以下特点:1. 包含有标签的样本数据:由于Bayes 分类器是一种监督学习算法,我们需要有样本的标签信息来进行分类。
2. 具备多类别分类的情况:我们希望能够测试Bayes 分类器在多类别分类问题上的表现,以便更全面地评估其性能。
三、实验设置1. 数据预处理:根据所选数据集的特点,我们需要对数据进行适当的预处理。
可能的预处理步骤包括特征选择、特征缩放、处理缺失值等。
2. 分类器参数设置:Bayes 分类器的性能会受到不同参数的影响,我们希望通过实验找到最佳的参数设置。
例如,在朴素贝叶斯分类器中,我们可以选择不同的先验概率分布,或者使用不同的平滑技术来处理零概率问题。
3. 评价指标选择:为了评估分类器的性能,我们需要选择合适的评价指标。
常见的评价指标包括准确率、召回率、精确率和F1 分数等。
四、实验结果在实验完成后,我们将根据所选的评价指标对实验结果进行分析和总结。
我们可以比较不同参数设置下的分类器性能,并选择最佳的参数设置。
此外,我们还可以考虑其他因素对分类器性能的影响,如数据预处理方法和样本量等。
五、实验总结在本次实验中,我们通过对Bayes 分类器的设置进行实验,得到了一些有价值的结果和经验。
根据实验结果,我们可以总结以下几点:1. 参数设置的重要性:Bayes 分类器的性能受到参数设置的影响。
机电学院通信工程系实验报告课程名称: 模型识别实验名称:贝叶斯分类实验实验地点:信息楼105 指导老师: 侯强实验时间: 2013.06.15 提交时间:2013.06.19 班级: 075102 – 04姓名:肖敬轩学号:20101000639图1引进新样本,分类前(样本为绿色) 图2新样本分类后 从上图可以看出引进的新样本按照分界边界方程把它们分类,即把分类边界左边的归为鲈鱼类,把分类边界右边的归为鲑鱼类。
第二题 1)此题中判别边界与第一题一样,都是一条直线,且垂直于均值的连线,但不一定通过连线的中点,而是通过x0的表达式为:)()(P )(P ln )(21x j i j i 2ji 2j i 0μμωωμμσμμ---+=的点。
故在第一题的基础上求出x0,即可求出判别边界的表达式。
2)编写代码如下:% x 是第一类数据,每一列代表一个样本(两个特征)x1(1,:) = normrnd(10,4,1,20);x1(2,:) = normrnd(12,4,1,20);x2(1,:) = normrnd(11,4,1,20);x2(2,:) = normrnd(14,4,1,20);plot(x1(1,:),x1(2,:),'bo');hold onplot(x2(1,:),x2(2,:),'ro');mx1=mean(x1');%均值mx2=mean(x2');hold on plot(mx1(:,1),mx1(:,2),'g*',mx2(:,1),mx2(:,2),'g*');u=1/2*(x1+x2);%均值估计e=1/2*((x1-u)*(x1-u)'+(x2-u)*(x2-u)');%协方差估计u1=[10;12];u2=[11;14];w=u1-u2;x0=1/2*(u1+u2)-(16/(u1-u2).^2)*log10(2/3)*(u1-u2);%假设先验概率之比为2/3 b=x0(2)-k*x0(1);k=-(mx1(:,1)-mx2(:,1))/(mx1(:,2)-mx2(:,2));%z=(mx1+mx2)/2;%b=z(2)-k*z(1);x=5:20;y=k*x+b;hold onplot(x,y);axis equal3)运行以上代码,得到如下图:(其中绿色*为两类样本的均值)从上图可以看出,判别边界是一条垂直于均值连线但不通过连线中点的直线,因此我们已按照要求把该图像画出。
本文部分内容来自网络整理,本司不为其真实性负责,如有异议或侵权请及时联系,本司将立即删除!== 本文为word格式,下载后可方便编辑和修改! ==分类器实验报告篇一:Bayes分类器设计实验报告装订线模式识别实验报告:学院计算机科学与技术专业 xxxxxxxxxxxxxxxx学号xxxxxxxxxxxx姓名xxxx指导教师xxxx201X年xx月xx日题目Bayes分类器设计一、实验目的对模式识别有一个初步的理解,能够根据自己的设计对贝叶斯决策理论算法有一个深刻地认识,理解二类分类器的设计原理。
二、实验原理最小风险贝叶斯决策可按下列步骤进行:(1)在已知叶斯公式计算出后验概率: ???及给出待识别的X的情况下,根据贝(2)利用计算出的后验概率及决策表,按下面的公式计算出采取险的条件风(3)对(2)中得到的a个条件风险值风险最小的决策????则就是最小风险贝叶斯决策。
,即进行比较,找出使其条件三、实验内容假定某个局部区域细胞识别中正常和非正常两类先验概率分别为正常状态:P (w1)=0.9;异常状态:P(w2)=0.1。
现有一系列待观察的细胞,其观察值为x:-3.9847-3.5549-1.2401-0.9780 -0.7932 -2.8531-2.7605-3.7287-3.5414-2.2692 -3.4549 -3.0752-3.9934 2.8792-0.97800.7932 1.1882 3.0682-1.5799-1.4885-0.7431-0.4221 -1.1186 4.2532已知类条件概率是的曲线如下图:类条件概率分布正态分布分别为N(-2,0.25)、N(2,4)试对观察的结果进行分类。
四、实验要求1)用matlab完成基于最小错误率的贝叶斯分类器的设计,要求程序相应语句有说明文字,要求有子程序的调用过程。
2)根据例子画出后验概率的分布曲线以及分类的结果示意图。
3)如果是最小风险贝叶斯决策,决策表如下:最小风险贝叶斯决策表:请重新设计程序,完成基于最小风险的贝叶斯分类器,画出相应的条件风险的分布曲线和分类结果,并比较两个结果。
实验一图像的贝叶斯分类一、实验目的将模式识别方法与图像处理技术相结合,掌握利用最小错分概率贝叶斯分类器进行图像分类的基本方法,通过实验加深对基本概念的理解。
二、实验仪器设备及软件HP D538、MATLAB三、实验原理1 基本原理阈值化分割算法是计算机视觉中的常用算法,对灰度图象的阈值分割就是先确定一个处于图像灰度取值范围内的灰度阈值,然后将图像中每个像素的灰度值与这个阈值相比较。
并根据比较的结果将对应的像素划分为两类,灰度值大于阈值的像素划分为一类,小于阈值的划分为另一类,等于阈值的可任意划分到两类中的任何一类。
此过程中,确定阈值是分割的关键。
对一般的图像进行分割处理通常对图像的灰度分布有一定的假设,或者说是基于一定的图像模型。
最常用的模型可描述如下:假设图像由具有单峰灰度分布的目标和背景组成,处于目标和背景内部相邻像素间的灰度值是高度相关的,但处于目标和背景交界处两边的像素灰度值有较大差别,此时,图像的灰度直方图基本上可看作是由分别对应于目标和背景的两个单峰直方图混合构成。
而且这两个分布应大小接近,且均值足够远,方差足够小,这种情况下直方图呈现较明显的双峰。
类似地,如果图像中包含多个单峰灰度目标,则直方图可能呈现较明显的多峰。
上述图像模型只是理想情况,有时图像中目标和背景的灰度值有部分交错。
这时如用全局阈值进行分割必然会产生一定的误差。
分割误差包括将目标分为背景和将背景分为目标两大类。
实际应用中应尽量减小错误分割的概率,常用的一种方法为选取最优阈值。
这里所谓的最优阈值,就是指能使误分割概率最小的分割阈值。
图像的直方图可以看成是对灰度值概率分布密度函数的一种近似。
如一幅图像中只包含目标和背景两类灰度区域,那么直方图所代表的灰度值概率密度函数可以表示为目标和背景两类灰度值概率密度函数的加权和。
如果概率密度函数形式已知,就有可能计算出使目标和背景两类误分割概率最小的最优阈值。
假设目标与背景两类像素值均服从正态分布且混有加性高斯噪声,上述分类问题可以使用模式识别中的最小错分概率贝叶斯分类器来解决。
Bayes分类器原理分析以及实现编程环境:python 3.7jupyter notebook⽂章说明:这⾥只是贝叶斯分类器的原理进⾏分析以及实现,重点关注其中的数学原理和逻辑步骤,在测试等阶段直接调⽤了python机器学习的库。
基本步骤:输⼊类数,特征数,待分样本数输⼊训练样本数和训练样本集计算先验概率计算各类条件概率密度计算各类的后验概率若按最⼩错误率原则分类,则根据后验概率判定若按最⼩风险原则分类,则计算各样本属于各类时的风险并判定# 导⼊基本库import pandas as pdimport numpy as npimport mathimport matplotlib.pyplot as plt%matplotlib inline%config InlineBackend.figure_format = 'png'数据预处理colume_names = ['','gender','height','weight','size']df= pd.read_excel('data/gender.xlsx',index_col=0,names=colume_names)df.head(5)gender height weight size1⼥163.062.036.02⼥158.042.036.03男168.067.042.04男180.067.041.05男180.075.046.0df.shape(571, 4)这⾥可以看到数据有4个维度,分别为性别、⾝⾼、体重、鞋码,共有571条记录。
下⾯做⼀些简单的处理:# 性别数据转换df.replace('男',1,inplace=True)df.replace('⼥',2,inplace=True)df.head(5)gender height weight size12163.062.036.022158.042.036.031168.067.042.041180.067.041.0gender height weight size 51180.075.046.0# 男⽣⼥⽣数据分开male_df = df.loc[df['gender']==1]female_df = df.loc[df['gender']==2]female_df.head(5)gender height weight size 12163.062.036.022158.042.036.092160.045.036.0102163.048.037.0112161.045.036.01、单个特征——⾝⾼为了更加深⼊得理解贝叶斯分类器原理,我们从简单的⼀维特征开始。
贝叶斯分类算法实验报告贝叶斯分类算法是一种基于统计学原理的分类算法,在文本分类、垃圾邮件过滤和情感分析等领域得到了广泛应用。
本实验通过使用Python语言和sklearn库实现了贝叶斯分类算法,并在果蔬分类数据集上进行了实验。
实验数据果蔬分类数据集是一个有监督的分类数据集,包含了81个样本和9个特征。
特征包括水分、纤维、硬度、色泽、含糖量、口感、储存期、气味和价格。
样本的分类标签包括红萝卜、西红柿和黄瓜三种类型。
实验过程首先,我们需要将数据集划分为训练集和测试集,我们选择将数据集的70%用作训练集,30%用作测试集。
然后,我们需要对数据进行预处理,包括特征选择和标准化。
对于特征选择,我们可以使用卡方检验进行特征评估。
```pythonfrom sklearn.feature_selection import SelectKBest, chi2对于标准化,我们可以使用z-score标准化方法进行处理。
最后,我们可以使用sklearn库中的GaussianNB类实现高斯朴素贝叶斯分类算法。
结果分析我们使用准确率和混淆矩阵来评估算法的性能。
首先,我们计算了算法在测试集上的准确率,结果为0.8。
accuracy = accuracy_score(y_test, y_pred)print('Accuracy: {:.2f}%'.format(accuracy * 100))```混淆矩阵可以用来查看分类器在每个类别中的表现,包括正确分类数和错误分类数。
混淆矩阵的行表示实际分类结果,列表示预测分类结果。
混淆矩阵结果为:```[[8 0 1][1 5 0][2 0 9]]```我们可以看到,分类器在红萝卜和黄瓜两个类别上表现良好,但在西红柿一类中有错误分类。
这可能是由于数据集中这个类别的样本数量较少,导致算法对于这个类别的分类效果较差。
总结。
《模式识别》实验报告-贝叶斯分类一、实验目的通过使用贝叶斯分类算法,实现对数据集中的样本进行分类的准确率评估,熟悉并掌握贝叶斯分类算法的实现过程,以及对结果的解释。
二、实验原理1.先验概率先验概率指在不考虑其他变量的情况下,某个事件的概率分布。
在贝叶斯分类中,需要先知道每个类别的先验概率,例如:A类占总样本的40%,B类占总样本的60%。
2.条件概率后验概率指在已知先验概率和条件概率下,某个事件发生的概率分布。
在贝叶斯分类中,需要计算每个样本在各特征值下的后验概率,即属于某个类别的概率。
4.贝叶斯公式贝叶斯公式就是计算后验概率的公式,它是由条件概率和先验概率推导而来的。
5.贝叶斯分类器贝叶斯分类器是一种基于贝叶斯定理实现的分类器,可以用于在多个类别的情况下分类,是一种常用的分类方法。
具体实现过程为:首先,使用训练数据计算各个类别的先验概率和各特征值下的条件概率。
然后,将测试数据的各特征值代入条件概率公式中,计算出各个类别的后验概率。
最后,取后验概率最大的类别作为测试数据的分类结果。
三、实验步骤1.数据集准备本次实验使用的是Iris数据集,数据包含150个Iris鸢尾花的样本,分为三个类别:Setosa、Versicolour和Virginica,每个样本有四个特征值:花萼长度、花萼宽度、花瓣长度、花瓣宽度。
2.数据集划分将数据集按7:3的比例分为训练集和测试集,其中训练集共105个样本,测试集共45个样本。
计算三个类别的先验概率,即Setosa、Versicolour和Virginica类别在训练集中出现的频率。
对于每个特征值,根据训练集中每个类别所占的样本数量,计算每个类别在该特征值下出现的频率,作为条件概率。
5.测试数据分类将测试集中的每个样本的四个特征值代入条件概率公式中,计算出各个类别的后验概率,最后将后验概率最大的类别作为该测试样本的分类结果。
6.分类结果评估将测试集分类结果与实际类别进行比较,计算分类准确率和混淆矩阵。
实验报告一、实验目的通过上机编程加深对贝叶斯分类器分类过程的理解,同时提高分析问题、解决问题、实际操作的能力。
二、实验数据说明实验数据来源于/ml/,详细说明请见附件一。
数据源的完整名称是Wine Data Set,是对3种不同的酒进行分类。
这三种酒包括13种不同的属性。
13种属性分别为:Alcohol,Malic acid,Ash,Alcalinity of ash,Magnesium,Total phenols,Flavanoids,Nonflavanoid phenols,Proanthocyanins,Color intensity,Hue,OD280/OD315 of diluted wines,Proline。
在“wine.data”文件中,每行代表一种酒的样本,共有178个样本;一共有14列,其中,第一列为类标志属性,共有三类,分别记为“1”,“2”,“3”;后面的13列为每个样本的对应属性的样本值。
其中第1类有59个样本,第2类有71个样本,第3类有48个样本。
三、朴素贝叶斯分类算法分析贝叶斯分类器是用于分类的贝叶斯网络。
该网络中应包含类结点C,其中C 的取值来自于类集合( c1 , c2 , ... , cm),还包含一组结点X = ( X1 , X2 , ... , Xn),表示用于分类的特征。
对于贝叶斯网络分类器,若某一待分类的样本D,其分类特征值为x = ( x1 , x2 , ... , x n) ,则样本D 属于类别ci 的概率P( C = ci | X1 = x1 , X2 = x 2 , ... , Xn = x n) ,( i = 1 ,2 , ... , m) 应满足下式:P( C = ci | X = x) = Max{ P( C = c1 | X = x) , P( C = c2 | X = x ) , ... , P( C = cm | X = x ) } 而由贝叶斯公式:P( C = ci | X = x) = P( X = x | C = ci) * P( C = ci) / P( X = x)其中,P( C = ci) 可由领域专家的经验得到,而P( X = x | C = ci) 和P( X = x) 的计算则较困难。
贝叶斯分类实验报告篇一:贝叶斯分类实验报告实验报告实验课程名称数据挖掘实验项目名称贝叶斯分类年级XX级专业信息与计算科学学生姓名学号 1207010220理学院实验时间:XX年12月2日学生实验室守则一、按教学安排准时到实验室上实验课,不得迟到、早退和旷课。
二、进入实验室必须遵守实验室的各项规章制度,保持室内安静、整洁,不准在室内打闹、喧哗、吸烟、吃食物、随地吐痰、乱扔杂物,不准做与实验内容无关的事,非实验用品一律不准带进实验室。
三、实验前必须做好预习(或按要求写好预习报告),未做预习者不准参加实验。
四、实验必须服从教师的安排和指导,认真按规程操作,未经教师允许不得擅自动用仪器设备,特别是与本实验无关的仪器设备和设施,如擅自动用或违反操作规程造成损坏,应按规定赔偿,严重者给予纪律处分。
五、实验中要节约水、电、气及其它消耗材料。
六、细心观察、如实记录实验现象和结果,不得抄袭或随意更改原始记录和数据,不得擅离操作岗位和干扰他人实验。
七、使用易燃、易爆、腐蚀性、有毒有害物品或接触带电设备进行实验,应特别注意规范操作,注意防护;若发生意外,要保持冷静,并及时向指导教师和管理人员报告,不得自行处理。
仪器设备发生故障和损坏,应立即停止实验, 并主动向指导教师报告,不得自行拆卸查看和拼装。
八、实验完毕,应清理好实验仪器设备并放回原位,清扫好实验现场,经指导教师检查认可并将实验记录交指导教师检查签字后方可离去。
九、无故不参加实验者,应写出检查,提出申请并缴纳相应的实验费及材料消耗费,经批准后,方可补做。
十、自选实验,应事先预约,拟订出实验方案,经实验室主任同意后,在指导教师或实验技术人员的指导下进行。
H^一、实验室内一切物品未经允许严禁带出室外,确需带出,必须经过批准并办理手续。
学生所在学院:理学院专业:信息与计算科学班级: 信计121篇二:数据挖掘-贝叶斯分类实验报告实验报告实验课程名称数据挖掘实验项目名称贝叶斯的实现年级专业学生姓名学号00学院实验时间:年月曰13篇三:模式识别实验报告贝叶斯分类器模式识别理论与方法课程作业实验报告实验名称:Generating Pattern Classes 实验编号:Proj02-01规定提交日期:XX年3月30日实际提交日期:XX年3 月24日摘要:在熟悉贝叶斯分类器基本原理基础上,通过对比分类特征向量维数差异而导致分类正确率发生的变化,验证了“增加特征向量维数,可以改善分类结果”。
模式识别实验报告题目: Bayes 分类器设计学 院 计算机科学与技术 专 业 xxxxxxxxxxxxxxxx 学 号 xxxxxxxxxxxx 姓 名 xxxx 指导教师 xxxx2015年xx 月xx 日装 订 线Bayes分类器设计一、实验目的对模式识别有一个初步的理解,能够根据自己的设计对贝叶斯决策理论算法有一个深刻地认识,理解二类分类器的设计原理。
二、实验原理最小风险贝叶斯决策可按下列步骤进行:(1)在已知及给出待识别的X的情况下,根据贝叶斯公式计算出后验概率:(2)利用计算出的后验概率及决策表,按下面的公式计算出采取的条件风险(3)对(2)中得到的a个条件风险值进行比较,找出使其条件风险最小的决策,即则就是最小风险贝叶斯决策。
三、实验内容假定某个局部区域细胞识别中正常和非正常两类先验概率分别为正常状态:P(w1)=0.9;异常状态:P(w2)=0.1。
现有一系列待观察的细胞,其观察值为x:-3.9847 -3.5549 -1.2401 -0.9780 -0.7932 -2.8531-2.7605 -3.7287 -3.5414 -2.2692 -3.4549 -3.0752-3.9934 2.8792 -0.9780 0.7932 1.1882 3.0682-1.5799 -1.4885 -0.7431 -0.4221 -1.1186 4.2532已知类条件概率是的曲线如下图:类条件概率分布正态分布分别为N(-2,0.25)、N(2,4)试对观察的结果进行分类。
四、实验要求1)用matlab完成基于最小错误率的贝叶斯分类器的设计,要求程序相应语句有说明文字,要求有子程序的调用过程。
2)根据例子画出后验概率的分布曲线以及分类的结果示意图。
3)如果是最小风险贝叶斯决策,决策表如下:最小风险贝叶斯决策表:请重新设计程序,完成基于最小风险的贝叶斯分类器,画出相应的条件风险的分布曲线和分类结果,并比较两个结果。
五、实验程序最小错误率贝叶斯决策分类器设计x=[-3.9847 -3.5549 -1.2401 -0.9780 -0.7932 -2.8531 -2.7605 -3.7287 -3.5414 -2.269 2 -3.4549 -3.0752 -3.9934 2.8792 -0.9780 0.7932 1.1882 3.0682 -1.5799 -1.4 885 -0.7431 -0.4221 -1.1186 4.2532 ] pw1=0.9 pw2=0.1 e1=-2; a1=0.5 e2=2;a2=2m=numel(x) %得到待测细胞个数pw1_x=zeros(1,m) %存放对w1的后验概率矩阵pw2_x=zeros(1,m) %存放对w2的后验概率矩阵results=zeros(1,m) %存放比较结果矩阵for i = 1:m%计算在w1下的后验概率pw1_x(i)=(pw1*normpdf(x(i),e1,a1))/(pw1*normpdf(x(i),e1,a1)+pw2*normpdf(x(i),e2,a2))%计算在w2下的后验概率pw2_x(i)=(pw2*normpdf(x(i),e2,a2))/(pw1*normpdf(x(i),e1,a1)+pw2*normpdf(x(i),e2,a2)) endfor i = 1:mif pw1_x(i)>pw2_x(i) %比较两类后验概率result(i)=0 %正常细胞elseresult(i)=1 %异常细胞endenda=[-5:0.05:5] %取样本点以画图 n=numel(a)pw1_plot=zeros(1,n)pw2_plot=zeros(1,n)for j=1:npw1_plot(j)=(pw1*normpdf(a(j),e1,a1))/(pw1*normpdf(a(j),e1,a1)+pw2*normpdf(a(j),e2,a2)) %计算每个样本点对w1的后验概率以画图pw2_plot(j)=(pw2*normpdf(a(j),e2,a2))/(pw1*normpdf(a(j),e1,a1)+pw2*normpdf(a(j),e2,a2)) endfigure(1)hold onplot(a,pw1_plot,'k-',a,pw2_plot,'r-.')for k=1:mif result(k)==0plot(x(k),-0.1,'b*') %正常细胞用*表示elseplot(x(k),-0.1,'rp') %异常细胞用五角星表示end;end;legend('正常细胞后验概率曲线','异常细胞后验概率曲线','正常细胞','异常细胞')xlabel('样本细胞的观察值') ylabel('后验概率')title('后验概率分布曲线')grid onreturn实验内容仿真x = [-3.9847 , -3.5549 , -1.2401 , -0.9780 , -0.7932 , -2.8531 ,-2.7605 , -3.7287 , -3.5414 , -2.2692 , -3.4549 , -3.0752 , -3.9934 , 2.8792 , -0.9780 , 0.7932 , 1.1882 , 3.0682, -1.579 9 , -1.4885 , -0.7431 , -0.4221 , -1.1186 , 4.2532 ]disp(x)pw1=0.9pw2=0.1[result]=bayes(x,pw1,pw2)最小风险贝叶斯决策分类器设计function [R1_x,R2_x,result]=danger(x,pw1,pw2)m=numel(x) %得到待测细胞个数R1_x=zeros(1,m) %存放把样本X判为正常细胞所造成的整体损失R2_x=zeros(1,m) %存放把样本X判为异常细胞所造成的整体损失result=zeros(1,m) %存放比较结果e1=-2a1=0.5e2=2a2=2%类条件概率分布px_w1:(-2,0.25) px_w2(2,4)r11=0r12=2r21=4r22=0%风险决策表for i=1:m %计算两类风险值R1_x(i)=r11*pw1*normpdf(x(i),e1,a1)/(pw1*normpdf(x(i),e1,a1)+pw2*normpdf(x(i),e2,a2))+r21 *pw2*normpdf(x(i),e2,a2)/(pw1*normpdf(x(i),e1,a1)+pw2*normpdf(x(i),e2,a2))R2_x(i)=r12*pw1*normpdf(x(i),e1,a1)/(pw1*normpdf(x(i),e1,a1)+pw2*normpdf(x(i),e2,a2))+r22 *pw2*normpdf(x(i),e2,a2)/(pw1*normpdf(x(i),e1,a1)+pw2*normpdf(x(i),e2,a2))endfor i=1:mif R2_x(i)>R1_x(i)%第二类比第一类风险大result(i)=0 %判为正常细胞(损失较小),用0表示elseresult(i)=1 %判为异常细胞,用1表示endenda=[-5:0.05:5] %取样本点以画图n=numel(a)R1_plot=zeros(1,n)R2_plot=zeros(1,n)for j=1:nR1_plot(j)=r11*pw1*normpdf(a(j),e1,a1)/(pw1*normpdf(a(j),e1,a1)+pw2*normpdf(a(j),e2,a2))+r 21*pw2*normpdf(a(j),e2,a2)/(pw1*normpdf(a(j),e1,a1)+pw2*normpdf(a(j),e2,a2))R2_plot(j)=r12*pw1*normpdf(a(j),e1,a1)/(pw1*normpdf(a(j),e1,a1)+pw2*normpdf(a(j),e2,a2))+r 22*pw2*normpdf(a(j),e2,a2)/(pw1*normpdf(a(j),e1,a1)+pw2*normpdf(a(j),e2,a2))%计算各样本点的风险以画图endfigure(1)hold onplot(a,R1_plot,'b-',a,R2_plot,'g*-')for k=1:mif result(k)==0plot(x(k),-0.1,'b^')%正常细胞用上三角表示elseplot(x(k),-0.1,'go')%异常细胞用圆表示end;end;legend('正常细胞','异常细胞','Location','Best')xlabel('细胞分类结果')ylabel('条件风险')title('风险判决曲线')grid onreturn实验内容仿真x = [-3.9847 , -3.5549 , -1.2401 , -0.9780 , -0.7932 , -2.8531 ,-2.7605 , -3.7287 , -3.5414 , -2.2692 , -3.4549 , -3.0752 , -3.9934 , 2.8792 , -0.9780 , 0.7932 , 1.1882 , 3.0682, -1.5799 , -1.4885 , -0.7431 , -0.4221 , -1.1186 , 4.2532 ]disp(x)pw1=0.9pw2=0.1[R1_x,R2_x,result]=danger(x,pw1,pw2)六、实验结果和数据最小错误率贝叶斯决策后验概率曲线与判决结果在一张图上:后验概率曲线如图所示,带*的绿色曲线为判决成异常细胞的后验概率曲线;另一条平滑的蓝色曲线为判为正常细胞的后验概率曲线。
根据最小错误概率准则,判决结果见曲线下方,其中“上三角”代表判决为正常细胞,“圆圈”代表异常细胞。
各细胞分类结果:0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 1 1 0 0 0 1 0 10为判成正常细胞,1为判成异常细胞最小风险贝叶斯决策风险判决曲线如图2所示,其中带*的绿色曲线代表异常细胞的条件风险曲线;另一条光滑的蓝色曲线为判为正常细胞的条件风险曲线。