两类正态分布模式的贝叶斯判别
- 格式:doc
- 大小:139.50 KB
- 文档页数:7
【模式识别与机器学习】——2.1贝叶斯判别法⼀.作为统计判别问题的模式分类 模式识别的⽬的就是要确定某⼀个给定的模式样本属于哪⼀类。
可以通过对被识别对象的多次观察和测量,构成特征向量,并将其作为某⼀个判决规则的输⼊,按此规则来对样本进⾏分类。
在获取模式的观测值时,有些事物具有确定的因果关系,即在⼀定的条件下,它必然会发⽣或必然不发⽣。
但在现实世界中,由许多客观现象的发⽣,就每⼀次观察和测量来说,即使在基本条件保持不变的情况下也具有不确定性。
只有在⼤量重复的观察下,其结果才能呈现出某种规律性,即对它们观察到的特征具有统计特性。
特征值不再是⼀个确定的向量,⽽是⼀个随机向量。
此时,只能利⽤模式集的统计特性来分类,以使分类器发⽣错误的概率最⼩。
⼆.贝叶斯判别原则2.1 两类模式集的分类⽬的:要确定x是属于ω1类还是ω2类,要看x是来⾃于ω1类的概率⼤还是来⾃ω2类的概率⼤。
2.2 贝叶斯判别规则对于⾃然属性是属于ωi类的模式x来说,它来⾃ωi类的概率应为P(ωi |x)根据概率判别规则,有:由贝叶斯定理,后验概率P(ωi | x)可由类别ωi的先验概率P(ωi)和x的条件概率密度p(x | ωi)来计算,即:这⾥p(x | ωi)也称为似然函数。
将该式代⼊上述判别式,有:或其中,l12称为似然⽐,P(ω2)/P(ω1)=θ21称为似然⽐的判决阈值,此判别称为贝叶斯判别。
2.3 贝叶斯判别⽰例问题描述: 对某⼀地震⾼发区进⾏统计,地震以ω1类表⽰,正常以ω2类表⽰统计的时间区间内,每周发⽣地震的概率为20%,即P(ω1)=0.2,当然P(ω2)=1-0.2=0.8 在任意⼀周,要判断该地区是否会有地震发⽣。
显然,因为P(ω2)> P(ω1),只能说是正常的可能性⼤。
如要进⾏判断,只能其它观察现象来实现。
通常地震与⽣物异常反应之间有⼀定的联系。
若⽤⽣物是否有异常反应这⼀观察现象来对地震进⾏预测,⽣物是否异常这⼀结果以模式x代表,这⾥x为⼀维特征,且只有x=“异常”和x=“正常”两种结果。
贝叶斯判别界面方程式
贝叶斯判别界面方程式是:y = argmax P(Ck|X) = argmax
P(X|Ck)P(Ck)。
其中,y表示判别界面输出的类别,Ck表示第k个类别,X表示样本,P(Ck|X)表示样本属于第k个类别的后验概率,P(X|Ck)表示样本属于第k个类别的条件概率,P(Ck)表示第k个类别的先验概率。
对于两类问题且模式都是正态分布的特殊情况,当C1≠C2时,两类模式的正态分布为:p(x|ω1)表示为N(m1, C1),p(x|ω2)表示为N(m2, C2),ω1和ω2两类的判别函数对应为:m1和m2是两种模式的均值向量mi = Ei{x}Ci是协方差矩阵。
当x是二维模式时,判别界面为二次曲线,如椭圆,圆,抛物线或双曲线等。
当C1=C2=C时的情况判别界面为x的线性函数,为一超平面。
当x是二维时,判别界面为一直线。
请注意,这里的贝叶斯判别界面方程式可能根据具体问题的不同而有所不同。
如果您需要更具体的指导,建议您咨询专业人士获取更详细的信息。
对数正态分布贝叶斯更新方法比较研究近年来,对数正态分布在很多领域中被广泛地应用和研究,例如金融学、能源经济学、健康与医疗学等等。
由于对数正态分布有很好的数学性质和适用性,所以它被广泛地应用于各类实际问题中。
贝叶斯统计是一种常用的概率方法,它通过使用先验分布的信息来更新后验分布的信息,从而得出基于新观测数据的最终结果。
本文中,我们主要探讨对数正态分布贝叶斯更新方法的研究现状和比较。
研究现状对数正态分布是指随机变量的对数服从正态分布。
它的概率密度函数为:$$f(x; \mu, \sigma) = \frac{1}{x\sigma\sqrt{2\pi}}exp(-\frac{(ln(x)-\mu)^2}{2\sigma^2})$$其中,$\mu$和$\sigma$分别是对数正态分布的均值和标准差。
1.基于共轭先验分布的贝叶斯更新方法先验分布是一个在贝叶斯统计中非常重要的概念,因为它可以提供关于参数的信息,从而可以更准确地推断从数据中获得参数的概率。
对数正态分布的常用先验分布是正态分布。
由于正态分布是对数正态分布的共轭先验分布,所以可以用其来计算对数正态分布的后验分布。
具体地,假设我们已经观测到$n$个独立且同分布的随机变量$x_1, x_2, ..., x_n$,它们均满足对数正态分布。
假设我们已经得到了关于对数正态分布均值参数$\mu$和方差参数$\sigma^2$的先验分布$p(\mu, \sigma^2)$,那么它们的后验分布$p(\mu, \sigma^2|x_1, x_2, ..., x_n)$可以表示为:其中,$f(x_i; \mu, \sigma^2)$是对数正态分布的概率密度函数。
由于$p(\mu,\sigma^2|x_1, x_2, ..., x_n)$也是正态分布,所以可以用正态分布的参数来表示:其中,$N(\mu_n, \tau_n^2)$表示均值为$\mu_n$,方差为$\tau_n^2$的正态分布后验分布,$IG(a_n, b_n)$表示参数为$a_n$和$b_n$的逆伽马分布后验分布。
第二章贝叶斯决策理论与统计判别方法课前思考1、机器自动识别分类,能不能避免错分类,如汉字识别能不能做到百分之百正确?怎样才能减少错误?2、错分类往往难以避免,因此就要考虑减小因错分类造成的危害损失,譬如对病理切片进行分析,有可能将正确切片误判为癌症切片,反过来也可能将癌症病人误判为正常人,这两种错误造成的损失一样吗?看来后一种错误更可怕,那么有没有可能对后一种错误严格控制?3、概率论中讲的先验概率,后验概率与概率密度函数等概念还记得吗?什么是贝叶斯公式?4、什么叫正态分布?什么叫期望值?什么叫方差?为什么说正态分布是最重要的分布之一?学习目标这一章是模式识别的重要理论基础,它用概率论的概念分析造成错分类和识别错误的根源,并说明与哪些量有关系。
在这个基础上指出了什么条件下能使错误率最小。
有时不同的错误分类造成的损失会不相同,因此如果错分类不可避免,那么有没有可能对危害大的错分类实行控制。
对于这两方面的概念要求理解透彻。
这一章会将分类与计算某种函数联系起来,并在此基础上定义了一些术语,如判别函数、决策面(分界面),决策域等,要正确掌握其含义。
这一章会涉及设计一个分类器的最基本方法——设计准则函数,并使所设计的分类器达到准则函数的极值,即最优解,要理解这一最基本的做法。
这一章会开始涉及一些具体的计算,公式推导、证明等,应通过学习提高这方面的理解能力,并通过习题、思考题提高自己这方面的能力。
本章要点1、机器自动识别出现错分类的条件,错分类的可能性如何计算,如何实现使错分类出现可能性最小——基于最小错误率的Bayes决策理论2、如何减小危害大的错分类情况——基于最小错误风险的Bayes决策理论3、模式识别的基本计算框架——制定准则函数,实现准则函数极值化的分类器设计方法4、正态分布条件下的分类器设计5、判别函数、决策面、决策方程等术语的概念6、Bayes决策理论的理论意义与在实践中所遇到的困难知识点§2.1 引言在前一章中已提到,模式识别是一种分类问题,即根据识别对象所呈现的观察值,将其分到某个类别中去。
对数正态分布贝叶斯更新方法比较研究引言贝叶斯更新方法是一种统计推断方法,通过不断地更新先验概率和观测数据,得到后验概率分布。
在实际应用中,经常会遇到对数正态分布的贝叶斯更新问题,即给定对数正态分布的先验概率分布和观测数据,需要更新后验概率分布。
对数正态分布在生物学、金融学、环境科学等领域有着广泛的应用,因此对其贝叶斯更新方法的比较研究具有重要的理论和实际意义。
本文将从对数正态分布的基本特点和贝叶斯更新方法的原理入手,对不同的对数正态分布贝叶斯更新方法进行比较研究,旨在为相关领域的研究者和应用者提供参考和借鉴。
一、对数正态分布的基本特点对数正态分布是一种连续概率分布,其密度函数为:f(x|μ,σ)=1/xσ2πe−(lnx−μ)22σ2,x>0μ为对数正态分布的均值参数,σ为对数正态分布的标准差参数。
对数正态分布具有以下几个基本特点:1. 数据取值范围广泛:对数正态分布的取值范围为(0,∞),适用于描述不同领域中的非负数据,如生物学中的生长率数据、金融学中的股票收益率数据等。
2. 非对称性:对数正态分布是一个非对称分布,其密度函数在均值μ处取得最大值,随着σ的增大或减小,分布形状会发生相应的改变。
3. 随机变量的对数服从正态分布:若随机变量X服从对数正态分布,即ln(X)∼N(μ,σ2),则X服从对数正态分布。
对数正态分布的这些特点使得其在实际问题中有着广泛的应用价值。
下面将介绍对数正态分布的贝叶斯更新方法。
对数正态分布的贝叶斯更新方法是通过贝叶斯定理来更新先验概率分布,得到后验概率分布。
假设先验概率分布为对数正态分布f(θ|μ0,σ02),观测数据为x,后验概率分布为f(θ|x,μ0,σ02)。
θ表示对数正态分布的参数,μ0和σ02分别为先验概率分布的均值和方差。
根据贝叶斯定理,后验概率分布可以表示为:f(θ|x,μ0,σ02)∝f(x|θ)f(θ|μ0,σ02)f(x|θ)为观测数据的似然函数,f(θ|μ0,σ02)为先验概率分布。
对数正态分布贝叶斯更新方法比较研究1. 引言1.1 研究背景对数正态分布是一种常见的概率分布,在许多领域都有广泛的应用。
它可以描述许多现实世界中的现象,如股票价格的变化、自然资源的分布等。
贝叶斯更新方法是一种统计推断方法,通过不断更新先验概率得到后验概率,可以更准确地估计参数或进行预测。
对数正态分布贝叶斯更新方法比较研究可以帮助我们更好地理解这两种方法的优劣势,为我们在实际问题中选择合适的方法提供依据。
在过去的研究中,对数正态分布和贝叶斯更新方法分别都有很多研究成果,但是很少有对它们进行深入比较的研究。
了解它们在不同情况下的表现,可以帮助我们更好地理解其适用范围和局限性。
对数正态分布贝叶斯更新方法比较研究具有很高的研究价值和现实意义。
1.2 研究意义对数正态分布贝叶斯更新方法比较研究的意义在于深入探讨不同概率分布在贝叶斯更新中的应用情况,为贝叶斯统计推断提供更为全面的参考。
对数正态分布在现实生活中具有广泛的应用,例如在金融领域中对股票价格的建模、在生态学中对生态环境变量的分布等方面均有实际需求。
通过研究不同分布在贝叶斯更新中的表现,可以为相关领域提供更为准确和有效的统计推断方法,为决策提供科学依据和支持。
对数正态分布贝叶斯更新方法比较研究还能够推动概率统计领域的发展,促进更多学者对概率分布和贝叶斯方法的深入理解和研究,从而推动相关领域的学科进步和创新。
这一研究具有重要的理论与实践意义,对于促进统计学科的发展和应用具有积极的推动作用。
1.3 研究目的本研究的目的是探讨对数正态分布和贝叶斯更新方法在统计学和概率论中的应用,并比较它们在实际问题中的效果和优劣。
通过对这两种方法的原理和应用进行全面深入的研究和比较分析,旨在为实际问题的解决提供更有效的统计和推断方法。
在现实生活中,数据往往不完全服从正态分布,因此对数正态分布被广泛用于模拟和描述各种非负态的数据。
而贝叶斯更新方法则是一种通过不断更新先验概率分布,将新数据纳入统计推断中的方法,具有更加灵活和适应性的特点。
对数正态分布贝叶斯更新方法比较研究对数正态分布是概率论中的一种重要概率分布,它在实际应用中有着广泛的应用。
贝叶斯更新方法是利用先验分布和观测数据来更新参数估计的一种方法。
本文将对对数正态分布的贝叶斯更新方法进行比较研究,以期对该方法的应用和效果有更深入的理解。
一、对数正态分布和贝叶斯更新方法的基本概念对数正态分布是指一个随机变量的对数服从正态分布的分布。
如果一个随机变量X服从对数正态分布,即ln(X)服从正态分布,则X服从对数正态分布。
其概率密度函数为:f(x|μ,σ2) = 1 / (xσ * √(2π)) * exp[-(ln(x)-μ)2 / (2σ2)]其中μ为正态分布的均值,σ为标准差。
对数正态分布在金融、生物学、环境学等领域有着广泛的应用。
贝叶斯更新方法是一种根据已知信息来更新概率模型参数的方法。
其基本思想是先假设一个先验分布,然后利用观测到的数据来调整这个分布,得到后验分布。
在贝叶斯统计学中,后验概率是利用先验概率和样本数据得到的后验概率。
通过贝叶斯更新方法,可以更加准确地估计参数的后验分布。
二、对数正态分布的贝叶斯更新方法对数正态分布的贝叶斯更新方法是指利用贝叶斯更新方法来估计对数正态分布的参数。
假设我们对一个对数正态分布的参数进行估计,我们首先需要假设一个先验分布。
通常可以选择对数正态分布的参数的共轭先验分布作为先验分布,这样可以方便计算后验分布。
对于对数正态分布的参数μ和σ,可以选择正态分布和Inverse Gamma分布作为共轭先验分布。
假设μ的先验分布为正态分布N(μ0,σ0),σ2的先验分布为Inverse Gamma 分布IG(α,β)。
则根据贝叶斯定理,可以得到μ和σ2的后验分布。
从贝叶斯理论的角度来看,对数正态分布的参数估计问题可以转化为一个后验概率的估计问题。
通过先验分布和观测数据,可以计算出后验概率分布,从而得到对参数的更加准确的估计。
三、对数正态分布的贝叶斯更新方法比较研究在实际应用中,对数正态分布的贝叶斯更新方法有多种选择。
对数正态分布贝叶斯更新方法比较研究对数正态分布是指随机变量的对数服从正态分布的分布形式。
在贝叶斯统计推断中,对数正态分布被广泛应用于建模和参数估计。
本文将对对数正态分布的贝叶斯更新方法进行比较研究,探讨不同方法的特点和适用范围,为贝叶斯统计推断提供参考。
一、对数正态分布的基本形式对数正态分布是一种连续概率分布,其概率密度函数形式为:f(x|\mu,\sigma^2) = \frac {1}{\sqrt{2\pi}\sigma x}exp\left(-\frac{(logx-\mu)^2}{2\sigma^2}\right)x是随机变量,\mu和\sigma^2分别是对数正态分布的均值和方差。
对数正态分布的参数估计和推断常常涉及贝叶斯方法,即通过先验分布和观测数据来更新对参数的估计。
下面将介绍两种常见的对数正态分布贝叶斯更新方法,并进行比较研究。
1. 共轭先验分布方法共轭先验分布是指先验分布与后验分布具有相同函数形式的先验分布。
对于对数正态分布而言,其共轭先验分布是正态分布。
即假设对数正态分布的参数\mu和\sigma^2的先验分布分别为:\mu \sim N(\mu_0, \sigma_0^2)N(\mu_0, \sigma_0^2)表示均值为\mu_0,方差为\sigma_0^2的正态分布,IG(\alpha_0, \beta_0)表示形状参数为\alpha_0,尺度参数为\beta_0的逆伽玛分布。
在获得新的观测数据后,根据贝叶斯定理,可以求得参数的后验分布。
对于对数正态分布,后验分布的形式可以通过共轭先验分布的性质得到。
具体表达式可以利用贝叶斯定理进行推导。
优点:共轭先验分布方法在数学推导上较为简单,参数的后验分布可以通过解析表达式给出。
缺点:实际问题中很难找到具有共轭先验分布的先验分布,因此不太适用于复杂的实际应用场景。
在实际问题中,往往无法找到具有共轭性质的先验分布。
此时,可以采用非共轭先验分布的方法进行贝叶斯更新。
贝叶斯判别法简介与应用场景标题:贝叶斯判别法简介与应用场景引言:贝叶斯判别法是一种基于贝叶斯定理的分类算法,被广泛应用于机器学习、数据挖掘和模式识别等领域。
本文将对贝叶斯判别法进行深入介绍,包括其原理、应用场景以及优缺点等方面的内容。
通过阐述贝叶斯判别法的相关知识,我们将能够更好地理解该算法,并在实际应用中更加高效地利用它。
正文:一、贝叶斯判别法原理贝叶斯判别法是基于贝叶斯公式进行分类问题求解的一种方法。
它假设数据服从特定的概率分布,并通过建立分类模型来进行分类。
贝叶斯判别法中的关键是计算给定类别的后验概率,以判断新样本的类别。
该方法包括朴素贝叶斯、高斯判别分析和多项式判别分析等具体方法。
二、贝叶斯判别法应用场景1. 文本分类贝叶斯判别法在文本分类中被广泛应用。
通过对已知类别的文本样本进行学习,该方法可以对新的文本进行分类。
例如,垃圾邮件过滤器就是利用贝叶斯判别法对邮件进行分类,将垃圾邮件和正常邮件进行区分。
2. 医学诊断贝叶斯判别法在医学诊断中也有广泛的应用。
通过建立患病和健康状态之间的概率模型,医生可以根据各种特征指标来进行诊断和预测。
例如,对于一种罕见疾病,医生可以使用贝叶斯判别法来评估患者的患病风险,并提供相应的治疗建议。
3. 图像识别贝叶斯判别法在图像识别领域的应用也十分重要。
通过对训练样本集进行学习,贝叶斯判别法可以对新的图像进行分类和识别。
例如,在人脸识别系统中,贝叶斯判别法可根据训练样本集中的人脸特征,对新的图像进行人脸识别。
4. 金融风控在金融风控领域,贝叶斯判别法被广泛应用于评估客户的信用风险。
通过分析历史数据和风险指标,该方法可以对可能出现的风险进行预测,帮助金融机构做出合理的风险决策。
三、贝叶斯判别法的优缺点1. 优点- 简单且易于理解:贝叶斯判别法基于贝叶斯定理,其原理相对简单,容易理解。
- 适用范围广:贝叶斯判别法不仅适用于概率独立的数据,还可以用于处理相关数据和连续数据。
两类正态分布模式的贝叶斯判别硕633 3106036072 赵杜娟一.实验目的1.理解贝叶斯判别原则,编写两类正态分布模式的贝叶斯分类程序; 2.了解正态分布模式的贝叶斯分类判别函数; 3.通过实验,统计贝叶斯判别的正确率。
二.实验原理(1)贝叶斯判别原则对于两类模式集的分类,就是要确定x 是属于1ω类还是2ω类,这要看x 来自1ω类的概率大还是来自2ω类的概率大,根据概率的判别规则,可以得到: 如果)|()|(21x P x P ωω> 则 1ω∈x如果)|()|(21x P x P ωω< 则 2ω∈x (1.1) 利用贝叶斯定理,可得 )()()|()|(x p P x p x P i i i ωωω=式中,)|(i x p ω亦称似然函数。
把该式代入(1.1)式,判别规则可表示为: )()|()()|(2211ωωωωP x p P x p > 则 1ω∈x )()|()()|(2211ωωωωP x p P x p < 则 2ω∈x 或写成: )()()|()|()(122112ωωωωP P x p x p x l >=则 1ω∈x )()()|()|()(122112ωωωωP P x p x p x l <=则 2ω∈x (1.2) 这里,12l 称为似然比,2112)()(θωω=P P 称为似然比的判决阈值。
该式称为贝叶斯判别。
(2)正态分布模式的贝叶斯分类器判别原理具有M 种模式类别的多变量正态分布的概率密度函数为:)]()(21exp[)2(1)|(1212i i T i in i m x C m x C x P ---=-πω 2,1=i (1.3)式中,x 是n 维列向量; i m 是n 维均值向量; i C 是n n ⨯协方差矩阵;i C 为矩阵i C 的行列式。
且有 {}i i m E x =; ()(){}Ti i i i m x m x E C --=;{}iE x 表示对类别属于i ω的模式作数学期望运算。
心理学基本概念系列——
贝叶斯判别
形而上是人类区别于动物的重要文明之一,
情志,即现在所说的心理学,
在人类医学有重要地位。
本文提供对心理学基本概念
“贝叶斯判别”
的解读,以供大家了解。
贝叶斯判别
判别分析的一种方法。
以平均误判损失最小为最优准则来建立判别规则,并以此对样品(被试)作出归属何个总体的判别分析。
设有k个p维总体G1,G2,…,Gk,密度函数分别为
fi(x),各总体出现的先验概率为q1,q2,…,qk,记C(j|i)为实际来自Gi的样品误判到Gj产生的损失(i,
j=1,2,…,k),约定C(i|i)=0。
又设D1,D2,…,Dk是根据判别规则产生的样本空间的一个划分,若样品x∈Di,则将x判归Gi(i=1,2,…,k)。
在这些假设下,来自Gi的样品x被误判为Gj的概率为
P(j|i)=|Djfi(x)dx,从而来自Gi的样品被误判的平均损失为L(Di)=P(j|i)C(j|i)。
于是总的平均误判损失为L(D1,D2,…,
Dk)=qiP(j|i)C(j|i)。
贝叶斯判别相当于选择样本空间的一个划分,使
L(D1,D2,…,Dk)达到极小。
记ht(x)=qjfj(x)C(t|j),t=1,2,…,k,贝叶斯判别的规则是:若x使得min{ht(x)}=hl(x),则将x判归Gl。
若误判损失都相同,则贝叶斯判别规则为:若x使得qlfl(x)>qifi(x)(对所有的i),则将x判归Gl。
对于两个正态总体,若误判损失相同,先验概率也相同,贝叶斯判别与距离判别结果一致,判别函数和判别规则也一致。
两类正态分布模式的贝叶斯判别硕633 3106036072 赵杜娟一.实验目的1.理解贝叶斯判别原则,编写两类正态分布模式的贝叶斯分类程序; 2.了解正态分布模式的贝叶斯分类判别函数; 3.通过实验,统计贝叶斯判别的正确率。
二.实验原理(1)贝叶斯判别原则对于两类模式集的分类,就是要确定x 是属于1ω类还是2ω类,这要看x 来自1ω类的概率大还是来自2ω类的概率大,根据概率的判别规则,可以得到: 如果)|()|(21x P x P ωω> 则 1ω∈x如果)|()|(21x P x P ωω< 则 2ω∈x (1.1) 利用贝叶斯定理,可得 )()()|()|(x p P x p x P i i i ωωω=式中,)|(i x p ω亦称似然函数。
把该式代入(1.1)式,判别规则可表示为: )()|()()|(2211ωωωωP x p P x p > 则 1ω∈x )()|()()|(2211ωωωωP x p P x p < 则 2ω∈x 或写成: )()()|()|()(122112ωωωωP P x p x p x l >=则 1ω∈x )()()|()|()(122112ωωωωP P x p x p x l <=则 2ω∈x (1.2) 这里,12l 称为似然比,2112)()(θωω=P P 称为似然比的判决阈值。
该式称为贝叶斯判别。
(2)正态分布模式的贝叶斯分类器判别原理具有M 种模式类别的多变量正态分布的概率密度函数为:)]()(21exp[)2(1)|(1212i i T i in i m x C m x C x P ---=-πω 2,1=i (1.3)式中,x 是n 维列向量; i m 是n 维均值向量; i C 是n n ⨯协方差矩阵;i C 为矩阵i C 的行列式。
且有 {}i i m E x =; ()(){}Ti i i i m x m x E C --=;{}iE x 表示对类别属于i ω的模式作数学期望运算。
可见,均值向量i m 由n 个分量组成,协方差矩阵i C 由于其对称性故其独立元素只有2)1(+n n 个,所以多元正态密度函数完全由2)1(++n n n 个独立元素所确定。
取自一个正态总体的样本模式的分布是聚集于一个集群之内,其中心决定于均值向量,而其分布形状决定于其协方差矩阵,分布的等密度点的轨迹为超椭圆,椭圆的主轴与协方差矩阵的本征向量的方向一致,主轴的长度与相应的协方差矩阵的本征值成正比。
类别的判别函数可表示为:)()|()(i i i P x P x d ωω= 对于正态密度函数,可对判别函数取自然对数,即:)(ln )]|(ln[)(i i i P x P x d ωω+=将(1.3)代入上式,简化后可以得到:{})()(21ln 21)(ln )(1i i T i i i i m x C m x C P x d ----=-ω这是正态分布模式的贝叶斯判别函数。
显然,上式表明)(x d i 是超二次曲面,所以对于两类正态分布模式的贝叶斯分类器,两个模式类别之间用一个二次判别界面分开,就可以求得最优的分类效果。
对于两类问题,判别界面方程为:()()120d x d x -= 即:)()|(11ωωP x P 0)()|(22=-ωωP x P判别条件为: 如果0)()(21>-x d x d , 则1ω∈x如果0)()(21≤-x d x d , 则2ω∈x应指出,贝叶斯分类规则是基于统计的概念,因此要有大量的模式样本,才能获得最优的结果。
三实验内容及结果分析1.根据实验要求,在本实验中将三组分别服从不同参数的正态分布数据两两进行分类,利用贝叶斯原理首先设定其先验概率,并从每组数据中随机抽取一定的训练样本数来进行参数估计,从而得到三组数据各自的条件概率。
2.根据条件概率,利用贝叶斯判别原则进行分类实验,得到结果。
3.实验结果分析分别对x1,x2和x3两两进行实验,每次选取不同的先验概率和不同的训练样本数,进行训练,且训练样本是随机选取的,即在每次相同的训练样本个数的情况下所抽取的样本是不一样的。
然后按照训练后的结果得到的每组的条件概率,对全部数据进行分类。
各自在选取相同训练样本个数的条件下进行50次分类,然后求出50次分类的平均正确率,可得下表:分析表格,可以得到:x1和x2之间的分类,无论先验概率是多少,在选取的样本数m=5时,分类的正确率都比较低,m=15时,正确率接近100%,样本数再大,正确率就会达到100%。
这说明x1和x2之间的分类,在训练样本数较小时,分类效果较差;在样本数选取较大时,分类效果比较理想。
x2和x3之间的分类,在训练样本数较小时,分类正确率很低,仅有70%左右,随着训练样本数的增多,正确率增大,直到选取45个训练样本时正确率大于95%,但达不到100%。
这说明x2和x3这两组数据很接近,无论先验概率选取多少,训练样本数是多少,分类效果都不太理想。
x1和x3之间的分类,无论先验概率选取多少,在训练样本数m=5时,分类正确率较小,当训练样本数达到15时,分类正确率已经达到了100%。
这说明x1和x3之间的分类相对来说比较容易达到,只要选取的训练样本数较大,分类效果都比较理想。
4.实验中的问题(1).为了得到随机抽取的训练样本,采用randsperm函数,先产生1~50内随机排序的数字,然后取其前m行(m为训练样本数),就可以得到随机的训练样本。
(2).在随机选取训练样本时,当所选训练样本数很少时(比如m=5),所选样本的协方差矩阵的行列式很可能为0,这样的话就得不到条件概率密度函数,也就无法进行分类判断了。
解决的方法是:给协方差矩阵加上一个对角线上元素值很小(0.000001)的对角阵,然后再对所得结果矩阵求行列式,然后再求概率密度函数进行分类判断。
四.实验程序部分clear all;close all;clc;load('data.mat'); %%读入实验数据P1=input('please input P1:'); %输入先验概率P2=1-P1;s1=input('s1='); %选择实验模式类s2=input('s2=');m=input('训练样本数m='); %输入训练样本数T1=zeros(m,4);T2=zeros(m,4);T3=zeros(m,4);r=zeros(1,50);p=1;while p<=50 %进行50次分类,以便进行统计分类的正确性%随机抽取m个训练样本index=randperm(50);for i=1:1:m %得到随机的训练样本T1(i,:)=k1(index(i),:);T2(i,:)=k2(index(i),:);T3(i,:)=k3(index(i),:);end%由训练样本计算均值和协方差me1=mean(T1);me2=mean(T2);me3=mean(T3);co1=cov(T1);co2=cov(T2);co3=cov(T3);%判断是对哪两类模式要进行分类if (isequal(k1,s1)==1&&isequal(k2,s2)==1)m1=me1;c1=co1;m2=me2;c2=co2;elseif (isequal(k2,s1)==1&&isequal(k1,s2)==1)m1=me2;c1=co2;m2=me1;c2=co1;elseif (isequal(k2,s1)==1&&isequal(k3,s2)==1)m1=me2;m2=me3;c1=co2;c2=co3;elseif (isequal(k3,s1)==1&&isequal(k2,s2)==1)m1=me3;m2=me2;c1=co3;c2=co2;elseif (isequal(k3,s1)==1&&isequal(k1,s2)==1)m1=me3;m2=me1;c1=co3;c2=co1;elseif (isequal(k1,s1)==1&&isequal(k3,s2)==1)m1=me1;m2=me3;c1=co1;c2=co3;end%两类的正态分布模式的贝叶斯判别if det(c1)==0||det(c2)==0 %当协方差矩阵行列式为0时给它加一个极小值,再进行分类l=size(c1);I=eye(l(1),l(1));I=I*0.000001;c1=I+c1;c2=I+c2;endn=1;t1=0;while n<=100if rem(n,2)==1 %奇数次输入s1x=s1((n+1)/2,:);d1=log(P1)-0.5*log(det(c1))-0.5*(x-m1)*(inv(c1))*(x-m1)';d2=log(P2)-0.5*log(det(c2))-0.5*(x-m2)*(inv(c2))*(x-m2)';% Pw1=1/(2*pi)^2/(det(c1))*exp(-0.5*(x-m1)*(inv(c1))*(x-m1)')*P1;% Pw2=1/(2*pi)^2/(det(c2))*exp(-0.5*(x-m2)*(inv(c2))*(x-m2)')*P2;n=n+1;% if Pw1>Pw2if d1>d2 %判断条件 d1>d2判为w1类t1=t1+1; %t1是判断正确次数,若判断正确,则加1endendif rem(n,2)==0 %偶数次输入s2x=s2(n/2,:);d1=log(P1)-0.5*log(det(c1))-0.5*(x-m1)*(inv(c1))*(x-m1)';d2=log(P2)-0.5*log(det(c2))-0.5*(x-m2)*(inv(c2))*(x-m2)';% Pw1=1/(2*pi)^2/(det(c1))*exp(-0.5*(x-m1)*(inv(c1))*(x-m1)')*P1; % Pw2=1/(2*pi)^2/(det(c2))*exp(-0.5*(x-m2)*(inv(c2))*(x-m2)')*P2; n=n+1;% if Pw1<Pw2if d1<d2 %判断条件 d1<d2判为w2类t1=t1+1;endendendr(p)=t1; %r存放每进行一个循环的判断中判断正确的次数p=p+1;endra=sum(r)/50/100 %计算50次分类后的正确率。