贝叶斯统计_先验分布的确定
- 格式:docx
- 大小:226.70 KB
- 文档页数:14
贝叶斯统计的基本原理与方法贝叶斯统计作为一种概率统计方法,具有广泛的应用领域和强大的实用性。
本文将介绍贝叶斯统计的基本原理与方法,并探讨其在实际问题中的应用。
一、贝叶斯定理贝叶斯定理是贝叶斯统计的基础,它建立了先验概率和后验概率之间的关系。
贝叶斯定理的数学表达为:P(A|B) = ( P(B|A) * P(A) ) / P(B)其中,P(A|B) 表示在给定B发生的条件下A发生的概率,P(B|A)表示在给定A发生的条件下B发生的概率,P(A) 表示A发生的先验概率,P(B) 表示B发生的先验概率。
二、贝叶斯统计方法贝叶斯统计方法基于贝叶斯定理,通过不断更新概率分布来推断模型参数或进行预测。
主要包括先验分布、似然函数和后验分布的计算。
1. 先验分布先验分布是对参数的先验信息的概率分布。
在没有实际观测数据前,我们通常根据经验或领域知识来选择合适的先验分布。
常见的先验分布有均匀分布、正态分布等。
2. 似然函数似然函数是在给定参数值的情况下,观测数据出现的可能性。
通过似然函数,我们可以评估参数值对观测数据的拟合程度。
似然函数越大,说明参数值越能解释观测数据。
3. 后验分布后验分布是在考虑观测数据后,对参数进行更新和修正得到的概率分布。
根据贝叶斯定理,后验分布与先验分布和似然函数的乘积成正比。
通过后验分布,我们可以得到参数的点估计或区间估计。
三、贝叶斯统计的应用贝叶斯统计具有广泛的应用领域,我们将以两个具体问题来说明其应用。
1. 医学诊断贝叶斯统计在医学诊断中有重要的应用。
在医学检测中,我们通常需要根据患者的检测结果判断其是否患有某种疾病。
贝叶斯统计可以帮助我们评估患病的概率,并根据患者的症状和其他相关因素进行精确的诊断。
2. 文本分类贝叶斯统计在文本分类中被广泛应用。
通过对已知类别的文本进行训练,我们可以得到每个单词在不同类别下的概率分布,即先验概率。
然后,根据贝叶斯定理,我们可以根据给定的文本内容来计算其在不同类别下的后验概率,从而实现文本的自动分类。
先验分布的确定幻灯⽚67 其步骤如下:(1)写出样本的对数似然函数∑∏====ni i n i i x p x p x l 11)|(ln )|(ln )|(θθθ(2)求样本的信息阵pj i l E I j i x ,...,2,1,,)(2|=-=θθθθ2|2(),x l I Eθθθ=-??在单参数(p=1)场合,(3)Θ的⽆信息先验密度为2/1)]([det )(θθπI =1/2()[()]I πθθ=在单参数(p=1)场合,幻灯⽚682122(,,...,)(,),(,).n X x x x N Jeffreys µσθµσ==设是来⾃正态分布的⼀组样本试求的先验2211:()ln[]2i x ni l x e µσθπσ--==∑写出样本的对数似然函数22111(,)ln(2)ln ().22ni i l n x µσπσµσ=?=---∑22222222()()0:(,);20()()ll nE E Fisher I n ll E E µµσσµσσµσσ-- ??==?? -- ??其信息阵42),(det -=?σσµn I22,(,):(,)2.Jeffreys n µσπµσσσ--=∝所以的先验为幻灯⽚6911:,(),:()1;,()2,();,(,);nI I n σµπµσµσσπσσµσπµσσ---=∝=∝∝注当已知当已知当和独⽴幻灯⽚70 例3.22关于成功概率的⽆信息先验分布⾄今已有4种π1(θ)=1 ——正常π2(θ)=θ-1(1-θ)-1 ——不正常π3(θ)=θ-1/2(1-θ)-1/2 ——正则化后可成为正常π4(θ)=θθ(1-θ)(1-θ) ——正则化后可成为正常注意:1.⼀般说来,⽆信息先验不是唯⼀的.但它们对贝叶斯统计推断的影响都很⼩,很少对结果产⽣较⼤的影响2.任何⽆信息先验都可以采⽤。
贝叶斯统计标准方法
贝叶斯统计标准方法是一种使用贝叶斯定理进行概率推断和统计推断的方法。
贝叶斯定理是一种在已经观察到某些证据的情况下更新概率分布的方法。
在贝叶斯统计标准方法中,首先需要确定一个先验概率分布,表示在观察到任何数据之前对待估计量的不确定性的初始估计。
然后,根据观察到的数据,计算出一个后验概率分布,用于更新预估量的不确定性。
贝叶斯统计标准方法的步骤如下:
1. 定义问题并确定待推断的参数或模型。
2. 确定先验概率分布,通常基于以往的经验或领域知识。
3. 收集观测数据。
4. 使用贝叶斯定理计算出后验概率分布,将先验概率分布与观察到的数据相结合。
5. 基于后验概率分布,可以计算出感兴趣的统计量的点估计、置信区间或区间估计。
6. 验证结果,可以使用模型检验方法检验推断的质量。
贝叶斯统计标准方法的优点在于可以利用先验信息来约束推断结果,并逐步更新先验概率分布,使其适应观察到的数据。
这使得贝叶斯方法在处理小样本或缺少数据的情况下特别有用。
贝叶斯先验分布
贝叶斯先验分布是贝叶斯统计学中的一个重要概念。
在统计学上,它是为了解决在前提条件下的概率问题而设计的。
贝叶斯先验分布可以理解为一种已知某些信息下,我们对未知参数的概率分布的一种假设。
在贝叶斯统计学中,可以使用既存的数据来推导出这种分布,并将其作为新数据的基础分布。
在具体应用上,贝叶斯先验分布在很多实际问题中都有着广泛应用。
例如,在医学领域中,可以假定一种药物对某种疾病的有效率符合γ 分布,那么如果有一个新的患者需要进行治疗,我们就可以将先验分布作为考虑新患者的基础,通过观察该患者的治疗效果来不断更新这个先验分布,得到更加准确的预测结果。
另一个例子是在金融或投资领域中,我们可以将某公司的财务数据作为先验分布,用来预测该公司未来的盈利情况。
如果在观察到一些新的信息之后,我们更新了某些参数,并且重新计算了该公司的盈利预测,那么这就是基于贝叶斯先验分布的预测。
由此可见,贝叶斯先验分布在很多实际问题中都具有很强的实用性。
但是,构造一个准确的先验分布需要根据具体的问题场景进行分析和处理。
例如,对于一些不确定性较大的领域,我们可能需要选择一种较为宽松的先验分布,以保证我们的预测结果更加准确。
总之,无论在什么场景下,贝叶斯先验分布都是一个非常重要的概念。
它为我们提供了一种简单而有效的工具,能够通过少量的数据,在高度不确定性的情况下,对未来结果进行比较准确的预测。
因此,对于任何从事数据分析和预测的人来说,掌握并理解贝叶斯先验分布的概念是非常重要的。
第一章 先验分布与后验分布1.1 解:令120.1,0.2θθ==设A 为从产品中随机取出8个,有2个不合格,则22618()0.10.90.1488P A C θ== 22628()0.20.80.2936P A C θ== 从而有5418.03.02936.07.01488.07.01488.0)()|()()|()()|()|(2211111=⨯+⨯⨯=+=θπθθπθθπθθπA P A P A P A 4582.0)|(1)|(4582.03.02936.07.01488.03.02936.0)()|()()|()()|()|(122211222=-==⨯+⨯⨯=+=A A or A P A P A P A θπθπθπθθπθθπθθπ1.2 解:令121, 1.5λλ==设X 为一卷磁带上的缺陷数,则()XP λ∴3(3)3!e P X λλλ-==R 语言求:)4(/)exp(*)3(^gamma λλ-1122(3)(3)()(3)()0.0998P X P X P X λπλλπλ∴===+== 从而有111222(3)()(3)0.2457(3)(3)()(3)0.7543(3)P X X P X P X X P X λπλπλλπλπλ==========1.3 解:设A 为从产品中随机取出8个,有3个不合格,则3358()(1)P A C θθθ=-(1) 由题意知 ()1,01πθθ=<< 从而有.10,)1(504)|(504)6,4(/1)6,4(1)6,4()1()1()1()1()1()1()1()()|()()|()|(535311614531535315338533810<<-==-=--=--=--==⎰⎰⎰⎰--θθθθπθθθθθθθθθθθθθθθθθθθπθθπθθπA beta B R B d d d C C d A P A P A :语言求(2).10,)1(840)|(840)7,4(/1)7,4(1)7,4()1()1()1()1()1()1(2)1()1(2)1()()|()()|()|(636311714631636315338533810<<-==-=--=--=----==⎰⎰⎰⎰--θθθθπθθθθθθθθθθθθθθθθθθθθθπθθπθθπA beta B R B d d d C C d A P A P A :语言求1.5 解:(1)由已知可得.5.125.11,110110/1)()|()()|()|(,2010,101)(5.125.111)|(2112211)|(12,2121,1)|(5.125.11201011111111<<===<<=<<=+<<-==+<<-=⎰⎰θθθθπθθπθθπθθπθθθθθθθθd d x p x p x x p x p x x x p ,,即,时,当(2)由已知可得.6.115.11,1010110/1)()|,,()()|,,(),,|(,2010,101)(6.115.111)|,,(,219.1121,214.1121,211.1121,217.1121215.11212112211)|,,(9.11,4.11,1.11,7.11,5.11,0.12,6,2,1,2121,1)|,,(6.115.112010621621621621621654321621<<===<<=<<=+<<-+<<-+<<-+<<-+<<-+<<-========+<<-=⎰⎰θθθθπθθπθθπθθπθθθθθθθθθθθθθθθθθθd d x x x p x x x p x x x x x x p x x x p x x x x x x i x x x x p i ,即,,时,当【原答案:由已知可得 ()1,0.50.5P x x θθθ=-<<+1(),102010πθθ=<< 11.611.51()0.0110m x d θ==⎰从而有()()()10,11.511.6()P x x m x θπθπθθ==<< 】1.6 证明:设随机变量()XP λ,λ的先验分布为(,)Ga αβ,其中,αβ为已知,则即得证!),(~),,|()()|,,(),,|(,0,)()(,!!)|,,(121)(121211112111βαλπλλπλλπλλαβλπλλλλβαβλααλλ++∑∑∝•∝>Γ=∑===+--+--=-=-==∏∏n x Ga x x x ex x x p x x x e x e x ex x x p ni i n n x n n ni in x ni i x n ni i ni ii【原答案: (),0!x e P x x λλλλ-=>1(),0()e ααβλβπλλλα--=>Γ 因此 11(1)()()()x x x P x e e e λαβλαβλπλλπλλλλ---+--+∝•∝= 所以 (,1)x Ga x λαβ++】 1.7 解:(1)由题意可知.1},max{,1)/(1)/(122)()|,,()()|,,(),,|(,10,1)(,,2,1,10,22)|,,(121},max{221},max{2121121212112122111<<∝===<<==<<<==⎰⎰∏∏⎰∏∏====θθθθθθθθθθπθθπθθπθθπθθθθn nx x nn x x nni in nni inn n n ni i nni inin x x d d x xd x x x p x x x p x x x n i x xx x x x p n n【原答案:由题意可知 ()1,01πθθ=<< 因此122()12(1)xxm x d x θθ=•=-⎰因此 2()()1(),1()1P x x x x m x x θπθπθθθ==<<- (实质是新解当n=1的情形)】(2) 由题意可知.1},max{,1)/(1)/(13232)()|,,()()|,,(),,|(,10,3)(,,2,1,10,22)|,,(12-21},max{2-22-21},max{2212211212121212122111<<∝=⨯⨯==<<==<<<==⎰⎰∏∏⎰∏∏====θθθθθθθθθθθθπθθπθθπθθθπθθθθn n x x n n x x nni in nni inn n n ni i nni inin x x d d x xd x x x p x x x p x x x n i x xx x x x p n n【原答案:由题意可知 1222()36xm x d x θθθ=•=⎰因此 ()()()1,01()P x x m x θπθπθθ==<<】 1.8 解:设A 为100个产品中3个不合格,则3397100()(1)P A C θθθ=-由题意可知 199(202)()(1),01(200)πθθθθΓ=-≤≤Γ 因此 3971994296()()()(1)(1)(1)A P A πθθπθθθθθθθ∝•∝--=- 由上可知)297,5(~)|(Be A θπ1.9 解:设X 为某集团中人的高度,则2(,5)XN θ∴25(,)10XNθ ∴2(176.53)5()p x θθ--=由题意可知 2(172.72)5.08()θπθ--=又由于X 是θ的充分统计量,从而有()()()()x x p x πθπθθπθ=∝•222(176.53)(172.72)(174.64)55.0821.26eeeθθθ------⨯∝•∝因此 (174.64,1.26)x N θ1.10 证明:设22(,),,N u u θσσ其中为已知又由于X 是θ的充分统计量,从而有()()()()x x p x πθπθθπθ=∝•222222251()()11252()11225252u x x u eeeσθθθσσσ+----+⨯--⨯+⨯∝∝因此 222251(,)112525u x xN σθσσ+++又由于21112525σ≤+ 所以 θ的后验标准差一定小于151.11 解:设X 为某人每天早上在车站等候公共汽车的时间,则(0,)X U θ.8,861)/(1192192)()|,,()()|,,(),,|(,4,192)(.81)|,,(8,8,5.3,2,1,0,1)|,,(768778774321321321433213213321>⨯====≥=>=====<<=⎰⎰⎰∞∞∞θθθθθθθθθθπθθπθθπθθθπθθθθθθd d d x x x p x x x p x x x x x x p x x x i x x x x p i ,时,当【原答案:设X 为某人每天早上在车站等候公共汽车的时间,则(0,)XU θ∴1(),0p x x θθθ=<<当8θ>时,31()p x θθ=43819211()8192m x d θθθ+∞==⎰从而有 7()()3()()128p x x m x θπθπθθ==, 计算错误】1.12 证明:由题意可知 1(),0,1,2,...,i np x x i n θθθ=<<=从而有 ()()()()x x p x πθπθθπθ∝•00111n n n ααααθθθθθ++++∝•∝ 因此 θ的后验分布仍是Pareto 分布。
贝叶斯统计经典统计先验信息贝叶斯统计与经典统计是统计学中两个重要的分支,它们在统计推断和参数估计等方面有着不同的理论基础和方法。
在进行统计分析时,我们通常会考虑先验信息,也就是在观测数据之前已经获得的关于参数的知识或信念。
下面将分别介绍贝叶斯统计和经典统计中的先验信息。
1. 贝叶斯统计中的先验信息:贝叶斯统计的核心思想是基于贝叶斯定理,通过将先验信息与观测数据相结合来更新对参数的估计。
以下是一些贝叶斯统计中常见的先验信息:- 先验分布:根据领域知识或以往实验的结果,我们可以选择一个适当的先验分布来描述参数的不确定性。
例如,对于一个二项分布的参数p,我们可以选择一个Beta分布作为其先验分布。
- 先验均值:如果我们对参数的均值有一定的认识,可以将其设置为先验均值。
这可以是基于经验或专家知识得出的结果。
- 先验方差:如果我们对参数的方差有一定的预期,可以将其设置为先验方差。
这可以反映出我们对参数的不确定性程度。
2. 经典统计中的先验信息:经典统计是基于频率主义的理论,它主要关注样本的分布和参数的估计。
以下是一些经典统计中常见的先验信息:- 假设检验:在进行假设检验时,我们通常会根据先验信息提出一个原假设和一个备择假设。
原假设是我们想要进行推断的参数满足的条件,备择假设是原假设不成立的情况。
- 置信区间:在估计参数时,我们可以根据先验信息构造一个置信区间。
置信区间可以反映我们对参数估计的不确定性程度。
- 样本大小:在经典统计中,样本大小对于参数估计的准确性和置信区间的精度有重要影响。
我们可以根据先验信息来确定样本大小,以保证估计结果的可靠性。
3. 贝叶斯统计与经典统计的先验信息比较:贝叶斯统计和经典统计在先验信息的处理上有所不同。
贝叶斯统计中,先验信息直接融入了参数的估计过程,而经典统计中,先验信息主要用于假设检验和置信区间的构造。
贝叶斯统计更加注重主观先验信息的利用,而经典统计更加注重样本数据的分布和频率性质。
先验分布的选择的概念
先验分布是在贝叶斯统计学中一个重要的概念,它是指在进行统计推断时,对于待估计的未知量可能取值的预先概率分布。
先验分布的选择对贝叶斯分析的结果有着至关重要的影响。
在这篇文章中,我们将分步骤阐述先验分布的选择的概念。
1. 了解先验分布的作用
在进行贝叶斯分析时,我们需要先指定一个先验分布。
这个先验分布代表了我们关于待估计量的先有知识和信念。
这个先验分布将与我们要估计的数据相结合,得到一个后验分布。
后验分布是我们对待估计量真实值的置信度分布。
2. 考虑问题的具体情况
在选择先验分布时,需要考虑到具体的问题情况。
例如,如果我们要对某一物种的平均寿命进行估计,那么我们可以选择一个均值为50岁,方差为10岁的正态分布作为先验分布。
这是因为我们已经知道的关于这个物种寿命的知识是它大概位于50岁附近,并且可能有一些波动。
3. 考虑领域知识
在选择先验分布时,领域知识会起到重要的作用。
以医学统计学为例,医生可能会选择一个先验分布,该分布已经考虑了疾病的流行率和其他相关因素。
这样的选定的先验分布可能会使得后验分布更加准确。
4. 更替先验分布
如果我们发现后验分布并不准确,那么我们应该考虑更换先验分布。
我们可以通过先验分布的灵活性,比如选择一个更加宽松的先验分布,来看看是否有更好的结果。
在贝叶斯统计学中,选择先验分布是一个非常关键的环节,它直接影响到后验分布和加权决策的准确性和可靠性。
因此,在选择先验
分布时,我们需要考虑问题所涉及的具体情况和领域知识,以及不断更替先验分布,以寻找效果更好的方法。
贝叶斯先验分布
贝叶斯先验分布(Bayesian prior distribution),是指在进行贝叶斯统计推断过程中,对未知参数的概率分布的初始假设。
简单来说,先验分布是对参数先前知识的一个概率分布的表达。
贝叶斯统计中的先验分布是与后验分布相关的。
先验分布是在获得新的证据之前确定参数的概率分布,而后验分布是仅仅基于新的信息来确定参数的概率分布。
先验分布是在进行实验之前就已经被确定的,因此可以被视为提供了默认的基准信息。
在实验产生数据的时候,新发现的数据会与先验分布结合,从而构建出一个更新的后验分布。
贝叶斯先验分布中常常包含一些超参数,这些超参数可以用来控制先验分布的形态和精度。
根据数据的实际情况和模型的选择,可以利用贝叶斯最优化方法来确定超参数的值,从而使得先验分布更好地反映出真实情况。
实际中,先验分布的选择和超参数的确定往往需要专家经验和领域知识的支持,因此具有一定的主观性。
贝叶斯统计知识整理第⼀章先验分布和后验分布统计学有两个主要学派,频率学派与贝叶斯学派。
频率学派的观点:统计推断是根据样本信息对总体分布或总体的特征数进⾏推断,这⾥⽤到两种信息:总体信息和样本信息;贝叶斯学派的观点:除了上述两种信息以外,统计推断还应该使⽤第三种信息:先验信息。
贝叶斯统计就是利⽤先验信息、总体信息和样本信息进⾏相应的统计推断。
1.1三种信息(1)总体信息:总体分布或所属分布族提供给我们的信息(2)样本信息:从总体抽取的样本提供给我们的信息(3)先验信息:在抽样之前有关统计推断的⼀些信息1.2贝叶斯公式⼀、贝叶斯公式的三种形式(⼀)贝叶斯公式的事件形式假定k A A ,,1 是互不相容的事件,它们之和i ki A 1= 包含事件B ,即i ki A B 1=? 则有:∑==ki ii i i i A B P A P A B P A P B A P 1)()()()()((⼆)贝叶斯公式的密度函数形式1.贝叶斯学派的⼀些具体思想假设I :随机变量X 有⼀个密度函数);(θx p ,其中θ是⼀个参数,不同的θ对应不同的密度函数,故从贝叶斯观点看,);(θx p 是在给定θ后的⼀个条件密度函数,因此记为)(θx p 更恰当⼀些。
在贝叶斯统计中记为)(θx p 它表⽰在随机变量θ给定某个值时,总体指标X 的条件分布。
这个条件密度能提供我们的有关的θ信息就是总体信息。
假设II :当给定θ后,从总体)(θx p 中随机抽取⼀个样本X1,…,Xn ,该样本中含有θ的有关信息。
这种信息就是样本信息。
假设III :从贝叶斯观点来看,未知参数θ是⼀个随机变量。
⽽描述这个随机变量的分布可从先验信息中归纳出来,这个分布称为先验分布,其密度函数⽤)(θπ表⽰。
2.先验分布定义1:将总体中的未知参数Θ∈θ看成⼀取值于Θ的随机变量,它有⼀概率分布,记为)(θπ,称为参数θ的先验分布。
3.后验分布(1)从贝叶斯观点看,样本x =(1x ,…,n x )的产⽣要分两步进⾏。
第三章 先验分布的确定3.1 主观概率3.1.1概率的公理化定义定义:设Ω为一个样本空间,F 为Ω的某些子集组成的一个事件域,如果对任一事件A ∈F ,定义在F 上一个实值函数P(A)满足下列条件:(1)非负性公理:对于每一事件A ,有P(A)≥0;(2)正则性(规范性)公理:P(Ω)=1;(3)可列可加性(完全可加性)公理:设A 1,A 2,…是互不相容的事件,即对于i≠j ,A i A j =∅,i ,j=1,2,…,则有11()()i i i i P A P A ∞∞===∑ 则称P (A )为事件A 的概率(Probability) ,称三元素(Ω, F ,P)为概率空间(Probability space) 。
概率是定义在σ-域F 上的一个非负的、正则的、可列可加的集函数。
3.1.2 主观概率在经典统计中,概率是用三条公理定义的:1)非负性;2)正则性;3)可加性。
概率确定方法有两种:1)古典方法;2)频率方法。
实际中大量使用的是频率方法,所以经典统计的研究对象是能大量重复的随机现象,不是这类随机现象就不能用频率的方法去确定其有关事件的概率。
这无疑把统计学的应用和研究领域缩小了[1]。
在经典统计中有一种习惯,对所得到的概率都要给出频率解释,这在有些场所是难于做出的。
譬如,天气预报:“明天下雨的概率是0.8”。
贝叶斯统计中要使用先验信息,而先验信息主要是指经验和历史资料。
因此如何用人们的经验和过去的历史资料确定概率和先验分布是贝叶斯学派要研究的问题。
贝叶斯学派是完全同意概率的公理化定义,但认为概率也是可以用经验确定。
这是与人们的实践活动一致。
这就可以使不能重复或不能大量重复的随机现象也可谈及概率。
同时也使人们积累的丰富经验得以概括和应用。
贝叶斯学派认为:一个事件的概率是人们根据经验对该事件发生可能性所给出个人信念。
这样给出的概率称为主观概率。
下面举几个例子:一个企业家认为“一项新产品在未来市场上畅销”的概率是0.8,这里的0.8是根据他自己多年的经验和当时一些市场信息综合而成的个人信念。
一位医生要对一位病人动手术,他认为成功的概率是0.9,这是他根据手术的难易程度和自己的手术经验而对“手术成功”所给出的把握程度。
这样的例子在我们生活,生产和经济活动中也是常遇见的,他们观察的主观概率绝不是随意的,而是要求当事人对所考察的事件有较透彻的了解和丰富的经验,甚至是这一行的专家。
并能对周围信息和历史信息进行仔细分析,在这个基础上确定的主观概率就能符合实际。
所以应把主观概率与主观臆造,瞎说一通区别开来。
主观概率要受到实践检验,要符合概率的三条公理,通过实践检验和公理验证,人们会接受其精华,去其糟粕。
主观概率是频率方法和经典方法的一种补充,有了主观概率至少使人们在频率观点不适用时也能谈论概率,使用概率和统计方法。
主观概率并不反对用频率方法确定概率,但也要看到它的局限性。
3.1.3 确定主观概率的方法(1)用对立事件的比较来确定主观概率(最简单的方法)例3.1一位出版商要知道一本新书畅销(事件A)的概率是多少,以决定是否与作者签订出版合同。
他在了解这本新书的内容后,根据他自己多年出书的经验认为该书畅销的可能性较大,畅销(A)比畅销(A)的可能性要高出一倍,即P A P A+=,可以推得()2/3P A P A=,由此根据概率的性质()()1()2()P A=,即该书畅销的主观概率是2/3。
(2)用专家意见来确定主观概率(最常用)例3.2有一项带有风险的生意,预估计成功(记为A)的概率。
为此,决策者去拜访这方面的专家(如董事长,银行家等),向专家提这样的问题:“如果这种生意做100次,你认为会成功几次?”专家回答:“成功次数不会太多,大约60次。
”这时()0.6P A=是专家的主观概率,可此专家还不是决策者,过分谨慎的。
决策者决定修改专家的估计,把0.6提高到0.7。
这样()0.7P A=就是决策者自己的主观概率。
(3)通过向多位专家咨询后,经修正和综合获得主观概率例3.3某公司再决定是否成产某种新产品时,想估计该产品在未来市场上的畅销(记为A)的概率是多少,为此公司经理召集设计,财会,推销和质量管理等方面人员的座谈会,仔细分析影响新产品销路的各种因素,大家认为此新产品质量好,只要定价合理,畅销可能性很大,而影响销路的主要因素是市场竞争。
据了解,还有一家工厂(简称外厂)亦有生产此新产品的想法,该厂技术和设备都比本厂强。
经理在听取大家的分析后,向在座各位提出二个问题:(i)假如外厂不生产此新产品本公司的新产品畅销的可能性(即概率)有多大?(ii)假如外厂要生产此新产品本公司的新产品畅销的可能性(即概率)有多大?在座人员根据自己的经验各写了二个数,经理在计算了二个平均值后,略加修改,提出自己的看法:在上述二种情况下,本公司新产品畅销概率各为0.9和0.4,这是经理在征求多位专家意见后所获得的主观概率。
另根据本公司情报部门报告,外厂正忙于另一项产品开发,很可能无暇顾及生产此新产品。
经理据此认为外厂将生产此新产品的概率为0.3,不产此新产品的概率为0.7。
利用上面4个主观概率,由全概率公式可得本公司生产此新产品获畅销的概率为0.90.70.40.30.75⨯+⨯=注意:1)向专家提的问题要设计好,既要使专家易懂又要使专家回答不是模棱两可。
2)要对专家本人比较了解,以便做出修正,形成决策者自己的主观概率。
3)通过向多位专家咨询后,经修正和综合获得主观概率,关键在于把问题设计好,便于往后综合,即在提出问题时,就要想到如何综合。
(4)假如有历史数据,要尽量利用,帮助形成初步概念,然后再做一些对比修正,再形成个人信念。
例3.4某公司经营儿童玩具好多年,今设计了一种新式玩具将投入市场。
现要估计此新式玩具在未来市场上的销售情况。
经理查阅了本公司过去37种新式玩具的销售记录,得知销售状态是畅销(1A )、一般(2A )、滞销(3A )分别有29,6,2种,于是算得过去新式玩具的三种销售状态的概率分别为29620.7840.1620.054373737=== , , 考虑到这次设计玩具不仅外形新颖,而且在开发儿童智力上有显著突破,经理认为此种新玩具会更畅销一些,滞销可能性更小,故对上述概率作了修改,提出自己的主观概率如下:123()0.85()0.14()0.01P A P A P A === , ,根据经验和历史资料等先验信息给出主观概率没有什么固定的模式。
但是其所确定的主观概率都必须满足概率的三条公理,即1)非负性2)正则性3)可列可加性当发现所确定的主观概率与这三条公理及其推出的性质有不和谐时,必须立即修正,直到和谐为止。
3.2 利用先验信息确定先验分布在贝叶斯统计方法中关键的一步是确定先验分布。
1、当总体参数θ是离散时,即参数空间Θ只含有限个或可数个点时,可对Θ中每个点确定一个主观概率。
2、当总体参数θ是连续时,即参数空间Θ是实数轴或其上某个区间时,要构造一个先验密度π(θ ),就有些困难了。
当θ的先验信息足够多时,下面有三个方法可供使用。
3.2.1 直方图法这个方法与一般的直方图法类似,步骤如下:1)把参数空间分成一些小区间。
2)在每个小区间上决定主观概率或依据历史数据确定其频率。
3)绘制直方图。
4)在直方图上做一条光滑的曲线,此曲线就是π(θ )。
下面举个例子:例3.6表3.1 每周平均销售量统计表某药材店记录了吉林人参的每周销售量,现要寻找每周平均销售量θ的概率分布。
现用直方图法来确定它。
1)把参数空间分成一些小区间。
统计过去二年102个营业周的销售记录,每周平均销售量最高不超过35两。
若以5两作为小区间长度,共分为7个小区间。
2)在每个小区间上决定主观概率或依据历史数据确定其频率。
这里用的是后者,其频率见表3.1。
3)绘制频率直方图。
这里绘制的频率直方图见图3.1,其中纵坐标为频率/5。
4)在直方图上作一条光滑的曲线,此曲线就是π(θ )。
在作光滑曲线时,尽量在每个小区间上使用得曲线下的面积与直方图的面积相等。
这条曲线已在图3.1上画出,利用此曲线可求出一个单位区间上的概率,如(2021)1(20.5)0.03P θπ<≤=⨯=注意:这样得到的先验密度常常仅限于有限区间上,有时使用也不方便。
下面这种方法更为适用。
3.2.2 选定先验密度函数形式再估计其超参数要点:(1)根据先验信息选定θ的先验密度函数的形式π(θ ) 。
(2)当先验分布中含有未知参数(即超参数)时,给出超参数的估计值. 注意:方法常用,但也极易误用。
因为先验密度π(θ)的函数形式选用不当将会导致以后推导失误。
例3.7在例3.6中对周平均销售量θ,选用正态分布2(,)N μτ作为先验分布,于是确定先验分布问题就能转化为估计超参数μ和2τ的问题。
这可从每周平均销售量统计表上作出估计。
若对的每个小区间用其中点作代表,则可算得μ和2τ的估计如下:2222.50.051...32.50.00113.4575(2.513.4574)0.051...(32.513.4574)0.00136.0830μτ=⨯++⨯==-⨯++-⨯=这表明,该商店每周平均销售量θ的先验分布为(13.4574,36.0830)N 。
用此先验分布可以算得:2113.45752013.4575(2021)()(=6.0069 6.0069P θ--<<=Φ-Φ)0.0350 这个例子说明,若能从先验信息整理加工中获得前几阶先验矩,然后用其估计先验分布的各个参数。
在给定先验分布形式时决定其中先验参数的另一个方法是从先验信息中获得几个分位数的统计值,然后选择先验分布中的参数使其尽可能地接近这些分位数。
下面再看一个例子。
例3.8设参数的取值θ范围是∞∞(-,),它的先验分布具有正态分布形式。
若从先验信息可以得知:(1)先验中位数为0;(2)上下四分位数为-1和1,即先验的0.25分位数和0.75分位数为-1和1。
要确定先验分布2(,)N μτ中的超参数μ和2τ。
对正态分布,均值和中位数相等故0μ=另外由0.75分位数为1,可列出方程(1)0.75(/1/)0.75P P θθσσ<=<=或。
查标准正态分布表可知1/0.675 1.481σσ==或这样就可得先验分布为2(0,1.481)N 。
另外,若设θ的先验分布为柯西分布(,)C αβ,其密度函数为22(|,),()βπθαβθπβθα=-∞<<∞+- 它的期望与方差都不存在,但其各分位数都有。
由于柯西密度函数是关于α的对称函数,故其中位数是α。
由已知条件知0α=。
另外由-1是1/4分位数可得方程-122-1/4d βθπβθ∞=+⎰由此可算得1β=。