贝叶斯统计与经典统计异同
- 格式:doc
- 大小:259.00 KB
- 文档页数:4
贝叶斯统计学的运用与展望0引言贝叶斯统计方法是一种以贝叶斯公式为核心,以先验信息和后验信息为综合依据,以“辩证”推断为主要特征的统计方法。
与经典的统计归纳推理方法相比,它采用了一种全新的思维范式,将不确定参数看作随机变量,并以贝叶斯理论(BayesTheory)为基础,将获取数据前人们的主观信念作为先验信息与样本信息进行综合,再根据贝叶斯定理推导出参数的后验概率分布,最后以该后验分布为基础,利用模拟方法进行参数的统计推断。
1贝叶斯基本统计理论就基本统计理论而言,贝叶斯统计学与经典统计学存在着重大的差异,其中最主要的特征可以概括为以下三个方面:1.1“主观”概率在经典频率统计学中,概率通常被定义为:在同一条件下进行多次重复实验的基础上对事件出现可能性的一种测度,是一种基于数据的“客观”的概率。
然而,在贝叶斯统计学中,概率被看作是人们对于一个不确定事件真实度的相信程度或者信念,不依赖事件能否重复,是一种“主观”概率。
贝叶斯学派认为频率解释的概率只能应用于在一定时期内可以重复地、无限次地出现的事件,至少在理论上应该如此,然而事实上,一些事件的概率通过大量重复试验获得是不现实的,很多时候人们都是根据已有的知识和逻辑推理能力来对统计问题作出判断的。
1.2先验信息对于“客观“概率的经典频率统计学而言,统计推断一般只需要两方面的信息:—是模型信息,即已知(或假定)研究对象(数量特征)形成的总体服从某种概率分布,如正态分布等等。
二是数据信息,即通过试验或者调查获得的相关样本数据信息。
所有统计推断都仅依赖于这些“客观”样本数据来完成。
然而,贝叶斯统计学除了以上两种信息外,还利用另外一种信息,那就是先验信息。
基于“主观“概率的贝叶斯统计学认为在进行试验或者调查获取相关数据前,人们往往已经从理论分析、实践经验积累以及主观判断,长期积累了许多资料和信息,这些先验信息使得人们在没有数据的情况下仍然能对不确定事件给出一定的信度评价。
摘要贝叶斯方法近年来得到广泛应用,尤其在风险分析中发挥了巨大作用,与用传统方法估计风险相比,贝叶斯估计方法较大的提高了估计精度。
本文首先综合了参考的文献资料,了解了关于贝叶斯方法的基本发展过程和各个学派的不同观点,比789地学习,基较了他们的不同,对贝叶斯方法有了了解。
通过对《贝叶斯统计》[][][]本掌握了贝叶斯方法。
在文中详细的介绍了贝叶斯方法的基础理论和企业风险的有关理论,给出了贝叶斯估计方法的基本解题思路和步骤,再结合具体实例,对某纺织厂公司生产两种产品,花呢(A)和华达呢(B)具体生产的决策问题采用贝叶斯期望损益分析法,计算出两种方案的期望值,选取收益最大或损失最小的决策方案为最优决策方案,在不同的自然状态下,再计算其他的指标,例如敏感度分析,风险度。
通过比较,得出方案A 为最优方案,它的收益期望值最大,而风险度相对较小,是决策者的最优选择。
关键字:贝叶斯决策;企业风险;损益分析法;最优决策ABSTRACTBayes’method had been widely applied recent years, especially made great effect in risk analysis. Compared with the traditional method of estimate, Bayes’method had been much exactitude. In this paper, I first synthesis reference literature datum, and comprehend fundamental development process and distinct concepts of every school on Beyes’method. I have get their differences. By studying Bayesian statistics, I mastered Beyes’ method essentially .In this paper I introduce basic theory of Bayes’method and business risk. I give out the thought of essential solving steps, then combine with an instance, as a spinning mill which would produce two different manufactures, flower woolen cloth (A) and gabardine (B). I adopt Bayes’ expectation of loss method to analysis the two manufactures producing, then made a decision, figure out expectation value of the two schemes. Then select a plan which get best profit or least loss. I compute other indexes, for example, probabilities under different stations, tenderness analysis, risk degree of different plans, then compare those indexes, we make a decision. Plan A is the best one. The profit of plan A is the highest and the risk is the lowest. So plan A is the best choice t.Key Words: Bayes’ decision-making; business risk; loss analysis method; best decision目录1 绪论 (1)2 贝叶斯基本理论 (3)2.1贝叶斯公式 (3)2.2贝叶斯推断 (5)2.2.1 条件方法 (5)2.2.2 估计与区间估计 (6)2.2.3 假设检验与似然原理 (8)2.3先验分布的确定 (9)2.3.1 主观概率 (9)2.3.2 利用先验信息确定先验分布 (10)2.3.3 利用边缘分布确定先验密度 (11)2.3.4 无信息先验分布 (13)2.4 贝叶斯决策 (16)2.4.1 决策问题的三要素 (16)2.4.2 决策准则 (18)2.5本章小结 (20)3 贝叶斯在经营决策中的运用并举例论证 (21)3.1企业决策的几种方法 (21)3.2贝叶斯在企业决策的运用 (22)3.3本章小结 (24)4结论 (28)致谢 (29)参考文献 (30)附录1 外文原文 (31)附录2 中文翻译 (37)1 绪论贝叶斯统计起源于英国学者贝叶斯死后发表的一篇论文“论有关给予问题的求解”。
贝叶斯统计贝叶斯统计是一种基于贝叶斯定理的统计学方法,它广泛应用于概率论、统计学、机器学习等领域。
贝叶斯统计与经典统计有所不同,它强调的是个体概率和主观概率的结合,即在缺乏足够的信息来确定一个确定的结论时,通过引入主观概率来得出一个可能的结论。
贝叶斯统计的基本思想是将概率定义为某个事件发生的可能性,并将其作为主观概率来考虑。
主观概率是指人们对于某个事件发生的可能性大小的估计。
在贝叶斯统计中,主观概率被赋予了数学意义,并且可以用于计算和推理。
贝叶斯定理是贝叶斯统计的核心,它描述了一个事件发生的概率与先验概率和似然函数之间的关系。
先验概率是指人们在观察到任何数据之前对于某个事件发生的概率的估计。
似然函数是指基于观测数据对于参数的估计函数。
贝叶斯定理将这三个因素结合起来,为人们提供了一种将先验知识和观测数据结合起来得出结论的方法。
贝叶斯统计在实际应用中有很多优点。
首先,它能够考虑到人们对于未知信息的先验知识,从而更加准确地描述了现实世界中的不确定性。
其次,它能够结合多个来源的信息,使得结论更加准确和可靠。
最后,贝叶斯统计方法可以很容易地扩展到处理复杂的问题,例如在机器学习中的分类、聚类等问题。
然而,贝叶斯统计也存在一些挑战和限制。
首先,主观概率的估计需要人们的经验和专业知识,因此可能会存在误差和不准确的情况。
其次,在一些复杂的问题中,参数的先验分布可能难以确定,这也会影响结论的准确性。
最后,贝叶斯统计方法在处理大数据集时需要大量的计算资源,因此可能会存在效率和性能方面的问题。
总之,贝叶斯统计是一种基于主观概率和贝叶斯定理的统计学方法,它具有很多优点和实际应用价值。
虽然存在一些挑战和限制,但随着技术的不断发展和应用场景的不断扩大,贝叶斯统计将会得到越来越广泛的应用和发展。
1贝叶斯统计与经典统计的异同曹正最近初步接触了在与经典统计的争论中逐渐发展起来的贝叶斯统计。
贝叶斯派不同于频率派的地方在于他们愿意作出不是基于数据的假定,也就是说他们的观点来自何处并没有严格的限定。
我觉得Bayes 统计的思想非常有意思,根据课堂上老师的指导,我清楚了Bayes的基本观点:1.认为未知参数是一个随机变量,而非常量。
2.在得到样本以前,用一个先验分布来刻画关于未知参数的信息。
3. Bayes 的方法是用数据,也就是样本,来调整先验分布,得到一个后验分布。
4.任何统计问题都应由后验分布出发。
为了更好的理解两种统计思想,我查阅了一些参考文献,整理出以下一些结论:以往,经典统计方法占据着统计学的主导地位,但是,贝叶斯方法正在国外迅速发展并得到日益广泛的应用,可以说“二十一世纪的统计学是贝叶斯的时代”。
假设检验问题是统计学的一类重要问题,以下我们从这个角度对两大学派的假设检验思想进行一些比较,以揭示两种思想的区别与联系,并着重探讨贝叶斯方法的优势。
在经典统计中处理假设检验问题,用的是反证的思想进行推断,即:在认定一次实验中小概率事件不会出现的前提下,若观察到的事件是0 H 为真时的小概率事件,则拒绝0 H 。
具体的步骤是:1.建立原假设0 1 H ∈Θ vs 备择假设 1 2 H ∈Θ ;2.选择检验统计量T = T(x),使其在原假设0 H 为真时概率分布是已知的,这在经典方法中是最困难的一步。
3.对给定的显著水平α ,确定拒绝域,使犯第一类错误的概率不超过α 。
4.当样本观测值落入拒绝域W 时,就拒绝原假设0 H ,接受备择假设1 H ;否则就保留原假设。
2而在Bayes 统计中,处理假设检验问题是直截了当的,依据后验概率的大小进行推断。
在获得后验分布π (θ | x)后,即可计算两个假设 0 H 和1 H 的后验概率0 α 和1 α ,然后比较两者的大小,当后验概率比(或称后验机会比) 0 α / 1 α > 1时接受 0 H ;当0 α / 1 α < 1时,接受 1 H ;当0 α / 1 α ≈ 1时,不宜做判断,还需进一步抽样或者进一步搜集先验信息。
贝叶斯统计经典统计先验信息贝叶斯统计与经典统计是统计学中两个重要的分支,它们在统计推断和参数估计等方面有着不同的理论基础和方法。
在进行统计分析时,我们通常会考虑先验信息,也就是在观测数据之前已经获得的关于参数的知识或信念。
下面将分别介绍贝叶斯统计和经典统计中的先验信息。
1. 贝叶斯统计中的先验信息:贝叶斯统计的核心思想是基于贝叶斯定理,通过将先验信息与观测数据相结合来更新对参数的估计。
以下是一些贝叶斯统计中常见的先验信息:- 先验分布:根据领域知识或以往实验的结果,我们可以选择一个适当的先验分布来描述参数的不确定性。
例如,对于一个二项分布的参数p,我们可以选择一个Beta分布作为其先验分布。
- 先验均值:如果我们对参数的均值有一定的认识,可以将其设置为先验均值。
这可以是基于经验或专家知识得出的结果。
- 先验方差:如果我们对参数的方差有一定的预期,可以将其设置为先验方差。
这可以反映出我们对参数的不确定性程度。
2. 经典统计中的先验信息:经典统计是基于频率主义的理论,它主要关注样本的分布和参数的估计。
以下是一些经典统计中常见的先验信息:- 假设检验:在进行假设检验时,我们通常会根据先验信息提出一个原假设和一个备择假设。
原假设是我们想要进行推断的参数满足的条件,备择假设是原假设不成立的情况。
- 置信区间:在估计参数时,我们可以根据先验信息构造一个置信区间。
置信区间可以反映我们对参数估计的不确定性程度。
- 样本大小:在经典统计中,样本大小对于参数估计的准确性和置信区间的精度有重要影响。
我们可以根据先验信息来确定样本大小,以保证估计结果的可靠性。
3. 贝叶斯统计与经典统计的先验信息比较:贝叶斯统计和经典统计在先验信息的处理上有所不同。
贝叶斯统计中,先验信息直接融入了参数的估计过程,而经典统计中,先验信息主要用于假设检验和置信区间的构造。
贝叶斯统计更加注重主观先验信息的利用,而经典统计更加注重样本数据的分布和频率性质。
数理统计是在概率论的基础上发展起来的。
在概率论中随机变量的分布总是假设给定的,而数理统计假设总体的分布未知,假定总体的分布是某一个分布族的成员。
数理统计主要是某些现象在一定精确程度上做出判断与预测。
因为大数定理,把大量的事实经验,进行理论总结,所以才能进行假设检验。
基本思想:它以随机现象的观察试验取得资料作为出发点,以概率论为理论基础来研究随机现象.根据资料为随机现象选择数学模型,且利用数学资料来验证数学模型是否合适,在合适的基础上再研究它的特点,性质和规律性.应用价值:数理统计在自然科学、工程技术、管理科学及人文社会科学中得到越来越广泛和深刻的应用,其研究的内容也随着科学技术和政治、经济与社会的不断发展而逐步扩大,概括地说可以分为两大类:⑴试验的设计和研究,即研究如何更合理更有效地获得观察资料的方法;⑵统计推断,即研究如何利用一定的资料对所关心的问题作出尽可能精确可靠的结论,主要方法:参数估计、假设检验、回归分析、方差分析、正交分析。
我们的数理统计课程只讨论统计推断。
数理统计以概率论为基础,根据试验或观察得到的数据,来研究随机现象统计规律性的学科。
本课程的目的是让学生了解统计推断检验等方法并能够应用这些方法对研究对象的客观规律性作出种种合理的估计和判断。
掌握总体参数的点估计和区间估计。
掌握假设检验的基本方法与技巧。
理解平方差分析及回归分析的原理,并能运用其方法和技巧进行统计推断。
缺陷:统计学处理的都是带有随机误差的数据。
分析这样的数据,得出的结论就可能出错或不准确,出错的可能性的大小,不准确的程度如何,需要用概率论的概念和方法作定量的刻画。
但是如果严格遵守这一规范,好多问题我们又不能解决。
于是就转向了一些人为的、不太复杂的、用现行数学工具可以处理的模型,但是这种模型往往会缺乏现实性。
二、经典统计与贝叶斯统计的区别: 1. 贝叶斯统计:贝叶斯统计的两个基本概念是先验分布和后验分布。
贝叶斯推断方法的关键是任何推断都必须只根据后验分布,而不能再设计样本分布。
贝叶斯统计与经典统计的差别主要是哪些,谈谈你对此的理解
贝叶斯统计学派与经典统计学派在很多问题上都有分歧但是它们最根本的分歧是:第一,是否利用先验信息。
由于产品的设计、生产都有一定的继承性,这样
就存在许多相关产品的信息以及先验信息可以利用,贝叶斯统计学派认为利用这些先验信息不仅可以减少样本容量,而且在很多情况还可以提高统计精度;而经典统计学派忽略了这些信息。
第二,是否将参数e看成随机变量。
贝叶斯统计学派的最基本的观点是:任一未知量e都可以看成随机变量,可以用一个概率分布
去描述,这个分布就是先验分布。
因为任一未知量都具有不确定性,而在表述不确定性时,概率与概率分布是最好的语言;相反,经典统计学派却把未知量e
就简单看成一个未知参数,来对它进行统计推断。
贝叶斯统计学派与经典统计学派虽然有很大区别,但是它们各有优缺点,各有其适用的范围,作为研究者一定要博采众长,以获得一种更适合解决实际问题的方法。
而且,在不少情况下,二者得出的结论在形式上是相同的。
贝叶斯统计中我认为最重要的内容是利用先验信息去求后验分布,这个是与经典统计的主要差别的,利用好先验信息在很多情况下提高统计精度。
最难学的感觉是第二章贝叶斯推断,假设检验里面的各种假设方法难以理解,各种密度函数的形式记不牢,在写答案的时候经常会卡带。
这门课主要是改变了自己对待信息的一种态度,可以从一段话里面提取各种对自己有用的信息,例如对先验信息的提示等。
我觉得自己对待这门课的态度还是挺认真的,虽然不是很听得懂,但是已经很努力的去理解了的。
0引言传统的或常规的参数检验方法为频率派方法。
研究假设检验以假想数据的抽样分布为依据,这些抽样分布占据显著性概率p 值和置信区间的核心[1]。
贝叶斯统计方法则采用不同的视角:利用参数先验分布和观测数据直接开展模型比较或推导参数后验分布。
在应用语言学界,已有学者接受并使用贝叶斯方法[2—5]。
要不要顺应统计思维向贝叶斯转向?受传统统计学熏陶的语言学研究者对此可能会很困惑。
本文简要讨论贝叶斯统计方法相对于传统统计方法的优势,利用实例比较两种统计方法的差异。
1贝叶斯统计的基本思想贝叶斯统计利用现有数据更新对模型参数先验分布的不确定性,推导更加确定性的参数后验分布,体现科学研究证据的累积过程。
先验分布是在收集观测数据之前对参数(如总体平均数)分布的认识。
在无信息先验分布中,分布呈扁平状,各个可能参数值的概率(或概率密度)相同。
在有信息先验分布中,各个可能参数值的概率(或概率密度)有差异。
有信息先验分布来源于前期研究、相关理论或专业判断。
参数后验分布的计算利用贝叶斯定理。
贝叶斯定理的数学公式为:p ()θ|D =p ()D |θp (θ)/p (D ),其中θ是参数,D 是观测数据,“|”表示条件分布。
后验分布p ()θ|D 指在观测数据D 已知的条件下参数θ的分布。
p ()D |θ是似然函数,表示在先验分布参数θ已知的条件下数据D 的分布。
p (θ)是参数θ的先验分布。
p (D )是数据的边缘似然。
如果变量是离散性的,p (D )=åθp ()D |θp (θ),即边缘似然是每个观测值在各个参数θ值上的概率之和。
如果变量是连续性的,边缘似然的计算由累计变为求积分,即p (D )= d θp ()D |θp (θ)。
图1为参数先验分布、似然函数和后验分布之间的关系,其中横坐标为参数估计,纵坐标为参数估计的概率密度。
(a )(b )Distributionpriorlikelihood posterior0.000.250.500.751.000.000.250.500.751.00Estimate43210D e n s i t yFlat priorInformative prior图1先验分布、似然函数和后验分布图1(a )显示,参数先验分布为扁平分布(即无信息分布)时,后验分布与似然函数接近,先验分布对后验分布的作用很小。
1、在假设检验中,第一类错误是指:A. 原假设为真时拒绝原假设B. 原假设为假时接受原假设C. 原假设为真时接受原假设D. 原假设为假时拒绝原假设(答案)A2、下列哪个统计量不是用于衡量数据离散程度的?A. 方差B. 标准差C. 众数D. 变异系数(答案)C3、在回归分析中,如果模型中的解释变量之间存在高度相关性,这可能导致的问题是:A. 模型的解释力增强B. 参数的估计值不稳定C. 模型的预测精度提高D. 残差项减小(答案)B4、关于极大似然估计,下列说法错误的是:A. 极大似然估计是寻找使似然函数最大的参数值B. 极大似然估计通常在大样本情况下表现良好C. 极大似然估计不需要知道总体的分布形式D. 极大似然估计是一种点估计方法(答案)C5、在多元线性回归模型中,如果增加一个解释变量后,调整后的R方值减小,这说明:A. 新增解释变量与因变量高度相关B. 新增解释变量与其他解释变量高度相关C. 新增解释变量对模型的解释力没有贡献或贡献很小D. 新增解释变量提高了模型的预测精度(答案)C6、下列哪个不是贝叶斯统计与经典统计的主要区别?A. 贝叶斯统计认为参数是随机的,而经典统计认为参数是固定的B. 贝叶斯统计使用先验信息,而经典统计不使用C. 贝叶斯统计的推断基于后验分布,而经典统计基于样本分布D. 贝叶斯统计只适用于小样本情况,而经典统计适用于大样本情况(答案)D7、在主成分分析中,第一主成分的解释方差比例最大,这意味着:A. 第一主成分与所有原始变量的相关性都最高B. 第一主成分包含了原始数据最多的信息C. 第一主成分的方差最大,但不一定包含最多信息D. 第一主成分是由原始变量线性组合而成的唯一有效变量(答案)B8、在时间序列分析中,如果序列的自相关函数呈现出拖尾性,而偏自相关函数呈现出截尾性,这通常表明该序列适合建立:A. AR模型B. MA模型C. ARMA模型D. ARIMA模型(答案)A。
统计学中的贝叶斯统计方法统计学中的贝叶斯统计方法是一种基于贝叶斯定理的统计推断方法。
它是以英国数学家托马斯·贝叶斯(Thomas Bayes)命名的,贝叶斯定理是该方法的核心。
贝叶斯统计方法与经典统计学(频率派统计学)不同,它更注重主观概率和先验知识的引入。
在贝叶斯统计中,我们可以使用先验概率来描述我们对未知参数的先前信念或经验。
然后,通过考虑新的观测数据,我们可以更新我们的信念,并获得后验概率。
这一过程可以通过贝叶斯定理实现。
贝叶斯定理可以表达为:P(A|B) = (P(B|A) * P(A)) / P(B)其中,P(A|B)表示在B发生的条件下A发生的概率,P(B|A)表示在A发生的条件下B发生的概率,P(A)和P(B)分别表示A和B的边际概率。
贝叶斯统计方法的主要优势在于它能够将先验知识与观测数据相结合,提供更准确的推断结果。
具体而言,贝叶斯统计方法可以解决以下几个问题:1. 参数估计:在贝叶斯统计中,我们可以通过先验分布来描述参数的不确定性。
然后,根据观测数据,我们可以计算出参数的后验分布,从而获得对参数的准确估计。
2. 假设检验:贝叶斯统计方法可以将假设检验问题转化为计算假设的后验概率。
通过比较不同假设的后验概率,我们可以确定哪个假设更为合理。
3. 模型选择:在贝叶斯统计中,我们可以使用模型的边际似然或边际概率来比较不同模型的拟合好坏。
这有助于我们选择最合适的模型来解释观测数据。
4. 不确定性量化:贝叶斯统计方法可以提供对参数和模型不确定性的准确量化。
通过参数的后验分布或模型的边际概率,我们可以获取参数估计的置信区间或模型选择的不确定性范围。
贝叶斯统计方法的应用广泛,涵盖了许多领域。
在医学研究中,贝叶斯统计方法可以用于判断一种药物治疗的有效性。
在机器学习中,贝叶斯统计方法可以用于建立贝叶斯网络模型,进行概率推断。
在金融领域,贝叶斯统计方法可以用于风险管理和投资决策。
总之,统计学中的贝叶斯统计方法通过引入先验知识和主观概率,提供了更准确的推断结果。
1
贝叶斯统计与经典统计的异同
曹正
最近初步接触了在与经典统计的争论中逐渐发展起来的贝叶斯统计。
贝叶斯派不同于频
率派的地方在于他们愿意作出不是基于数据的假定,也就是说他们的观点来自何处并没有严
格的限定。
我觉得Bayes 统计的思想非常有意思,根据课堂上老师的指导,我清楚了Bayes
的基本观点:1.认为未知参数是一个随机变量,而非常量。
2.在得到样本以前,用一个先验分
布来刻画关于未知参数的信息。
3. Bayes 的方法是用数据,也就是样本,来调整先验分布,得
到一个后验分布。
4.任何统计问题都应由后验分布出发。
为了更好的理解两种统计思想,我查
阅了一些参考文献,整理出以下一些结论:
以往,经典统计方法占据着统计学的主导地位,但是,贝叶斯方法正在国外迅速发展并得
到日益广泛的应用,可以说“二十一世纪的统计学是贝叶斯的时代”。
假设检验问题是统计学的一类重要问题,以下我们从这个角度对两大学派的假设检验思想
进行一些比较,以揭示两种思想的区别与联系,并着重探讨贝叶斯方法的优势。
在经典统计中处理假设检验问题,用的是反证的思想进行推断,即:在认定一次实验中小
概率事件不会出现的前提下,若观察到的事件是0 H 为真时的小概率事件,则
拒绝0 H 。
具体的
步骤是:1.建立原假设0 1 H ∈Θ vs 备择假设 1 2 H ∈Θ ;2.选择检验统计量T = T(x),使其在
原假设0 H 为真时概率分布是已知的,这在经典方法中是最困难的一步。
3.对给定的显著水平α ,
确定拒绝域,使犯第一类错误的概率不超过α 。
4.当样本观测值落入拒绝域W 时,就拒绝原假
设0 H ,接受备择假设1 H ;否则就保留原假设。
2
而在Bayes 统计中,处理假设检验问题是直截了当的,依据后验概率的大小进行推断。
在
获得后验分布π (θ | x)后,即可计算两个假设 0 H 和1 H 的后验概率0 α 和1 α ,然后比较两者的
大小,当后验概率比(或称后验机会比) 0 α / 1 α > 1时接受 0 H ;当0 α / 1 α < 1时,接受 1 H ;当
0 α / 1 α ≈ 1时,不宜做判断,还需进一步抽样或者进一步搜集先验信息。
很明显,它选择了后验
概率较大的假设。
由上叙述,我们可以看到两种思想的联系与分歧:在经典统计学中,参数被看作未知常数,
不存在0 H 和1 H 的概率,给出的是0 P(x | H 真),其中x代表样本信息。
在贝叶斯方法中,参
数被看成随机变量,在参数空间内直接讨论样本x 下0 H 和1 H 的后验概率,给出的是0 P(H 真
| x)和 0 P(H 不真| x)。
下面我们通过一个例子对两种假设检验思想进行一些比较。
例:以随机变量θ 代表某人群中个体的智商真值,i
θ 为第i 个个体的智商真值,随机变量
i X 代表第i 个个体的智商测验得分,若该人群的期望智商为⎧ ,则第i 个个体在一次智商测
验中的得分可以表示为:ij i ij i ij X =θ + e = ⎧ + e + e ,其中i e 为第i 个个体的自然变异,ij e 为
第i 个个体第j 次测量的测量误差。
根据以往积累的资料,已知在某年龄的儿童的智商真值
θ ~ N(100,225),个体智商测验得分 ~ ( ,100) * X N θ 。
现在一名该年龄的儿童智商测验得
分为115,问:(1)该儿童智商真值是否高于同龄儿童的平均水平?(2)若取* θ
在(a,b)为正常,
问该儿童智商是否属于正常?
Ⅰ. 用经典统计方法解答
对第一问,建立检验问题: 0 H : 100 * θ ≤ vs 1 H : 100 * θ > ,按照经典统计学方法,
若取α = 0.05,则拒绝域为 *
1 {x : x 100 u } {x : x 116.45} α σ ≥ + = ≥ 。
尚不能认为该儿童智商
高于平均水平。
对第二问,经典方法需要进行两次分别针对a、b 的单侧检验。
过程与第一问相似,这里
不再叙述。
Ⅱ. 用贝叶斯方法解答
在贝叶斯学派中,当i
θ 未知时,将其看作随机变量,与θ 具有相同的分布,这是贝叶斯
学派与经典学派的一个重大区别。
3
根据贝叶斯理论,θ 的先验分布是N(100, 225),测验结果 * X ~ N(θ ,100),儿童智商
的后验分布为正态分布N(110.38,69.23)(具体计算过程请参见参考茆老师的《贝叶斯统计》
P14-15)。
对第一问,同样设0 H : 100 * θ ≤ 1 H : 100 * θ > ,查正态分布表可以得到:
( : 100 | 115) *
0 P H θ ≤ x = =0.106, ( : 100 | 115) *
1 P H θ > x = =0.894。
根据风险最小原则
拒绝0 H ,接受1 H 。
对第二问,设0 H :a< * θ <b 1 H : * θ <a 或* θ >b,查正态分布表可以分别得到
{ : | 115} *
0 P H a <θ < b x = 和 { : b | 115} * *
1 P H θ < a或θ > x = ,类似第一问,依据风险
最小原则做出推断。
按Bayes 的观点,多重假设检验的情形并不比两个假设的检验更困难,因为它只需要多
算几个后验概率即可;它同时利用了样本和_ 的先验信息,且由于导出了样本x 下的后验分
布,可以对风险给出正面的回答,因而较经典方法下的间接判断更直观。
事实上,两个学派的方法在一定程度上统一于贝叶斯公式。
因此,当 ( ) ( ) 0 1 P H = P H ,
即0 H 与1 H 居于平等地位时,经典学派与贝叶斯学派的结果是一致的。
对于正态分布前提下
的单侧检验: ~ ( ,1), : 0 0 X N θ H θ ≤ : 0, 1 H θ > 经典方法得到的P 值与贝叶斯方法在无信
息先验分布下的后验概率相等,此结论可以推广到正态分布前提下其他类似的单侧检验,如
上例。
而对于形如 : 0, : 0 1 H θ = H θ > o ,(或 : 0 1 H θ < )的单侧检验,情况则不同,与下述的
双侧检验有类似结果。
即对形如 : 0, : 0 1 H θ = H θ ≠ o 的双侧检验,经典方法得到的P 值与
贝叶斯方法的后验概率大不相同。
在Berger 和Sellke 1987 年对正态分布前提下二者的比较研
究中,当经典方法得到的P 在0.01~0.1 之间时,贝叶斯方法得到0 H 为真的后验概率大于P,
因而此时拒绝0 H 所承担的实际风险大于P,而这个区间对于经典方法下结论是非常重要的。
Hwang 和Pematle 1994 年提出,对这类双侧检验,类似结果始终存在,因而P 值应该由其他
判断标准来替代。
但他们还没有找到这种标准。
值得注意的是,经典的犯第一,二类错误的
概率通常都不与相应的假设后的概率近似,这也许是经典派实际工作者愿意用P 值代替犯第
一,二类错误的原因吧。
在这里我只对一个简单的单侧假设检验的例子作了一点展开,而实际中的Bayes 检验问
题包括单侧检验,原假设为简单假设的检验和多重假设检验。
我们可以参考的文献有很多,
在James O.Berger 的《统计决策论及贝叶斯分析》中有着很全面和详细的叙述。
4
假设检验是Bayes 分析中的一个问题,Bayes 分析在运算上有不少优点,在这里要提的相
关的一点是,由它得出的未知参数的最终分布(后验分布),由此可以同时解决大量的问题,
这比经典统计学要方便容易得多。
贝叶斯方法在先验信息的利用、风险的回答、损失的考虑以及多重假设问题的处理等方
面较经典方法具有明显的优势。
贝叶斯学派的理论已经成为决策论的一个基本工具,在社会
学、经济学等领域发挥着重要作用,正逐步受到重视更多领域的重视。
参考文献:
_ James O.Berger 著.贾乃光译《统计决策论及贝叶斯分析》中国统计出版社,1998 版
_ 吴喜之著中国人民大学《现代贝叶斯统计学》中国统计出版社 2000 版
_ 茆诗松编著《贝叶斯统计》1999 版
一句话评论:对例中的第二问,经典方法应考虑双边假设检验方法,可参见茆诗松等著
《高等数理统计》。
__。