当前位置:文档之家› 贝叶斯计量经济学 从先验到结论

贝叶斯计量经济学 从先验到结论

贝叶斯计量经济学  从先验到结论
贝叶斯计量经济学  从先验到结论

2006年中国经济学年会投稿论文

研究领域:数理经济学与计量经济学

贝叶斯计量经济学:从先验到结论

Bayesian Econometrics: From Priors to Conclusions

刘乐平1

摘要

本文从现代贝叶斯分析与现代贝叶斯推断的角度探讨贝叶斯计量经济学建模的基本原理。并通过一具体应用实例介绍贝叶斯计量经济学常用计算软件WinBUGS的主要操作步骤,希望有更多的国内计量经济学研究学者关注现代计量经济学研究的一个重要方向——贝叶斯计量经济学(Bayesian Econometrics)。

关键词:贝叶斯计量经济学, MCMC, WinBUGS

Abstract:

Basic principles of Bayesian econometrics with Modern Bayesian statistics analysis and Bayesian statistics inference are reviewed. MCMC computation method and Bayesian software WinBUGS are introduced from application example.

KEYWORDS: Bayesian Econometrics, MCMC, WinBUGS

JEL Classifications: C11, C15,

1天津财经大学统计学院教授, 中国人民大学应用统计科学研究中心兼职教授。电子邮箱:liulp66@https://www.doczj.com/doc/eb12432869.html, 。天津市2005年度社科研究规划项目[TJ05-TJ001];中国人民大学应用统计科学研究中心重大项目(05JJD910152)资助。

一、引言

美国经济学联合会将2002年度“杰出资深会员奖(Distinguished Fellow Award)”授予了芝加哥大学Arnold Zellner教授,以表彰他在“贝叶斯方法”方面对计量经济学所做出的杰出贡献。1985年,Arnold Zellner教授在Econometrica 上发表论文——Bayesian Econometrics,1996年,Arnold Zellner的著作《An Introduction to Bayesian Inference in Econometrics 》正式出版。近年来,Gary Koop(2003)的专著《Bayesian Econometrics》、Tony Lancaster (2004) 的专著《An Introduction to Modern Bayesian Econometrics》和John Geweke(2005) 的专著《Contemporary Bayesian Econometrics and Statistics》等,加上大量出现在各种计量经济学重要期刊上的文献无疑已逐渐形成了现代计量经济学研究的一个重要方向——贝叶斯计量经济学(Bayesian Econometrics)。

本文从现代贝叶斯分析与现代贝叶斯推断的角度探讨贝叶斯计量经济学建模的基本原理。并通过一具体应用实例介绍贝叶斯计量经济学常用计算软件WinBUGS的主要操作步骤,希望有更多的国内计量经济学研究人员关注贝叶斯计量经济学。

二、现代贝叶斯分析与现代贝叶斯推断

虽然对贝叶斯分析方法至今还有许多争议,但贝叶斯统计学在统计学中的地位可用中国科学院院士陈希孺教授的一段话来形容:“托马斯.贝叶斯……这个生性孤僻,哲学气味重于数学气味的学术怪杰,以其一篇遗作的思想重大地影响了两个世纪以后的统计学术界,顶住了统计学的半边天”。

在大约三百年以前,人们开始严肃地思考这样一个问题:“当存在不确定性时,如何进行推理?”。James Bernoulli (1713)恐怕是第一个构造该问题的人(Samuel Kotz, 吴喜之,2000)。他意识到在可应用于机会游戏的演绎逻辑和每日生活中的归纳逻辑之间的区别。对于他来说,这个未回答的问题在于前者的机理如何能帮助处理后者的推断问题。

托马斯·贝叶斯(Reverend Thomas Bayes, 1702-1761)是对归纳推理给出精确定量表达方式的第一人,他死后发表的论文,可以作为科学史上最著名的论文之一(Press,1989:P181)。他在18世纪上半叶欧洲学术界不算一个起眼的人物。在他生前,没有片纸只字的科学论著发表。那时,传播和交流科学成果的一种方式,是学者间的私人通信。这些信件许多都得以保存下来并发表传世,例如Huygens—Pascal通信。但在贝叶斯生前,除在1755年有一篇致John . Condon的信(其中讨论了Simpsons有关误差理论的工作)见John的文件外,历史上也没有记载下他与当时的人有何重要的学术交往。不过,他一定曾以某种方式表现出其学术造诣而为当时的学术界所承认,因为他在1742年就当选为英国皇家学会会员,这个称号相当于今天的英国科学院院士。这篇“遗作”的题目就是《An essay towards solving a problem in the doctrine of chances》(机遇理论中一个问题的解),发表在1764年伦敦皇家学会的《Philosophical Transactions》上。

1812年,Laplace 在他的概率论教科书第一版中首次将贝叶斯思想以贝叶斯定理的现代形式展示给世人。Laplace 本人不仅重新发现了贝叶斯定理,阐述得远比贝叶斯更为清晰,

而且还用它来解决天体力学、医学统计、甚至法学问题(Samuel Kotz和吴喜之,2000)。

目前被承认的现代贝叶斯统计工具的使用,应归功于Jeffreys(1939),Wald(1950),Savage(1954),Raiffa和Schlaifer(1961),Lindly(1972)和DeFinetti(1974-1975)。在20世纪90年代,由于高维计算上的困难,贝叶斯方法的应用受到了很大的限制。但随着计算机技术的发展和贝叶斯方法的改进,特别是MCMC方法的发展和WinBUGS软件的应用,原来复杂异常的数值计算问题如今变得非常简单,参数后验分布的模拟也趋于方便,所以现代贝叶斯理论和应用得到了迅速的发展(刘乐平、袁卫,2004)。

1. 现代贝叶斯分析

经典统计学,它的基本观点是把数据(样本)看成是来自具有一定概率分布的总体,所研究的对象是这个总体而不局限于数据本身。据现有资料看、这方面最早的工作是Gauss,C.F.(1777—1855)和Legendre,A.M.(1752—1833)的误差分析、正态分布和最小二乘法。从十九世纪末期到二十世纪上半叶,经Pearson,K.(1857一l 936)、Fisher,R.A.(1890一1962)和Neyman,J(1894一1981)等人杰出的工作创立了经典统计学。如今统计学教材几乎全是叙述经典统计学的理论与方法。二十世纪下半叶,经典统计学在工业、农业、医学、经济、管理、军事等领域里获得广泛的应用。这些领域中又不断提出新的统计问题,这又促进了经典统计学的发展,随着经典统计学的持续发展与广泛应用,它本身的缺陷也逐渐暴露出来了,从而带动了贝叶斯理论、方法和应用的发展。

贝叶斯方法是基于贝叶斯定理而发展起来用于系统地阐述和解决统计问题的方法。(Samuel Kotz和吴喜之,2000)。一个完全的贝叶斯分析(Full Bayesian Analysis)包括数据分析、概率模型的构造、先验信息和效应函数的假设和最后的决策(Lindley,2000)。贝叶斯推断的基本方法是将关于未知参数的先验信息与样本信息综合,再根据贝叶斯定理,得出后验信息,然后根据后验信息去推断未知参数(茆诗松,王静龙等,1998)。

Duke 大学统计与决策科学学院的统计学教授James O. Berger,可以称得上是当代国际贝叶斯统计学领域研究的顶尖人物,他是ISBA的发起者,他在贝叶斯理论和应用方面的做了许多重要的研究工作。他的著作《统计决策论及贝叶斯分析》(第二版)(Statistical Decision Theory and Bayesian Analysis)已作为“现代外国统计学优秀著作译丛“之一被介绍到中国。他于2000年在《美国统计学会期刊》(JASA:Journal of the American Statistical Association)上发表文章,对贝叶斯统计学今日的状况和明日的发展进行了综述(Berger,2000):(1)客观贝叶斯分析(Objective Bayesian Analysis)

将贝叶斯分析当作主观的理论是一种普遍的观点。但这无论在历史上,还是在实际中都不是非常准确的。第一个贝叶斯学家,贝叶斯学派的创始人Thomas Bayes 和Laplace 进行贝叶斯分析时,对未知参数使用常数先验分布。事实上,在统计学的发展中,这种被称为“逆概率”(inverse probability)方法在十九世纪非常具有代表性,而且对十九世纪初的统计学产生了巨大的影响。对使用常数先验分布的批评,使得Jeffreys对贝叶斯理论进行了具有非常重大意义的改进。Berger认为,大多数贝叶斯应用研究学者都受过Laplace-Jefferys贝叶斯分析客观学派的影响,当然在具体应用上也可能会对其进行现代意义下的改进。

许多贝叶斯学者的目的是想给自己贴上“客观贝叶斯”的标签,这种将经典统计分析方法当作真正客观的观点是不正确的。对此,Berger认为,虽然在哲学层面上同意上述这个观点,但他觉得这里还包含很多实践和社会学中的原因,使得人们不得已地使用这个标签。他强调,统计学家们应该克服那种用一些吸引人的名字来对自己所做的工作大加赞赏的不良习

惯。

客观贝叶斯学派的主要内容是使用无信息先验分布(noninformative or default prior distribution)。其中大多数又是使用Jeffreys 先验分布。最大熵先验分布(maximum entropy priors)是另一种常用的无信息先验分布(虽然它们也常常使用一些待分析总体的已知信息,如均值或方差等)。在最近的统计文献中经常强调的是参照先验分布(reference priors)(Bernardo 1979, Yang and Berger 1997),这种先验分布无论从贝叶斯的观点,还是从非贝叶斯的观点进行评判,都取得了显著的成功。Kass and Wasserman(1996) 对选择无信息先验分布的方法进行了综述。

客观贝叶斯学派研究的另一个完全不同的领域是研究对“默认”模型(default model)的选择和假设检验。这个领域有着许多成功的进展(Berger 1999)。而且,当对一些问题优先选择默认模型时,还有许多值得进一步探讨的问题。

经常使用非正常先验分布(improper prior distribution)也是客观贝叶斯学派面临的主要问题。这不能满足贝叶斯分析所要求的一致性(coherency)。同样,一个选择不适当的非正常先验分布可能会导致一个非正常的后验分布。这就要求贝叶斯分析过程中特别要对此类问题加以重视,以避免上述问题的产生。同样,客观贝叶斯学派也经常从非贝叶斯的角度进行分析,而且得出的结果也非常有效。

(2)主观贝叶斯分析(Subjective Bayesian Analysis)

虽然在传统贝叶斯学者的眼里看起来比较“新潮”,但是,主观贝叶斯分析已被当今许多贝叶斯分析研究人员普遍地接受,他们认为这是贝叶斯统计学的“灵魂”(soul)。不可否认,这在哲学意义上非常具有说服力。一些统计学家可能会提出异议并加以反对,他们认为当需要主观信息(模型和主观先验分布)的加入时,就必须对这些主观信息完全并且精确的加以确定。这种“完全精确的确定”的不足之处是这种方法在应用上的局限性。主观贝叶斯分析方法的重要进展可参见The Statistician,47,1998。

有很多问题,使用主观贝叶斯先验分布信息是非常必要的,而且也容易被其他人所接受。对这些问题使用主观贝叶斯分析可以获得令人惊奇的结论。即使当研究某些问题时,如使用完全的主观分析不可行,那么同时使用部分的主观先验信息和部分的客观先验信息对问题进行分析,这种明智的选择经常可以取得很好的结果(Andrews, Berger, and Smith 1993)。

(3)稳健贝叶斯分析(Robust Bayesian Analysis)

稳健贝叶斯分析研究者认为不可能对模型和先验分布进行完全的主观设定,即使在最简单的情况下,完全主观设定也必须包含一个无穷数。稳健贝叶斯的思想是构建模型与先验分布的集合,所有分析在这个集合框架内进行,当对未知参数进行多次推导(elicitation)之后,这个集合仍然可以反映此未知参数的基本性质。

关于稳健贝叶斯分析基础的争论是引人注目的(Kadane 1984;Walley 1991),关于稳健贝叶斯分析最新进展的文献可参见Berger,(1985,1994,1996)。通常的稳健贝叶斯分析的实际运用需要相应的软件。

(4)频率贝叶斯分析(Frequentist Bayesian Analysis)

统计学存在许多不断争议的学科基础——这种情况还会持续多久,现在很难想像。假设必须建立一个统一的统计学科基础,它应该是什么呢?今天,越来越多的统计学家不得不面对将贝叶斯思想和频率思想相互混合成为一个统一体的统计学科基础的事实。

Berger从三个方面谈了他个人的观点。第一,统计学的语言(Language of Statistics)应

该是贝叶斯的语言。统计学是对不确定性进行测度的科学。50多年的实践表明(当然不是令人信服的严格论证):在讨论不确定性时统一的语言就是贝叶斯语言。另外,贝叶斯语言在很多种情况下不会产生歧义,比经典统计语言要更容易理解。贝叶斯语言既可对主观的统计学,又可以对客观的统计学进行分析。第二,从方法论角度来看,对参数问题的求解,贝叶斯分析具有明显的方法论上的优势。当然,频率的概念也是非常有用的,特别是在确定一个好的客观贝叶斯过程方面。第三,从频率学派的观点看来,基础统一也应该是必然的。我们早就已经认识到贝叶斯方法是“最优”的非条件频率方法(Berger 1985),现在从条件频率方法的角度,也产生了许多表明以上结论是正确的依据。

(5)拟(准)贝叶斯分析(Quasi- Bayesian Analysis)

有一种目前不断在文献中出现的贝叶斯分析类型,它既不属于“纯”贝叶斯分析,也不同于非贝叶斯分析。在这种类型中,各种各样的先验分布的选取具有许多特别的形式,包括选择不完全确定的先验分布(vague proper priors);选择先验分布对似然函数的范围进行“扩展”(span);对参数不断进行调整,从而选择合适的先验分布使得结论“看起来非常完美”。Berger称之为拟(准)贝叶斯分析,因为虽然它包含了贝叶斯的思想,但它并没有完全遵守主观贝叶斯或客观贝叶斯在论证过程中的规范要求。

拟(准)贝叶斯方法,伴随着MCMC方法的发展,已经被证明是一种非常有效的方法,这种方法可以在使用过程中,不断产生新的数据和知识。虽然拟(准)贝叶斯方法还存在许多不足,但拟(准)贝叶斯方法非常容易创造出一些全新的分析过程,这种分析过程可以非常灵活的对数据进行分析,这种分析过程应该加以鼓励。对这种分析方法的评判,不必要按照贝叶斯内在的标准去衡量,而应使用其它外在的标准去判别(例如,敏感性,模拟精度等)。

2. 现代贝叶斯推断

贝叶斯推断的基本方法是将关于未知参数的先验信息与样本信息综合,再根据贝叶斯定理,得出后验信息,然后根据后验信息去推断未知参数。(茆诗松,王静龙等,1998)一个完全的贝叶斯分析(full Bayesian analysis)包括数据分析、概率模型的构造、先验信息和效应函数的假设和最后的决策。(Lindley,2000)

袁卫(1990)从认识论的角度阐述了贝叶斯辨证推断的思想。他认为,贝叶斯公式中包含了丰富的辨证思想:

(1)贝叶斯公式既考虑了主观概率,又尊重了客观信息。

(2)贝叶斯公式将静态与动态结合起来,充分利用前人的知识和经验,符合认识的发展过程。

(3)人类的认识过程是一个从实践到认识,再从认识到实践这样循环往复的过程。经典的统计理论仅仅反映了这一无限的认识链条中的一个环节,即“实践—>认识”过程;而贝叶斯推断则反映整个认识链条中互相联系的两个环节“认识—>实践—>认识”。其中第一个认识活动即先验知识,反映为先验分布;实践活动主要表现为样本观察;第二个认识活动是通过认识到实践再到认识的重新认识活动,是对第一次认识的补充、修改和提高。毫无疑问,历史和前人的知识对实践会起指导作用。

陈希孺院士(1999)从统计推断的观点对贝叶斯估计进行了论述。他从纯科学研究的性质(不考虑损失,只关心获取有关未知参数的知识),解释了贝叶斯方法:(1)先验分布总结了研究者此前(试验之前)对未知参数可能取值的有关知识或看法。

(2)在获得样本后,上述知识或看法有了调整,调整结果为后验分布。

按贝叶斯学派的观点,在获得后验分布后,统计推断的任务原则上就完成了。理由很简单:推断的目的是获取有关未知参数的知识,而后验分布反映了当前对未知参数的全部知识。至于为了特定的目的而需要对未知参数作出某种特定形式的推断,它可以由研究者根据后验分布,以他认为合适的方法去做,这些都已不是贝叶斯方法中固有的,而只是研究者个人的选择。

陈希孺院士还总结了吸引应用者的贝叶斯推断思想和方法的特点:

(1)“先验分布+样本—>后验分布”这个模式符合人们的认识过程,即不断以新发现的资料来调整原有的知识或看法。

(2)贝叶斯推断有一个固定的、不难实现的程式:方法总是落实到计算后验分布。这可能很复杂但无原则困难。在频率学派的方法中,为进行推断,往往需要知道种种统计量的抽样分布,这在理论上往往是很难的问题。

(3)用后验分布来描述对未知参数的认识,显得比频率学派通过用统计量来描述更自然些。

(4)对某些常见的问题,贝叶斯方法提供的解释比频率学派更加合理。

三、贝叶斯计量经济学

1. 什么是贝叶斯计量经济学?

Ragnar Frisch在1933年《计量经济学》(ECONOMETRICA)杂志首期创刊中指出:“经验表明,统计学、经济理论和数学对理解现代经济生活的定量关系都是必须的,但其中任何单独一种都是不够的,三者的结合才是强有力的,且正是这三者的结合构成了计量经济学”。(ECONOMETRICS is the unification of Statistics, Economic Theory and Mathematics.)从Ragnar Frisch对计量经济学的定义可以很清晰地看出,将统计学放在首位,置于经济理论和数学之前,表明统计学对于计量经济学的特别突出的重要性。我们知道,建立经济模型、估计经济模型和检验经济模型是计量经济学的主要内容,而估计和检验——统计推断的主要内容正是计量经济学方法的核心,之所以在计量经济学中,统计学比数学更有效,主要的原因是因为经济问题的不确定性,而不确定性是很难用严密的数学去描述的。

而什么是贝叶斯计量经济学?从贝叶斯计量经济学的英文定义——Bayesian Econometrics ——可以看出,贝叶斯计量经济学不仅仅是在经典计量经济学的参数估计中使用贝叶斯估计或检验中使用贝叶斯检验(否则可用Bayesian Inference in Econometrics),而是以贝叶斯统计思想和原理为基础,从一个全新的角度,将计量经济学模型中的参数作为具有先验分布的随机变量,然后根据贝叶斯定理,得出后验分布,以此为基础,再进行模型参数估计和模型检验的过程。贝叶斯计量经济学不仅在模型参数估计和模型检验中使用贝叶斯方法,更重要的是在模型的构建中也使用了贝叶斯思想。

如果从统计学角度对计量经济学进行分类,可以分为频率(或频率统计学)计量经济学和贝叶斯计量经济学。而其中的频率计量经济学包含了使用频率统计学的经典计量经济学和现代计量经济学(经典、微观、非参数、时间序列和动态计量经济学等)的绝大部分内容。

而现代贝叶斯计量经济学(Modern Bayesian Econometrics)可以理解为以MCMC方法为代表的现代贝叶斯统计学的发展促进了现代贝叶斯统计推断方法的进展,而将MCMC方法和相应的软件(如WinBUGS)应用到贝叶斯计量经济学中,对后验分布进行模拟,对模

型的参数进行估计,对模型进行检验等构成了现代贝叶斯计量经济学区别于传统计量经济学的主要方面。

2. 贝叶斯计量经济学模型的构建过程有哪些步骤?

按照李子奈(2005)关于建立计量经济学模型的步骤和要点,可将非贝叶斯计量经济学模型的构建过程用以下框图表示:

而以贝叶斯统计分析和贝叶斯统计推断为基础的贝叶斯计量经济学模型的构建过程则

变换为:

3. 贝叶斯计量经济学的先验信息是否可靠?

对于贝叶斯计量经济学的批评的主要方面——先验信息是否可靠?同贝叶斯方法受到了经典频率统计学批评类似,批评的理由也会集中在三个方面——主观性、

先验分布的误用和先验依赖数据或模型。针对这些批评,贝叶斯学派的回答如下:

几乎没有什么统计分析哪怕只是近似是“客观的”。因为只有在具有研究问题的全部覆

盖数据时,才会得到明显的“客观性”,此时,贝叶斯分析也可得出同样的结论。但大多数统计研究都不会如此幸运,以模型作为特性的选择对结论会产生严重的影响。

实际上,在许多研究问题中,模型的选择对答案所产生的影响比参数的先验选择所产生的影响要大得多。

Box(1980)说:“不把纯属假设的东西看作先验……我相信,在逻辑上不可能把模型的假设与参数的先验分布区别开来。”

Good (1973)说的更直截了当:“主观主义者直述他的判断,而客观主义者以假设来掩盖其判断,并以此享受着客观性的荣耀。”

防止误用先验分布的最好方法就是给人们在先验信息方面以适当的教育。另外,在贝

叶斯分析的最后报告中,应将先验(和数据、损失)分开来报告,以便使其他人对主观的输入做合理性的评价。两个“接近的”先验可能会产生很不相同的结果。没有办法使这个问题完全消失,但通过“稳健贝叶斯”方法和选择“稳健先验”可以减轻。(Berger, 1985)能否在计量经济学中利用主观经验,加入先验信息,我国著名科学家钱学森的一段话非常值得我们深思(成平,1990):

“处理复杂行为系统的定量学方法学,是科学理论、经验和专家判断力的结合,这是定量方法学,是半经验半理论的。提出经验性假设(猜想或判断),是建立复杂行为系统数学模型的

出发点。这些经验性假设(猜想或判断)不能用严谨的科学方法证明,但需要经验性数据对其确

实性进行检测。从经验性假设(猜想或判断)出发,通过定量方法途径获得的结论,仍然具有半

经验、半理论的属性。当人们寻求用定量的方法处理复杂行为系统时,容易注重于数学模型和逻

辑推理,而忽视数学模型微妙的经验含义或解释。要知道,这样的数学模型看起来‘理论性’很

强,其实不免牵强附会,从而脱离真实。与其如此,反不如从建模一开始就老实承认理论的不足,而求援于经验的判断,让定性的方法和定量的方法结合起来,最后定量。”

本文观点与Samuel Kotz和吴喜之(2000)观点相同,认为杰出的当代贝叶斯统计学家A. O’Hagan(1977)的观点是最合适的:“劝说某人不加思考地利用贝叶斯方法并不符合贝叶斯统计的初衷。进行贝叶斯分析要花更多的努力。如果存在只有贝叶斯计算方法才能处理的很强的先验信息或者更复杂的数据结构,这时收获很容易超过付出,由此能热情地推荐贝叶斯方法。另一方面,如果有大量的数据和相对较弱的先验信息,而且一目了然的数据结构能导致已知合适的经典方法(即近似于弱先验信息时的贝叶斯分析),则没有理由去过分极度地敲贝叶斯的鼓(过分强调贝叶斯方法)。”

四、贝叶斯计算方法及软件应用

1. 贝叶斯计算方法

20年前,人们经常听到的一句话是:“贝叶斯分析在理论上确实很完美,但遗憾的是在实际应用过程中不能计算出结果”。令人高兴的是,现在情况已大有改进。如今,再复杂的模型也可通过贝叶斯方法进行处理。这种改进已经吸引了许多新人加入贝叶斯研究的行列,而且还减少了关于贝叶斯方法可行性的“哲学”上的争论。

贝叶斯计算主要集中在后验期望(posterior expectation)的计算上,这种计算需要进行特别的从一维到上千维的积分。另一种常见的贝叶斯计算类型是计算后验分布的众数(posterior mode)。

计算后验分布期望的传统数值计算方法是数值积分、Laplace近似计算和Monte Carlo 重要抽样。数值积分在中等维数(最大为10)问题上非常有效,最新发展可见Monahan and Genz(1996)。Laplace和其它鞍点(saddlepoint)近似方法的讨论可参考R.Strawderman的简评(vignette)。至今为止,Monte Carlo重要抽样是利用传统方法计算后验分布期望最常用的方法。这种方法可以计算维数很大的问题,并且有着很高的计算精度。

目前,MCMC方法已经变成了非常流行的贝叶斯计算方法。一方面是由于它处理非常复杂问题的效率,另一方面是因为它的编程方法相对容易。最近,这方面的书籍非常多,如Chen, Shao, and Ibrahim(2000)等。需要强调的是,并不是说MCMC方法已经完全替代传统的方法,在一些特别的场合(如要求精度),传统方法还具有它的优势。

2. MCMC方法

MCMC方法——马尔可夫链蒙特卡罗(Markov Chain Monte Carlo)方法实质上就是利用Markov链进行蒙特卡洛积分。它的历史可以追溯到40多年前,几乎与蒙特卡洛方法同时出现,最初出现于统计物理学(statistical physics),后来还被应用于空间统计学(spatial statistics)和图像分析(image analysis)的研究。

在统计领域里,有关MCMC方法经典的文献是Hastings, W. K.在1970年发表在Biometrika上的一篇论文"Monte Carlo Sampling Methods Using Markov Chains and Their Applications"。90年代以来,很多应用问题都存在着研究对象比较复杂和对模型结构正确识别的困难。现在根据MCMC理论,通过使用专用统计软件进行MCMC模拟,可解决许多复杂的应用问题。

贝叶斯图建模的目的是用图形清晰地显示出参数之间的条件独立的假设,并以此为基础设计基于MCMC的计算方针。在贝叶斯图建模过程中,主要是采用DAG(Directed Acyclic Graphy)。对于这种方法,Best et al. (1996), Smith, Spiegelhalter, and Parmar (1996), and Spiegelhalter, Thomas, and Best(1996)都作了深入的研究,在国内,Samuel Kotz和吴喜之(2000)在其著作中通过实例对此方法作了介绍。

在贝叶斯统计中(有时在经典统计中),常常需要对高维概率分布函数进行积分来对总体参数进行推断或预测。而在许多情况下,这种积分是很困难的,它没有或很难写出明确的解析表达式。解决这一难题用数值积分比较困难而且不够准确,尤其当维数较大时更是如此。而MCMC方法是一种简单且行之有效的Bayes计算方法。在国内的书籍当中,关于MCMC 方法的详细内容可参见茆诗松、王静龙和濮晓龙(1998)第六章。

3. 软件介绍

关于MCMC方法最重要的软件包是BUGS(Spiegelhalter et al. 1996)和WinBUGS。BUGS 是Bayesian Inference Using Gibbs Sampling的缩写,它是一种通过贝叶斯分析利用MCMC方法解决复杂统计模型的软件。该软件1989年开始由剑桥大学的生物统计医学研究所(MRC:Biostatistics the Medical Research Council, Cambridge, United Kingdom)开发研制,现在由MRC和伦敦St. Mar y’s的皇家医学院(Imperial College School of Medicine at St Mary's, London.)共同开发。

BUGS的运行以MCMC方法为基础,它将所有未知参数都看作随机变量,然后对此种类型的概率模型进行求解。它所使用的编程语言非常容易理解,允许使用者直接对研究的概率模型作出说明。WinBUGS是在BUGS基础上开发面向对象交互式的Windows软件版本,它可以在Windows 95/98/NT/XP中使用,WinBUGS提供了图形界面,允许通过鼠标的点击直接建立研究模型。

4. 下载安装

目前,关于WinBUGS最权威、资源最丰富的是“The BUGS Project”网站:https://www.doczj.com/doc/eb12432869.html,/bugs/winbugs/contents.shtml

WinBUGS1.4 软件现在免费提供下载,WinBUGS软件非常小(压缩后只有2.86M),安装的方法非常简单,先将软件包(zipped version of the whole file structure)下载到你的机器中,解压缩,然后双击WinBUGS14.exe即可(为了使用方便,你可右键WinBUGS图标在桌面上创建快捷方式)。为了避免出现软件使用过期问题,最好按网址的要求通过电子信箱获得WinBUGS无约束适用的“key”(免费即得)。

5. 应用实例

以下通过一实际例子,来说明通过贝叶斯统计计算软件WinBUGS 来模拟后验密度的具体操作步骤。

例(引自于WinBUGS 软件帮助手册中的 Volum I ):George et al (1993) 讨论了分层模型的贝叶斯分析(Bayesian analysis of hierarchical models )。其中,第一层采用了共轭先验分布。

该例考虑了相关的10个发电站的水泵,假设发生故障的水泵个数i x 服从Poisson 分布,即

)(~i i i t Poisson x θ,10,2,1 =i .

其中,i θ 表示水泵 i 的发生故障率,i t 表示水泵运行时间的长度 (单位:千小时),数据见下表:

故障率的共轭先验分布假设为),(~βαθGamma i ,10,2,1 =i .

George et al (1993) 对超参数α和β先验假设为

)0.1(~l Exponentia α )0.1,1.0(~G a m m a β

他们给出了β的后验分布,但α的标准后验分布无法给出。因而,他们使用Gibbs sampler 模拟得到α的后验密度。

以上表达式可用贝叶斯图建模方法(Samuel Kotz 和吴喜之,2000, 现代贝叶斯统计学)表示成如下有向关系图(图1),在WinBUGS 中称作Doodle 模型。(注意:α用alpha 表示,i x 用x[i]表示,图1 Doodle 模型

启动WinBUGS14,会出现两个窗口,关闭其中一个(Licence Agreement 窗口),你会看

到如下WinBUGS 主窗口(图2):窗口简单明了,WinBUGS 主窗口和Windows 常用窗口结构类似,关闭、最小化等基本操作相同。WinBUGS 主窗口最上面一行为标题栏(heading line ),下一行是菜单栏(menu heading line )——有File, Tools, Edit, Attributes, Info, Model, Inference, Options, Doodle, Map, Window, Help ——12个菜单,最下面一行是状态栏(status line )。

下面分四个步骤解释怎样通过WinBUGS 软件解决以上问题。

步骤1:Doodle 模型的建立和检验

[1] 建立Doodle 模型(图3)

图2:WinBUGS 主窗口 图3:Doodle 模型的建立 在WinBUGS 的使用中,Doodle 模型非常特别,它以节点(nodes )、箭头(edges )和平板(plates)等图形方式出现(对应图1:包含alpha 的小椭圆形和包含t[i]的小矩形都为节点;箭头分实线箭头和双线空心箭头;右侧和下侧边线较粗的大矩形称为 “平板”),可以用图形的方式来构建模型。模型的每个节点,都含有特定的属性,如名称、类型、分布或逻辑函数的定义等(name, type, distribution, or logical function definition)。以下我们按照图1的形状,以从上到下、从左至右的顺序,利用Doodle 菜单构建Doodle 模型。

(1)打开Doodle 菜单,选择New (新建)命令,可以打开一个名为“New Doodle ”的对话框。键入200、150和20,作为编辑窗口的显示宽度、显示高度和节点的宽度。这三个选项控制编辑窗口和节点的大小,输入数值的大小应与模型相适合。点击OK ,一个无标题名(untitled1)的DoodleBUGS 编辑窗口就产生了。(注:可以按默认值打开,窗口大小可以按调节windows 窗口的一般方法调节)。

(2)在此DoodleBUGS 编辑窗口(untitled1)中的空白处单击(左键,下同)鼠标,会自动产生一个椭圆形节点(node )(注:在此窗口中,不能按习惯任意点击,因为一点就会出现一个节点。多余节点删除与一般删除不同,先用鼠标将需删除的节点点击选中,然后按住Ctrl 键不放,再按下delete 键或backspace 键删除),窗口左上方也会同时出现七个蓝色的标题,分别为name (名称), type (类型), density (密度), mean (均值),precision (精度), lower bound (下界), upper bound (上界),光标在第一个名称栏(name )内闪烁,节点可以用鼠标点中后随意拖动。在名称栏(name )内,输入“alpha ”(表示α)作为此节点的名称。然后,name 右侧的是类型栏(type ),单击(type )不放它会自动出现下拉菜单,菜单中有三个选项:随机、逻辑和常量(stochastic, logical, and constant ),第一项是默认值。由于alpha 是随机变量,故选择默认值;再往右是密度栏(density ),单击此栏会出现16种分布的下拉菜单栏(默认值是正态分布dnorm )。因为假设alpha 服从Exponential 指数分布,所以选择dexp (表示Exponential 分布)密度。接下来,在scale 框中输入数值1.0

()0.1(~l Exponentia

α)。对于下界和上界(lower bound and upper bound )栏,不用输入数值,因为不需要对此节点的数值范围加以限制。这样,就完成了对模型中参数α的节点属性定义。

在窗口中的其它位置重新再点击鼠标,生成一个新的节点,命名为beta (表示β)。这个新的节点的颜色相比会显得“高亮”(highlighted ),称之为选中状态。(注:节点只有处于选中状态时,才能对节点的属性进行修改和编辑)。参照以上方法对此节点按假设条件

()0.1,1.0(~Gamma β)进行属性设置。类型栏(type )中默认stochastic ,在密度(density )

类型中按要求选择dgamma 分布,在形状参数框(shape )中输入0.1,在尺度参数框(scale )

中输入1.0。

创建一个新的节点theta[i],name 后输入theta[i],type 中默认stochastic ,density 中按要求选择dgamma 分布。注意,对于此节点,shape 和scale 中不用输入值,因为按假设它们分别为alpha 和beta (),(~βαθGamma i )

,通过下面箭头关系的操作,程序会自动生成shape 和scale 中的值。

保持节点theta[i]处于选中状态,按住Ctrl 键不放,点击alpha 节点(内部),这时会在两个节点之间产生一个实线箭头(表示随机节点到随机节点),箭头的方向从alpha 节点指向theta[i]节点—— 即将父节点与子节点进行连接 —— 这时,在形状框(shape )中就会自动出现alpha 。同样操作,建立从beta 节点指向theta[i]节点的实线箭头,这时,在尺度框(scale )中就会自动出现beta 。[为了以后的应用,先将怎样进行箭头移动和删除的方法进行说明,想移动箭头,不要去点击箭头,通过移动节点,箭头会随着自动调整。要想删除箭头,先选中子节点(箭头所指),然后按住Ctrl 键不放,再次点击父节点(箭尾),箭头删除要注意次序,否则会加上一个新箭头]。

按照以上方式继续进行下去,创建节点t[i]。对这个节点,选择它的类型(type )为常数(constant ),这时,你会发现节点t[i]的形状会变成矩形。(注意:属性栏也随之发生变化)。

接着创建并定义一个新的节点,命名为lambda[i],选择它的类型(type )为逻辑logical ,在value 栏中,输入逻辑表达式theta[i]*t[i]。

按前述方法创建从父节点theta[i]到子节点lambda[i]的箭头,注意,这次显示的箭头与以前有区别,呈双线空心箭头,这种箭头表示随机变量到逻辑变量之间的联系,区别于两个随机变量之间联系的实线箭头。同理,也可建立从父节点t[i]到子节点lambda[i]的双线空心箭头。

最后,根据条件)(~i i i t Poisson x θ,创建节点x[i],density 中选择密度为dpois (表示poisson 分布),创建从父节点lambda[i]到它的箭头,父节点的名称lambda[i]会自动出现在mean 栏中。

(3)建立矩形“平板”(plates )如图1所示。按下Ctrl 键不放,在Doodle 窗口内的空白处点击鼠标,就可创建一个矩形“平板”。用鼠标点击“平板”右侧或下侧较粗的边线,就可选中激活它,并且可以对它进行移动。想对“平板”的大小进行调整,将鼠标点击“平板”的右下角顶点进行拖动(如同对一般窗口调整大小)。想删除“平板”,选中(点击“平板”右侧或下侧较粗的边线),按住Ctrl 键不放,再按下delete 键或backspace 键删除。此例中,将创建的“平板”的大小调整到如图1所示,包含下半部分的四个节点。

当一个“平板”被选中后(点击“平板”右侧或下侧较粗的边线),窗口的左上方会出现三个蓝色的标题:指标、起始和结束(index, from, up to )。首先在指标文本框(index )中输入指标名称,它表示一列整数序列数值,从from 中的数值到up to 中的数值,在此例中,index 中输入i ,from 中输入1,up to 中输入N 。

这样就完成了例子的全部Doodle 模型的构建(图3)。这时比较明智的选择应该是把刚才辛苦的工作保存下来,在File 菜单中,选择Save as 命令,然后在对话框中,输入便于记忆的文件名(用英文),WinBUGS 会自动在文件名之后加上后缀名.odc ,选择合适的目录保存,便于以后使用。(使用WinBUGS 经常将做过的内容保存下来,如同用word 编辑文档时需要经常点击保存一样,是以免“白做一晚上”的“首要法则”)。

图4:“Specification Tool”的对话窗口图5:Doodle模型的检验

[2] 对Doodle模型进行检验(check)

构建完Doodle模型后,下一步是对此模型进行检验,检验WinBUGS对它是否识别,检验模型在程序语法上是否正确。在Modle菜单中选择Specification命令,会出现一个标题为“Specification Tool”的对话窗口(图4)(用完后不要关闭,以下步骤还需使用)。在窗口中点击“check model”按钮,如果你建立的Doodle模型正确,在WinBUGS主窗口的左下角的状态栏(status line)上就会出现一条信息“model is syntactically correct”(图5)。否则,你必须对你的Doodle模型的每一个节点、每一个箭头和每一块平板进行检查,耐心检查它们的名称和属性,改正错误的地方。然后,重新对模型进行检验……,直到WinBUGS宣布“model is syntactically correct”。

(注:Doodle help例子中的Doodle模型,可以“复制”和“粘贴”到窗口中,如果你对以上操作多次都通不过。不妨将软件帮助中的例子(Examples VolumeI-例2)中现成的Doodle模型通过Edit(编辑)菜单中的copy 和paste to window直接复制过来,然后进行比较,找出错误。)

步骤2:数据输入、模型编译和初始值设定(图6)

图6:数据输入、模型编译和初始值设定

[1] 输入数据(data loaded)

模型检验合格后,需要对数据进行定义和输入。例中的数据可以按以下方式进行定义list(t = c (94.3, 15.7, 62.9, 126, 5.24, 31.4, 1.05, 1.05, 2.1, 10.5),

x = c( 5, 1, 5, 14, 3, 19, 1, 1, 4, 22), N = 10)

这种数据的表示格式被称为S-PLUS格式。观测值t和x被定义成数组(如有缺失数据,用NA表示)。

在File菜单中选择New命令。出现的窗口可以对文本进行编辑。将数据在英文输入状态下按以上形式分两行输入。输入完毕,检查确定无误后,选中输入内容(将光标点中以上输入内容中任意位置即可),然后在“Specification Tool”对话窗口中点击“load data”按钮。信息“data loaded”将会在状态栏显示。

[2] 对模型进行编译(compile)

继续在“Specification Tool”的对话窗口中通过“compile”按钮完成。在对模型进行编

译之前,注意在“compile”按钮右边上的文本框中的正整数应大于或等于默认值1(这个数字表示使用者希望同时模拟互相独立的链的个数)。模型的编译需要运行Gibbs samping,模型需要对数据的完整性和一致性进行检验。当模型编译成功后,信息“model compiled”会出现在状态栏中(如果你输入数据有误,需要从模型检验(check)步骤开始重做)。

[3] 对模型进行初始值设定(load inits)

在编译好的模型真正运行之前,还需要对模型进行初始值设定(load inits)。以下的语句可以执行这项任务。

list( alpha = 1, beta = 1 )

注意,这只是模拟的初始值,并不需要一定要与我们实际期望的参数值很接近。将这条命令继续输入到数据窗口中(可换行,在刚才输入的两行数据下输入),选中这个语句,按“Specification Tool”的对话窗口中的“load inits”按钮,状态栏中会出现信息“this initial value does not correspond to a stochastic node”。这时,“Specification Tool”的对话窗口中的“gen inits”按钮将被激活,按下“gen inits”按钮,状态栏上会出现信息“initial values generated, model initialized”(图6)。

步骤3:变量监控和模型迭代

[1] 对变量进行监控设置(Monitor)

打开Inference菜单,选择Samples命令。会产生一个名为“Sample Monitor Tool”的对话窗口(图7),在node框中输入alpha,然后按下“set”;输入beta,按下“set”;输入theta[1],按下“set”,再输入theta[2],……WinBUGS可以同时控制多个变量,但必须分别输入变量名和依次进行“set” 操作。进行以上操作后,WinBUGS会在运行时,对输入的控制变量的运行过程及结果进行存储。

[2] 模型迭代运行(iterations, or updates)

当以上步骤完成之后,就可以对模型进行迭代运行了。在Model菜单中选择Update命令,会出现一个“Update Tool”的对话窗口(图8),输入需要迭代(iterations/updates)的次数,按“update”按钮开始执行。迭代的速度非常的快,对此模型进行10000次迭代运算,在150 MHz Pentium laptop 的PC上需要5秒,而在a dual 200 MHz Pentium Pro的机器上只需2秒钟。

图7:“Sample Monitor Tool”的对话窗口图8:“Update Tool”的对话窗口

步骤4:模拟结果输出和收敛性判别

再次选中“Sample Monitor Tool”的对话窗口(图7),在node框中,可以按需要输入你想观测的变量(节点)的名称(步骤3中已输入的控制变量),也可以输入万能替代符“*”来表示“输入的所有需要控制的变量”,然后,点击“stats”,会同时产生所有控制的变量的统计量模拟估计结果,如图9所示;“density”按钮可以对连续变量画出光滑的核密度估计(kernel density estimate),对离散变量画出直方图(histogram);按“trace”按钮,被选择作为控制的变量的样本路径会由动态轨迹图(a dynamic trace plot)显示出来。(注:WinBUGS的图形功能非常强大,且都是彩色图形,由于篇幅的关系,许多图形只好省略,

读者可亲自操作软件体会)。

图9:模拟结果的输出

注:(1)单击“coda”按钮可以打开两个输出窗口。一个窗口,我们将其称为“ind”窗口,它包含了控制变量的名称和列数的范围(a range of row numbers)。这些列数相应的输入行出现在另一个窗口——“out”窗口中, 这个窗口包含控制变量的模拟值。这两个窗口给出了模拟数据的ASCII表示方式,这种表示方式可以复制到其它应用软件中使用,例如Excel 或S-PLUS。

另外,软件会自动产生模型的源程序:(在Doodle窗口激活的条件下,在Doodle菜单中,点击Write Code命令)

model;

{

for( i in 1 : N ) {

x[i] ~ dpois(lambda[i])

}

for( i in 1 : N ) {

lambda[i] <- theta[i] * t[i]

}

for( i in 1 : N ) {

theta[i] ~ dgamma(alpha,beta)

}

alpha ~ dexp( 1.0)

beta ~ dgamma( 0.1, 1.0)

}

(2)收敛性的判别:对于任何以MCMC为基础的完全概率模型分析,关于MCMC模拟的监测和收敛性的判断都是非常重要的一步。一个MCMC 模拟称为收敛的,是指模拟结果来自于真的Markov chain的稳定或目标分布。能从理论上证明收敛性的情形非常少,大多数情况,我们只能满足于有效收敛(effective convergence)。

(3)Log(日志)窗口会记录以上操作的信息,Log窗口可以通过选择Info菜单中的Open Log命令打开)。

参考文献:

[1] 陈希孺,《高等数理统计学》,合肥:中国科学技术大学出版社,1999.

[2] 李子奈等,《计量经济学》(第二版),北京:高等教育出版社,2005.

[3] 袁卫,《统计推断思想》,北京:中国统计出版社,1990.

[4] 茆诗松,王静龙等:《高等数理统计》,北京:高等教育出版社. 1998.

[5] 刘乐平、袁卫:《现代贝叶斯分析与现代统计推断》[J],《经济理论与经济管理》, 2004,(6):64-69.

[6] S.James Press, “Bayes statistics: Principles, Models, and Applications.” John Wiley & Sons, 1989.中译本廖文等译:《贝叶斯统计学:原理、模型及应用》北京:中国统计出版社, 1992.

[7] Samuel Kotz, 吴喜之:《现代贝叶斯统计学》,北京:中国统计出版社,2000.

[8] Berger J. O., “Statistical Decision Theory and Bayesian Analysis”.2nd ed. New York: Springer-Verlag, 1985.中译本:贾乃光译. 《统计决策论及贝叶斯分析》北京:中国统计出版社,1998.

[9] 李琳,杨招军,阿诺德.泽尔纳及其计量经济学思想,经济学动态,2003,1:89-93.

[10] 成平,1990,对贝叶斯统计的几点看法, 数理统计与应用概率, 5(4)

[11] A. Zellner(1985), “Bayesian Econometrics”Econometrica, V ol. 53, 2, 253-270.

[12] A. Zellner (1996), “An Introduction to Bayesian Inference in Econometrics”, Wiley-Interscience,

[13] A.Zellner (1996), “Past, Present and Future of Econometrics,” Journal of Statistical Planning and Inference, 49, 3-8.

[14] Berger,J.(2000), “Bayesian Analysis: A Look at Today and Thoughts of Tomorrow”. Journal of the American Statistical Association., 95:1269-1276.

[15] Lancaster, T. (2004): “An Introduction to Modern Bayesian Econometrics”, Blackwell Publishing.

[16] Lindley,D. V. (2000), “The Philosophy of Statistics.” The Statistician , 49:293-337.

[17] Koop, G (2003): “ Bayesian econometric s” , Wiley-Interscience.

[18] GEWEKE, J(2005). “Contemporary Bayesian Econometrics and Statistics (Wiley Series in Probability and Statistics)”, Wiley-Interscience .

计量经济学试题

06A卷 一、判断说明题(每小题1分,共10分) 1.在实际中,一元回归没什么用,因为因变量 的行为不可能仅由一个解释变量来解释。(×) 4.在线性回归模型中,解释变量是原因,被解 释变量是结果。(×) 7. 给定显著性水平 及自由度,若计算得到 的t 值超过t的临界值,我们将拒绝零假设。 (√) 8.为了避免陷入虚拟变量陷阱,如果一个定性 变量有 m类,则要引入m个虚拟变量。(×) 二、名词解释(每小题2分,共10分) 1.计量经济学:融合数学、统计学及经济理论,结合研究经济行为和现象的理论和实务。 2.最小二乘法:使全部观测值的残差平方和为最小的方法就是最小二乘法。 3.虚拟变量:在经济生活研究中,有一些暂时起作用的因素。如战争、天灾、人祸等,这些因素在经济中不经常发生,但又带有相同特性,经济学家把这些不经常发生的、又起暂时影响作用的称为虚拟变量。 4.滞后变量:用来作为解释变量的内生变量的前期值称为滞后内生变量,简称为滞后变量。 5.自回归模型:包含有被解释变量滞后值的模型,称为自回归模型。 三、简答题(每小题5分,共20分) 1.应用最小二乘法应满足的古典假定有哪些?(1)随机项的均值为零; (2)随机项无序列相关和等方差性; (3)解释变量是非随机的,如果是随机的则与随机项不相关; (4)解释变量之间不存在多重共线性。 2.运用计量经济学方法解决经济问题的步骤一般是什么? (1)建立模型; (2)估计参数; (3)验证理论; (4)使用模型。 3.你能分别举出三个时间序列数据、截面数据、混合数据、虚拟变量数据的实际例子吗? (1)时间序列数据如:每年的国民生产总值、 各年商品的零售总额、各年的年均人口增长 数、年出口额、年进口额等等; (2)截面数据如:西南财大2002年各位教师年收入、2002年各省总产值、2002年5月成都市 各区罪案发生率等等; (3)混合数据如:1990年~2000年各省的人均收入、消费支出、教育投入等等; (4)虚拟变量数据如:婚否,身高是否大于170厘米,受教育年数是否达到10年等等。 4.随机扰动项μ的一些特性有哪些? (1)众多因素对被解释变量Y的影响代表的综合体; (2)对Y的影响方向应该是各异的,有正有负;(3)由于是次要因素的代表,对Y的总平均影响可能为零; (4)对Y的影响是非趋势性的,是随机扰动的。 四、分析、计算题(每小题15分,共45分) 1. 根据下面Eviews回归结果回答问题。Dependent Variable: DEBT Method: Least Squares Date: 05/31/06 Time: 08:35 Sample: 1980 1995 Included observations: 16 Variable Coefficie nt Std. Erro r t-Statist ic Prob . C() INCOME() COST() R-squared Mean dependent var Adjusted R-squared () . dependent var . of regression Akaike info criterion Sum squared resid Schwarz criterion Log likelihood F-statistic()Durbin-Wats on stat Prob(F-statisti c) INCOME——个人收入,单位亿美元; COST——抵押贷款费用,单位%。 1. 完成Eviews回归结果中空白处内容。 2. 说明总体回归模型和样本回归模型的区别。

计量经济学简答题及答案

计量经济学简答题及答案 1、比较普通最小二乘法、加权最小二乘法和广义最小二乘法的异同。 答:普通最小二乘法的思想是使样本回归函数尽可能好的拟合样本数据,反映在 图上就是是样本点偏离样本回归线的距离总体上最小,即残差平方和最小 ∑=n i i e 12min 。 只有在满足了线性回归模型的古典假设时候,采用OLS 才能保证参数估计结果的可靠性。 在不满足基本假设时,如出现异方差,就不能采用OLS 。加权最小二乘法是对原 模型加权,对较小残差平方和2i e 赋予较大的权重,对较大2i e 赋予较小的权重,消除异方差,然后在采用OLS 估计其参数。 在出现序列相关时,可以采用广义最小二乘法,这是最具有普遍意义的最小二乘 法。 最小二乘法是加权最小二乘法的特例,普通最小二乘法和加权最小二乘法是广义 最小二乘法的特列。 6、虚拟变量有哪几种基本的引入方式? 它们各适用于什么情况? 答: 在模型中引入虚拟变量的主要方式有加法方式与乘法方式,前者主要适用于 定性因素对截距项产生影响的情况,后者主要适用于定性因素对斜率项产生影响的情况。除此外,还可以加法与乘法组合的方式引入虚拟变量,这时可测度定性因素对截距项与斜率项同时产生影响的情况。 7、联立方程计量经济学模型中结构式方程的结构参数为什么不能直接应用OLS 估计? 答:主要的原因有三:第一,结构方程解释变量中的内生解释变量是随机解释变 量,不能直接用OLS 来估计;第二,在估计联立方程系统中某一个随机方程参数时,需要考虑没有包含在该方程中的变量的数据信息,而单方程的OLS 估计做不到这一点;第三,联立方程计量经济学模型系统中每个随机方程之间往往存在某种相关性,表现于不同方程随机干扰项之间,如果采用单方程方法估计某一个方程,是不可能考虑这种相关性的,造成信息的损失。 2、计量经济模型有哪些应用。 答:①结构分析,即是利用模型对经济变量之间的相互关系做出研究,分析当其 他条件不变时,模型中的解释变量发生一定的变动对被解释变量的影响程度。②经济预测,即是利用建立起来的计量经济模型对被解释变量的未来值做出预测估计或推算。③政策评价,对不同的政策方案可能产生的后果进行评价对比,从中做出选择的过程。④检验和发展经济理论,计量经济模型可用来检验经济理论的正确性,并揭示经济活动所遵循的经济规律。 6、简述建立与应用计量经济模型的主要步骤。 答:一般分为5个步骤:①根据经济理论建立计量经济模型;②样本数据的收集; ③估计参数;④模型的检验;⑤计量经济模型的应用。 7、对计量经济模型的检验应从几个方面入手。 答:①经济意义检验;②统计准则检验;③计量经济学准则检验;④模型预测检 验。

计量经济学重点简答论述题

计量经济学重点(简答题) 一、什么就是计量经济学?计量经济学,又称经济计量学,它就是以一定的经济理论与 实际统计资料为依据,运用数学、统计学与计算机技术,通过建立计量经济学模型,定量分析经济变量之间的随机因果关系、。 二、计量经济学的研究的步骤就是什么? 1)理论模型的设计 A.理论或假说的陈述; B.理论的数学模型的设定; C.理论的计量经济模型的设定。 i.把模型中不重要的变量放进随机误差项中; ii.拟定待估参数的理论期望值。 2)获取数据 数据来源:网络、统计年鉴、报纸、杂志 数据类别:时间序列数据、截面数据、混合数据、虚变量数据。 数据要求:完整性、准确性、可比性、一致性 i.完整性:模型中包含的所有变量都必须得到相同容量的样本观察值。 ii.准确性:统计数据或调查数据本身就是准确的。 iii.可比性:数据口径问题。 iv.一致性:指母体与样本的一致性。 3)模型的参数估计:普通最小二乘法。 4)模型的检验:经济学检验;统计学检验;计量经济学检验;模型的预测检验。 5)模型的应用:结构分析;经济预测;政策评价;经济理论的检验与发展。 三、简述统计数据的类别? 时间序列数据、截面数据、混合数据、虚变量数据。 1)时间序列数据:按时间先后排列收集的数据。

采纳时间序列数据的注意事项: A.所选择的样本区间的经济行为一致性问题。 B.样本数据在不同样本点之间的可比性问题。 C.样本数据过于集中的问题。不能反映经济变量间的结构关系,应增大观察区间。 D.模型的随机误差项序列相关问题。 2)截面数据:又称横向数据,就是一批发生在同一时间截面上的调查数据。研究某时 点上的变化情况。 采纳截面数据的注意事项: A.样本与母体的一致性问题。 B.随机误差项的异方差问题。 3)混合数据:也称面板数据,既有时间序列数据,又有截面数据。 4)虚变量数据:又称二进制数据,只能取0与1两个值,表示的就是某个对象的质量特 征。 四、模型的检验包括哪几个方面?具体含义就是什么? 1)经济学检验:参数的符合与大致取值。 2)统计学检验:拟合优度检验;模型的显著性检验;参数的显著性检验。 3)计量经济学检验:序列相关性;异方差检验;多重共线性检验。 4)模型的预测检验:a,扩大样本容量或变换样本重新估价模型;b,利用模型对样本期以 外的某一期进行预测。

计量经济学简答题及答案43378

简答: 1、时间序列数据和横截面数据有何不同? 时间序列数据是一批按照时间先后排列的统计数据。截面数据是一批发生在同一时间截面上的调查数据。这两类数据都是反映经济规律的经济现象的数量信息,不同点:时间序列数据是含义、口径相同的同一指标按时间先后排列的统计数据列;而横截面数据是一批发生在同一时间截面上不同统计单元的相同统计指标组成的数据列。 2、建立计量经济模型赖以成功的三要素。P16(课本) 成功的要素有三:理论、方法和数据。理论:即经济理论,所研究的经济现象的行为理论,是计量经济学研究的基础;方法:主要包括模型方法和计算方法,是计量经济学研究的工具与手段,是计量经济学不同于其他经济学分支科学的主要特征;数据:反映研究对象的活动水平、相互间以及外部环境的数据,更广义讲是信息,是计量经济学研究的原料。三者缺一不可。 3、什么是相关关系、因果关系;相关关系与因果关系的区别与联系。 相关关系是指两个以上的变量的样本观测值序列之间表现出来的随机数学关系,用相关系数来衡量。 因果关系是指两个或两个以上变量在行为机制上的依赖性,作为结果的变量是由作为原因的变量所决定的,原因变量的变化引起结果变量的变化。因果关系有单向因果关系和互为因果关系之分。 具有因果关系的变量之间一定具有数学上的相关关系。而具有相关关系的变量之间并不一定具有因果关系。 4、回归分析与相关分析的区别与关系。P23-P24(课本) 相关分析与回归分析既有联系又有区别。首先,两者都是研究非确定性变量间的统计依赖关系,并能测度线性依赖程度的大小。其次,两者间又有明显的区别。相关分析仅仅是从统计数据上测度变量间的相关程度,而无需考察两者间是否有因果关系,因此,变量的地位在相关分析中饰对称的,而且都是随机变量;回归分析则更关注具有统计相关关系的变量间的因果关系分析,变量的地位是不对称的,有解释变量与被解释变量之分,而且解释变量也往往被假设为非随机变量。再次,相关分析只关注变量间的具体依赖关系,因此可以进一步通过解释变量的变化来估计或预测被解释变量的变化,达到深入分析变量间依存关系,掌握其运动规律的目的。 5、数理经济模型和计量经济模型的区别。 答:数理经济模型揭示经济活动中各个因素之间的理论关系,用确定性的数学方程加以描述。计量经济模型揭示经济活动中各个因素之间的定量关系,用随机性的数学方程加以描述。 6、从哪几方面看,计量经济学是一门经济学科?P6(课本)

第一章 先验分布与后验分布

第一章 先验分布与后验分布 1.1 解:令120.1,0.2θθ== 设A 为从产品中随机取出8个,有2个不合格,则 2 2618()0.10.90.1488P A C θ== 22628()0.20.80.2936P A C θ== 从而有 1111122()() ()0.4582()()()() P A A P A P A θπθπθθπθθπθ==+ 2221122()() ()0.5418()()()() P A A P A P A θπθπθθπθθπθ= =+ 1.2 解:令121, 1.5λλ== 设X 为一卷磁带上的缺陷数,则()X P λ ∴3(3)3! e P X λ λλ-== 1122(3)(3)()(3)()0.0998P X P X P X λπλλπλ∴===+== 从而有 111222(3)() (3)0.2457 (3)(3)() (3)0.7543 (3) P X X P X P X X P X λπλπλλπλπλ========== 1.3 解:设A 为从产品中随机取出8个,有3个不合格,则 33 58()(1)P A C θθθ=- (1) 由题意知 ()1,01πθθ=<< 从而有 351 ()() ()504(1),01()()P A A P A d θπθπθθθθθπθθ = =-<

1 (),102010πθθ= << 11.611.51()0.0110 m x d θ==? 从而有 ()()()10,11.511.6() P x x m x θπθπθθ==<< 1.6 证明:设随机变量()X P λ ,λ的先验分布为(,)Ga αβ,其中,αβ为已知,则 (),0 ! x e P x x λ λλλ-= > 1(),0 () e ααβλ βπλλλα--=>Γ 因此 11(1) ()()()x x x P x e e e λαβλαβλπλλπλλλλ---+--+∝?∝= 所以 (,1) x G a x λαβ++ 1.7 解:(1)由题意可知 ()1,01πθθ=<< 因此 1 2 2()12(1)x x m x d x θθ =?=-? 因此 2()()1(),1 ()1P x x x x m x x θπθπθθθ==<<- (2) 由题意可知 1 22 2()36x m x d x θθθ=?=? 因此 ()() ()1,01 () P x x m x θπθπθθ= =<< 1.8 解:设A 为100个产品中3个不合格,则 3 397100()(1)P A C θθθ=- 由题意可知 199(202) ()(1),01(200) πθθθθΓ= -≤≤Γ 因此 3971994296()()()(1)(1)(1)A P A πθθπθθθθθθθ∝?∝--=- 由上可知 (5,297)A Be θ

计量经济学简答题整理版

1. 请问自回归模型的估计存在什么困难?如何来解决这些苦难? 答:主要存在两个问题: (1) 出现了随机解释变量Y ,而可能与随机扰动项相关; (2) 随机扰动项可能存在自相关,库伊克模型和自适应预期模型的随机扰动项都会导致自相关,只有局部调整模型的随机扰动项无自相关。 对于第一个问题的解决可以使用工具变量法;对于第二个问题的检验可以用德宾h 检验法,目前还没有很好的解决办法,唯一能做的就是模型尽可能的设定正确。 2. 为什么要进行广义差分变换?写出其过程。 答:进行广义差分变换是为了处理自相关,写出其过程如下: 以一元模型为例:Y t = b 0 + b 1 X t +u t 假设误差项服从AR(1)过程:u t =ρu t-1 +v t -1 ≤ρ≤1 其中,v 满足OLS 假定,并且是已知的。 为了弄清楚如何使变换后模型的误差项不具有自相关性,我们将回归方程中的变量滞后一期,写为: Y t-1 = b 0 + b 1 X t-1 +u t-1 方程的两边同时乘以ρ,得到:ρY t-1 = ρb 0 + ρb 1 X t-1 +ρu t-1 现在将两方程相减,得到:(Y t -ρY t-1 ) = b 0 ( 1 -ρ) + b 1 (X t -ρX t-1 ) + v t 由于方程中的误差项v t 满足标准OLS 假定,方程就是一种变换形式,使得变换后的模型无序列相关。如果我们将方程写成:Y t * = b 0* + b 1 X t * +v t ,其中,Y t * = (Y t -ρY t-1 ) ,X t * = (X t -ρX t-1 ) ,b 0* = b 0 ( 1 -ρ)。 3. 什么是递归模型? 答:递归模型是指在该模型中,第一个方程的内生变量Y 1仅由前定变量表示,而无其它内生变量;第二个方程内生变量Y 2表示成前定变量和一个内生变量Y 1的函数;第三个方程内生变量Y 3表示成前定变量和两个内生变量Y 1与Y 2的函数;按此规律下去,最后一个方程内生变量Y m 可表示成前定变量和m -1个Y 1,Y 2、,Y 3,…、Y m-1的函数。 4. 为什么要进行同方差变换?写出其过程,并证实之。 答:进行同方差变换是为了处理异方差,写出其过程如下: 我们考虑一元总体回归函数Y i = b 0 + b 1 X i + u i 假设误差σi 2 是已知的,也就是说,每个观察值的误差是已知的。对模型作如下“变换”: Y i /σi = b 0 /σi + b 1 X i /σi + u i /σi 这里将回归等式的两边都除以“已知”的σi 。σi 是方差σi 2 的平方根。 令 v i = u i /σi 我们将v i 称作是“变换”后的误差项。v i 满足同方差吗?如果是,则变换后的回归方程就不存在异方差问题了。假设古典线性回归模型中的其他假设均能满足,则方程中各参数的OLS 估计量将是最优线性无偏估计量,我们就可以按常规的方法进行统计分析了。 证明误差项v i 同方差性并不困难。根据方程有:E (v i 2 ) = E (u i 2 /σi 2 ) = E (u i 2 ) /σi 2 =σi 2 /σi 2 = 1 显然它是一个常量。简言之,变换后的误差项v i 是同方差的。因此,变换后的模型不存在异方差问题,我们可以用常规的OLS 方法加以估计。 5. 简述逐步回归法的基本步骤。 答:先用被解释变量对每一个解释变量做简单回归,然后以对被解释变量贡献最大的解释变量所对应的回归方程为基础,再逐个引入其余的解释变量。这个过程会出现3种情形:①若新变量的引入改进了R 2 和F 检验,且其它回归系数的t 检验在统计上仍是显著的,则可考

计量经济学简答

简答题:1.选择工具变量的原则是什么:(1)工具变量必须与所替代的随机解释变量高度相关;(2)工具变量与随机误差项不相关(3)工具变量与其它解释变量不相关,避免出现多重共线性。 2.实际经济问题中的多重共线性 (1)经济变量的趋同性(2)滞后变量的引入(3)样本资料的限制 3.序列相关性产生的原因: (1)惯性;(2)模型设定误差;(3)蛛网现象;(4)数据加工。 4、随机解释变量问题及其解决方法。如果存在一个或多个随机变量作为解释变量,则称原模型出现随机解释变量问题。第一、随机解释变量与误差项相互独立;第二、随机解释变量与误差项同期无关,而异期相关;第三、随机解释变量与误差项同期相关;第四、解决方法为工具变量法。 5.随机解释变量产生的后果 1.若相互独立,则参数估计量仍然无偏一致。2 若同期相关,异期不相关,得到的参数估计有偏,但却是一致的3 若同期相关,则估计量有偏且非一致。 6.简述最小二乘估计量的性质:(1)线性性,即它是否是另一随机变量的线性函数;(2)无偏性,即它的均值或期望值是否等于总体的真实值;(3)有效性,即它是否在所有线性无偏估计量中具有最小方差。(4)渐近无偏性,即样本容量趋于无穷大时,是否它的均值序列趋于总体真值;(5)一致性,即样本容量趋于无穷大时,它是否依概率收敛于总体的真值;(6)渐近有效性,即样本容量趋于无穷大时,是否它在所有的一致估计量中具有最小的渐近方差。 7、虚拟变量的作用:(1)表现定性因素对被解释变量的影响(2)提高模型的说明能力与水平(3)季节变动分析。(4)方程差异性检验。 8、虚拟变量设置的原则:如果有定性因素共有个结果需要区别,那么至多引入m-1 个虚拟变量 9、实际经济问题中的多重共线性:(1)经济变量的趋同性(2)滞后变量的引入(3)样本资料的限制 10.引入随机误差形式为了:(1)代表未知的影响因素(2)代表残缺数据(3)代表众多细小的影响因素(4)代表数据观测误差(5)代表模型设定误差(6)变量的随机存在性 11. 12.回归分析的主要内容有:(1)根据样本观测值对经济计量模型参数进行估计,求得回归方程(2)对回归方程、参数估计值进行显著性检验(3)利用回归方程进行分析、评价及预测。 13.叙述原理:最小二乘法:当从模型总体随机抽取n组样本观测值后,最合理的参数估计量应该使得模型能最好的的拟合样本数据:最大似然法:当从模型的总体随机抽取n组样本观测值后,最合理的参数估计量应该使得从模型中抽取该n组样本观测值的概率最大。在满足一系列基本假设的情况下,模型结构参数的最大或然估计量与普通最小二乘估计量是相同的。

计量经济学重要简答题

计量经济学重点简答题 1.简述计量经济学与经济学、统计学、数理统计学学科间得关系。 答:计量经济学就是经济理论、统计学与数学得综合.经济学着重经济现象得定性研究,计量经济学着重于定量方面得研究。统计学就是关于如何收集、整理与分析数据得科学,而计量经济学则利用经济统计所提供得数据来估计经济变量之间得数量关系并加以验证。数理统计学作为一门数学学科,可以应用于经济领域,也可以应用于其她领域;计量经济学则仅限于经济领域。计量经济模型建立得过程,就是综合应用理论、统计与数学方法得过程,计量经济学就是经济理论、统计学与数学三者得统一。 2、计量经济模型有哪些应用? 答:①结构分析②经济预测③政策评价④检验与发展经济理论 3、简述建立与应用计量经济模型得主要步骤。 答:模型设定估计参数模型检验模型应用 或1)经济理论或假说得陈述2) 收集数据3)建立数理经济学模型4)建立经济计量模型5)模型系数估计与假设检验6)模型得选择7)理论假说得选择8)经济学应用 4、对计量经济模型得检验应从几个方面入手? 答:①经济意义检验②统计推断检验③计量经济学检验④模型预测检验 5、计量经济学应用得数据就是怎样进行分类得? 答:时间序列数据截面数据面板数据虚拟变量数据 6、解释变量与被解释变量,内生变量与外生变量 被解释变量就是模型要研究得对象,被称为“因变量”,就是变动得结果。 解释变量就是说明被解释变量变动得原因,被称为“自变量”,就是变动得原因. 内生变量就是其数值由模型所决定得变量,就是模型求解得结果。 外生变量就是其数值由模型以外决定得变量。 7、计量经济学得含义 计量经济学就是以经济理论与经济数据得事实为依据,运用数学、统计学得方法,通过建立数学模型来研究经济数量关系与规律得一门经济学科。 8、在计量经济模型中,为什么会存在随机误差项? 答:随机误差项就是计量经济模型中不可缺少得一部分. 产生随机误差项得原因有以下几个方面:①模型中被忽略掉得影响因素造成得误差;②模型关系认定不准确造成得误差;③变量得测量误差;④随机因素. 9.对于多元线性回归模型,为什么在进行了总体显著性F检验之后,还要对每个回归系数进行就是否为0得t检验? 答:多元线性回归模型得总体显著性F检验就是检验模型中全部解释变量对被解释变量得共同影响就是否显著。通过了此F检验,就可以说模型中得全部解释变量对被解释变量得共同影响就是显著得,但却不能就此判定模型中得每一个解释变量对被解释变量得影响都就是显著得。因此还需要就每个解释变量对被解释变量得影响就是否显著进行检验,即进行t 检验. 10、古典线性回归模型具有哪些基本假定。 答:1 随机误差项与解释变量不相关。2随机误差项得期望或均值为零。3随机误差项具有同方差,即每个随机误差项得方差为一个相等得常数。4 两个随机误差项之间不相关,即随机误差项无自相关。 11、在多元线性回归分析中,为什么用修正得决定系数衡量估计模型对样本观测值得拟合优度? 答:因为人们发现随着模型中解释变量得增多,多重决定系数得值往往会变大,从而增加了模

计量经济学简答题

1.计量经济学与经济理论、统计学、数学的联系是什么?计量经济学与经济理论、统计学、数学的联系主要体现在计量经济学对经济理论、统计学、数学的应用方面,分别如下: 1)计量经济学对经济理论的利用主要体现在以下几个方面 (1)计量经济模型的选择和确定 (2)对经济模型的修改和调整 (3)对计量经济分析结果的解读和应用 2)计量经济学对统计学的应用 (1)数据的收集、处理、 (2)参数估计 (3)参数估计值、模型和预测结果的可靠性的判断3)计量经济学对数学的应用 (1)关于函数性质、特征等方面的知识 (2)对函数进行对数变换、求导以及级数展开 (3)参数估计 (4)计量经济理论和方法的研究 2.模型的检验包括哪几个方面?具体含义是什么? 模型的检验主要包括:经济意义检验、统计检验、计量经济学检验、模型的预测检验。 ①在经济意义检验中,需要检验模型是否符合经济意义,检验求得的参数估计值的符号、大小、参数之间的关系是否与根据人们的经验和经济理论所拟订的期望值相符合; ②在统计检验中,需要检验模型参数估计值的可靠性,即检验模型的统计学性质,有拟合优度检验、变量显著检验、方程显著性检验等; ③在计量经济学检验中,需要检验模型的计量经济学性质,包括随机扰动项的序列相关检验、异方差性检验、解释变量的多重共线性检验等; ④模型的预测检验,主要检验模型参数估计量的稳定性以及对样本容量变化时的灵敏度,以确定所建立的模型是否可以用于样本观测值以外的范围。 1.为什么计量经济学模型的理论方程中必须包含随机干扰项? 计量经济学模型考察的是具有因果关系的随机变量间的具体联系方式。由于是随机变量,意味着影响被解释变量的因素是复杂的,除了解释变量的影响外,还有其他无法在模型中独立列出的各种因素的影响。这样,理论模型中就必须使用一个称为随机干扰项的变量来代表所有这些无法在模型中独立表示出来的影响因素,以保证模型在理论上的科学性。3.为什么用可决系数R2评价拟合优度,而不是用残差平方和作为评价标准? 可决系数R2=ESS/TSS=1-RSS/TSS,含义为由解释变量引起的被解释变量的变化占被解释变量总变化的比重,用来判定回归直线拟合的优劣,该值越大说明拟合的越好;而残差平方和与样本容量关系密切,当样本容量比较小时,残差平方和的值也比较小,尤其是不同样本得到的残差平方和是不能做比较的。此外,作为检验统计量的一般应是相对量而不能用绝对量,因而不能使用残差平方和判断模型的拟合优度。 4.根据最小二乘原理,所估计的模型已经使得拟合优度差达到最小,为什么还要讨论模型的拟合优度问题? 普通最小二乘法所保证的最好拟合是同一个问题内部的比较,即使用给出的样本数据满足残差的平方和最小;拟合优度检验结果所表示的优劣可以对不同的问题进行比较,即可以辨别不同的样本回归结果谁好谁坏。 1.多元线性回归模型与一元线性回归模型有哪些区别? 多元线性回归模型与一元线性回归模型的区别表现在如下几个方面:一是解释变量的个数不同;二是模型的经典假设不同,多元线性回归模型比一元线性回归模型多了个“解释变量之间不存在线性相关关系”的假定;三是多元线性回归模型的参数估计式的表达更为复杂。 2.为什么说最小二乘估计量是最优线性无偏估计量?对于多元线性回归最小二乘估计的正规方程组,能解出唯一的参数估计量的条件是什么? 在满足经典假设的条件下,参数的最小二乘估计量具有线性性、无偏性以及最小性方差,所以被称为最优线性无偏估计量(BLUE) 对于多元线性回归最小二乘估计的正规方程组,能解出唯一的参数估计量的条件是(X X )-1存在,或者说各解释变量间不完全线性相关。

贝叶斯统计-教学大纲

《贝叶斯统计》教学大纲 “Bayesian Statistics” Course Outline 课程编号:152053A 课程类型:专业选修课 总学时:48 讲课学时:48实验(上机)学时:0 学分:3 适用对象:金融学(金融经济) 先修课程:数学分析、概率论与数理统计、计量经济学 Course Code:152053A Course Type:Discipline Elective Total Hours:48 Lecture:48E xperiment(Computer):0 Credit:3 Applicable Major:Finance(Finance and Economics Experiment Class) Prerequisite:Mathematical Analysis, Probability Theory and Statistics, Econometrics 一、课程的教学目标 本课程旨在向学生介绍贝叶斯统计理论、贝叶斯统计方法及其在实证研究中的应用。贝叶斯统计理论与传统统计理论遵循着不同的基本假设,为我们处理数据信息提供新的角度和解读思路,并在处理某些复杂模型上(如,估计动态随机一般均衡模型、带时变参数的状态空间模型等)相比传统方法具有相对优势。本课程要求学生在选课前具备基本的微积分、概率统计以及计量经济学知识。以此为起点,我们将主要就贝叶斯统计理论知识、统计模型的应用以及基于计算机编程的实证能力三方面对学生进行训练。经过对本课程的学习,学生应了解贝叶斯框架的基本思想,掌握基本的贝叶斯理论方法及其主要应用,并掌握实证研究中常用的贝叶斯数值抽样方法以及相关的计算机编程技能。特别地,学生应能明

先验概率后验概率及贝叶斯公式

先验概率、后验概率及全概率公式、贝叶斯公式2011-11-15 16:04:24| 分类:数理统计|举报|字号订阅 先验概率与后验概率 事情还没有发生,要求这件事情发生的可能性的大小,是先验概率. 事情已经发生,要求这件事情发生的原因是由某个因素引起的可能性的大小,是后验概率. 一、先验概率是指根据以往经验和分析得到的概率,如全概率公式,它往往作为“由因求果”问题中的“因”出现。后验概率是指在得到“结果”的信息后重新修正的概率,如贝叶斯公式中的,是“执果寻因”问题中的“因”。先验概率与后验概率有不可分割的联系,后验概率的计算要以先验概率为基础。 二、A prior probability is a marginal probability, interpreted as a description of what is known about a variable in the absence of some evidence. The posterior probability is then the conditional probability of the variable taking the evidence into account. The posterior probability is computed from the prior and the likelihood function via Bayes' theorem. 三、先验概率与后验概率通俗释义 事情有N种发生的可能,我们不能控制结果的发生,或者影响结果的机理是我们不知道或是太复杂超过我们的运算能力。新发一个物种,到底是猫,还是小老虎呢(朱道元的经典例子)?是由于我们的无知才不能确定判断。 先验概率 ( Prior probability) 先验概率是在缺乏某个事实的情况下描述一个变量;而后验概率是在考虑了一个事实之后的条件概率。先验概率通常是经验丰富的专家的纯主观的估计。比如在法国大选中女候选罗雅尔的支持率 p,在进行民意调查之前, 可以先验概率来表达这个不确定性。

计量经济学重要简答题

计量经济学重点简答题 1.简述计量经济学与经济学、统计学、数理统计学学科间的关系。 答:计量经济学是经济理论、统计学和数学的综合。经济学着重经济现象的定性研究,计 量经济学着重于定量方面的研究。统计学是关于如何收集、整理和分析数据的科学,而计 量经济学则利用经济统计所提供的数据来估计经济变量之间的数量关系并加以验证。数理 统计学作为一门数学学科,可以应用于经济领域,也可以应用于其他领域;计量经济学则 仅限于经济领域。计量经济模型建立的过程,是综合应用理论、统计和数学方法的过程, 计量经济学是经济理论、统计学和数学三者的统一。 2、计量经济模型有哪些应用? 答:①结构分析②经济预测③政策评价④检验和发展经济理论 3、简述建立与应用计量经济模型的主要步骤。 答:模型设定估计参数模型检验模型应用 或 1)经济理论或假说的陈述 2)收集数据 3)建立数理经济学模型4)建立经济计量模型5)模型系数估计和假设检验 6)模型的选择 7)理论假说的选择 8)经济学应用 4、对计量经济模型的检验应从几个方面入手? 答:①经济意义检验②统计推断检验③计量经济学检验④模型预测检验 5、计量经济学应用的数据是怎样进行分类的? 答:时间序列数据截面数据面板数据虚拟变量数据 6、解释变量和被解释变量,内生变量和外生变量 被解释变量是模型要研究的对象,被称为“因变量”,是变动的结果。 解释变量是说明被解释变量变动的原因,被称为“自变量”,是变动的原因。 内生变量是其数值由模型所决定的变量,是模型求解的结果。 外生变量是其数值由模型以外决定的变量。 7、计量经济学的含义 计量经济学是以经济理论和经济数据的事实为依据,运用数学、统计学的方法,通过建立 数学模型来研究经济数量关系和规律的一门经济学科。 8.在计量经济模型中,为什么会存在随机误差项? 答:随机误差项是计量经济模型中不可缺少的一部分。 产生随机误差项的原因有以下几个方面:①模型中被忽略掉的影响因素造成的误差;②模 型关系认定不准确造成的误差;③变量的测量误差;④随机因素。 9.对于多元线性回归模型,为什么在进行了总体显著性F检验之后,还要对每个回归系 数进行是否为0的t检验? 答:多元线性回归模型的总体显著性 F 检验是检验模型中全部解释变量对被解释变量的共同影响是否显著。通过了此 F 检验,就可以说模型中的全部解释变量对被解释变量的共同影响是显著的,但却不能就此判定模型中的每一个解释变量对被解释变量的影响都是显著

计量经济学习题

1、已知回归模型:,为起始薪金(元),为受教育水平(年), 为随机干扰分布未知: ⑴、的含义 ⑵是否满足线性、无偏、有效? ⑶是否可对作t检验? ⑷若E的单位为100元,各变量有什么变化? 解: ⑴表示没有接受过教育的员工的平均起始薪金;表示 每单位N变化所引起的E的变化,即每多接受一年教育所对应的薪金的增加值。 ⑵满足线性、无偏、有效性,因为这些性质的成立无 需随机干扰项μ的正态分布假设。 (3)如果的分布未知,则所有的假设检验都是无效的。 因为t检验与F检验是建立在μ的正态分布的基础上的。 ⑷设表示以百元为度量单位的薪金, =++ 所以,估计的截距项与斜率项均为原回归系数的1/100 2、下面是根据10组数据的X和Y的观察值得到的数据: ;; ;

假定满足所有的古典线性回归模型的假设,要求: (1)和的估计值及其标准差? (2)R 2 的值 (3)对和分别建立95%的置信区间?利用置信区间法,你可以接受零假设:吗? 解: (1)因为n =10 且 所以0.5344 =21.22 若要求标准差,则需首先求出随机干扰项方差的估计: =77.60 故∑=2 2??1 i x S σ β=0.0484 == ∑∑222??0 i i x n X S σβ8.5913 (2) ∑∑-= 2 2 ) ?(i i i Y Y e =620.81 ∑-2)(Y Y i =10090 故TSS RSS TSS ESS R -== 12=0.9365 (3)对自由度为8 的分布,在5%的显著性水平下的临界值 ???????∑-∑∑∑-∑= ∑-∑∑∑-∑∑=2 212220)(?)(?i i i i i i i i i i i i i X X n X Y X Y n X X n X Y X Y X ββ2?2 2-=∑n e i σ

计量经济学名词解释和简答题

计量经济学 第一部分:名次解释 第一章 1、模型:对现实的描述和模拟。 2、广义计量经济学:利用经济理论、统计学和数学定量研究经济现象的经济计量方法的统称,包括回归分析方法、投入产出分析方法、时间序列分析方法等。 3、狭义计量经济学:以揭示经济现象中的因果关系为目的,在数学上主要应用回归分析方法。 第二章 1、总体回归函数:指在给定Xi 下Y 分布的总体均值与Xi 所形成的函数关系(或者说总体被解释变量的条件期望表示为解释变量的某种函数)。 2、样本回归函数:指从总体中抽出的关于Y ,X 的若干组值形成的样本所建立的回归函数。 3、随机的总体回归函数:含有随机干扰项的总体回归函数(是相对于条件期望形式而言的)。 4、线性回归模型:既指对变量是线性的,也指对参数β为线性的,即解释变量与参数β只以他们的1次方出现。 5、随机干扰项:即随机误差项,是一个随机变量,是针对总体回归函数而言的。 6、残差项:是一随机变量,是针对样本回归函数而言的。 7、条件期望:即条件均值,指X 取特定值Xi 时Y 的期望值。 8、回归系数:回归模型中βo ,β1等未知但却是固定的参数。 9、回归系数的估计量:指用?μ01 ,ββ等表示的用已知样本提供的信息所估计出来总体未知参数的结果。 10、最小二乘法:又称最小平方法,指根据使估计的剩余平方和最小的原则确定样本回归函数的方法。 11、最大似然法:又称最大或然法,指用生产该样本概率最大的原则去确定样本回归函数的方法。 12、估计量的标准差:度量一个变量变化大小的测量值。 13、总离差平方和:用TSS 表示,用以度量被解释变量的总变动。 14、回归平方和:用ESS 表示:度量由解释变量变化引起的被解释变量的变化部分。 15、残差平方和:用RSS 表示:度量实际值与拟合值之间的差异,是由除解释变量以外的其他因素引起的被解释变量变化的部分。 16、协方差:用Cov (X ,Y )表示,度量X,Y 两个变量关联程度的统计量。 17、拟合优度检验:检验模型对样本观测值的拟合程度,用2R 表示,该值越接近1,模型对样本观测值拟合得越好。 18、t 检验时针对每个解释变量进行的显著性检验,即构造一个t 统计量,如果该统计量的值落在置信区间外,就拒绝原假设。 19、相关分析:研究随机变量间的相关形式 20、回归分析:研究一个变量关于另一个(些)变量的依赖关系的计算方法和理论。 第三章 1、多元线性回归模型:在现实经济活动中往往存在一个变量受到其他多个变量的影响的现象,表现为在线性回归模型中有多个解释变量,这样的模型成为多元线性回归模型,多元指多个变量。

先验概率与后验概率的区别-1

先验概率与后验概率的区别(老迷惑了) 此为Bayesian先生,敬仰吧,同志们! 先验(A priori;又译:先天)在拉丁文中指“来自先前的东西”,或稍稍引申指“在经验之前”。近代西方传统中,认为先验指无需经验或先于经验获得的知识。它通常与后验知识相比较,后验意指“在经验之后”,需要经验。这一区分来自于中世纪逻辑所区分的两种论证,从原因到结果的论证称为“先验的”,而从结果到原因的论证称为“后验的”。 先验概率是指根据以往经验和分析得到的概率,如全概率公式 中的,它往往作为“由因求果”问题中的“因”出现。后验概 率是指在得到“结果”的信息后重新修正的概率,是“执果寻因”问题中的“因” 。后验概率是基于新的信息,修正原来的先验 概率后所获得的更接近实际情况的概率估计。先验概率和后验概

率是相对的。如果以后还有新的信息引入,更新了现在所谓的后验概率,得到了新的概率值,那么这个新的概率值被称为后验概率。 先验概率的分类: 利用过去历史资料计算得到的先验概率,称为客观先验概率;当历史资料无从取得或资料不完全时,凭人们的主观经验来判断而得到的先验概率,称为主观先验概率。 后验概率是指通过调查或其它方式获取新的附加信息,利用贝叶斯公式对先验概率进行修正,而后得到的概率。 先验概率和后验概率的区别: 先验概率不是根据有关自然状态的全部资料测定的,而只是利用现有的材料(主要是历史资料)计算的;后验概率使用了有关自然状态更加全面的资料,既有先验概率资料,也有补充资料; 先验概率的计算比较简单,没有使用贝叶斯公式;而后验概率的计算,要使用贝叶斯公式,而且在利用样本资料计算逻辑概率时,还要使用理论概率分布,需要更多的数理统计知识。

计量经济学重点简答论述题

计量经济学重点(简答题) 一、什么是计量经济学计量经济学,又称经济计量学,它是以一定的经济理论和实际统计资料为 依据,运用数学、统计学和计算机技术,通过建立计量经济学模型,定量分析经济变量之间的随机因果关系.。 二、计量经济学的研究的步骤是什么 1)理论模型的设计 A.理论或假说的陈述; B.理论的数学模型的设定; C.理论的计量经济模型的设定。 i.把模型中不重要的变量放进随机误差项中; ii.拟定待估参数的理论期望值。 2)获取数据 数据来源:网络、统计年鉴、报纸、杂志 数据类别:时间序列数据、截面数据、混合数据、虚变量数据。 数据要求:完整性、准确性、可比性、一致性 i.完整性:模型中包含的所有变量都必须得到相同容量的样本观察值。 ii.准确性:统计数据或调查数据本身是准确的。 iii.可比性:数据口径问题。 iv.一致性:指母体与样本的一致性。 3)模型的参数估计:普通最小二乘法。 4)模型的检验:经济学检验;统计学检验;计量经济学检验;模型的预测检验。 5)模型的应用:结构分析;经济预测;政策评价;经济理论的检验与发展。 三、简述统计数据的类别 时间序列数据、截面数据、混合数据、虚变量数据。 1)时间序列数据:按时间先后排列收集的数据。 采纳时间序列数据的注意事项:

A.所选择的样本区间的经济行为一致性问题。 B.样本数据在不同样本点之间的可比性问题。 C.样本数据过于集中的问题。不能反映经济变量间的结构关系,应增大观察区间。 D.模型的随机误差项序列相关问题。 2)截面数据:又称横向数据,是一批发生在同一时间截面上的调查数据。研究某时点上的变 化情况。 采纳截面数据的注意事项: A.样本与母体的一致性问题。 B.随机误差项的异方差问题。 3)混合数据:也称面板数据,既有时间序列数据,又有截面数据。 4)虚变量数据:又称二进制数据,只能取0和1两个值,表示的是某个对象的质量特征。 四、模型的检验包括哪几个方面具体含义是什么 1)经济学检验:参数的符合和大致取值。 2)统计学检验:拟合优度检验;模型的显着性检验;参数的显着性检验。 3)计量经济学检验:序列相关性;异方差检验;多重共线性检验。 4)模型的预测检验:a,扩大样本容量或变换样本重新估价模型;b,利用模型对样本期以外的 某一期进行预测。

2018级计量经济学选择题

选择题汇总 1、同一统计指标,同一统计单位按时间顺序记录形成的数据列是(C) A时期数据 B混合数据 C时间序列数据 D横截面数据 2、下面属于横截面数据的是(C) A 1991-2003年各年某地区20个乡镇企业的平均工业产值 B 1991-2003年各年某地区20个乡镇企业各镇的工业产值 C 某年某地区20个乡镇工业产值的合计数 D 某年某地区20个乡镇各镇的工业产值 2、在回归分析中,下列有关解释变量和被解释变量的说法正确的有(B) A 被解释变量和解释变量均为随机变量 B 被解释变量为随机变量,解释变量为非随机变量 C被解释变量和解释变量均为非随机变量 D被解释变量为非随机变量,解释变量为随机变量 3、如果回归模型违背了同方差假定(异方差),最小二乘估计量是(A) A 无偏的,非有效的 B 有偏的,非有效的 C 无偏的,有效的 D 有偏的,有效的 4、在回归模型满足DW检验的前提下,当统计量等于2时,表明(C) A 存在完全的正自相关 B 存在完全的负自相关 C 不存在自相关 D 不能判定 5、将一年四个季度对被解释变量的影响引入到包含截距项的回归模型中,则需要引入虚拟变量的个数为(A) A 3 B 2 C 1 D 4 6、在异方差性情况下,常用的估计方法是(D) A 一阶差分法 B 广义差分法 C 工具变量法

D 加权最小二乘法 7、当DW=4时,说明(D) A 不存在序列相关 B 不能判断是否存在一阶自相关 C 存在完全的正的一阶自相关 D存在完全的负的一阶自相关 8、在多元线性回归模型中,若某个解释变量对其余解释变量的判定系数接近于1,则表明模型中存在(C) A 异方差 B 序列相关 C 多重共线性 D 高拟合优度 9、需要在经济分析之前将经济时间序列进行( A ),剔除其中的季节变动要素和不规则要素 A.季节调整 B.趋势分解 C.指数平滑 D.移动平均 10、利用( B )方法可以把趋势和循环要素分离开来,从而研究经济的长期趋势变动和景气循环变动。 A.季节调整 B.趋势分解 C.指数平滑 D.移动平均 11、对某些经济时间序列(如股票序列),不存在明显的趋势变动和季节变动。一般,我们使用( C )方法对这样的时间序列进行拟合及预测。 A.季节调整 B.趋势分解 C.指数平滑 D.移动平均 12、最终的不规则要素分量表示为( D ) A. SA B. SF C.TC D. IR 13、最小化问题用[c(L)YtT]2来调整趋势的变化,并随着λ的变化而变化。则当λ( B ) 时,满足最小化问题的趋势等于序列{Yt},即趋势曲线与实际曲线重合 A.越小 B.等于0 C.越大 D.趋于无穷大 14、AR(p) 模型平稳的充要条件是Φ(z) 的根全部落在单位圆( A) A.之外 B.之内 C.圆上 D.以上均可 15、D_W统计量检验中,如果存在正序列相关,D.W.值将( A ) A.小于2 B.在2附近 C.2-4之间 D.大于4 16、8、自相关是q阶截尾,偏自相关是p阶截尾,则为( C )模型 p,q) D.以上均可 17( B )类型 A. 不变参数模型 B. 变截距模型 C. 变系数模型 D.以上均可 18、实践中,基于相关系数对序列相关性的判断实际上是通过相关图进行判断的。其中的虚线之间的区域是( C )所夹成的。 A.正两倍标准差 B. 负两倍标准差 C. 正负两倍标准差 D. 正负两倍方差 19、季节调整方法下列不包括哪个(D) A.X11调整方法 B.X12调整方法 C.TRAMO 方法 D.Hodrick-Prescott方法

相关主题
文本预览
相关文档 最新文档