计量经济学第五讲20130416
- 格式:doc
- 大小:575.00 KB
- 文档页数:22
计量经济学第一章绪论目前,在经济学、管理学以及一些相关学科的研究中,定量分析用得越来越多。
所谓定量分析,即揭示经济活动中客观存在的数量关系。
定量分析方法统计分析方法:一元多元经济计量分析方法:以模型为基础时间序列分析方法:动态时间序列§1.1 计量经济学及其模型概述一、计量经济学计量经济学的诞生计量经济学“Econometrics”一词最早是由挪威经济学家弗里希(R.Frish)于1926年仿照“Biometrics”(生物计量学)提出来的,这标志着计量经济学的诞生。
弗里希将计量经济学定义为经济学、统计学和数学三者的结合。
计量经济学的定义计量经济学是以经济理论为指导,以经济事实为依据,以数学、统计学为方法,以计算机为手段;主要从事经济活动的数量规律研究,并以建立、检验和运用计量经济学模型为核心的一门经济学学科。
二、计量经济学模型模型,是对现实的描述和模拟。
模型分类语义模型:语言文字。
物理模型:简化的实物。
几何模型:几何图形。
数学模型:数学公式。
计算机模拟模型:计算机模拟技术。
计量经济学模型属于经济数学模型,即用数学公式来描述经济活动。
例:生产函数经济数学模型是建立在经济理论的基础之上的。
生产理论:“在供给不足的条件下,产出由资本、劳动、技术等投入要素决定,随着各投入要素的增加,产出也随之增加,但要素的边际产出递减。
” 建立初始模型初始模型的特点模型描述了经济变量之间的理论关系;通过模型可以分析经济活动中各因素之间的相互影响,从而为控制经济活动提供理论指导;认为这种关系是准确实现的;模型并没有揭示各因素之间的定量关系,因为参数未知。
模型的改进以1964-1984年我国工业生产活动的数据作为样本,估计得到:改进模型的特点1.用随机性的数学方程描述现实的经济活动与经济关系。
2.揭示了经济活动中各因素之间的定量关系。
3.可用于对研究对象进行深入的研究,如结构分析、生产预测等。
初始模型——数理经济学模型数理经济学模型:由确定性的数学方程所构 成,用以揭示经济活动中各因素间的理论关系。
第五讲 自相关高斯-马尔科夫假定五是:(,)0,i j i j C ovariance i j εεεεδ==≠如果该假定不成立,那么称模型的误差项是序列相关的。
由于序列相关主要针对于时间序列数据,因此,下面把i 改写为t ,样本容量N 改写为T 。
笔记:1、如果基于横截面数据的回归模型其误差项是相关的,则称为空间自相关。
但是要记住,除非观察顺序具有某种逻辑或者经济上的意义,否则,在横截面数据回归中,观察顺序是可以随意的,因此,也许在某种观测顺序下误差项呈现出一种模式的自相关但在另一种观测顺序下又呈现出另外一种模式的自相关。
然而,当我们处理时间序列时,观测服从时间上的一种自然顺序。
2、在经济变量时间序列回归模型中,误差项经常被称之为冲击(Shock )。
对经济系统的冲击经常具有持续性,从而这为误差项序列相关提供了现实依据。
一、 自相关的后果在证明高斯-马尔科夫定理时,我们仅仅在证明OLS 估计量的方差最小(在所有线性无偏估计量中)时用到了序列无关假定,而在证明线性、无偏性并没有用到该假定,因此违背无自相关性假定并不影响线性、无偏性,只影响方差最小性质。
在证明方差最小时,我们分了两步,其中第一步是计算OLS 估计量的方差。
对模型:t 01t t y x ββε=++有:12ˆ12222()()()()(())()()[()]t t t t t t t t tx x Variance x x x x Variance x x Variance x x x x βεδβεε-=+---==--∑∑∑∑∑∑在假定五:0,0t t j j εεδ+=≠下,有:122ˆ222()[()]ttt x x x x βεδδ-=-∑∑如果假定五不成立,那么正确的方差表达式应该是:12ˆ1221122()2()()[()]t t t jT T tt t t j t j t x x x x x x x x βεεεδδδ+--+==-+--=-∑∑∑∑所以, OLS 法下通常的系数估计量方差的表示是错误的。
第一章一、计量经济学定义。
计量经济学是经济学的一个分支学科,是以揭示经济活动中客观存在的数量关系为内容的分支学科。
它是经济理论、统计学和数学三者的结合。
二、建立与应用计量经济学模型的主要步骤。
(一)理论模型的设计1.确定模型所包含的变量2.确定模型的数学形式3.拟定理论模型中待估参数的理论期望值(二)、样本数据的收集(三)、模型参数的估计(四)、模型的检验(五)、模型的应用三、理论模型的设计所包含的三部分工作。
(一)、确定模型所包含的变量在单方程模型中,变量分为两类。
作为研究对象的变量,也就是因果关系中的“果”,是模型中的被解释变量;而作为“原因”的变量,是模型中的解释变量。
确定模型所包含的变量,主要是指确定解释变量。
可以作为解释变量的有下列几类变量:外生经济变量、外生条件变量、外生政策变量和滞后被解释变量。
如何正确地选择解释变量?1、需要正确理解和把握所研究的经济现象中暗含的经济学理论和经济行为规律。
2、选择变量要考虑数据的可得性。
3、选择变量时要考虑所有入选变量之间的关系,使得每一个解释变量都是独立的。
(二)、确定模型的数学形式选择模型数学形式的主要依据是经济行为理论。
在数理经济学中,已经对常用的生产函数、需求函数、消费函数、投资函数等模型的数学形式进行了广泛的研究,可以借鉴这些研究成果。
也可以根据变量的样本数据作出解释变量与被解释变量之间关系的散点图,由散点图显示的变量之间的函数关系作为理论模型的数学形式。
如果无法事先确定模型的数学形式,那么就采用各种可能的形式进行试模拟,然后选择模拟结果较好的一种。
(三)、拟定理论模型中待估参数的理论期望值理论模型中的待估参数一般都具有特定的经济含义,对于它们的数值范围,即理论期望值,可以根据它们的经济含义在开始时拟定。
这一理论期望值可以用来检验模型的估计结果。
拟定理论模型中待估参数的理论期望值,关键在于理解待估参数的经济含义。
例如在生产函数理论模型中有4个待估参数α、β、γ和A。
第五讲 序列相关一、 为什么要关注序列相关问题?对于模型01i i i y x ββε=++,序列无关假定即:(,)0,i j Cov i j εε=≠。
对于时间序列数据,这个假定经常被违背,即出现序列相关问题。
时间序列数据是通过对同一个单元的连续观测而获得的,所有观测具有固定的时间先后顺序。
与之相比,横截面数据是通过对不同单元的观测而获得的,在横截面数据中,所有观测在本质上都处于一个平行位置,而其实际顺序具有随意性。
由于时间序列数据来自于同一个单元,而同一个单元的某些内在特性在一定时期不会出现较大的变化,因此时间序列数据经常表现出明显的序列相关性。
从直觉上看,这种序列相关一般应该是正的序列相关。
由于序列相关主要针对时间序列数据,因此在讨论这个问题时我们把模型中的脚标i 改写为t ,把样本容量N 改写为T : 01t t t y x ββε=++误差项ε容纳了除x 之外的其他对y 有影响的变量。
当这些变量序列相关时,误差项就很可能出现序列相关。
理解误差项序列相关的另一个视角是,在时间序列模型中,误差项经常被称之为冲击(Shock)。
对经济系统的冲击经常具有持续性,从而这为误差项序列相关提供了现实依据。
笔记:在日常生活中,我们经常说“好运连连”、“屋漏偏逢连夜雨”等口头禅。
如果把“好运”理解成正向冲击,“连夜雨”理解成负向冲击,则这些口头禅就意味着冲击一般具有正相关性。
序列相关问题会产生什么样的后果呢?(一)理论意义上的后果在证明高斯-马尔科夫定理时,我们仅仅在证明OLS估计量具有有效性时涉及到了序列无关假定,而在证明线性、无偏性并没有用到该假定,因此序列相关并不影响OLS估计量所具有的线性与无偏性这两个性质(实际上也不影响OLS估计量的一致性,一致性只涉及到高斯-马尔科夫假定一、二、三),而只影响OLS估计量的有效性。
具体来说,当序列相关问题存在时,在所有线性无偏估计量中,OLS估计量再也不是最有效的估计量了。
如果在模型估计时利用序列相关信息而不是像OLS估计那样对序列相关问题视而不见,则模型估计的有效性将提高。
本章后面我们将介绍如何利用序列相关信息进行模型估计。
(二)实践意义上的后果计量软件包在默认状态下总是认为同方差假定成立,进而依据一些常规公式来计算参数估计的标准误。
例如,在默认状态下1ˆβ标准误的计算公式是,1ˆ)(se β=其中22ˆˆ2i N δε=-∑是对误差方差的估计。
然而我们知道, 12ˆ(())i i i i Var Var k y k βδε==∑∑ 如果序列无关假定不成立,则12ˆ2(,)()i i j i j i ji k k Cov Var k βεεδε≠+=∑∑ 即使同方差假定成立,然而由于0(,)i j i j i jk k Cov εε≠≠∑,因此们根本无法推导出12ˆ22()i x x βδδ=-∑这个通常的公式。
计1ˆβδ的目的显然是不可行的。
因此,序列相关问题在实践意义上的后果就是,计量软件包在默认状态下计算出的参数估计量的标准误是无意义的,进而基于这种标准误所进行的假设检验也是无意义的。
笔记:由于正序列相关更常见,故(,)i j i j i jk k Cov εε≠∑一般是大于0的,因此省略此项得到的1ˆβ的标准差一般会小于其真实的标准差。
相应的,计量软件包在默认状态下计算出的参数估计量的标准误很可能低估了真实的标准差,夸大了估计精度。
幸运的是,与异方差问题一样,当出现序列相关问题时,在大样本情况下,我们能够计算一个稳健标准误。
这个标准误既对序列相关问题稳健,也对异方差问题稳健,被称为HAC(heteroskedasticity and autocorrelation consistent)标准误或者Newey-West 标准误。
在大样本下,我们可以基于HAC 标准误进行统计推断。
关于HAC 标准误的简单介绍参见Stock & Watson(Second edition,p.606-607)。
二、 发现自相关与异方差检验一样、我们是通过对残差的分析来检验序列无关假定是否被违背。
(一)图示法如果残差随着观测顺序的变化并不频繁地改变符号,见图一,则这是误差项序列正自相关的证据;如果残差随着观测顺序的变化频繁地改变符号,则这是误差项序列负自相关的证据,见图二。
笔记: 1、与上述图形检验思路一样但更正规的一种检验方式是游程检验(runs test )。
首先记录残差的符号,例如:(++++++++++)(--)(+++++++)(-)(++++++)。
所谓游程是指具有同一符号的一个不间断历程。
在此例中,具有5个游程。
直观来看,如果游程太多,这意味着残差频繁地改变符号,而这是负自相关的证据;反之,如果游程太少,则是正自相关的证据。
给定观测值的个数,利用Swed & Eisenhart 所给出的一定显著水平下关于游程数的两个临界值,我们可以检验误差是独立的这个原假设。
详情可参见相关教科书。
2、在图一中,残差大约在三个位置改变了符号,你也许会问,这不是违背了正序列相关的判断吗?记住!我们发现的正序列相关是统计规律,而统计规律是大部分观测所具有的规律。
图一:正序列相关ˆt εˆt ε图二:负序列相关(二)Durbin-Watson (DW )检验DW 检验用来检验误差项是否存在一阶自相关。
该检验法利用OLS 残差ˆt ε构造检验统计量: 21221ˆˆ()ˆT t t t T t t DW εεε-==-=∑∑很容易证明ˆ2(1)DW ρ≈-,其中ˆρ是残差样本一阶自相关系数(该证明留作讨论相关图检验时的一个练习)。
基于这个结论,显然,如果误差项没有一阶自相关关系,那么ˆρ应该接近于0,而DW 应该接近于2;如果误差项具有强烈的一阶正自相关关系,即ˆρ接近于1,而DW 应该接近于0;如果误差项具有强烈的一阶负自相关关系,即ˆρ接近于-1,而DW 应该接近于4。
上述这些论述为我们利用DW 统计量来检验序列相关提供了指南。
为了更好地利用DW 统计量,我们当然希望知道它的分布。
不过不幸的是,在误差项一阶自相关系数为零的原假设下,DW 的精确分布取决于解释变量的取值。
换句话说,当我们利用相同的模型但不同的样本时(这里样本不同不是指样本容量不同,而是指变量取值不同),我们所面对的DW 统计量分布是不同的,从而这损害了DW 统计量的实际应用性。
Durbin-Watson 证明,DW 的精确分布位于两个极限分布之间。
我们可以利用这两个极限分布来进行假设检验。
在实践中,经济变量如果存在自相关,则一般是正自相关,因此在进行DW 检验时,我们通常利用单侧(左侧)检验(一般教科书所提供的临界值表是针对单侧检验的)。
笔记:1、经济变量一般正自相关是针对水平变量而言。
对于差分变量,负自相关在年度时间序列中也是常见的。
这是因为,差分表示变量的变化,如果经济变量在均衡位置上下波动,那么上一期涨幅较大往往意味着在本期将出现回落。
不过对于来自于资本市场的高频时间序列数据,由于冲量效应等原因,差分变量出现正自相关也是常见的。
2、如果DW 值远远大于2,这往往是模型错误设定的信号。
在单侧检验下,给定显著水平,当l DW d,我们d U d L 4-d U 4-d L2认为误差项是一阶正自相关的;当u l d DW d <≤,则无法判断;当u d DW <,我们认为误差项不存在一阶自相关。
由于存在无法判断的区间,因此DW 检验具有局限性。
另外,进行DW 检验还应该注意如下几个问题:(1)该检验用来判断误差项是否存在一阶自相关。
一阶自相关不存在并不一定意味着不存在高阶自相关。
(2)回归模型一般应带有截距项以保证残差均值为零;(3)DW 统计量的分布除了取决于解释变量矩阵X 外还依赖于全套的经典线性模型假定。
因此,为了保证DW 检验有效,其他经典线性模型假定必须成立。
(4)解释变量中不能含有滞后因变量。
考虑模型:121t t t t y a b x b y ε-=+++,当t ε与1t ε-相关时,t ε与1t y -是相关的,这将导致OLS 估计量有偏,且偏差不会随样本容量的增加而趋于零,即OLS 估计量不是一致估计量。
OLS 估计将把误差项所包含的信息价值归功于解释变量,而相应的残差看起来再也不含有价值的信息,因此,此时DW 值经常接近于2,从而具有误导性。
(三)相关图(Correlogram )检验在讨论DW 检验时,我们提到结论ˆ2(1)DW ρ≈-,一个显然问题是,为何我们不直接基于残差样本一阶自相关系数ˆρ对误差项是否存在一阶自相关进行检验呢?事实上这也是可行的,而且还可以推广,即我们能够基于残差样本k 阶自相关系数ˆk ρ来检验误差项是否存在k 阶自相关。
在讨论这些检验之前,我们先了解一些预备知识。
(1)时间序列平稳性在针对时间序列的经典计量分析中,我们要求时间序列都是平稳的。
本讲义第八讲我们详细讨论时间序列平稳性概念,但在这里有必要先简单介绍一下这个概念。
在直观意义上,平稳时间序列应该没有趋势性,也不会持久偏离均值;从数学上看,平稳时间序列{}t y 应该满足三个条件:期望值为常数,即()t E y μ=;方差为常数,即2()t Var y δ=;协方差与时间起点无关,即,()j t t j Cov y y δ-=。
(2)自相关系数平稳时间序列{}t y 的总体k 阶自相关系数是:2222(,)()()()()()()()t t t t t t k t k k tt Cov y y E y y E y E y y E y Var y E y E y ρ--=--==- 如果平稳时间序列的期望值为零,则2()()t t t k k E y y E y ρ-=,此时样本k 阶自相关系数是121ˆT t t k t k T t t k y y y ρ-=+==∑∑。
误差项t ε满足期望值为零的条件,故其样本k 阶自相关系数是121ˆT t t k t k T t t k εεερ-=+==∑∑,然而误差项是不可观测的,因此我们用残差代替之,于是121ˆˆˆˆTt t k t k T t t k εεερ-=+==∑∑。
练习:证明ˆ2(1)DW ρ≈-,其中1ˆˆρρ=是残差样本一阶自相关系数。
在介绍了一些预备知识后,为了利用残差样本k阶自相关系数ˆk ρ来检验误差项是否存在k 阶自相关,我们还需要了解ˆk ρ所服从的分布。
可以证明,22)ˆ(,a k k T k T TN ρρ-+:。
当T 很大时,还可进一步简化为:1)ˆ(,ak k T N ρρ:,因此在原假设0k ρ=下,10)ˆ(,a k T N ρ:,故在95%置信水平下,ˆk ρ≤≤-。