计量经济学第八讲v
- 格式:doc
- 大小:562.00 KB
- 文档页数:15
计量经济学夏凡第八章动态计量模型基础第一节分布滞后模型第二节单位根检验第三节协整与误差修正模型计量经济学夏凡引言⏹传统的时序模型●一般先从已知相关理论出发设定模型形式,再由样本数据估计模型中的参数⏹这种方法使建模过程对相关理论有很强的依赖性⏹动态计量经济学模型●20世纪70年代末,以英国计量经济学家Hendry为代表,将理论和数据信息有效结合,提出了动态计量经济学模型的理论与方法●为时序模型带来了重要的发展量经济学夏凡第一节分布滞后模型⏹几何分布滞后模型⏹多项式分布滞后模型⏹自回归分布滞后模型量经济学夏凡基本概念⏹分布滞后模型●⏹如果p是有限数,称为有限分布滞后模型⏹如果p是无限数,称为无限分布滞后模型npptxxxytptpttt,,2,111++=+++++=--εβββα计量经济学夏凡基本概念(续)⏹分布滞后模型的两个问题●由于存在滞后值,则要损失若干个自由度⏹如果滞后时期长,而样本较小,自由度损失就较大,有时甚至无法进行估计●通常一个变量的滞后变量之间共线性问题严重,影响估计量的精度⏹解决方法●对系数施加约束条件,减少待估参数的数目计量经济学夏凡几何分布滞后模型⏹几何分布滞后模型●又称Koyck滞后模型●反映变量的影响程度随滞后期的延长而按几何级数递减⏹经济变量间的因果关系,往往随着时间间隔的延伸而逐渐减弱●模型⏹●()1221ti ititttttxxxxyελβαεβλλββα++=+++++=∑∞=---1<λ计量经济学夏凡几何分布滞后模型(续1)⏹模型的第二种表达形式●⏹对(1)式取一期滞后,并两边同乘λ得●⏹(1)式减去(2)式得●⏹令,即可得到模型的第二种表达式●用y t-1代替了x的滞后变量⏹减小了多重共线性的程度()ttttuyxy+++-=-11λβλα()212211----++++=ttttxxyλεβλλβλαλ()111---++-=-tttttxyyλεεβλαλ1--=tttuλεε计量经济学夏凡几何分布滞后模型(续2)⏹模型的估计●模型中的随机扰动项通常存在一阶负相关关系⏹参数估计变得较复杂●可采用工具变量法和广义差分法相结合的估计方法计量经济学夏凡多项式分布滞后模型⏹多项式分布滞后模型●为解决几何分布滞后模型存在的问题,Almon提出了多项式分布滞后(PDL:Polynomial Distributed Lag)模型⏹用多项式表示滞后变量系数βi和滞后长度i的关系⏹一般,多项式阶数不超过3次计量经济学夏凡多项式分布滞后模型(续1)⏹对于模型●其解释变量之间存在多重共线性,不能采用OLS估计●将βi分解为⏹●其中,且●即将每个参数用一个多项式表示()()()()pqpipipi qqi<-++-+-+=ααααβ221pi,,2,1,0=()()Nkkpkpppp∈⎩⎨⎧-==-=1222/12/()30tpi ititxyεβα++=∑=-计量经济学夏凡多项式分布滞后模型(续2)⏹模型的估计●(3)式可改写为⏹●其中●则(4)式实际上比(3)式少了p-q个参数●可对模型施加约束条件⏹近端(near end)约束和远端(far end)约束⏹应用时,可同时指定上述两种约束,或其中之一,也可不含约束条件()4110tqtqtttzzzyμαααα+++++=()()qjxpizitjpijt,,1,0=-=-=∑计量经济学夏凡多项式分布滞后模型(续3)⏹PDL模型的确定因素●滞后期p、多项式次数q和约束条件⏹PDL模型的特点●优点⏹减少了待估参数,因此减小了多重共线性的程度⏹方程的变换并没有改变干扰项的形式,没有引入自相关问题,可用OLS直接估计变换后的方程●缺点⏹样本损失没有减少●只有(n-q)个观测值可用于估计计量经济学夏凡多项式分布滞后模型(续4)⏹操作命令●ls y x1 x2pdl(series_name,lags,order,options)⏹lags:代表滞后期p⏹order:表示多项式阶数q⏹options:指定约束类型,没有约束条件时缺省●1:近端约束●2:远端约束●3:同时采用近端和远端两种约束计量经济学夏凡多项式分布滞后模型(续5)⏹[例8-1]某水库1998年至2000年各旬的流量、降水量数据如下所示。
《计量经济学》各章数据第8章 滞后变量模型例8.2.1 已知某地区制造业部门1955-1974年期间的资本存量y 和销售额x 的统计资料如表8.2.1(单位:百万元)。
表8.2.1 某地区制造业部门资本存量和销售额资料设定有限分布滞后模型为t t t t t t u x b x b x b x b a y +++++=---3322110运用经验加权法,选择下列三组权数:递减滞后、A 型滞后、不变滞后①81,41,21,1;②41,32,21,41;③41,41,41,41 分别估计上述模型,并从中选择最佳的方程。
例8.2.2 表8.2.3给出了某企业产品1988-2007年的产量y 和销售量x 的资料。
试利用分布滞后模型建立产量关于销售量的回归模型。
表8.2.3 某企业产品1988-2007年产量和销售量资料例8.3.1 表8.3.1给出了1994-2005年某地区居民消费y 与可支配收入x 的调查数据。
假定本期消费不仅与本期收入有关,而且与以前各期收入有关,此时消费函数模型有如下形式t t t t t u x b x b x b a y +++++=-- 22110其中,t y 与t x 分别代表第t 期的消费和收入。
假定随机项t u 满足全部经典假定,试用库伊克模型估计这一消费模型。
表8.3.1 某地区居民消费与收入调查数据8.5 案例分析表8.5.1给出了某地区消费总额y(亿元)和货币收入总额x(亿元)的年度资料,试分析消费同收入的关系。
表8.5.1 某地区消费总额和货币收入总额年度资料思考与练习14.表1给出了某行业1975-1994年的库存额y 和销售额x 的资料。
试利用分布滞后模型:t t t t t t u x b x b x b x b a y +++++=---3322110建立库存函数(用2次有限多项式变换估计这个模型)。
表1 某行业1975-1994年库存额和销售额资料15.表2给出了美国1970-1987年间个人消费支出(C )与个人可支配收入(I )的数据(单位:10亿美元,1982年为基期)表2 美国1970-1987年个人消费支出与个人可支配收入数据t t t u I a a C ++=21 t t t t u C b I b b C +++=-1321请回答以下问题:(1)估计以上两模型;(2)估计边际消费倾向(MPC )17.表3给出了1970-1991年美国制造业固定厂房设备投资y 与销售额x 的相关数据(单位:亿元)。
三、多重共线性的检验 (一) 相关系数检验利用相关系数可以分析解释变量之间的两两相关情况。
在EViews 软件中可以直接计算(解释)变量的相关系数矩阵: [命令方式]COR 解释变量名[菜单方式]将所有解释变量设置成一个数组,并在数组窗口中点击View\Correlations. (二) 辅助回归模型检验相关系数只能判断解释变量之间的两两相关情况,当模型的解释变量个数多于两下、并且呈现出较为复杂的相关关系时,可以通过每个解释变量对其他解释变量的辅助回归模型来检验多重共线性,即依次建立k 个辅助回归模型:k i x a x a x a x a a x kki i i i i,,1111111=++++++=++--ε如果,其中某些方程显著,则表明存在多重共线性,所对应的变量可以近似地用其他解释变量线性表示。
辅助回归模型检验不仅能检验多元回归模型的多重共线性,而且可以得到多重共线性的具体形式;如果再结合偏相关关系检验,还能进一步判定是哪些解释变量引起了多重共线性,这有助于分析如何消除多重共线性的影响。
(三) 方差膨胀因子检验对于多元线性回归模型,ib ˆ的方差可以表示成:iijiiijiVIF x x R x x b D ∙∑-=-∑-=22222)(11)()ˆ(σσ其中,i i x R 为2关于其他解释变量辅助回归模型的判定系数,i VIF 为方差膨胀因子。
随着多重共线性程度的增强,VIF 以及系数估计误差都在增大。
因此,可以用VIF 作为衡量多重共线性的一个指标;一般当10>VIF 时,(此时9.02>iR ),认为模型存在较严重的多重共线性。
另一个与VIF 等价的指标是“容许度”(Tolerance ),其定义为:iiiVIF R TOL /1)1(2=-=显然,10≤≤TOL ,当i x 与其他解释变量高度相关时,0→TOL 。
因此,一般当1.0<TOL 时,认为模型存在较严重的多重共线性。
第八章 古典线性回归的大样本理论迄今为止的讨论涉及了最小二乘估计量的有限样本性质。
根据非随机回归量和扰动项正态分布这两个假设,我们知道了最小二乘估计量的精确分布和一些检验统计量。
在本章中,我们去总结前一章关于最小二乘法的有限样本特性,然后我们重点讨论古典回归模型的大样本结果。
第一节 最小二乘法的有限样本特性 古典回归模型的基本假设是 Ⅰ.y=X β+ε。
Ⅱ.X 是秩为K 的n ×K 非随机矩阵。
Ⅲ.E[ε]=0。
Ⅳ.E[εε′]=σ2I 。
未知参数β和σ2的最小二乘估计量是y X X X b ''=-1)(和)(2K n ee s -'=通过分析εβX X X b ''+=-1)(并且Kn M s -'=εε2我们可得下列精确的有限样本结果:1. E[b]=β(最小二乘估计是无偏的)2. Var[b]=σ2(X ′X)-13. 任意函数r ′β的最小方差线性无偏估计量是r ′b 。
(这就是高斯—马尔科夫定理)4. E[s 2]=σ25. Cov[b,e]=0为了构造置信区间和检验假设,我们根据正态分布的假设],0[~.2I N V σε推导额外了的结果,即6. b 和e 在统计上是相互独立的。
相应的,b 和s 2无关并在统计上相互独立。
7. b 的精确分布依赖于X ,是])(,[12-'X X N σβ。
8. 22/)(σs K n -的分布是][2K n -χ。
s 2的均值是σ2,方差是2σ4/(n -K )。
9. 根据6至8结果,统计量))(][12-'-=-kk kk X X s b K n t β服从自由度为n -K 的t 分布。
10. 用于检验一组J 个线性约束R β=q 的检验统计量Jq Rb R X X Rs q Rb K n e e J q Rb R X X R q Rb )(])([)()/(/)(])([)(11211-'''-=-'-'''----- 服从自由度为J 和n -K 的F 分布。
第八讲 平稳时间序列与单位根过程一、随机时间序列模型概述在严格意义上,随机过程{}t X 的平稳性是指这个过程的联合和条件概率分布随着时间t 的改变而保持不变。
在实践中,我们更关注弱意义上的平稳或者所谓的协方差平稳:2();();(,)t t t t j j E X Var X Cov X X μδδ+===显然20δδ=。
在本讲义中,平稳皆指协方差平稳。
当上述条件中的任意一个被违背时,则称{}t X 是非平稳的。
(一)平稳随机过程的例子 1、白噪声过程{}t ε:20()0;();(,)0,t t t t j j E Var Cov εεδεε+≠===2、AR(1)过程:011,11t t t y a a y a ε<-=++,{}t ε是白噪声过程为了验证上述过程满足平稳性条件,我们首先通过迭代得到:1111010t t i it ii i t t y a a a y a ε---===++∑∑。
接下来注意到,111)0(t i i t t E y a a a y -==+∑,进一步假设数据生成过程发生了很久,即t 趋于无穷大,则01)1(t a E y aμ-==;其次也有110()()t it i i t Var y Var a ε--==∑,当t 趋于无穷大时,21221()11()i t Var a a Var y εδ-=-=;最后,当t 趋于无穷大时,有:1211111111222 (1241)11121......(...)[()()][()()]s s t t s t s t t s t s t s t t s s s s s a a a a a E y y E a a a a μμδδεεεεεεε+-----------++--+++++++++++=== 关于AR(p)过程的平稳性,见附录。
3、MA(P)过程:11...pt t t p t y a a εεε--=+++,{}t ε是白噪声过程显然,任意有限阶MA 过程都是平稳的。
第八讲 平稳时间序列在严格意义上,随机过程{}t X 的平稳性是指这个过程的联合和条件概率分布随着时间t 的改变而保持不变。
在实践中,我们更关注弱意义上的平稳或者所谓的协方差平稳:2();();(,)t t t t j j E X Var X Cov X X μδδ+===显然20δδ=。
在本讲义中,平稳皆指协方差平稳。
当上述条件中的任意一个被违背时,则称{}t X 是非平稳的。
(一)平稳随机过程的例子 1、白噪声过程{}t ε:20()0;();(,)0,t t t t j j E Var Cov εεδεε+≠===笔记:假定t ε还服从正态分布,则{}t ε被称为高斯白噪声。
在正态分布下,独立与不相关是两个等价的概念,从而高斯白噪声{}t ε也属于严格白噪声。
对于严格白噪声过程,有:, (12)()()t t t t E E εεεε--=,。
因此,就预测t ε来说,,1t i i ε-≥没有任何信息价值。
当一个变量的当期及其过去值对预测变量未来值没有任何帮助时,我们常常称该变量是不可预测的。
2、AR(1)过程:011,11t t t y a a y a ε<-=++,{}t ε是白噪声过程为了验证上述过程满足平稳性条件,我们首先通过迭代得到:11110010t t ii t ii i t t y a a a y a ε---===++∑∑。
接下来注意到,111)0(t i i t t E y a a a y -==+∑,进一步假设数据生成过程发生了很久,即t 趋于无穷大,则01)1(t a E y a μ-==;其次也有11()()t i t ii t Var y Var a ε--==∑,当t 趋于无穷大时,21221()11()i t Var a a Var y εδ-=-=;最后,当t 趋于无穷大时,有:1211111111222 (12411112)1......(...)[()()][()()]s s t t s t s t t s t s t s t t s s s s sa a a a a E y y E a a a a a μμδδεεεεεεε+-----------++--+++++++++++===关于AR(p)过程的平稳性,见附录。
下图是对一个平稳AR(1)过程的模拟。
1,(0,1)10.8t N ID t t ty y εε-+=+笔记:重新表述上述AR(1)过程:1011011()[()]11()()tt t t E y E yt tt t t t E y a a E y y a a y y a y εε--⎫⎪⇒--⎬⎪⎭--=+=++=+即1[]1t t t y a y μμε---=+,进而有:11[]()(1)()111)(t t t t t t t y y a y y a y μμμμεε=----=-----∆∆=++由于110a -<,因此有:11;11)0)0((t t y y t t tt if ifE y y E y y μμ--><--<>∆∆此即平稳AR(1)过程所具有的均值回复性(Mean reversion )。
3、MA(1)过程:11t t t y a μεε-=++,{}t ε是白噪声过程显然,任意有限阶MA 过程都是平稳的。
模型:111t t t t y y a μρεε+--=++,{}t ε是白噪声过程被称为ARMA(1,1)过程,关于ARMA(p,q)过程的平稳性,见附录。
(二)自相关函数、偏自相关函数与相关图 1、自相关函数定义t y 与t y τ-的相关系数为:(,)()()t t t t C ov y y sd y sd y τττρ--=假定2()()0;()()tt t tE y E y s d y s d y ττδ--====,则()()t t t E y y Var y ττρ-=。
按照时间序列平稳性假定,自相关系数是τ而不是t 的函数,τρ被称为自相关函数(ACF )。
样本自相关函数是:112ˆˆˆˆTt Tt tt t yyy τττρ=+=-=∑∑(显然,如果ˆt y对ˆt y τ-进行无截距回归,其斜率估计就是ˆτρ的一个近似值1)。
在原假设:0τρ=下,ˆ(0,1/)aN T τρ,因此,在95%的置信水平下,样本自相关函数将落在2±内,即“两倍的标准误差带内”。
2、偏自相关函数假定{}t y 的数据生成过程为()AR τ:1122...t t t t t y p y p y p y ττε---=+++,{}t ε是白噪声过程则p τ被称为{}t y 的τ阶偏自相关函数(PACF )。
利用OLS 法,得到p τ的估计ˆp τ:2112...ˆˆˆˆtt t t y y p y p p y ττ---=++在原假设:0p τ=下,ˆp(0,1/)aN T τ 。
笔记:t y 与t y τ-的自相关函数与偏自相关函数的区别在于,前者度量了两变量之间简单、常规的相关程度;而后者在度量相关程度1为了满足假定:()0tE y =,时间序列应该预先剔除均值。
时,首先剔除了121...t t t y y yτ----()、、对两者的影响。
思考题:样本一阶自相关系数与样本一阶偏自相关系数具有什么关系?这个关系能够推广到二阶及其以上的情况吗?3、各种过程下τρ与p τ的性质 (1)AR(1)过程的τρ与p τ假定{}t y 的数据生成过程是AR(1)模型:1t t t y yρε-=+其中1ρ<,22tεδδ=,,)0,1(t t i i C ov y ε-=≥。
1ρ<这个约束条件是{}t y 具有平稳性的充分条件。
对AR(1) 模型进行迭代,有:1221221)(...j j j t t j t j t t t j t j y y ρρερερερεε--+++++-+-=++++++把括号内表达整体上看成是一个误差项,则ττρρ=,当τ→∞时,0τρ→。
因此,自相关函数是拖尾的。
按照偏自相关函数的定义,显然有:1234,...0p p p p ρ=====。
我们称偏自相关系数从2τ=处开始截尾。
推广:当平稳序列其数据生成过程是()AR p 模型时,偏自相关函数从1p τ=+处开始截尾,而自相关函数具有拖尾性质。
(2)MA(1)过程的τρ与p τ假定{}t y 的数据生成过程是MA(1)模型:1tt ty v λε-=+其中1λ<,22t εδδ=,,)0,1(t t i i C ov y ε-=≥。
1λ<这个约束条件是MA(1)过程具有可逆性的充分条件。
把上式递推,有:11212...t tt t t t y v y v λελε+++++=+=+不难证明1232, (01)λρρρλ===+。
因此,自相关函数从2τ=处开始截尾。
为了考察偏自相关函数所具有的性质,对MA(1) 模型进行迭代,有:221212t t t t t t yyλεελλεε+++++=+=-+23112t t t t yy λλλεε+-+=-++2341122...t t t t t yy yλλλλεε+--+=-+-+ 因此,1(1)p τττλ+=-。
当τ→∞时,0p τ→,因此,偏自相关函数是拖尾的。
推广:当平稳序列其数据生成过程是()M A p 模型并且满足可逆性时,其自相关系数从1p τ=+处开始截尾,而偏自相关系数具有拖尾性质。
(3)ARMA(1,1)过程的τρ与p τ平稳序列其数据生成过程是ARMA(1,1)模型:11t t t t y yρλεε--=++则自相关函数与偏自相关函数皆是拖尾的。
该结论对ARMA(p,q)过程成立。
(4)总结4、相关图分析关于ˆτρ与ˆp τ的图形被称为相关图(Correlogram),见例图:上图中,虚线区域表示两倍的标准误差带。
显然,根据样本计算的一阶自相关函数及其一阶、二阶偏自相关函数都超出了两倍的标准误差带。
因此,我们可以得到结论:在5%显著水平下,拒绝一阶自相关函数数及其一阶、二阶偏自相关函数数为零的原假设。
根据Q统计值(参见第五讲的Portmanteau检验),我们也可以得到结论:在5%显著水平下,拒绝1210 ...0,m mρρρ≤====的原假设。
根据上图,我们还可以认为,一个AR(2)模型可以被用来描述数据生成过程。
因为上图表明,样本偏自相关函数从3τ=开始接近为零,而样本自相关函数展现出拖尾性质。
这些现象与数据生成过程是AR(2)模型时其偏自相关函数与自相关函数所具有的性质相一致(此时偏自相关函数将从3τ=开始为零,而自相关函数是拖尾的)。
(三)模型估计利用OLS 法就可以对AR(p)模型进行估计。
对MA(p)与ARMA(p,q)模型的估计比较棘手,其估计方法一般包括非线性最小二乘法(NLS)与极大似然估计(ML)两种。
如果假定误差项服从正态分布,则ML估计与NLS估计渐进等价。
对NLS与ML的详细介绍超出了本讲义的范围,但幸运的是,计量软件包EVIEWS 对这两种估计都提供了标准的程序。
附录:AR(p)过程的平稳性AR(1)过程:11,11t t t y a a y aε<-=++,{}t ε是白噪声过程通过反复迭代有:111110t t i i t ii i t t y a a a y a ε---===++∑∑。
AR(1)过程是一个一阶随机差分方程,而111110t t i i t ii i t t y a a a y a ε---===++∑∑就是该方程的解。
考察这个解的结构:111110t t i i t ii i t t y a a a y a ε---==↓↓↓=++∑∑特解中的 通解 特解中的确定性部分 随机性部分应该注意到,a 1是齐次差分方程11t t y a y -=的特征方程:1111,01t t or x a x a x --==-的解。
在t 趋于无穷的情况下,平稳性要求这个特征方程的解其绝对值小于1。
AR(p)过程:1pii t t t i y a a y ε=-=++∑,{}t ε是白噪声过程是一个p 阶随机差分方程。
其解也包括两部分:通解与特解,而特解又包括确定性与随机部分。
齐次差分方程1pii t t i y a y =-=∑的特征方程为:11,01ppiii i tt iiorx a xa x ==--==-∑∑其解是x 1,x 2,...,x p 。
则原随机差分方程的通解为:1pii t i A x =∑,其中A i 是待定的常数,它们依赖于初始条件。
在t 趋于无穷的情况下,平稳性要求上述特征方程的解其绝对值小于1。