计量经济学第八讲
- 格式:doc
- 大小:476.00 KB
- 文档页数:18
第八讲 平稳时间序列在严格意义上,随机过程{}t X 的平稳性是指这个过程的联合和条件概率分布随着时间t 的改变而保持不变。
在实践中,我们更关注弱意义上的平稳或者所谓的协方差平稳:2();();(,)t t t t j j E X Var X Cov X X μδδ+===显然20δδ=。
在本讲义中,平稳皆指协方差平稳。
当上述条件中的任意一个被违背时,则称{}t X 是非平稳的。
(一)平稳随机过程的例子 1、白噪声过程{}t ε:20()0;();(,)0,t t t t j j E Var Cov εεδεε+≠===笔记:假定t ε还服从正态分布,则{}t ε被称为高斯白噪声。
在正态分布下,独立与不相关是两个等价的概念,从而高斯白噪声{}t ε也属于严格白噪声。
对于严格白噪声过程,有:, (12)()()t t t t E E εεεε--=,。
因此,就预测t ε来说,,1t i i ε-≥没有任何信息价值。
当一个变量的当期及其过去值对预测变量未来值没有任何帮助时,我们常常称该变量是不可预测的。
2、AR(1)过程:011,11t t t y a a y a ε<-=++,{}t ε是白噪声过程为了验证上述过程满足平稳性条件,我们首先通过迭代得到:11110010t t ii t ii i t t y a a a y a ε---===++∑∑。
接下来注意到,111)0(t i i t t E y a a a y -==+∑,进一步假设数据生成过程发生了很久,即t 趋于无穷大,则01)1(t a E y a μ-==;其次也有11()()t i t ii t Var y Var a ε--==∑,当t 趋于无穷大时,21221()11()i t Var a a Var y εδ-=-=;最后,当t 趋于无穷大时,有:1211111111222 (12411112)1......(...)[()()][()()]s s t t s t s t t s t s t s t t s s s s sa a a a a E y y E a a a a a μμδδεεεεεεε+-----------++--+++++++++++===关于AR(p)过程的平稳性,见附录。
计量经济学讲义浙江工商大学金融学院姚耀军目录第一讲 OLS的代数 (2)第二讲 OLS估计量 (17)第三讲假设检验 (33)第四讲异方差 (63)第五讲自相关 (82)第六讲多重共线 (107)第七讲虚拟变量 (122)第八讲时间序列初步:平稳性与单位根 (134)第九讲协整与误差修正模型 (158)第十讲 ARCH模型及其扩展 (165)第一讲 OLS 的代数一、 问题假定y 与x 具有近似的线性关系:01y x ββε=++,其中ε是随机误差项。
我们对01,ββ这两个参数的值一无所知。
我们的任务是利用样本去猜测01,ββ的取值。
现在,我们手中就有一个样本容量为N 的样本,其观测值是:1122(),(),...,()N N y x y x y x 。
问题是,如何利用该样本来猜测01,ββ的取值?一个简单的办法是,对这些观察值描图,获得一个横轴x ,纵轴y 的散点图。
既然y 与x 具有近似的线性关系,那么我们就在散点图中拟合一条直线:1ˆˆˆx yββ=+。
该直线是对y 与x 的真实关系的近似,而01ˆˆ,ββ分别是对01,ββ的猜测(估计)。
问题是,如何确定0ˆβ与1ˆβ,以使我们的猜测看起来是合理的呢?二、 O LS 的两种思考方法法一:12(,...,)N y y y '与12ˆˆˆ(,...,)N yy y '是N 维空间的两点,0ˆβ与1ˆβ的选择应该是这两点的距离最短。
这可以归结为求解一个数学问题:01012201ˆˆˆˆ,,11ˆˆˆ()()N Ni i i i i i Min y y Min y x ββββββ==-=--∑∑在这里ˆi i y y-定义了残差ˆi ε。
法二:给定i x ,看起来i y 与ˆi y 越近越好(最近距离是0)。
然而,当你选择拟合直线使得i y 与ˆi y是相当近的时候,j y 与ˆj y的距离也许变远了,因此,存在一个权衡。
一种简单的权衡方式是,给定12,,..,N x x x ,拟合直线的选择应该使1y 与2ˆy、2y 与2ˆy 、...、N y 与ˆN y 的距离的平均值是最小的。
计量经济学夏凡第八章动态计量模型基础第一节分布滞后模型第二节单位根检验第三节协整与误差修正模型计量经济学夏凡引言⏹传统的时序模型●一般先从已知相关理论出发设定模型形式,再由样本数据估计模型中的参数⏹这种方法使建模过程对相关理论有很强的依赖性⏹动态计量经济学模型●20世纪70年代末,以英国计量经济学家Hendry为代表,将理论和数据信息有效结合,提出了动态计量经济学模型的理论与方法●为时序模型带来了重要的发展量经济学夏凡第一节分布滞后模型⏹几何分布滞后模型⏹多项式分布滞后模型⏹自回归分布滞后模型量经济学夏凡基本概念⏹分布滞后模型●⏹如果p是有限数,称为有限分布滞后模型⏹如果p是无限数,称为无限分布滞后模型npptxxxytptpttt,,2,111++=+++++=--εβββα计量经济学夏凡基本概念(续)⏹分布滞后模型的两个问题●由于存在滞后值,则要损失若干个自由度⏹如果滞后时期长,而样本较小,自由度损失就较大,有时甚至无法进行估计●通常一个变量的滞后变量之间共线性问题严重,影响估计量的精度⏹解决方法●对系数施加约束条件,减少待估参数的数目计量经济学夏凡几何分布滞后模型⏹几何分布滞后模型●又称Koyck滞后模型●反映变量的影响程度随滞后期的延长而按几何级数递减⏹经济变量间的因果关系,往往随着时间间隔的延伸而逐渐减弱●模型⏹●()1221ti ititttttxxxxyελβαεβλλββα++=+++++=∑∞=---1<λ计量经济学夏凡几何分布滞后模型(续1)⏹模型的第二种表达形式●⏹对(1)式取一期滞后,并两边同乘λ得●⏹(1)式减去(2)式得●⏹令,即可得到模型的第二种表达式●用y t-1代替了x的滞后变量⏹减小了多重共线性的程度()ttttuyxy+++-=-11λβλα()212211----++++=ttttxxyλεβλλβλαλ()111---++-=-tttttxyyλεεβλαλ1--=tttuλεε计量经济学夏凡几何分布滞后模型(续2)⏹模型的估计●模型中的随机扰动项通常存在一阶负相关关系⏹参数估计变得较复杂●可采用工具变量法和广义差分法相结合的估计方法计量经济学夏凡多项式分布滞后模型⏹多项式分布滞后模型●为解决几何分布滞后模型存在的问题,Almon提出了多项式分布滞后(PDL:Polynomial Distributed Lag)模型⏹用多项式表示滞后变量系数βi和滞后长度i的关系⏹一般,多项式阶数不超过3次计量经济学夏凡多项式分布滞后模型(续1)⏹对于模型●其解释变量之间存在多重共线性,不能采用OLS估计●将βi分解为⏹●其中,且●即将每个参数用一个多项式表示()()()()pqpipipi qqi<-++-+-+=ααααβ221pi,,2,1,0=()()Nkkpkpppp∈⎩⎨⎧-==-=1222/12/()30tpi ititxyεβα++=∑=-计量经济学夏凡多项式分布滞后模型(续2)⏹模型的估计●(3)式可改写为⏹●其中●则(4)式实际上比(3)式少了p-q个参数●可对模型施加约束条件⏹近端(near end)约束和远端(far end)约束⏹应用时,可同时指定上述两种约束,或其中之一,也可不含约束条件()4110tqtqtttzzzyμαααα+++++=()()qjxpizitjpijt,,1,0=-=-=∑计量经济学夏凡多项式分布滞后模型(续3)⏹PDL模型的确定因素●滞后期p、多项式次数q和约束条件⏹PDL模型的特点●优点⏹减少了待估参数,因此减小了多重共线性的程度⏹方程的变换并没有改变干扰项的形式,没有引入自相关问题,可用OLS直接估计变换后的方程●缺点⏹样本损失没有减少●只有(n-q)个观测值可用于估计计量经济学夏凡多项式分布滞后模型(续4)⏹操作命令●ls y x1 x2pdl(series_name,lags,order,options)⏹lags:代表滞后期p⏹order:表示多项式阶数q⏹options:指定约束类型,没有约束条件时缺省●1:近端约束●2:远端约束●3:同时采用近端和远端两种约束计量经济学夏凡多项式分布滞后模型(续5)⏹[例8-1]某水库1998年至2000年各旬的流量、降水量数据如下所示。
第八讲 平稳时间序列与单位根过程一、随机时间序列模型概述在严格意义上,随机过程{}t X 的平稳性是指这个过程的联合和条件概率分布随着时间t 的改变而保持不变。
在实践中,我们更关注弱意义上的平稳或者所谓的协方差平稳:2();();(,)t t t t j j E X Var X Cov X X μδδ+===显然20δδ=。
在本讲义中,平稳皆指协方差平稳。
当上述条件中的任意一个被违背时,则称{}t X 是非平稳的。
(一)平稳随机过程的例子1、白噪声过程{}t ε: 20()0;();(,)0,t t t t j j E Var Cov εεδεε+≠===2、AR(1)过程:011,11t t t y a a y a ε<-=++,{}t ε是白噪声过程为了验证上述过程满足平稳性条件,我们首先通过迭代得到:110110010t t i i t i i i t t y a a a y a ε---===++∑∑。
接下来注意到,10101)0(t i i t t E y a a a y -==+∑,进一步假设数据生成过程发生了很久,即t 趋于无穷大,则01)1(t a E y a μ-==;其次也有110()()t it ii t Var y Var a ε--==∑,当t 趋于无穷大时,21221()11()i t Var a a Var y εδ-=-=;最后,当t 趋于无穷大时,有:1211111111222 (124111121)......(...)[()()][()()]s s t t s t s t t s t s t s t t s s s s s a a a a a E y y E a a a a a μμδδεεεεεεε+-----------++--+++++++++++=== 关于AR(p)过程的平稳性,见附录。
3、MA(P)过程:11...p t t t p t y a a εεε--=+++,{}t ε是白噪声过程 显然,任意有限阶MA 过程都是平稳的。
练习:对于00():,1,t i t i i MA y βεβ∞-=∞==∑{}t ε是白噪声过程,请指出平稳性条件。
关于ARMA(p,q)过程的平稳性,见附录。
(二)非平稳随机过程的例子1、随机游走:1t t t y y ε-=+,其中{}t ε是白噪声过程注意到11210...ti t t t t t t i y y y y εεεε=---=+=++==+∑ ,故有:0()t E y y =、2()t t Var y δ=。
显然,随着时期的延伸其方差趋于无穷大,因此随机游走属于非平稳过程。
对于过程:1t t t y y με-=++,其中{}t ε是白噪声过程。
该过程被称为带漂移的随机游走。
显然这也是一个不平稳的数据生成过程。
笔记:1、有效市场理论认为股票价格应当是一个随机游走过程。
在随机游走模型中,{}t ε是白噪声过程,0(,)0,t t j j Cov εε+≠=,因此有效市场理论的含义也即是股票价格变动(1t t t p p ε--=)是不可预测的。
按照有效市场理论,股票价格能够及时吸纳消息,因此,如果下一时刻价格与现在价格确实存在差异,那么导致这个价格差异的消息就现在时刻来说是无法预测的,否则,现在价格将马上变动从而使价格差异消失。
2、在财富(预期未来现金流的贴现)给定的情况下,最优的消费计划是现在消费与下一期消费相等(饿一等饱一等显然不是最优)。
如果下一期消费与现在的消费确实存在差异,那么导致这个差异的原因(也许是飞来横财)在现在肯定是不知道的,否则现在的消费将作出调整,并做到现在消费与下一期消费相等。
按照上述逻辑,消费将是一个随机游走过程。
以上是Hall(1978)的消费随机游走理论。
2、单位根过程:1t t t y y ε-=+, {}t ε是平稳过程显然随机游走是单位根过程的特例。
另外,我们还可以在上述模型基础上增加截距项或者时间趋势项,如:00111t t t t t t y y y t y βεββε++--=+=++ 上述过程都属于单位根过程。
笔记:按照附加预期的菲利普斯曲线理论:通胀率=预期的通胀率-a (失业率-自然失业率)+供给冲击。
失业率与自然失业率的差异(即周期性失业率)与供给冲击一般是平稳的。
假定人们采取静态预期,即预期通胀率等于过去一年的实际通胀率,则通胀率=过去一年的通胀率+平稳性变量,故基于一些假定我们可以从理论上表明通胀率是一个单位根过程。
3、趋势平稳过程:01t t y t ββε=++, {}t ε是平稳过程 由于01)(t E y t ββ=+随时间的变化而变化,故该过程是不平稳的。
然而,对变量剔除时间趋势之后我们将得到一个平稳的过程。
因此,上述模型被称为趋势平稳过程。
趋势平稳过程在剔除时间趋势之后显示出平稳性。
而对过程:1t t t y y ε-=+,其中t ε平稳,故t t y ε∆=,即通过对变量取差分,我们可以得到一平稳序列,这样的过程被称为差分平稳过程。
只要我们在分析时注意纳入时间趋势变量,趋势平稳过程基本上不会对传统的计量分析构成威胁。
而单位根过程才是对传统计量分析的真正威胁。
事实上,在计量经济学文献中,非平稳过程常常被作为单位根过程的同义词。
二、为什么考察数据生成过程的平稳性十分重要?对于两个不平稳的变量,即使从理论上看两者毫无联系,但实证中我们常常会发现两者具有“显著”的相关关系,此即“伪相关”问题,在回归分析中这被称为“伪回归”。
另外,当变量含有单位根时,我们通常所利用的一系列统计检验,如t检验与F检验,经常会失效,因为t统计量或者F统计量此时很可能并不服从标准的t分布或者F分布。
三、如何基于样本数据判断过程的平稳性?(一)通过折线图粗略判断如果样本数据表现出均值回复的态势,那么可初步判断数据生成过程是平稳的(应该注意到,对于趋势平稳过程,其均值具有确定性的时间趋势)。
如果样本数据表现出持久偏离均值的态势,则初步判断数据生成过程是非平稳的。
(二)利用相关图如果样本自相关函数表现出拖尾性,而偏自相关函数表现出截尾性,我们可以初步判断数据生成过程是平稳的AR 过程;如果样本自相关函数表现出截尾性,而偏自相关函数表现出拖尾性,我们可以初步判断数据生成过程是MA 过程;如果样本自相关函数表现出拖尾性,而偏自相关函数也表现出拖尾性,我们可以初步判断数据生成过程是平稳的ARMA 过程。
(三)单位根检验考虑模型:1t t t y y ρε-=+ 其中t ε是白噪声。
模型可以被改写为:1t t t y y λε-∆=+其中1λρ=-。
单位根检验等价于检验λ是否为零。
该检验是一个单尾检验,我们不考虑ρ>1的情况。
因为该情况意味着时间序列是爆炸性。
该检验的假设体系是:1::0(1)0(1)H H λρλρ=⇔=<⇔< 与往常一样,我们利用t 统计量来进行检验。
然而,在原假设下,此时的t 统计量并不服从t 分布,而是服从DF 分布,为了强调这一点,一般把这里的t 统计量改称为τ统计量。
如果计算出的τ值小于临界值(临界值是一个负数),则在某个显著水平下拒绝原假设,反之则不拒绝原假设。
上述检验被称为DF 检验。
在DF 检验中,初始模型的误差项是白噪声,然而实际情况可能并不如此。
此时,应该重新建立模型,以保证误差项是白噪声。
新的检验模型是:11pii t t t i t y y y v λθ=+--∆=+∆∑ t i y -∆的引入就是为了使新的误差项是白噪声。
上述检验单位根的方法被称为扩展的DF 检验(ADF 检验)。
显然,DF 检验模型是ADF 检验模型的特例。
笔记:1、为什么引入众多t i y -∆项就可以达到使新的误差项是白噪声这个目的?考虑模型1t t t y y λε-∆=+,其中t ε序列相关。
假定t ε服从一个AR (1)过程:1t v t t ρεε=+-,其中t v 是白噪声。
当原假设为真(0λ=)时,有:11t t v v t t t y y ρρε+=+--∆=∆。
可以发现,新模型的误差项是白噪声;同时,新模型中的解释变量包含有原模型被解释变量(t y ∆)的一阶滞后(1t y -∆)。
推广:当t ε服从一个AR (p )过程时,通过引入t i y -∆(i=1,2…,p ),新模型的误差项将是白噪声。
但一个问题是,为什么要用AR (p )过程来表示误差项?这是因为,即使误差项服从ARMA 或者MA 过程,但它们都可以被表示成无限阶的AR 过程。
对于平稳过程而言,这个无限阶AR 过程中的(滞后变量前面)系数是收敛于零的。
因此,只要p 够大,那么AR (p )就是对无限阶AR 过程的良好近似。
2、如何确定p 值呢?此时,我们可以先选择一个较大的p 值,然后利用通常的t 检验来判断t p y -∆所对应估计系数的显著性,如果不显著,则确定最大的滞后数为p-1。
总而言之,最终所确定的p 值应该使t p y -∆所对应估计系数是显著的。
在实践中我们通常是利用一些信息准则来确定p 值。
例如,(1)SIC(Schwarz information criterion)准则:估计任意模型,记RSS 为残差平方和,K 为待估计参数个数,T 为样本容量,则log log(/)SIC TRSS T T K =∙+按照SIC 准则,p 值的确定应该使SIC 最小。
(2)AIC(Akaike information criterion)准则:2log(/)AIC RSS T T K =∙+按照AIC 准则,p 值的确定应该使AIC 最小。
(3)HQIC(Hannan-Quinn information criterion)准则:2log(log )log(/)HQIC T RSS T TK =∙+ 按照HQIC 准则,p 值的确定应该使HQIC 最小。
利用不同的信息准则可能得到的结果并不一致,Stock & Watson(Second Edition,p561) 建议利用AIC 准则确定p 值。
3、理解信息准则。
如果仅以残差平方和最小为模型设定的标准,那么纳入更多的解释变量就可以迎合这个标准。
然而,实这将付出代价——自由度降低。
因此,在设定模型时存在一个权衡,而SIC 与AIC 准则不过就是权衡的规则(事实上我们已经涉及到一个规则,即以调整的R 2最大为权衡的规则,回忆一下,该规则是否考虑了残差平方和与自由度这两个因素?)。
应该注意到,在SIC 中,K 与log /T T 相乘,而在AIC 中,K 与2/T 相乘。
一般来说,log /2/T T T >,因此,SIC 准则比AIC 准则更加重视自由度不足问题,于是根据SIC 准则一般会得到更加简约的模型。