计量经济学第五讲v
- 格式:doc
- 大小:597.50 KB
- 文档页数:22
第五讲 自相关高斯-马尔科夫假定五是:(,)0,i j i j C ovariance i j εεεεδ==≠如果该假定不成立,那么称模型的误差项是序列相关的。
由于序列相关主要针对于时间序列数据,因此,下面把i 改写为t ,样本容量N 改写为T 。
笔记:1、如果基于横截面数据的回归模型其误差项是相关的,则称为空间自相关。
但是要记住,除非观察顺序具有某种逻辑或者经济上的意义,否则,在横截面数据回归中,观察顺序是可以随意的,因此,也许在某种观测顺序下误差项呈现出一种模式的自相关但在另一种观测顺序下又呈现出另外一种模式的自相关。
然而,当我们处理时间序列时,观测服从时间上的一种自然顺序。
2、在经济变量时间序列回归模型中,误差项经常被称之为冲击(Shock )。
对经济系统的冲击经常具有持续性,从而这为误差项序列相关提供了现实依据。
一、 自相关的后果在证明高斯-马尔科夫定理时,我们仅仅在证明OLS 估计量的方差最小(在所有线性无偏估计量中)时用到了序列无关假定,而在证明线性、无偏性并没有用到该假定,因此违背无自相关性假定并不影响线性、无偏性,只影响方差最小性质。
在证明方差最小时,我们分了两步,其中第一步是计算OLS 估计量的方差。
对模型:t 01t t y x ββε=++有:12ˆ12222()()()()(())()()[()]t t t t t t t t tx x Variance x x x x Variance x x Variance x x x x βεδβεε-=+---==--∑∑∑∑∑∑在假定五:0,0t t j j εεδ+=≠下,有:122ˆ222()[()]ttt x x x x βεδδ-=-∑∑如果假定五不成立,那么正确的方差表达式应该是:12ˆ1221122()2()()[()]t t t jT T tt t t j t j t x x x x x x x x βεεεδδδ+--+==-+--=-∑∑∑∑所以, OLS 法下通常的系数估计量方差的表示是错误的。
第五讲 自相关高斯-马尔科夫假定五是:(,)0,i j Cov i j εε=≠如果该假定不成立,那么称模型的误差项是序列相关的。
由于序列相关主要针对于时间序列数据,因此我们把脚标i 改写为t ,把样本容量N 改写为T 。
笔记:1、如果基于横截面数据的回归模型其误差项是相关的,则称为空间自相关。
但是要记住,除非观察顺序具有某种逻辑或者经济上的意义,否则,在横截面数据回归中,观察顺序是可以随意的,因此,也许在某种观测顺序下误差项呈现出一种模式的自相关但在另一种观测顺序下又呈现出另外一种模式的自相关。
然而,当我们处理时间序列时,观测服从时间上的一种自然顺序。
2、在时间序列模型中,误差项经常被称之为冲击(Shock)。
对经济系统的冲击经常具有持续性,从而这为误差项序列相关提供了现实依据。
一、 自相关的后果与仅仅违背同方差假定一样,仅仅违背序列无关假定并不影响OLS 估计量所具有的线性、无偏性、一致性等性质。
在误差项序列相关的情况下,OLS 估计法并没有利用这个信息,故OLS 估计量不是最有效的。
我们下面来推导在误差项序列相关情况下OLS 估计量的方差表达。
假定真实模型是:t 01t t y x ββε=++则12ˆ12222()()()()(())()()[()]t t t t t t t t t x x Var x x x x Var x x Var x x x x βεδβεε-=+---==--∑∑∑∑∑∑ 在假定五:0,0t t j j εεδ+=≠下,有:122ˆ222()[()]t t t x x x x βεδδ-=-∑∑ 但如果假定五不成立,那么正确的方差表达式应该是:12ˆ1221122()2()()[()]t t t j T T t t t t j t j t x x x x x x x x βεεεδδδ+--+==-+--=-∑∑∑∑所以, OLS 法下通常的系数估计量方差的表示是错误的,一般来说它小于真实的方差。
这是因为,对于经济数据来说,正的序列相关是最常见的,因此t t j εεδ+一般为正,而()()t t j x x x x +--一般也是正的。
因此,111()()t t j T T t t t j t j x x x x εεδ+--+==--∑∑一般是大于0的。
计量软件包默认状态下通过公式:1ˆ)(se β=来计算1ˆβ的标准误,其中用22ˆˆ2i N δε=-∑来估计误差项的方差。
利用这个公式的理由在于:在误差项同方差与序列无关假定下有:1ˆ)(sd β=,而22ˆˆ2i N δε=-∑是对2δ的无偏与一致估计估计。
显然,当同方差与序列无关假定中的任意一个不成立时,基于1ˆ)(se β=当序列无关假定被违背时,基于上述公式所计算的标准误很可能低估1ˆβ的真实的标准差(当序列无关假定被违背时,异方差稳健标准误也面临着低估问题,因为该稳健标准误同样是假定误差项序列无关)。
当然,依靠错误的标准误所进行的t 检验也是无效的。
标准的F 检验在序列相关情况下也是无效的。
笔记:1、如果误差项序列相关,即使其他高斯-马尔科夫假定成立,但2RSS/ δ并不服从卡方分布,而2RSS/ δ对于构造F 检验十分重要。
2、模型设定错误很可能是误差项呈现出序列相关性的一个原因。
例如,如果模型遗漏了解释变量,而这些被遗漏的变量是自相关的,则当这些被遗漏变量进入误差项后,误差项将呈现出自相关性。
在实践中,序列相关与异方差一样,也被认为是模型设定错误的信号。
如果产生自相关性的原因是模型设定有误,那么我们首先应该正确设定模型。
二、 发现自相关与异方差检验一样、我们是通过对残差的分析来检验序列无关假定是否被违背。
因此,序列无关检验同样隐含着一个前提,即残差是对误差的良好近似。
而高斯-马尔科夫假定中的假定一、二、三被违背将使得很多检验方法无效。
(一)图示法图一:正序列相关ˆt εˆt ε图二:负序列相关如果残差随着观测顺序的变化并不频繁地改变符号,见图一,则这是误差项序列正自相关的证据;如果残差随着观测顺序的变化频繁地改变符号,则这是误差项序列负自相关的证据,见图二。
笔记:1、与上述图形检验思路一样但更正规的一种检验方式是游程检验(runs test)。
首先记录残差的符号,例如:(++++++++++)(--)(+++++++)(-)(++++++)。
所谓游程是指具有同一符号的一个不间断历程。
在此例中,具有5个游程。
直观来看,如果游程太多,这意味着残差频繁地改变符号,而这是负自相关的证据;反之,如果游程太少,则是正自相关的证据。
我们是用残差来近似作为误差的观测值。
给定观测值的个数,利用Swed & Eisenhart所给出的一定显著水平下关于游程数的两个临界值,我们可以检验误差是独立的这个原假设。
详情可参见相关教科书。
2、在图一中,残差大约在三个位置改变了符号,你也许会问,这不是违背了正序列相关的判断吗?记住!我们发现的正序列相关是统计规律,而统计规律是大部分观测所具有的规律。
(二)Durbin-Watson检验DW检验用来检验误差项是否存在一阶自相关。
首先利用OLS残差ˆt 构造检验统计量:21221ˆˆ()ˆT t t t T t t DW εεε-==-=∑∑ 显然,2211122222211ˆˆˆˆˆˆ22(1)ˆˆT T T T t t t t t t t t t t T T t t t t DW εεεεεεεε---======+-=≈-∑∑∑∑∑∑,而2121ˆˆˆ/T T t t t t t εεε-==∑∑是残差(样本)一阶自相关系数ˆρ的近似,因此,ˆ2(1)DW ρ≈-。
笔记:按照定义,一阶样本自相关系数是:1111ˆˆˆˆ()()ˆT T T t t t t εεεερ----=∑∑∑ 而1221111ˆˆˆ011T T T t t t t t t T T T εεε-===≈≈=--∑∑∑。
应该注意,模型应该带有截距,以保证残差均值为0。
另外,≈≈故2121ˆˆˆ/ˆT T t t t t t εεερ-==≈∑∑。
注意,要使得ˆρ是对误差项一阶自相关系数的恰当近似,我们要求误差项是同方差的。
关于自相关系数所涉及到的一些假设可参见本章 “相关图分析”一节。
如果误差项没有一阶自相关,那么ˆρ应该接近于0,而DW 应该接近于2;如果误差项具有强烈的一阶正自相关关系,即ˆρ接近于1,而DW 应该接近于0;如果误差项具有强烈的一阶负自相关关系,即ˆρ接近于-1,而DW 应该接近于4。
不幸的是,在误差项的一阶自相关系数为零的原假设下,DW 的精确分布取决于解释变量矩阵X 。
然而,Durbin-Watson 证明,DW 的精确分布位于两个极限分布之间。
我们利用这两个极限分布就可以进行检验了。
在实践中,经济变量如果存在自相关,则一般是正自相关,因此,在进行DW 检验时,我们通常利用单侧(左侧)检验(很多教材所所提供的临界值表是针对单侧检验的)。
事实上,如果DW 值超过了4-d L ,这往往是模型错误设定的信号。
笔记:d U d L 4-d U 4-d L2经济变量一般正自相关是针对水平变量而言。
对于差分变量,负自相关在年度时间序列中也是常见的。
这是因为,差分表示变量的变化,如果经济变量在均衡位置上下波动,那么上一期涨幅较大往往意味着在本期将出现回落。
不过对于来自于资本市场的高频时间序列数据,由于冲量效应等原因,差分变量出现正自相关也是正常的。
在单侧检验下,给定显著水平,当l DW d ≤,我们认为误差项是一阶正自相关的;当u l d DW d <≤,则无法判断;当u d DW <,我们认为误差项不存在一阶自相关。
进行DW 检验应该注意的问题是:(1) 该检验用来判断误差项是否是一阶自相关的。
一阶自相关不存在并不一定意味着不存在高阶自相关。
(2)回归模型必须带有截距项以保证残差均值为零;(3)DW 统计量的分布除了取决于解释变量矩阵X 外还依赖于全套的经典线性模型假定。
因此,为了保证DW 检验的有效,其他相关假定的成立也是重要的。
笔记:DW 检验要求同方差假定成立,故在DW 检验之前有必要进行异方差检验。
但在第四讲中我们强调,序列相关检验应放在异方差检验之前。
由此可以看出,DW 检验在实际应用中面临着很大的限制。
幸运的是,有很多其他的序列相关检验方法并不要求同方差假定成立。
由于众多局限,DW 检验并不是现代计量经济学中主流的序列相关检验方法,尽管很多计量软件包在模型估计完成会自动给出DW 值。
(4)解释变量中不能含有滞后因变量。
考虑模型:121t t t t y a b x b y ε-=+++,当t ε与1t ε-相关时,t ε与1t y -是相关的,这违背了标准假定(标准假定是,要么解释变量非随机,要么随机但与误差项无关),此时由OLS 获得的残差并不是对误差良好的近似(此时估计量将是有偏的,且偏差不会随样本的增加而趋于零,即OLS 估计量不是一致估计量)。
事实上,OLS 估计将把误差项所包含的信息价值归功于解释变量,而相应的残差看起来再也不含有价值的信息,因此,此时DW 值经常接近于2,从而具有误导性1。
(5)没有缺失数据。
例如,完整样本是1978-2008年的年度数据,但是,由于某些原因,我们所掌握的样本没有1999年的观测值。
笔记:1 Durbin 针对此情况提出Durbin-h 统计量:/2(1DW h =-h 渐进服从标准正态分布。
由于不能保证21ˆ[()]1T se β<,故该检验具有局限性。
既然ˆ2(1)DW ρ≈-,为什么不基于2121ˆˆˆ/ˆT Tt t t t t εεερ-===∑∑直接进行检验呢?如果考虑回归:1ˆˆˆˆt t v ερε=-+,则 222121/211ˆˆˆˆ/ˆˆˆT T t t t T Tt t t t t t t t ρεεεεεε==-==--=≈∑∑∑∑针对上述回归,利用t 检验不是可以检验ˆρ的显著性吗?这里首先要指出的是,DW 统计量精确地服从DW 分布,尽管DW 分布比较复杂。
而在上述的t 检验中,t 统计量只是渐进服从t 分布(ˆρ是对ρ的一致估计,但不是无偏估计,参考更高级的教科书),换句话说,上述t 检验适用于大样本。
不过基于残差自回归的检验确实具有一定的优点,例如操作简单,并且还可以利用异方差稳健标准误。
但要记住,此时原模型同样不能含有滞后因变量,解释同DW 检验。
我们还可以进行推广,如进行回归:11ˆˆˆ...p t t p t t b b v εεε--=+++,以检验误差项是否具有高阶自回归性质。
(三)Portmanteau 检验定义t ε与t τε-的相关系数为:(,)()()t t t t Cov sd sd τττεεεερ--= 假定2()()0;()()t t t t E E sd sd ττεεεεδ--====(以后我们将知道,上述假定涉及到时间序列平稳性假定),则()()t t t E Var ττεεερ-=。