第六章 自相关
- 格式:doc
- 大小:298.00 KB
- 文档页数:10
第六章 自相关§6.1 自相关一. 概念:经典假定4 cov(,)0,()i j u u i j =≠,不被满足,称i u 存在自相关或序列相关。
自 相关主要存在于时间序列中。
自相关又分为正自相关和负自相关,其主要表现是: 正自相关:当某个0t u >时,随后若干项12,,t t u u ++⋅⋅⋅⋅⋅⋅都有大于零的倾向; 当某个0t u <时,随后若干项12,,t t u u ++⋅⋅⋅⋅⋅⋅都有小于零的倾向。
负自项关:相邻两项的符号有相反的倾向。
在时间序列中,t u 的符号信息对以后各期都有一定的影响,即跨期的扰动项序列相关(经济数据中居多)。
所以在实际工作中,以正自相关较为常见。
二. 产生自相关的原因:1. 许多经济变量是时间序列,此时不能认为u 无自相关;2. 非重要因素归入随机误差项,而这些因素又有自相关的情况;3. 一些重大偶然事件对经济的冲击,往往要延续一段时间;4. 模型本身设置的不正确。
三. 自相关强度的度量------自相关系数1. 自相关的阶:一阶自相关:t u 只与1t u -(之前一期)有关,1()t t u f u -=; 二阶自相关:t u 与12,t t u u --(之前两期)有关,12(,)t t t u f u u --= s 阶自相关:t u 与之前s 期有关,12(,,,)t t t t s u f u u u ---=⋅⋅⋅⋅⋅⋅一般情况下,以研究一阶自相关为主。
因为相邻两期的影响最强且一阶的形式也比较简单。
这时通常假定是一阶线性自相关。
2. 自相关系数:若假定是一阶线性自相关,则自相关形式为1t t t u u v ρ-=+且11ρ-<<ρ是常数,可称为(一阶)自相关系数;t v 是一个新的随机项且满足所有经典假定,即 2~(0,)t v v N σ ()0t t E v v '= ()t t '≠()0s t E u v = ()t s >这样自相关形式就是一个不含常数项的线性模型,ρ就是回归参数,可用OLS 法估计ρ:12212nt t t nt t u uuρ-∧=-==∑∑1nt t u u-≈∑ (当n 很大时,22122n nt t t t u u-==≈∑∑)这完全符合相关系数的计算表达,所以称ρ为自相关系数是合理的。
第六章 自相关一、什么是自相关及其来源 二、自相关的后果三、自相关的检验 四、自相关的修正五、应用实例6.1自相关的概念及其来源例如:研究中国工业总产值指数(Y )和国有企业工业总产值指数(X )的关系,利用1977年至1997年的历史资料,运用OLS 方法得到如下模型。
2ˆ0.0568 1.0628(37.8666)(0.3502)(0.0015)(3.0348)0.32650.37679.2099t t Y X t R DW F =+====给定显著性水平a=0.05,自由度为19,查t 分布表得0.025(19) 2.093t =。
以模型的计算结果t=3.0348,且0.025(19)t t >,表明t X 对t Y 的影响比较显著,但可决系数并不理想。
这种情况下,随机扰动项之间有可能存在序列自相关。
一、自相关的概念自相关(auto correlation )又称序列相关(serial correlation ),是指总体回归模型的随机误差项i u 之间存在的相关关系。
更一般的,自相关是指某一随机变量在时间上与其滞后项之间的相关。
经典回归模型中,曾假定随机误差项无自相关,即i u 在不同观测点之间是不相关的。
(,)(,)0()i j i j Cov u u E u u i j ==≠如果该假设不成立,就称i u 与j u 存在自相关,即不同观测点上的误差项彼此相关。
二、自相关产生的原因 1)经济系统的惯性。
自相关现象大多出现在时间序列数据中,其本期值往往受滞后值影响,突出特征就是惯性和低灵敏度。
例如:居民总消费函数模型01(1,2,,)t t tC Y u t n ββ=++=总消费受收入(t Y )的影响,事实上消费也受消费习惯的影响。
把消费习惯并列随机扰动项中,就可能出现序列相关性。
2)经济行为的滞后性例如,基础设施的建设需要一定的建设周期,那么产出效益的发挥有一定滞后时间。
第六章 自相关(序列相关)§1 自相关的涵义一、自相关的概念回归模型中随机扰动项的逐项相关,即(,)(,)()0 (t s, s,t T)t s t s t s Cov Y Y Cov u u E u u ==≠≠∈ 多重共线性和异方差既可出现于时间序列数据,也可于横截面数据。
而序列相关则存在与用时间序列数据建立的模型中。
二、自相关的模式⎧⎧⎪⎨⎨⎩⎪⎩一阶线性自相关线性自相关自相关高阶线性自相关非线性自相关(一)一阶线性自相关12White Noise ()0()(,)0 (t s)t t tt t t t s u u E Var Cov ερεεεεσεε-=+=⎧⎪=⎨⎪=≠⎩其中为白噪声(),即(二)高阶线性自相关 以二阶为例1122,t t t t t u u u ρρεε--=++其中为白噪声一般形式为p 阶1122,t t t p t p t t u u u u ρρρεε---=++++其中为白噪声§2 自相关的产生原因和后果一、 自相关的产生原因 (一)经济现象固有的惯性 (二)模型的设定偏误 (三)数据处理的影响 二、 自相关的后果(一) 参数估计量仍然是线性无偏的(二) 参数估计量不再具有最小方差性(OLS 低估真实方差)(三) 参数的显著性检验失效§3 自相关的判断一、图示法1t t te e e t --⎧⎨-⎩作图作图二、游程检验三、Durbin-Watson 检验 (一) 适用条件(二) D-W 统计量的构造21221()nt t t ntt e e d e-==-=∑∑(三) D-W 统计量与自相关系数的关系22222111112222222211122212212111222221122()(2)222222nnnnntt tt t t tt t t t t t t t nnnt t t t t t nnntt tt t t nnnt t t t t t t t nn t t t t e eeee e eee e d e e e eee e e e e ed e e -----========-===---===--==-+-+-==≈≈-∴==-=∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑=在大样本条件下,有ˆ2ˆ12dρρ-=-或(四) DW 检验的判别标准d=0.121(五) DW 检验的局限性 四、LM 检验根据定义,p 阶自相关可表述为:()1122 711t t t p t p t t u u u u ρρρεε---=++++-教材其中为白噪声存在上述自相关时,回归模型01122......t t t k kt t Y X X X u ββββ=+++++可记为()011221122...... 712t t t k kt t t p t p t Y X X X u u u ββββρρρε---=+++++++++-教材LM 检验为:012112:0:p p H H ρρρρρρ====,,不全为零原假设成立时()2LM nR p χ=若卡方统计量大于临界点,或者其概率值低于给定的α,应当拒绝原假设,认定存在p 阶线性自相关。
第六章自相关一、填空题1. 回归模型残差序列的自相关指。
2. 以时间序列数据为样本建立起来的计量经济模型中的随机误差项往往存在较严重的__________。
3. D.W统计量与一阶自相关系数的关系是。
4. 建立线性回归模型,进行D.W检验,如果α=5%,填写下表空格:D.W统计量是否存在自相关序号样本容量n解释变量个数(不含截距项)k1 252 0.832 30 5 1.243 50 8 1.984 60 6 3.725 200 20 1.615. 残差序列自相关的型式有两种:、和。
6. 识别模型残差项自相关型式的工具是,也就是计算残差序列的自相关系数(AC)和偏自相关系数(PAC)。
7. 用自相关图识别模型残差序列的自相关型式,如果AC函数拖尾,PAC函数截尾,则残差序列可建立型自相关。
如果PAC函数拖尾,AC函数截尾,则残差序列可建立型自相关。
如果AC、PAC函数都拖尾,则建立型自相关。
二、选择题1.若回归模型中的残差项存在一阶自回归形式的自相关,则估计模型参数应采用()。
A.普通最小二乘法(OLS)B.加权最小二乘法(WLS)C.广义差分法(GLS)D.工具变量法(IV)2.用于检验残差序列一阶自相关的DW统计量的取值范围是( )。
A. 0≤ DW ≤1B.-1≤ DW ≤1C.-2 ≤ DW ≤2D.0≤ DW ≤ 43.已知DW统计量的值接近于2,则样本回归模型残差的一阶自相关系数 近似为()。
A.0B.-1C.1D.0.54.已知样本回归模型残差的一阶自相关系数接近于-1,则DW统计量近似等于( )。
A.0B.1C.2D.45.在给定的显著性水平之下,若DW 统计量的上、下临界值分别为U d 和L d ,则当L d <DW <U d 时,可认为随机误差项( )。
A.存在一阶正自相关B.存在一阶负相关C.不存在序列相关D.存在序列相关与否不能断定6.某企业的生产决策是由模型t t t u P S ++=10ββ描述(其中t S 为产量,t P 为价格),又知:如果该企业在t-1期生产过剩,决策者会削减t 期的产量。
由此判断上述模型存在( )。
A. 异方差问题B. 序列自相关问题C. 多重共线性问题D. 随机解释变量问题7. 对于模型u X Y +=β,若存在残差序列自相关,同时存在异方差,即有0)(=u E ,Ω='='2)()(u u u E u u Cov σ,则广义最小二乘法随机误差项的方差—协方差矩阵是一个( )。
A.奇异阵B.单位阵C.长方形矩阵D.对称阵8.用矩阵形式表示的广义最小二乘参数估计量为Y X X X b 111)(---Ω'Ω'=,此估计量为( )。
A.有偏、有效的估计量B.有偏、无效的估计量C.无偏、无效的估计量D.无偏、有效的估计量9.采用广义最小二乘法关键的一步是得到随机误差项的方差—协方差矩阵Ω,这就需要对原模型βX Y =,首先采用( )以求得随机误差项的近似估计量,从而构成矩阵Ω的估计量( )。
A.一阶差分法B.广义差分法C.普通最小二乘法D.Durbin 两步法三、简答题1.简述序列相关性的含义。
其产生的原因是什么?2.简述序列相关性的后果。
3.列举序列相关性的检验方法。
4.DW 检验的局限性主要有哪些?5.简述自相关性检验方法的共同思路。
6. 科克兰内-奥长特(Cohrane-Orcutt )两步法)。
7.如何用广义差分法解决自相关问题。
8.什么是虚假自相关?如何避免虚假自相关问题。
9.若回归模型的随机误差项可能存在q (1>q )阶自相关,应采用什么检验?其检验过程和检验统计量是什么?四、实践题1.某地消费基金、GDP 使用额、平均人口数资料如下:要求:(1)用OLS 法建立二元线性回归方程,估计有关参数,并对其做经济意义解释和说明; (2)对得出的二元回归方程进行拟合程度检验、t 检验、F 检验,并说明各自的经济意义; (3)进行D.W 检验;(4) 设第13年X1=67,X2=58,应用该回归模型进行区间预测。
(0.05()(123)222.26n m t t α--==)2. 下表给出了美国1960-1995年36年间个人实际可支配收入X 和个人实际消费支出Y 的数据。
注:资料来源于Economic Report of the President ,数据为1992年价格。
要求:(1)用OLS 法估计收入—消费模型;t t u X Y ++=221ββ(2)检验收入—消费模型的自相关状况(5%显著水平);(3)用适当的方法消除模型中存在的问题。
3. 下表给出了中国进口需求(Y )与国内生产总值(X )的数据。
1985~2003年中国实际GDP 、进口需求 单位: 亿元 年份 实际GDP (亿元)X 实际进口额(亿元)Y 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 19998964.40 9753.27 10884.65 12114.62 12611.32 13090.55 14294.88 16324.75 18528.59 20863.19 23053.83 25267.00 27490.49 29634.75 31738.822543.2 2983.4 3450.1 3571.6 3045.9 2950.4 3338.0 4182.2 5244.4 6311.9 7002.2 7707.2 8305.4 9301.3 9794.82000 2001 2002 200334277.92 36848.76 39907.21 43618.5810842.5 12125.6 14118.8 17612.2注:表中数据来源于《中国统计年鉴2004》光盘。
实际GDP 和实际进口额均为1985年可比价指标。
要求:(1)检测进口需求模型 t t t u X Y ++=21ββ 的自相关性; (2)采用科克伦-奥克特迭代法处理模型中的自相关问题。
参考答案 一、填空题1.残差的当前值与其自身的过去值之间的相关关系;2.自相关;3. d≈2(1-ρ) ;4. 存在一阶正自相关、不确定、不存在自相关、存在一阶负自相关、不确定;5.AR(p)、MA(q)、ARMA(p,q);6.相关分析;7.AR 型、MA 型、ARMA 型。
二、选择题1.C;2.D;3.A;4.D;5.D;6.B;7.D;8.D;9.D三、问答题1.答:对于模型i ik k i i i u X X X Y +++++=ββββ 22110, i=1,2,…,n 随机误差项互相独立的基本假设表现为: 0),(=j i u u C o v , i≠j ,i,j =1,2,…,n如果对于不同的样本点,随机误差项之间不再是完全互相独立,而是存在相关关系,即 0),(≠j i u u C o v , i≠j ,i,j=1,2,…,n 则认为出现了自相关性。
2.答:(1)参数估计量仍然具有无偏性,但非有效,在大样本情况下仍不具有一致性;(2)变量的显著性检验失去意义; (3)模型的预测失效。
3.答:图示检验法、回归检验法、冯诺曼比检验法、D.W 检验等。
后三种方法的共同思路是:首先采用OLS 法估计模型,以求得残差项的近似估计e 。
图示检验法。
有两种图示检验法。
其一是绘制1,-t t e e 的散点图,观察散点的分布状态,判断自相关的形式和性质。
其二是绘制t e 随时间变化的散点图。
如果t e 随时间的变化呈现有规律的变化,比如锯齿型或循环型,则认为t e 序列存在自相关。
如果t e 随时间的变化不断改变符号,则判断t e 之间存在负自相关。
如果t e 随时间的变化并不频繁地改变符号,而是几个正的后面跟几个负的,则判断t e 之间存在正自相关。
回归检验法。
即是以e 为被解释变量,以各种可能的相关量,比如以221 , ,t t t e e e --等为解释变量,建立各种方程:t t t e e ερ+=-1,t t t t e e e ερρ++=--2211,…对各方程进行估计并进行显著性检验,如果存在某一函数形式,使得方程显著性成立,则说明原存在序列相关性。
具体应用时须反复试算。
回归检验法的优点在于一旦确定了模型存在自相关,也就指导了相关的形式,而且这种方法适合于任何学时的自相关问题的检验。
冯诺曼比检验法。
该法在于构造冯诺曼统计量:∑∑==----ni ini i i ne en e e 12221/)()1/()(当样本容量足够大时(大于30),该统计量近似服从正态分布。
计算该统计量的值,将它与具有正态分布的理论分布进行比较,如果大于临界值,表示不存在序列相关,如果小于临界值,表示存在序列相关。
德宾-瓦特森(Durbin-Watson )检验(D-W 检验)。
该检验主要用于探测一阶自相关形式t t t u u ερ+=-1的存在性。
该检验的原假设0:0=ρH ,备择假设0:1≠ρH ,检验统计量为的d 。
∑∑∑∑===--=-+=nt tnt nt t t t n t t ee e ee d 2222121222d 与ρ的关系为:)1(2ρ-≈d 。
d 的取值范围为40≤≤d 。
查D-W 分布表,可知在样本容量为n,解释变量个数为k,显著性水平为α时的临界值U L d d ,。
若0<d <L d ,则存在正自相关;若4-L d <d <4,存在负自相关; 若U d <d <4-U d ,不存在自相关;若L d <d <U d ,4-U d <d <4-L d ,为不能确定区间。
4. 答:在图示检验法、回归检验法、冯诺曼比检验法、D.W 检验方法中,D.W 检验最具有应用价值。
但其应用必须具有以下条件:(1)回归模型必须含有截距项; (2)解释变量必须是非随机的;(3)解释变量中不能包含被解释变量的滞后期; (4)不能用于联立方程模型中各方程组的自相关检验; (5)只适用于随机误差项存在一阶自回归形式的自相关检验;(6)DW 检验存在两个不能确定是否存在自相关的范围,目前还没有比较好的解决办法。
5. 答:由于自相关性,相对于不同的样本点,随机误差项之间不再是完全互相独立,而是存在相关关系,那么检验自相关性,也就是检验随机误差项之间的相关性。
各种检验方法就是在这个思路下发展起来的。
6. Cohrane-Orcutt 迭代法。
如果自相关系数ρ未知,采用迭代法估计模型。
设原回归模型为:t t t t t t u u u X Y ερββ+=++=-110 ,(1)对模型进行OLS 估计得e )1(1,e )1(2…e )1(n ,计算)1(ρ。