计量经济学课件:第六章-自相关性
- 格式:doc
- 大小:432.00 KB
- 文档页数:13
计量经济学第六章自相关自相关是计量经济学中一种重要的现象,它指的是一个变量与其自己在过去时间点上的相关性。
自相关在实证研究中十分常见,对经济学家来说,了解和掌握自相关性质是至关重要的。
1. 引言自相关作为计量经济学的一项基础概念,是经济学研究中不可或缺的一个重要方法。
自相关性的存在通常会引起回归结果的偏误,而忽略自相关性可能导致估计不准确的结果。
因此,探讨自相关性的性质和应对方法是计量经济学的重点之一。
2. 自相关的定义和表示自相关是指一个变量与其自身在过去时间点上的相关性。
假设我们有一个时间序列数据集,其中变量yt表示一个时间点上的观测值,t表示时间索引。
自相关系数可以通过计算观测值yt与其在过去某一时间点上的观测值yt-k(k为时间滞后期数)的相关性来得到。
数学上,自相关系数可以用公式表示为:ρ(k) = Cov(yt, yt-k) / (σ(yt) * σ(yt-k))其中,ρ(k)表示第k期的自相关系数,Cov表示协方差,σ表示标准差。
3. 自相关性的性质自相关性具有以下几个性质:3.1 一阶自相关性一阶自相关性是指变量值yt与前一期的观测值yt-1之间的相关性。
一阶自相关系数ρ(1)通常用来检验时间序列数据是否存在自相关性。
若ρ(1)大于零且显著,则表明存在正的一阶自相关性;若ρ(1)小于零且显著,则表明存在负的一阶自相关性。
3.2 高阶自相关性除了一阶自相关性,时间序列数据还可能存在高阶自相关性。
高阶自相关性是指变量值yt与过去第k期的观测值yt-k之间的相关性。
通过计算不同滞后期的自相关系数ρ(k),可以了解数据在不同时间跨度上的自相关性情况。
3.3 异方差自相关性异方差自相关性是指时间序列数据中的方差不仅与自身相关,还与过去观测值的相关性有关。
异方差自相关性可能导致在回归分析中的标准误差失效,从而产生无效的回归结果。
因此,在处理存在异方差自相关性的数据时要采取合适的修正方法。
4. 自相关性的检验方法在实证研究中,经济学家通常使用多种方法来检验数据中的自相关性,常用的方法包括:4.1 Durbin-Watson检验Durbin-Watson检验是一种常用的检验自相关性的方法,其基本思想是通过检验误差项的相关性来判断自相关是否存在。
第六章自相关性6.1 自相关性:6.1.1. 非自相关假定由第2章知回归模型的假定条件之一是,Cov(u i, u j) = E(u i u j) = 0, (i, j∈T, i≠j), (6.1)即误差项u t的取值在时间上是相互无关的。
称误差项u t非自相关。
如果Cov (u i,u j ) ≠ 0, (i≠j)则称误差项u t存在自相关。
自相关又称序列相关。
原指一随机变量在时间上与其滞后项之间的相关。
这里主要是指回归模型中随机误差项u t与其滞后项的相关关系。
自相关也是相关关系的一种。
6.1.2.一阶自相关自相关按形式可分为两类。
(1)一阶自回归形式当误差项u t只与其滞后一期值有关时,即u t = f (u t - 1) + v t称u t具有一阶自回归形式。
(2) 高阶自回归形式当误差项u t的本期值不仅与其前一期值有关,而且与其前若干期的值都有关系时,即u t = f (u t– 1, u t– 2 , …u t– p ) + v t则称u t具有P阶自回归形式。
通常假定误差项的自相关是线性的。
因计量经济模型中自相关的最常见形式是一阶自回归形式,所以下面重点讨论误差项的线性一阶自回归形式,即u t = α1 u t -1 + v t(6.2)其中α1是自回归系数,v t 是随机误差项。
v t 满足通常假设E(v t) = 0, t = 1, 2 …,T,Var(v t) = σv2, t = 1, 2 …,T,Cov(v i , v j ) = 0, i ≠ j , i , j = 1, 2 …, T , Cov(u t -1, v t ) = 0, t = 1, 2 …, T ,依据普通最小二乘法公式,模型(6.2)中 α1 的估计公式是,1ˆa= ∑∑=-=-Tt t Tt t t u u u 22121(1ˆβ=∑---2)())((x x x x y y t t t ) (6.3)其中T 是样本容量。
计量经济学第六章自相关在计量经济学的学习中,自相关是一个重要且颇具挑战性的概念。
自相关,简单来说,就是指在时间序列或横截面数据中,观测值之间存在的某种相关性。
想象一下,我们在研究某个经济变量随时间的变化情况,比如一家公司的销售额。
如果在不同的时间段,销售额的变化不是相互独立的,而是存在一定的关联,这就可能出现了自相关现象。
自相关产生的原因多种多样。
其中一个常见的原因是经济变量的惯性。
例如,消费者的消费习惯往往具有一定的延续性,不会突然发生巨大的改变。
这就导致消费数据在不同时期可能存在相关性。
另一个可能的原因是模型设定的不准确。
如果我们在构建计量经济模型时,遗漏了某些重要的解释变量,那么残差项就可能包含这些被遗漏变量的影响,从而导致自相关。
自相关的存在会给我们的计量经济分析带来一系列问题。
首先,它会影响参数估计的有效性。
在存在自相关的情况下,传统的最小二乘法(OLS)估计得到的参数估计值不再是最优的,估计的方差也会被低估,这可能导致我们对参数的显著性做出错误的判断。
其次,自相关会使我们对模型的假设检验失效。
假设检验是基于一定的统计分布进行的,如果存在自相关,这些分布就不再适用,从而导致检验结果的不可靠。
那么,如何检测自相关呢?常用的方法有图形法、杜宾瓦特森(DurbinWatson)检验等。
图形法是通过绘制残差的序列图来直观地观察是否存在自相关。
如果残差呈现出某种周期性或趋势性,那么就可能存在自相关。
杜宾瓦特森检验则是一种基于统计量的检验方法。
它通过计算一个特定的统计量,并与临界值进行比较来判断是否存在自相关。
如果经过检测发现存在自相关,我们就需要采取相应的方法来处理。
一种常见的方法是广义最小二乘法(GLS)。
GLS通过对原模型进行变换,使得变换后的模型不存在自相关,从而得到更有效的参数估计。
另外,还可以使用一阶差分法。
这种方法将原变量的一阶差分作为新的变量进行回归分析,从而消除可能存在的自相关。
第六章 自相关性本章教学要求:本章是违背古典假定情况下线性回归描写的参数估计的又一问题。
通过本章的学习应达到:掌握自相关的基本概念,产生自相关的背景;自相关出现对模型影响的后果;诊断自相关存在的方法和修正自相关的方法。
能够运用本章的知识独立解决模型中的自相关问题。
经过第四、五、六章的学习,要求自行选择一个实际经济问题,建立模型,并判断和解决上述可能存在的问题。
第一节 自相关性的概念一、一个例子研究中国城镇居民消费函数,其中选取了两个变量,城镇家庭商品性支出(现价)和城镇家庭可支配收入(现价),分别记为CSJTZC 和CSJTSR ,时间从1978年到1997年,n=20。
但为了剔除物价的影响,分别对CSJTZC 和CSJTSR 除以物价(用CPI 表示),这里CPI 为城镇居民消费物价指数(以1990年为100%),经过扣除价格因素以后,记CPICSJTSRX CPICSJTZCY ==即如下表回归以后得到的残差为Dependent Variable: YMethod: Least SquaresDate: 10/27/04 Time: 09:39Sample: 1978 1997Included observations: 20Std. Error t-Statistic Prob.Variable CoefficientC-103.369278.80739-1.3116690.2061X0.9235510.01603357.603880.00003939.341 R-squared0.994605Mean dependentvarAdjusted R-squared0.994305S.D. dependent var2124.467S.E. of regression160.3247Akaike info criterion13.08692Sum squared resid462671.9Schwarz criterion13.18649Log likelihood -128.8692 F-statistic 3318.207 Durbin-Watson stat1.208037 Prob(F-statistic)0.000000二、什么是自相关性在引出自相关性的概念之前,根据建立中国城镇居民储蓄函数,经用最小二乘法估计出参数后,得到残差序列,由此画出残差图(残差序列自身的关系),从图形上看存在t e 对1 t e 的线性关系,残差的这种现象说明了什么?下面给出序列自相关的定义。
第六章 自相关性本章教学要求:本章是违背古典假定情况下线性回归描写的参数估计的又一问题。
通过本章的学习应达到:掌握自相关的基本概念,产生自相关的背景;自相关出现对模型影响的后果;诊断自相关存在的方法和修正自相关的方法。
能够运用本章的知识独立解决模型中的自相关问题。
经过第四、五、六章的学习,要求自行选择一个实际经济问题,建立模型,并判断和解决上述可能存在的问题。
第一节 自相关性的概念一、一个例子研究中国城镇居民消费函数,其中选取了两个变量,城镇家庭商品性支出(现价)和城镇家庭可支配收入(现价),分别记为CSJTZC 和CSJTSR ,时间从1978年到1997年,n=20。
但为了剔除物价的影响,分别对CSJTZC 和CSJTSR 除以物价(用CPI 表示),这里CPI 为城镇居民消费物价指数(以1990年为100%),经过扣除价格因素以后,记CPICSJTSRX CPICSJTZCY ==即如下表回归以后得到的残差为Dependent Variable: YMethod: Least SquaresDate: 10/27/04 Time: 09:39Sample: 1978 1997Included observations: 20Std. Error t-Statistic Prob.Variable CoefficientC-103.369278.80739-1.3116690.2061X0.9235510.01603357.603880.00003939.341 R-squared0.994605Mean dependentvarAdjusted R-squared0.994305S.D. dependent var2124.467S.E. of regression160.3247Akaike info criterion13.08692Sum squared resid462671.9Schwarz criterion13.18649Log likelihood -128.8692 F-statistic 3318.207 Durbin-Watson stat1.208037 Prob(F-statistic)0.000000二、什么是自相关性在引出自相关性的概念之前,根据建立中国城镇居民储蓄函数,经用最小二乘法估计出参数后,得到残差序列,由此画出残差图(残差序列自身的关系),从图形上看存在t e 对1 t e 的线性关系,残差的这种现象说明了什么?下面给出序列自相关的定义。
1、如果模型中的随机误差项i u ,满足以下关系式 s t u u Cov s t ≠≠,0),( 则随机误差项i u 之间存在自相关性。
2、一阶线性自相关。
在s t u u Cov s t ≠≠,0),(中,如果1s t =-,则 ,0),(1≠-t t u u Cov并且t u 与1-t u 之间为线性关系,即t t t u u ερ+=-1,其中t ε满足古典假定,即ρεεσεεε,,0)(,)(,0)(22s t E E E s t t t ≠===<1。
将t u 与1-t u 的这种线性关系称为一阶线性自相关(或一阶线性自回归),简称一阶自相关(或一阶自回归)。
3、一阶线性自回归的数学性质。
设一元线性模型为t t t u X Y ++=21ββ并且,t t t u u ερ+=-1,其中t ε满足ρεεσεεε,,0)(,)(,0)(22s t E E E s t t t ≠===<1。
设总体一阶序列自相关系数为 )var()var(),cov(11--=t t t t u u u u ρ按照样本相关系数计算公式,样本序列自相关系数为ˆe eρ=另一方面,对一阶线性自回归t t t u u ερ+=-1,求参数ρ的最小二乘估计,即12212ˆnt t t nt t e eeρ-=-='=∑∑在大样本下,有ˆˆρρ'≈。
因此,通常可用ˆρ'表示ρˆ。
t u 的数学特性:(1)0)(=t u E 事实上,.,,,)1(1211r t r t r t t t t t t t u u u u u u -+------+=+=+=ερερερΛ将递推关系逐一代入,并注意当0→r 时,0→-r t r u ρ,则∑∞=------------=++++===+++=++=++=+=0332211232122121)()(r rt r t t t t t t t t t t t t t t t t t u u u u u ερερερρεεερεερρερερεερρερΛΛ0()()()()0,(()0)rrr t t r t r t r t r r r E u E E E E ρερερεε∞∞∞---========∑∑∑(2)2221)var(σρσε=-=t u[]2222221112222211222()()()()(2)()()()(()0)()1t t t t t t t t t t t t t t t t Var u E u E u E u E u E u u E u E Var u E u Var u εερερρεερερσεσσρ-----=-==+=++=+=+===-在t ε满足22()0,(),()0,,t t t s E E E t s εεεσεε===≠t ε服从正态分布,且ρ<1。
有23123231232222322223()()()()()()(1)1t t t t t t t t t Var u Var Var Var Var Var εεεεεεερερερεερερερεσρσρσρσσσρρρρ------=++++=++++=++++=++++=-L L LL LL L(3)2),cov(σρs s t t u u =-按照协方差的定义,可类似推出上述结果。
三、自相关产生的原因1、经济变量大多存在惯性的作用。
如经济变量随时间运动往往存在趋势的作用,使得变量在变化中具有惯性特征。
2、许多经济变量具有滞后性的表现。
3、一些随机偶然因素的干扰或影响。
4、设定偏倚。
与异方差性情况类似。
5、蛛网现象模型。
这是农产品与农产品价格所固有的一种关系,即当期农产品的产出量与前期的农产品价格有关,用公式表示为)(1-=t s t p f Q 6、时间序列更易产生自相关性。
第二节 自相关性的后果从统计意义上讲,并参考异方差性的情况,自相关性对模型的影响主要有以下几方面。
一、在自相关存在的前提下,参数估计的统计特性 1、参数估计仍是无偏的。
设线性回归模型为t t t u X Y ++=21ββ其样本回归函数中参数的最小二乘估计分别为21ˆ,ˆββ,有 11)ˆ(ββ=E 22)ˆ(ββ=E其证明可参见在第五章中异方差存在的条件下,参数估计仍是无偏的。
2、参数估计不再具有方差最小性。
在自相关下,由第五章异方差对参数估计影响的说明,有[]()∑∑∑∑∑∑∑∑∑∑∑∑∑∑=+=+=⎪⎪⎪⎭⎫ ⎝⎛+=⎪⎪⎭⎫ ⎝⎛=⎪⎪⎭⎫ ⎝⎛-+=-=-=≠=≠=≠222222222222222222222222222*2)ˆ()()(2)()(2)()(2ˆ)ˆ(ˆ)ˆ(iiji j i j i i i j i ji j i j i i i i j i j i j i j i i i i i i i i i xVar x u u E x x x x u u E x x u E x x u u x x u x E x u x E x u x E E E E Var σβσβββββββ在无自相关下,有比较上述两式,可以很明显看到,如果随机误差序列存在正的自相关,则)ˆ(*2βVar >)ˆ(2βVar 。
三、2ˆσ严重低估了2σ。
四、参数的显著性检验失效。
五、预测精度降低。
需要注意的问题,比较多重共线性与异方差、自相关在预测应用中有不同的情况。
如果模型中存在多重共线性,但变量符合经济意义,并且线性结构保持不变,则这个时候可以利用模型进行预测;如果模型中存在的是异方差和自相关问题,则不能利用模型进行预测(为什么?)。
第三节 自相关的检验一、图示法。
1、利用t e 对1-t e 的散点图进行判断。
(1)当散点大部分落在一、三象限时,则表明随机误差存在正自相关。
(2)当散点大部分落在二、四象限时,则表明随机误差存在负自相关。
2、利用t e 对时间t 的折线图进行判断。
(1)当t e 随t 逐次而变动时,t e 开始为正,随后几个也为正;t e 出现负值,随后几个也出现负值,则随机误差存在正自相关。
(2)当t e 随t 逐次而变动时,t e 不断地改变符号,则随机误差存在负自相关。
二、D-W 检验法该方法为Durbin J 和Watson G S (1951)基于残差序列t e 与1-t e 之间的相关系数ρˆ提出检验ρ的D-W 统计量。
1、D-W 检验的适用条件。
(1) 解释变量非随机。
(2)t u ~t t t u u ερ+=-1,且t ε满足基本假定。
(3)线性回归模型不存在如下形式 t t t t u Y X Y +++=-1321βββ如果出现这种情况,应用Durbin-H 检验,将在第七章介绍。
2、D-W 统计量的构成。
(1)提出假设:0:;0:10≠=ρρH H(2)构造D-W 检验统计量,记为d ,即∑∑--=-≈211ˆ),ˆ1(2t t t eee d ρρ其中。
推导过程见教科书。
3、运用D-W 检验判断一阶自相关的区域。
(1)当0ˆ=ρ时,d=2,则t u 无一阶自相关。
(2)当1ˆ=ρ时,d=0,则t u 有完全一阶正自相关。
(3)当1ˆ-=ρ时,d=4,则t u 有完全一阶负自相关。
(4)通常情况下,当ρˆ<1时,有0<d <4。
当d 落在0到4范围内时,有如下判断区域:当0<d <d L 时,存在一阶正自相关; 当d L <d <d U 时,不能判定存在自相关; 当d U <d <4-d U 时,不存在一阶自相关; 当4-d U <d <4-d L 时,不能判定存在自相关; 当4-d L <d <4时,存在一阶负自相关。
4、运用D-W 检验应注意的问题。
(1)由教科书上的图形可知,在d=2的附近,有一个较大的无自相关区域,所以通常当d 在2的左右时,可以不用查表就判断出随机误差不存在自相关。
(2)D-W 检验存在不能判定区域,这时可以用扩大样本容量或改用其它检验方法(如D-W 检验的修正方法,参见教材第167页)。
(3)要求样本容量至少为15,否则很难对自相关的存在作出准确判断。