计量经济学第五讲
- 格式:doc
- 大小:315.00 KB
- 文档页数:13
第五讲 自相关高斯-马尔科夫假定五是:(,)0,i j i j C ovariance i j εεεεδ==≠如果该假定不成立,那么称模型的误差项是序列相关的。
由于序列相关主要针对于时间序列数据,因此,下面把i 改写为t ,样本容量N 改写为T 。
笔记:1、如果基于横截面数据的回归模型其误差项是相关的,则称为空间自相关。
但是要记住,除非观察顺序具有某种逻辑或者经济上的意义,否则,在横截面数据回归中,观察顺序是可以随意的,因此,也许在某种观测顺序下误差项呈现出一种模式的自相关但在另一种观测顺序下又呈现出另外一种模式的自相关。
然而,当我们处理时间序列时,观测服从时间上的一种自然顺序。
2、在经济变量时间序列回归模型中,误差项经常被称之为冲击(Shock )。
对经济系统的冲击经常具有持续性,从而这为误差项序列相关提供了现实依据。
一、 自相关的后果在证明高斯-马尔科夫定理时,我们仅仅在证明OLS 估计量的方差最小(在所有线性无偏估计量中)时用到了序列无关假定,而在证明线性、无偏性并没有用到该假定,因此违背无自相关性假定并不影响线性、无偏性,只影响方差最小性质。
在证明方差最小时,我们分了两步,其中第一步是计算OLS 估计量的方差。
对模型:t 01t t y x ββε=++有:12ˆ12222()()()()(())()()[()]t t t t t t t t tx x Variance x x x x Variance x x Variance x x x x βεδβεε-=+---==--∑∑∑∑∑∑在假定五:0,0t t j j εεδ+=≠下,有:122ˆ222()[()]ttt x x x x βεδδ-=-∑∑如果假定五不成立,那么正确的方差表达式应该是:12ˆ1221122()2()()[()]t t t jT T tt t t j t j t x x x x x x x x βεεεδδδ+--+==-+--=-∑∑∑∑所以, OLS 法下通常的系数估计量方差的表示是错误的。
第三章 回归模型的扩展利用回归分析的估计、检验理论可以建立一个较好的因果关系模型,但是数理统计方法主要适用于研究可控的自然现象,对于无法通过人为控制进行“实验”的社会经济现象,其适用性就受到一定限制。
因此,对于传统的回归分析方法,人们在理论、方法和应用上都有了许多发展。
本章主要讨论三个方面的“扩展”内容:(1)古典回归模型基本假定不成立时所产生的问题;(2)如何反映定性因素的影响;(3)如何反映滞后因素的影响,将静态模型转化成动态模型。
第一节 异方差性古典回归模型包含了若干基本假定,在这些基本假定成立的前提下,应用最小二乘法可以得到无偏、有效的参数估计量,而且可以构造F 检验、t 检验、系数的标准误差等统计量来评价模型的优劣。
但是许多经济现象并不一定都能满足这些假定,这必然会影响回归分析的估计和检验结果。
在古典回归模型的若干假定中间,是不容易成立的是同方差假定、非自相关假定和无多重共线性假定。
因此,在本章的前三节中我们将着重分析这三个假定,并且对每一个假定都依次讨论以下问题: (1)假定的含义及其违反的原因;(2)假定违反时将会产生什么不利影响; (3)如何检验假定是否成立; (4)假定违反时的处理方法。
一、异方差性及其产生的原因 对于线性回归模型i ki k i i i x b x b x b b y ε+++++= 22110同方差假定为:n i D i ,,2,1)(2==σε即对于不同的样本点,随机误差项的离散程度是相同的;如果出现:n i D i i ,,2,1)(2 =≠=常数σε则称模型出现了异方差性(Heteroskedasticity )例如,利用横截面资料建立居民储蓄函数时,对于低收入家庭,其满足基本消费支出之后的剩余收入已经不多,所以各个家庭之间的储蓄存款不会有太大差异;但对于高由入家庭,因受储蓄心理、消费习惯、家庭成员构成等因素的影响,各个家庭之间的储蓄存款可能会有很大差异,即随机误差项的方差会明显地大于低收入家庭。
又如,以总产值作为解释变量建立企业的成本函数时,由于管理水平、生产技术条件等因素的影响,使得同一生产规模的企业有不同的生产成本;但生产规模较小的企业,其生产成本的差异不会很大,而生产规模较大的企业则可能会产生较大的差异,即随机误差项的方差有增大的趋势。
模型产生异方差性主要有以下原因:(1) 模型中遗漏了影响逐渐增大的因素。
例如,储蓄函数中的证券投资、利息、消费者行为等因素;成本函数中的管理水平、生产技术条件和规模效益等因素;消费函数中的家庭财产、消费心理等因素。
(2) 模型函数形式的误差。
如将指数曲线模型误设成了线性模型,则误差有增大的趋势。
(3) 随机因素的影响,如政策变动、自然灾害、金融危机等。
因此,经济分析中经常会遇到异方差性的问题。
而且经验表明,利用横截面数据建立模型时,由于在不同样本点上(解释变量之外)其他因素影响的差异较大,所以比时间序列资料更容易产生异方差性。
二、异方差性的影响模型一旦出现异方差性,将会产生以下不利影响: (一) 最小二乘估计不再是有效估计因为在高斯——马尔可夫定理的证明过程中曾利用了同方差假定,随机误差项为异方差时,OLS 估计仍然是无偏估计,但不再具有最小方差的特性,即存在其他的参数估计方法,其估计误差将小于OLS 估计的误差。
(二) 无法正确估计系数的标准误差以一元线性回归模型为例,在高斯——马尔可夫定理的证明过程中曾经得:∑∑∑∑∑-====+=22222)(/()()()()ˆ(x x )k )(D k k D k b D b D i i i i ii i i σσεεε在同方差情况下在非自相关情况下其中:∑--=2)(/)(x x x x k i i i 。
这样,如果再以2σ的无偏估计量∑-=)2/(ˆ22n e i σ估计2σ,就可以得到b ˆ的标准误差为:xxiS x x bS 222ˆ)(ˆ)ˆ(σσ=-=∑但是,在异方差的情况下,2i σ是一些不同的数,只有估计出每一个2i σ之后才能得到系数的标准误差,这在只有一组样本观察值的情况下是无法做到的。
而且,如果设:),,2,1,0(ˆ22n i i i i =>=λσλσ则在异方差情况下,系数的标准误差为:∑∑∑∑-∙=∙-===xxi i xxi xx i ii i i S x x S S x x k k b S 222222222)(ˆˆ)(ˆ)ˆ(λσσλσλσ因此,如果仍然用xx S /ˆ2σ计算系数的标准误差,将会产生估计偏差;偏差的大小取决于第二个因子值的大小,当其大于1时,则会过低估计系数的误差;反之,则做出院过高的估计。
(三) t 检验的可靠性降低因为在异方差情况下,无法正确估计系数的标准误差)ˆ(bS ,这直接影响到t 统计量值的正确确定。
因为:)ˆ(ˆb S bt =所以用t 检验来判断解释变量影响的显著性将失去意义。
(四) 增大模型的预测误差异方差性的存在一方面使模型夫去了良好的统计性质,另一方面由于随机误差项的方差与模型的预测区间密切相关())ˆ(ˆ),ˆ(ˆ(2/2/b S t b b S t b αα+-,在2iσ逐渐增大的情况下,模型的预测误差也随着增大。
上述分析表明,实际经济总是中经常会出现异方差性,这将直接影响回归模型的估计、检验和应用。
因此,在建立计量经济模型的过程中,应该检验模型是否存在异方差性;如果不存在异方差性(当然要求其他假定也同时成立),则可以用回归分析方法建立模型;否则,应该采用其他的参数估计方法建立模型。
三、异方差性的检验为了检验模型是否存在异方差性,需要事先了解随机误差项取值的概率分布情况。
但是随机误差项的变化是由模型之外其他因素的综合影响来决定,其取值情况是无法观测的。
实际研究中,一般是通过对残差分布情况的分析来推测随机误差项的分布特征,因为残差项i e 描述的也是解释变量之外其他因素的综合影响,可以将其作为随机误差项i ε的估计量。
例1 我国制造工业利润函数。
表3-1列出了1998年我国主要制造工业销售收入与销售利润的统计资料。
现以表3-1数据资料为例,介绍检验异方差性的一些常用方法 (一) 图示检验法1、 相关图分析“方差”即为随机变量取值的离散程度。
由于被解释变量y 与误差项ε的方差相同,因此通过观察y 与x 的相关图,可以分析y 的离散程度与解释变量之间是否存在着相关关系;如果随着x 值的增加,y 的离散程度呈现逐渐增大(或减小)的趋势,则表明模型存在着递增(或递减型)的异方差性。
建立回归模型时,为了判断模型的函数形式,一般要观察被解释变量与解释变量的相关图,此时也可以大致判断模型是否存在异方差性。
图3-1(P72)为销售利润与销售收入的相关图,从图中可以明显看出,随着销售收入的增加,销售利润的平均水平不断提高,但其离散程度同时也在逐步扩大,即呈现出递增型的异方差性。
2、 残差分布图分析建立回归模型之后,在方程窗口中点击Resids 按钮可以得到模型的残差分布图,如果残差分布的离散程度有明显扩大的趋势,则表明存在着异方差性。
注意观察之前需要先将数据关于解释变量排序,命令格式为:SORT X图示检验法只能粗略地判断模型是否存在异方差性,当异方差性不太明显时,还需要采用一些较为精确的检验方法。
(二) 戈德菲尔德——匡特(Goldfeld —Quandt )检验戈德菲尔德检验,简称G —Q 检验,它的原理可以用图3-2直观表示。
图3-2 G —Q 检验原理图为了检验异方差性,将样本按解释变量排序后分成两部分,再利用样本1和样本2分别建立回归模型,并求出各自的残差平方和RSS 1和RSS 2。
如果误差项的离散程度相同(即为同方差的),则RSS 1和RSS 2的值应该大致相同;若两者之间存在显著差异,则表明存在异方差性。
检验过程中为了“夸大”残差的差异性,一般先在样本中部去掉C 个数据(通常取C=n/4),再利用F 统计量判断差异的显著性:12R S S R S S F =~)13()12,12(-------k c n k c n F其中,一般取RSS 1>RSS 2。
K 为参数的个数,对于给定的显著水平α,若αF F>,则表明存在异方差性;反之,则不存在异方差性。
例如,例1中样本数据个数n=28,C=n/4=7,为了使两个子样本的容量相同,从中间去掉8个数据(即取C=8)。
因此,利用EViews 进行G —Q 的具体步骤为: SORT X 将样本数据关于X 排序 SMPL 1 10 确定子样本1LS Y C X 求出RSS1=2579.59 SMPL 19 28 确定子样本2LS Y C X 求出RSS2=63769.67 =63769.67/2579.59 计算出F=24.72 取05.0=α时,查F 分布表得44.3)1110,1110(05.0=----F ,而44.372.2405.0=>=F F ,所以存在(递增的)异方差性。
从检验过程可以看出,G —Q 检验适用于检验样本容量较大、异方差性呈递增或递减的情况,而且检验结果与数据剔除个数C 的选取有关。
(三) 怀特(White )检验White 检验是通过建立辅助回归模型的方式来判断异方差性。
不妨设回归模型为二元线性回归模型:i i i i x b x b b y ε+++=22110则White 检验的具体步骤为:(1) 估计回归模型,并计算残差的平方2i e 。
(2) 估计辅助回归模型:i i i i i i i i v x x a x a x a x a x a a e ++++++=215224213221102即将残差平方关于所有解释变量的一次项、二次项和交叉乘积项进行回归(其中,i v 是满足古典回归模型假定的误差项),实际上还可以引进解释变量的高次项,但这样会使样本的自由度在幅度下降,所以一般只引入二次项;而且在样本容量较小、解释变量个数相对较多的情况下,为了保证自由度,在辅助回归模型中可以省去交叉乘积项。
(3) 计算辅助回归模型的判定系数2R ,可以证明,在同方差的假设下(即假设0:543210=====a a a a a H ),渐近地有:2nR ~)23()(2-q χ其中,自由度q 为辅助回归模型中的自变量个数(此时q=5)。
(4) 对于给定的显著水平α,若)(22q nRαχ>,则拒绝原假设0H ,即认为)0(≠i a i 中至少有一个显著地不等于0,模型存在异方差性;反之,则认为不存在异方差性。
利用EViews 软件可以直接进行White 检验。
例如,对例1的我国制造工业利润函数,White 检验的具体步骤为:(1)建立回归模型: LS Y C X (2)检验异方差性:在方程窗口中依次点击View\Residual Test\White Heteroskedasticity此时可以选择在辅助回归模型中是否包含交叉乘积项(Crossterms ),本例为一元回归模型,辅助回归模型中只有x 和x 2两项,不存在交叉乘积项。