复旦大学经济学院谢识予计量经济学第三章异方差及自相关广义线性模型
- 格式:doc
- 大小:1.13 MB
- 文档页数:40
《计量经济学》中多重共线性、异方差性、自相关三者之间的联系与区别———经济121班马永政学号:1202010155 首先我们先来回顾一下经典线性回归模型的基本假设:1、为什么会出现异方差性我们可以从一下两方面来分析:第一,因为随即误差项包括了测量误差和模型中被省略的一些因素对因变量的影响;第二,来自不同抽样单元的因变量观察值之间可能差别很大。
因此,异方差性多出现在截面样本之中。
至于时间序列,则由于因变量观察值来自不同时期的同一样本单元,通常因变量的不同观察值之间的差别不是很大,所以异方差性一般不明显。
含义及影响:y=X β+ε,var (εi )≠v ar(εj), i ≠j ,E(ε)=0,或者记为212200['|]0000n E X σεεσσ⎛⎫⎪=Ω= ⎪ ⎪⎝⎭即违背假设3。
用OL S估计,所得b 是无偏的,但不是有效的。
111(')'(')'()(')'b X X X y X X X X X X X βεβε---==+=+由于E(ε)=0,所以有E(b )=β。
即满足无偏性。
但是,b 的方差为1111121var(|)[()()'][(')''(')|] (')'['|](') (')'()(')b X E b b E X X X X X X X X X X E X X X X X X X X X X ββεεεεσ------=--===Ω其中212200['|]0000n E X σεεσσ⎛⎫⎪=Ω= ⎪ ⎪⎝⎭2、自相关产生的原因:(1)、经济数据的固有的惯性带来的相关 (2)、模型设定误差带来的相关 (3)、数据的加工带来的相关 含义及影响:cov(,)0,i j i j εε≠≠影响:和异方差一样,系数的l s估计是无偏的,但不是有效的。
第三章 异方差与自相关广义线性模型本章继续讨论线性模型Y =X β+ε, E (ε)=0 ()所不同在于以前的关于误差方差的假定是Var(ε)=σ2I n ()这一章逐次推广讨论。
第一节讨论异方差的存在与检验,尤其是在经济模型资料中的存在与影响,第二节讨论的是n i diag Var i n ,,1,),,,()(2221 ==σσσε已知()2221222222212121,),,,,,,,,,()(σσσσσσσσε diag Var =未知 ())ex p(),,,()(2221ασσσεi i n Z diag Var '== ,α未知()这些都是误差方差为对角阵的模型。
第三节讨论自相关线性模型。
首先讨论的是残差一阶自回归线性模型,它的残差满足i i i υρεε+=-1() )(,0)(,)(,0)(22j i E E E j i i i ≠===υυσυυ()此时残差εi 的方差虽不为对角阵,但只含一个参数。
接着我们介绍自回归条件异方差(ARCH)模型,它的误差假设是i p i p i i υεαεααε++++=--221102() )(,0)(,)(,0)(22j i E E E j i i i ≠===υυσυυ()因为模型计算中用到了广义矩估计方法(GMM),我们在第四节又介绍了GMM 。
第五节讨论的是22,0)(σσε>=M Var 未知,M 已知()第六节讨论的是22,0)(σσε≥=M Var 未知,M 已知()所讨论的内容还是各种回归模型、算法及性质。
第一节 异方差的存在与检验一、异方差的存在与影响前面介绍的线性回归模型,都是假定随机误差项εi 独立同分布,有相同的方差 (Homoscedasticity)2)( ,0)(σεε==i i Var E()但是实际抽样很难保证这一点。
经济对象千差万别,可以按不同标准划分成不同的群体。
这些群体间的差别导致样本方差不一致,于是就有所谓异方差(Heteroscedasticity):2)( ,0)(i i i Var E σεε==()反映在散点图上,如下图可以明显看出样本方差与点 (X i , Y i )有关,随着样本数值增大而增大。
一、判断题,并说明理由1.若误差项不服从正态分布,OLS仍然无偏2.点估计比区间估计更精确,所以点估计比区间估计更有效3.异方差是由定式误差引起的,与数据无关4.扩大因子是用来判别异方差的5.用一阶段差分法处理自相关会使误差项的方差变大6.如果一个联立方程组中的一个方程包含了所有的内生变量,那么这个方程一定不可别(看清啊,是内生变量)7.分布滞后模型和自回归模型可以相互转换二、联立方程中的一个为 Wt=aRt bIt ut另一个方程含有Rt、It、Et、Pt,其中Et、Pt为外生变量,讨论上述参数的估计方法三、个体异质性和时间异质性的来源﹑对回归分析的影响和克服处理方法四、有Yt=B1 B2Xi e,Xi因为观察原因数据全部扩大为原来的两倍,问是否会改变参数的估计量的数值,t统计量,Y的拟合度和残差,为什么?五、看一张残差图分析问题和处理六、Y=a bX cZ e数据为Y 23 31 35 37 43 46 57 66 76 80X 10 20 30 40 50 60 70 80 90 100Z 10 30 50 70 90 110 130 150 170 190问:用这个方程做回归效果如何?能得到哪些参数值?用最小二乘法估计参数一、判断。
(5*5m)1.参数的t显著性检验要求参数估计量一定要服从正态分布。
2.若误差项不服从正态分布,OLS仍然无偏。
3.如果虚拟假设不能拒绝,那么一定真实。
4.异方差是由定式误差引起的,与数据无关。
5.如果误差项的方差大,参数估计值的方差也大。
二、10分误差项的作用,以及与残差的关系。
模型为 Yi=a bX1i cX2i ui 当数据扩大2倍时,残差和拟和度有何变化:当X 增大3个单位,又有何影响。
四、填空。
10分Y=#0.0000 #0.0000XSE=(#0.000) ( )t=( ) (#0.0000)评价回归结果。
五、10分。
当分析结果如下列情况时,问可能出现的问题,并说出你的理由和建议。
第三章 异方差与自相关广义线性模型本章继续讨论线性模型Y =X β+ε, E (ε)=0 (所不同在于以前的关于误差方差的假定是Var(ε)=σ2I n (这一章逐次推广讨论。
第一节讨论异方差的存在与检验,尤其是在经济模型资料中的存在与影响,第二节讨论的是n i diag Var i n ,,1,),,,()(2221 ==σσσε已知(2221222222212121,),,,,,,,,,()(σσσσσσσσε diag Var =未知()e xp (),,,()(2221ασσσεi i n Zdiag Var '== ,α未知 (这些都是误差方差为对角阵的模型。
第三节讨论自相关线性模型。
首先讨论的是残差一阶自回归线性模型,它的残差满足i i i υρεε+=-1( )(,0)(,)(,0)(22j i E E E j i i i ≠===υυσυυ(此时残差εi 的方差虽不为对角阵,但只含一个参数。
接着我们介绍自回归条件异方差(ARCH)模型,它的误差假设是i p i p i i υεαεααε++++=--221102( )(,0)(,)(,0)(22j i E E E j i i i ≠===υυσυυ(因为模型计算中用到了广义矩估计方法(GMM),我们在第四节又介绍了GMM 。
第五节讨论的是22,0)(σσε>=M Var 未知,M 已知(第六节讨论的是22,0)(σσε≥=M Var 未知,M 已知(所讨论的内容还是各种回归模型、算法及性质。
第一节 异方差的存在与检验一、异方差的存在与影响前面介绍的线性回归模型,都是假定随机误差项εi独立同分布,有相同的方差(Homoscedasticity)2)( ,0)(σεε==i i Var E(但是实际抽样很难保证这一点。
经济对象千差万别,可以按不同标准划分成不同的群体。
这些群体间的差别导致样本方差不一致,于是就有所谓异方差(Heteroscedasticity):2)( ,0)(i i i Var E σεε==(反映在散点图上,如下图可以明显看出样本方差与点 (X i , Y i )有关,随着样本数值增大而增大。
图由于样本方差的差异,原来最小二乘估计的一些优良性质不再存在。
如在一元线性回归n i X Y i i i ,,1 ,10 =++=εββ(我们知道最小二乘估计∑∑∑===-=---==ni i XXi n j ini i iXXXY Y S XX X XY Y X XS S 11211)())((ˆβ (∑=⎥⎦⎤⎢⎣⎡--=-=ni i XX i Y S X X X n X Y 110)(1ˆˆββ(于是)()()ˆ(211i n i XX i Y Var S X X Var ⎪⎪⎭⎫ ⎝⎛-=∑=β()()(1)ˆ(210i n i XX i Y Var S X X X nVar ⎪⎪⎭⎫ ⎝⎛⎥⎦⎤⎢⎣⎡--=∑=β (现在Var(Y i )不是常量,我们就无法证明01ˆ,ˆββ是最小方差线性无偏估计。
显著性检验也成了问题。
原来构造的F 统计量是分子分母都含有未知参数σ2, 可以分别提取公因式再约去,现在是异方差,按原来方法构造的F 统计量里的未知参数无法直接约去,预测精度也无法保证。
差不多原来推导的各种统计方法、统计性质由于基础动摇而都需重新考虑。
因此我们需要将一般线性回归模型推广。
不过在推广之前,首先要解决异方差的检验问题。
二、异方差的检验异方差的检验一般需要比较大的样本,一般都是作所谓残差分析。
图最简单直观的方法是将残差平方n i Y Y e ii i ,,1 ,)ˆ(ˆ22 =-= (与iY ˆ画在一张图上,大致可以看出残差是否发生改变。
图,其余图像都指示有异方差。
还有一些方法对异方差问题作统计检验。
1. Park 检验R. E. Park 建议将2i σ看作解释变量X 的函数,并使用函数形式为ie X i i υβσσ22=(或取对数其中i υ是随机分布项。
因为2i σ未知,就用残差项的平方2ˆi e代替 对上式作回归,并作假设检验。
若β=0成立,则认为异方差不成立;若β≠0成立,则认为异方差成立。
Park 检验要作两次最小二乘,第一次是对原始资料对(X i , Y i ), 获得i ie Y ˆ,ˆ;第二次是对(2ˆ,i i eX )。
从某种意义上讲,是用第二次最小二乘去否定第一次最小二乘,用第二次假设去否定第一次假设。
类似的还有Glejser 检验,不过使用的回归方程不一样。
2. Breusch Pagan Godfrey (BPG)检验这里考虑的是多元问题,基本思想差不多。
设原始资料满足模型i mi m i i X X Y εβββ++++= 110(先用普通最小二乘获得i ie Y ˆ,ˆ,作 ∑∑==-==n i ii n i i Y Y n e n 12122)ˆ(1ˆ1~σ (注意这里不是∑=---=ni i i Y Y m n 122)ˆ(11ˆσ。
然后定义变量 22~/ˆσi i ep = (用p i 与X ji 去作回归i mi m i i X X p υααα++++= 110(而获得回归平方和S ES , 定义统计量∑=-==Θni i i ES p pS 12)ˆ(2121 (可以证明在正态假设下,当样本容量充分大时,Θ有渐近分布:)(,~21∞→Θ-n m χ(于是对给定显著性水平,当Θ超过2χ分布的临界值时,就拒绝同方差假设,接受异方差假设。
算例3.1.2 消费-收入异方差资料的BPG 检验在文献[1]里,收有一组消费(Y )与收入(X )的资料,共60对,要求作异方差检验。
表3.1.2 消费 (Y ),收入 (X ) 资料Y X Y X Y X 55. 80. 152. 220. 95. 140. 65. 100. 144. 210. 108. 145. 70. 85. 175. 245. 113. 150. 80. 110. 180. 260. 110. 160. 79. 120. 135. 190. 125. 165. 84. 115. 140. 205. 115. 180. 98. 130. 178. 265. 130. 185. 95. 140. 191. 270. 135. 190. 90. 125. 137. 230. 120. 200. 75. 90. 189. 250. 140. 205. 74. 105. 55. 80. 140. 210. 110. 160. 70. 85. 152. 220. 113. 150. 75. 90. 140. 225. 125. 165. 65. 100. 137. 230. 108. 145. 74. 105. 145. 240. 115. 180. 80. 110. 175. 245. 140. 225. 84. 115. 189. 250. 120. 200. 79. 120. 180. 260. 145. 240. 90. 125. 178. 265. 130.185.98.130.191.270.当然在计算机数据文件里它是排成2列,而不是6列。
使用我们自编的异方差检验程序,算得原始资料回归方程为ii X Y 6378.02903.9ˆ+= (再将p i 对X i 回归,得方程i i X p0101.07426.0ˆ+-= (程序算得统计量2140.5=Θ(从程序自带的电子数表上查得)1(299.0χ=6.6349,因为5.2140<6.6349,故在0.01的显著性水平,不认为异方差存在,于是有了进一步回归分析的可能。
当取显著性水平为0.05时,)1(295.0χ= 3.8414,于是认为异方差存在,就只打印一般最小二乘回归结果,不能作出基于正态同方差的统计检验。
实际计算执行过程如下,由于F 统计量高达4722,再看拟合效果图 (图,(I Y i ,)与(I Y i,ˆ)确实拟合非常好。
很难想象这里面还会有什么问题。
下面是计算过程与结果。
------------------------------------------------------------------------------------------------------------------------- 异方差资料 BPG 检验计算程序, 例 第一列为 Y , 以后各列为 X 例312.D 数据文件中, n=60, M=1要显示原始资料吗? 0=不显示, 1=显示 (0)原始资料回归方程 : Y = b0 + b1*X1 + ... + bm*Xm 回归系数b0,b1,b2, 9.2903 .6378 .0000 残差平方和: 4722.31 回归平方和: 83773.38 误差方差的估计 : .0000 标准差 = 8.8716 请输入卡方检验的置信水平 (0.01)BPG 检验结果: 显著性水平: .01 统计量 5.2140卡方临界值: 6.6349 方差资料回归方程 : Pi = a0 + a1*X1 + ... + am*Xm 回归系数a0,a1,a2, -.7426 .0101 .0000 残差平方和: 97.82 回归平方和: 20.86 误差方差的估计 : .0000 标准差 = 1.2768BPG 检验通过, 不认为有异方差, 对原始资料进行一般回归分 析并打印计算结果 现在作线性回归显著性检验, 计算t,F,R 统计量请输入显著性水平a, 通常取a=0.01, 0.05, 0.10, a=? (0.01) ----------------------------------------------------- 线 性 回 归 分 析 计 算 结 果样本总数 60 自变量个数 1 ----------------------------------------------------- 回归方程 Y = b0+b1*X1+...+b1*X1 Y = 9.2903 + .6378 X1 回归系数 b0, b1, b2, ..., b19.2903 .6378-----------------------------------------------------残差平方和: 4722.31 回归平方和: 83773.38 误差方差的估计 : 78.7051 标准差 = 8.8716 -----------------------------------------------------线 性 回 归 显 着 性 检 验 显著性水平 : .010 -----------------------------------------------------回归方程整体显著性F 检验, H0:b0=b1=...=b1=0 F 统计量: 1028.9160 F 临界值F(1, 58) 7.093 全相关系数 R : .9730 -----------------------------------------------------回归系数逐一显著性t 检验, H0:bi=0, i=1,...,1 t 临界值 t( 58) 2.3924回归系数b1-b 1的t 值: 7.6158 -----------------------------------------------------要作回归预测吗? 键入 0=不预测, 1=要预测 (0) 要打印拟合数据吗? 0=不打印, 1=打印 (0) 计算结束。