异方差与自相关广义线性模型
- 格式:doc
- 大小:1.13 MB
- 文档页数:47
ccc-garch广义自回归条件异方差模型什么是广义自回归条件异方差模型(GARCH)?广义自回归条件异方差模型(Generalized Autoregressive Conditional Heteroskedasticity Model,简称GARCH模型)是一种用于描述时间序列数据中异方差性的模型。
GARCH模型是由Engle在1982年首次提出的,是对传统的自回归条件异方差模型(ARCH)的改进和扩展。
GARCH模型是一种统计模型,可以通过对数据序列进行拟合来捕捉其异方差性。
在金融学中,GARCH模型常常被用于建立金融资产价格的波动模型,从而用于风险管理和金融衍生品的定价等方面。
GARCH模型的原理是基于以下两个主要假设:第一,时间序列数据存在自回归关系,即当前观测值与过去的观测值相关;第二,时间序列数据的方差存在自回归条件异方差的特性,即方差的变动与过去的方差相关。
GARCH模型可以通过对这种自回归关系进行建模来预测未来的波动情况。
GARCH模型的一般形式可以表示为:\[r_t = \mu + \epsilon_t = \mu + \sigma_t \cdot z_t\]其中,\(r_t\)是时间序列数据的观测值,\(\mu\)是均值,\(\epsilon_t\)是误差项,\(\sigma_t\)是方差,\(z_t\)是一个标准正态分布随机变量。
GARCH模型的关键是对方差进行建模,一种常用的方式是使用ARCH效应和GARCH效应。
ARCH效应是指方差与过去的观测值相关,可以表示为:\[\sigma_t^2 = \alpha_0 + \sum_{i=1}^{p} \alpha_i \epsilon_{t-i}^2\]其中,\(\alpha_0\)是常数,\(\alpha_i\)是ARCH参数,\(p\)是ARCH阶数。
ARCH效应通过利用过去的观测值来预测当前的方差。
GARCH效应是指方差与过去的预测误差相关,可以表示为:\[\sigma_t^2 = \alpha_0 + \sum_{i=1}^{p} \alpha_i \epsilon_{t-i}^2 +\sum_{j=1}^{q} \beta_j \sigma_{t-j}^2\]其中,\(\beta_j\)是GARCH参数,\(q\)是GARCH阶数。
多重共线性、异方差、自相关的检测与模型修正从《国家统计数据库》找到了自1978—2008年我国人均居民消费、人均国内生产总值、居民消费价格指数、前期人均居民消费、城镇居民人均可支配收入以及农村居民人均纯收入的官方数据。
以此来分析我国人均消费的影响因素以及它们具体是如何对消费产生影响的。
1978—2008年我国人均消费及其影响因素相关数据城镇居民农村居民人均居民人均国内居民消费前期人均年份人均可支人均纯收消费生产总值价格指数居民消费配收入入343 134 1978 184 381 100.7 165405 160 1979 208 419 101.9 184477 191 1980 238 463 107.5 208501 223 1981 264 492 102.5 238535 270 1982 288 528 102 264564 310 1983 316 583 102 288652 355 1984 361 695 102.7 316739 398 1985 446 858 109.3 361901 424 1986 497 963 106.5 4461002 463 1987 565 1112 107.3 4971180 545 1988 714 1366 111.8 5651373 602 1989 788 1519 118 7141510 686 1990 833 1644 103.1 7881701 709 1991 932 1893 103.4 8332027 784 1992 1116 2311 106.4 9322577 922 1993 1393 2998 114.7 11163496 1221 1994 1833 4044 124.1 13934283 1578 1995 2355 5046 117.1 18334839 1926 1996 2789 5846 108.3 23555160 2090 1997 3002 6420 102.8 27895425 2162 1998 3159 6796 99.2 30025854 2210 1999 3346 7159 98.6 31596280 2253 2000 3631 7858 100.4 33466859 2366 2001 3886 8622 100.7 36317703 2476 2002 4143 9398 99.2 38868472 2622 2003 4474 10542 101.2 41439422 2936 2004 5031 12336 103.9 447410493 3255 2005 5572 14053 101.8 503111759 3587 2006 6263 16165 101.5 557213786 4140 2007 7255 19524 104.8 626315781 4761 2008 8348 23648 105.9 7255来自《国家统计数据库》设定如下形式的计量经济模型1:=++++ Y,X,,,X,Xi33i24124其中,Y为人均居民消费 , X2为人均国内生产总值 , X3为居民消费价格指数 , X4为前期人均消费。
《计量经济学》中多重共线性、异方差性、自相关三者之间的联系与区别首先我们先来回顾一下经典线性回归模型的基本假设:1、为什么会出现异方差性我们可以从一下两方面来分析:第一,因为随即误差项包括了测量误差和模型中被省略的一些因素对因变量的影响;第二,来自不同抽样单元的因变量观察值之间可能差别很大。
因此,异方差性多出现在截面样本之中。
至于时间序列,则由于因变量观察值来自不同时期的同一样本单元,通常因变量的不同观察值之间的差别不是很大,所以异方差性一般不明显。
含义及影响:y=X β+ε,var(εi )var(εj ), ij ,E(ε)=0,或者记为212200['|]0000n E X σεεσσ⎛⎫⎪=Ω= ⎪ ⎪⎝⎭即违背假设3。
用OLS 估计,所得b 是无偏的,但不是有效的。
111(')'(')'()(')'b X X X y X X X X X X X βεβε---==+=+由于E(ε)=0,所以有E(b )=β。
即满足无偏性。
但是,b 的方差为1111121var(|)[()()'][(')''(')|] (')'['|](') (')'()(')b X E b b E X X X X X X X X X X E X X X X X X X X X X ββεεεεσ------=--===Ω其中212200['|]0000n E X σεεσσ⎛⎫⎪=Ω= ⎪ ⎪⎝⎭2、自相关产生的原因:(1)、经济数据的固有的惯性带来的相关 (2)、模型设定误差带来的相关 (3)、数据的加工带来的相关 含义及影响:cov(,)0,i j i j εε≠≠影响:和异方差一样,系数的ls 估计是无偏的,但不是有效的。
D -W 检验(Durbin -Watson )221212222121212222112112122211221122121()()()2()()222222(1)n i i i n i i n n n i i i i i i i n i i n n n i i i i i i i n n i i n i i i nn n i i i i nn i ie e d e e e e e e e e e e e e e e e e e e e e e e ρρ=-===-=-====-==-===∑-=∑∑+∑-∑=∑∑+∑-∑--=∑∑+=--∑∑+=--∑≈-其中2121n i i i n i ie e e ρ=-=∑=∑是样本一阶自相关函数。
第三章 异方差与自相关广义线性模型本章继续讨论线性模型Y =X β+ε, E (ε)=0 (3.0.1)所不同在于以前的关于误差方差的假定是Var(ε)=σ2I n (3.0.2)这一章逐次推广讨论。
第一节讨论异方差的存在与检验,尤其是在经济模型资料中的存在与影响,第二节讨论的是n i diag Var i n ,,1,),,,()(2221 ==σσσε已知(3.0.3) 2221222222212121,),,,,,,,,,()(σσσσσσσσε diag Var =未知 (3.0.4) )e xp (),,,()(2221ασσσεi i n Zdiag Var '== ,α未知(3.0.5)这些都是误差方差为对角阵的模型。
第三节讨论自相关线性模型。
首先讨论的是残差一阶自回归线性模型,它的残差满足i i i υρεε+=-1(3.0.6) )(,0)(,)(,0)(22j i E E E j i i i ≠===υυσυυ(3.0.7)此时残差εi 的方差虽不为对角阵,但只含一个参数。
接着我们介绍自回归条件异方差(ARCH)模型,它的误差假设是i p i p i i υεαεααε++++=--221102(3.0.8) )(,0)(,)(,0)(22j i E E E j i i i ≠===υυσυυ(3.0.9)因为模型计算中用到了广义矩估计方法(GMM),我们在第四节又介绍了GMM 。
第五节讨论的是22,0)(σσε>=M Var 未知,M 已知(3.0.10)第六节讨论的是22,0)(σσε≥=M Var 未知,M 已知(3.0.11)所讨论的内容还是各种回归模型、算法及性质。
第一节 异方差的存在与检验一、异方差的存在与影响前面介绍的线性回归模型,都是假定随机误差项εi独立同分布,有相同的方差(Homoscedasticity)2)( ,0)(σεε==i i Var E(3.1.1)但是实际抽样很难保证这一点。
经济对象千差万别,可以按不同标准划分成不同的群体。
这些群体间的差别导致样本方差不一致,于是就有所谓异方差(Heteroscedasticity):2)( ,0)(i i i Var E σεε==(3.1.2)反映在散点图上,如下图可以明显看出样本方差与点 (X i , Y i )有关,随着样本数值增大而增大。
图3.1.1.1由于样本方差的差异,原来最小二乘估计的一些优良性质不再存在。
如在一元线性回归n i X Y i i i ,,1 ,10 =++=εββ(3.1.3)我们知道最小二乘估计∑∑∑===-=---==ni i XXi n j ini i iXXXY Y S XX X XY Y X XS S 11211)())((ˆβ (3.1.4)∑=⎥⎦⎤⎢⎣⎡--=-=ni i XX i Y S X X X n X Y 110)(1ˆˆββ (3.1.5)于是)()()ˆ(211i n i XX i Y Var S X X Var ⎪⎪⎭⎫ ⎝⎛-=∑=β(3.1.6))()(1)ˆ(210i n i XX i Y Var S X X X nVar ⎪⎪⎭⎫ ⎝⎛⎥⎦⎤⎢⎣⎡--=∑=β (3.1.7)现在Var(Y i )不是常量,我们就无法证明01ˆ,ˆββ是最小方差线性无偏估计。
显著性检验也成了问题。
原来构造的F 统计量是分子分母都含有未知参数σ2, 可以分别提取公因式再约去,现在是异方差,按原来方法构造的F 统计量里的未知参数无法直接约去,预测精度也无法保证。
差不多原来推导的各种统计方法、统计性质由于基础动摇而都需重新考虑。
因此我们需要将一般线性回归模型推广。
不过在推广之前,首先要解决异方差的检验问题。
二、异方差的检验异方差的检验一般需要比较大的样本,一般都是作所谓残差分析。
图3.1.2.1最简单直观的方法是将残差平方ˆeYˆ YˆYˆ Yˆn i Y Y e ii i ,,1 ,)ˆ(ˆ22 =-=(3.1.8)与iY ˆ画在一张图上,大致可以看出残差是否发生改变。
图3.1.2.1除了第1个图外,其余图像都指示有异方差。
还有一些方法对异方差问题作统计检验。
1. Park 检验R. E. Park 建议将2i σ看作解释变量X 的函数,并使用函数形式为ie X i i υβσσ22=(3.1.9)或取对数i i i X υβσσ++=ln ln ln 22其中i υ是随机分布项。
因为2i σ未知,就用残差项的平方2ˆi e代替 i i i X eυβσ++=ln ln ˆln 22 对上式作回归,并作假设检验。
若β=0成立,则认为异方差不成立;若β≠0成立,则认为异方差成立。
Park 检验要作两次最小二乘,第一次是对原始资料对(X i , Y i ), 获得i ie Y ˆ,ˆ;第二次是对(2ˆ,i i eX )。
从某种意义上讲,是用第二次最小二乘去否定第一次最小二乘,用第二次假设去否定第一次假设。
类似的还有Glejser 检验,不过使用的回归方程不一样。
2. Breusch Pagan Godfrey (BPG)检验这里考虑的是多元问题,基本思想差不多。
设原始资料满足模型i mi m i i X X Y εβββ++++= 110(3.1.10)先用普通最小二乘获得i ie Y ˆ,ˆ,作 ∑∑==-==n i ii n i i Y Y n e n 12122)ˆ(1ˆ1~σ (3.1.11)注意这里不是∑=---=ni i i Y Y m n 122)ˆ(11ˆσ。
然后定义变量22~/ˆσi i ep =(3.1.12)用p i 与X ji 去作回归i mi m i i X X p υααα++++= 110(3.1.13)而获得回归平方和S ES , 定义统计量∑=-==Θni i i ES p pS 12)ˆ(2121 (3.1.14)可以证明在正态假设下,当样本容量充分大时,Θ有渐近分布:)(,~21∞→Θ-n m χ(3.1.15)于是对给定显著性水平,当Θ超过2χ分布的临界值时,就拒绝同方差假设,接受异方差假设。
算例3.1.2 消费-收入异方差资料的BPG 检验在文献[1]里,收有一组消费(Y )与收入(X )的资料,共60对,要求作异方差检验。
表3.1.2 消费 (Y ),收入 (X ) 资料Y X Y X Y X 55. 80. 152. 220. 95. 140. 65. 100. 144. 210. 108. 145. 70. 85. 175. 245. 113. 150. 80. 110. 180. 260. 110. 160. 79. 120. 135. 190. 125. 165. 84. 115. 140. 205. 115. 180. 98. 130. 178. 265. 130. 185. 95. 140. 191. 270. 135. 190. 90. 125. 137. 230. 120. 200. 75. 90. 189. 250. 140. 205. 74. 105. 55. 80. 140. 210. 110. 160. 70. 85. 152. 220. 113. 150. 75. 90. 140. 225. 125. 165. 65. 100. 137. 230. 108. 145. 74. 105. 145. 240. 115. 180. 80. 110. 175. 245. 140.225.84.115.189.250.120. 200. 79. 120. 180. 260. 145. 240. 90. 125. 178. 265. 130.185.98.130.191.270.当然在计算机数据文件里它是排成2列,而不是6列。
使用我们自编的异方差检验程序,算得原始资料回归方程为ii X Y 6378.02903.9ˆ+= (3.1.16)再将p i 对X i 回归,得方程i i X p0101.07426.0ˆ+-= (3.1.17)程序算得统计量2140.5=Θ(3.1.18)从程序自带的电子数表上查得)1(299.0χ=6.6349,因为5.2140<6.6349,故在0.01的显著性水平,不认为异方差存在,于是有了进一步回归分析的可能。
当取显著性水平为0.05时,)1(295.0χ= 3.8414,于是认为异方差存在,就只打印一般最小二乘回归结果,不能作出基于正态同方差的统计检验。
实际计算执行过程如下,由于F 统计量高达4722,再看拟合效果图 (图3.1.2.2),(I Y i ,)与(I Y i,ˆ)确实拟合非常好。
很难想象这里面还会有什么问题。
下面是计算过程与结果。
------------------------------------------------------------------------------------------------------------------------- 异方差资料 BPG 检验计算程序, 例 3.1.2. 第一列为 Y , 以后各列为 X 例312.D 数据文件中, n=60, M=1要显示原始资料吗? 0=不显示, 1=显示 (0)原始资料回归方程 : Y = b0 + b1*X1 + ... + bm*Xm 回归系数b0,b1,b2, 9.2903 .6378 .0000 残差平方和: 4722.31 回归平方和: 83773.38 误差方差的估计 : .0000 标准差 = 8.8716 请输入卡方检验的置信水平 (0.01)BPG 检验结果: 显著性水平: .01 统计量 5.2140卡方临界值: 6.6349 方差资料回归方程 : Pi = a0 + a1*X1 + ... + am*Xm 回归系数a0,a1,a2, -.7426 .0101 .0000 残差平方和: 97.82 回归平方和: 20.86 误差方差的估计 : .0000 标准差 = 1.2768BPG 检验通过, 不认为有异方差, 对原始资料进行一般回归分 析并打印计算结果现在作线性回归显著性检验, 计算t,F,R 统计量请输入显著性水平a, 通常取a=0.01, 0.05, 0.10, a=? (0.01)-----------------------------------------------------线性回归分析计算结果样本总数60 自变量个数 1-----------------------------------------------------回归方程Y = b0+b1*X1+...+b1*X1Y = 9.2903 + .6378 X1回归系数b0, b1, b2, ..., b19.2903 .6378-----------------------------------------------------残差平方和: 4722.31 回归平方和: 83773.38误差方差的估计: 78.7051 标准差= 8.8716-----------------------------------------------------线性回归显着性检验显著性水平: .010-----------------------------------------------------回归方程整体显著性F检验, H0:b0=b1=...=b1=0F统计量: 1028.9160 F临界值F(1, 58) 7.093全相关系数R : .9730-----------------------------------------------------回归系数逐一显著性t检验, H0:bi=0, i=1,...,1t 临界值t( 58) 2.3924回归系数b1-b 1的t值: 7.6158-----------------------------------------------------要作回归预测吗? 键入0=不预测, 1=要预测(0)要打印拟合数据吗? 0=不打印, 1=打印(0)计算结束。