第七节 自相关检验与修正
- 格式:ppt
- 大小:109.51 KB
- 文档页数:12
实验四 -- 自相关性的检验及修正实验四自相关性的检验及修正一、实验目的掌握自相关性的检验与处理方法。
二、实验学时: 2三、实验内容及操作步骤建立我国城乡居民储蓄存款模型,并检验模型的自相关性。
1.回归模型的筛选2.自相关的检验3.自相关的调整四、实验要求利用表 5-1 资料,试建立我国城乡居民储蓄存款模型,并检验模型的自相关性。
我国城乡居民储蓄存款与GDP统计资料( 1978 年= 100)存款GDP 年份存款余额Y GDP指数X年份余额指数Y X19919241.6 199211759.4 199315203.5 199421518.8 199529662.3 199638520.8 199746279.8 199853407.5 199959621.8 200064332.4308.2200286910.6888.5 351.52003103617.7981.6 399.62004119555.41084.5 452.020051410511201.7 494.22006161587.31361.2 544.520071725341560.5 596.920082178851717.8 640.620092607721861.1 691.520103033022050.0 750.62011343635.92228.9 811.12410.3200173762.43995512012【实验步骤】(一)回归模型的筛选⒈相关图分析SCAT X Y相关图表明, GDP指数与居民储蓄存款二者的曲线相关关系较为明显。
现将函数初步设定为线性、双对数、对数、指数、二次多项式等不同形式,进而加以比较分析。
⒉估计模型,利用LS命令分别建立以下模型⑴线性模型: LS Y C Xy?62251.79175.4516 xt (-9.5629) (33.3308)R2= 0.9823 F=1110.940S.E=15601.32⑵双对数模型: GENR LNY=LOG(Y)GENR LNX=LOG(X)LS LNY C LNX?0.59996 1.7452 ln xln yt(-1.6069) (31.8572)R2= 0.9807 F= 1014.878 S.E=0.1567⑶对数模型: LS YCLNX?y1035947170915.4 ln xt(-10.2355)(11.5094)R2=0.8688 F =132.4672 S.E =42490.60⑷指数模型: LS LNY C Xln y? 9.5657 0.001581xt (55.0657) (11.2557)2R = 0.8637 F=126.6908 S.E=0.4163LS Y CXX2?16271.5477.8476x0.0378x2yt(-2.4325)(6.1317) (7.8569)R2= 0.9958F=2274.040 S.E= 7765.275⒊选择模型比较以上模型,可见各模型回归系数的符号及数值较为合理。
计量经济学实验报告多重共线性、异方差及自相关的检验和修正——以财政收入模型为例经济学 1班一、引言财政收入是一国政府实现政府职能的基本保障,对国民经济的运行及社会的发展起着非凡的作用。
首先,它是一个国家各项收入得以实现的物质保证。
一个国家财政收入规模的大小通常是衡量其经济实力的重要标志。
其次,财政收入是国家对经济实行宏观调控的重要经济杠杆。
财政收入的增长情况关系着一个国家的经济的发展和社会的进步。
因此,研究财政收入的增长显得尤为重要。
二、数据及模型说明研究财政收入的影响因素离不开一些基本的经济变量。
回归变量的选择是建立回归模型的一个极为重要的问题。
如果遗漏了某些重要变量,回归方程的效果肯定不会好;而考虑过多的变量,不仅计算量增大许多,而且得到的回归方程稳定性也很差,直接影响到回归方程的应用。
通过经济理论对财政收入的解释以及对实践的观察,对财政收入影响的因素主要有农业增加值、工业增加值、建筑业增加值、总人口数、最终消费、受灾面积等等。
全部数据均来源于中华人民共和国国家统计局网站/具体数据见附录一。
为分析被解释变量财政收入(Y)和解释变量农业增加值(X1)、工业增加值(X2)、建筑业增加值(X3)、总人口(X4)、最终消费(X5)、受灾面积(X6)的关系。
作如下线性图(图1)。
图1可以看出Y、X1、X2、X3、X5基本都呈逐年增长的趋势,仅增长速率有所变动,而X4和X6在多数年份呈现水平波动,可能这两个自变量和因变量间不一定是线性关系。
可以初步建立回归模型如下:Y=α+β1*X1+β2*X2+β3*X3+β4*X4 +β5*X5+β6*X6 +U i 其中,U i为随机干扰项。
三、模型的检验及验证(一)多重共线性检验及修正利用Eviews5.0,做Y对X1、X2、X3、X4、X5和X6的回归,Eviews的最小二乘估计的回归结果如下表(表1)所示:表1Dependent Variable: YMethod: Least SquaresDate: 11/16/13 Time: 20:54Sample: 1990 2011Included observations: 22Variable Coefficient Std. Error t-Statistic Prob.C 145188.0 26652.27 5.447488 0.0001X1 -0.972478 0.222703 -4.366701 0.0006X2 0.210089 0.068192 3.080851 0.0076X3 -0.100412 0.569465 -0.176327 0.8624X4 -1.268320 0.247725 -5.119870 0.0001X5 0.600205 0.130089 4.613794 0.0003X6 -0.007430 0.044233 -0.167964 0.8689R-squared 0.999306 Mean dependent var 27186.86Adjusted R-squared 0.999029 S.D. dependent var 28848.33S.E. of regression 899.0866 Akaike info criterion 16.69401Sum squared resid 12125351 Schwarz criterion 17.04116Log likelihood -176.6341 F-statistic 3600.848Durbin-Watson stat 1.825260 Prob(F-statistic) 0.000000 由上表的回归结果可见,,该模型可决系数R2=0.9993很高,F检验值3601,明显显著。
异方差、自相关的检验与修正实验目的:通过对模型的检验掌握异方差性问题和自相关问题的检验方法及修正的原理,以及相关的Eviews 操作方法。
模型设定:εβββ+++=23121i i i X X YYi----人均消费支出X1--从事农业经营的纯收入X2--其他来源的纯收入 中国内地2006年各地区农村居民家庭人均纯收入与消费支出 单位:元 城市 y x1 x2 城市 y x1 x2 北京 5724.5 958.3 7317.2 湖北 2732.5 1934.6 1484.8 天津 3341.1 1738.9 4489 湖南 3013.3 1342.6 2047 河北 2495.3 1607.1 2194.7 广东 3886 1313.9 3765.9 山西 2253.3 1188.2 1992.7 广西 2413.9 1596.9 1173.6 内蒙古 2772 2560.8 781.1 海南 2232.2 2213.2 1042.3 辽宁 3066.9 2026.1 2064.3 重庆 2205.2 1234.1 1639.7 吉林 2700.7 2623.2 1017.9 四川 2395 1405 1597.4 黑龙江 2618.2 2622.9 929.5 贵州 1627.1 961.4 1023.2 上海 8006 532 8606.7 云南 2195.6 1570.3 680.2 江苏 4135.2 1497.9 4315.3 西藏 2002.2 1399.1 1035.9 浙江 6057.2 1403.1 5931.7 陕西 2181 1070.4 1189.8 安徽 2420.9 1472.8 1496.3 甘肃 1855.5 1167.9 966.2 福建 3591.4 1691.4 3143.4 青海 2179 1274.3 1084.1 江西 2676.6 1609.2 1850.3 宁夏 2247 1535.7 1224.4 山东 3143.8 1948.2 2420.1 新疆 2032.4 2267.4 469.9 河南 2229.3 1844.6 1416.4 数据来源:《中国农村住户调查年鉴(2007)》、《中国统计年鉴(2007)》参数估计:估计结果如下:2709030.01402097.01402.728X X Y ++=Λ(2.218) (2.438) (16.999) 922173.02=R D.W.=1.4289 F=165.8853 SE=395.2538实验步骤:一、检查模型是否存在异方差1.图形分析检验(1)散点相关图分析分别做出X1和Y 、X2和Y 的散点相关图,观察相关图可以看出,随着X1、X2的增加,Y 也增加,但离散程度逐步扩大,尤其表现在X1和Y .这说明变量之间可能存在递增的异方差性。
自相关的补救措施引言在数据分析和时间序列预测中,自相关(Autocorrelation)是指时间序列数据中的各个观测值与其之前观测值之间的相关性。
自相关可以帮助我们理解时间序列数据中存在的模式和趋势,并用于预测未来观测值。
然而,自相关同时也可能引入一些问题,如误导性的相关性、不稳定的模型等。
为了解决这些问题,我们需要采取一些补救措施。
本文将介绍一些常见的自相关问题及其补救措施,包括合理选择滞后阶数、采用差分法、使用ARIMA模型等。
1. 合理选择滞后阶数自相关函数(ACF)和偏自相关函数(PACF)是衡量时间序列数据中自相关性的常用工具。
ACF显示了某个观测值与其滞后值之间的相关性,而PACF则显示了某个观测值与其滞后值之间的“直接”相关性,消除了中间的干扰。
通过分析ACF和PACF图,我们可以判断出最佳的滞后阶数。
当ACF和PACF图呈现出明显的减小趋势并在某个点后截尾时,我们可以选择该点之前的滞后阶数作为模型中的参数。
这样可以确保我们捕捉到了时间序列数据中的重要模式和趋势,避免了过多的冗余信息。
2. 采用差分法差分法(Differencing)是通过对时间序列数据进行差分运算来消除自相关性的一种方法。
差分法可以将非平稳的时间序列数据转化为平稳的时间序列数据,从而降低自相关性。
差分法的基本思想是对时间序列数据进行一阶或多阶的差分运算,计算相邻观测值之间的差异。
通过消除季节周期性和趋势等因素的干扰,我们可以得到平稳的时间序列数据,并减少自相关性的影响。
3. 使用ARIMA模型自回归移动平均模型(Autoregressive Integrated Moving Average, ARIMA)是一种常用的时间序列预测模型,它结合了自回归模型(AR)和移动平均模型(MA),并引入了差分运算。
ARIMA模型的基本原理是通过考虑时间序列的历史观测值和误差项来预测未来的观测值。
ARIMA模型的三个参数分别代表了自回归项、差分项和移动平均项的阶数。
多重共线性、异方差、自相关的检测与模型修正从《国家统计数据库》找到了自1978—2008年我国人均居民消费、人均国内生产总值、居民消费价格指数、前期人均居民消费、城镇居民人均可支配收入以及农村居民人均纯收入的官方数据。
以此来分析我国人均消费的影响因素以及它们具体是如何对消费产生影响的。
1978—2008年我国人均消费及其影响因素相关数据城镇居民农村居民人均居民人均国内居民消费前期人均年份人均可支人均纯收消费生产总值价格指数居民消费配收入入343 134 1978 184 381 100.7 165405 160 1979 208 419 101.9 184477 191 1980 238 463 107.5 208501 223 1981 264 492 102.5 238535 270 1982 288 528 102 264564 310 1983 316 583 102 288652 355 1984 361 695 102.7 316739 398 1985 446 858 109.3 361901 424 1986 497 963 106.5 4461002 463 1987 565 1112 107.3 4971180 545 1988 714 1366 111.8 5651373 602 1989 788 1519 118 7141510 686 1990 833 1644 103.1 7881701 709 1991 932 1893 103.4 8332027 784 1992 1116 2311 106.4 9322577 922 1993 1393 2998 114.7 11163496 1221 1994 1833 4044 124.1 13934283 1578 1995 2355 5046 117.1 18334839 1926 1996 2789 5846 108.3 23555160 2090 1997 3002 6420 102.8 27895425 2162 1998 3159 6796 99.2 30025854 2210 1999 3346 7159 98.6 31596280 2253 2000 3631 7858 100.4 33466859 2366 2001 3886 8622 100.7 36317703 2476 2002 4143 9398 99.2 38868472 2622 2003 4474 10542 101.2 41439422 2936 2004 5031 12336 103.9 447410493 3255 2005 5572 14053 101.8 503111759 3587 2006 6263 16165 101.5 557213786 4140 2007 7255 19524 104.8 626315781 4761 2008 8348 23648 105.9 7255来自《国家统计数据库》设定如下形式的计量经济模型1:=++++ Y,X,,,X,Xi33i24124其中,Y为人均居民消费 , X2为人均国内生产总值 , X3为居民消费价格指数 , X4为前期人均消费。
实验2自相关的检验与修正、实验目的:掌握自相关模型的检验方法与处理方法.。
、实验内容及要求:表1列出了1985—2007年中国农村居民人均纯收入与人均消费性支出的统计数据。
(1)利用OLS法建立中国农村居民人均消费性支出与人均纯收入的线性模型。
(2)检验模型是否存在自相关。
(3)如果存在自相关,试采用适当的方法加以消除。
表1 1985 —2007年中国农村居民人均纯收入与人均消费性支出(单位:元)年份全年人均纯收入(现价)全年人均消费性支出(现价)消费价格指数(1985=100)1985397.6317.42100 1986423.8357106.1 1987462.6398.3112.7 1988544.9476.7132.4 1989601.5535.4157.9 1990686.3584.63165.1 1991708.6619.8168.9 1992784659.8176.8 1993921.6769.7201 199412211016.81248 19951577.71310.36291.4 19961923.11572.1314.4 19972090.11617.15322.3 199821621590.33319.1 19992214.31577.42314.3 20002253.41670314 20012366.41741316.5 20022475.61834315.2 20032622.241943.3320.2 20042936.42185335.6 20053254.932555343 200635872829348.1实验如下:首先对数据进行调整,将全年人均纯收入和全年人均消费性支出相应调整为全年实际人均纯收入和全年实际人均消费性支出。
LIL I. .一.... U h ―................ H全年人沟地收入全年人均泊箜低立出J泊费桥特描旷全年人均实际地收/全年人枸实加寸抵性女出tMM1昭W7…6J17.4Z m35^.60 31X42恤(山妙1441斯石Mid JMJ m.T41M7ma«44J J-L7JJ2.44IL5636*05MU UU期M45W.A8州IMJ nus ltf.1Uf矽»ill14^1TlV.b他E I4B.9m到W:71417*4⑷話珊肿1W3Kl.«THL73D1 4SU1M1M喻i*ii toirn3JS49*14』I・M157TJ IJ1IU4^1.4:出紺阳阳J157!4314J«1.«750•巧2000J3t:J 5OL75[潮2U3159U331S,1491^8L9M2114J isn«314J■04J1S0LJB32WI22S3J L6TO314 71T..U531.852«1UWJ P4I JMJ卿AS1W2倔ud)m31SJ■SS.I1繩US:621.21ifl-jjj irsij UU4乂MU wn困口6.4sits»71.97izM.yj皿會埠HLN T I4.W 加?n«HU 1W負建tUMSW741 4055T43M 8iraj^171711用OLS 估计法估计参数<-□ Group; UN1TTUD Wcrldilft UNTTTLED;;UMtided\[UMr][fi&£|[Oto[jKt |ftjrtt£narrtfeJprMafe]匚][Sart|Eart£pflgj&]旦fc#^[Sapli4j 』T 程]色3y?.弓13S$ [1936 VT1937 1920 193919^?19931934 1935 1936 1037 1939 2»J0 2001 20 J 2 205J 20342035G3E?017397 5000 317.42M1399 43DO 330,«Q0 410 47DO 353.420C 411 56D0 36D.050C SSOEWDO333.0 30C416.690041^ 54J0443 44DU 375 190C 45S5100 382.340C 492.34 DO 410.0000 541 4200 443.680C 611.6700 501030C 648 50 DO 50L75M 677 53DO 4DL3SO0 704 52 DO 501 aaoo J17MOO 531 B500 747 68DO 550.080C 75541D0 M1.350C G10 94DO GO5.930C C74 97D0 esijD7oo 阳⑹0 71J.030C 1033.4S0 81Z7DOO 112R170 Q7B 71 nr也 E\ie\;&zi e Edit Object View Proc Qui:k Options Window Heipdaw Uy ciO Eq uatio n: U NTTTLED Worlcflvc UMTTTLEI>:U 般―、3. frx| JDEU |f i rure I UEUE ihstma 世 心已工竄 '曲ts KKdtCoefficientSU Error t SkteticProa.G 50.21B7S 14 548SB 3.E642100.(]0Q9KC 6969260.02134231 99373 C 0000R-gquan&10S7QQ34dep^nd&ntvarjqu Q013-etiusted R-squar?d C.978947&D, ciependeTitvar15E.3tZ3 3.El ofreer&ssion 22.97705 4<aike info cnteilori 9.1B9B13 Sun squared resic 1105B.87 Sshwa-irz. cnUnon9.2ft Log hka || hood -1026826 Hannar^Oiilrin cfit&r. 9214646 h-S^tlStlC1023.933 □urciin Batson sealU4 码rroa(r-statistic) 0.000030-i e Edit Otwect Viav Proc Quick Options 州nticm 卜口 dacg iy图2DeDerKfentA ;an3ti«: T LlEtnnd: LEastSqijarss Dats: 04/24^5 Tria: 12:32 fianph 1Q95200?ricuaec ooser/atcns 、u图4从图4中可以看出,中国农村居民人均消费性支出与人均纯收入存在着显著的正相关关系。
自相关检验方法自相关检验是一种时间序列分析方法,用于检测一个时间序列是否存在自相关关系。
自相关意味着一个时间序列中过去的值会对未来的值产生影响,因此这种检验在研究时间序列数据的影响因素时非常有用。
在进行自相关检验前,需要首先了解一些基本概念。
时间序列是指同一现象在不同时间点观测所得到的数据。
自相关是指一个时间序列中过去的值与现在值之间的关系。
自相关系数是用来衡量自相关强度的指标,其值范围在-1到1之间。
如果自相关系数为正,则表明时间序列中过去的值与现在值呈正相关关系;如果自相关系数为负,则表示它们呈负相关关系;若为0,表示它们之间无自相关关系。
对于自相关检验,经典的方法是使用Ljung-Box检验和Durbin-Watson检验。
Ljung-Box检验用来检验时间序列是否存在自相关关系。
它计算出一系列自相关系数,然后比较它们与随机分布的期望值,从而得出时间序列是否有显著的自相关关系。
这个检验需要提供用于计算的自相关滞后数(lags),通常建议在10~20之间选择适当的值。
如果Ljung-Box统计量的p值小于显著性水平(例如0.05),则可以推断该时间序列存在自相关关系。
Durbin-Watson检验也是一种常用的自相关检验方法,它特别适用于AR(1)模型。
该检验利用AR(1)模型的自相关系数的特性,基于残差的一阶自相关系数来判断时间序列的自相关性。
Durbin-Watson检验的检验统计量为DW,其范围为0到4。
一般DW值在2左右表明无自相关关系,小于2表明有正自相关关系,大于2表明有负自相关关系。
在进行自相关检验时,还需要注意以下几点:1. 时间序列的长度和样本容量要充分,否则结果会不够可靠。
2. 自相关检验只能检测线性自相关,其他形式的自相关关系无法检测。
3. 对于复杂的时间序列,可能需要采用其他更为复杂的自相关检验方法。
总之,自相关检验是一种重要的时间序列分析方法,可以用来检测时间序列中的自相关关系。
实验2自相关的检验与修正一、实验目的:掌握自相关模型的检验方法与处理方法・。
二、实验内容及要求:表1列出了1985-2007年中国农村居民人均纯收入与人均消费性支岀的统讣数据。
(1)利用OLS法建立中国农村居民人均消费性支出与人均纯收入的线性模型。
(2)检验模型是否存在自相关。
(3)如果存在自相关,试采用适当的方法加以消除。
表1 1985-2007年中国农村居民人均纯收入与人均消费性支出弹位:元)实验如下:首先对数据进行调整,将全年人均纯收入和全年人均消费性支出相应调整为全年实际人均纯收入和全年实际人均消费性支出。
年份全年入丙纯收入飞年入改消转住支出F费价格抠數全年人均实际纯收〉全年人均实际消费性支出(现价〉(现价〉(1985=100)1985397.6317.42100397.60317.C 42X83571W.1399.43336.48 1987161.63983112.7410.47⑹上19S8544.9476.7132.4411.56360.05 60M535.415T.93S0.94339.03谢0686.3581.63145.1415.6P554.11 1991708.6619.8168.9419.54366.96 1W7M443.44373.19 1993921.6769.7201458.5138194 199412211016.812484X34410.00 19951577.7131036291.4541.42449.68 19961913A1572.1314.4611.67500.03 2090.11617.153X3648.50501.75 1998216215W33319.1677.53498.58 1好9211U1577.42314S704.52501.88 20M22SJ.41670314717.64531.E5 20012366.417413165747.68550.08 20022475.61834315J785.415S1.85 20032622.2419B3320.2818.94606.90 20042936 4218S335 6874.976S1.07 20053251. 932555343943.96744.20 20G635872329348 11030.45812.70 2W7414032243MJ 91128J7878.711>用OLS估计法估计参数data xy□ Group: UNTITLED Workfile: UNTITLED::Untitled\[v»ew][Proc][Cbjact |Print [Name [Freezej [pefaUt ^][Sort]|Tfanspose| ^It4-/-][Smpl47«|Title] Sample) 397.6ODS I X Y1985 | 397 6000 317.42001936 399 4330 335.48001937 4104700 353.42001988 411 5600 360.05001989 380 9430 333.08001990 415.6900 354.11001991 419 6400 36S96001992 •ICC o 443 4400ARO a H nA373 1900oo r c v cc1993 1994 458 01 JU492 34903oZ.94uU410.00001995 541.4200 449.68001996 611 6700 500.03001997 648.5000 501.75001998 677 5300 498.38001999 704 5200 501 88002000 717 6400 531 85002001 747 6890 550.08002002 785 4100 581.35002003 6189430 605.90002004 0749700 651.07002005 948 9600 744.90002006 103D.450 812.70002007 1128370 2787100® EViews-i e Edit Object View Proc Quick Options Window Help data xy Is ? ex□ Equation: UNTITLED Workfile: UNTnLED::Untitled\^e/v|[proc][obj2ct^ |pnnt.(Narre (Freeze] [estunate]f=ofecasi]|statsHResids] Dependent vanawe:YMethod: Least SquaresDate: 04/24M5 Timo: 12:32Sample 1985 2007inciudec oosefvaticns;23Cocffidcnt Std. Error t-Statistic Prob.C X 56.218780.6989281454858 3.8642100.021342 31 999730.00090.0000R-squaredAdjusted R-squared S.E. of regression Sum squared rcsid Log likelihood F-siatistlc Prob(F-statistic) 09799040.97894722 9770811086.87 -103 68281023.9830.000000fvlean deperdantx/zrs.D.aependentvar Akaikeinfo criterion Schwarz cri torio n Hannan-Quinn enterDuroin-watso n stat495.8012158.35739.1898139.2885519 2146450.409903费EViev/sFile Edit Object View Proc Quick Options Window Help图4从图4中可以看出,中国农村居民人均消费性支出与人均纯收入存在着显著的正相关 关系。
**大学经济学院实验报告估计线性回归模型并计算残差。
用普通最小二乘法估计输出结果如下:20,73.0,086.0.,9988.0)02.122()79.6(18.045.1ˆ2====-+-=T DW e s R X Y tt所以,回归方程拟合得效果比较好,但是DW 值比较低。
(2)残差图见图2。
(3)自相关的检验(检验误差项t u 是否存在自相关)①DW 检验:已知DW=0.73,若给定05.0=α,查表得,得DW 检验临界值41.1,20.1==U L d d ,因为DW=0.73<1.20,认为误差项t u 存在严重的一阶正自相关。
②回归检验法:建立残差t u 与21,--t t e e 的回归模型,如表2和表3。
从表2可以看出,1-t e 的回归参数通过了显著性检验,而表3中,21,--t t e e 中只有1-t e 的回归参数通过显著性检验,故判断误差项具有一阶回归形式的自相关。
表2 残差回归相关结果(1)表3 残差回归结果(2)③LM(BG)检验:辅助回归估计输出结果如下表(1)。
表(1)由LM 检验结果可知,LM (1)=7.998,伴随概率p=0.0047<0.05.LM(2)=8.459,伴随概率p=0.0146,所以在α=0.05显著性水平显著,存在一阶,二阶自相关。
同时,由表一,可得LM(BG)自相关检验辅助回归式估计结果是:00.840.020,74.1,40.0)4.0()4.0()4.3(0004.00609.06388.0221=⨯====-+-+=-TR LM DW R v X e e tt t t因为84.3)1(205.0=χ,LM=8.00>3.84,所以LM 检验结果也说明随机误差项存在一阶正自相关。
(4)用差分法和广义差分法建立模型,消除自相关。
用广义最小二乘法估计回归参数。
估计自相关系数ρˆ,635.0273.0121ˆ=-=-=DW ρ 对原变量做广义差分变换。