计量经济学实验教程 实验七 多重共线性模型的检验和处理
- 格式:doc
- 大小:153.00 KB
- 文档页数:8
【实验名称】:多重共线性的检验方法和处理【实验目的】:掌握多重共线性的原理【实验原理】:综合统计检验法、相关系数矩阵检验法、逐步回归法【实验步骤】:一、创建一个新的工作文件:二、输入样本数据:三、用普通最小二乘法估计模型:由于解释变量个数较多,并且解释变量之间可能存在相关性,为了降低这种相关性以减弱序列相关性对模型的影响,我们先对各个解释变量和被解释变量取对数:即在Eviews软件的命令框执行:genr lnY=log(Y),genr lnX1=log(X1),genr lnX2=log (X2)……genr lnX5=log(X5)我们设粮食生产函数为:LnY=β0+β1lnX1+β2lnX2+β3lnX3+β4lnX4+β5lnX5+μ用运普通最小二乘法估计:下表给出了采用Eviews软件对表一的数据进行回归分析的统计结果:Dependent Variable: LNYMethod: Least SquaresDate: 12/19/13 Time: 10:05Sample: 1983 2007C -4.173174 1.923624 -2.169434 0.0429LNX1 0.381145 0.050242 7.586182 0.0000 LNX2 1.222289 0.135179 9.042030 0.0000 LNX3 -0.081110 0.015304 -5.300024 0.0000 LNX4 -0.047229 0.044767 -1.054980 0.3047R-squared 0.981597 Mean dependent var 10.70905 Adjusted R-squared 0.976753 S.D. dependent var 0.093396 S.E. of regression 0.014240 Akaike info criterion -5.459968 Sum squared resid 0.003853 Schwarz criterion -5.167438 Log likelihood 74.24960 F-statistic 202.6826 Durbin-Watson stat 1.791427 Prob(F-statistic) 0.000000根据上表估计出的参数,可以得到如下普通最小二乘法估计模型:lnY=‐4.17+0.381lnX1+1.222lnX2‐0.081lnX3‐0.047lnX4‐0.101lnX5四、模型检验:1、数学检验:由于R2为0.9816接近于一,且F=202.68>F0.05(5,9)=2.74,故认为粮食产量和上述解释变量之间的总体线性关系显著;但是就X4,X5来说,其t检验的参数较小,尚不能通过t检验,因此怀疑模型中存在多重共线性。
多重共线性模型的检验与处理一、 研究的目的和要求 1)研究的目的中国钢材工业自新中国成立以来,历经起伏,虽然目前中国钢铁工业已形成具有相当规模,布局比较合理,大、中、小型企业相结合,行业比较完整的工业体系,但是钢材行业在现在有进入低速增长的趋势,面临供大于求,同质无序竞争,效益下滑的严峻局面。
在此背景下,寻找正确的钢材产量的预测模型,改变追求规模和产量的观念,给如何控制产量,优化产品提供了一定的参考。
本实验的目的在于建立并检验我国钢材产量预测模型,检验其多重共线性,并加以补救并得出正确的预测模型。
2)研究的具体内容本实验主要研究并建立检验我国钢材产量预测模型,检验其多重共线性,并加以补救并得出正确的预测模型。
二、 模型设定经分析,影响我国的钢材产量的主要因素除了生铁产量和发电量外,还可能和固定资产投资、国内生产总值、铁路运输量有关。
为此,为考虑的影响因素主要有生铁产量X1和发电量X2、固定资产投资X3、国内生产总值X4、铁路运输量X5,为此设定了如下形式的计量经济模型:12132435465t Y X X X X X ββββββμ=++++++其中Yt 为第t 年的钢材产量(万吨);生铁产量X1(万吨);发电量X2(亿千瓦时);固定资产投资X3(亿元);国内生产总值X4(亿元);铁路运输量X5(万吨)。
为估计模型中的参数,收集1978-1997年我国钢材产量及其它相关经三、 估计参数利用Eviews 软件,生成Yt 、X1、X2、X3、X4、X5等数据,采用这些数据对模型进行OLS 回归,输入命令:LS Yt C X1 X2 X3 X4 X5 可得到如下回归表格如下表2:表2 OLS 回归结果Dependent Variable: YT Method: Least Squares Date: 05/20/15 Time: 10:16 Sample: 1978 1997 Included observations: 20Variable Coefficient Std. Error t-Statistic Prob. C 354.5884 435.6968 0.813842 0.4294 X1 0.026041 0.120064 0.216892 0.8314 X2 0.994536 0.136474 7.287380 0.0000 X3 0.392676 0.086468 4.541271 0.0005 X4 -0.085436 0.016472 -5.186649 0.0001 X5-0.0059980.006034-0.9940190.3371R-squared 0.999098 Mean dependent var 5153.450 Adjusted R-squared 0.998776 S.D. dependent var 2512.131 S.E. of regression 87.87969 Akaike info criterion 12.03314 Sum squared resid 108119.8 Schwarz criterion 12.33186 Log likelihood -114.3314 Hannan-Quinn criter. 12.09145 F-statistic 3102.411 Durbin-Watson stat 1.919746 Prob(F-statistic)0.000000由此可见2R =0.999098,2R =0998776可决系数很高,F 检验值3102.411,明显显著。
计量经济学实验报告题目:关于多重共线性模型的检验和处理方法姓名:张飞飞学号:2008163050专业:工商管理指导教师:崔海燕实验时间: 2010-12-22二○一○年十二月二十五日关于多重共线性模型的检验和处理的方法一、实验目的:掌握多重共线性模型检验和处理的方法二、实验原理:判定系数检验法、逐步回归法、解释变量、相关系数检验三、实验步骤:1.创建一个新的工作文件:打开Eviews软件,点击File下的New File,创建一个新的工作文件,选择Annual,在Start Date栏中输入1983,在End date栏中输入2000,点击OK,点击保存,完成创建新的工作文件。
2.输入数据:点击Quick下的Empty Group,导入中国粮食生产函数模型的具体数据,命名被解释变量为Y,解释变量为X1、X2、X3、X4、X5,其中:Y表示粮食产量;X1表示农业化肥施用量;X2表示粮食播种面积;X3表示成灾面积;X4表示农业机械总动力;X5表示农业劳动力.点击Name保存数据,命名为Group01。
3.采用普通最小二乘法估计模型参数:点击Quick下的Estimate Equation,输入方程y c x1 x2 x3 x4 x5.点击OK,生成EQ1. 如下表所示:从结果可以看出:R-squared的值为0.982798,拟合优度比较高(一般为0.9以上),F-statistic 的值为137.1164,也比较大,说明模型上存在多重共线性,但无法看出变量之间的关系。
4.进行多重共线性检验:主要运用综合统计检验和采用解释变量之间的相关系数进行检验。
由综合统计检验法(步骤3),可以看出存在多重共线性,继而进行解释变量之间的相关下系数检验。
点击Quick下的Groupstatistics,选择Correlations,打开Series List界面,输入X1 X2 X3 X3 X4 X5,点击OK,生成Group02,结果如下图:从结果可以看出:X1和X4之间的相关系数为0.960278,最接近1,说明X1和X4之间存在高度相关性。
时间 地点 实验题目 多重共线性的诊断与修正一、实验目的与要求:要求目的:1、对多元线性回归模型的多重共线性的诊断;2、对多元线性回归模型的多重共线性的修正。
二、实验内容根据书上第四章引子“农业的发展反而会减少财政收入”,1978-2007年的财政收入,农业增加值,工业增加值,建筑业增加值等数据,运用EV 软件,做回归分析,判断是否存在多重共线性,以及修正。
三、实验过程:(实践过程、实践所有参数与指标、理论依据说明等)(一)模型设定及其估计经分析,影响财政收入的主要因素,除了农业增加值,工业增加值,建筑业增加值以外,还可能与总人口等因素有关。
研究“农业的发展反而会减少财政收入”这个问题。
设定如下形式的计量经济模型:i Y =1β+2β2X +3β3X +4β4X +5β5X +6β6X +7β7X +i μ其中,i Y 为财政收入CS/亿元;2X 为农业增加值NZ/亿元;3X 为工业增加值GZ/亿元;4X 为建筑业增加值JZZ/亿元;5X 为总人口TPOP/万人;6X 为最终消费CUM/亿元;7X 为受灾面积SZM/千公顷。
图1: 1978~2007年财政收入及其影响因素数据年份财政收入CS/亿元 农业增加值NZ/亿元 工业增加值GZ/亿元 建筑业增加值JZZ/亿元总人口TPOP/万人最终消费CUM/亿元受灾面积SZM/千公顷 1978 1132.3 1027.5 1607 138.2 96259 2239.1 50790 1979 1146.4 1270.2 1769.7 143.8 97542 2633.7 39370 1980 1159.9 1371.6 1996.5 195.5 98705 3007.9 44526 1981 1175.8 1559.5 2048.4 207.1 100072 3361.5 39790 1982 1212.3 1777.4 2162.3 220.7 101654 3714.8 33130 1983 1367 1978.4 2375.6 270.6 103008 4126.4 34710 1984 1642.9 2316.1 2789 316.7 104357 4846.3 31890 1985 2004.8 2564.4 3448.7 417.9 105851 5986.3 44365 1986 2122 2788.7 3967 525.7 107507 6821.8 47140 1987 2199.4 3233 4585.8 665.8 109300 7804.6 42090 1988 2357.2 3865.4 5777.2 810 111026 9839.5 50870 1989 2664.9 4265.9 6484 794 112704 11164.2 46991 1990 2937.1 5062 6858 859.4 114333 12090.5 38474 1991 3149.48 5342.2 8087.1 1015.1 115823 14091.9 55472 1992 3483.37 5866.6 10284.5 1415 117171 17203.3 51333 1993 4348.95 6963.8 14188 2266.5 118517 21899.9 48829 19945218.1 9572.7 19480.7 2964.7 11985029242.2550431995 6242.2 12135.8 24950.6 3728.8 121121 36748.2 45821 1996 7407.99 14015.4 29447.6 4387.4 122389 43919.5 46989 1997 8651.14 14441.9 32921.4 4621.6 123626 48140.6 53429 1998 9875.95 14817.6 34018.4 4985.8 124761 51588.2 50145 1999 11444.08 14770 35861.5 5172.1 125786 55636.9 49981 2000 13395.23 14944.7 40036 5522.3 126743 61516 54688 2001 16386.04 15781.3 43580.6 5931.7 127627 66878.3 52215 2002 18903.64 16537 47431.3 6465.5 128453 71691.2 47119 2003 21715.25 17381.7 54945.5 7490.8 129227 77449.5 54506 2004 26396.47 21412.7 65210 8694.3 129988 87032.9 37106 2005 31649.29 22420 76912.9 10133.8 130756 96918.1 38818 2006 38760.2 24040 91310.9 11851.1 131448 110595.3 41091 2007 51321.78 28095 107367.2 14014.1 132129 128444.6 48992利用EV 软件,生成i Y 、2X 、3X 、4X 、5X 、6X 、7X 等数据,采用这些数据对模型进行OLS 回归。
山西大学实验报告实验报告题目:多重共线性问题的检验和处理学院:专业:课程名称:计量经济学学号:学生姓名:教师名称:崔海燕上课时间:一、实验目的:熟悉和掌握Eviews在多重共线性模型中的应用,掌握多重共线性问题的检验和处理。
二、实验原理:1、综合统计检验法;2、相关系数矩阵判断;3、逐步回归法;三、实验步骤:(一)新建工作文件并保存打开Eviews软件,在主菜单栏点击File\new\workfile,输入start date1978和end date 2006并点击确认,点击save键,输入文件名进行保存。
(二)输入并编辑数据在主菜单栏点击Quick键,选择empty\group新建空数据栏,根据理论和经验分析,影响粮食生产(Y)的主要因素有农业化肥施用量(X1)、粮食播种面积(X2)、成灾面积(X3)、农业机械总动力(X4)和农业劳动力(X5),其中成灾面积的符号为负,其余均应为正。
下表给出了1983——2000中国粮食生产的相关数据。
点击name键进行命名,选择默认名称Group01,保存文件。
Y X1 X2 X3 X4 X5 1983 38728 1660 114047 16209 18022 31151 1984 40731 1740 112884 15264 19497 30868 1985 37911 1776 108845 22705 20913 31130 1986 39151 1931 110933 23656 22950 31254 1987 40208 1999 111268 20393 24836 31663 1988 39408 2142 110123 23945 26575 32249 1989 40755 2357 112205 24449 28067 33225 1990 44624 2590 113466 17819 28708 38914 1991 43529 2806 112314 27814 29389 39098 1992 44264 2930 110560 25895 30308 38669 1993 45649 3152 110509 23133 31817 37680 1994 44510 3318 109544 31383 33802 36628 1995 46662 3594 110060 22267 36118 35530 1996 50454 3828 112548 21233 38547 34820 1997 49417 3981 112912 30309 42016 34840 1998 51230 4084 113787 25181 45208 35177 1999 50839 4124 113161 26731 48996 35768 2000 46218 4146 108463 34374 52574 36043 2001 45264 4254 106080 31793 55172 36513 2002 45706 4339 103891 27319 57930 36870 2003 43070 4412 99410 32516 60387 365462004 46947 4637 101606 16297 64028 35269 2005 48402 4766 104278 19966 68398 33970 2006 49804 4928 104958 24632 72522 32561 2007 50160 5108 105638 25064 76590 31444 (三)用普通最小二乘法估计模型参数用最小二乘法估计模型参数。
《计量经济学》课程实训项目报告项目名称多重共线性和自相关的检验及解决方法实训日期2012.11.23 实训人53 班级统计1005 学号1004100508 指导教师张维群应用软件SPSS 实训地点实验楼314实训目的1.多重共线性和自相关的检验及解决方法的软件操作能力训练2.验证多重共线性和自相关的检验及解决方法的理论,并加深理解。
实训内容1.根据自己在网上寻找到的感兴趣的数据,用膨胀因子法和相关系数法对其进行是否存在多重共线性的检验;运用图示法和D-W法对数据是否存在自相关进行检验。
2.若检验出有多重共线性,则用逐步回归法剔除对因变量影响不大的解释变量;若检验出存在自相关,则用广义差分法建立新的模型进行解决。
实训数据资料说明1.问题:我国GDP的增长率与第一产业增长率、第二产业增长率、第三产业增长率用最小二乘法回归时的模型是否存在多重共线性和自相关。
若存在,先解决多重共线性再解决自相关并重新估计。
2.指标有哪些?自变量有x1:第一产业增长率,x2:第二产业增长率,x3:第三产业增长率。
因变量是y:GDP的增长率。
3.数据来源什么地方?数据是从网上查找的,数据包括从1981—2010年我国的GDP增长率、第一产业增长率、第二产业增长率和第三产业增长率,为时间序列数据,样本量为30。
实训结果与简要分析首先对原始数据进行用普通最小二乘法进行大致的拟合,并选择Linear Regression-Statistics-Collinearity diagnostics,即用膨胀因子法对原模型进行多重共线性检验,结果如下:Model SummaryModel R R Square Adjusted R Square Std. Error of the Estimate1 .982a.965 .961 .55883表1A N OVA bModel Sum of Squares df Mean Square F Sig.1 Regression 224.079 3 74.693 239.176 .000aResidual 8.120 26 .312T otal 232.199 29表2Coefficients aModel1(Constant) 第一产业增长率第二产业增长率第三产业增长率Unstandardized Coeff icients B .690 .187 .456 .287Std. Error .400 .047 .030 .042 Standardized Coeff icients Beta .169 .742 .344t 1.727 3.971 15.045 6.837 Sig. .096 .001 .000 .000 Collinearity Statistics T olerance .740 .553 .531VIF 1.351 1.809 1.883表3由表1可知模型的可决系数R^=0.965>0.8,可见其拟合程度较好。
一、实训背景在计量经济学和统计分析中,多重共线性是指模型中的多个自变量之间存在高度的相关性。
这种相关性会导致回归系数估计的不稳定,影响模型的预测能力和解释力。
因此,对多重共线性进行检验和修正对于确保模型的准确性和可靠性至关重要。
本实训旨在通过实际操作,学习如何使用SPSS软件进行多重共线性检验,并探讨相应的修正方法。
二、实训目的1. 理解多重共线性的概念及其对模型的影响。
2. 掌握使用SPSS软件进行多重共线性检验的方法。
3. 学习识别多重共线性的存在,并掌握相应的修正方法。
4. 提高对计量经济学模型诊断和修正的实际操作能力。
三、实训内容1. 数据准备本实训使用的数据集为某城市房价与多个影响因素的相关数据,包括房价(被解释变量)和收入、教育水平、交通便利性、周边设施等(解释变量)。
2. SPSS软件操作(1)数据导入首先,将数据集导入SPSS软件。
在SPSS界面中,点击“文件”菜单,选择“打开”,找到数据文件并导入。
(2)多重共线性检验导入数据后,进行以下操作:a. 点击“分析”菜单,选择“回归”,再选择“线性”。
b. 将被解释变量拖入“因变量”框,将解释变量拖入“自变量”框。
c. 点击“统计”菜单,选择“共线性诊断”。
d. 点击“继续”,然后点击“确定”。
(3)结果分析SPSS会自动计算并显示多重共线性的检验结果,主要包括方差膨胀因子(VIF)和容忍度(Tolerance)。
3. 结果分析(1)方差膨胀因子(VIF)VIF用于衡量变量之间相关性的程度。
一般来说,VIF值大于10表示存在多重共线性问题。
本实训中,我们发现收入、教育水平和交通便利性三个变量的VIF值均大于10,说明这三个变量之间存在严重的多重共线性。
(2)容忍度(Tolerance)容忍度是VIF的倒数,用于衡量变量之间独立性的程度。
一般来说,容忍度值小于0.1表示存在多重共线性问题。
本实训中,我们发现收入、教育水平和交通便利性的容忍度值均小于0.1,进一步证实了这三个变量之间存在多重共线性。
第七章 多重共线性及其处理第一部分 学习辅导一、本章学习目的与要求1.理解多重共线性的概念;2.掌握多重共线性存在的主要原因;3.理解多重共线性可能造成的后果;4.掌握多重共线性的检验与修正的方法。
二、本章内容提要本章主要介绍计量经济模型的计量经济检验。
即多重共线性问题。
多重共线性是多元回归模型可能存在的一类现象,分为完全共线与近似共线两类。
模型的多个解释变量间出现完全共线性时,模型的参数无法估计。
更多的情况则是近似共线性,这时,由于并不违背所有的基本假定,模型参数的估计仍是无偏、一致且有效的,但估计的参数的标准差往往较大,从而使得t 统计值减小,参数的显著性下降,导致某些本应存在于模型中的变量被排除,甚至出现参数正负号方面的一些混乱。
显然,近似多重共线性使得模型偏回归系数的特征不再明显,从而很难对单个系数的经济含义进行解释。
多重共线性的检验包括检验多重共线性是否存在以及估计多重共线性的范围两层递进的检验。
而解决多重共线性的办法通常有逐步回归法、差分法以及使用额外信息、增大样本容量等方法。
(一)多重共线性及其产生的原因当我们利用统计数据进行分析时,解释变量之间经常会出现高度多重共线性的情况。
1.多重共线性的基本概念多重共线性(Multicollinearity )一词由弗里希(Frish )于1934年在其撰写的《借助于完全回归系统的统计合流分析》中首次提出。
它的原义是指一个回归模型中的一些或全部解释变量之间存在有一种“完全”或准确的线性关系。
如果在经典回归模型Y X βε=+中,经典假定(5)遭到破坏,则有()1R X k <+,此时称解释变量k X X X ,,,21 间存在完全多重共线性。
解释变量的完全多重共线性,也就是解释变量之间存在严格的线性关系,即数据矩阵X 的列向量线性相关。
因此,必有一个列向量可由其余列向量线性表示。
同时还有另外一种情况,即解释变量之间虽然不存在严格的线性关系,但是却有近似的线性关系,即解释变量之间高度相关。
目录
R值和t值检验 (4)
一、2
二、解释变量相关系数检验 (5)
三、辅助回归检验 (6)
四、CS对GDP1、GDP2、GDP3回归多重共线性的处理 (8)
五、TZG对ZJ、YY和CZ回归多重共线性的处理 (9)
实验七多重共线性模型的检验和处理
实验目的:掌握多重共线性模型的检验和处理方法。
R值和t值检验及解释变量相关系数检验,实验要求:了解辅助回归检验和掌握2
了解变量变换法和掌握先验信息法。
R值和t值检验、解释变量相关系数检验和辅助回归检验,先验信实验原理:2
息法和变量变换法。
实验步骤:
一、2R值和t值检验
在实验二的一元线性回归模型的估计中,根据广东数据把CS作为应变量,GDPS作为解释变量,进行了一元线性回归,得到结果为
CS=0.0802959511276*GDPS+12.5096023259
其含义是国内生产总值GDPS每增加一个单位,财政收入CS将增加0.0830个单位。
实际上三个产业对财政收入的贡献是不同的,那么就应该把上述回归改为财政收入CS对三个产业增加值GDP1、GDP2、GDP3进行回归。
进行这个三元回归,得结果为:
从结果看判定系数2R很高,方程很显著,但3个参数t检验值两个不显著,有一个较显著,其中一个参数估计值还是负的,不符合经济理论。
显然,出现了严重的多重共线性。
在实验三的多元线性回归模型的估计和检验中,根据广东数据,建立了固定
资产投资模型,固定资产投资TZG取决于固定资产折旧ZJ、营业盈余YY和财政支出CZ,进行三元线性回归如下:
估计方程的判定系数2R很高,方程显著性F检验也显著,但只有两个参数显著性t检验比较显著,这与很高的判定系数不相称,出现了严重的多重共线性。
二、解释变量相关系数检验
根据广东数据,CS对GDP1、GDP2和GDP3的回归中,解释变量GDP1、GDP2和GDP3之间的相关系数为
可以看出三个解释变量GDP1、GDP2和GDP3之间高度相关,必然存在严重的多重共线性。
根据广东数据,TZG对ZJ、YY、CZ的回归中,解释变量ZJ、YY、CZ之间的相关系数为
可以看出三个解释变量ZJ、YY、CZ之间也高度相关,特别是ZJ和CZ之间高度相关,必然存在严重的多重共线性。
三、辅助回归检验
根据广东数据,CS对GDP1、GDP2和GDP3的回归中,解释变量GDP1、GDP2和GDP3之间的辅助回归分别为:
三个回归方程均高度显著,特别是第二、三个方程,显示存在严重的多重共线性,特别是GDP2和GDP3之间存在严重的多重共线性,解释变量之间相关系数检验也证实了这一点。
根据广东数据,TZG对ZJ、YY、CZ的回归中,解释变量ZJ、YY、CZ之间的辅助回归分别为:
三个回归方程均高度显著,特别是第一、三个方程,显示存在严重的多重共线性,特别是ZJ和CZ之间存在严重的多重共线性,解释变量之间的相关系数检验也证实了这一点。
通过多重共线性模型的检验试验,发现根据广东数据CS对GDP1、GDP2和GDP3的回归以及根据广东数据TZG对ZJ、YY、CZ的回归都存在严重的多重共线性,现在分别对它们进行处理。
处理方法有多种,但没有一种万无一失的补救措施,只有一些经验的法则。
四、CS对GDP1、GDP2、GDP3回归多重共线性的处理
根据广东数据CS对GDP1、GDP2和GDP3的回归中,发现存在严重的多重共线性,特别是GDP2和GDP3之间存在严重的多重共线性。
假设知道已知信息,
GDP3对CS的贡献是GDP1贡献的3倍,并结合变量变换法,进行如下回归:
得回归方程为
LOG(CS)=0.0693221*LOG(GDP2)+2.372361e-05(GDP1+3*GDP3)+0.432021 基本消除了多重共线性,当然,假设是否正确有待探讨,上述方程也是试了很多次得到的,同学们也可以试其他形式。
五、TZG对ZJ、YY和CZ回归多重共线性的处理
根据广东数据TZG对ZJ、YY和CZ的回归中,发现存在严重的多重共线性,特别是ZJ和CZ之间存在严重的多重共线性。
实际上,在企业折旧资金和营业盈余资金主要是会计账面的区别,资金常常是混在一起用的,不区别折旧资金和营业盈余资金的使用,据此,把ZJ和YY加在一起,进行如下回归:
得回归方程为
TZG=0.461207865212*(ZJ+YY)+1.06966732681*CZ+30.6306268397 基本消除了多重共线性。