多重共线性检验与修正
- 格式:docx
- 大小:15.65 KB
- 文档页数:2
习题1.下表给出了中国商品进口额Y 、国内生产总值GDP 、消费者价格指数CPI 。
年份 商品进口额 (亿元)国内生产总值(亿元)居民消费价格指数(1985=100)1985 1257.8 8964.4 1001986 1498.3 10202.2 106.5 1987 1614.2 11962.5 114.3 1988 2055.1 14928.3 135.8 1989 2199.9 16909.2 160.2 1990 2574.3 18547.9 165.2 1991 3398.7 21617.8 170.8 1992 4443.3 26638.1 181.7 1993 5986.2 34634.4 208.4 1994 9960.1 46759.4 258.6 1995 11048.1 58478.1 302.8 1996 11557.4 67884.6 327.9 1997 11806.5 74462.6 337.1 1998 11626.1 78345.2 334.4 1999 13736.4 82067.5 329.7 2000 18638.8 89468.1 331.0 2001 20159.2 97314.8 333.3 2002 24430.3 105172.3 330.6 200334195.6117251.9334.6资料来源:《中国统计年鉴》,中国统计出版社2000年、2004年。
请考虑下列模型:i t t t u CPI GDP Y ++=ln ln ln 321βββ+ (1)利用表中数据估计此模型的参数。
解:ln 3.6489 1.796ln 1.2075ln t t t Y GDP CPI =--+t= (-11.32) (9.93) (-3.415)20.988770.6.0.1124R F S E ===(2)你认为数据中有多重共线性吗?多重共线性的检验 1)综合统计检验法若 在OLS 法下:R 2与F 值较大,但t 检验值较小,则可能存在多重共线性。
实验题目 多重共线性的诊断与修正一、实验目的与要求:要求目的:1、对多元线性回归模型的多重共线性的诊断;2、对多元线性回归模型的多重共线性的修正。
二、实验内容根据书上第四章引子“农业的发展反而会减少财政收入”,1978-2007年的财政收入,农业增加值,工业增加值,建筑业增加值等数据,运用EV 软件,做回归分析,判断是否存在多重共线性,以及修正。
三、实验过程:(实践过程、实践所有参数与指标、理论依据说明等)(一)模型设定及其估计经分析,影响财政收入的主要因素,除了农业增加值,工业增加值,建筑业增加值以外,还可能与总人口等因素有关。
研究“农业的发展反而会减少财政收入”这个问题。
设定如下形式的计量经济模型:i Y =1β+2β2X +3β3X +4β4X +5β5X +6β6X +7β7X +i μ其中,i Y 为财政收入CS/亿元;2X 为农业增加值NZ/亿元;3X 为工业增加值GZ/亿元;4X 为建筑业增加值JZZ/亿元;5X 为总人口TPOP/万人;6X 为最终消费CUM/亿元;7X 为受灾面积SZM/千公顷。
图1: 1978~2007年财政收入及其影响因素数据年份财政收入CS/亿元 农业增加值NZ/亿元 工业增加值GZ/亿元 建筑业增加值JZZ/亿元总人口TPOP/万人最终消费CUM/亿元受灾面积SZM/千公顷 1978 1132.3 1027.5 1607 138.2 96259 2239.1 50790 1979 1146.4 1270.2 1769.7 143.8 97542 2633.7 39370 1980 1159.9 1371.6 1996.5 195.5 98705 3007.9 44526 1981 1175.8 1559.5 2048.4 207.1 100072 3361.5 39790 1982 1212.3 1777.4 2162.3 220.7 101654 3714.8 33130 1983 1367 1978.4 2375.6 270.6 103008 4126.4 34710 1984 1642.9 2316.1 2789 316.7 104357 4846.3 31890 1985 2004.8 2564.4 3448.7 417.9 105851 5986.3 44365 1986 2122 2788.7 3967 525.7 107507 6821.8 47140 1987 2199.4 3233 4585.8 665.8 109300 7804.6 42090 1988 2357.2 3865.4 5777.2 810 111026 9839.5 50870 1989 2664.9 4265.9 6484 794 112704 11164.2 46991 1990 2937.1 5062 6858 859.4 114333 12090.5 38474 1991 3149.48 5342.2 8087.1 1015.1 115823 14091.9 55472 1992 3483.37 5866.6 10284.5 1415 117171 17203.3 51333 1993 4348.95 6963.8 14188 2266.5 118517 21899.9 48829 1994 5218.1 9572.7 19480.7 2964.7 119850 29242.2 55043 19956242.2 12135.8 24950.6 3728.8 12112136748.2458211996 7407.99 14015.4 29447.6 4387.4 122389 43919.5 46989 1997 8651.14 14441.9 32921.4 4621.6 123626 48140.6 53429 1998 9875.95 14817.6 34018.4 4985.8 124761 51588.2 50145 1999 11444.08 14770 35861.5 5172.1 125786 55636.9 49981 2000 13395.23 14944.7 40036 5522.3 126743 61516 54688 2001 16386.04 15781.3 43580.6 5931.7 127627 66878.3 52215 2002 18903.64 16537 47431.3 6465.5 128453 71691.2 47119 2003 21715.25 17381.7 54945.5 7490.8 129227 77449.5 54506 2004 26396.47 21412.7 65210 8694.3 129988 87032.9 37106 2005 31649.29 22420 76912.9 10133.8 130756 96918.1 38818 2006 38760.2 24040 91310.9 11851.1 131448 110595.3 41091 2007 51321.78 28095 107367.2 14014.1 132129 128444.6 48992利用EV 软件,生成i Y 、2X 、3X 、4X 、5X 、6X 、7X 等数据,采用这些数据对模型进行OLS 回归。
实验报告课程名称:计量经济学实验项目:实验四多重共线性模型的检验和处理实验类型:综合性□设计性□验证性 专业班别:11本国贸五班姓名:学号:实验课室:厚德楼A207指导教师:实验日期:2014/5/20广东商学院华商学院教务处制一、实验项目训练方案小组合作:是□否 小组成员:无实验目的:掌握多重共线性模型的检验和处理方法:实验场地及仪器、设备和材料实验室:普通配置的计算机,Eviews软件及常用办公软件。
实验训练内容(包括实验原理和操作步骤):【实验原理】多重共线性的检验:直观判断法(R2值、t值检验)、简单相关系数检验法、方差扩大因子法(辅助回归检验)多重共线性的处理:先验信息法、变量变换法、逐步回归法【实验步骤】(一)多重共线性的检验1.直观判断法(R2值、t值检验)根据广东数据(见附件1),先分别建立以下模型:【模型1】财政收入CS对第一产业产值GDP1、第二产业产值GDP2和第三产业产值GDP3的多元线性回归模型;(请对得到的图表进行处理,以上在一页内)【模型2】固定资产投资TZG对固定资产折旧ZJ、营业盈余YY和财政支出CZ的多元线性回归模型。
观察模型结果,初步判断模型自变量之间是否存在多重共线性问题。
【模型1】从上图可以得到,估计方程的判定系数R 2很高,但三个参数t检验值两个不显著,有一个较显著,其中一个参数估计值还是负的,不符合经济理论。
所以,出现了严重的多重共线性。
【模型2】1】从上图可以得到,估计方程的判定系数R 2很高,方程显著性F检验也显著,但只有两个参数显著性t检验比较显著,这与很高的判定系数不相称,出现了严重的多重共线性。
2.简单相关系数检验法分别计算【模型1】和【模型2】的自变量的简单相关系数。
【模型1】【模型2】(请对得到的图表进行处理,以上在一页内)根据计算的简单相关系数,判断模型是否存在多重共线性。
【模型1】可看出三个解释变量GDP1 、GDP2和GDP3之间高度相关,存在严重的多重共线性。
多重共线性问题的几种解决方法在多元线性回归模型经典假设中,其重要假定之一是回归模型的解释变量之间不存在线性关系,也就是说,解释变量X1,X2,……,X k中的任何一个都不能是其他解释变量的线性组合。
如果违背这一假定,即线性回归模型中某一个解释变量与其他解释变量间存在线性关系,就称线性回归模型中存在多重共线性。
多重共线性违背了解释变量间不相关的古典假设,将给普通最小二乘法带来严重后果。
这里,我们总结了8个处理多重共线性问题的可用方法,大家在遇到多重共线性问题时可作参考:1、保留重要解释变量,去掉次要或可替代解释变量2、用相对数变量替代绝对数变量3、差分法4、逐步回归分析5、主成份分析6、偏最小二乘回归7、岭回归8、增加样本容量这次我们主要研究逐步回归分析方法是如何处理多重共线性问题的。
逐步回归分析方法的基本思想是通过相关系数r、拟合优度R2和标准误差三个方面综合判断一系列回归方程的优劣,从而得到最优回归方程。
具体方法分为两步:第一步,先将被解释变量y对每个解释变量作简单回归:对每一个回归方程进行统计检验分析(相关系数r、拟合优度R2和标准误差),并结合经济理论分析选出最优回归方程,也称为基本回归方程。
第二步,将其他解释变量逐一引入到基本回归方程中,建立一系列回归方程,根据每个新加的解释变量的标准差和复相关系数来考察其对每个回归系数的影响,一般根据如下标准进行分类判别:1.如果新引进的解释变量使R2得到提高,而其他参数回归系数在统计上和经济理论上仍然合理,则认为这个新引入的变量对回归模型是有利的,可以作为解释变量予以保留。
2.如果新引进的解释变量对R2改进不明显,对其他回归系数也没有多大影响,则不必保留在回归模型中。
3.如果新引进的解释变量不仅改变了R2,而且对其他回归系数的数值或符号具有明显影响,则认为该解释变量为不利变量,引进后会使回归模型出现多重共线性问题。
不利变量未必是多余的,如果它可能对被解释变量是不可缺少的,则不能简单舍弃,而是应研究改善模型的形式,寻找更符合实际的模型,重新进行估计。
实验五 多重共线性检验实验时间: 姓名:学号: 成绩:【实验目的】1、掌握多元线性回归模型的估计、检验和预测;2、掌握多重共线性问题的检验方法3、掌握多重共线性问题的修正方法 【实验内容】1、数据的读取和编辑;2、多元回归模型的估计、检验、预测;3、多重共线性问题的检验4、多重共线性问题的修正 【实验背景】为了评价报账最低工资(负收入税)政策的可行性,兰德公司进行了一项研究,以评价劳动供给(平均工作小时数)对小时工资提高的反应,词研究中的数据取自6000户男户主收入低于15000美元的一个国民样本,这些数据分成39个人口组,并放在表1中,由于4个人口组中的某些变量确实,所以只给出了35个组的数据,用于分析的各个变量的定义如下:Y 表示该年度平均工作小时数;X1表示平均小时工资(美元);X2表示配偶平均收入(美元);X3表示其他家庭成员的平均收入(美元);X4表示年均非劳动收入(美元);X5表示平均家庭资产拥有量;X6表示被调查者的平均年龄;X7表示平均赡养人数;X8表示平均受教育年限。
μ为随机干扰项,考虑一下回归模型:μβββββββββ+++++++++=87654321876543210X X X X X X X X Y(1) 将该年度平均工作小时数Y 对X 进行回归,并对模型进行简单分析; (2) 计算各变量之间的相关系数矩阵,利用相关系数法分析变量间是否具有多重共线性;(3) 利用逐步回归方法检验并修正回归模型,最后再对模型进行经济意义检验、统计检验。
表5观测组Y X1 X2 X3 X4 X5 X6 X7 X81 2157 2.905 1121 291 380 7250 38.5 2.34 10.52 2174 2.97 1128 301 398 7744 39.3 2.335 10.53 2062 2.35 1214 326 185 3068 40.1 2.851 8.94 2111 2.511 1203 49 117 1632 22.4 1.159 11.55 2134 2.791 1013 594 730 12710 57.7 1.229 8.86 2185 3.04 1135 287 382 776 38.6 2.602 10.77 2210 3.222 1100 295 474 9338 39 2.187 1128 2105 2.495 1180 310 255 4730 39.9 2.616 9.39 2267 2.838 1298 252 431 8317 38.9 2.024 11.110 2205 2.356 885 264 373 6489 38.8 2.662 9.511 2121 2.922 1251 328 312 5907 39.8 2.287 10.312 2109 2.499 1207 347 271 5069 39.7 3.193 8.913 2108 2.796 1036 300 259 4614 38.2 2.4 9.214 2047 2.453 1213 397 139 1987 40.3 2.545 9.115 2174 3.582 1141 414 498 10239 40 2.064 11.716 2067 2.909 1805 290 239 4439 39.1 2.301 10.517 2159 2.511 1075 289 308 5621 39.3 2.486 9.518 2257 2.516 1093 176 392 7293 37.9 2.042 10.119 1985 1.423 553 381 146 1866 40.6 3.833 6.620 2184 3.636 1091 291 560 11240 39.1 2.328 11.621 2084 2.983 1327 331 296 5653 39.8 2.208 10.222 2051 2.573 1197 279 172 2806 40 2.362 9.123 2127 3.263 1226 314 408 8042 39.5 2.259 10.824 2102 3.234 1188 414 352 7557 39.8 2.019 10.725 2098 2.28 973 364 272 4400 40.6 2.661 8.426 2042 2.304 1085 328 140 1739 41.8 2.444 8.227 2181 2.912 1072 304 383 9340 39 2.337 10.228 2186 3.015 1122 30 352 7292 37.2 2.046 10.929 2188 3.01 990 366 374 7325 38.4 2.847 10.630 2077 1.901 350 209 95 1370 37.4 4.158 8.231 2196 3.009 947 294 342 6888 37.5 3.047 10.632 2093 1.899 342 311 120 1425 37.5 4.512 8.133 2173 2.959 1116 296 387 7625 39.2 2.342 10.534 2179 2.959 1116 296 387 7625 39.2 2.342 10.535 2200 2.98 1126 204 393 7885 39.2 2.341 10.6 【实验过程】一、利用Eviews软件建立年度平均工作小时数y的回归模型。
282186 3.015 1122 30 352 7292 37.22.04610.9292188 3.01 990 366374 732538.4 2.847 10.6 3020771.901350209 95 137037.44.158 8.2 31 2196 3.009 947 294 342688837.5 3.047 10.632 2093 1.899 342 311 1201425 37.5 4.5128.133 2173 2.959 1116 296 3877625 39.2 2.342 10.534 2179 2.9591116296 387 762539.2 2.342 10.535 2200 2.98 1126 204 393 7885 39.2 2.34110.6【实验过程】一、利用Eviews软件建立年度平均工作小时数y的回归模型。
(一)首先创建Workfile(命令窗口输入Create U,再输入35个样本观测值),其次输入数据Y,X1,X2,X3,X4,X5,X6,X7,X8(命令窗口Data Y X1X 2X3 X4 X5 X6 X7 X8)将上述表格中的数据复制粘贴到数据窗口中。
(二)进行OLS回归命令窗口输入命令LSY C X1X2X3 X4 X5 X6X7 X8从表中可以看到,模型可能存在多重共线性。
因为拟合优度较高,F统计量对应的P值小于1%,说明回归方程是显著地,回归系数X3,X4,X6,X7在10%的水平下显著,其他回归系数的t统计量对应的P值大于0.1,是不显著变量,说明解释变量可能存在多重共线性。
二、多重共线性的检验1、简单相关系数法这种方法只适用于只有两个解释变量的情况。
当这两个解释变量相关系数的绝对值很大时,认为这两个解释变量存在共线性。
操作:Quick → Group statistics→Correlations→对话框→x1 x2 x3 x4 x5 x6x7 x8→ok,得到关于上述8个变量之间的相关系数矩阵。
实验题目多重共线性的诊断与修正一、实验目的与要求:要求目的:1、对多元线性回归模型的多重共线性的诊断;2、对多元线性回归模型的多重共线性的修正。
二、实验内容根据书上第四章引子“农业的发展反而会减少财政收入”,1978-2007年的财政收入,农业增加值,工业增加值,建筑业增加值等数据,运用EV软件,做回归分析,判断是否存在多重共线性,以及修正。
三、实验过程:(实践过程、实践所有参数与指标、理论依据说明等)(一)模型设定及其估计经分析,影响财政收入的主要因素,除了农业增加值,工业增加值,建筑业增加值以外,还可能与总人口等因素有关。
研究“农业的发展反而会减少财政收入”这个问题。
设定如下形式的计量经济模型:=+++++++其中,为财政收入CS/亿元;为农业增加值NZ/亿元;为工业增加值GZ/亿元;为建筑业增加值JZZ/亿元;为总人口TPOP/万人;为最终消费CUM/亿元;为受灾面积SZM/千公顷。
图1: 1978~2007年财政收入及其影响因素数据年份财政收入CS/亿元农业增加值NZ/亿元工业增加值GZ/亿元建筑业增加值JZZ/亿元总人口TPOP/万人最终消费CUM/亿元受灾面积SZM/千公顷2004 26396.47 21412.7 65210 8694.3 129988 87032.9 37106 2005 31649.29 22420 76912.9 10133.8 130756 96918.1 38818 2006 38760.2 24040 91310.9 11851.1 131448 110595.3 41091 2007 51321.78 28095 107367.2 14014.1 132129 128444.6 48992利用EV软件,生成、、、、、、等数据,采用这些数据对模型进行OLS回归。
(二)诊断多重共线性1、双击“Eviews”,进入主页。
输入数据:点击主菜单中的File/Open /EV Workfile—Excel—多重共线性的数据.xls ;2、在EV主页界面的窗口,输入“ls y c x2 x3 x4 x5 x6 x7”,按“Enter”.出现OLS回归结果,图2:图2: OLS 回归结果Dependent Variable: Y由此可见,该模型的可决系数为0.995,修正的可决系数为0.993,模型拟和很好,F统计量为701.47,模型拟和很好,回归方程整体上显著。
多重共线性检验与修正
数据来源:《中国统计年鉴2014》12-10、4-3、12-4、12-5、12-8、
Eviews操作:
1、基本操作:
(1)录入数据:命令:data y l m f a ir
(y代表粮食产量,l代表第一产业劳动力数量,m代表农业机械总动力,f代表化肥施用量,a代表农作物总播种面积,ir为有效灌溉面积/农作总播种面积得出的灌溉率)
(2)做线性回归:命令:LS y c l m f a ir
2、检验多重共线性
(1)方差膨胀因子判断法
在生成的线性回归eq01中,view—coefficient diagnostics—variance inflation factors
看生成表格中的Centered VIF,发现L、M、F、A、IR的方差膨胀因子都很大,说明存在严重多重共线性。
(eg:L的Centered VIF指以L为因变量,M、A、F、IR为自变量所做出的辅助回归的判定系数R²,然后1/1-R²得出的值。
)
(由课本内容可知,当完全不共线性时,VIF=1;完全共线性时,VIF=正无穷)(2)相关系数矩阵判断法
命令:cor l m f a ir
这个是通过看各个解释变量之间的相关系数来判断是否存在多重共线性的。
可以看到大多数解释变量之间两两相关系数都大于0.9。
相关系数极大说明解释变量之间存在很高的相关性,因而也就很可能存在共线性。
3、修正多重共线性
(1)逐步回归排除引起共线性的变量
①菜单栏操作
在生成的线性回归eq01中,Estimate—Method—STEPLS
接下来会出现两个框框,上面的框框是固定住不做逐步回归的变量,一般设定为y和c
下面的框框是需要进行逐步回归选择是否剔除的变量,这里填入l m f a ir 然后出来一个新的表格,这个表格已经自动选择了可以保留的变量l a f,剔除了m ir
②命令栏操作
命令:STEPLS y c @ l m f a ir
这条命令其实和菜单栏操作的意思一样,stepls代表采用逐步回归方法,@前的y、c代表固定不做逐步回归的变量,@后的l、m、f、a、ir代表要做逐步回归的变量
出来的结果和菜单栏操作的结果是一样的。
(注:当然,固定保留的变量你也可以根据自己的需要进行选择,只不过一般是固定保留y和c)
做完逐步回归后,按照保留下来的变量,重新做线性回归就可以得到不存在多重共线性的新模型了。
(2)岭回归法减小参数估计量方差
这个方法没法在Eviews做。