多重共线性的检验与处理

  • 格式:doc
  • 大小:27.00 KB
  • 文档页数:4

下载文档原格式

  / 8
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

实验名称:多重共线性的检验与处理

实验时间:2011.12.10

实验要求:

主要是学习多重共线性的检验与处理,主要是研究解释变量与其余解释变量之间有严重多重共线性的模型,分析变量之间的相关系数。通过具体案例建立模型,然后估计参数,求出相关的数据。再对模型进行检验,看数据之间是否存在多重共线性。最后利用所求出的模型来进行修正。

实验内容:

实例:我国钢材供应量分析

通过分析我国改革开放以来(1978-1997)钢材供应量的历史资料,可以建立一个单一方程模型。根据理论及对现实情况的认识,影响我国钢材供应量 Y(万吨)的主要因素有:原油产量X1(万吨),生铁产量X2(万吨),原煤产量X3(万吨),电力产量X4(亿千瓦小时),固定资产投资X5(亿元),国内生产总值

X6(亿元),铁路运输量X7(万吨)。

(一)建立我国钢材供应量的计量经济模型:

(二)估计模型参数,结果为:

Dependent Variable: Y

Method: Least Squares

Date: 11/02/09 Time: 16:09

Sample: 1978 1997

Included observations: 20

Variable Coefficient Std. Error t-Statistic Prob.

C 139.2362 718.2493 0.193855 0.8495

X1 -0.051954 0.090753 -0.572483 0.5776

X2 0.127532 0.132466 0.962751 0.3547

X3 -24.29427 97.48792 -0.249203 0.8074

X4 0.863283 0.186798 4.621475 0.0006

X5 0.330914 0.105592 3.133889 0.0086

X6 -0.070015 0.025490 -2.746755 0.0177

X7 0.002305 0.019087 0.120780 0.9059

R-squared 0.999222 Mean dependent var 5153.350

Adjusted R-squared 0.998768 S.D. dependent var 2511.950

S.E. of regression 88.17626 Akaike info criterion 12.08573

Sum squared resid 93300.63 Schwarz criterion 12.48402

Log likelihood -112.8573 F-statistic 2201.081

Durbin-Watson stat 1.703427 Prob(F-statistic) 0.000000

由此可见,该模型可绝系数很高,F检验值2201.081,明显显著。但当,系数的t检验不显著,而且系数的符号与预期的相反,这表明很可能存在严重的多重共线性。

(三)计算各解释变量的相关系数,选择数据,得相关系数矩阵(表3.1)。

表3.1 相关系数矩阵

X2 X3 X4 X5 X6 X7

X2 1.000000 0.964400 0.994921 0.969686 0.972530 0.931689

X3 0.964400 1.000000 0.974809 0.894963 0.913344 0.982943

X4 0.994921 0.974809 1.000000 0.959613 0.969105 0.945444

X5 0.969686 0.894963 0.959613 1.000000 0.996169 0.827643

X6 0.972530 0.913344 0.969105 0.996169 1.000000 0.846079

X7 0.931689 0.982943 0.945444 0.827643 0.846079 1.000000

由相关系数矩阵可以看出,各解释变量相互之间的相关系数较高,证实确实存在严重多重共线性。

(四)修正多重共线性

采用逐步回归的办法,去检验和解决多重共线性问题。分别做Y对的一元回归,结果如表3.2所示

表3.2 一元回归结果

变量

参数估计

量 1.181784 0.926212 926.7178 0.884047 0.572451 0.108665 0.106826

t统计

量 10.10629 57.82017 15.87243 62.49381 15.47892 16.54535 11.45524

0.850171 0.994645 0.933317 0.995412 0.930123 0.938303 0.879375

0.841847 0.994347 0.929612 0.995157 0.926241 0.934875 0.872673

其中,加入的方程最大,以为基础,顺次加入其他变量逐步回归,结果如表3.3所示。

表3.3 加入新变量的回归结果(一)

变量 X1 X2 X3 X4 X5 X6 X7

X4、X1 -0.074944

(-1.359593) 0.932329

(24.46548)

0.995375

X4、X2 0.429201

(3.895858) 0.476623

(4.534407) 0.997291

X4、X3 -125.0949

(-1.960538) 0.996689

(16.91041) 0.995818

X4X5 0.808630

(16.81022) 0.052646

(1.633786) 0.995568

X4、X6 0.858914

(14.63712)

0.003283

(0.441961) 0.994931

X4、X7 0.927639

21.44406

-0.005928

(-1.065860) 0.995194

经比较,新加入的方程 =0.997291,改进最大,而且各参数的t检验显著,选择保留 ,再加入其他新变量逐步回归,结果如表3.4所示:

表3.4 加入新变量的回归结果(二)

X1 X2 X3 X4 X5 X6 X7

X4、X2、X1 -0.052631

-1.255622 0.409652

3.742505 0.529087

4.745215 0.997380

X4、X2、X3 0.386819

3.559933 -81.25478

-1.604227 0.590021

4.800056 0.997521

在、基础上加入后的方程增大,但参数的t检验不显著,甚至的符号也变得不合理。加入后的方程增大,但参数的t检验不显著,甚至的符号也变得不合理。加入后的方程下降,而且参数的t检验不显著。加入后的方程下降,而且参数的t检验不显著,甚至的符号也变得不合理。加入后的方程下降,而且参数的t检验不显著,甚至的符号也变得不合理。这说明、、、、引起严重多重共线性,应予剔除。