实验六多元线性回归和多重共线性

  • 格式:doc
  • 大小:915.48 KB
  • 文档页数:8

下载文档原格式

  / 8
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

实验六多元线性回归和多重共线性

姓名:何健华 学号:201330110203 班级:13金融数学2班

一 实验目的:

掌握多元线性回归模型的估计方法、掌握多重共线性模型的识别和修正。

二 实验要求:

应用教材P140例子4.3.1案例做多元线性回归模型,并识别和修正多重共线性。

三 实验原理:

普通最小二乘法、简单相关系数检验法、综合判断法、逐步回归法。

四 预备知识:

最小二乘法估计的原理、t 检验、F 检验、R 2值。

五 实验步骤:

有关的研究分析表明,影响国内旅游市场收入的主要因素,除了国内旅游人数和旅游支出外,还可能与基础设施有关。因此考虑影响国内旅游收入Y (单位为亿元)的以下几个因素:国内旅游人数X1、城镇居民人均旅游支出X2(单位为元)、农村居民人均旅游支出X3(单位为元)、并以公路里程X4(单位为万公里)和铁路里程X5(单位为万公里)作为相关设施的代表,根据这些变量建立如下的计量经济模型:

01122334455y x x x x x ββββββμ=++++++

为了估计上述模型,从《中国统计年鉴》收集到1994年到2003年的有关统计数据。

Year Y X1 X2 X3 X4 X5

1994 1023.5 52400 414.7 54.9 111.78 5.9

1995 1375.7 62900 464 61.5 115.7 5.97

1996 1638.4 63900 534.1 70.5 118.58 6.49

1997 2112.7 64400 599.8 145.7 122.64 6.6

1998 2391.2 69450 607 197 127.85 6.64

1999 2831.9 71900 614.8 249.5 135.17 6.74

2000 3175.5 74400 678.6 226.6 140.27 6.87

2001 3522.4 78400 708.3 212.7 169.8 7.01

2002 3878.4 87800 739.7 209.1 176.52 7.19

2003 3442.3 87000 684.9 200 180.98 7.3

1、 请用普通最小二乘方法估计模型参数;

2、 检验模型是否存在多重共线性,如果存在共线性,试采用适当的方法消除共线性。

1. 用普通最小二乘方法估计模型参数

1.1设定并估计多元线性回归模型

01122334455y x x x x x ββββββμ=++++++ ------- (1-1)

1.2建立工作工作文件并录入数据,得到图1.1。

图1.1

点击主界面菜单Quick\Estimate Equation ,在弹出的对话框中输入Y C X1 X2 X3 X4 X5,点击确定即可得到回归结果图1.2。

图1.2

由图1.2数据结果,可得到模型(1-1)的估计结果为

12345274.37730.013088 5.438193 3.27177312.98624563.1077y x x x x x =-++++- (-0.208384) (1.031172) (3.939591) (3.465073) (3.108296) (-1.752685) ()220.995406,0.989664,.. 2.311565,173.3525,5,4R R DW F df ===== 其中,括号内的数为相应的t 检验值。从以上回归结果可以看出,拟合优度很高,整体效果的F 检验通过,但有重要变量X1、X5的t 检验不显著,而且符合的经济意义也不合理,故认为解释变量之间存在多重共线性。

2.检验模型是否存在多重共线性,如果存在共线性,试采用适当的方法消除共线性。

2.1多重共线性模型的识别

2.1.1综合判断法

由模型(1-1)的估计结果可以看出,220.995406,0.989664R R ==,可决系数很高,说明模型对样本的拟合很好;173.3525F =检验值很大,相应的0.00092p =,说明回归方程显著,即各自变量联合起来确实对因变量“国内旅游收入”有显著影响;给定显著性水平0.05,α=但变量X1、X5系数的t 统计量分别为1.031172、-1.752685,相应的p 值分别为0.8451、0.1545,说明变量X1、X5对因变量影响不显著,而且符号的经济意义也不合理。

综合上述分析,表明模型(1-1)存在严重的多重共线性。

2.1.2简单相关系数检验法

计算解释变量X1、X2、X3、X4、X5的简单相关系数矩阵。

将解释变量X1、X2、X3、X4、X5选中,双击Open Group (或点击右键,选择Open\as Group ),然后再点击View\Covariance analysis\仅勾选Correlation ,点击OK 即可得出相关系数矩阵(图2.1.1)。再点击顶部的Freeze 按钮,可以得到一个Table 类型独立的Object (图2.1.2)。

图2.1.1

图2.1.2

由图2.1.1相关系数矩阵可以看出,各解释变量之间的相关系数较高,特别是X2和X5之间的高度相关,证实解释变量之间存在多重共线性。

根据综合判别法与简单相关系数法分析的结果可以知道,回归变量间确实存在多重共线性。注意,多重共线性是一个程度问题而不是存在与否的问题。下面我们将采用逐步回归法来减少共线性的严重程度而不是彻底地消除它。

2.2多重共线性模型的修正

这里仅用向前逐步回归法,来减少共线性的严重程度。

第一步:运用OLS方法分别求Y对各解释变量X1、X2、X3、X4、X5进行一元回归。五个方程的回归结果详见图2.2.1——图2.2.5,再结合经济意义和统计检验选出拟合效果好的一元线性回归方程。

图2.2.1 图2.2.2

图2.2.3 图2.2.4