第五章 多重共线性(计量经济学-北京大学,岳昌君)
- 格式:ppt
- 大小:239.50 KB
- 文档页数:24
计量经济学:多重共线性多重共线性52=.53085123 第四章专门讨论古典假定中⽆多重共线性假定被违反的情况,主要内容包括多重共线性的实质和产⽣的原因、多重共线性产⽣的后果、多重共线性的检测⽅法及⽆多重共线性假定违反后的处置⽅法。
第⼀节什么是多重共线性⼀、多重共线性的含义第三章讨论多元线性回归模型的估计时,强调了假定⽆多重共线性,即假定各解释变量之间不存在线性关系,或者说各解释变量的观测值之间线性⽆关。
在计量经济学中所谓的多重共线性(Multi-Collinearity),不仅包括解释变量之间精确的线性关系,还包括解释变量之间近似的线性关系。
从数学意义上去说明多重共线性,就是对于解释变量k X 、、X X 32,如果存在不全为0的数k λλλ,2,1 ,能使得n ,2, ,1i 033221 ==++++ki k i i X X X λλλλ ( 4.1 )则称解释变量k X X X ,,,32 之间存在着完全的多重共线性。
⽤矩阵表⽰,解释变量的数据矩阵为X=213112232223111k k nnkn X X X X X X X X X ??(4.2)当Rank(X )在实际经济问题中,完全的多重共线性并不多见。
常见的情形是解释变量k X X X ,,,32 之间存在不完全的多重共线性。
所谓不完全的多重共线性,是指对于解释变量k X 、、X X 32,存在不全为0的数k λλλ,2,1 ,使得n ,2, ,1i 033221 ==+++++i ki k i i u X X X λλλλ(4.3)其中,i u 为随机变量。
这表明解释变量k X 、、X X 32只是⼀种近似的线性关系。
如果k 个解释变量之间不存在完全或不完全的线性关系,则称⽆多重共线性。
若⽤矩阵4表⽰,这时X 为满秩矩阵,即Rank(X )=k 。
需要强调,解释变量之间不存在线性关系,并⾮不存在⾮线性关系,当解释变量存在⾮线性关系时,并不违反⽆多重共线性假定。
一.研究的目的要求近年来,随着中国经济的不断发展,我国的国内生产总值保持着高速增长,其作为衡量经济发展的一个重要指标,在整个经济社会发展中的作用日益显著。
中国的国内生产总值主要受到居民消费水平、全社会固定资产投资、商品出口额财政收入、财政支出和就业人员数的影响。
就从1995年到2008年间,我国的GDP的平均年增长速度为112.1%,而与之有关的居民消费水平的年平均增长速度为109.3%,全社会固定资产投资的年平均增长速度为116.7%,商品出口额的年平均增长速度为116.1%,由此可以看出我国的经济是以非常惊人的速度在发展。
为了认识中国在未来经济发展情况,需要定量地对影响我国GDP的主要因素进行分析。
散点图:利用EViews软件,输入Y、X1、X2、X3、X4、X5、X6等数据,采用这些数据对模型进行OLS回归,结果如下:由此可见,该模型的R2=0.999909,Adjusted R-squared=0.999832可决系数异常高,F检验值12865.89,明显显著。
但是当α=0.05时查表的T值万为2.365,不仅X3的T检验不显著,而且X5系数的符号与预期的相反,这表明很可能存在严重的多重共线性。
二、相关分析令国内生产总值为Y,居民消费水平为X1,固定资产投资为X2,出口总额为X3,财政收入为X4,财政支出为X5,就业人员数为X6,有e-views软件可以得到各变量之间的相关系数:表三由相关系数矩阵可以看出,各解释变量相互之间的相关系数很高,证实确实存在严重的多重共线性。
三、修正多重共线性1、判定系数法:2、采用逐步回归的办法,去检验和解决多重共线的问题。
分别做Y对X1、X2、X3、X4、X5、X6的一元线性回归,根据比较系数由大到小排序为:x4、x1、x5、x2、x3、x6X5、x2导致不显著,删最后修正严重多重共线性的回归结果为Y = 2434.07753 + 1.728188114*X4 + 17.97396022*X1 + 0.4320065441*X3随机解释变量问题:检验内生性:第一步:X1 = 1156.103781 + 0.4979871065*X1(-1) + 0.005053326594*X3 + 0.04818665208*X4X3 = -50406.28441 + 1.161928962*X3(-1) + 23.11627169*X1 - 2.273365012*X4X4 = -11019.22777 + 0.5056267614*X4(-1) + 4.854749225*X1 +0.06574184046*X3第二步:Y = 6347.819234 + 16.24766676*X1 + 0.4428944999*X3 + 1.876605301*X4 + 7.026642473*E1Y = 7149.553219 + 15.97797479*X1 + 0.5300464217*X3 + 1.744257955*X4 - 0.176056636*E3Y = 45699.73211 - 1.456575031*X1 + 0.4044678757*X3 + 3.685902148*X4 - 2.36392959*E4X4有内生性工具变量法:第一阶段:X4 = -792.8862088 + 1.249459681*X4(-1)第二步:Y = 15755.17718 + 11.99382105*X1 + 0.2558015318*X3 + 2.738892206*X4F。
第五讲 多重共线性本讲分为两个部分:第一部分是对相关性问题的研究,作为多重共线性问题的基础,第二部分则是对多重共线性问题展开讨论。
第一部分:相关理论 1.相关理论相关分析是研究变量间相互关系的最基本方法。
从相关分析中引出的相关系数是回归分析的一个基本统计量。
掌握它有助于对经济问题和经济计量模型的分析与理解。
1.1 相关的定义与分类定义:相关(correlation )指两个或两个以上变量间相互关系的程度或强度。
分类:①按强度分完全相关:变量间存在函数关系。
例,圆的周长,L = 2πr 。
高度相关(强相关):变量间近似存在函数关系。
例,我国家庭收入与支出的关系。
弱相关:变量间有关系但不明显。
例,近年来我国耕种面积与产量。
零相关:变量间不存在任何关系。
例,某班学生的学习成绩与年龄。
2004006008001020304050YX121020304050YX0.51.01.52.02.53.02.02.53.03.54.04.5YX完全相关 高度相关、线性相关、正相关 弱相关②按变量个数分按形式分:线性相关, 非线性相关 简单相关:指两个变量间相关按符号分:正相关, 负相关, 零相关 复相关(多重相关和偏相关):指三个或三个以上变量间的相关。
05010015020050100150200250YX 121020304050Y X-4-224-4-224YX非线性相关 负相关 零相关因非线性相关可以转化为线性相关处理,而复相关又可看作是简单相关基础上的拓展,所以后面重点介绍简单线性相关。
1.2 简单线性相关的度量用简单线性相关系数,简称相关系数(correlation coefficient )度量两个变量间的线性相关强度,用表示。
的随机变量表达式是=)()()(t t t t y D x D y ,x Cov 。
的统计表达式是=∑∑∑===----Tt y t Tt x t Tt y t x t y Tx Ty x T 12121)(1)(1))((1μμμμ=∑∑∑===----T t y t T t x t Tt y t x t y x y x 12121)()())((μμμμ其中T ,总体容量;x t , y t ,变量的观测值;μx ,μy ,变量观测值的均值。