2019年1计量经济学作业多重共线性p171.doc复习进程
- 格式:doc
- 大小:442.00 KB
- 文档页数:14
计量经济学之多重共线性引言多重共线性是计量经济学中一个重要的概念,在经济学研究中扮演着重要的角色。
在本文中,我们将深入探讨多重共线性的概念、原因和影响,并介绍一些常见的解决方案和应对方法。
什么是多重共线性?多重共线性是指在回归分析中,自变量之间存在高度相关性的情况。
具体来说,多重共线性指的是自变量之间线性相关性较高,可能导致回归分析的结果不准确或难以解释。
多重共线性的原因多重共线性的产生有多种原因,以下是一些常见的原因:1.样本选择偏倚:当样本中存在特定的特征或者数据的选择方式导致一些变量的相关性增强。
2.变量的定义重复:有些变量可能在定义上重复,导致它们之间存在高度相关性。
3.缺少重要变量:当回归模型中存在遗漏的重要变量时,其他变量可能会代替这些遗漏的变量,导致多重共线性。
4.数据测量误差:测量误差也可能导致自变量之间存在高度相关性。
多重共线性的影响多重共线性可能会对回归模型产生一系列的问题和影响:1.估计系数不准确:多重共线性会导致回归系数的估计不准确,使得对自变量的解释变得困难。
2.系数符号相反:多重共线性可能导致估计系数的符号与理论预期相反。
3.误差项的方差增加:多重共线性会导致误差项的方差增加,从而降低了模型的精确度。
4.解释力度减弱:多重共线性会降低模型的解释力度,使得我们难以解释模型的结果。
解决多重共线性的方法针对多重共线性问题,我们可以采取以下方法来解决:1.增大样本量:增大样本量可以降低变量之间的相关性,从而减轻多重共线性的影响。
2.删除相关变量:通过检验变量之间的相关性,删除相关性较高的变量,可以减轻多重共线性的程度。
3.主成分分析:主成分分析是一种降维的方法,可以将相关性较高的变量合并为一个主成分,从而避免了多重共线性的问题。
4.增加惩罚项:在回归模型中增加惩罚项,如岭回归或lasso回归,可以减轻多重共线性的影响。
5.使用时间序列数据:对于存在多重共线性的房地产数据等时间序列数据,可以使用时间序列模型来避免多重共线性的问题。
计量经济学试题计量经济学中的多重共线性问题与解决方法计量经济学试题-多重共线性问题与解决方法在计量经济学中,多重共线性是一个重要的问题。
它指的是当两个或多个自变量之间存在高度相关性时,会导致模型估计的结果不准确或者不可靠。
多重共线性问题在经济学研究中经常出现,因此探索解决方法是非常必要的。
一、多重共线性问题的原因多重共线性问题通常由于样本中的自变量之间存在强烈的线性相关性而引发。
例如,当一个自变量可以通过其他自变量的线性组合来表示时,就会出现多重共线性问题。
这种情况下,模型估计的结果会变得不稳定,标准误差会变得很大,使得对自变量的解释变得困难。
二、多重共线性问题的影响多重共线性问题对计量经济模型的影响是多方面的。
首先,它会导致模型估计结果的不稳定性。
当自变量之间存在高度相关性时,即使是微小的样本误差也会导致模型估计结果的显著变化。
其次,多重共线性问题会导致标准误差的上升,使得参数的显著性检验变得困难。
最后,多重共线性问题还会导致模型解释力的下降,使得对自变量对因变量的影响进行准确的解释变得困难。
三、解决多重共线性问题的方法1. 删除变量:当发现自变量之间存在高度相关性时,一种解决方法是删除其中一个变量。
如果某个自变量可以用其他变量线性表示,就可以考虑将其删除。
然而,删除变量的过程需要谨慎,以免造成结果的失真。
2. 采用主成分分析:主成分分析是一种常用的处理多重共线性问题的方法。
它通过对自变量进行线性组合,生成新的主成分变量,从而消除原始自变量之间的相关性。
通过采用主成分分析,可以得到一组无关的自变量,从而解决多重共线性问题。
3. 利用岭回归:岭回归是一种通过增加正则化项来减小模型参数估计标准误差的方法。
通过岭回归,可以有效地解决多重共线性问题。
岭回归对相关自变量的系数进行惩罚,从而减小系数估计的方差。
这种方法可以提高模型的准确性和稳定性。
4. 使用其他估计方法:在实际应用中,还可以采用其他估计方法来解决多重共线性问题。
计量经济学作业——多重共线性P1718.下表是被解释变量Y,解释变量X1,X2,X3,X4的时间序列观测值:时间序列观测值表序号3 6.5 47.5 5.2 108 864 7.1 49.2 6.8 100 1005 7.2 52.3 7.3 99 1076 7.6 58.0 8.7 99 1117 8.0 61.3 10.2 101 1148 9.0 62.3 14.1 97 1169 9.0 64.7 17.1 93 11910 9.3 66.8 21.3 102 121(1)采用适当的方法检验多重共线性。
(2)多重共线性对参数估计值有何影响?(3)用Frisch法确定一个较好的回归模型。
解:(1)采用参数估计值的统计检验法检验多重共线性。
用OLS最小二乘法,估计被解释变量Y与解释变量X1,X2,X3,X4的样本方程,如下所示:图1-1 在Eviews中建立样本回归模型图1-2 样本回归模型数据表输入被解释变量与解释变量:图1-3 整体样本回归模型建立用最小二乘法求得结果如下所示:图1-4 Eviews的结果分析一元线性样本回归方程为:1.拟合优度检验由上表可知,样本可决系数为:R-squared=0.978915修正样本可决系数为:Adjusted-squared=0.962046即计算结果表明,估计的样本回归方程较好的拟合了样本观测值。
2.F检验提出检验的原假设为对立假设为由图1-4,得F统计量为F-statistic=58.03254对于给定的显著性水平α=0.05,查出分子自由度为4,分母自由度为5的F分布上侧分位数F0.05(4,5)=5.19。
因为F=58.03254>5.19,所以否定H0,总体回归方程显著。
3.t检验提出检验的原假设为由上表可知,t统计量为β0的t-statistic=1.975329β1的t-statistic=1.149646β2的t-statistic=2.401806β3的t-statistic=-0.662938β4的t-statistic=0.472622对于给定的显著性水平α=0.05,查出自由度v=5的t分布双侧分位数t0.05/2(5)=2.57。
计量经济学:多重共线性12第四、五、六章将讨论的主题。
农业和建筑业的发展会减少财政收入吗?国家财政收入主要来自各项税收收入,经济增长是其重要的影响因素。
为了分析各主要因素对国家财政收入的影响,建立财政收入(亿元) (CS)为被解释变量,农业增加值(亿元)(NZ)、工业增加值(亿元)(GZ)、建筑业增加值(亿元)(JZZ)、总人口(万人)(TPOP)、最终消费(亿元)(CUM)、受灾面积(万公顷)(SZM)等为解释变量的计量模型。
数据样本时期为1978年-2003年共26个年份的统计数据(资料来源:《中国统计年鉴2004》,中国统计出版社2004年版)设定的理论模型为:i i i i i i i i u SZM CUM TPOP JZZ GZ NZ CS +++++++=6543210βββββββ采用普通最小二乘法得到以下估计结果关于财政收入的多元回归结果 Variable Coefficient Std. Error t-Statistic Prob. 农业增加值 -1.535090 0.129778 -11.82861 0.0000 工业增加值 0.898788 0.245466 3.661558 0.0017 建筑业增加值-1.527089 1.206242 -1.2659890.2208 总人口 0.151160 0.033759 4.477646 0.0003 最终消费 0.101514 0.1053290.9637830.3473 受灾面积 -0.036836 0.018460 -1.995382 0.0605 截距项-11793.343191.096 -3.6957040.0015R-squared0.995015 Mean dependent var 5897.824 Adjusted R-squared 0.993441 S.D. dependent var 5945.854 S.E. of regression 481.5380 Akaike infocriterion15.41665Sum squared resid 4405699. Schwarz criterion 15.75537 Log likelihood -193.4165 F-statistic 632.0999 Durbin-Watson stat1.873809 Prob(F-statistic)0.000000 从主要指标分析可见,可决系数为0.995,校正的可决系数为0.993,模型拟合很好。
2019年1计量经济学作业多重共线性
p171.d o c
计量经济学作业
——多重共线性P171
8.下表是被解释变量Y,解释变量X1,X2,X3,X4的时间序列观测值:
时间序列观测值表
3 6.5 47.5 5.2 108 86
4 7.1 49.2 6.8 100 100
5 7.2 52.3 7.3 99 107
6 7.6 58.0 8.
7 99 111
7 8.0 61.3 10.2 101 114
8 9.0 62.3 14.1 97 116
9 9.0 64.7 17.1 93 119
10 9.3 66.8 21.3 102 121
(1)采用适当的方法检验多重共线性。
(2)多重共线性对参数估计值有何影响?
(3)用Frisch法确定一个较好的回归模型。
解:(1)采用参数估计值的统计检验法检验多重共线性。
用OLS最小二乘法,估计被解释变量Y与解释变量X1,X2,X3,X4的样本方程,如下所示:
图1-1 在Eviews中建立样本回归模型
图1-2 样本回归模型数据表
输入被解释变量与解释变量:
图1-3 整体样本回归模型建立
用最小二乘法求得结果如下所示:
图1-4 Eviews的结果分析一元线性样本回归方程为:
1.拟合优度检验
由上表可知,样本可决系数为:
R-squared=0.978915
修正样本可决系数为:
Adjusted-squared=0.962046
即
计算结果表明,估计的样本回归方程较好的拟合了样本观测值。
2.F检验
提出检验的原假设为
对立假设为
由图1-4,得F统计量为
F-statistic=58.03254
对于给定的显著性水平α=0.05,查出分子自由度为4,分母自由度为5的F分布上侧分位数F0.05(4,5)=5.19。
因为
F=58.03254>5.19,所以否定H0,总体回归方程显著。
3.t检验
提出检验的原假设为
由上表可知,t统计量为
β0的t-statistic=1.975329
β1的t-statistic=1.149646
β2的t-statistic=2.401806
β3的t-statistic=-0.662938
β4的t-statistic=0.472622
对于给定的显著性水平α=0.05,查出自由度v=5的t分布双侧分位数t0.05/2(5)=2.57。
t0=1.975329<2.57= t0.05/2(5),所以否定H1,β0显著等于0。
t1=1.149646<2.57=t0.05/2(5),所以否定H1,β1显著等于0。
t2=2.401806<2.57= t0.05/2(5),所以否定H1,β0显著等于0。
|t3|=0.662938<2.57= t0.05/2(5),所以否定H1,β0显著等于0。
t4=0.472622<2.57= t0.05/2(5),所以否定H1,β0显著等于0。
该模型的拟合优度较大,总体线性关系显著,但回归系数在统计上均不显著,即t检验绝对值过小,说明模型存在多重共线性。
(2)多重共线性对参数估计值的影响
多元线性回归模型中如果存在完全的多重共线性,则参数的最小二乘估计量是不确定的,其标准差为无穷大;如果存在近似的多重共线性,则参数的最小二乘估计量是确定的,而且具有无偏性,但其方差较大,常导致参数估计值不精确,不稳定,样本观测值稍有变动,增加或减少的解释变量等都会使参数估计值发生较大变化,甚至出现符号错误,从而不能正确反映解释变量对被解释变量的影响,参数估计量的标准差较大,使参数t假烟增加了接受零假设的可能,从而舍去对被解释变量有显著影响的解释变量。
(3)用Frisch法修正多重共线性
1.对Y分别关于X1,X2,X3,X4作最小二乘回归,其步骤与结果如下所示:
图1-5 Y与X1的最小二乘回归
图1-6 Eviews的结果分析得:
图1-7 Y与X2的最小二乘回归
图1-8 Eviews的结果分析得:
图1-9 Y与X3的最小二乘回归
图1-10 Eviews的结果分析
得:
图1-11 Y与X4的最小二乘回归
图1-12 Eviews的结果分析
得:
根据回归结果易知X1是最重要的解释变量,所以选取第一个回归方程为基本方程。
2.加入X2,对Y关于X1,X2作最小二乘回归,得:
图1-13 Y与X1,X2的最小二乘回归
图1-14 Eviews的结果分析得:
可以看出,加入X2后,拟合优度有所增加,参数估计值的符号也正确,并且没有影响X1的显著性,所以在模型中保留X1。
3.加入X.4,对Y关于X1,X2,X4作最小二乘回归,得:
图1-15 Y与X1,X2,X4的最小二乘回归
图1-16 Eviews的结果分析
得:
可以看出,在加入X4后,拟合优度R2增加不显著,调整后的R2有所减小,并且X1和X4系数均不显著,说明存在严重的多重共线性,在模型中保留X1,略去X4。