计量经济学_庞皓_第二版_第四章_多重共线性(公式详细)
- 格式:ppt
- 大小:1.76 MB
- 文档页数:51
计量经济学课件庞皓第四章简介本文档是关于计量经济学课程中庞皓第四章的课件摘要。
本章重点讲解了关于回归模型的假设检验和模型选择的内容。
通过学习本章,我们将能够对回归模型的假设进行检验,并了解如何选择最合适的模型来解释我们的数据。
回归模型的假设检验回归模型的假设检验是计量经济学中的重要内容,它帮助我们判断我们的回归模型是否有效,以及通过对模型参数的假设进行检验来评估模型的准确性。
本节我们将学习三个重要的假设检验:线性关系、零斜率以及模型中的其他假设。
1. 线性关系的检验在回归模型中,我们假设解释变量和被解释变量之间存在线性关系。
我们可以使用各种统计方法来检验线性关系,其中最常用的方法是利用t统计量对斜率进行假设检验。
具体地,我们对斜率的假设进行如下检验:H0:斜率等于零,即变量之间不存在线性关系。
Ha:斜率不等于零,即变量之间存在线性关系。
我们可以根据t统计量的计算结果,来判断是否拒绝原假设。
2. 零斜率的检验当我们在回归模型中引入一个变量时,我们可以对该变量的斜率进行检验,来判断该变量对模型的解释能力是否显著。
具体地,我们对斜率的假设进行如下检验:H0:斜率等于零,即该变量对模型的解释能力不显著。
Ha:斜率不等于零,即该变量对模型的解释能力显著。
我们可以根据t统计量的计算结果,来判断是否拒绝原假设。
3. 模型中的其他假设检验除了线性关系和零斜率的检验,回归模型中还有其他重要的假设需要进行检验,包括误差项的正态性、异方差性以及自相关性的检验。
这些假设检验对于模型的有效性评估至关重要。
模型选择在计量经济学中,我们常常面临多个模型的选择问题,如何选择最合适的模型来解释我们的数据是一个重要的问题。
本节将介绍两种常用的模型选择方法:最小二乘法(OLS)和信息准则。
1. 最小二乘法(OLS)最小二乘法是回归模型中最常用的估计方法,它通过最小化观测值和模型估计值之间的残差平方和,来得到模型的最优拟合。
最小二乘法通过估计出的模型参数来评估模型的拟合效果,我们可以根据拟合优度以及估计参数的显著性来选择最优模型。
4.1(1) 存在3322ˆˆˆˆβγβα==且。
因为()()()()()()()23223223232322ˆ∑∑∑∑∑∑∑--=ii i i i i ii i i i x x x x x x x y x x y β 当32X X 与之间的相关系数为零时,离差形式的032=∑i i x x 有()()()()222223222322ˆˆαβ===∑∑∑∑∑∑i i ii i i i i x x y x x x x y 同理有:33ˆˆβγ= (2)会的。
(3) 存在()()()()3322ˆvar ˆvar ˆvar ˆvar γβαβ==且。
因为()()∑-=22322221ˆvar r x i σβ当023=r 时,()()()22222232222ˆvar 1ˆvar ασσβ==-=∑∑i i x r x 同理,有()()33ˆvar ˆvar γβ=4.3(1)参数估计结果如下: 093.1275F 991.0 992.0(-4.923) (17.967) (-9.069) ln 0571.1ln 6567.10601.3ˆln 22===-+-=R R CPI GDP Y t(2)数据中有多重共线性,居民消费价格指数的回归系数的符号不能进行合理的经济意义解释,且其简单相关系数呈现正向变动。
(3)分别拟合的回归模型如下:983.0(34.622)(-10.646) ln 187.1745.3ˆln 2=+-=R GDP Y867.0(11.681) (-4.341) PI ln 6638.24424.5ˆln 2=+-=R C Y931.0(16.814) (-1.958) ln 246.2438.1ˆln 2=+-=R CPI P DG单方程拟合效果都很好,回归系数显著,判定系数较高,GDP 和CPI 对进口的显著的单一影响,在这两个变量同时引入模型时影响方向发生了改变;GDP 对CPI 进行回归分析,回归系数显著,判定系数较高,说明GDP 和CPI 有很强的线性关系,这正是原模型多重共线性的原因。
第四章 多重共线性第一节 违背基本假定的一般描述一、基本假定的回顾1、零均值假定。
2、同方差假定。
3、无自相关假定。
4、解释变量与随机误差项不相关。
5、无多重共线性假定。
6、正态性假定。
除此之外,还有一些需要注意的地方,回归模型关于参数线性;在重复抽样中X 值是固定的(或X 是非随机的);X 的值要有变异;模型设定是正确的。
二、假定1和假定6违背的讨论1、违背假定1的情况。
(1)正确理解零均值假定是掌握所有假定的关键(参见Wooldridge ,计量经济学导轮现代观点,pp.23-25)。
(2)假定1不满足的数学描述。
设一元线性回归模型为121212'1212,1,2,,()0,i i i i i i i i i iY X u i nE u k E Y X E u X k k X X ββββββββββ=++==≠=++=++=++=+如果有则有()()()由上式表明,这时在0≠)(i u E 下,改变的只是截距项,而对模型的线性结构并不影响。
(3)对假定1被破坏的解释。
通常在这种情况下,我们认为是变量所取的数据可能出现了异常表现,即有异常值。
因为按照零均值的意义,要求各个散点是均匀地分布在回归线的周围。
修正的方法将在后面虚拟变量部分介绍。
例如,我们分析江苏省社会商品消费品零售总额与江苏省城乡居民可支配收入之间的关系,发现在1991年该省的社会消费品零售总额存在异常值,表现为样本回归模型的残差在1991年有估计值与实际值存在明显的差异。
见下图和下表另一方面,有时通过变量的时序数据的样本折线图也可直接观察到样本是否存在异常表现。
如我们根据全国国有经济单位职工人数(万人)从1952年到1998年的数据绘制了折线图为从图形中我们可以看到,在1958年、1959年、1960年这三年中,全国国有经济单位职工人数存在异常情况,其背景是这几年为国家大跃进时期,国有单位职工人数增加迅速。
因此,要依据这一数据建立模型,零均值假定就不一定成立。
计量经济学课件第四章多重共线性第四章多重共线性1 / 45计量经济学课件第四章 多重共线性 2 / 45引子:发展农业会减少财政收入吗?为了分析各主要因素对财政收入的影响,建立财政收入模型:= β 0 + β1 i + β 2 + β 3 i + β 4 + β 5 i + β 6 i +其中: 财政收入(亿元) ;农业增加值(亿元)工业增加值(亿元); 建筑业增加值(亿元); 总人口(万人); 最终消费(亿元)受灾面积(万公顷)数据样本时期1978年-2007年(资料来源:《中国统计年鉴 2008》,中国统计出版社2008年版)采用普通最小二乘法得到以下估计结果计量经济学课件第四章 多重共线性3 / 45财政收入模型的估计结果农业增加值 工业增加值建 筑业增加值 总人口 最终消费 受灾面积 截距-1.907548.0.342045 0.042746 0.765767 0.091660 0.042807 0.048904 8607.753-5.576888 1.074892 8.433867 1.047591 0.072609 -0.564916 -0.631118.0.0000 0.2936 0.0000 0.3057 0.9427 0.5776 0.53420.0459476.458374 0.096022 0.003108 -0.027627 -5432.507.0.989654 0.986955 1437.448 47523916 -256.7013 1.654140 10049.04 . 12585.51 17.58009 17.90704 366.6801 ()0.000000计量经济学课件第四章 多重共线性4 / 45模型估计与检验结果分析●可决系数为0.9897 ,校正的可决系数为0.9870,模 型拟合很好。
模型对财政收入的解释程度高达98.9%。
●F 统计量为366.68,说明0.05水平下回归方程整体 上显著。
第四章 多重共线性第一节 违背基本假定的一般描述一、基本假定的回顾1、零均值假定。
2、同方差假定。
3、无自相关假定。
4、解释变量与随机误差项不相关。
5、无多重共线性假定。
6、正态性假定。
除此之外,还有一些需要注意的地方,回归模型关于参数线性;在重复抽样中X 值是固定的(或X 是非随机的);X 的值要有变异;模型设定是正确的。
二、假定1和假定6违背的讨论1、违背假定1的情况。
(1)正确理解零均值假定是掌握所有假定的关键(参见Wooldridge ,计量经济学导轮现代观点,pp.23-25)。
(2)假定1不满足的数学描述。
设一元线性回归模型为121212'1212,1,2,,()0,i i i i i i i i i iY X u i nE u k E Y X E u X k k X X ββββββββββ=++==≠=++=++=++=+如果有则有()()()由上式表明,这时在0≠)(i u E 下,改变的只是截距项,而对模型的线性结构并不影响。
(3)对假定1被破坏的解释。
通常在这种情况下,我们认为是变量所取的数据可能出现了异常表现,即有异常值。
因为按照零均值的意义,要求各个散点是均匀地分布在回归线的周围。
修正的方法将在后面虚拟变量部分介绍。
例如,我们分析江苏省社会商品消费品零售总额与江苏省城乡居民可支配收入之间的关系,发现在1991年该省的社会消费品零售总额存在异常值,表现为样本回归模型的残差在1991年有估计值与实际值存在明显的差异。
见下图和下表Dependent Variable: JSSHEHSPMethod: Least SquaresDate: 10/16/04 Time: 09:38Sample: 1980 1998Included observations: 19Variable Coefficient Std. Error t-Statistic Prob.C -70.48491 25.87473 -2.724083 0.0144JSCZNC 0.243263 0.005811 41.85896 0.0000R-squared 0.990391 Mean dependent var 751.2384Adjusted R-squared 0.989826 S.D. dependent var 728.4301S.E. of regression 73.47491 Akaike info criterion 11.53107Sum squared resid 91775.55 Schwarz criterion 11.63048Log likelihood -107.5451 F-statistic 1752.172Durbin-Watson stat 1.905133 Prob(F-statistic) 0.000000另一方面,有时通过变量的时序数据的样本折线图也可直接观察到样本是否存在异常表现。
计量经济学(庞皓)第二版课后思考题答案第一章绪论思考题1.1怎样理解产生于西方国家的计量经济学能够在中国的经济理论研究和现代化建设中发挥重要作用?答:计量经济学的产生源于对经济问题的定量研究,这是社会经济发展到一定阶段的客观需要。
计量经济学的发展是与现代科学技术成就结合在一起的,它反映了社会化大生产对各种经济因素和经济活动进行数量分析的客观要求。
经济学从定性研究向定量分析的发展,是经济学逐步向更加精密、更加科学发展的表现。
我们只要坚持以科学的经济理论为指导,紧密结合中国经济的实际,就能够使计量经济学的理论与方法在中国的经济理论研究和现代化建设中发挥重要作用。
答:计量经济学不仅要寻求经济计量分析的方法,而且要对实际经济问题加以研究,分为理论计量经济学和应用计量经济学两个方面。
理论计量经济学是以计量经济学理论与方法技术为研究内容,目的在于为应用计量经济学提供方法论。
所谓计量经济学理论与方法技术的研究,实质上是指研究如何运用、改造和发展数理统计方法,使之成为适合测定随机经济关系的特殊方法。
应用计量经济学是在一定的经济理论的指导下,以反映经济事实的统计数据为依据,用计量经济方法技术研究计量经济模型的实用化或探索实证经济规律、分析经济现象和预测经济行为以及对经济政策作定量评价。
1.3怎样理解计量经济学与理论经济学、经济统计学的关系?1.4在计量经济模型中被解释变量和解释变量的作用有什么不同?答:在计量经济模型中,解释变量是变动的原因,被解释变量是变动的结果。
被解释变量是模型要分析研究的对象。
解释变量是说明被解释变量变动主要原因的变量。
1.5一个完整的计量经济模型应包括哪些基本要素?你能举一个例子吗?答:一个完整的计量经济模型应包括三个基本要素:经济变量、参数和随机误差项。
例如研究消费函数的计量经济模型:Yαβ某u其中,Y为居民消费支出,某为居民家庭收入,二者是经济变量;α和β为参数;u是随机误差项。
1.6假如你是中央银行货币政策的研究者,需要你对增加货币供应量促进经济增长提出建议,你将考虑哪些因素?你认为可以怎样运用计量经济学的研究方法?答:货币政策工具或者说影响货币供应量的因素有再贴现率、公开市场业务操作以及法定准备金率。