高级计量经济学复习精要
- 格式:doc
- 大小:1.55 MB
- 文档页数:28
计量经济学期末复习提纲(红色部分要注意)绝密!!计量经济学复习提纲第一章绪论一、计量经济学的含义二、计量经济学与其他学科的联系与区别三、计量经济学的内容体系四、计量经济学的研究步骤五、计量经济学的发展概况需要掌握的主要内容1.如何理解计量经济学?(研究对象、理论基础、与经济学的区别、所研究变量的特点)计量经济学是经济学的一个分支,(起因:对经济问题的定量研究名词:1926年弗瑞希仿造出“Biometrics” “Econometrics”标志:1930年成立计量经济学会 1933年创刊《Econometrica》说明:“计量经济学” “经济计量学”)“用数学方法探讨经济学可以从好几个方面着手,但任何一个方面都不能和计量经济学混为一谈。
计量经济学与经济统计学绝非一码事;它也不同于我们所说的一般经济理论,尽管经济理论大部分具有一定的数量特征;计量经济学也不应视为数学应用于经济学的同义语。
经验表明,统计学、经济理论和数学这三者对于真正了解现代经济生活的数量关系来说,都是必要的,但本身并非是充分条件。
三者结合起来,就是力量,这种结合便构成了计量经济学。
”2.狭义计量经济学研究的是具有因果关系的经济现象,用的是回归的分析方法。
3.计量经济学的建模步骤?一、理论模型的设计: 确定模型包含的变量;确定模型的数学形式;拟定模型中待估计参数的理论期望值区间二、样本数据的收集三、模型参数的估计四、模型的检验计量经济学模型成功的三要素 :理论,数据,方法,三者缺一不可.4.选择解释变量时需要注意的问题:(1)根据经济规律确定变量的数目(2)考虑数据的可得性(3)考虑所有入选变量的关系,要求各变量独立。
---否则会引起多重共线性5.如何确定模型的数学形式?(1)根据经济理论(2)画散点图(3)试模拟6.什么是时间序列数据?在不同时间点上收集到的数据,这类数据反映了某一事物、现象等随时间的变化状态或程度。
如我国国内生产总值从1949到2009的变化就是时间序列数据。
第一章高级计量经济学4 1.数据类型:42.经验经济分析的步骤:4 第二章简单回归模型41.回归分析(regression analysis):42.回归分析的主要内容包括:43.变量间的关系:44.变量关系的描述:45.相关关系的类型:46.线性相关的程度:57.回归分析的意义:58.总体回归线(population regression line )/总体回归曲线(population regression curve ):在给定解释变量Xi 条件下被解释变量Yi 的期望轨迹。
59.总体回归函数(PRF):E (y ∣x )=β0+β1x,510.随机干扰项(stochastic disturbance )或随机误差项(stochastic error ):511.样本回归方程(SRF ):01ˆˆˆi i y x =β+β 512.拟合值:当x=i 时,y 通过样本回归方程算出来的值。
即01ˆˆˆi i y x =β+β 5 13.样本回归模型(sample regression model ):01ˆˆˆi i i iY Y u X e =+=β+β+ 5 14.回归分析的主要目的:根据样本回归函数SRF ,估计总体回归函数PRF 。
6 第三章:简单回归方程分析61.简单回归方程:62.线性的含义:63.OLS 斜率估计,β0和β1的普通最小二乘估计值的推算:64.OLS 法是要找到一条直线,使残差平方和最小。
75.残差:是对误差项的估计,因此,它是拟合直线(样本回归函数)和样本点之间的距离。
76.OLS 统计量的代数性质:77.SST=SSE+SSR :88.拟合优度:来衡量样本回归线是否很好地拟合了样本数据的指标。
89.判定系数:解释变异与总变异之比。
即y 的样本变异中被x 解释的部分。
8 10.测量单位:811.在简单回归中加入非线性因素(因变量为对数):8 12.OLS 的基本假设:913.定理2.1: OLS 的无偏性:914.定理2.2 OLS 估计量的抽样方差:9 15.定理2.3:σ²的无偏估计1016.回归标准误差:ˆσ17.1ˆβ的标准误:11221ˆˆ()(())ni i se x x =σβ==-∑10第四章多元回归分析101.多元回归分析的优点:102.多元线性回归模型:103.多元线性回归的OLS估计值:104.SRF样本回归函数:115.拟合值和残差11ˆβ的计算116.偏效应以及17.比较简单回归和多元回归估计值:128.拟合优度(SST、SSR、SSE、R2):139.过原点的回归:1310.多元回归模型的假定及定理3.1、定理3.2:1411.多重共线性:两个或多个自变量之间高度(但不完全)相关。
计量经济学精要重点什么是OLS估计?原理ols估计是指样本回归函数尽可能好的拟合这组织,即样本回归线上的点与真实观测点的总体误差尽可能小的估计方法。
一、什么是计量经济学?答:计量经济学以经济理论为指导,以事实为依据,以数学和统计学为方法,以电脑技术为工具,从事经济关系与及经济活动数量规律的研究,并以建立和应用随机性的经济计量模型为核心的一门经济学科。
计量经济学模型揭示经济活动中各种因素之间的定量关系,用随机性的数量方程加以描述。
二、建立计量经济学模型的步骤和要点1.理论模型的设计(确定模型所包含的变量,确定模型的数量形式,拟定理论模型中的待估参数的理论期望值)2.样本数据的收集(常用的样本数据:时间序列数据,截面数据,虚变量数据)3.模型参数的估计(选择模型参数估计方法,应用软件的使用)4.模型的检验模型的检验包括几个方面?其具体含义是什么?答:模型的检验主要包括:经济意义检验、统计检验、计量经济学检验、模型的预测检验。
经济意义检验——需要检验模型是否符合经济意义,检验求得的参数估计值的符号与大小是否与根据人们的经验和经济理论所拟订的期望值相符合;统计检验——需要检验模型参数估计值的可靠性,即检验模型的统计学性质;计量经济学检验——需要检验模型的计量经济学性质,包括随机扰动项的序列相关检验、异方差性检验、解释变量的多重共线性检验等;模型的预测检验——主要检验模型参数估计量的稳定性以及对样本容量变化时的灵敏度,以确定所建立的模型是否可以用于样本观测值以外的范围。
5.模型成功的三要素:理论、方法、数据三、计量经济学模型的应用方面(功能)答:结构分析,经济预测,政策评价,检验与发展经济理论四、引入随机干扰项的原因,内容?原因:1.代表未知的影响因素2.代表数据观测误差3.代表残缺数据4.代表模型设定误差5.代表众多细小影响因素6.变量的内在随机性内容:1.被遗漏的影响因素(由于研究者对客观经济现象了解不充分,或是由于经济理论上的不完善,以至于使研究者在建立模型时遗漏了一些对被解释变量有重要影响的变量);2.变量的测量误差(在观察和测量变量时,种种原因使观测值并不等于他的真实值而造成的误差);3.随机误差(在影响被解释变量的诸因素中,还有一些不能控制的因素);4.模型的设定误差(在建立模型时,由于把非线性关系线性化,或者略去模型)五、什么是随机误差项和残差,他们之间的区别是什么随机误差项u=Y-E(Y/X),而总体回归函数Y=Y^+e,其中e就是残差,利用Y^估计Y时带来的误差e=Y-Y^是对随机变量u的估计六、一元线性回归模型的基本假设主要有哪些?违背基本假设是否就不能进行估计1.回归模型是正确设定的;2.解释变量X是确定性变量不是随机变量;在重复抽样中取固定值。
高级计量经济学复习精要一、简答题(10分×2):(一)多重共线性问题:(主要看修正方法)1、多重共线性是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。
完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性。
2、产生原因主要有3各方面:(1)经济变量相关的共同趋势;(2)滞后变量的引入;(3)样本资料的限制。
3、造成的后果:(1)完全共线性下参数估计量不存在;(2)近似共线性下OLS 估计量非有效;(3)参数估计量经济含义不合理;(4)变量的显著性检验失去意义;(5)模型的预测功能失效。
4、识别方法:(1)经验识别:对模型估计后,R 2极高,多个变量不显著,出现与理论预期相悖的情况,有理由怀疑存在多重共线性。
(2)相关系数法:计算变量间两两相关系数。
只要其中一个大等于0.6或0.7,则说明可能存在严重的共线性。
(3)膨胀因子法:计算每个解释变量的VIF ,若某一个VIF ≥10, 则说明存在严重的共线性。
5、修正方法:(※※※)根据老师讲课容进行整理共线性的修正方法有很多,按照优劣程度排序,主要有五种方法:方法1:扩充样本以减弱共线性。
主要通过增加自由度来提高精度,如将时序数据或截面数据变为面板数据,从而将一维数据变为二维。
评价:这种方法最理想,但存在的缺点是:①效果不定;②不可行。
方法2:工具变量法(IV )。
主要通过工具变量,运用两阶段最小二乘完成。
评价:这种方法目前最受欢迎,高质量的期刊论文通常都采用该方法。
缺点是:①由于相关关系具有传导性,工具变量S 很难找;②用S 替代X ,有时经济正当性不足。
方法3:变量变换法。
可以通过对数变换、绝对转相对和方程变换进行变量变换。
评价:这种方法最简单易行,但存在的缺点是:①简单相关系数描述的是线性关系,而对数是非线性化过程;②功效不足;③不是所有变量都能用来做变换,必须有明确的经济学指代。
计量经济学复习要点164590(总20页)--本页仅作为文档封面,使用时请直接删除即可----内页可以根据需求调整合适字体及大小--计量经济学复习要点第1章 绪论数据类型:截面、时间序列、面板用数据度量因果效应,其他条件不变的概念 习题:C1、C2第2章 简单线性回归回归分析的基本概念,常用术语现代意义的回归是一个被解释变量对若干个解释变量依存关系的研究,回归的实质是由固定的解释变量去估计被解释变量的平均值。
简单线性回归模型是只有一个解释变量的线性回归模型。
回归中的四个重要概念1. 总体回归模型(Population Regression Model ,PRM)t t t u x y ++=10ββ--代表了总体变量间的真实关系。
2. 总体回归函数(Population Regression Function ,PRF )t t x y E 10)(ββ+=--代表了总体变量间的依存规律。
3. 样本回归函数(Sample Regression Function ,SRF )tt t e x y ++=10ˆˆββ--代表了样本显示的变量关系。
4. 样本回归模型(Sample Regression Model ,SRM )tt x y 10ˆˆˆββ+=---代表了样本显示的变量依存规律。
总体回归模型与样本回归模型的主要区别是:①描述的对象不同。
总体回归模型描述总体中变量y 与x 的相互关系,而样本回归模型描述所关的样本中变量y 与x 的相互关系。
②建立模型的依据不同。
总体回归模型是依据总体全部观测资料建立的,样本回归模型是依据样本观测资料建立的。
③模型性质不同。
总体回归模型不是随机模型,而样本回归模型是一个随机模型,它随样本的改变而改变。
总体回归模型与样本回归模型的联系是:样本回归模型是总体回归模型的一个估计式,之所以建立样本回归模型,目的是用来估计总体回归模型。
线性回归的含义线性:被解释变量是关于参数的线性函数(可以不是解释变量的线性函数) 线性回归模型的基本假设简单线性回归的基本假定:对模型和变量的假定、对随机扰动项u 的假定(零均值假定、同方差假定、无自相关假定、随机扰动与解释变量不相关假定、正态性假定) 普通最小二乘法(原理、推导)最小二乘法估计参数的原则是以“残差平方和最小”。
1.普通最小二乘法(Ordinary Least Squares,OLS):已知一组样本观测值{}n i Y X i i ,2,1:),(⋯=,普通最小二乘法要求样本回归函数尽可以好地拟合这组值,即样本回归线上的点∧i Y 与真实观测点Yt 的“总体误差”尽可能地小。
普通最小二乘法给出的判断标准是:被解释变量的估计值与实际观测值之差的平方和最小。
2.广义最小二乘法GLS :加权最小二乘法具有比普通最小二乘法更普遍的意义,或者说普通最小二乘法只是加权最小二乘法中权恒取1时的一种特殊情况。
从此意义看,加权最小二乘法也称为广义最小二乘法。
3.加权最小二乘法WLS :加权最小二乘法是对原模型加权,使之变成一个新的不存在异方差性的模型,然后采用普通最小二乘法估计其参数。
4.工具变量法IV :工具变量法是克服解释变量与随机干扰项相关影响的一种参数估计方法。
5.两阶段最小二乘法2SLS, Two Stage Least Squares :两阶段最小二乘法是一种既适用于恰好识别的结构方程,以适用于过度识别的结构方程的单方程估计方法。
6.间接最小二乘法ILS :间接最小二乘法是先对关于内生解释变量的简化式方程采用普通小最二乘法估计简化式参数,得到简化式参数估计量,然后过通参数关系体系,计算得到结构式参数的估计量的一种方法。
7.异方差性Heteroskedasticity :对于不同的样本点,随机干扰项的方差不再是常数,而是互不相同,则认为出现了异方差性。
8.序列相关性Serial Correlation :多元线性回归模型的基本假设之一是模型的随机干扰项相互独立或不相关。
如果模型的随机干扰项违背了相互独立的基本假设,称为存在序列相关性。
9.多重共线性Multicollinearity :对于模型i k i i X X X Y μββββ++⋯+++=i k 22110i ,其基本假设之一是解释变量X 1,X 2,…,Xk 是相互独立的。
计量经济学复习知识要点计量经济学定义。
P1统计学、经济理论和数学的结合建立及应用计量经济学模型的主要步骤。
P9-P18理论模型的设计、样本数据的收集、模型参数的估计、模型的检验、模型的应用理论模型的设计包含的三局部工作。
P9选择变量、确定变量之间的数学关系、拟定模型中待估计参数的数值范围在确定了被解释变量之后,怎样才能正确地选择解释变量。
P9-P101)需要正确理解和把握所研究的经济现象中暗含的经济学理论和经济行为规律2)选择变量要考虑数据的可得性3)选择变量时要考虑所有入选变量之间的关系,使得每个解释变量都是独立的如何恰当地确定模型的数学形式。
P111)依据经济行为理论2)根据变量数据的散点图判断解释变量及被解释变量之间的数学关系3)试模拟常用的样本数据类型。
样本数据质量。
P12,P13时间序列数据、截面数据、虚变量数据完整性、准确性、可比性、一致性虚变量。
带常数项的计量模型引入虚拟变量个数原那么。
P13,p145虚变量数据也称为二进制数据,一般取0或1M-1 〔M为水平数量〕计量经济学模型必须通过四级检验。
P14经济意义检验、统计学检验、计量经济学检验、模型预测检验计量经济模型成功的三要素。
P16理论、方法、数据计量经济学模型几方面应用领域。
P18-P20构造分析、经济预测、政策评价、检验及开展经济理论相关分析及回归分析的区别及关系。
P23-P24联系:二者都是分析具有非确定性关系的变量区别:1.相关分析仅从数据上测度变量间的相关程度,所分析的变量地位是对称的,都是随机变量2.回归分析是分析变量的因果关系,所分析的变量地位是不对称的,解释变量被设为非随机变量随机误差项包含哪些因素影响。
P271)代表未知的影响因素2)代表残缺数据3)代表众多细小影响因素4)代表数据观测误差5)代表模型设定误差6)变量的内在随机性线性回归模型的根本假设。
违背根本假设的计量经济模型是否可以估计。
P30,P56-P571)回归模型是正确设定的2)解释变量X是确定型变量,并且互不相关3)解释变量及随机扰动项不想改4)随机扰动项服从零均值、同方差的正态分布5)随机扰动项具有零均值、同方差6)不同样本点对应的随机扰动项不相关最小二乘法和最大似然法的根本原理。
计量经济学复习要点第一篇:计量经济学复习要点计量经济学复习要点第一章、概率论基础1.随机事件的概念P22.古典概行例题P5例1.1P2例1.2利用第一章的知识说明抽签的合理性如何利用第一章的知识估计一个池塘有多少鱼还有一个关于晚上紧急集合穿错鞋的题目,记不太清楚了3.期望与方差的概念,切比雪夫不等式,看例题1.4-例题1.8,不要求求出数4.变异系数的概念P175.大数定律和中心极限定律(具有独立同分布的随机变量序列的有限和近似地服从正态分布)的概念P24、P25第二章、矩阵代数1.矩阵的定义,加(page29)、减(page29)、乘(page30)、转置(page30)、逆(page31)知道怎么回事2.最小二乘法P39-P41(定义最小二乘解)3.第三节没有听,求听课学霸补充第三章、数据的分析方法和参数的统计推断1.数据的分析方法(算数平均、加权算数平均、几何平均、移动平均)(1)几种分析方法的定义(2)几中分析方法的不同(3)每种分析方法的具体作用(4)移动平均法中k的选择(5)指数平滑法的意义,α的选择,P552.t分布的概率密度函数3.矩估计法定义4.几大似然估计法P65,例题3.7例题3.85.贝叶斯估计和极大极小估计(应该是只看一下概念就可以了)6.假设检验(1)基本思想P75(2)双边假设检验(3)单边假设检验(4)参数检验P807.方差分析的思想、作用和模型第四章、一元线性回归(计算题)回归方程的求法,显著性检验,经济解释(各参数的解释),不显著的解释第六章、虚拟变量的回归模型1.虚拟变量的作用及模型2.应用虚拟变量改变回归直线的截距、斜率3.对稳定性的检验第二篇:2007计量经济学复习要点2007年计量经济学课程要点归纳1.十大经典假设的证明(关于两变量模型的性质检验)2.BLUE估计量的证明3.自相关检验方法(检验方法一定要记住)4.异方差检验方法(至少三种)5.孙老师讲过的附录要留意6.异方差与自相关的补救措施7.违反十大经典假设情况下的问题怎么解决(如多重共线性,异方差,自相关问题,虚拟变量的估计)注:以上重点均是提供参考,不做考试说明计量考察的重点是对计量模型的建立与估算,结果评价与补救思路的考察,没有大量的数学计算,请同学们放心!建议大家根据参考要点确定进度,并根据孙老师上课的重点决定自己的复习范围!希望同学们认真复习,考出好成绩!王琳第三篇:计量经济学复习笔记计量经济学复习笔记CH1导论1、计量经济学:以经济理论和经济数据的事实为依据,运用数学、统计学的方法,通过建立数学模型来研究经济数量关系和规律的一门经济学科。
计量经济学重点知识整理1一般性定义计量经济学是以经济理论和经济数据的事实为依据,运用数学和统计学的方法,通过建立数学模型来研究经济数量关系和规律的一门经济学科。
研究的主体(出发点、归宿、核心):经济现象及数量变化规律研究的工具(手段):模型数学和统计方法必须明确:方法手段要服从研究对象的本质特征(与数学不同),方法是为经济问题服务2注意:计量经济研究的三个方面理论:即说明所研究对象经济行为的经济理论——计量经济研究的基础数据:对所研究对象经济行为观测所得到的信息——计量经济研究的原料或依据方法:模型的方法与估计、检验、分析的方法——计量经济研究的工具与手段三者缺一不可3计量经济学的学科类型●理论计量经济学研究经济计量的理论和方法●应用计量经济学:应用计量经济方法研究某些领域的具体经济问题4区别:●经济理论重在定性分析,并不对经济关系提供数量上的具体度量●计量经济学对经济关系要作出定量的估计,对经济理论提出经验的内容5计量经济学与经济统计学的关系联系:●经济统计侧重于对社会经济现象的描述性计量●经济统计提供的数据是计量经济学据以估计参数、验证经济理论的基本依据●经济现象不能作实验,只能被动地观测客观经济现象变动的既成事实,只能依赖于经济统计数据6计量经济学与数理统计学的关系联系:●数理统计学是计量经济学的方法论基础区别:●数理统计学是在标准假定条件下抽象地研究一般的随机变量的统计规律性;●计量经济学是从经济模型出发,研究模型参数的估计和推断,参数有特定的经济意义,标准假定条件经常不能满足,需要建立一些专门的经济计量方法3、计量经济学的特点:计量经济学的一个重要特点是:它自身并没有固定的经济理论,而是根据其它经济理论,应用计量经济方法将这些理论数量化。
4、计量经济学为什么是一门单独的学科计量经济学是经济理论、数理经济、经济统计与数理统计的混合物。
1、经济理论所作的陈述或假说大多数是定性性质的,计量经济学对大多数经济理论赋予经验内容。
2012级博士高级计量经济学复习面板数据模型与非面板数据模型在多处具有相似性。
在面板数据模型的模型设定中,需要考虑以下的主要问题:1.模型设定问题(1)平稳性问题(包括LLC、IPS检验法的基本原理,检验结果的读解);(2)“斜率”系数问题(变斜率系数与不变斜率系数的检验方法以及基本原理,检验结果的读解);(3)“维数”问题(两维截距、一维截距的检验方法以及基本原理,检验结果的读解);(4)“截距”系数问题(包括FEFE、RERE、FERE、REFE、FE0、0FE、RE0、0RE、pool等的检验方法以及基本原理,检验结果的读解);(5)检验的策略2.估计问题(只涉及平稳数据的估计问题)(1)一维情形下的估计问题(包括FE和RE的估计方法以及基本原理,估计结果的读解);(2)两维情形下的估计问题(包括FEFE、RERE、FERE和REFE的估计方法以及基本原理,估计结果的读解)3. 检验问题(1)F检验的应用前提条件(2)异方差性的检验(组内、组间以及总体方差的异方差性的检验方法以及基本原理,检验结果的读解);(3)自相关性的检验(组内、组间以及总体的自相关性的检验方法以及基本原理,检验结果的读解);(4)检验的策略与基本步骤微观部分二元选择模型(1)概率基础 (2)模型设定 (3)模型结果读解 有序选择模型 (1)模型设定 (2)模型结果读解例题(微观部分) 1. 设有()()()1|~1Prob y X e eΦ⎧⎪==⎨Λ⎪+⎩X βX βX βX β (1)(4分)试推导Logit 模型关于X 的边际效应;(2)(4分)有人得到以下实证分析结果,请对结果给出自己的解释; (3)(4分)计算实证分析中解释变量GPA 和TUCE 的边际效应; (4)(4分)试对如下结果中LR statistic (3 df)= 15.54585的含义进行解释。
Dependent Variable: GRADE Method: ML - Binary Probit (Quadratic hill climbing) Date: 08/12/09 Time: 23:15 Sample: 1 32 Included observations: 32 Convergence achieved after 5 iterations C -7.452320 2.542472 -2.931132 0.0034 GPA 1.625810 0.693882 2.343063 0.0191 TUCE 0.051729 0.083890 0.616626 0.5375 PSI 1.426332 0.595038 2.397045 0.0165Mean dependent var 0.343750 S.D. dependent var 0.482559 S.E. of regression 0.386128 Akaike info criterion 1.051175 Sum squared resid 4.174660 Schwarz criterion 1.234392 Log likelihood -12.81880 Hannan-Quinn criter. 1.111906 Restr. log likelihood -20.59173 Avg. log likelihood -0.400588 LR statistic (3 df) 15.54585 McFadden R-squared 0.377478Probability(LR stat) 0.001405Obs with Dep=0 21 Total obs 32 Obs with Dep=1 11()0.328f X β= 答案The logit model or logistic regression model specifies()()1TT TTe p F e==Λ=+xβx βx βx β (1)where ()Λ⋅is the logistic cdf, with ()111e e e-Λ==++z z zz . Logit 模型的边际效应()()()()()Pr 1||Ti i T iF y E y f ∂∂=∂===∂∂∂βx x x βx βx x x()()()()()()()22111TT T T T TT T T TT e d e dF d e e d d d e e⎛⎫⎪ ⎪Λ+⎝⎭===-++βxβx βx βx βx βx βx βx βx βx βx ()()()1111TTT T T T e e ee ⎛⎫=-=Λ-Λ ⎪ ⎪++⎝⎭βx βxβxβx βx βx ()()()()()()()|1T TT TT F dF E y d ⎛⎫∂∂ ⎪===Λ-Λ ⎪∂∂⎝⎭βx βx x ββx βx βx xβx Probit 模型的边际效应()()()()|T Ti T i iF E y φ∂∂Φ∂===∂∂∂βx βx x βx βx x x 故有:GPA1.625810 0.5333 TUCE 0.051729 0.01697 PSI1.426332 0.4678LR statistic (3 df)= 15.54585的含义是对Probit/Logit 模型中所有的斜率系数均等于0的假设进行检验。
高级计量经济学复习精要一、简答题(10分×2):(一)多重共线性问题:(主要看修正方法)1、多重共线性是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。
完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性。
2、产生原因主要有3各方面:(1)经济变量相关的共同趋势;(2)滞后变量的引入;(3)样本资料的限制。
3、造成的后果:(1)完全共线性下参数估计量不存在;(2)近似共线性下OLS估计量非有效;(3)参数估计量经济含义不合理;(4)变量的显著性检验失去意义;(5)模型的预测功能失效。
4、识别方法:(1)经验识别:对模型估计后,R2极高,多个变量不显著,出现与理论预期相悖的情况,有理由怀疑存在多重共线性。
(2)相关系数法:计算变量间两两相关系数。
只要其中一个大等于或,则表明可能存在严重的共线性。
(3)膨胀因子法:计算每个解释变量的VIF,若某一个VIF≥10, 则表明存在严重的共线性。
5、修正方法:(※※※)根据潘老师讲课内容进行整理共线性的修正方法有很多,按照优劣程度排序,主要有五种方法:方法1:扩充样本以减弱共线性。
主要通过增加自由度来提高精度,如将时序数据或截面数据变为面板数据,从而将一维数据变为二维。
评价:这种方法最理想,但存在的缺点是:①效果不定;②不可行。
方法2:工具变量法(IV)。
主要通过工具变量,运用两阶段最小二乘完成。
评价:这种方法目前最受欢迎,高质量的期刊论文通常都采用该方法。
缺点是:①由于相关关系具有传导性,工具变量S很难找;②用S替代X,有时经济正当性不足。
方法3:变量变换法。
可以通过对数变换、绝对转相对和方程变换进行变量变换。
评价:这种方法最简单易行,但存在的缺点是:①简单相关系数描述的是线性关系,而对数是非线性化过程;②功效不足;③不是所有变量都能用来做变换,必须有明确的经济学指代。
方法4:逐步回归法。
主要是通过降维减少变量来减弱共线性。
评价:这种方法要慎用,最大的缺点是:虽然能很好地解决共线性问题,但是却引发了更严重的内生性问题。
方法5:主成份分析法或因子分析法。
具有降维的作用,主要用于多指标评价。
评价:该方法很好地消除了共线性。
但这种方法要慎用,最大的缺点是:经济含义伤害过大。
(二)内生性问题1、内生性是指:模型中的解释变量与扰动项相关。
通常我们做古典假设①iε为白噪声,E(ε)=0,var(iε)=2σ,cov(iεjε)=0;②X 是非随机变量(微观可以通过固定抽样得到解决,宏观则不可),则cov(X,ε)=0成立。
但是当cov(X, ε)≠0时上述假设便不再成立,我们称之为内生性,进而导致OLS失效,是非一致性的。
2、内生性产生的原因:①X与Y 存在双向因果,即X影响Y的同时,Y 也影响X;如金融发展与经济增长;外商直接投资FDI与经济增长;犯罪率与警备投入。
②模型遗漏重要解释变量。
无论是缺失重要解释变量导致,还是无法获取数据导致,被遗漏的重要变量进入了残差项,如果与其他解释变量相关,就会出现cov(U t,X t)≠0,也就是内生性问题。
③度量误差:由于关键变量的度量上存在误差,使其与真实值之间存在偏差,这种偏差可能会成为回归误差的一部分,从而导致内生性问题。
(潘老师上课没讲③)3、解决方法:针对双向因果产生的内生性问题,比较容易解决,通过联立方程组即可。
难处理的是遗漏重要解释变量的情况,通常采用的方法有:①工具变量法(IV ):就是找到一个变量和内生化变量相关,但是和残差项不相关。
通常采用2SLS 方法进行回归。
这种方法是找到影响内生变量的外生变量,连同其他已有的外生变量一起回归,得到内生变量的估计值,以此作为IV ,放到原来的回归方程中进行回归。
(假如我们考察一个工资决定模型012i salary educ abli u βββ=+++首先,用Probit 模型估计()(,)p work f educ abli =,得到ˆi p其次,构建模型012ˆi i salary educ abli pv βββδ=++++进行估计) ②得分匹配与DID 模型(双差分模型):思想是按照一定的标准,找到与样本match 的控制组。
在假设外在冲击同时影响两个组别的情况下,做差来剔除掉外界冲击的影响。
第一步,该方法关键在于得分匹配的确定,配对样本的选择原则是保证两个样本随时间自然变化的部分是相同的,一般根据距离最近作为配对的样本点的方法进行匹配得分。
第二步是估计方法,采用双重差分法(DID )。
在假设外在冲击同时影响两个组别的情况下,做差来剔除掉外界冲击的影响。
(在样本选择上,控制不可观测变量,然后利用双差分模型进行估计Eg :012i salary educ abli u βββ=+++(1)样本抽取时,将ablity 相等或相近的观测值进行配对(匹配标准IQ/双胞胎)(2)用双差分模型(DID )进行参数估计01ln(-ln(-+i salary salary educ educ αα=+对照组对照组得分组得分组))v估计出1ˆα,等价于原模型中的1ˆβ 不足:样本要求非常大,尤其是用多重标准进行匹配时,样本要求更大。
) 潘老师举得例子二、虚拟变量:(20分)(给出实际经济问题,根据目标设计虚拟变量,写出模型。
考察一种群体异质。
完整考察如何设计,如何运用到模型中。
)注意事项:1、模型设计时一定要有截距项,虚拟变量引入原则一定要满足m-1原则。
m 为互斥类型的定性因素。
2、要掌握虚拟变量引入模型的三种方法,即加法模型、乘法模型和既加又乘模型。
1、举例说明如何引进加法模式和乘法模式建立虚拟变量模型。
答案:设Y 为个人消费支出;X 表示可支配收入,定义如果设定模型为此时模型仅影响截距项,差异表现为截距项的和,因此也称为加法模型。
如果设定模型为此时模型不仅影响截距项,而且还影响斜率项。
差异表现为截距和斜率的双重变化,因此也称为乘法模型。
2、考虑下面的模型:其中,Y表示大学教师的年薪收入,X表示工龄。
为了研究大学教师的年薪是否受到性别(男、女)、学历(本科、硕士、博士)的影响。
按照下面的方式引入虚拟变量:3、考虑下面的模型:其中,Y 表示大学教师的年薪收入,X表示工龄。
为了研究大学教师的年薪是否受到性别、学历的影响。
按照下面的方式引入虚拟变量:(10分)1. 基准类是什么2. 解释各系数所代表的含义,并预期各系数的符号。
3. 若B4>B3,你得出什么结论答案:1. 基准类是本科学历的女教师。
2.B0表示刚参加工作的本科学历女教师的收入,所以B0的符号为正。
B1表示在其他条件不变时,工龄变化一个单位所引起的收入的变化,所以B1的符号为正。
B2表示男教师与女教师的工资差异,所以B2的符号为正。
B3表示硕士学历与本科学历对工资收入的影响,所以B3的符号为正。
B4表示博士学历与本科学历对工资收入的影响,所以B4的符号为正。
3. 若B4>B3,说明博士学历的大学教师比硕士学历的大学教师收入要高。
4、性别因素可能对年薪和工龄之间的关系产生影响。
试问这种影响可能有几种形式,并设定出相应的计量经济模型。
性别因素可能对年薪和工龄之间的关系的影响有三种方式。
第一种,性别只影响职工的初始年薪,设定模型为:5、考虑下面的模型:其中,Y——MBA毕业生收入,X——工龄。
所有毕业生均来自清华大学,东北财经大学,沈阳工业大学。
(1)基准类是什么基准类是东北财经大学MBA毕业生。
你预期各系数的符号如何预期B1的符号为正;B2的符号为正;B3的符号为负。
(2)如何解释截距B2 B3 截距B2反应了清华大学MBA毕业生相对于东北财经大学MBA毕业生收入的差别;截距B3反应了沈阳工业大学MBA毕业生相对于东北财经大学MBA毕业生收入的差别。
)(3)若B2>B3,你得出什么结论(4)如果B2>B3,我们可以判断清华大学MBA毕业生的收入平均高于沈阳工业大学MBA毕业生的收入。
三、异方差问题(25分)模型,如果出现,对于不同的样本点,随机扰动项的方差不再是常数,而且互不相同,则认为出现了异方差。
1、异方差的三大后果:一是最小二乘估计不再是有效估计量;二是相关参数的t检验、模型F检验失效;三是估计量的方差是有偏的,参数或因变量预测的置信区间的估计精度下降(甚至这种区间估计是失效的)。
2、异方差的检验识别:White检验的具体步骤如下。
以二元回归模型为例,y t= 0 + 1 x t1+ 2 x t2+ u t(1)①首先对上式进行OLS回归,求残差uˆ。
t②做如下辅助回归式,(包括截距项、一次项、平方项、交叉项)2ˆu= 0 + 1 x t1 +2x t2 + 3 x t12 +4x t22 + 5 x t1x t2 + v tt(2)即用2ˆt u对原回归式(1)中的各解释变量、解释变量的平方项、交叉积项进行OLS 回归。
求辅助回归式(2)的可决系数R 2。
③White 检验的零假设和备择假设是H 0: (1)式中的u t 不存在异方差,H 1: (1)式中的u t 存在异方差④在不存在异方差假设条件下构造LM 统计量或F 统计量LM=n R 2 2(5)或 F= /5R )6/()R -(122___ n ~F (5,n-6)其中n 表示样本容量,R 2是辅助回归式(2)的OLS 估计式的可决系数。
自由度5表示辅助回归式(2)中解释变量项数(注意,不计算常数项),n-6是样本量减参数个数(因此可以扩展到K 个解释变量的情形)。
nR 2属于LM 统计量。
⑤判别规则是若 n R 22 (5), 接受H 0 (u t 具有同方差)若 nR 2 > 2 (5), 拒绝H 0 (u t 具有异方差)或F F (5,n-6),接受H 0 (u t 具有同方差)反之拒绝3、异方差的消除(WLS:加权最小二乘估计)关键在于权重的选择,我们考的是采用残差作为权重,即采用(1)式中估计的1/|uˆ|为权重,将残差的绝对值除(1)式的左右两边,t然后对转换后的(1)式进行OLS。
1、什么是异方差性举例说明经济现象中的异方差性。
1)模型,如果出现,对于不同的样本点,随机扰动项的方差不再是常数,而且互不相同,则认为出现了异方差。
2)在现实经济中,异方差性经常出现,尤其是采用截面数据作样本的计量经济学问题。
例如:工业企业的研究与发展费用支出同企业的销售和利润之间关系的函数模型;服装需求量与季节、收入之间关系的函数模型;个人储蓄与个人可支配收入之间关系的函数模型等。
检验异方差的主要思路就是检验随机扰动项的方差与解释变量观察值的某种函数形式之间是否存在相关性。
2、下面是一个回归模型的检验结果。