计量经济学讲义(上海财经大学 周建)
- 格式:ppt
- 大小:7.83 MB
- 文档页数:963
计量经济学讲义第六讲(共⼗讲)第六讲多重共线⼀、 FWL 定理及其应⽤考虑模型:112233i i i i i y a b x b x b x ε=++++ (1)假如我们只关注1b,则通过如下步骤可以获得之。
第1步:把1x 对其他解释变量进⾏回归(请注意,截距所对应的解释变量为1),即有: 101223i i i ix x x v βββ=+++ (2)第2步:把y 也对(2)中的解释变量进⾏回归,即有:01223i i i i y x x w ???=+++ (3)第3步:把w 对?v 进⾏回归(不含截距,当然你可以包含截距,但你会发现,截距的估计结果是零,这是因为?w 与?v 其均值都为零),即有模型:i i i ve w η=+ (4)则有:2i i iw v v η=∑∑,可以验证,1??b η=,且残差?i e 等于初始的残差?i ε。
此即著名的FWL 定理(Frisch-Waugh-Lovell theorem )。
关于FWL 定理的⼀个简单证明见附录1。
思考题:利⽤关于“偏导数”的直觉,你能够理解1b η=吗?考察2i i iw v v η=∑∑,把01223i i i i y x x w ?=---代⼊,现在分⼦是:2012230123()?i i i i i i i ii i i v x i i y x x y v x v v v wv ------∑∑∑==∑∑∑应该注意到,在进⾏第⼀步回归时,OLS 法保证了203i i i i i v x x vv ===∑∑∑ 因此,22i i i i i iw v y v v v η==∑∑∑∑ 显然,如果把y 对?v 直接进⾏⽆截距回归:*?iiiy v η?=+ (5)我们也可以得到:*122i i i i i i y v w v b v vηη====∑∑∑∑。
因此,如果只关注如何获得1b ,我们可以把FWL 定理中第⼆步与第三步合并为把y 对v 直接进⾏⽆截距回归。
第二章经典单方程计量经济学模型:一元线性回归模型§2.1 回归分析概述一回归分析的概念无论自然现象之间还是社会经济现象之间,大都存在着不同程度的联系,计量经济学的主要任务之一就是寻找各种经济变量之间的相互联系程度、联系方式以及经济变量之间的运动规律。
一般来说,变量之间的关系可以分为两类:一类是确定性的函数关系。
例如,表示。
圆的半径与圆面积之间的关系,可以用函数关系S=2r另一类是非确定性的统计相关关系。
例如,商品房的价格Y与房屋面积X 的关系,随着X的增加,Y也增加。
但是,在给定X时,Y并不能确定。
原因在于,商品房的价格Y不仅与房屋面积X有关,而且还与所在的区域、楼层和小区的人文环境等等因素有关。
这样,虽然人们无法得到商品房的价格Y与房屋面积X之间的函数关系,但是,人们可以将商品房的价格Y作为随机变量,通过统计计量的方法研究它们之间的统计相关关系。
研究随机变量间统计相关关系的方法主要有两种,一种是相关分析法,另一种是回归分析法。
1 相关分析相关分析主要研究随机变量间的相关形式和相关程度。
(1)相关的定义与分类定义:相关(correlation)指两个或两个以上随机变量间相互关系的程度或强度。
分类:①按强度分完全相关:变量间存在函数关系。
例,圆的周长,L = 2πr高度相关(强相关):变量间近似存在函数关系。
例,我国家庭收入与支出的关系。
弱相关:变量间有关系但不明显。
例,近年来我国耕种面积与产量。
零相关:变量间不存在任何关系。
例,某班学生的学习成绩与年龄。
2004006008001020304050YX121020304050YX0.51.01.52.02.53.02.02.53.03.54.04.5YX完全相关 高度相关、线性相关、正相关 弱相关②按变量个数分按形式分:线性相关, 非线性相关 简单相关:指两个变量间相关按符号分:正相关, 负相关, 零相关 复相关(多重相关):指一个变量与两个或两个以上变量间的相关。
第一讲 普通最小二乘法的代数一、 问题假定y 与x 具有近似的线性关系:01y x ββε=++,其中ε是随机误差项。
我们对01ββ、这两个参数的值一无所知。
我们的任务是利用样本数据去猜测01ββ、的取值。
现在,我们手中就有一个样本容量为N 的样本,其观测值是:1122(,),(,),...,(,)N N y x y x y x 。
问题是,如何利用该样本来猜测01ββ、的取值?为了回答上述问题,我们可以首先画出这些观察值的散点图(横轴x ,纵轴y )。
既然y 与x 具有近似的线性关系,那么我们就在图中拟合一条直线:1ˆˆˆyx ββ=+。
该直线是对y 与x 的真实关系的近似,而01ˆˆ,ββ分别是对01,ββ的猜测(估计)。
问题是,如何确定0ˆβ与1ˆβ,以使我们的猜测看起来是合理的呢? 笔记:1、为什么要假定y 与x 的关系是01y x ββε=++呢?一种合理的解释是,某一经济学理论认为x 与y 具有线性的因果关系。
该理论在讨论x 与y 的关系时认为影响y 的其他因素是不重要的,这些因素对y 的影响即为模型中的误差项。
2、01y x ββε=++被称为总体回归模型。
由该模型有:01E()E()y x x x ββε=++。
既然ε代表其他不重要因素对y的影响,因此标准假定是:E()0x ε=。
故进而有:01E()y x x ββ=+,这被称为总体回归方程(函数),而01ˆˆˆy x ββ=+相应地被称为样本回归方程。
由样本回归方程确定的ˆy与y 是有差异的,ˆy y-被称为残差ˆε。
进而有:01ˆˆˆy x ββε=++,这被称为样本回归模型。
二、 两种思考方法法一:12(,,...,)N y y y '与12ˆˆˆ(,,...,)N yy y '是N 维空间的两点,0ˆβ与1ˆβ的选择应该是这两点的距离最短。
这可以归结为求解一个数学问题:01012201ˆˆˆˆ,,11ˆˆˆ()()NNi i i i i i Min y y Min y x ββββββ==-=--∑∑ 由于ˆi i y y -是残差ˆi ε的定义,因此上述获得0ˆβ与1ˆβ的方法即是0ˆβ与1ˆβ的值应该使残差平方和最小。
第一章绪论§计量经济学一、计量经济学的产生与发展计量经济学是经济学的一个分支,是以揭示经济活动中的客观存在的数量关系为容的分支学科。
其创立者R.弗里希将其定义为经济理论、统计学、数学三者的结合,但它又完全不同于这三个学科的每一个分支。
计量经济学(Econometrics)1926年由挪威经济学家弗里希(R.Frish)仿造生物计量学(Biometrics)一词提出的。
1930年12月弗里希、丁百根和费歇耳等经济学家在美国克利夫兰市成立经济计量学会。
1933年出版《计量经济学杂志》在发刊词中弗里希将计量经济学定义为:经济理论、数学、统计学的结合。
计量经济学的学术渊源和社会历史根源:17世纪英国经济学家威廉.配弟在《政治算术》一书中应用“数字、重量或尺度”来阐述经济现象19世纪法国经济学家古尔诺《财富理论的数学原理研究》中认为:某些经济畴、需求、价格、供给可以视为互为函数关系,从而有可能用一系列的函数方程表述市场中的关系,并且可以用数学语言系统地阐述某些经济规律(数理学派的奠基者)其后瑞士经济学家瓦尔拉斯创立了一般均衡理论,利用联立方程研究一般均衡的决定条件(洛桑学派的先驱)意大利经济学家帕累托发展了一般均衡理论。
用立体几何研究经济变量之间的关系。
1890年(剑桥学派的创始人)马歇尔的《经济学原理》的问世,使数学成为经济学研究不可缺少的描述与分析推理的工具为计量经济学奠定了基础计量经济学从二十世纪三十年代诞生起就显示了极强的生命力。
一方面出于对经济的干预政策的需要,许多国家都广泛采用经济计量理论和方法,进行经济预测,加强市场研究,探讨经济政策的效果。
另一方面随着科学技术的发展与进步,各门科学相互协作、相互渗透,计算机科学、数学、系统论、信息论、控制论等相继进入了经济研究领域。
特别是计算机技术的高速发展为计量经济学广泛应用铺平了道路。
计量经济学的发展过程是计量经济模型的建立、应用和发展的过程。
(财务知识)计量经济学讲义计量经济学讲义第四讲趋势和DF检验(修订版)此翻译稿制作学习之用,如有错误之处,文责自负。
趋势平稳序列(TS)(图1和2)壹个趋势平稳序列绕着壹个确定的趋势(序列的均值),其波动幅度不显示增大或者减小的趋势。
线性确定性趋势:t=1,2,…平方确定性趋势:t=1,2,…通常:t=1,2,…均值是是随时间变化的(川),可是方差是常数。
能够为任意平稳序列,也就是说,不壹定要是白噪声过程。
通过拟合壹个确定的多项式时间趋势,趋势能够来消除:拟合趋势后残差将给出壹个去趋势的序列。
壹个带线性确定性趋势AR(1)过程能够写作:t=1,2,…此处确定性趋势被减去。
然而在实践中,、是未知的而且必须估计出来。
于是模型能够被重述为:其中包含壹个截距和壹个趋势,也就是此处且若,那么此AR过程就是围绕壹个确定性趋势的平稳过程.差分平稳序列(DF)(也叫单整序列)和随机性趋势如果壹个非平稳序列能够由壹个平稳序列通过d次差分得到,那么我们说这个序列就是d阶单整的,写做I(d).这壹过程也因此叫做差分平稳过程(DSP).因此,平稳序列就是零阶单整的,I(0)。
白噪声序列是I(0)。
所以如果序列是平稳的,那么就是I(d)。
是差分算子,即如果序列是平稳的话,是I(1);如果序列是平稳的,是I(2),随机游走(图3)是随机游走的,如果满足此处这是壹个AR(1)过程,且在中具有根这壹序列被称为具有单位根,或者叫做1阶单整,I(1)。
注意:假设此过程在t=0起始处有壹个确定的值y0.那么,……(1)注释:(a)在(1)式中,y t被表示为初始值y0和壹个序列的局部的和(即所谓的随机趋势)。
所有随机冲击对序列y t都有永久的影响,它们能够永久的改变y t的水平,而在平稳序列中,冲击的影响会随着时间的流逝而趋向于零。
因此,称随机游走具有壹个随机趋势。
(b)E(y t)=y0+t*0=y0[定值]Var(y t)=Var()=t 2都时间依赖的,即,Var(y t)存在趋势。
第七讲 虚拟变量一、含有虚拟变量的模型假设居民家庭的教育费用支出除了受收入水平的影响之外,还与子女的年龄结构密切相关。
如果家庭中有适龄子女(6~21岁),教育费用支出就多。
现在考虑模型:010i i i i y x D ββαε=+++ (1)其中,y 表示教育支出,x 表示收入,而D 的取值是1D ⎧⎪⎪⎨⎪⎪⎩=有适龄子女无适龄子女在这里,D 就是一个虚拟变量,也被称为哑变量,它反映了定性因素的变化。
模型(1)的等价形式由如下两个子模型组成:无适龄子女家庭其教育费用支出函数(D i = 0):01i i i y x ββε=++有适龄子女家庭其教育费用支出函数(D i = 1):001()i i i y x βαβε=+++如果保持家庭收入一样,有适龄子女的家庭教育费用将比无适龄子女的家庭费用高0α。
因此,虚拟变量D 的显著性意味着子女的年龄结构对家庭教育费用有显著影响。
定性因素也可能影响斜率参数,例如随着收入水平的提高,家庭教育支出的边际消费倾向也可能会发生变化。
为了反映定性因素对斜率参数的影响,可以设定模型:011()i i i i i y x x D ββαε=+++ (2)模型(2)的等价形式由如下两个子模型组成: 无适龄子女家庭其教育费用支出函数(D i = 0):01i i i y x ββε=++有适龄子女家庭其教育费用支出函数(D i = 1):011()i i i y a x ββε=+++事实上,我们还可以设定更一般的模型,以涵盖定性因素不仅影响截距也影响斜率参数的情况:0011()i i i i i i a y D x x D ββαε+=+++当然,我们可以利用t 检验或者F 检验分别判断0ˆa、1ˆa 单个或者联合显著性,进而确定哪一种模型设定合理。
二、虚拟变量的设置原则假设公司职员的年薪与工龄和学历有关。
学历分成三种类型:大专以下、本科、研究生。
为了反映“学历”这个定性因素的影响,我们设置两个虚拟变量:110D ⎧⎪⎪⎨⎪⎪⎩=本科其他210D ⎧⎪⎪⎨⎪⎪⎩=研究生其他如果把模型设定为:010112i i i i i y x D D ββααε=++++其中y 是年薪,x 是工龄。
计量经济学讲义计量经济学已经成了经济学专业中越来越热门的课程,是当今西方国家经济类专业三门核心课程(宏观、微观、计量)之一。
现在我们随手翻一翻《经济研究》这类经济专业刊物,就会发现,大部分的文章都采用了计量经济学的分析方法.计量经济学的重要地位还可以从诺贝尔经济学奖获得者的数量中反映出来,从1969年设立诺贝尔经济学奖,首届获得者就是计量经济学的创始人弗里希和荷兰经济学家丁伯根,表彰他们开辟了用计量经济方法研究经济问题这一领域,之后,直接因为对计量经济学的发展作出贡献而获奖者达十几人,包括去年获奖的Engle和Granger。
这些都说明了计量经济学越来越得到广泛的认可和高度的重视,经济科学日益朝着用数学表达经济内容和统计定量的方向发展。
所以这是一门值得大家付出努力去学好的课程。
大家随便翻一下手中的教材,就会发现这门课程中会有大量的数学推导过程。
我想这可能会是一个大家都很头疼的问题,根据这个特点,我把计量经济学这门课程做了一个定位:课程定位:用于研究经济问题的一种工具所谓的工具,就好象我们常用的office软件一样,我们用它是为了编辑文件,而我们大多数人并不知道它的每一条程序是如何编写的。
如果我们把计量经济学仅仅当成我们研究经济问题的一种工具的话,我们就可以把很多的数学推导过程装进一个个“黑箱”中,只需要学会用它的结果就够了。
我们用一个word软件,要能够打印出一篇漂亮的文章出来,那我们用一个学期的时间来学习如何使用计量经济学这个工具,最终希望达到什么要求呢?一、课程目的:1、掌握计量经济学的基本理论和方法;2、能够读懂采用了计量经济分析方法的经济文章;3、结合自己的专业,能应用计量经济方法对实际问题进行初步的计算分析。
我一直认为,要做成任何事情,有清晰的思路是最重要的。
如果说细节是一串珍珠项链上的珠子,那么思路就是把珠子串起来的那根线,珠子少一颗不要紧,没有了这个线,就成不了项链。
学习同样也是这样。