计量经济学中相关证明
- 格式:docx
- 大小:174.78 KB
- 文档页数:14
第六讲 多重共线一、 FWL 定理及其应用考虑模型:112233i i i i i y a b x b x b x ε=++++ (1)假如我们只关注1ˆb,则通过如下步骤可以获得之。
第1步:把1x 对其他解释变量进行回归(请注意,截距所对应的解释变量为1),即有: 101223ˆˆˆˆi i i ix x x v βββ=+++ (2)第2步:把y 也对(2)中的解释变量进行回归,即有:01223ˆˆˆˆi i i i y x x w ϕϕϕ=+++ (3)第3步:把ˆw 对ˆv 进行回归(不含截距,当然你可以包含截距,但你会发现,截距的估计结果是零,这是因为ˆw 与ˆv 其均值都为零),即有模型:ˆˆi i i ve w η=+ (4) 则有:2ˆˆˆˆi i iw v v η=∑∑,可以验证,1ˆˆb η=,且残差ˆi e 等于初始的残差ˆi ε。
此即著名的FWL 定理(Frisch-Waugh-Lovell theorem )。
关于FWL 定理的一个简单证明见附录1。
思考题:利用关于“偏导数”的直觉,你能够理解1ˆˆb η=吗? 考察2ˆˆˆˆi i iw v v η=∑∑,把01223ˆˆˆˆi i i i y x x w ϕϕϕ=---代入,现在分子是:2012230123ˆˆˆˆ()ˆˆˆˆˆˆˆˆˆi i i i i i i ii i i v x i i y x x y v x v v v wv ϕϕϕϕϕϕ------∑∑∑==∑∑∑应该注意到,在进行第一步回归时,OLS 法保证了203ˆˆˆi i i i i v x x vv ===∑∑∑ 因此,22ˆˆˆˆˆˆi i i i i iw v y v v v η==∑∑∑∑ 显然,如果把y 对ˆv 直接进行无截距回归:*ˆiiiy v ης=+ (5)我们也可以得到:*122ˆˆˆˆˆˆˆi i i i i i y v w v b v vηη====∑∑∑∑。
第一章:绪论1.计量经济学的学科属性、计量经济学与经济学、数学、统计学的关系;2.计量经济研究的四个基本步骤(1)建立模型(依据经济理论建立模型,通过模型识别、格兰杰因果关系检验、协整关系检验建立模型);(2)估计模型参数(满足基本假设采用最小二乘法,否则采用其他方法:加权最小二乘估计、模型变换、广义差分法等);(3 )模型检验:经济意义检验(普通模型、双对数模型、半对数模型中的经济意义解释,见例1、例2 ),统计检验(T检验,拟合优度检验、F检验,联合检验等);计量经济学检验(异方差、自相关、多重共线性、在时间序列模型中残差的白噪声检验等);(4 )模型应用。
例1:在模型中,y某类商品的消费支出,x收入,P商品价格,试对模型进行经济意义检验,并解释A"》的经济学含义。
In X = 0.213 +0.25 In 一0.31£其中参数卩'",都可以通过显著性检验。
经济意义检验可以通过(商品需求与收入正相关、与商品价格负相关\商品消费支出关于收入的弹性为0.25 ( 1心/畑)=0.251】心/仏));价格增加一个单位,商品消费需求将减少31%。
例2 :硏究金融发展与贫富差距的关系,认为金融发展先使贫富差距加大(恶化), 尔后会使贫富差距降<氐(好转),成为倒U型。
贫富差距用GINI系数表示,金融发展用(贷款余额/存款总额)表示。
回归结果G/^VZ r =2.34 + 0.641;-1.29x;/模型参数都可以通过显著性检验。
在X的有意义的变化范围内,GINI系数的值总是大于1 ,细致分析后模型变的毫无意义;同样的模型还有:GINI系数的值总是为负= —13.34 + 7.12 兀一14.31#O3.计量经济学中的一些基本概念数据的三种类型:横截面数据、时间序列数据、面板数据;线性模型的概念;模型的解释变量与被解释变量,被解释变量为随机变量(如果—个变量为随机变量,并与随机扰动项相关,这个变量称为内生变量),被解释变量为内生变量,有些解释变量也为内生变量。
《计量经济学》试题及答案第一章绪论一、填空题:1.计量经济学是以揭示经济活动中客观存在的___数量关系_______为内容的分支学科,挪威经济学家弗里希,将计量经济学定义为______经济理论____、______统计学____、___数学_______三者的结合。
2.数理经济模型揭示经济活动中各个因素之间的____理论______关系,用______确定____性的数学方程加以描述,计量经济模型揭示经济活动中各因素之间的____定量_____关系,用_____随机_____性的数学方程加以描述。
3.经济数学模型是用___数学方法_______描述经济活动。
第一章绪论4.计量经济学根据研究对象和内容侧重面不同,可以分为___理论_______计量经济学和___应用_______计量经济学。
5.计量经济学模型包括____单方程模型______和___联立方程模型_______两大类。
6.建模过程中理论模型的设计主要包括三部分工作,即选择变量、确定变量之间的数学关系、拟定模型中待估计参数的取值范围。
7.确定理论模型中所包含的变量,主要指确定__解释变量________。
8.可以作为解释变量的几类变量有_外生经济_变量、_外生条件_变量、_外生政策_变量和_滞后被解释_变量。
9.选择模型数学形式的主要依据是_经济行为理论_。
10.研究经济问题时,一般要处理三种类型的数据:_时间序列_数据、_截面_数据和_虚变量_数据。
11.样本数据的质量包括四个方面_完整性_、_可比性_、_准确性_、_一致性_。
12.模型参数的估计包括_对模型进行识别_、_估计方法的选择_和软件的应用等内容。
13.计量经济学模型用于预测前必须通过的检验分别是_经济意义检验、_统计检验、_计量经济学检验和_预测检验。
14.计量经济模型的计量经济检验通常包括随机误差项的_异方差_检验、_序列相关_检验、解释变量的_多重共线性_检验。
15.计量经济学模型的应用可以概括为四个方面,即_结构分析_、_经济预测_、_政策评价_、_检验和发展经济理论_。
二阶段最小二乘法(Two-Stage Least Squares, 2SLS)和工具变量法(Instrumental Variables, IV)在计量经济学中被广泛应用,用于解决因果关系的内生性问题。
虽然这两种方法在形式上有所不同,但是它们在某些条件下可以得到相同的结果。
本文将就二阶段最小二乘法和工具变量法结果相同的证明展开探讨。
1. 二阶段最小二乘法的基本原理及公式我们需要了解二阶段最小二乘法的基本原理。
在计量经济学中,当自变量存在内生性问题时,我们无法直接使用最小二乘法进行回归分析。
这时,我们可以通过引入工具变量来解决内生性问题。
二阶段最小二乘法包括两个阶段,第一阶段是利用工具变量估计内生变量的值,第二阶段是利用第一阶段的估计值替代内生变量进行普通最小二乘法回归分析。
其公式为:[Y_i = _0 + _1X_i + _i][X_i = _0 + _1Z_i + _i]其中,(Y_i)代表因变量,(X_i)代表内生解释变量,(Z_i)代表工具变量,(_i)和(_i)分别为误差项。
通过两个阶段的回归分析,我们可以得到最终的估计结果。
2. 工具变量法的基本原理及公式工具变量法是一种处理内生性的方法,其基本原理是利用与内生解释变量相关但与误差项不相关的外生变量作为工具变量,通过工具变量的线性组合来替代内生变量进行估计。
工具变量法的回归模型可以表示为:[X_i = _0 + _1Z_i + _i] [Y_i = _0 + _1 + _i]其中,()是利用工具变量估计的内生变量的值。
3. 二阶段最小二乘法和工具变量法结果相同的条件现在让我们来探讨二阶段最小二乘法和工具变量法结果相同的条件。
事实上,当工具变量法满足一定条件时,其结果与二阶段最小二乘法是等价的。
具体而言,若工具变量满足外生性和相关性条件(即与内生变量相关),并且内生变量的影响能够完全通过工具变量进行替代,那么工具变量法的结果将与二阶段最小二乘法一致。
《计量经济学(第二版)》习题解答第一章1.1 计量经济学的研究任务是什么?计量经济模型研究的经济关系有哪两个基本特征? 答:(1)利用计量经济模型定量分析经济变量之间的随机因果关系。
(2)随机关系、因果关系。
1.2 试述计量经济学与经济学和统计学的关系。
答:(1)计量经济学与经济学:经济学为计量经济研究提供理论依据,计量经济学是对经济理论的具体应用,同时可以实证和发展经济理论。
(2)统计数据是建立和评价计量经济模型的事实依据,计量经济研究是对统计数据资源的深层开发和利用。
1.3 试分别举出三个时间序列数据和横截面数据。
1.4 试解释单方程模型和联立方程模型的概念,并举例说明两者之间的联系与区别。
1.5 试结合一个具体经济问题说明计量经济研究的步骤。
1.6 计量经济模型主要有哪些用途?试举例说明。
1.7 下列设定的计量经济模型是否合理,为什么?(1)ε++=∑=31i iiGDP b a GDPε++=3bGDP a GDP其中,GDP i (i =1,2,3)是第i 产业的国内生产总值。
答:第1个方程是一个统计定义方程,不是随机方程;第2个方程是一个相关关系,而不是因果关系,因为不能用分量来解释总量的变化。
(2)ε++=21bS a S其中,S 1、S 2分别为农村居民和城镇居民年末储蓄存款余额。
答:是一个相关关系,而不是因果关系。
(3)ε+++=t t t L b I b a Y 21其中,Y 、I 、L 分别是建筑业产值、建筑业固定资产投资和职工人数。
答:解释变量I 不合理,根据生产函数要求,资本变量应该是总资本,而固定资产投资只能反映当年的新增资本。
(4)ε++=t t bP a Y其中,Y 、P 分别是居民耐用消费品支出和耐用消费品物价指数。
答:模型设定中缺失了对居民耐用消费品支出有重要影响的其他解释变量。
按照所设定的模型,实际上假定这些其他变量的影响是一个常量,居民耐用消费品支出主要取决于耐用消费品价格的变化;所以,模型的经济意义不合理,估计参数时可能会夸大价格因素的影响。
课本中相关章节的证明过程第2章有关的证明过程2.1 一元线性回归模型有一元线性回归模型为:y t = ?0 + ?1 x t + u t上式表示变量y t 和x t之间的真实关系。
其中y t 称被解释变量(因变量),x t称解释变量(自变量),u t称随机误差项,?0称常数项,?1称回归系数(通常未知)。
上模型可以分为两部分。
(1)回归函数部分,E(y t) = ?0 + ?1 x t,(2)随机部分,u t。
图2.8 真实的回归直线这种模型可以赋予各种实际意义,收入与支出的关系;如脉搏与血压的关系;商品价格与供给量的关系;文件容量与保存时间的关系;林区木材采伐量与木材剩余物的关系;身高与体重的关系等。
以收入与支出的关系为例。
假设固定对一个家庭进行观察,随着收入水平的不同,与支出呈线性函数关系。
但实际上数据来自各个家庭,来自各个不同收入水平,使其他条件不变成为不可能,所以由数据得到的散点图不在一条直线上(不呈函数关系),而是散在直线周围,服从统计关系。
随机误差项u t中可能包括家庭人口数不同,消费习惯不同,不同地域的消费指数不同,不同家庭的外来收入不同等因素。
所以,在经济问题上“控制其他因素不变”实际是不可能的。
回归模型的随机误差项中一般包括如下几项内容,(1)非重要解释变量的省略,(2)人的随机行为,(3)数学模型形式欠妥,(4)归并误差(粮食的归并)(5)测量误差等。
回归模型存在两个特点。
(1)建立在某些假定条件不变前提下抽象出来的回归函数不能百分之百地再现所研究的经济过程。
(2)也正是由于这些假定与抽象,才使我们能够透过复杂的经济现象,深刻认识到该经济过程的本质。
通常,线性回归函数E(y t) = ?0 + ?1 x t是观察不到的,利用样本得到的只是对E(y t) = ?0 + ?1 x t 的估计,即对?0和?1的估计。
在对回归函数进行估计之前应该对随机误差项u t做出如下假定。
(1) u t 是一个随机变量,u t 的取值服从概率分布。
(2) E(u t) = 0。
(3) D(u t) = E[u t - E(u t) ]2 = E(u t)2 = ?2。
称u i 具有同方差性。
(4) u t 为正态分布(根据中心极限定理)。
以上四个假定可作如下表达:u t? N (0,??)。
(5) Cov(u i, u j) = E[(u i - E(u i) ) ( u j - E(u j) )] = E(u i, u j) = 0, (i?j )。
含义是不同观测值所对应的随机项相互独立。
称为u i 的非自相关性。
(6) x i是非随机的。
(7) Cov(u i, x i) = E[(u i - E(u i) ) (x i - E(x i) )] = E[u i (x i - E(x i) ] = E[u i x i - u i E(x i) ] = E(u i x i) = 0.u i与x i相互独立。
否则,分不清是谁对y t的贡献。
(8) 对于多元线性回归模型,解释变量之间不能完全相关或高度相关(非多重共线性)。
在假定(1),(2)成立条件下有E(y t) = E(?0+ ?1 x t+ u t) = ?0+ ?1 x t。
2.2 最小二乘估计(OLS)对于所研究的经济问题,通常真实的回归直线是观测不到的。
收集样本的目的就是要对这条真实的回归直线做出估计。
图2.9怎样估计这条直线呢?显然综合起来看,这条直线处于样本数据的中心位置最合理。
怎样用数学语言描述“处于样本数据的中心位置”?设估计的直线用t y ˆ =0ˆβ+1ˆβ x t 表示。
其中t y ˆ称y t 的拟合值(fitted value ),0ˆβ和1ˆβ分别是 ?0 和?1的估计量。
观测值到这条直线的纵向距离用t uˆ表示,称为残差。
y t =t y ˆ+t u ˆ=0ˆβ+1ˆβ x t +t u ˆ 称为估计的模型。
假定样本容量为T 。
(1)用“残差和最小”确定直线位置是一个途径。
但很快发现计算“残差和”存在相互抵消的问题。
(2)用“残差绝对值和最小”确定直线位置也是一个途径。
但绝对值的计算比较麻烦。
(3)最小二乘法的原则是以“残差平方和最小”确定直线位置。
用最小二乘法除了计算比较方便外,得到的估计量还具有优良特性(这种方法对异常值非常敏感)。
设残差平方和用Q 表示, Q =∑=Ti tu12ˆ= ∑=-T i t t y y 12)ˆ(= ∑=--Ti tt x y 1210)ˆˆ(ββ, 则通过Q 最小确定这条直线,即确定0ˆβ和1ˆβ的估计值。
以0ˆβ和1ˆβ为变量,把Q 看作是0ˆβ和1ˆβ的函数,这是一个求极值的问题。
求Q 对0ˆβ和1ˆβ的偏导数并令其为零,得正规方程, 0ˆβ∂∂Q = 2∑=--Ti t t x y 110)ˆˆ(ββ(-1) = 0 (2.7) 1ˆβ∂∂Q = 2∑=--T i t t x y 110)ˆˆ(ββ(- x t ) = 0 (2.8) 下面用代数和矩阵两种形式推导计算结果。
首先用代数形式推导。
由(2.7)、(2.8)式得,∑=--Ti tt x y 110)ˆˆ(ββ= 0 (2.9) ∑=--T i tt x y 110)ˆˆ(ββx t = 0 (2.10) (2.9)式两侧用除T ,并整理得,0ˆβ= x y 1ˆβ- (2.11) 把(2.11)式代入(2.10)式并整理,得,])(ˆ)[(11∑=---Ti ttx x y yβx t = 0 (2.12) ∑∑==---Ti t tTi t t x x xx y y 111)(ˆ)(β= 0 (2.13)1ˆβ= ∑∑--ttt txx x y y x )()( (2.14)因为∑=-Ti ty yx 1)(= 0,∑=-Ti tx xx 1)(= 0,[采用离差和为零的结论:∑==-Ti tx x10)(,0)(1=-∑=Ti t y y ]。
所以,通过配方法,分别在(2.14)式的分子和分母上减∑=-Ti ty yx 1)(和∑=-Ti tx xx 1)(得,1ˆβ= ∑∑∑∑------)()()()(x xx x x x y yx y y x ttttt t(2.15)=∑∑---2)())((x x y y x x tt t(2.16) 即有结果:1ˆβ= ∑∑---2)())((x x y y x x t t t t t (2.17)0ˆβ= x y 1ˆβ- 这是观测值形式。
如果以离差形式表示,就更加简洁好记。
1ˆβ= ∑∑2ttt xyx0ˆβ= x y 1ˆβ- 矩阵形式推导计算结果:由正规方程,ˆβ∂∂Q = 2∑=--T i t t x y 110)ˆˆ(ββ(-1) = 0 1ˆβ∂∂Q = 2∑=--T i t t x y 110)ˆˆ(ββ(- x t ) = 0 0ˆβT +1ˆβ (∑=T i t x 1) = ∑=Ti t y 1ˆβ∑=Ti t x 1+1ˆβ (∑=Ti tx 12) = ∑=Ti t t y x 1⎥⎦⎤⎢⎣⎡∑∑∑2ttt xx xT ⎥⎥⎦⎤⎢⎢⎣⎡10ˆˆββ=⎥⎥⎦⎤⎢⎢⎣⎡∑∑t t t y x y ⎥⎥⎦⎤⎢⎢⎣⎡10ˆˆββ=12-⎥⎥⎦⎤⎢⎢⎣⎡∑∑∑t tt x x x T ⎥⎥⎦⎤⎢⎢⎣⎡∑∑t t t y x y=22)(1∑∑-t t x x T ⎥⎥⎦⎤⎢⎢⎣⎡--∑∑∑T x x x t t t 2⎥⎥⎦⎤⎢⎢⎣⎡∑∑t t t y x y = ⎪⎪⎪⎪⎪⎪⎪⎭⎫⎝⎛----∑∑∑∑∑∑∑∑∑∑∑22222)()(t t t t t t t t t t t t t x x T y x y x Tx x T y x x y x 注意:关键是求逆矩阵12-⎥⎥⎦⎤⎢⎢⎣⎡∑∑∑t tt x x x T。
它等于其伴随阵除以其行列式,伴随阵是其行列式对应的代数余子式构成的方阵的转置。
写成观测值形式。
1ˆβ= ∑∑---2)())((x x y y x x t t t t t0ˆβ= x y 1ˆβ- 如果,以离式形式表示更为简洁: 1ˆβ= ∑∑2ttt xyx0ˆβ= x y 1ˆβ-2.3 一元线性回归模型的特性1. 线性特性(将结果离差转化为观测值表现形式)2. 无偏性其中:0)222=-===∑∑∑∑∑∑∑i i i i i ii x X X x x x x K (故有:∑+=i i u K 22ˆββ3. 有效性首先讨论参数估计量的方差。
即: ∑=222)ˆ(i x Var οβ同理有:显然各自的标准误差为:∑=22)ˆ(i x se οβ,∑∑=221)ˆ(i i x n X se οβ标准差的作用:衡量估计值的精度。
由于σ为总体方差,也需要用样本进行估计。
证明过程如下: 因此有: u X Y ++=21ββ那么:)()()(2121u X u X y Y Y i i i i ++-++==-ββββ根据定义:i i ix y e 2ˆβ-=, (实际观测值与样本回归线的差值) 则有:两边平方,再求和: 对上式两边取期望有:其中:2222οο==∑∑i i x x A故有:22)1(ο-=∑n e Ei即有:⎥⎥⎦⎤⎢⎢⎣⎡-=∑222n e E i ο, 令2ˆ22-=∑n e i ο,则问题得证。
关于∑2i e 的计算:关于22R R ≤的证明:()()22211111R a k n n RR -⨯-=----=,其中:1≥a 。
当11=⇒=a k当11>⇒>a k ,当102≤≤R 时,有: 关于2R 可能小于0的证明。
设:t t t u X Y +=2β则有:那么 0ˆ2=∂∂βJ但:0≠∑t e ,因为没有0ˆ1=∂∂βJ存在。
同时,还有: 其中:()01=-=-=-∑∑∑∑t t t t e nn e e n e e e ,和 0=∑t t e X则: 考虑到: 若定义可能小于0。
参考书:Dennis J. Aigner Basic Econometrics, Prentice-Hall, Englewood Cliffs, N. J. 1971,pp85-88第二章2.1 简单线性回归最小二乘估计最小方差性质的证明对于OLS 估计式^1β和^2β,已知其方差为这里只证明^2()Var β最小,^1()Var β最小的证明可以类似得出。
设2β的另一个线性无偏估计为*2β,即其中2,i i i i i x w k k x ≠=∑因为*2β也是2β的无偏估计,即*22()E ββ=,必须有0iw =∑,1iiw X=∑ 同时*2()()i i Var Var wY β=∑22i w σ=∑ [因为2()i Var Y σ=]上式最后一项中22222()i ii i iiiiw x x w k k xx -=-∑∑∑∑∑∑0= (因为0iw =∑,1iiw X=∑)所以2*222222()()[]()i i i i x Var w k x βσσ=-+∑∑∑而20σ≥,因为i i w k ≠,则有2()0i i w k -≥,为此 只有i i w k =时,^*22()()Var Var ββ=,由于*2β是任意设定的2β的线性无偏估计式,这表明2β的OLS 估计式具有最小方差性。