当前位置:文档之家› 计量教案(7随机解释变量)

计量教案(7随机解释变量)

第七章随机解释变量

按照经典的回归分析理论,回归模型中的解释变量是非随机的,其取值都是事先精确给定的,并且还假定解释变量与随机误差项不相关。然而,在实际问题中,这种假定往往是难于满足的,经常存在着违背这种假设的情况。本章将要讨论的就是线性回归模型中的解释变量是随机的,而非确定性变量的问题。

本章的目的与要求

通过本章学习,要求重点掌握的内容是:

1.了解随机变量产生的原因,充分理解当线性回归模型的解释变量为随机的情形下可能产生的后果;

2.熟练掌握检测随机解释变量的各种方法以及在此情形下相应的处理与估计改进方法。从而能够运用这些知识处理经济计量分析实践中的相应问题。

本章内容(计划学时)

一、随机解释变量产生的原因及后果

(一)随机解释变量产生的原因

(二)随机解释变量问题的后果

二、误差变量模型

(一)误差变量模型的含义

(二)误差变量模型的性质

三、工具变量法

(一)工具变量的概念

(二)工具变量的原理

(三)测量误差的检验

(四)工具变量的选择

学习重点

一、随机解释变量的后果

二、误差变量模型的概念与性质

三、工具变量法的原理

四、测量误差的检验

学习难点

一、随机解释变量的后果

二、误差变量模型的性质

三、工具变量法的原理

四、测量误差的检验

第一节 随机解释变量的原因及其后果

一、随机解释变量产生的原因

1、由于存在观测误差,使得解释变量具有一定的随机性。

2、被解释变量的滞后性;

3、经济变量的取值(观测值)往往难以人为控制,其取值往往难以十分精确;

二、随机解释变量问题的后果

对于解释变量是随机变量的线性回归模型,其参数的估计倘若仍使用普通最小二乘法,

估计得到的β

?既不是β的无偏估计,也不是β的一致估计。 线性回归模型:

Y i = βX i + u i , (式7-1.1)

式中仍假设随机误差项u i 具有零均值和常数方差,即假定E (u i ) = 0、Var ( u i ) = σ2,且X i 是随机变量。对此使用普通最小二乘法,可得回归系数β的估计量为:

∑∑2

1?i i X Y X =β ∑∑+2

1)

(i i i i X

u X X β= ∑∑∑=221i i i i X

u X X +β ∑∑+=2

1i i i X u X βi i

i u X X )(2∑∑+=β 如果随机解释变量X i 与随机误差项u i 是相互独立的,那么就有

0)()(])[(22==∑∑i i

i i i i u E X X E u X X E (式7-1.2) 从而

])[()()?(2i i

i u X X E E E ∑∑+=ββ= β (式7-1.3) 这时,回归系数的普通最小二乘估计仍然是无偏估计。

若随机解释变量X i 与随机误差项u i 不独立,但却不相关,有Cov ( X i , u i ) = 0,

由于n u X i

i ∑是X i 与u i 协方差的一致估计量,即当样本容量n → ∞时,估计量 n u X i

i ∑ 接

近于Cov ( X i , u i ) = 0的概率为1,称

n u X i i ∑ 的概率极限为Cov ( X i , u i ) = 0, 记为

p lim n u X i

i ∑= Cov ( X i , u i ) = 0

所以,β

?的概率极限为 p lim β?= β + )/lim()

/lim(2

n X p n u X p i i i ∑∑= β

表明在X i 与u i 不相关时,普通最小二乘估计量β

?仍是β的一致估计。 如果随机解释变量X i 与随机误差项u i 具有相关性,则Cov ( X i , u i ) ≠ 0,那么E (n u X i i ∑)≠ 0,以及n u X i

i ∑的概率极限不为0,即p lim (n u X i

i ∑)≠ 0,所以

)()?(2

∑∑+=i i i X u X E E ββ≠ β p lim β?= β + )/lim()

/lim(2n X p n u X p i i i ∑∑≠ β

这表明当随机解释变量X i 与随机误差项u i 具有相关关系时,普通最小二乘估计量β

?既不是β的无偏估计,也不是β的一致估计。

第二节 误差变量模型

一、误差变量模型的概念

解释变量含有观测误差的模型称为误差变量模型。

二、误差变量模型的性质

模型参数的估计量将是有偏的和不一致的。

在样本模型y = β0 + β1 x + e 中,解释变量x 与被解释变量y 的观测值假设无法准确得到,总是存在观测误差,有

x* = x + v

y* = y + w

其中v 与w 都是观测误差,并设二者均同样满足零均值、同方差、且二者都不与 x 和 y 相关的假定,即有:

E ( v ) = 0 E ( w ) = 0

Var ( v ) = σv 2 Var ( w ) = σw 2

Cov ( v ,x ) = 0 Cov ( w ,x ) = 0

Cov ( v ,y ) = 0 Cov ( w ,y ) = 0

将实际观测变量 x*= x + v 与y*= y + w 代入

y =0

?β +1?β x + e (式7-2.1) 得:

y*-w = 0

?β +1?β ( x*-v ) + e y* =0

?β +1?β x* + e + w –1?βv 记 e*= e + w –1

?βv ,上式可写成 y* =0

?β +1?βx* + e* (式7-2.2) 在此一元线性回归模型中,随机误差项e*(在e*中仅有v 与x*有关)与解释变量x*之间的协方差为:

Cov ( e*, x* ) = Cov ( –1?βv , x + v ) = –1

?βσv 2 由于随机误差项e*与解释变量x*之间的协方差不等于0,说明了随机误差项e 与解释变量x 之间存在着相关性,所以,如果仍然使用普通最小二乘法对模型(式7-2.2)进行估计,则模型参数的估计量将是有偏的和不一致的。

第三节 工具变量法

一、工具变量法的概念

找一个与模型中的随机解释变量高度相关,但却与随机误差项不相关的变量,并用此变量和模型中的变量构造出一个与原模型相应回归系数的一个一致估计量。这个变量就是工具变量,用Z 表示,这种方法就是工具变量法。即

Cov ( Z , x ) ≠ 0 (甚至越大越好)

Cov ( Z , e ) = 0

二、工具变量法的原理

1、不含截距项β0的一元线性回归模型

Y = β1X + u (式7-3.1)

其β1的普通最小二乘估计是由下式得到的

∑X (Y -1

?βX )= 0 (式7-3.2) 且 1?β∑∑2X XY = (式7-3.3)

这里主要是假设了X 与u 不相关的结果。如果X 与u 相关,就无法再使用这个公式进行

估计了。但是,倘若我们找到一个与模型中的随机解释变量X 高度相关,但却与随机误差项u 不相关的随机变量Z ,即

Cov ( Z , X ) = p lim n

X Z ∑≠ 0 (式7-3.4) Cov ( Z , u ) = p lim n

u Z ∑= 0 (式7-3.5) 由于随机变量Z 与X 高度相关(我们寻找的有此条件的Z ),可代替(式7-3.2)的X ,将其改变为:

∑Z (Y -*1

?βX )= 0 (式7-3.6) 解此方程,即得β的工具变量估计量*1

?β为 ∑∑=*ZX

ZY 1?β (式7-3.7) 将 Y = β1 X + u 代入(式7-3.7),得 *1?β=∑∑+ZX u X Z )(1β=∑∑+ZX Zu 1

β (式7-3.8) 对该式取概率极限,有

p lim *1?β= β1+)/lim()/lim(∑∑n ZX p n Zu p = β1 (式7-3.9)

这说明了工具变量估计量*1

?β是回归系数β1的一致估计量。 2、含截距项β0的一元线性回归模型

对于回归模型

Y = β0 + β1 X + u

其普通最小二乘估计的标准方程组是:

∑(Y -0

?β-1?βX )= 0 (式7-3.10) ∑X (Y -0

?β-1?βX )= 0 (式7-3.11) 同样的,模型中的解释变量X 是随机的且与随机误差项u 相关,我们已找到随机变量Z 与X 相关,但与u 不相关,则上述标准方程组的第二式的乘积因子X 可替换成 Z ,将标准方程组改写为:

∑(Y -*0

?β-*1?βX )= 0 (式7-3.12) ∑Z (Y -*0

?β-*1?βX )= 0 (式7-3.13)

整理得

∑Y = n *0

?β+*1?β∑X (式7-3.14) ∑ZY =*0

?β∑Z -*1?β∑ZX (式7-3.15) 解此改变后的标准方程组,可得β0与β1的工具变量估计量为:

*1?β=∑∑----)

)(())((X X Z Z Y Y Z Z (式7-3.16) *0

?β=X Y *1?β+ (式7-3.17) 可以证明

*1?β=β1 + ∑∑----)

)(())((X X Z Z u u Z Z (式7-3.18) 对这两个工具变量的估计量取概率极限,得 p lim *1?β= β1+]/))((lim[]

/))((lim[n X X Z Z p n u u Z Z p ∑∑----

= β1+)

,(),(X Z Cov u Z Cov = β1 (式7-3.19) p lim *0

?β= p lim Y -p lim X *1?β =01ββ=-X Y (式7-3.20)

这说明,使用工具变量法不仅可得到回归系数β1的一致估计量,同时也可以得到截距项β0的一致估计量。

三、测量误差的检验

检验的步骤:

1、对于所研究的回归模型,无论是否存在测量误差,首先采用OLS 法估计出参数估计量;

2、对可能存在测量误差的解释变量,选择与其相关的工具变量,将可能存在测量误差的解释变量对选择的工具变量进行回归,并获得回归残差ω;

3、将回归残差ω作为一个解释变量加入第一步中的回归模型中,再次进行OLS 估计,

得ω的参数估计值ω

β?,并对其进行显著性检验; 4、若ω

β?为显著时,则可以认为解释变量的确存在测量误差,反之,认为解释变量不存在测量误差。

四、工具变量的选择

工具变量法估计的关键问题是工具变量的选择,在实际分析中,寻找一个可行的工具变量是一件并不很容易的事情。通常的做法是:

1、对于时间序列资料

(1)随机解释变量X t 的滞后值X t -1可作为工具变量;

对于

Y t = βX t + u t (式7-3.21)

如果解释变量X t 存在序列相关,而且有

Cov ( X t , u t ) ≠ 0

Cov ( X t -1 , u t ) = 0

这时可用X t -1作为工具变量,得β的工具变量估计量为:

t t t t X X Y

X

∑∑--=11*?β (式7-3.22)

(2)被解释变量Y t 的滞后值Y t-1作为工具变量,得β的工具变量估计量为:

t t t t X Y Y

Y

∑∑--=11*?β (式7-3.23)

2、对于截面数据资料

对于截面数据资料,常见的一种较简便的工具变量法是组平均方法。有以下三种:

(1)瓦尔德(A.Wald )法

首先将解释变量X 按由小到大排列,并以中位数m e 为界,将数据分为两部分,并且记大于m e 的每一个观测值为1作为Z 值;记小于m e 的每一个观测值为-1作为Z 值。即取工具变量Z 值为

+1 X >m e

-1 X <m e (式7-3.24)

实际上就是对于每一个观测值,大于m e 的取正值,小于m e 的取负值。

将( 式7-3.24 )代入∑∑=*ZX

ZY 1?β得: *0?β= ∑∑∑∑--1212

X X Y Y

1

212X X Y Y --=

(式7-3.25) 式中小于其中位数的一组样本数据总和用∑X 1和∑Y 1表示,大于其中位数的一组样本数据总和用∑X 2和∑Y 2表示。

(2)巴特莱特(M.S.Bartlett )法

巴特莱特建议将解释变量X 的样本观测值按大小顺序排列后,平均分成三份,然后取工具变量Z 的值为:

+1 X 值最大一组

Z = 0 X 值中间一组 (式7-3.26)

-1 X 值最小一组

将( 式7-3.26 )代入∑∑=*ZX

ZY 1?β得: *0?β=∑∑∑∑--1313

X X Y Y

1

313X X Y Y --=

(式7-3.27) 式中数值最小的一组样本数据总和用∑X 1和∑Y 1表示;数值最大的一组样本数据总和用∑X 3和∑Y 3表示;其他的为0。

(3) 德宾(J.Durbin )法

德宾则建议将X i 的序号作为工具变量Z 。即将解释变量X 的观测值按从小到大排列后,取X 的升序排列序号1、2、…… n 作为工具变量Z 。得 ∑∑=*i i

iX iY 1?β (式7-3.28)

如果上述各种方法的大小排序正好与随机误差项相关,那么用这些方法所得的估计量就会有偏或是不一致。不过,这种情况极为少见。有人曾作过研究表明,以上分组法所得到的估计量在很多情况下是一致的。

显然,工具变量可以有多种不同的选择,实际上,如果随机解释变量与随机误差项不相关,则随机解释变量本身也可以作为工具变量使用。实践中,若有多个工具变量可供选择,为了使工具变量估计量的方差较小,应选择与随机解释变量相关程度较密切的变量作为工具变量,或者用这些供选择变量的线性组合作为工具变量,以提高工具变量估计量的渐进有效性。

相关主题
文本预览
相关文档 最新文档