第7章 随机解释变量
- 格式:doc
- 大小:551.00 KB
- 文档页数:18
第七章思考与练习参考答案1.答:函数关系是两变量之间的确定性关系,即当一个变量取一定数值时,另一个变量有确定值与之相对应;而相关关系表示的是两变量之间的一种不确定性关系,具体表示为当一个变量取一定数值时,与之相对应的另一变量的数值虽然不确定,但它仍按某种规律在一定的范围内变化。
2.答:相关和回归都是研究现象及变量之间相互关系的方法。
相关分析研究变量之间相关的方向和相关的程度,但不能确定变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况;回归分析则可以找到研究变量之间相互关系的具体形式,并可变量之间的数量联系进行测定,确定一个回归方程,并根据这个回归方程从已知量推测未知量。
3.答:单相关系数是度量两个变量之间线性相关程度的指标,其计算公式为:总体相关系数,样本相关系数。
复相关系数是多元线性回归分析中度量因变量与其它多个自变量之间的线性相关程度的指标,它是方程的判定系数2R 的正的平方根。
偏相关系数是多元线性回归分析中度量在其它变量不变的情况下两个变量之间真实相关程度的指标,它反映了在消除其他变量影响的条件下两个变量之间的线性相关程度。
4.答:回归模型假定总体上因变量Y 与自变量X 之间存在着近似的线性函数关系,可表示为t t t u X Y ++=10ββ,这就是总体回归函数,其中u t 是随机误差项,可以反映未考虑的其他各种因素对Y 的影响。
根据样本数据拟合的方程,就是样本回归函数,以一元线性回归模型的样本回归函数为例可表示为:tt X Y 10ˆˆˆββ+=。
总体回归函数事实上是未知的,需要利用样本的信息对其进行估计,样本回归函数是对总体回归函数的近似反映。
两者的区别主要包括:第一,总体回归直线是未知的,它只有一条;而样本回归直线则是根据样本数据拟合的,每抽取一组样本,便可以拟合一条样本回归直线。
第二,总体回归函数中的0β和1β是未知的参数,表现为常数;而样本回归直线中的0ˆβ和1ˆβ是随机变量,其具体数值随所抽取的样本观测值不同而变动。
计量经济学 第一部分:名词解释第一章1、模型:对现实的描述和模拟。
2、广义计量经济学:利用经济理论、统计学和数学定量研究经济现象的经济计量方法的统称,包括回归分析方法、投入产出分析方法、时间序列分析方法等。
3、狭义计量经济学:以揭示经济现象中的因果关系为目的,在数学上主要应用回归分析方法。
第二章1、总体回归函数:指在给定Xi 下Y 分布的总体均值与Xi 所形成的函数关系(或者说总体被解释变量的条件期望表示为解释变量的某种函数)。
2、样本回归函数:指从总体中抽出的关于Y ,X 的若干组值形成的样本所建立的回归函数。
3、随机的总体回归函数:含有随机干扰项的总体回归函数(是相对于条件期望形式而言的)。
4、线性回归模型:既指对变量是线性的,也指对参数β为线性的,即解释变量与参数β只以他们的1次方出现。
5、随机干扰项:即随机误差项,是一个随机变量,是针对总体回归函数而言的。
6、残差项:是一随机变量,是针对样本回归函数而言的。
7、条件期望:即条件均值,指X 取特定值Xi 时Y 的期望值。
8、回归系数:回归模型中βo ,β1等未知但却是固定的参数。
9、回归系数的估计量:指用01,ββ等表示的用已知样本提供的信息所估计出来总体未知参数的结果。
10、最小二乘法:又称最小平方法,指根据使估计的剩余平方和最小的原则确定样本回归函数的方法。
11、最大似然法:又称最大或然法,指用生产该样本概率最大的原则去确定样本回归函数的方法。
12、估计量的标准差:度量一个变量变化大小的测量值。
13、总离差平方和:用TSS 表示,用以度量被解释变量的总变动。
14、回归平方和:用ESS 表示:度量由解释变量变化引起的被解释变量的变化部分。
15、残差平方和:用RSS 表示:度量实际值与拟合值之间的差异,是由除解释变量以外的其他因素引起的被解释变量变化的部分。
16、协方差:用Cov (X ,Y )表示,度量X,Y 两个变量关联程度的统计量。
17、拟合优度检验:检验模型对样本观测值的拟合程度,用2R 表示,该值越接近1,模型对样本观测值拟合得越好。
第七章 相关和回归一、单项选择题1.相关关系中,用于判断两个变量之间相关关系类型的图形是( )。
(1)直方图 (2)散点图 (3)次数分布多边形图 (4)累计频率曲线图 2.两个相关变量呈反方向变化,则其相关系数r( )。
(1)小于0 (2)大于0 (3)等于0 (4)等于13.在正态分布条件下,以2yx S (提示:yx S 为估计标准误差)为距离作平行于回归直线的两条直线,在这两条平行直线中,包括的观察值的数目大约为全部观察值的( )。
(1)68.27% (2)90.11% (3)95.45% (4)99.73% 4.合理施肥量与农作物亩产量之间的关系是( )。
(1)函数关系 (2)单向因果关系 (3)互为因果关系 (4)严格的依存关系 5.相关关系是指变量之间( )。
(1)严格的关系 (2)不严格的关系(3)任意两个变量之间关系 (4)有内在关系的但不严格的数量依存关系 6.已知变量X 与y 之间的关系,如下图所示:其相关系数计算出来放在四个备选答案之中,它是( )。
(1)0.29 (2)-0.88 (3)1.03 (4)0.997.如果变量z 和变量Y 之间的相关系数为-1,这说明两个变量之间是( )。
(1)低度相关关系 (2)完全相关关系 (3)高度相关关系 (4)完全不相关 8.若已知2()x x -∑是2()y y -∑的2倍,()()x x y y --∑是2()y y -∑的1.2倍,则相关系数r=( )。
(1)1.2 (3)0.92 (4)0.65 9.当两个相关变量之问只有配合一条回归直线的可能,那么这两个变量之间的关系是( )。
(1)明显因果关系 (2)自身相关关系(3)完全相关关系 (4)不存在明显因果关系而存在相互联系 10.在计算相关系数之前,首先应对两个变量进行( )。
(1)定性分析 (2)定量分析 (3)回归分析 (4)因素分析 11.用来说明因变量估计值代表性高低的分析指标是( )。
第7章 随机解释变量单方程线性计量经济学模型假定解释变量是确定性变量,并且与随机误差项不相关,违背这一基本假设的问题被称为随机解释变量问题。
本章介绍了随机解释变量问题的概念、产生的原因和后果、检验方法以及解决方法。
随机解释变量问题的概念对于计量经济模型n21i i k i k i 22i 110 ,,,ββββ=+++++=u X X X Y i(7.1.1)其中一个基本假设是解释变量k 21,,X X X 是确定性变量,即解释变量与随机扰动项不相关。
但是在现实经济生活中,这个假定不一定成立,这一方面是因为用于建模的经济变量的观测值一般会存在观测误差,另一方面是经济变量之间联系的普遍性使得解释变量可能在一定程度上依赖于应变量,即解释变量X 影响应变量Y ,而应变量Y 也会反过来影响解释变量X 。
模型中如果存在一个或多个随机变量作为解释变量,就称为模型出现了随机解释变量问题。
其中k x 可能与随机误差项u 不相关,就是说,解释变量121,,-k x x x 都是外生的,但k x 有可能在方程(4.4.1)中是内生的,则称原模型存在随机解释变量问题。
内生性可能源自于省略误差、测量误差,联立性等①。
为讨论方便,我们假设中2X 为随机解释变量。
在模型()中,根据解释变量2X 与随机误差项的关系,可以分为三种类型: 1)随机解释变量与随机干扰项独立)()(),(),(222===u E x E u x E u X Cov(7.1.2)2)随机解释变量与随机干扰项同期无关但异期相关n 21i 0),(),(i 2i 2 ,,,===u x E u X Cov i i①具体详见《Econometric analysis of cross section and panal data 》(Jeffrey Wooldrige,2007 )。
(7.1.3)n21i 0),(),(s -i 2s -i 2 ,,,=≠=u x E u X Cov i i(7.1.4)3)随机解释变量与随机干扰项同期相关n 21i 0),(),(i 2i 2 ,,,=≠=u x E u X Cov i i(7.1.5)实际经济问题中的随机解释变量在许多经济现象中,自变量的非随机性假定有时是不符合实际的。
因为,⑴ 许多经济变量是不能用控制的方法进行观测的,所以作为模型中的解释变量其取值就不可能是确定的,而是随机的。
⑵ 由于随机误差项中包含了模型中略去的解释变量,而略去的解释变量同模型中保留的解释变量往往存在一定的相关关系。
⑶ 在自回归模型中,因变量作为解释变量也必定是随机变量。
因此,我们必须对模型中的解释变量为随机变量且与随机项相关的情形进行讨论。
在单方程计量经济学模型中,凡是外生变量都被认为是确定性的,于是随机解释变量问题主要变现于用滞后被解释变量作为模型的解释变量的情况。
同时,由于经济活动具有连续性,使得这类模型在以时间序列数据作样本的模型中占据较大份额。
例如,消费不仅受收入的影响,还受前期消费水平的影响。
投资不仅受收入的影响,还受前期投资水平的影响。
但是,并不是所有包含滞后被解释变量的模型都会带来随机解释变量问题,下面通过几个例子来说明。
耐用品的存量由前一个时期的存量和当期收入共同决定,于是著名的“耐用品存量调整模型”表示为t t t t u Q I Q +++=-1210βββ n t ,,3,2,1 = (7.2.1)这是一个滞后被解释变量作为解释变量的自回归模型。
但是如果模型中不存在随机误差项的序列相关性,那么随机解释变量t t t u u Q 相关,而与只与11--不相关,属于上述的第一种情况。
再如,在著名的“合理预期的消费函数模型”中,首先认为消费是由对收入的预期所决定的,或者说消费是有计划的,而这个计划是根据对收入的预期制定的。
于是有:1110110---++=++=t e t t t e t t u IC u I C ββββ (7.2.2)其中,et I 表示t 期收入预期值,而预期收入与实际收入之间存在差距,用函数形式表现出来为:()e t t e t I I I 11-+-=λλ (7.2.3)该式是由合理预期理论给出来的,因此可以进一步推导出()t e t t t u I I C ++-+=-11101λβλββ()()t t t t u u C I +--+-+=--101101βλλββ()()111011---++-+-=t t t t u u C I λλλβλβ (7.2.4) 在该模型中,作为解释变量的1-t C 是一个随机解释变量,同时由于11--t t u C 与高度相关,所以它与模型(7.2.4)中的随机误差项1--t t u u λ也高度相关。
属于上述第三种类型。
随机解释变量的后果当模型存在随机解释变量时,如果仍采用普通最小二乘法估计模型参数,不同性质的随机解释变量会产生不同的后果。
对一元线性回归模型i i 10μββ++=X Y i在前面得到如下最小二乘估计量:(7.3.1)随机解释变量X 与随机干扰项μ的关系不同,参数OLS 估计量的统计性质也会不同。
7.3.1估计量的渐近特征如果一个变量是随机变量,它的精确抽样分布是很难找到的,只能是渐进结果。
例如,∑∑∑∑+==2iii12iii1y xx x x μββ当线性回归模型满足最小二乘法的假定条件时,其参数的最小二乘估计量具有无偏性和有效性。
优势最小二乘估计量并不具有这种统计特征,但随着样本容量的增加却具有了这种特征。
1)渐近无偏性设∧nβ是参数β的估计量,其中n 为样本容量,设依次抽样的样本容量n 分别为r n n n <<< 21,则∧nβ是一个随机变量,其数学期望值为E(∧n β),方差为Var(∧nβ)=E[∧nβ-E(∧nβ)]2。
随着样本容量n 取值的不同,得到下面随机解释变量序列|∧nβ|∧∧∧=rn n n βββ,,,21| E(∧nβ)|∧∧∧=)(,,)(),(21rn n n E E E βββ| Var(∧nβ)|222)]([,,)]([,)]([2211∧∧∧∧∧∧---=rr n n n n n n E E E E E E ββββββ (7.3.2)所谓渐近分布是指。
当样本容量n 趋于无穷大时,上面各随机变量序列分别收敛到一定分布。
对于均值、方差存在以下关系。
)E() E( n∧∧∞→=ββn Lim2n)]E([E ) Var( ∧∧∧∞→-=βββn Lim (7.3.3)其中)E(∧β,2)]E([E ∧∧-ββ分别是∧nβ的渐近期望值和渐进方差。
如果ββ=∧∞→) E( nn Lim则称∧nβ是β的渐近无偏估计。
即当样本容量n 充分大时,∧nβ的均值趋向于总体参数β。
以上的讨论是在样本容量充分大的情况下进行的。
如果小样本估计量是有偏的,但其估计量具有渐近无偏性,我们就可以增加样本来优化估计结果。
2)一致性一致性估计是指对于任意给定的两个任意小的正数ηε,,总存在一个充分大的样本容量0n ,使得当n>0n 时,满足ηεββ->⎭⎬⎫⎩⎨⎧<-∧1||n P (7.3.4)称估计序列ββ是∧n 的一致估计序列,即当样本容量n 充分大时,∧nβ值趋向于总体真实值的概率接近于1,记为ββ=∧∞→nn L P im (7.3.5)也可以简记为 ββ=∧lim P综上所述,由数理统计的理论可知,要想建立一个一致性估计量,必须满足两个条件ββ=∧∞→)(im n n E L 和0)(im =∧∞→nn Var L β即估计量∧nβ具有渐近无偏性,并且当样本容量充分大时,∧nβ的方差趋近于0。
3)随机解释变量模型最小二乘估计量的统计特征 随机解释变量X 的OLS 估计量可能出现下面三种情况(1)如果X 与随机误差项u 相互独立,即0)()()(==i i i i u E X E u X E ,得到的参数估计量仍然是无偏一致估计量。
由于()∑∑∑∑-=-=ii i i iii u X u X u X Xu x因此则有 []1211)()(1)(βββ=-+=∑∑∑∧iii i u E X u X E x E (7.3.6)这说明∧1β是1β的无偏估计量。
同理可以证明∧0β是0β的无偏估计量。
(2)如果X 与μ同期不相关,而异期相关,得到的参数估计量有偏,但却是一致的。
由(7.3.1)易知(7.3.7) 尽管i X 与i u 同期无关,但对任一的分母中一定包含不同期的X ;由异期相关性知i k 与i u 相关,导致,ββ1i )ˆ(≠E 即参数估计量是有偏的。
但是∑∑∑+=+=)()()ˆ(i1i 211μβμββi ii k E x xE E 1i 12i 12i i )(ar ),(ov )1lim()1(lim )(lim βμβμβμβ=+=+=+∑∑∑∑∞→i i i i i i n X V X C x nP x n P x x P(7.3.8)即在假定01im2≠∑i x nL P 的情况下,分子项等于0,于是上式成立。
这说明最小二乘估计量∧1β虽然是有偏的,但它是1β的一致估计量。
(3)如果随机解释变量X 与随机误差项u 同期相关,得到的参数估计量有偏且非一致。
由于 Cov ()0,≠i i u X 所以则有0),(1im≠=∑i i i i u X Cov u X nL P (7.3.9) 即12111lim 1lim 1limlim βββ≠-+=∑∑∑∧i ii i x nP u n P X u X n P P (7.3.10)这说明最小二乘估计量∧1β是有偏的,也不是1β的一致估计量。
同理也可以证明∧0β是有偏的,也不是0β的一致估计量。
但是需要注意的是,如果模型中带有滞后被解释变量作为解释变量,则当该滞后被解释变量与随机干扰项同期相关时,普通最小二乘估计量是有偏的且非一致的。
即使同期无关,其普通最小二乘估计量也是有偏的,因为此时肯定会出现异期相关。
总之,在存在随机解释变量问题时,采用OLS 法估计模型参数,得到的参数估计量在小样本情况下是有偏的,在大样本情况下也不具有渐进无偏性,就有可能产生严重的误导结果。
随机解释变量的检验(内生性)随机解释变量的内生性检验在国内,暂时还很少提及,这里简单介绍下国外学者的主要检验方法之一—豪斯曼检验(Hausman,1978)。
举例说明,假定我们有单一的被怀疑的内生变量u z z x y ++++=231210ββββ (7.4.1)其中,假定x 是内生性变量,21,z z 是外生的。
如果x 与u 不相关,我们应该用OLS 法估计(4.4.20)模型。