研究生计量经济学模拟
试题及答案
暨 南 大 学 考 试 试 卷
一、单项选择题(将正确的选项填在括号内,共10小题,每小题2分,共20分)
1.某商品需求函数为i i i u x b b y ++=10,其中y 为需求量,x 为价格。为了考虑“地区”(农村、城市)和“季节”(春、夏、秋、冬)两个因素的影响,拟引入虚拟变量,则应引入虚拟变量的个数为【 B 】
A 2
B 4
C 5
D 6
2.假设某需求函数为i i i u x b b y ++=10,为了考虑“季节”因素(春、夏、秋、冬四个不同的状态),引入4个虚拟变量形式形成截距变动模型,则模型的【 D 】
A 参数估计量将达到最大精度
B 参数估计量是有偏估计量
C 参数估计量是非一致估计量
D 参数将无法估计
3.设y 表示居民的消费支出,x 表示居民的可支配收入,二者之间的真实关系
A t t x y 10???ββ+=
B E t t x y 10)(ββ+=
C ()t t t y f x u =+
D t t x y 10ββ+= 4.下面属于时间序列数据的是【 A 】
A 1991-2003年各年某地区20个镇的平均工业产值
B 1991-2003年各年某地区20个镇的各镇工业产值
C 某年某地区20个镇工业产值的合计数
D 某年某地区20个镇各镇工业产值
5.经验认为,某个解释变量与其他解释变量间多重共线性严重的情况是这个解
释变量的VIF 【 C 】
A 大于1
B 小于1
C 大于10
D 小于10
6.下列哪种方法不是检验异方差的方法【 D 】 A 戈德菲尔特——匡特检验 B 怀特检验
C 戈里瑟检验
D 方差膨胀因子检验
7.令1?θ和2?θ是参数θ的两个无偏的估计量,它们互相独立,其方差分别为2和
4。要使得2211???θθθc c +=是参数θ的无偏的方差最小的估计量,则【 C 】
A 4/14/321==c c
B 9/15/121==c c
C 3/13/221==c c
D 5/37
/421==c c
8.如果模型包含有随机解释变量,且与随机误差项不独立也不线性相关,则普通最小二乘估计量和工具变量估计量都是【 C 】 A 无偏估计量 B 有效估计量 C 一致估计量 D 最佳线性无偏估计量
9.在小样本情况下,对回归模型t t t u x y ++=10ββ进行统计检验时,通常假定
t u 服从【 C 】
A N (0,2i σ)
B t(n-2)
C N (0,2σ)
D t(n)
10.要使最小二乘法的估计量满足无偏性需要满足的条件是 【 D 】 A 正态性 B 无自相关 C 同方差 D 零均值
二、判断题(对的打“√”,错的打“×”,共10小题,每小题2分,共20分)
× 】
2.在一个含有截距项的回归模型中,使用最小二乘法计算出的残差总和必定等于零。【 √ 】
3.自相关出现时,通常计算的预期值的方差就不是有效的。【 √ 】
4.如果模型i ki k i i i e x x x y +++++=ββββ????22110 满足经典线性回归模型的基本假定,则在零假设j β=0下,统计量)?(/?j j s ββ(其中s(j β)是j β的标准误差)服从t (n-2)分布【 × 】
5.DW 在0和4之间取值,数值越小说明正相关程度越大,数值越大说明负相关程度越大。【 × 】
6.用一阶差分变换消除自相关是假定自相关系数为-1。【 √ 】
7.当计量经济学模型出现异方差性,其普通最小二乘法参数估计量仍具有无偏性,但不具有有效性。【 √ 】
8.决定系数是指回归平方和占残差平方和的比重。【 × 】
9.如果戈德菲尔特——匡特检验显着,则认为序列相关问题是严重的。
10.选择的工具变量只要满足和随机误差项不相关,即使和原来要代替的解释变量相关程度很低,得到的最小二乘估计量也是一致的。【 √ 】
三、简答题(共6小题,每题5分,共30分)
值的拟合优度 (5分)
在应用过程中,人们发现随着模型中解释变量的增多多重决定系数2R 的值往往会变大。有些解释变量对被解释变量的影响很小,增加这些解释变量对减
小残差平方和没有多大用处。由估计式1
?2
2--=∑k n e t
σ
知,引入的解释变量数目
越多,k 越大,如果引入的解释变量不能显着减小∑2
t e 的话,2?σ
的值将变大。而2?σ
的增大对于推测总体参数估计区间还是对预测区间的估计都意味着精确度的降低,因此不重要的解释变量不应该引入。于是引入修正的样本决定系数2R (3分)
∑∑-----
=1
/)(1
/122
2
n y y
k n e R
t
t
当增加一个对因变量有较大影响的解释变量时,残差平方和∑2
t e 减小比
)1(--k n 的减小更显着时,修正系数2R 才会增加。(2分)
2.设公司职员的年薪(y )与工龄(x )和学历(D )有关。学历分成三种类型:大专以下、本科、研究生(一个定性因素,三个不同属性)。为了反映“学历”这个定性因素的影响,有人建议对虚拟变量D 做如下设置,D=0时,代表大专以下,D=1时,代表本科,D=2时,代表研究生,t t t t u D x b b y +++=α10请问该设置方法可行吗试说明理由。(5分)
不可行,(2分)因为如果采用如下方式设置虚拟变量,可以得出三个反映不同学历的方程如下:大专以下 t t t u x b b y ++=10,本科 t t t u x b b y +++=10α,研究生 t t t u x b b y +++=102α,这样实际上人为的设定三个层次的差异是一样的,即大专与本科的差异和本科与研究生的差异是一样的,这种人为的限制不合适,因此该设置方法不可行。(3分)
3.关于随机误差项的经典假设条件的内容是什么,为什么要对回归模型规定经典假设条件(5分)
假设1 零均值假定 即在给定t x 的条件下,随机误差项t u 的数学期望为零
0)(=t u E
假设2 同方差假定。误差项t u 的方差与t 无关,为一个常数
22
2)())(()(σ==-=t t t t u E u E u E u Var
假定3 无自相关假定 即不同的误差项t u 和s u 相互独立 即 0),(=s t u u Cov
假定4 解释变量t x 与随机误差项t u 不相关假定
0))]())(([(),(=--=t t t t t t x E x u E u E x u Cov
只有具备这些假设,我们用最小二乘法估计出的估计量才具有良好的性质。(2分)
4.考虑如下模型:t t t u x b b y ++=10,n t ,,2,1 =其中y 代表消费,x 代表收
入,我们知道最小二乘估计量∑∑==---=n
t t
n
t t t
x x
y y x x
b 1
2
1
1
)()
)((?在满足经典假定的条件下
是无偏的,试问估计量1
21
2x x y y --=α是无偏的吗,请论证你的理由你还能找到其他的无偏估计量吗(5分)
由于
1
121
211211212)()()(b x x u u x b x b E x x y y E E =--+-=--=α,因此是无偏的估计量。(2
分)估计量∑∑==---=m
t t
m
t t t
x x
y y x x
b 1
2
1
1
)()
)((?,1-≤n m 仍是无偏的,因此m 取2,3到n-1时∑∑==---=m
t t
m
t t t
x x
y y x x
b 1
2
1
1
)()
)((?都是无偏的估计量。(3分)
5.为什么用最小二乘法算出来的参数估计量b
?和总体的真实参数b 有差异,是因为我们使用的是样本数据吗,是用样本推断总体产生的吗,如果我们使用的
数据是总体的数据,是用总体的数据来建立回归方程,那么用最小二乘法算出来的估计量和总体的真实参数就没有差异吗,说出你的观点。(5分)
首先最小二乘法算出来的参数估计量b
?和总体的真实参数b 有差异并不都是由于样本去推推断总体产生的,并不都是因为总体和样本之间的差异产生的。(2
分)最小二乘估计量b
?和总体的真实参数b 的差异来自于因变量y 与自变量x 的关系的不确定性,因为y 与x 的关系是由随机函数U XB Y +=确定的,最小
二乘估计量可以表示为U X X X B B
''+=-1)(?,它是一个随机变量,它的不确定或者说与参数真实值B 的差异来自随机误差项U 。(3分)
6.多重共线性对最小二乘估计量造成的影响是什么(5分)
多重共线性是多元回归模型可能存在的一类现象,分为完全共线与近似共线两类。模型的多个解释变量间出现完全共线性时,模型的参数无法估计。(2分)更多的情况则是近似共线性,这时,由于并不违背所有的基本假定,模型参数的估计仍是无偏、一致且有效的,但估计的参数的标准差往往较大,从而使得t-统计值减小,参数的显着性下降,导致某些本应存在于模型中的变量被排除,甚至出现参数正负号方面的一些混乱。显然,近似多重共线性使得模型偏回归系数的特征不再明显,从而很难对单个系数的经济含义进行解释。(3分)
共30分)
所示,依据表中资料建立消费y对收入x的线性回归方程,其估计结果如下:
(1)建立消费y对收入x的回归直线(2分)
(2)说明回归直线的代表性及解释能力(2分)
(3)在95%的置信度下检验参数的显着性(2分)
(4)如果有某个经济理论认为消费的边际倾向(回归模型中收入x前面的系数)是,你认为这个理论成立吗(4分)
解答:
①建立的消费y对收入x的回归直线方程为:Y =+*X
②根据我们得到的样本决定系数为可以说明我们建立的回归直线的代表性和解释能力是比较好的。
③根据我们从软件中计算出来的斜率系数的t统计值为,同时其对应的p值几乎为0,所以可以在5%的显着水平下拒绝该参数为0的原假设,认为该解释变量家庭收入对消费是有显着影响的。
④为了检验这个理论成立与否,我们先假设这个理论成立,于是可以设计出如下的统计量
38
.2
021
.0
14
.0
19
.0
)?(
?
=
-
=
-
=
b
s
b
b
z
由于样本数为100,是个大样本,所以这个统计量服从标准正态分布,在5%的显着性水平下,临界值为,由于算得的样本统计量为大于临界值,所以拒绝消费的边际倾向(回归模型中收入x前面的系数)是的原假设,认为这个理论不成立。
2.根据某地区职工平均消费水平(
t
y)职工平均收入(
t
x
1
)和生活费用价格
指数(
t
x
2
)的数据得出如下回归结果
(1)根据结果写出回归模型t t t t u x b x b b y +++=22110样本回归方程(2分) (2)给定在显着性水平α为,2622.2)9(025.0=t 。计算参数1b ,2b 的置信区间(2分)
(3)解释参数的经济意义(2分)
(4)如果某个理论认为1992年之前和之后消费和收入的关系模式发生了变化,你如何对这个理论进行检验判断。(4分)
解答:(1)根据数据算出的样本回归方程如下 Y = + *X1 - *X2
(2)1b ,2b 的置信区间。在显着性水平α为时,由于该模型中的样本小于30,是小样本,所以区间估计要用自由度为n-k-1的t 统计量,查表得到
2622.2)9(025.0=t 根据公式
当样本为小样本时,总体参数真实值1b 的置信区间:
ααα-=+≤≤-1))?(?)?(?(12/1112/1b s t b b b s t b P 得到
95.0)0.039772622.20.646196 0.039772622.20.646196 (1=?+≤≤?-b P ()95.00.7361640.5562281=≤≤b P
所以总体参数真实值1b 的置信区间为0.736164][0.556228,
。 当样本为小样本时,总体参数真实值2b 的置信区间:
ααα-=+≤≤-1))?(?)?(?(2
2/2222/2b s t b b b s t b P 得到95.0)72899.62622.26.847114 - 72899.62622.26.847114 - (2=?+≤≤?-b P
2( -22.06948.375207)0.95P b ≤≤=
所以总体参数真实值2b 的置信区间为]8.375207,22.0694- [
(3)回归系数的经济意义是职工平均工资每增加一元,职工平均消费水平平均来说增加元,生活费用价格指数每增加一个单位,职工平均消费水平平均来说减少元。这是符合经济实际的.
(4)可以通过虚拟变量来考察,设置的虚拟变量为:???=年之前年之后
1992019921D
设置的回归模型为:t t t t u aD x b x b b y ++++=22110
如果经过统计显着性检验发现a 和零没有区别,就说明1992年之前和之后消费和收入的关系模式没有发生显着的变化;如果经过统计显着性检验发现a 和零有显着区别,1992年之前和之后消费和收入的关系模式发生了显着的变化。
还可以通过chow 检验来进行,将1992年设置为转折点,用软件来判断相应的F 统计量的值是否显着超过临界值,如果超过就说明1992年之前和之后消费和收入的关系模式发生了显着的变化。
3. 设想你有一个针对包含N 个个体的两年的数据(即一个面板数据,包含N 个截面个体,2个年份),考虑下面的工资决定模型:
it i i t i it t it u c female d female z d wage ++?++++=22)log(2121δδγθθ
其中i female 是关于性别的虚拟变量,女性取值为1,男性取值为0,it z 是其他影响工资水平的变量,i c 可以与it z ,i female 相关。t d 2是关于时间的虚拟变量,第二年取值为1,第一年取值为0。 (1)请解释2θ和2δ的含义(3分)
(2)分别写出对应于的第一年和第二年的回归方程,并证明将两方程差分后得到如下的方程:(4分)
i i i i u female z wage ?++?+=?22)log(δγθ
(3)如果只想了解参数2θ,γ和2δ,使用上述的差分方程和使用原始的方程都可以进行估计,你认为使用哪个方程估计精度更高,说明理由。(3分) 解答:
(1)2θ是关于虚拟变量t d 2的回归系数,指的是在其他变量不变的条件下,平均来看第二年与第一年的工资对数值的差异;2δ关于虚拟变量t d 2与虚拟变量
i female 交互作用变量i t female d ?2的回归系数,反映了在其他变量不变的条件
下,平均来看第二年与第一年的变量i female 回归系数的差异,说明了变量
i female 对工资对数值影响的边际效用的变化。
(2)i i i i u female z wage ?++?+=?22)log(δγθ
第一年02=t d 11111)log(i i i i i u c female z wage ++++=δγθ
第二年12=t d 221221)log(i i i i i it u c female female z wage ++++++=δδγθθ 两个方程差分得到
i i i i u female z wage ?++?+=?22)log(δγθ
其中)log()log()log(12i i i wage wage wage -=?,12i i i z z z -=?
12i i i u u u -=?
(3)因为对于原始方程来说尽管可以使用的样本有2n 个,但是其中需要估计的参数为4+n+k 个(如果z 中包含的变量数为k)。而使用差分方程估计,尽管是用的样本只有n 个,但是需要估计的参数只有2+k 个,可以少估计2+n 个参数,因此损失的自由度比原始方程要少2个,所以使用差分方程估计精度更高。
4.以t Q 表示粮食产量,t A 表示播种面积,t C 表示化肥施用量,经检验,他们取对数后都是I (1)变量且相互之间存在CI (1,1)关系。同时经过检验并剔除了不显着的变量(包括滞后变量),得到如下粮食生产模型:
t t t t t t C C A Q Q μααααα+++++=--1432110ln ln ln ln ln
推导误差修正模型的表达式,并指出误差修正模型中每个待估参数的经济意义。 解答:
t
t t t t t t
t t t t t t t t t t C A Q C A C C C A A A Q Q Q Q μααααααααααμααααααα+-+-----
--?+?=+++-++-+-+=-=?---------)ln 1ln 11)(ln 1(ln ln ln )()ln (ln ln )ln (ln ln )1(ln ln ln 11
43112
1011321431312121101(6分)
短期播种面积变化1%,将引起粮食产量变化2α%;短期化肥施用量变化1%,将引起粮食产量变化3α%;-(1-1α)的大小反映了对偏离长期均衡的调整力度。(4分)
5. 一个由两个方程组成的联立模型的结构形式如下(省略t-下标)
t t t t t u A S N P ++++=3210αααα t t t t v M P N +++=210βββ
(1)指出该联立模型中的内生变量与外生变量。(2分)
(2)分析每一个方程是否为不可识别的,过度识别的或恰好识别的(4分) (3) 有与μ相关的解释变量吗有与υ相关的解释变量吗(2分) (4)如果使用OLS 方法估计α,β会发生什么情况(2分) 解答:
(1)内生变量:P 、N ;外生变量:A 、S 、M
(2)容易写出联立模型的结构参数矩阵
P N 常量 S A M
()???
?
??-------=Γ20
1
32010
01
01
βββααααβ 对第1个方程,()()200ββ-=Γ,因此,()100=Γβ秩,即等于内生变量个数减1,模型可以识别。进一步,联立模型的外生变量个数减去该方程外生变
量的个数,恰等于该方程内生变量个数减1,即4-3=1=2-1,因此第一个方程恰好识别。
对第二个方程,()()32
00ααβ--=Γ,因此,()100=Γβ秩,即等于内生变
量个数减1,模型可以识别。进一步,联立模型的外生变量个数减去该方程外生变量的个数,大于该方程内生变量个数减1,即4-2=2>=2-1,因此第二个方程是过渡识别的。
(3)S,A,M 为外生变量,所以他们与μ,υ都不相关。而P,N 为内生的,所以他们与μ,υ都相关。具体说来,N 与P 同期相关,而P 与μ同期相关,所以N 与μ同期相关。另一方面,N 与v 同期相关,所以P 与v 同期相关。 (4)由(3)知,由于随机解释变量的存在,α与β的OLS 估计量有偏且是不一致的。