当前位置:文档之家› 计量经济学ch9 虚拟变量回归模型

计量经济学ch9 虚拟变量回归模型

计量经济学ch9 虚拟变量回归模型
计量经济学ch9 虚拟变量回归模型

Ch9 虚拟变量回归模型

9.1. 虚拟变量

虚拟变量:用于反映定性变量,描述样本点是否具有某种属性或特征。度量这种属性常用“1”表示有,0表示“没有”(不出现)。

例如:性别、种族、战争、区域、经济结构变化和季节效应等。

例1:研究薪金问题;薪水y i ,

?

??=女性男性

01i D

y i =α+βD i +u i

于是:.)1(,

)(βαα+====i i i i D y E o D y E

表明男教授平均薪金为.βα+女教授为α。

例2:研究不同地区教师的工资差别,将一个国家分为3个地区(东中西),引进2个虚拟变量(为什么?),建立模型: y i =β1+β2D 2i +β3D 3i +u i

???=other east D i 011?

??=other west

D i 012上述模型回归元全是的虚拟变量,这样的模型称为 ANOV A 模型。

9.2 ANOV A模型

ANOV A模型用于分析不同子样本的均值在统计上的差异,类似与统计中比较均值差异的方差分析,所以被成为ANOV A回归模型。

例: 美国公立学校教师的地区差别

将美国分为东北(21个州)、南方(17个州)和西部地区(13个州),共3个属性,引进2个虚拟变量D2i和D3i,

D2i=1,如第i个州属于东北区,否则D2i=0;

D3i=1,如第i个州属于南方区,否则D3i=0。

模型为

y i=β1+β2D2i+β3D3i+u i(9.1) 东北区教师的平均工资:

E(y i∣D2i=1, D3i=0)= β1+β2

南方区和西部地区教师的平均工资分别为:

E(y i∣D2i=0, D3i=1)= β1+β3

E(y i∣D2i=0, D3i=0)= β1

估计结果为:

y i=26158.62-1734.473D2i-3264.615D3i+e i(9.1E)

se= (1128.53) (1435.93) (1499.6)

t= (23.18) (-1.21) (-2.18)

(0.0000)(0.2330)(0.0349)

R2=0.09

东北区教师的平均工资:26158.62-1734.473=24424

南方区教师的平均工资: 26158.62-3264.615=22894

西部地区教师的平均工资:26158.62

实际平均工资:东北区为24424.14;南方区为22894;西部区26158.

如何推断平均工资是否具有显著的地域差异?

说明:

1. 模型含截矩项时,虚拟变量个数为定性因素类别数减1.

虚拟变量陷阱——完全多重共线性

2. 不指定虚拟变量的类别(子样本)是比较的基准。

3. 截距即β1本身代表基的均值,

4.虚拟变量的系数即β2和β3的系数称为级差截距系数。反映其他类别(子样本)与基准组的截矩之差。

5. 基的选择完全由研究者根据经济分析的方便自行决定!

6.如果模型没有截矩项,则各个属性类别要分别定义虚拟变量。(虚拟变量的系数不再是级差截矩。模型无截距。)

如上例:3个地区引进3个虚拟变量且模型不含截距。

定义D1i=1,如第i个州属于西区,D1i=0,即第i个州不属于西区。

模型为

y i=β1D1i+β2D2i+β3D3i+u i(9.2) 注意:所得到的估计即为各种属性的均值而不是差异!

估计为:

y i=26158.62 D1i+24424.14D2i+22894D3i+e i(9.2E)

se= (1128.53) (887.9) (986.9.6)

t= (23.18) (27.50) (23.2)

R2=0.09

比较(9.2)和(9.1)的估计结果。

9.3 含有两个定性变量的回归

小时工资——婚姻状况、居住地

y i=8.8148+1.0997D2i+1.6729D3i+e i(9.3)

se= (0.4015) (0.4642) (0.4854)

t= (21.9528) (2.3688) (-3.4462)

(0.000)(0.0182)(0.0006)

R2=0.0322

解释该模型估计结果的含义?

9.4 回归元中同时含有定量变量和虚拟变量的回归

教师薪水——地域、政府对公立学校的支出X i

y i=β1+β2D2i+β3D3i+β4X i+u i(9.4)

y i表示薪水,X i表示政府对公立学校每个学生的支出,为定量变量;

D2i=1,如第i个州属于东北区,否则D2i=0;

D3i=1,如第i个州属于南方区,否则D3i=0。Dependent Variable: SALARY

Method: Least Squares

Date: 10/05/04 Time: 16:23

Sample: 1 51

Included observations: 51

Std. Error t-Statistic Prob.

Variable Coefficien

t

C 13269.111395.0569.5115300.0000

D2 -1673.514801.1703-2.0888370.0422

D3 -1144.157861.1182-1.3286870.1904

SPENDING 3.2888480.31764210.353930.0000

R-squared 0.722665 Mean dependent var24356.22

Adjusted R-squared 0.704963S.D. dependent var4179.426

S.E. of regression 2270.152Akaike info criterion18.36827

Sum squared resid 2.42E+08Schwarz criterion 18.51978

Log likelihood -464.3908 F-statistic 40.82341

Durbin-Watson stat 1.414238 Prob(F-statistic) 0.000000

上述回归结果:3条斜率相同但截距不同的回归直线。

截距分别为:基区即西部的13269.11,

南区的12125=13269.11-1144.2,

东北区的11595=13269.11-1673.5。

9.5 利用虚拟变量检验模型的结构稳定性

CHOW 检验只能检验是否具有显著的结构变化,但不能确认是截距还是斜率发生了变化。 Chow 检验(结构稳定性)检验(复习) Ⅰ:t t t u x y ++=21αα, 1

,1n t "=

Ⅱ: t t t

u x y ++=21ββ, 21

,1n n

t "+=

合并全样本:

t t t u x y ++=21λλ

步骤:

CHOW 检验:假设

),0(~2σN u i 211,1,,2,1n n n t ""+=)对模型

1. 用全体样本( t t t u x Y ++=21λλ 进行OLS ,得到RSS ,其自由度为))2((21=?+k n n ,并记为RSS R 。

2. 用2个子样本分别估计(8.20)和(8.21),且分别记RSS 为RSS 1和RSS 2;其自由度分别为k n ?1和k n ?2。定义 21RSS RSS RSS UR += 其自由度分别为k k k n n )),2(2(21=?+。 2. 构造CHOW 的F 统计量,在上述假设下,有

)2,(~)2/(/)(212

1k n n k F k n n RSS k

RSS RSS F UR UR R ?+?+?=

原假设:无结构变化,备选假设:模型具有结构变化若F>Fα, 则拒绝原假设。

例:美国高失业率与储蓄行为,全样本1970-1995。

利用虚拟变量则可以检验截矩和斜率是否发生了变化。 样本Ⅰ:1970-1981,达到最高失业率之前; 样本Ⅱ:1982-1995,达到最高失业率之后。

问题:两个时期的结构(系数)是否发生了怎样的变化? 样本Ⅰ:y i =λ1+ λ2x i +u 1i

i=1,2,…n 1(1981)

样本Ⅱ: y i =γ1+ γ2x i +u 2i

i=n 1(1981)+1,…n(1995)

≠n 2 y 表示储蓄, x 表示收入,n 1

若① λ1= γ1, λ2= γ2,,无结构变化——重合回归。 ②λ1≠γ1, λ2= γ2,截距变化——平行回归。

③λ1=γ1, λ2 ≠γ2,截距相同但斜率不同,汇合回归。 ④λ1≠γ1, λ2 ≠γ2,两个回归完全不同,相异回归。

引入虚拟变量:

??

?Ι∈Π∈=)(0

1i i D t 否则

模型 : y=α1+α2D t +β1X t +β2(D t X t )+u t (9.5)

i=1970,…n 1(=1981), n 1+1…n 2(=1995)

子样本Ⅰ: t t t t X X D y E 11),0(βα+== 子样本Ⅱ: t t t t X X D y E )()();1(2121ββαα+++== 即: 1211,βγαγ=

=,)(),(212211ββλααλ+=+=。

α2为级差截距;

β2为级差斜率系数。

估计结果:

Dependent Variable: SAVINGS Method: Least Squares Date: 10/06/04 Time: 09:41 Sample: 1970 1995 Included observations: 26

Variable Coefficien

t

Std. Error t-Statistic Prob. C 1.01611720.164830.0503910.9603DUM 152.478633.08237 4.6090580.0001INCOME 0.0803320.014497 5.5413470.0000INCOME*DUM -0.0654690.015982

-4.096340

0.0005R-squared

0.881944 Mean dependent var 162.0885Adjusted R-squared 0.865846 S.D. dependent var 63.20446S.E. of regression 23.14996 Akaike info criterion 9.262501

Sum squared resid 11790.25 Schwarz criterion 9.456055Log likelihood -116.4125 F-statistic 54.78413Durbin-Watson stat

1.648454 Prob(F-statistic)

0.000000

y=1.02+152.48D t +0.08X t -0.065(D t X t )+ e t (5.6) se=(20.16) (33.08) (0.0144) (0.016) t= (0.05) (4.61) (5.54) (-4.1) R 2=0.88 样本1: y=1.02+0.08X t +e 1t

样本2: y=(1.02+152.48)+(0.08?0.0655)X t +e 2t

与CHOW检验相比较,基于虚拟变量的分析具有如下优势:

1.仅需作一次回归;

2.可以实现很多假设检验,如检验α2=0、β2=0和α2=β2=0等,由此可推断截距和斜率是否发生变化。

3. CHOW检验不能确认是哪一个参数发生变化,虚拟变量回归则可以回答这个问题。

4. 虚拟变量回归由于将所有样本用于一个回归模型(CHOW 则需分别进行回归),从而增加了自由度,提高了参数估计量的相对精度。但多引入一个虚拟变量,将减少一个自由度。

9.6.运用虚拟变量反映交互作用效应

考虑为如下模型

y i=α1+α2D2i+α3D3i+βx i+u i(9.7) y i=小时工资;

x i=受教育年限;

D2i=1,第i个人为女性;否则D2i=0;

D3i=1,第i个人不是白人也不是西班牙人(有色),否则

D3i=0。

隐含的假设: 不同的种族之间, D2i所反映的性别差别相同;不同性别之间,由D3i所反映的种族差别相同。

现实中,在两个虚拟变量D2i和D3i之间可能存在交叉效应:y i=α1+α2D2i+α3D3i+α4(D2i D3i)+βx i+u i(9.8) 有色人种女性的平均工资函数为:

E(y i∣D2i=1, D3i=1, x i)=( α1+α2+α3+α4)+βx i(9.9)

α2:度量性别差异;

α3:度量种族差异;

α4 :度量有色女性工人平均工资的交叉效应;

α2+α3+α4:度量有色女性工人平均工资与基组(白人和西班牙男性工人的工资)的差异。

例:用美国的数据(采集于1998年3月), 估计结果为:

y i= ?0.261?2.36D2i?1.73D3i+0.8028x i+e i(9.7E)

t= (-0.236) (-5.49) (-2.18) (9.91)

R2=0.203 n=328

在受教育程度相同的条件下:

女性工人平均每小时工资(与基组比较)低2.36,

有色种族工人的每小时工资(与基比较)低1.73,

截距的估计为?0.261没有意义,因为样本中没有x i=0的样本点。

y i= ?0.261?2.36D2i?1.73D3i+2.13(D2i D3i)+0.8028x i+e i(9.8E) t=(-0.236) (-5.49) (-2.18) (1.74)(9.91) R2=0.203 n=328

解释: 在受教育程度相同的条件下,由α2+α3+α4=?2.36?1.73+2.13=?1.96,即:有色女性工人每小时平均工资比基组(无色男性)的平均工资低1.96,介于种族差异和性别差异之间。

15.10. 虚拟变量在季节分析中的作用

季节调整:去掉时间序列中的季节因素,用于研究不受季节影

响的趋势成份

例子.美国冰箱销售(Y)的季节性.数据如图所示,图形显示出季节性.

定义虚拟变量D 2, D 3, D 4和(或)D 1,

800

1000

1200

1400

1600

1800

5

10

15

2025

30

1.退化季节效应.建立模型

Y t =α1+α2D 2t +α3D 3t +α4D 4t +u t (9.9) 或 Y t =α1 D 1t +α2D 2t +α3D 3i +α4D 4t +u t (9.10)

(9.9)估计结果:

Dependent Variable: FRIG

Method: Least Squares

Date: 10/07/04 Time: 10:38

Sample: 1 32

Included observations: 32

Std. Error t-Statistic Prob.

Variable Coefficien

t

C 1222.12559.9904120.372000.0000

D2 245.375084.83926 2.8922340.0073

D3 347.625084.83926 4.0974540.0003

D4 -62.1250084.83926-0.7322670.4701 R-squared 0.531797 Mean dependent var1354.844 Adjusted R-squared 0.481632S.D. dependent var235.6719 S.E. of regression 169.6785Akaike info criterion13.22216 Sum squared resid 806142.4Schwarz criterion 13.40537

或估计(9.10)

Dependent Variable: FRIG(Y)

Method: Least Squares

Date: 10/07/04 Time: 10:40

Sample: 1 32

Included observations: 32

Std. Error t-Statistic Prob.

Variable Coefficien

t

D1 1222.12559.9904120.372000.0000

D2 1467.50059.9904124.462240.0000

D3 1569.75059.9904126.166680.0000

D4 1160.00059.9904119.336420.0000 R-squared 0.531797 Mean dependent var1354.844 Adjusted R-squared 0.481632S.D. dependent var235.6719 S.E. of regression 169.6785Akaike info criterion13.22216 Sum squared resid 806142.4Schwarz criterion 13.40537 Log likelihood -207.5545 Durbin-Watson stat0.392512

Y 退化季节成份后的数据即为上述回归的残差:

Y Y u

???=是时间趋势T 、周期成份C 和随机成份u 的和:

-400

-300-200-10001002003005

10

15

20

25

30

2.考虑季节效应后的销售Y与耐用品支出X的关系.

模型

Y t=α1+α2D2t+α3D3i+α4D4t+βx t+u t

估计结果

Dependent Variable: FRIG

Method: Least Squares

Date: 10/07/04 Time: 11:18

Sample: 1 32

Included observations: 32

Variable Coefficien

Std. Error t-Statistic Prob.

t

C 456.2440178.2652 2.5593550.0164

D2 242.497665.62589 3.6951510.0010

D3 325.264365.81483 4.9421120.0000

D4 -86.0804565.84317-1.3073560.2021

DUR 2.7734240.623285 4.4496910.0001

R-squared 0.729881 Mean dependent var1354.844

Adjusted R-squared 0.689864S.D. dependent var235.6719

S.E. of regression 131.2454Akaike info criterion12.73462

Sum squared resid 465084.7Schwarz criterion 12.96364

Log likelihood -198.7539 F-statistic 18.23901

Durbin-Watson stat 0.566015 Prob(F-statistic) 0.000000

注意: 上述虚拟变量的引入,不但退化了Y的季节性成份,同时,如果X也有季节效应,也同时退化了X季节性的影响。——一石二鸟。

9.8分段线性归

应用:解释变量存在某一阈值(临界值、结点),在该阈值上下,其与被解释变量之间存在不同的线性关系。对这种经济问题,需使用分段线性回归。

例:销售额与佣金.

某公司对销售人员的报酬支付按所销的额度进行支付,在某一值X *上下,佣金机制(随机)不同。

对这样的数据,需设定模型:

i i i i i u D x x x y +?++=*)(211ββα (9.11)

Y 代表佣金,X*为结点,事先指定(设计).

定义虚拟变量

?

??>=否则0*1x x D i i 假定E (u i)=0,有i i i i x x x D y E 1*),,0(βα+==

*)(*),,1(21x x x x x D y E i i i i i ?++==ββα

i x x )(*212βββα++?=

研究目的:的显著性,检验在x =x*处,有无分段的问题。 2

15.13.有关虚拟变量的技术问题

1. 含虚拟变量的半对数模型中,虚拟变量的解释.

对于半对数模型

lnY i=β1+β2D i +u i (9.12)

如Y i为每小时工资率, 对于女性D i=1,对于男性D i=0.

假定E(u i)=0,问题:如何解释参数?

男性和女性工资函数分别为

E(lnY i∣D i=0)= β1

E(lnY i∣D i=1)= β1+ β2

将估计的β1取反对数,所得到的是男性每小时工资的中位数(median),

而将β1+ β2取反对数则为女性每小时工资的中位数。

半弹性:

将男性工资的中位数减女性工资的中位数除男性工资中位数即为男性对女性的工资的半弹性。根据霍尔淡森的结论,这一半弹性也可直接计算,即对β2取反对数减1乘100。

计量经济学复习资料——虚拟变量

虚拟变量习题 一、 单项选择题 1、 若一个回归模型包含截距项,对一个具有m 个特征的质的因素需要引入的虚拟变量个数为 A.m-2 B.m-1 C.m D.m+1 2、 某商品需求函数为:Y i =β0+β1X i +μi ,其中Y 为需求量,X 为价格,为了考虑“性别”(男性、女性)和“地区”(东部、中部、西部)两个因素的影响,考虑引入虚拟变量,则应引入虚拟变量的个数为( ) A. 5 B. 4 C. 3 D. 2 3、 消费函数Y i =α0+α1D+β0X i +β1DX i +μi ,其中 虚拟变量D=???农村家庭城镇家庭 01,当统计检验表明下列哪项成立时,表示城镇家庭 与农村家庭有一样的消费行为( ) A. α1=0, β1=0 B. α1=0, β1≠0 C. α1≠0, β1=0 D. α1≠0, β1≠0 4、 根据样本资料建立某消费函数如下:?100.5055.350.45t t C D X =++,其中C 为消费,X 为收入,虚拟变量 1 D 0 ?=??城镇家庭 农村家庭,所有参数均检验显著,则城 镇家庭的消费函数 为 ( ) A 、?155.850.45t t C X =+ B 、?100.500.45t t C X =+ C 、?100.5055.35t t C X =+ D 、?100.9555.35t t C X =+ 5、 假设某需求函数为01i i i Y X ββμ=++,为了考虑“季节”因素(春、夏、秋、 冬四个不同的状态),引入4个虚拟变量形成截距变动模型,则模型的 ( ) A 、参数估计量将达到最大精度 B 、参数估计量是有偏估计量 C 、参数估计量是非一致估计量 D 、参数将无法估计 6、 对于模型01i i i Y X ββμ=++,为了考虑“地区”因素(北方、南方),引入2 个虚拟变量形成截距变动模型,则会产生 ( ) A 、序列的完全相关 B 、序列的不完全相关 C 、完全多重共线性 D 、不完全多重共线性

第五章 虚拟变量模型和滞后变量模型

1. 表5.1中给出了中国1980—2001年以城乡储蓄存款新增额代表的居民当年储蓄及以GNP 代表的居民当年收入的数据。以1991年为界,判断1991年前和1991年后的两个时期中国居民的储蓄—收入关系是否已发生变化。 表5.1 1980—2001年中国居民储蓄与收入数据 单位:亿元 年份 储蓄S GNP 年份 储蓄S GNP 1980 118.5 4517.8 1991 2072.8 21662.5 1981 124.2 4860.3 1992 2438.4 26651.9 1982 151.7 5301.8 1993 3217 34560.5 1983 217.1 5957.4 1994 6756.4 46670 1984 322.2 7206.7 1995 8143.5 57494.9 1985 407.9 8989.1 1996 8858.5 66850.5 1986 615 10201.4 1997 7759 73142.7 1987 835.7 11954.5 1998 7127.7 76967.2 1988 728.2 14922.3 1999 6214.3 80579.4 1989 1345.4 16917.8 2000 4710.6 88228.1 1990 1887.3 18598.4 2001 9430 94346.4 估计以下回归模型: 0123()i i i i i i Y X D D X u ββββ=++++ 其中i D 为引入的虚拟变量:1,19910,1991i D ?=?? 年前年后 对上面的模型进行估计,结果如下: 所以表达式为: 15350.0751981.90.032()i i i i i Y X D D X =+-+ (1.40) (4.45) (-1.38) (0.37)

计量经济学实验教学案例实验9_虚拟变量

实验九虚拟变量 【实验目的】 掌握虚拟变量的设置方法。 【实验内容】 一、试根据表9-1的1998年我国城镇居民人均收入与彩电每百户拥有量的统计资料建立我国城镇居民彩电需求函数; 资料来源:据《中国统计年鉴1999》整理计算得到 二、试建立我国税收预测模型(数据见实验一); 资料来源:《中国统计年鉴1999》 三、试根据表9-2的资料用混合样本数据建立我国城镇居民消费函数。

资料来源:据《中国统计年鉴》1999-2000整理计算得到 【实验步骤】 一、我国城镇居民彩电需求函数 ⒈相关图分析; 键入命令:SCAT X Y ,则人均收入与彩电拥有量的相关图如9-1所示。 从相关图可以看出,前3个样本点(即低收入家庭)与后5个样本点(中、高收入)的拥有量存在较大差异,因此,为了反映“收入层次”这一定性因素的影响,设置虚拟变量如下: ?? ?=低收入家庭 中、高收入家庭 1D 图9-1 我国城镇居民人均收入与彩电拥有量相关图 ⒉构造虚拟变量; 方式1:使用DATA 命令直接输入; 方式2:使用SMPL 和GENR 命令直接定义。 DATA D1 GENR XD=X*D1 ⒊估计虚拟变量模型: LS Y C X D1 XD 再由t 检验值判断虚拟变量的引入方式,并写出各类家庭的需求函数。 按照以上步骤,虚拟变量模型的估计结果如图9-2所示。

图7-2 我国城镇居民彩电需求的估计 我国城镇居民彩电需求函数的估计结果为: i i i i XD D x y 0088.08731.310119.061.57?-++= =t (16.249)(9.028) (8.320) (-6.593) 2R =0.9964 2R =0.9937 F =366.374 S.E =1.066 虚拟变量的回归系数的t 检验都是显著的,且模型的拟合优度很高,说明我国城镇居民低收入家庭与中高收入家庭对彩电的消费需求,在截距和斜率上都存在着明显差异,所以以加法和乘法方式引入虚拟变量是合理的。低收入家庭与中高收入家庭各自的需求函数为: 低收入家庭: i i x y 0119.061.57?+= 中高收入家庭: ()()i i x y 0088.00119.08731.3161.57 ?-++=i x 003.048.89+= 由此可见我国城镇居民家庭现阶段彩电消费需求的特点:对于人均年收入在3300元以下的低收入家庭,需求量随着收入水平的提高而快速上升,人均年收入每增加1000元,百户拥有量将平均增加12台;对于人均年收入在4100元以上的中高收入家庭,虽然需求量随着收入水平的提高也在增加,但增速趋缓,人均年收入每增加1000元,百户拥有量只增加3台。事实上,现阶段我国城镇居民中国收入家庭的彩电普及率已达到百分之百,所以对彩电的消费需求处于更新换代阶段。 二、我国税收预测模型 要求:设置虚拟变量反映1996年税收政策的影响。 方法:取虚拟变量D1=1(1996年以后),D1=0(1996年以前)。 键入命令:GENR XD=X*D1 LS Y C X D1 XD 则模型估计的相关信息如图7-3所示。

中级计量经济学讲义_第二章第一节数学基础 (Mathematics)第一节 矩阵(Matrix)及

上课材料之二: 第二章 数学基础 (Mathematics) 第一节 矩阵(Matrix)及其二次型(Quadratic Forms) 第二节 分布函数(Distribution Function),数学期望(Expectation)及方差(Variance) 第三节 数理统计(Mathematical Statistics ) 第一节 矩阵及其二次型(Matrix and its Quadratic Forms) 2.1 矩阵的基本概念与运算 一个m ×n 矩阵可表示为: 矩阵的加法较为简单,若C=A +B ,c ij =a ij +b ij 但矩阵的乘法的定义比较特殊,若A 是一个m ×n 1的矩阵,B 是一个n 1×n 的矩阵,则C =AB 是一个m ×n 的矩阵,而且∑== n k kj ik ij b a c 1,一般来讲,AB ≠BA ,但如下运算是成立 的: ● 结合律(Associative Law ) (AB )C =A (BC ) ● 分配律(Distributive Law ) A (B +C )=AB +AC 问题:(A+B)2=A 2+2AB+B 2是否成立? 向量(Vector )是一个有序的数组,既可以按行,也可以按列排列。 行向量(row ve ctor)是只有一行的向量,列向量(column vector)只有一列的向量。 如果α是一个标量,则αA =[αa ij ]。 矩阵A 的转置矩阵(transpose matrix)记为A ',是通过把A 的行向量变成相应的列向量而得到。 显然(A ')′=A ,而且(A +B )′=A '+B ', ● 乘积的转置(Transpose of a production ) A B AB ''=')(,A B C ABC '''=')(。 ● 可逆矩阵(inverse matrix ),如果n 级方阵(square matrix)A 和B ,满足AB=BA=I 。 则称A 、B 是可逆矩阵,显然1-=B A ,1-=A B 。如下结果是成立的: 1111111)()()()(-------='='=A B AB A A A A 。 2.2 特殊矩阵 1)恒等矩阵(identity matrix)

计量经济学范本

第八章 虚拟变量 一、单选题: 1、虚拟变量模型i i i D Y μβα++=中,i Y 为居民的年可支配收入,i D 为虚拟解释变量, i D =1代表城镇居民,i D =0代表非城镇居民。当i μ满足古典假设时,则α ==)0|(i i D Y E 表示( B ) A 、城镇居民的年平均收入, B 、非城镇居民的年平均收入, C 、所有居民的年平均收入, D 、其他; 2、虚拟变量模型i i i D Y μβα++=中,i Y 为居民的年可支配收入,i D 为虚拟解释变量, i D =1代表城镇居民,i D =0代表非城镇居民。当i μ满足古典假设时,则βα+==)1|(i i D Y E 表示( A ) A 、城镇居民的年平均收入, B 、非城镇居民的年平均收入, C 、所有居民的年平均收入, D 、其它; 3、在没有定量解释变量的情形下,以加法形式引入虚拟解释变量,主要用于( C )。 A 、共线性分析, B 、自相关分析, C 、方差分析 , D 、其它 4、如果你有连续几年的月度数据,如果只有2、4、6、8、10、12月表现季节类型,则需要引入虚拟变量的个数是( B )。 A 、模型中有截距项时,引入12个, B 、模型中有截距项时,引入5个 C 、模型中没有截距项时,引入11个, D 、模型中没有截距项时,引入12个 5、下列不属于常用的虚拟变量模型是( D ); A 、解释变量中只包含虚拟变量, B 、解释变量中既含定量变量又含虚拟变量, C 、被解释变量本身为虚拟变量的模型, D 、解释变量和被解释变量中不含虚拟变量。 6、考虑虚拟变量模型:i i i X D D D Y μβαααα+++++=3322110,其中 ???=其他一季度011D ???=其他二季度012D ???=其他 三季度013D , 当其随机扰动项服从古典假定时,则下列回归方程中表示一季度的是:( B ) A 、i i i X D D D X Y E βαα++====)()0,1,|(20312 B 、i i i X D D D X Y E βαα++====)()0,1,|(10321 C 、i i i X D D D X Y E βαα++====)()0,1,|(30213 D 、i i i X D D D X Y E βα+====0321)0,|( 7、在含有截距项的分段线性回归分析中,如果只有一个属性变量,且其有三种类型,则引入虚拟变量个数应为( B ) A 、 1个, B 、 2个, C 、3个, D 、4个; 8、某商品需求函数为 u x b b y i i i ++=10,其中y 为需求量,x 为价格。为了考虑“地

计量经济学习题与解答

第五章经典单方程计量经济学模型:专门问题 一、内容提要 本章主要讨论了经典单方程回归模型的几个专门题。 第一个专题是虚拟解释变量问题。虚拟变量将经济现象中的一些定性因素引入到可以进行定量分析的回归模型,拓展了回归模型的功能。本专题的重点是如何引入不同类型的虚拟变量来解决相关的定性因素影响的分析问题,主要介绍了引入虚拟变量的加法方式、乘法方式以及二者的组合方式。在引入虚拟变量时有两点需要注意,一是明确虚拟变量的对比基准,二是避免出现“虚拟变量陷阱”。 第二个专题是滞后变量问题。滞后变量包括滞后解释变量与滞后被解释变量,根据模型中所包含滞后变量的类别又可将模型划分为自回归分布滞后模型与分布滞后模型、自回归模型等三类。本专题重点阐述了产生滞后效应的原因、分布滞后模型估计时遇到的主要困难、分布滞后模型的修正估计方法以及自回归模型的估计方法。如对分布滞后模型可采用经验加权法、Almon多项式法、Koyck方法来减少滞项的数目以使估计变得更为可行。而对自回归模型,则根据作为解释变量的滞后被解释变量与模型随机扰动项的相关性的不同,采用工具变量法或OLS法进行估计。由于滞后变量的引入,回归模型可将静态分析动态化,因此,可通过模型参数来分析解释变量对被解释变量影响的短期乘数和长期乘数。 第三个专题是模型设定偏误问题。主要讨论当放宽“模型的设定是正确的”这一基本假定后所产生的问题及如何解决这些问题。模型设定偏误的类型包括解释变量选取偏误与模型函数形式选取取偏误两种类型,前者又可分为漏选相关变量与多选无关变量两种情况。在漏选相关变量的情况下,OLS估计量在小样本下有偏,在大样本下非一致;当多选了无关变量时,OLS估计量是无偏且一致的,但却是无效的;而当函数形式选取有问题时,OLS估计量的偏误是全方位的,不仅有偏、非一致、无效率,而且参数的经济含义也发生了改变。在模型设定的检验方面,检验是否含有无关变量,可用传统的t检验与F检验进行;检验是否遗漏了相关变量或函数模型选取有错误,则通常用一般性设定偏误检验(RESET检验)进行。本专题最后介绍了一个关于选取线性模型还是双对数线性模型的一个实用方法。 第四个专题是关于建模一般方法论的问题。重点讨论了传统建模理论的缺陷以及为避免这种缺陷而由Hendry提出的“从一般到简单”的建模理论。传统建模方法对变量选取的

高级计量经济学之第5章分布滞后与动态模型

第5章 分布滞后与动态模型 §5.1 分布滞后模型 很多经济模型在回归方程中有滞后项,例如,因为修建桥和高速公路需要很多时间,所以公共投资对GDP 的影响有一个滞后期,而且这个影响可能会持续数年;研发新产品需要时间,而后把这个新产品投入生产也需要时间;在研究消费行为时,一个工资的变化可能影响好几期的消费。在消费的恒久收入理论中,消费者会用若干期去决定真实可支配收入的变化是暂时的还是永久的。例如,今年额外的咨询费收入明年是否还会继续?同样,真实可支配收入的滞后值会在回归方程中出现,是因为消费者在平滑其消费行为时十分重视他自身的终身收入。一个人的终身收入可以用他过去和现在的收入来推测。换句话说,回归关系可以写为: T t X X X Y t s t s t t t ,,2,1110 =+++++=--εβββα (5.1) 其中,t Y 代表被解释变量Y 在第t 期的观测值,t s X -代表解释变量X 第t s -期的观测值,α为截距项,0β,1β,…,s β是t X 当期和滞后期的系数。方程(5.1)式就是分布滞后模型因为它把收入增长对消费的影响分为s 期。X 的一个单位变化对Y 的短期影响由0β来表示,而X 的一个单位变化对Y 的长期影响由 (s βββ+++ 10)来表示。 假设我们观察从1955年到1995年的t X ,1t X -为相同的变量,但是提前一期的,也就是1954-1994。因为1954年的数据观察不到,我们就从1955年开始观察 1t X -,到1994年结束。这意味着当我们滞后一期时,t X 序列将从1956年开始到 1995年结束。对于实际的应用来说,也就是当我们滞后一期时,我们将从样本中

计量经济学判断题 )

1. 总离差平方和可分解为回归平方和与残差平方和。( 对 ) 2. 整个多元回归模型在统计上是显着的意味着模型中任何一个单独的解释变量均是统计显着的。( 错 ) 3. 多重共线性只有在多元线性回归中才可能发生。( 对 ) 4. 通过作解释变量对时间的散点图可大致判断是否存在自相关。( 错 ) 5. 在计量回归中,如果估计量的方差有偏,则可推断模型应该存在异方差( 错 ) 6. 存在异方差时,可以用广义差分法来进行补救。( 错 ) 7. 当经典假设不满足时,普通最小二乘估计一定不是最优线性无偏估计量。( 错 ) 8. 判定系数检验中,回归平方和占的比重越大,判定系数也越大。( 对 ) 9. 可以作残差对某个解释变量的散点图来大致判断是否存在自相关。( 错 )做残差 ) n 5、经典线性回归模型(CLRM )中的干扰项不服从正态分布的,OLS 估计量将有偏的。错,,即使经典线性回归模型(CLRM )中的干扰项不服从正态分布的,OLS 估计量仍然是无偏的。 因为222)()?(βμββ=+=∑i i K E E ,该表达式成立与否与正态性无关。 1、在简单线性回归中可决系数2R 与斜率系数的t 检验的没有关系。错误,在简单线性回归 中,由于解释变量只有一个,当t 检验显示解释变量的影响显着时,必然会有该回归模型的可决系数大,拟合优度高。 2、异方差性、自相关性都是随机误差现象,但两者是有区别的。正确,异方差的出现总是与模型中某个解释变量的变化有关。自相关性是各回归模型的随机误差项之间具有相关关

系。3、通过虚拟变量将属性因素引入计量经济模型,引入虚拟变量的个数与模型有无截距项无关。错误,模型有截距项时,如果被考察的定性因素有m个相互排斥属性,则模型中引入m-1个虚拟变量,否则会陷入“虚拟变量陷阱”;模型无截距项时,若被考察的定性因素有m个相互排斥属性,可以引入m个虚拟变量,这时不会出现多重共线性。 4、满足阶条件的方程一定可以识别。错误,阶条件只是一个必要条件,即满足阶条件的的方程也可能是不可识别的。 5、库依克模型、自适应预期模型与局部调整模型的最终形式是不同的。错误,库依克模型、自适应预期模型与局部调整模型的最终形式是相同的,其最终形式都是一阶自回归模型。2、多重共线性问题是随机扰动项违背古典假定引起的。错误,应该是解释变量之间高度相关引起的. (3) 线性回归模型意味着因变量是自变量的线性函数。(错) (4) 在线性回归模型中,解释变量是原因,被解释变量是结果。(对) 1、虚拟变量的取值只能取0或1(对) 2、通过引入虚拟变量,可以对模型的参数变化进行检验(对) 1、简单线性回归模型与多元线性回归模型的基本假定是相同的。错 在多元线性回归模型里除了对随机误差项提出假定外,还对解释变量之间提 出无多重共线性的假定。 2、在模型中引入解释变量的多个滞后项容易产生多重共线性。对 在分布滞后模型里多引进解释变量的滞后项,由于变量的经济意义一样,只

《计量经济学》虚拟变量练习题及参考答案

一、选择题 1、 对于一个含有截距项的计量经济模型,若某定性因素有m 个互斥的类型,为将其引入模型中,则需要引入虚拟变量个数为( B ) A. m B. m-1 C. m+1 D. m-k 2、 在经济发展发生转折时期,可以通过引入虚拟变量方法来表示这种变化。例如,研究中国城镇居民消费函数时。1991年前后,城镇居民商品性实际支出Y 对实际可支配收入X 的回归关系明显不同。现以1991年为转折时期,设虚拟变 量???=年以前,年以后,1991019911t D ,数据散点图显示消费函数发生了结构性变化:基本消费部分下降了,边际消费倾向变大了。则城镇居民线性消费函数的理论方程可以写作( D ) A. t t t u X Y ++=10ββ B. t t t t t u X D X Y +++=210βββ C. t t t t u D X Y +++=210βββ D. t t t t t t u X D D X Y ++++=3210ββββ 3、设某地区消费函数中,消费支出不仅与收入x 有关,而且与消费者的年龄构成有关,若将年龄构成分为小孩、青年人、成年人和老年人4个层次。假设边际消费倾向不变,考虑上述年龄构成因素的影响时,该消费函数引入虚拟变量的个数为 ( C ) A.1个 B.2个 C.3个 D.4个 4、在利用月度数据构建计量经济模型时,如果一年里的12个月全部表现出季节模式,则应该引入虚拟变量个数为( C ) A. 4 B. 12 C. 11 D. 6 5、在利用月度数据构建计量经济模型时,如果一年里的1、3、5、9四个月表现出季节模式,则应该引入虚拟变量个数为( 3个 ) 6、个人保健支出的计量经济模型为:i i i i X D Y μβαα+++=221 ,其中i Y 为保健年度 支出;i X 为个人年度收入;虚拟变量 ???=大学以下大学及以上 012i D ;i μ满足古典假定。则大学以上群体的平均年度保健支出为 ( B ) A. i i i i X D X Y E βα+==12)0,/( B.i i i i X D X Y E βαα++==212)1,/(

(精品)第五章-虚拟变量模型和滞后变量模型

第五章虚拟变量模型 1.表5.1中给出了中国1980—2001年以城乡储蓄存款新增额代表的居民当年储蓄及以GNP 代表的居民当年收入的数据。以1991年为界,判断1991年前和1991年后的两个时期中国居民的储蓄—收入关系是否已发生变化。 年份储蓄S GNP 年份储蓄S GNP 1980 118.5 4517.8 1991 2072.8 21662.5 1981 124.2 4860.3 1992 2438.4 26651.9 1982 151.7 5301.8 1993 3217 34560.5 1983 217.1 5957.4 1994 6756.4 46670 1984 322.2 7206.7 1995 8143.5 57494.9 1985 407.9 8989.1 1996 8858.5 66850.5 1986 615 10201.4 1997 7759 73142.7 1987 835.7 11954.5 1998 7127.7 76967.2 1988 728.2 14922.3 1999 6214.3 80579.4 1989 1345.4 16917.8 2000 4710.6 88228.1 1990 1887.3 18598.4 2001 9430 94346.4 估计以下回归模型: 0123 () i i i i i i Y X D D X u ββββ =++++ 其中 i D为引入的虚拟变量: 1,1991 0,1991 i D ? =? ? 年前 年后 对上面的模型进行估计,结果如下: 所以表达式为:

15350.0751981.90.032()i i i i i Y X D D X =+-+ (1.40) (4.45) (-1.38) (0.37) 从2β和3β的t 检验值可以知道,这两个参数显著的为0,所以1991年前和1991年后两个时期的回归结果是相同的。 下面用邹式检验来验证上面对于两个时期的回归结果相同的结论是否正确。 过程如下: 输入要验证的突变点,本例为1991年。 输出结果如下:

计量经济学分析模型

计量经济学分析模型

摘要 改革开放以来,我国经济呈迅速而稳定的增长趋势,由于分配机制和收入水平的变化,城镇居民生活水平在达到稳定小康之后,消费结构和消费水平都出现了一些新的特点。本文旨在对近几年,我国城镇年人均收入变动对年人均各种消费变动的影响进行实证分析。首先,我们综合了几种关于收入和消费的主要理论观点;本文根据相关的数据统计数据,运用一定的计量经济学的研究方法,进而我们建立了理论模型。然后,收集了相关的数据,利用EVIEWS软件对计量模型进行了参数估计和检验,并加以修正。最后,我们对所得的分析结果和影响消费的一些因素作了经济意义的分析,并相应提出一些政策建议。并找到影响居民消费的主要因素。 关键词:居民消费;城镇居民;回归;Eviews

目录 摘要.................................................................. II 前言. (1) 1 问题的提出 (2) 2 经济理论陈述 (3) 2.1西方经济学中有关理论假说 (3) 2.2有关消费结构对居民消费影响的理论 (4) 3 相关数据收集 (6) 4 计量经济模型的建立 (9) 5 模型的求解和检验 (10) 5.1计量经济的检验 (10) 5.1.1模型的回归分析 (10) 5.1.2拟合优度检验: (11) 5.1.3 F检验 (11) 5.1.4 T检验 (12) 5.2 计量修正模型检验: (12) 5.2.1 Y与的一元回归 (13) 5.2.2拟合优度的检验 (13) 5.2.3 F检验 (14) 5.2.4 T检验: (15) 5.3经济意义的分析: (15) 6 政策建议 (16) 结论 (17) 参考文献 (19)

最新资料计量经济学期末考试试卷集(含答案)

计量经济学试题一 一、判断题(20分) 1.线性回归模型中,解释变量是原因,被解释变量是结果。() 2.多元回归模型统计显著是指模型中每个变量都是统计显著的。() 3.在存在异方差情况下,常用的OLS法总是高估了估计量的标准差。()4.总体回归线是当解释变量取给定值时因变量的条件均值的轨迹。() 5.线性回归是指解释变量和被解释变量之间呈现线性关系。() 6.判定系数的大小不受到回归模型中所包含的解释变量个数的影响。()7.多重共线性是一种随机误差现象。() 8.当存在自相关时,OLS估计量是有偏的并且也是无效的。() 9.在异方差的情况下,OLS估计量误差放大的原因是从属回归的变大。()10.任何两个计量经济模型的都是可以比较的。() 二.简答题(10) 1.计量经济模型分析经济问题的基本步骤。(4分) 2.举例说明如何引进加法模式和乘法模式建立虚拟变量模型。(6分) 三.下面是我国1990-2003年GDP对M1之间回归的结果。(5分) 1.求出空白处的数值,填在括号内。(2分) 2.系数是否显著,给出理由。(3分) 四.试述异方差的后果及其补救措施。(10分)

五.多重共线性的后果及修正措施。(10分) 六.试述D-W检验的适用条件及其检验步骤?(10分) 七.(15分)下面是宏观经济模型 变量分别为货币供给、投资、价格指数和产出。 1.指出模型中哪些是内是变量,哪些是外生变量。(5分) 2.对模型进行识别。(4分) 3.指出恰好识别方程和过度识别方程的估计方法。(6分) 八、(20分)应用题 为了研究我国经济增长和国债之间的关系,建立回归模型。得到的结果如下:Dependent Variable: LOG(GDP) Method: Least Squares Date: 06/04/05 Time: 18:58 Sample: 1985 2003 Included observations: 19 Variable Coefficient Std. Error t-Statistic Prob. LOG(DEBT) 0.65 0.02 32.8 0 Adjusted R-squared 0.983 S.D. dependent var 0.86 S.E. of regression 0.11 Akaike info criterion -1.46 Sum squared resid 0.21 Schwarz criterion -1.36 Log likelihood 15.8 F-statistic 1075.5 Durbin-Watson stat 0.81 Prob(F-statistic) 0 其中,GDP表示国内生产总值,DEBT表示国债发行量。 (1)写出回归方程。(2分) (2)解释系数的经济学含义?(4分) (3)模型可能存在什么问题?如何检验?(7分)

计量经济学多元线性回归模型

多元线性回归模型 一.概述 当今农村农民人均纯收入与多个因素存在着紧密的联系,例如人均工资收入,人均农林牧渔产值人均生产费用支出,人均转移性和财产性收入等。本次将以安徽1995-2009年农村居民纯收入与人均工资收入,人均生产费用支出,人均转移性和财产性收入等因素的数据,通过建立计量经济模型来分析上述变量之间的关系,强调农村居民生活的重要性,从而促进全国经济的发展。 二、模型构建过程 ⒈变量的定义 被解释变量:农民人均纯收入y 解释变量:人均工资收入x1, 人均农林牧渔产值x2 人均生产费用支出x3 人均转移性和财产性收入x4。 建立计量经济模型:解释农民人均纯收入与人均工资收入,人均生产费用支出,人均转移性和财产性收入的关系 ⒉模型的数学形式 设定农民人均纯收入与五个解释变量相关关系模型,样本回归模型为: ∧Y i=∧ β + ∧ β 1 X i1+∧β 2 X i2+∧β 3 X i3+∧β 4 X i4+e i ⒊数据的收集 该模型的构建过程中共有四个变量,分别是中国从1995-2009年人均工资收入,人均农林牧渔产值人均生产费用支出,人均转移性和财产性收入,因此为时间序列数据,最后一个即2009年的数据作为预测对比数据,收集的数据如下所示: ⒋用OLS法估计模型 回归结果,散点图分别如下:

Y?=33.632+0.659X1+0.59X2-0.274X3+0.152X4 i d.f.=10 ,R2=0.997116 , Se=(186.261) (0.1815 (0.1245) (0.2037) (0.5699) t=(0.1805) (3.632) (4.741) (-1.347) (2.674) 三、模型的检验及结果的解释、评价

现代计量经济学模型体系解析

#学术探讨# 现代计量经济学模型体系解析* 李子奈刘亚清 内容提要:本文对现代计量经济学模型体系进行了系统的解析,指出了现代计量经济学的各个分支是以问题为导向,在经典计量经济学模型理论的基础上,发展成为相对独立的模型理论体系,包括基于研究对象和数据特征而发展的微观计量经济学、基于充分利用数据信息而发展的面板数据计量经济学、基于计量经济学模型的数学基础而发展的现代时间序列计量经济学、基于非设定的模型结构而发展的非参数计量经济学,并对每个分支进行了扼要的描述。最后在/交叉与综合0的方向上提出了现代计量经济学模型理论的研究前沿领域。 关键词:经典计量经济学时间序列计量经济学微观计量经济学 一、引言 计量经济学自20世纪20年代末30年代初诞生以来,已经形成了十分丰富的内容体系。一般认为,可以以20世纪70年代为界将计量经济学分为经典计量经济学(Classical Econometrics)和现代计量经济学(Mo dern Eco no metr ics),而现代计量经济学又可以分为四个分支:时间序列计量经济学(Tim e Ser ies Econo metrics)、微观计量经济学(M-i cro-econometrics)、非参数计量经济学(Nonpara-m etric Econometrics)以及面板数据计量经济学(Panel Data Eco nom etrics)。这些分支作为独立的课程已经被列入经济学研究生的课程表,独立的教科书也已陆续出版,应用研究已十分广泛,标志着它们作为计量经济学的分支学科已经成熟。 据此提出三个问题:一是经典计量经济学的地位问题。既然现代计量经济学模型体系已经成熟,而且它们都是在经典模型理论的基础上发展的,那么经典模型还有应用价值吗?是不是凡是采用经典模型的研究都是低水平和落后的?二是现代计量经济学的各个分支的发展导向问题。即它们是如何发展起来的?三是现代计量经济学进一步创新和发展的基点在哪里?回答这些问题,对于正确理解计量经济学的学科体系,对于计量经济学的课程设计和教学内容安排,对于正确评价计量经济学理论和应用研究的水平,对于进一步推动中国的计量经济学理论研究,都是十分有益的。 现代计量经济学的各个分支是以问题为导向,以经典计量经济学模型理论为基础而发展起来的。所谓/问题0,包括研究对象和表征研究对象状态和变化的数据。研究对象不同,表征研究对象状态和变化的数据具有不同的特征,用以进行经验实证研究的计量经济学模型既然不同,已有的模型理论方法不适用了,就需要发展新的模型理论方法。按照这个思路,就可以用图1简单地描述经典计量经济学模型与现代计量经济学模型各个分支之间的关系。 本文试图从方法论的角度对现代计量经济学模型的发展,特别是现代计量经济学模型与经典计量经济学模型之间的关系进行较为系统的讨论,以期对未来我国计量经济学的发展研究提供借鉴和启示。本文的内容安排如下:首先分析经典计量经济学模型的基础地位,明确它在现代的应用价值,同时对发生于20世纪70年代的/卢卡斯批判0的实质进行讨论;然后依次讨论时间序列计量经济学、微观计量经济学、非参数计量经济学以及面板数据计量经济学的发展,回答它们是以什么问题为导向,以什么为目的而发展的;最后以/现代计量经济学模型体系的分解与综合0为题,讨论现代计量经济学的前沿研究领域以及从对我国计量经济学理论的创新和发展 ) 22 ) *本文受国家社会科学基金重点项目(08AJY001,计量经济学模型方法论基础研究)的资助。

计量经济学实验报告(虚拟变量)

计量经济学实验报告 实验三:虚拟变量模型 姓名:上善若水 班级: 序号: 学号: 中国人均消费影响因素 一、理论基础及数据 1. 研究目的 本文在现代消费理论的基础,分析建立计量模型,通过对 1979—— 2008 年全国城镇居民的人均消费支出做时间序列分析和对2004— 2008年各地区(31 个省市)城镇居民的人均消费支出做面板数据分析,比较分析了人均可支配收入、消费者物价指数和银行一年期存款利率等变量对居民消费的不同影响。

2. 模型理论 西方消费经济学者们认为,收入是影响消费者消费的主要因素,消费是需求的函数。消费经济学有关收入与消费的关系,即消费函数理论有:( 1)凯恩斯的绝对收入理论。他认为消费主要取决于消费者的净收入,边际消费倾向小于平均消费倾向。他假定,人们的现期消费,取决于他们现期收入的绝对量。(2)杜森贝利的相对收入消费理论。他认为消费者会受自己过去的消费习惯以及周围消费水准来决定消费,从而消费是相对的决定的。当期消费主要决定于当期收入和过去的消费支出水平。(3)弗朗科?莫迪利安的生命周期的消费理论。这种理论把人生分为三个阶段:少年、壮年和老年;在少年与老年阶段,消费大于收入;在壮年阶段,收入大于消费,壮年阶段多余的收入用于偿还少年时期的债务或储蓄起来用来防老。( 4)弗里德曼的永久收入消费理论。他认为消费者的消费支出主要不是由他的现期收入来决定,而是由他的永久收入来决定的。这些理论都强调了收入对消费的影响。除此之外,还有其他一些因素也会对消费行为产生影响。(1)利率。传统的看法认为,提高利率会刺激储蓄,从而减少消费。当然现代经济学家也有不同意见,他们认为利率对储蓄的影响要视其对储蓄的替代效应和收入效应而定,具体问题具体分析。( 2)价格指数。价格的变动可以使得实际收入发生变化,从而改变消费。 基于上述这些经济理论,我找到中国 1979-2008 年全国城镇居民人均消费以及城镇居民人均可支配收入、城镇居民消费者物价指数和 2004— 2008年各地区城镇居民人均消费以及城镇居民人均可支配收入、城镇居民消费者物价指数、以及银行一年期存款利率的官方数据。想借此来分析中国消费的影响因素以及它们具体是如何对消费产生影响的。针对这一模型,有以下两个假定。一,自改革开放以来,我国人均消费倾向呈现缓慢的递减趋势,即保持粘性。这一假定符合我国居民的储蓄——消费心理,也与其他一些发展中国家的情况大体一致。二,由储蓄和消费的替代关系,可以假定刺激储蓄的因素,会制约消费。我们知道提高利率会刺激储蓄,因而我把利率也引入模型的分析中。 以下对我所找的数据作一一说明 : 1、城镇居民人均消费水平。借此来代表城镇居民的消费支出情况,这是将要建立计量经济学模型的被解释变量。由下图可以看到消费是逐年增加的,与此同时,人均可支配收入也是逐年增加,隐含着两者可能有很高的线性相关性这层意思。

第五章-含虚拟变量的回归模型

Econometrics 第五章虚拟变量回归模型(教材第六章)

第五章虚拟变量回归模型 第一节虚拟变量的性质和引入的意义 第二节虚拟变量的引入 第三节交互作用效应 第四节含虚拟变量的回归模型 学习要点 虚拟变量的性质,虚拟变量的设定

5.1 虚拟变量的性质和引入的意义 虚拟变量的性质 f定性变量 性别(男,女) 婚姻状况(已婚,未婚) 受教育程度(高等教育,其他) 收入水平(高收入,中低收入) 肤色(白人,有色人种) 政治状况(和平时期,战争时期) f引入虚拟变量(Dummy Variables)

1、分离异常因素的影响,例如分析我国GDP的时间序列,必须考虑“文革”因素对国民经济的破坏性影响,剔除不可比的“文革”因素。 2、检验不同属性类型对因变量的作用,例如工资模型中的文化程度、季节对销售额的影响。 3、提高模型的精度,相当与将不同属性的样本合并,扩大了样本量,从而提高了估计精度)。 5.1 虚拟变量的性质和引入的意义

5.2 虚拟变量的引入 虚变量引入的方式主要有两种 f加法方式 虚拟变量与其它解释变量在模型中是相加关系,称为虚拟 变量的加法引入方式。 加法引入方式引起截距变动

5.2 虚拟变量的引入 f 虚拟变量的作用在于把定性变量“定量化”:通过赋值0和1,0表示变量不具备某种性质,1表示具备。 f 例,0代表男性,1代表女性;0代表未婚,1代表已婚;等等。 f 这类取值为0和1的变量称为虚拟变量(dummy variables ),通常用符号D 表示。 f 事实上,模型可以只包括虚拟变量(ANOVA 模型): 其中,0,1,i i D D ==男性;女性。 12i i i Y B B D u =++

计量经济学回归模型实验报告

回归模型分析报告 背景意义: 教育是立国之本,强国之基。随着改革开放的进行、经济的快速发展和人们生活水平的逐步提高,“教育”越来越受到人们的重视。一方面,人均国内生产总值的增加与教育经费收入的增加有着某种联系,而人口的增长也必定会对教育经费收入产生影响。本报告将从这两个方面进行分析。 我国1991年~2013年的教育经费收入、人均国内生产总值指数、年末城镇人口数的统计资料如下表所示。试建立教育经费收入Y关于人均国内生产总值指数X1和年末城镇人口数X2的回归模型,并进行回归分析。 年份教育经费收入 Y(亿元) 人均国内生产总值指数 X1(1978年=100) 年末城镇人口数 X2(万人) 199131203 199232175 199333173 199434169 199535174 199637304 199739449 199841608 199943748 200045906 200148064 200250212 200352376 200454283 200556212 200658288 200760633 200862403 200964512 201066978 201169079 201271182 201373111 资料来源:中经网统计数据库。 根据经济理论和对实际情况的分析可以知道,教育经费收入Y依赖于人均国内生产总值指数X1和年末城镇人口数X2的变化,因此我们设定回归模型为 Y Y=Y0+Y1Y1Y+Y2Y2Y+Y Y 应用EViews的最小二乘法程序,输出结果如下表 Y?Y=5058.835+28.7491Y1Y?0.3982Y2Y

R2= Y???2= F= 异方差的检验 1.Goldfeld-Quandt检验 X1和X2的样本观测值均已按照升序排列,去掉中间X1和X2各5个观测值,用第一个子样本回归: Y?Y=?3510.668+5.9096Y1Y+0.0839Y2Y SSE1= 用第二个子样本回归: Y?Y=178636.6+107.5861Y1Y?4.7488Y2Y SSE2=6602898 H0=u t具有同方差, H1=u t具有递增型异方差 构造F统计量。F=SSE2 SSE1=6602898 45633.64 =>(9,9) = 所以拒绝原假设,计量模型的随机误差项存在异方差 2.White检验 因为模型中含有两个解释变量,辅助回归式一般形式如下 Y?Y2=Y0+Y1Y Y1+Y2Y Y2+Y3Y Y12+Y4Y Y22+Y5Y Y1Y Y2+Y Y 辅助回归式估计结果如下 Y?Y2=??40478.23Y Y1+1067.432Y Y2?18.9196Y Y12?0.0202Y Y22 +1.3633Y Y1Y Y2 因为TR2=>Y0.12 (5)= 该回归模型中存在异方差 3.克服异方差 以1/X1做加权最小二乘估计,

计量经济学名词解释(全)

广义计量经济学:利用经济理论、统计学和数学定量研究经济现象的经济计量方法的统称,包括回归分析方法、投入产出分析方法、时间序列分析方法等。 狭义计量经济学:以揭示经济现象中的因果关系为目的,在数学上主要应用回归分析方法。 计量经济学: 是经济学的一个分支学科,是以揭示经济活动中的客观存在的数量关系 为内容的分支学科。 计量经济学模型:揭示经济活动中各种因素之间的定量关系,用随机性的数学方程加以描述。 截面数据:截面数据是许多不同的观察对象在同一时间点上的取值的统计数据集合,可理解为对一个随机变量重复抽样获得的数据。 时间序列数据:把反映某一总体特征的同一指标的数据,按照一定的时间顺序和时间间隔排列起来,这样的统计数据称为时间序列数据 面板数据:指时间序列数据和截面数据相结合的数据。 总体回归函数:指在给定Xi下Y分布的总体均值与Xi所形成的函数关系(或者说总体被解释变量的条件期望表示为解释变量的某种函数)。 样本回归函数:指从总体中抽出的关于Y,X的若干组值形成的样本所建立的回归函数。随机的总体回归函数:含有随机干扰项的总体回归函数(是相对于条件期望形式而言的)。线性回归模型:既指对变量是线性的,也指对参数β为线性的,即解释变量与参数β只以他们的1次方出现。 最小二乘法:又称最小平方法,指根据使估计的剩余平方和最小的原则确定样本回归函数的方法。 最大似然法:又称最大或然法,指用生产该样本概率最大的原则去确定样本回归函数的方法。 总离差平方和:用TSS表示,用以度量被解释变量的总变动。 回归平方和:用ESS表示:度量由解释变量变化引起的被解释变量的变化部分。 残差平方和:用RSS表示:度量实际值与拟合值之间的差异,是由除解释变量以外的其他因素引起的被解释变量变化的部分。 协方差:用Cov(X,Y)表示,度量X,Y两个变量关联程度的统计量。 R表示,该值越接近1,模型拟合优度检验:检验模型对样本观测值的拟合程度,用2

相关主题
文本预览
相关文档 最新文档