- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
当X t X *时, Yt 1 1 X t ut 当X t X *时, Yt (1 2 X * ) (1 2 ) X t ut
23
说 明
1. 2 的显著性说明了在所设定的解释变量临界水 平X*处是否存在突变。 2.2段线性回归设置1个虚拟变量; k段线性回归设置k-1个虚拟变量。
10
解释变量只有一个分为两种相互排斥类型 的定性变量,而无定量变量的回归
假定文化程度、职业、性别等不变,研究农村居 民与城镇居民的年平均可支配收入是否有差异。
Yi 1 1 Di ui
0, 农村居民 Di 1, 城镇居民
1 表示农村居民的年平均可支配收入;
1 表示城镇居民与农村居民年平均可支配收入的 差异。 城乡居民年均可支配收入之间是否有差距,可通 过的 Di 显著性判断。 11
8
第二节 虚拟解释变量的回归
在计量经济模型中,加入虚拟解释变量,有两种 基本类型:加法类型和乘法类型。 一、用虚拟变量表示不同截距的回归——加法类 型 二、用虚拟变量表示不同斜率的回归——乘法类 型
9
一、用虚拟变量表示不同截距的回归—— 加法类型
解释变量只有一个分为两种相互排斥类型的定性
变量,而无定量变量的回归 解释变量包含一个定量变量和一个分为两种类型 定性变量的回归 解释变量包含一个定量变量和一个两种以上类型 的定性变量的回归 解释变量包含一个定量变量和两个定性变量的回 归
大专及以上:Yi (1 3 ) 1 X i ui
解释变量包含一个定量变量和两个定性变 量的回归
研究城乡居民卷烟需求量受居民可支配收入和性别的 影响: Yi 1 2 D2i 3 D3i 1 X i ui
0, 农村居民 D2i 1, 城镇居民 0, 女性 D3i 1, 男性
Yi 1 2 Di 1 X i ui
0, 租房户 Di 1, 有房户
15
i 1 2 3 4 5 6 7 8 9 10
Y 1.0 1.3 0.7 0.8 0.5 2.4 0.3 3.2 2.8 0.0
X 20.0 24.0 12.0 16.0 11.0 32.0 10.0 40.0 32.0 7.0
第八章
第一节 第二节 第三节 第四节
虚拟变量回归
虚拟变量 虚拟解释变量的回归 虚拟被解释变量 案例分析
1
第一节 虚拟变量
一、虚拟变量的基本概念
二、虚拟变量的设置规则 三、虚拟变量的作用
2
一、虚拟变量的基本概念
定量因素:指那些可直接测度的数值型因素。 定性因素:也称为属性因素,指不能直接测度的,说 明某种属性或状态存在与否的非数值型因素。 虚拟变量:也称为属性变量、双值变量、类型变量、 定性变量、二元型变量等。指人工构造的取值为0和 1的作为属性因素代表的变量,一般用字母D或DUM来 表示。(D=0,表示某种属性或状态不出现或不存在; D=1,表示某种属性或状态出现或存在) 例如:wagei 1 1educi 2 Di ui 0, 表示女性 Di 3 1, 表示男性
21
分段线性回归
适合于社会经济现象会在解释变量达到某个临界值时 发生突变,考虑下述模型: Yt 1 1 X t 2 ( X t X * ) Dt ut 0, X t X * Dt * 1, X t X
当X t X *时, Yt 1 1 X t ut 当X t X 时, Yt 1 1 X t 2 ( X t X * ) ut
二、虚拟变量的设置规则
1.虚拟变量个数的设置规则 若定性因素有m个相互排斥的类型(或属性、水 平),则: 在有截距项的模型中,只能引入m-1个虚拟变 量,否则会陷入“虚拟变量陷阱”(即:出 现完全的多重共线性); 在无截距项的模型中,可以引入m个虚拟变量, 不会导致完全的多重共线性。
4
例如:研究城乡居民的可支配收入对居民住房消费支 出的影响 C Y D u i 1 1 i 2 i i
0, 其他 D2 i 1, 初中 0, 其他 0, 其他 D4i D3 i 1, 大专及以上 1, 高中
Yi 1 1 X i 2 D2i 3 D3i 4 D4i ui
7
三、虚拟变量的作用
虚拟变量可以作为下列因素的代表: 属性因素 非精确计量的数量因素 偶然因素或政策因素 时间序列分析中的季节(或月份)因素 用于分段回归
0, 表示农村居民 Di 1, 表示城镇居民
若引入两个虚拟变量,则:
Ci 1 1Yi 2 D2i 3 D3i ui
0, D2i 1,
其他 城镇居民
0, D3i 1,
其他 农村居民
5
2.虚拟变量0和1的选取原则
虚拟变量取“0”,通常代表基础类型; 虚拟变量取“1”,通常代表与基础类型相比较 的类型。
城镇居民的消费函数: Ci (1 2 ) 1 X i ui
E(Ci | Di 1) (1 2 ) 1 X i
12
解释变量包含一个定量变量和一个两种以 上类型的定性变量的回归
研究居民的年医疗保健费用支出受可支配收入和居民 受教育程度的影响(受教育程度可分为:高中以下、 高中、大专及以上三个级别):
*
( 1 2 X * ) ( 1 2 ) X t ut
22
案 例
某公司为了激励公司的销售人员,按其销售额的 一定比例计提奖励,但是销售额在某一目标水 平X*以下和以上时,计提奖励的比例不同。
Yt 1 1 X t 2 ( X t X * ) Dt ut 0, X t X * Dt * 1 , X X t
解释变量包含一个定量变量和一个分为两 种类型定性变量的回归
研究城乡居民的消费函数: Ci 1 2 Di 1 X i ui
农村居民的消费函数:
Ci 1 1 X i ui
E(Ci | Di 0) 1 1 X i
0, 农村居民 Di 1, 城镇居民
24
3段分段线性回归举例
研究中国的货币流通量,从建国到现在历经了三 个时期: 从建国初期到1960年,增加速度比较快; 从1961年到1978年,由于处于经济困难和文化 革命时期,增加速度明显减缓; 从1978年改革开放往后,进入社会主义市场经 济时期,增加速度明显增加。 试建立中国的货币流通量的趋势模型。
16
4
3
Y
2
1
0 0 10 20 X
17
30
40
50
ˆ 0.3204 0.8273D 0.0675X Y i i i t ( 5.2) (16.9) (11.0) R 2 0.99
ˆ 0.3204 0.0675X 租房户: Y i i
ˆ 0.5069 0.0675X 有房户: Y i i
改革开放前: Yi 1 1 X i ui 改革开放后: Yi (1 2 ) ( 1 2 ) X i ui
20
以乘法方式引入虚拟变量做回归模型比较 的优点
用一个回归替代了多个回归,简化了分析过程;
可以方便地对模型结构的差异做各种假设检验;
合并了的回归增加了自由度,提高了参数估计 的精确性。
农村女性: Yi 1 1 X i ui 农村男性: Yi (1 3 ) 1 X i ui 城镇女性: Yi (1 2 ) 1 X i ui
城镇男性: Yi (1 2 3 ) 1 X i ui
14
案例
随机调查美国旧金山地区20个家庭的储蓄情况, 拟建立年储蓄额对年收入的回归模型,通过样 本的散点图发现,这20个家庭中,有房户和租 房户的储蓄额有较明显的区别,故在模型中加 入一个定性变量,以区别有房户和租房户。
例如:研究政府某项经济政策的施行与否对被解 释变量的影响
( 该项经济政策未施行 ) 0, 基 础 类 型 Di ( 该项经济政策施行了 ) 1, 比 较 类 型
6
练 习
将定性因素“学历”(分为:大专及以上、高中、 初中、小学及以下)作为解释变量引入下面的 模型中。 Yi 1 1 X i ui
25ቤተ መጻሕፍቲ ባይዱ
本章小结
虚拟变量的概念 虚拟变量的设置规则 加法类型引入虚拟变量 乘法类型引入虚拟变量
26
D 0 0 0 0 0 1 0 1 1 0
i 11 12 13 14 15 16 17 18 19 20
Y 0.3 0.0 1.0 2.0 0.4 0.7 1.5 1.6 0.6 0.6
X 9.0 6.0 18.0 20.0 12.0 14.0 15.0 16.0 15.0 14.0
D 0 0 0 1 0 0 1 1 0 0
Yi 1 2 D2i 3 D3i 1 X i ui
0, 其他 D2 i 1, 高中
0, 其他 D3i 1, 大专及以上
高中以下: Yi 1 1 X i ui 高中:
Yi (1 2 ) 1 X i ui
13
18
二、用虚拟变量表示不同斜率的回归—— 乘法类型
回归模型的比较——结构变化检验
分段线性回归
19
回归模型的比较——结构变化检验
研究改革开放前后(1950-2004),储蓄与收入的关系: Yi 1 2 Di 1 X i 2 ( Di X i ) ui
( 1950 1977 ) 0, 改革开放前 Di ( 1978 2004 ) 1, 改革开放后