当前位置:文档之家› 第五讲 虚拟变量模型

第五讲 虚拟变量模型

第五讲 虚拟变量模型
第五讲 虚拟变量模型

第七讲 经典单方程计量经济学模型:专门问题

虚拟变量模型

学习目标:

1. 了解什么是虚拟变量以及什么是虚拟变量模型;

2. 理解虚拟变量的设置原则;

3. 掌握虚拟变量模型的两种基本引入方式(加法方式和乘法方式);

4. 能够自行设计虚拟变量模型,并能够解释其中蕴含的经济意义; 教学基本内容

一、 虚拟变量

许多经济变量是可以定量度量,例如:商品需求量、价格、收入、产量等;但有一些影响经济变量的因素是无法定量度量。例如:职业、性别对收入的影响,战争、自然灾害对GDP 的影响,季节对某些产品(如冷饮)销售的影响等。

定性变量:把职业、性别这样无法定量度量的变量称为定性变量。

定量变量:把价格、收入、销售额这样可以可以定量度量的变量称为定量变量。

为了能够在模型中能够反映这些因素的影响,提高模型的精度,拓展回归模型的功能,需要将它们“量化”。 这种“量化”通常是通过引入“虚拟变量”来完成的。根据这些因素的属性类型,构造只取“0”或“1”的人工变量,通常称为虚拟变量(dummy variables ) ,记为D 。 虚拟变量只作为解释变量。

例如:反映性别的虚拟变量?

??=女男;0;1D 反映文化程度的虚拟变量???=非本科学历

本科学历;0;1D 一般地,基础类型和肯定类型取值为1;比较类型和否定类型取值为0。

二、 虚拟变量的设置原则

设置原则:

每一定性变量(qualitative variable)所需的虚拟变量个数要比该定性变量的状态类别数(categories)少1。即如果有m 种状态,只在模型中引入m-1个虚拟变量。

例如,冷饮的销售量会受到季节变化的影响。季节定性变量有春、夏、秋、冬4种状态,只需要设置3个虚拟变量:

???=其他春季;0;11D ???=其他夏季;0;12D ???=其他

秋季;0;13D

错误设置:

???=其他春季;0;11D ???=其他夏季;0;12D ???=其他

秋季;0;13D ???=其他冬季;0;14D 如果设置第4个虚变量,则出现“虚拟变量陷井”(Dummy Variable Trap )问题。

三、 虚拟变量模型

1. 概念

虚拟变量模型:同时含有一般解释变量与虚拟变量的模型称为虚拟变量模型,也称方差分析(analysis-of variance: ANOV A )模型。

2. 例子

一个以性别为虚拟变量考察企业职工薪金的模型:

i i i i D X Y μβββ+++=210

???=女

男;0;1D 其中:Y i 为企业职工的薪金;X i 为工龄; D i =1,代表男性,D i =0,代表女性。

四、 虚拟变量的引入方式

虚拟变量作为解释变量引入模型有两种基本方式:加法方式和乘法方式。

1. 加法方式—考察截距的变化

上述企业职工薪金模型中性别虚拟变量的引入采取了加法方式,即模型中将虚拟变量以相加的形式引入模型。

i i i i D X Y μβββ+++=210

???=女

男;0;1D 为了进行进一步的分析,深刻理解这种引入方法的内涵,假定E(μi )=0,我们将该模型化为:

男职工的平均薪金:

i i i i X D X Y E 120)()1,|(βββ++==

女职工的平均薪金:

i i i i X D X Y E 10)0,|(ββ+==

假定β2>0,则两个函数有相同的斜率,但有不同的截距。这意味着,男女职工平均薪金对工龄的变化率是一样的,但两者的平均薪金水平相差β2。

可以通过对β2的统计显著性进行检验,以判断企业男女职工的平均薪金水平是否有显著差异。

如图1所示对比图:

图 1

经济意义:男女职工平均薪金对工龄的变化率是一样的,但两者的平均薪金水平却不一样,相差β2,这也是生活中比价常见的现象,一般男性的基本工资要高于女性,符合经济现实。

思考题:

将上例中的性别换成教育水平,教育水平考虑三个层次:高中以下、高中、大学及其以上。如何建立虚拟变量模型?

i i i u D D X Y ++++=231210ββββ

?

??=其他高中;0;11D ???=其他大学及以上;0;12D 高中以下的平均薪金:

i i i X D D X Y E 1021)0,0,|(ββ+===

高中的平均薪金:

i i i X D D X Y E 12021)()0,1,|(βββ++===

大学及以上的平均薪金:

i i i X D D X Y E 13021)()1,0,|(βββ++===

Y

图2 不同教育程度人员薪金水平示意图

年薪 工龄X

2. 乘法方式——考察斜率的变化

在许多情况下,我们需要考察斜率的变化,此时可以通过乘法的方式引入虚拟变量来测度。

例1:根据消费理论,收入决定消费,即消费水平C 主要取决于收入水平X 。但是,在自然灾害、战争等反常年份,消费倾向往往发生变化。这种消费倾向的变化可通过在收入的系数中引入虚拟变量来考察。

设: 1;0;t D ?=??农村居民城镇居民

消费模型建立如下:

t t t t u X D X C +++=210t βββ

同样,我们把该函数分解来进行分析,可化为:

正常年份:

t t t t X D X C E )()1,|(210βββ++==

反常年份:

t t t t X D X C E 10)0,|(ββ+==

如图3所示对比图:

图 3

经济意义:无论是在正常年份还是反常年份人们首先必须解决衣食住行等温饱问题,这是基本的生活开支。但是到了有战争、自然灾害、金融危机等反常年份,人们的消费倾向就会下降。

例2:中国农村居民的边际消费倾向会与城镇居民的边际消费倾向不同?这种消费倾向的差异可通过在收入的系数中引入虚拟变量来考察。

设:1;0;i D ?=??农村居民城镇居民

消费模型建立如下:

i i i i u X D X C +++=210i βββ

农村居民:

i i i i X D X C E )()1,|(210βββ++==

城镇居民:

i i i i X D X C E 10)0,|(ββ+==

3. 混合方式——同时考查截距与斜率的变化

当截距与斜率发生变化时,则需要同时引入加法与乘法形式的虚拟变量。 课后习题

如果在服装需求函数模型中必须包含3个定性变量:季节(4种状态)、性别(2种状态)、职业(5种状态),自行设计一虚拟变量模型。

第五章 虚拟变量模型和滞后变量模型

1. 表5.1中给出了中国1980—2001年以城乡储蓄存款新增额代表的居民当年储蓄及以GNP 代表的居民当年收入的数据。以1991年为界,判断1991年前和1991年后的两个时期中国居民的储蓄—收入关系是否已发生变化。 表5.1 1980—2001年中国居民储蓄与收入数据 单位:亿元 年份 储蓄S GNP 年份 储蓄S GNP 1980 118.5 4517.8 1991 2072.8 21662.5 1981 124.2 4860.3 1992 2438.4 26651.9 1982 151.7 5301.8 1993 3217 34560.5 1983 217.1 5957.4 1994 6756.4 46670 1984 322.2 7206.7 1995 8143.5 57494.9 1985 407.9 8989.1 1996 8858.5 66850.5 1986 615 10201.4 1997 7759 73142.7 1987 835.7 11954.5 1998 7127.7 76967.2 1988 728.2 14922.3 1999 6214.3 80579.4 1989 1345.4 16917.8 2000 4710.6 88228.1 1990 1887.3 18598.4 2001 9430 94346.4 估计以下回归模型: 0123()i i i i i i Y X D D X u ββββ=++++ 其中i D 为引入的虚拟变量:1,19910,1991i D ?=?? 年前年后 对上面的模型进行估计,结果如下: 所以表达式为: 15350.0751981.90.032()i i i i i Y X D D X =+-+ (1.40) (4.45) (-1.38) (0.37)

第八章__虚拟解释变量回归.doc

第八章虚拟变量回归 第一节虚拟变量 一、虚拟变量的基本概念 在前面的分析中,被解释变量主要受到一些可以直接度量的变量影响,如收入、产出、 商品需求量、价格、成本、资金、人数等。但现实经济生活中,影响被解释变量变动的因素,除了这些可以直接获得实际观测数据的定量变量外,还包括一些本质上为定性因素(或称属 性因素)的影响,例如性别、种族、肤色、职业、季节、文化程度、战争、自然灾害、政府经济政策的变动等因素。在实际经济分析中,这些定性变量有时具有不可忽视的重要影响。

例如,研究某个企业的销售水平,产业部门(制造业、零售业)、所有制(私营、非私营)、地理位置(东、中、西部)、管理者素质的高低等是值得经常考虑的影响因素,这些因素有共同的特征,即都是表示某种属性的,不能直接用数据精确描述的因素。因此,被解释变量的变动经常是定量因素和属性因素共同作用的结果。在计量经济模型中,应当同时包含定量和属性两种因素对被解释变量的影响作用。 定量因素是指那些可直接测度的数值型因素,如GDP、M2 等。定性因素,或称为属性 因素,是不能直接测度的、说明某种属性或状态存在与否的非数值型因素,如男性或女性、城市居民或非城市居民、气候条件正常或异常、政府经济政策不变与改革等。在计量经济学的建模中应当将定量因素和定性因素同时纳入模型之内。 为了在模型中反映定性因素,可以将定性因素转化为虚拟变量去表现。虚拟变量(或称为属性变量、双值变量、类型变量、定性变量、二元型变量等),是人工构造的取值为0 和1 的作为属性变量代表的变量,一般用字母 D (或DUM ,英文dummy 的缩写)表示。属性 因素通常具有若干类型或水平,通常虚拟变量的取值为0和1,当虚拟变量取值为0,即D=0 时,表示某种属性或状态不出现或不存在,即不是某种类型;当虚拟变量取值为1,即D=1 时,表示某种属性或状态出现或存在,即是某种类型。例如,构造政府经济政策人工变量,当经济政策不变时,虚拟变量取值为0,当经济政策改变时,虚拟变量取值为1。这种做法 实际上是一种变换或映射,将不能精确计量的定性因素的水平或状态变换为用0 和1 来定量描述。 二、虚拟变量的设置规则 在计量经济学模型中引入虚拟变量,可以使我们同时兼顾定量因素和定性因素的影响和作用。但是,在设置虚拟变量时应遵循一定的规则。 1、虚拟变量数量的设置规则 虚拟变量个数的设置规则是:若定性因素有m 个相互排斥的类型(或属性、水平),在有截距项的模型中只能引入m-1 个虚拟变量,否则会陷入所谓“虚拟变量陷阱”,产生完 全的多重共线性。在无截距项的模型中,定性因素有m个相互排斥的类型时,引入m个虚 拟变量不会导致完全多重共线性,不过这时虚拟变量参数的估计结果,实际上是D=1 时的 样本均值。 例如,城镇居民和农村居民住房消费支出的模型可设定为:

(精品)第五章-虚拟变量模型和滞后变量模型

第五章虚拟变量模型 1.表5.1中给出了中国1980—2001年以城乡储蓄存款新增额代表的居民当年储蓄及以GNP 代表的居民当年收入的数据。以1991年为界,判断1991年前和1991年后的两个时期中国居民的储蓄—收入关系是否已发生变化。 年份储蓄S GNP 年份储蓄S GNP 1980 118.5 4517.8 1991 2072.8 21662.5 1981 124.2 4860.3 1992 2438.4 26651.9 1982 151.7 5301.8 1993 3217 34560.5 1983 217.1 5957.4 1994 6756.4 46670 1984 322.2 7206.7 1995 8143.5 57494.9 1985 407.9 8989.1 1996 8858.5 66850.5 1986 615 10201.4 1997 7759 73142.7 1987 835.7 11954.5 1998 7127.7 76967.2 1988 728.2 14922.3 1999 6214.3 80579.4 1989 1345.4 16917.8 2000 4710.6 88228.1 1990 1887.3 18598.4 2001 9430 94346.4 估计以下回归模型: 0123 () i i i i i i Y X D D X u ββββ =++++ 其中 i D为引入的虚拟变量: 1,1991 0,1991 i D ? =? ? 年前 年后 对上面的模型进行估计,结果如下: 所以表达式为:

15350.0751981.90.032()i i i i i Y X D D X =+-+ (1.40) (4.45) (-1.38) (0.37) 从2β和3β的t 检验值可以知道,这两个参数显著的为0,所以1991年前和1991年后两个时期的回归结果是相同的。 下面用邹式检验来验证上面对于两个时期的回归结果相同的结论是否正确。 过程如下: 输入要验证的突变点,本例为1991年。 输出结果如下:

虚拟解释变量回归

虚拟变量回归 第一节虚拟变量 一、虚拟变量的基本概念 在前面的分析中,被解释变量主要受到一些可以直接度量的变量影响,如收入、产出、商品需求量、价格、成本、资金、人数等。但现实经济生活中,影响被解释变量变动的因素,除了这些可以直接获得实际观测数据的定量变量外,还包括一些本质上为定性因素(或称属性因素)的影响,例如性别、种族、肤色、职业、季节、文化程度、战争、自然灾害、政府

经济政策的变动等因素。在实际经济分析中,这些定性变量有时具有不可忽视的重要影响。例如,研究某个企业的销售水平,产业部门(制造业、零售业)、所有制(私营、非私营)、地理位置(东、中、西部)、管理者素质的高低等是值得经常考虑的影响因素,这些因素有共同的特征,即都是表示某种属性的,不能直接用数据精确描述的因素。因此,被解释变量的变动经常是定量因素和属性因素共同作用的结果。在计量经济模型中,应当同时包含定量和属性两种因素对被解释变量的影响作用。 定量因素是指那些可直接测度的数值型因素,如GDP、M2等。定性因素,或称为属性因素,是不能直接测度的、说明某种属性或状态存在与否的非数值型因素,如男性或女性、城市居民或非城市居民、气候条件正常或异常、政府经济政策不变与改革等。在计量经济学的建模中应当将定量因素和定性因素同时纳入模型之内。 为了在模型中反映定性因素,可以将定性因素转化为虚拟变量去表现。虚拟变量(或称为属性变量、双值变量、类型变量、定性变量、二元型变量等),是人工构造的取值为0和1的作为属性变量代表的变量,一般用字母D(或DUM,英文dummy的缩写)表示。属性因素通常具有若干类型或水平,通常虚拟变量的取值为0和1,当虚拟变量取值为0,即D=0时,表示某种属性或状态不出现或不存在,即不是某种类型;当虚拟变量取值为1,即D=1时,表示某种属性或状态出现或存在,即是某种类型。例如,构造政府经济政策人工变量,当经济政策不变时,虚拟变量取值为0,当经济政策改变时,虚拟变量取值为1。这种做法实际上是一种变换或映射,将不能精确计量的定性因素的水平或状态变换为用0 和 1 来定量描述。 二、虚拟变量的设置规则 在计量经济学模型中引入虚拟变量,可以使我们同时兼顾定量因素和定性因素的影响和作用。但是,在设置虚拟变量时应遵循一定的规则。 1、虚拟变量数量的设置规则 虚拟变量个数的设置规则是:若定性因素有m个相互排斥的类型(或属性、水平),在有截距项的模型中只能引入m-1个虚拟变量,否则会陷入所谓“虚拟变量陷阱”,产生完全的多重共线性。在无截距项的模型中,定性因素有m个相互排斥的类型时,引入m个虚拟变量不会导致完全多重共线性,不过这时虚拟变量参数的估计结果,实际上是D=1时的样本均值。 例如,城镇居民和农村居民住房消费支出的模型可设定为:

计量经济学:第八章 虚拟变量回归

第八章 虚拟变量回归 第一节 虚拟变量的概念 一、问题的提出 计量经济学模型对变量的要求——可观测、可计量。但在现实经济问题中,存在定性影响因素,比如 1、属性(品质)因素的表达。 在经济活动中,有的经济变量的变动要受到属性因素(或品质因素)的影响。如收入在形成过程中,不同的性别所得到的收入是不一样的;在城乡、不同地区等收入存在差距;再比如,在我国,经济的发展水平对于不同的区域有不同的表现。 2、异常值现象。 当经济运行过程中,可能会受到突发事件的影响,那么,其值有可能出现异常,偏离正常轨迹很远,对这类现象需要加以修正。 3、季节因素的影响。 有的经济现象存在明显的季节特征,如啤酒的消费。那么,在建模过程中,季节变动这一因素怎样考虑? 4、离散选择现象的描述。 如公共交通与私人交通的选择、商品购买与否的决策、求职者对职业的选择等。 第1、2、3种情况属于解释变量为定性变量,第4情况为被解释变量属于定性变量。称前一种情况为虚拟解释变量,后一种为虚拟被解释变量。本章主要介绍虚拟解释变量的内容。 二、虚拟变量的定义 1、定义。设变量D 表示某种属性,该属性有两种类型,即当属性存在时D 取值为1;当属性不存在时D 取值为0。记为 ???=不具有该属性 具有某种属性01D

2、虚拟变量引入的规则。 (1)在模型里存在截距项的条件下,如果一个属性存在m 个相互排斥类型(非此即彼),则在模型里引入m-1个虚拟变量。否则,会出现完全的多重共线性。但要注意,在模型无截距项的情况下,如果一个属性存在m 个类型,即便引入m 个变量,不会出现多重共线性问题。( 请思考为什么?) (2)虚拟变量取值为0,意味着所对应的类型是基础类型。而虚拟变量取值为1,代表与基础类型相比较的类型,称为比较类型。例如“有学历”D 为1,“无学历”D 为0,则“无学历”就是基础类型,“有学历”为比较类型。 (3)当属性有m 个类型时,不能把虚拟变量的取值设成如下情况 D=0, 第一个类型; D=1, 第二个类型; …… D=m-1, 第m 个类型。 原因是上述情况没有反映出属性类型的相互排斥性。 第二节 虚拟解释变量的回归 一、加法引入规则 1、加法引入规则,虚拟解释变量与别的解释变量以相加的关系出现在模型里。加法引入虚拟变量对模型产生的结果是只改变截距项。 设模型为 123i i i i Y X D u βββ=+++ 式中,i D 为虚拟变量,它与其它解释变量是相加的关系。如果虚拟变量按这种方式引入模型,则称虚拟变量按加法类型引入。 2、加法引入虚拟变量的应用。 (1)模型中只有一个定性解释变量。 设模型形式为 12i i i Y D u ββ=++ n i ,,3,2,1 = 其中,i D 为具有两个属性类型的定性变量,如在教材第217页,设i Y 为居民的

第五章-含虚拟变量的回归模型

Econometrics 第五章虚拟变量回归模型(教材第六章)

第五章虚拟变量回归模型 第一节虚拟变量的性质和引入的意义 第二节虚拟变量的引入 第三节交互作用效应 第四节含虚拟变量的回归模型 学习要点 虚拟变量的性质,虚拟变量的设定

5.1 虚拟变量的性质和引入的意义 虚拟变量的性质 f定性变量 性别(男,女) 婚姻状况(已婚,未婚) 受教育程度(高等教育,其他) 收入水平(高收入,中低收入) 肤色(白人,有色人种) 政治状况(和平时期,战争时期) f引入虚拟变量(Dummy Variables)

1、分离异常因素的影响,例如分析我国GDP的时间序列,必须考虑“文革”因素对国民经济的破坏性影响,剔除不可比的“文革”因素。 2、检验不同属性类型对因变量的作用,例如工资模型中的文化程度、季节对销售额的影响。 3、提高模型的精度,相当与将不同属性的样本合并,扩大了样本量,从而提高了估计精度)。 5.1 虚拟变量的性质和引入的意义

5.2 虚拟变量的引入 虚变量引入的方式主要有两种 f加法方式 虚拟变量与其它解释变量在模型中是相加关系,称为虚拟 变量的加法引入方式。 加法引入方式引起截距变动

5.2 虚拟变量的引入 f 虚拟变量的作用在于把定性变量“定量化”:通过赋值0和1,0表示变量不具备某种性质,1表示具备。 f 例,0代表男性,1代表女性;0代表未婚,1代表已婚;等等。 f 这类取值为0和1的变量称为虚拟变量(dummy variables ),通常用符号D 表示。 f 事实上,模型可以只包括虚拟变量(ANOVA 模型): 其中,0,1,i i D D ==男性;女性。 12i i i Y B B D u =++

第五讲 虚拟变量模型

第七讲 经典单方程计量经济学模型:专门问题 虚拟变量模型 学习目标: 教学基本内容 虚拟变量 许多经济变量是可以定量度量,例如:商品需求量、价格、收入、产量等; 但有一些影响经济变量的因素是无法定量度量。 例如:职业、性别对收入的影响, 战争、自然灾害对 GDP 勺影响,季节对某些产品(如冷饮)销售的影响等。 定性变量:把职业、性别这样无法定量度量的变量称为定性变量。 定量变量:把价格、 收入、 销售额这样可以可以定量度量的变量称为定量变 量。 为了能够在模型中能够反映这些因素的影响, 型的功能,需要将它们“量化”。 这种“量化” 来完成的。 根据这些因素的属性类型, 构造只取 称为虚拟变量( dummy variables ) ,记为 D 。 例如:反映性别的虚拟变量 D 1;男 0;女 1; 本科学历 反映文化程度的虚拟变量 D 0;1非;本本科科学学历历 一般地,基础类型和肯定类型取值为 1;比较类型和否定类型取值为 0。 二、 虚拟变量的设置原则 设置原则: 每一定性变量(qualitative variable )所需的虚拟变量个数要比该定性变量的状 态类别数(categories 少1。即如果有m 种状态,只在模型中引入m-1个虚拟变量。 例如,冷饮的销售量会受到季节变化的影响。季节定性变量有春、夏、秋、 冬 4 种状态,只需要设置 3 个虚拟变量: 1. 2. 3. 4. 了解什么是虚拟变量以及什么是虚拟变量模型; 理解虚拟变量的设置原则; 掌握虚拟变量模型的两种基本引入方式(加法方式和乘法方式) 能够自行设计虚拟变量模型,并能够解释其中蕴含的经济意义; 提高模型的精度, 拓展回归模 通常是通过引入“虚拟变量” 0”或“1”的人工变量, 通常 虚拟变量只作为解释变量。

(VR虚拟现实)第八章虚拟解释变量回归

(VR虚拟现实)第八章虚拟解释变量回归

第八章虚拟变量回归 引子 男女大学生的消费真的有差异吗? 在校大学生的消费行为越来越受到社会的关注,学生家长也很关心自己的子女上大学究竟要准备多少花费。由共青团中央、全国学联共同发布的《2004中国大学生消费与生活形态研究报告》显示,当代大学生在消费结构方面呈现出多元化趋势。大学生除了日常生活费开支以外,还有人际交往消费、网络通讯消费、书报消费、衣着类消费、化妆品类消费、电脑类消费、旅游类消费、食品类消费、学习用品类消费、各种考证类等消费。大学生时尚化、个性化消费增多已成为趋势与潮流。不同性别大学生的消费结构有所不同,专科生、本科生、研究生的消费结构更有差异。有的记者调查发现,不同年级之间,男女同学之间,消费水平、消费结构、消费方式上都存在着差异。年级越高,消费水平也随之增长,随着阅历的增加,对自己形象的重视,精神享受的追求、学习的投入、配备手机电脑的需求也随之增长。同年级的男生的消费高于女生,虽然女生在化妆品、衣服饰品方面的投入明显高于男生。然而时代在变,对美的追求已不再限于女生,男生对于个人形象、装扮也已慢慢重视起来。此外男生在人际交往方面比女生投入了更多的"本钱"。请客吃饭、朋友聚会、节日送礼已不再罕见。所谓的"人情消费"已从社会向校园中扩张蔓延,而在乎"面子"的男同胞已成为追随这一潮流的"先驱"。高年级女生对于吃饭的投入相对较少,而在化妆品、服饰、零食方面的投入却增长不少。(注:来源于Solie教育网、网易教育频道、新华网等)为了研究男女大学生、不同层次大学生、不同年级大学生的消费结构是否有差异,需要将这些定性的因素引入计量模型,怎样才能在模型中有效地表示这些定性因素的作用呢?

第五章 离散选择模型(虚拟变量回归)(20140429)

第五章离散选择模型(虚拟变量回归) 第一节虚拟变量的概念 一、问题的提出 计量经济学模型对变量的要求——可观测、可计量。但在现实经济问题中,存在定性影响因素,比如 1、属性(品质)因素的表达 在经济活动中,有的经济变量的变动要受到属性因素(或品质因素)的影响。如收入在形成过程中,不同的性别所得到的收入是不一样的;在城乡、不同地区等收入存在差距;再比如,在我国,经济的发展水平对于不同的区域有不同的表现。 2、异常值现象 当经济运行过程中,可能会受到突发事件的影响,那么,其值有可能出现异常,偏离正常轨迹很远,对这类现象需要加以修正。 3、季节因素的影响 有的经济现象存在明显的季节特征,如啤酒的消费。那么,在建模过程中,季节变动这一因素怎样考虑? 4、离散选择现象的描述 如公共交通与私人交通的选择、商品购买与否的决策、求职者对职业的选择等。 第1、2、3种情况属于解释变量为定性变量,第4情况为被解释变量属于定性变量。称前一种情况为虚拟解释变量,后一种为虚拟被解释变量。本章主要介绍虚拟解释变量的内容。 二、虚拟变量的定义 1、定义 设变量D表示某种属性,该属性有两种类型,即当属性存在时D取值为1;当属性不存在时D取值为0。记为

???=不具有该属性类型 具有某种属性类型0 1D 2、虚拟变量引入的规则 (1)在模型里存在截距项的条件下,如果一个属性存在m 个相互排斥类型(非此即彼),则在模型里引入m-1个虚拟变量。否则,会出现完全的多重共线性。但要注意,在模型无截距项的情况下,如果一个属性存在m 个类型,即便引入m 个变量,不会出现多重共线性问题。( 请思考为什么?) (2)虚拟变量取值为0,意味着所对应的类型是基础类型。而虚拟变量取值为1,代表与基础类型相比较的类型,称为比较类型。例如“有学历”D 为1,“无学历”D 为0,则“无学历”就是基础类型,“有学历”为比较类型。 (3)当属性有m 个类型时,不能把虚拟变量的取值设成如下情况 D=0, 第一个类型; D=1, 第二个类型; …… D=m-1, 第m 个类型。 原因是上述情况没有反映出属性类型的相互排斥性。 第二节 虚拟解释变量的回归 一、加法引入规则 1、加法引入规则,虚拟解释变量与别的解释变量以相加的关系出现在模型里。加法引入虚拟变量对模型产生的结果是只改变截距项。 设模型为 123i i i i Y X D u βββ=+++ 式中,i D 为虚拟变量,它与其它解释变量是相加的关系。如果虚拟变量按这种方式引入模型,则称虚拟变量按加法类型引入。 2、加法引入虚拟变量的应用 (1)模型中只有一个定性解释变量 设模型形式为 12i i i Y D u ββ=++ n i ,,3,2,1 =

第八章 虚拟变量回归 思考题

第八章 虚拟变量回归 思考题 8.1 什么是虚拟变量 ? 它在模型中有什么作用 ? 8.2 虚拟变量为何只选 0 、 1, 选 2 、 3 、 4 行吗 ? 为什么 ? 8.3 对 (8.10) 式的模型 , 如果选择一个虚拟变量 1,01D ?? =??-? 大专及大专以上,高中,高中以下 这样的设置方式隐含了什么假定 ? 这一假定合理吗 ? 8.4 引入虚拟解释变量的两种基本方式是什么 ? 它们各适用于什么情况 ? 8.5 四种加法方式引入虚拟变量会产生什么效应? 8.6 引入虚拟被解释变量的背景是什么?含有虚拟被解释变量模型的估计方法有哪些 ? 8.7 设服装消费函数为 12233t i i i i Y D D X u αααβ=++++ 其中,i X =收入水平 ;Y = 年服装消费支出 ; 1,30D ?=? ?大专及大学以上 ,其他 ;1,20D ?=??女性,其他 试写出不同人群组的服装消费函数模型。 8.8 利用月度数据资料 ,为了检验下面的假设,应引入多少个虚拟解释变量 ? 1) 一年里的 12 个月全部表现出季节模式 ; 2) 只有 2 月、 6 月、 8 月、 10 月和 12 月表现出季节模式。 练习题 8.1 1971 年 ,Sen 和 Sztvastava 在研究贫富国之间期望寿命的差异时 , 利用 101 个国家的数据 , 建立了如下回归模型 []? 2.409.39ln 3.36(ln 7)i i i i Y X D X =-+-- (4.37)(0.857)(2.42) R2=0.752 其中 ,X 是以美元计的人均收入 ;Y 是以年计的期望寿命 ; Sen 和 Srimstava 认为人均收入的临界值为 1097 美元 (ln1097=7), 若人均收入超过 1097 美元 , 则被认定为富国 ; 若人均收入低于1097美元 , 被认定为贫穷国。括号内的数值为对应参数估计值的t 值。 1) 解释这些计算结果。 2) 回归方程中引入(ln 7)i i D X =-的原因是什么?如何解释这个回归解释变量? 3) 如何对贫穷国进行回归 ? 又如何对富国进行回归 ? 4)这个回归结果中可得到的一般结论是什么 ?

第五章虚拟变量模型和滞后变量模型

第五章虚拟变量模型和滞后变量模型 以下是为大家整理的第五章虚拟变量模型和滞后变量模型的相关范文,本文关键词为第五,虚拟,变量,模型,滞后,5.1,出了,中国,1980,,您可以从右上方搜索框检索更多相关文章,如果您觉得有用,请继续关注我们并推荐给您的好友,您可以在综合文库中查看更多范文。 1.表5.1中给出了中国1980—20XX年以城乡储蓄存款新增额代表的居民当年储蓄及以gnp代表的居民当年收入的数据。以1991年为界,判断1991年前和1991年后的两个时期中国居民的储蓄—收入关系是否已发生变化。

表5.11980—20XX年中国居民储蓄与收入数据单位:亿元 年份储蓄sgnp年份储蓄s1980118.54517.819912072.81981124.24860.319922438.41982151.753 01.8199332171983217.15957.419946756.41984322.27206.719958143.5 1985407.98989.119968858.5198661510201.4199777591987835.711954 .519987127.71988728.214922.319996214.319891345.416917.82000471 0.61990 1887.3 18598.4 20XX 9430 估计以下回归模型: Yi??0??1xi??2Di??3(Dixi)?ui 其中D?i为引入的虚拟变量:Di??1,1991年前?0,1991年后 对上面的模型进行估计,结果如下: 所以表达式为: Yi?1535?0.075xi?1981.9Di?0.032(Dixi) (1.40)(4.45)(-1.38)(0.37) gnp21662.526651.934560.54667057494.966850.573142.776967.280579

第九章 含虚拟变量的回归模型

第九章含虚拟变量的回归模型 目前为止,在已学习的线性回归模型中,解释变量X都是定量变量。但有时候,解释变量是定性变量。 9.1 虚拟变量的性质 通常在回归分析中,应变量不仅受一些定量变量的影响,还受一些定性变量的影响(性别、种族、肤色、宗教、民族、罢工、政团关系、婚姻状况)。 如: 美国黑人的收入比相应的白人的收入低。 女学生的S.A.T.的数学平均分数比相应的男生低。 定性变量通常表明了具备或不具备某种性质,比如,男性或女性,黑人或白人,佛教徒或非佛教徒,本国公民或非本国公民。 把定性因素“定量化”的一个方法是建立人工变量,并赋值0和1,0表示变量不具备某种属性,1表示变量具备某种属性,该变量称为虚拟变量(dummy variable),用符号D表示。 虚拟变量一样可用于回归分析,一个回归模型的解释变量可以仅仅是虚拟变量,称为方差分析模型( ANOVA )。

Yi = B1 + B2Di + ui ( 9 - 1 ) 其中Y = 初职年薪 Di =1,大学毕业 =0,非大学毕业 假定随机扰动项满足古典线性回归模型的基本假定,根据模型( 9 - 1 )得到: 非大学毕业生的初职年薪的期望为: E(Yi|Di=0) = B1 + B2( 0 ) = B1 ( 9 - 2 ) 大学毕业生的初职年薪的期望为: E(Yi|Di=1) = B1+B2( 1 ) = B1+B2 ( 9 - 3 ) 可以看出: 截距B1表示非大学毕业生的平均初职年薪, “斜率”系数B2表明大学毕业生的平均初职年薪与非大学生的差距是多少; (B1+B2)表示大学毕业生的平均初职年薪。 零假设:大学教育没有任何益处(即B2=0),可根据t检验值

相关主题
相关文档 最新文档