第五章_包含虚拟变量的回归模型
- 格式:ppt
- 大小:2.46 MB
- 文档页数:92
§5.5 含有虚拟变量的回归模型 1.带虚变量的回归预测前述变量均是用某种意义明确的尺度加以定量的变数。
暂时性影响:经济行为受特定因素的影响,因而促使一期或数期变数与其他各期有明显的差异。
虚拟变量:用来表现暂时性影响的变量,或者说,表明某种“品质”或属性是否存在的的变量。
2.基本概念(1)水平:当自变量以虚拟变量的形式出现时,虚拟变量的出现形式称为“水平”。
(2)反应:用()k j i,δ表示第i 个样本第j 个自变量取第k 个水平的反应:()k j i ,δ=⎩⎨⎧否则个水平时个自变量取第个样本第当第01k j i(3)反应表:将各样本的资料排列得到的表格称为反应表。
(4)反应矩阵:把反应表中的反应()k j i,δ写成矩阵形式,称为反应矩阵。
记为X=(()k j i,δ)。
3.基本方法(1)建模原则:如果一个属性变数有m 个类型,只引入m —1个虚拟变量。
否则,会陷入所谓的虚拟变数陷阱之中,出现完全多重共线性的情况。
在解释采用虚拟变量的模型结果时,要弄清楚水平值是如何确定的。
指定取值为0的类型或组通常用来指明基础类型、控制类型、对比类型或被省略的类型。
附属于虚拟变量D 的系数α1称为不同的截距系数,它说明D 取值为1的那种类型的截距项与基础类型的截距系数的数值差异有多大。
(2)建立数学模型:将虚拟变量视为普通变量,建立回归模型。
(3)对参数作出估计。
(4)进行预测。
(5)一般情况:指模型自变量中同时含有虚拟变量和普通变量。
4.应用实例研究1958年第四季度到1971年第二季度期间英国的失业率和职务空缺率之间的关系。
原始作出散点图解释:1966年第四季度起,失业—职位空缺的关系发生变化,表示两者之间关系的曲线在该季度开始上移。
这种上移的含义是指对于一定的职位空缺率来说,1966年第四季度比以前有更多的失业者。
其原因是1966年10月(即第四季度),当时的英国政府通过以统一收费率和(以前的)有关救济金收入的混合制度,取代短期失业救济的统一收费率制度,从而放宽了国民保险条例,这明显地增加了失业救济金的水平。
王中昭制作主要内容:§5.1 虚拟变量模型第五章经典单方程计量经济学模型:专门问题§5.1 、虚拟变量模型王中昭制作一、什么叫虚拟变量•在回归模型中,除了定量变量外,有时还必须引入一些不可量化的经济变量,例如,研究职工的收入问题,需考虑到职工的受教育程度,研究冷饮的需求量或某个旅游胜地的旅游人数,需引入季节因素。
这些都是非量化因素,但又非常重要,需引入模型中。
这些不可量化因素可称为虚拟变量。
•一般地,在模型中的定性变量称为虚拟变量。
或称为二元变量或分类变量等等。
用D表示虚拟变量,以强调它与其它定量变量的区别。
二、引入虚拟变量的方式与特点王中昭制作•①、加法方式:虚拟变量与各解释变量之间存在相加关系。
•特点:模型的截距不同,斜率相同。
•例如:Y=a1+a2D t+b1X t+μtt•当D=1时,截距=a1+a2;t•当D=0时,截距=a1t•②、乘法方式:虚拟变量与各解释变量之间存在相乘关系。
•特点:模型的截距相同,斜率不同。
•例如:Y=a1+ b1X t+b2D t*X t+μtt•当D=1时,斜率=b1+b2;t•当D=0时,斜率=b王中昭制作•③、混合方式:虚拟变量与各解释变量之间同时存在相乘和相加关系。
•特点:模型的截距和斜率均不相同。
•例如:Y t=a1+a2D t+b1X t+b2D t*X t+μt•当Dt =1时,截距=a1+a2,斜率=b1+b2;•当Dt=0时,截距=a1,斜率=b1。
王中昭制作•还可将多个虚拟变量引入模型中以考察多种“定性”因素的影响。
一个以性别为虚拟变量考察企业职工薪金的模型:D 1为性别,D 2为学历。
ii i D D X Y μββββ++++=231210⎩⎨⎧=012D 本科及以上学历本科以下学历职工薪金的加法方式引入的模型为:其中:Y 为企业职工的薪金,X 为工龄,D 1=1,若是男性,D 1=0,若是女性。
王中昭制作引入虚拟变量的作用是:消除异常值、体现其它重要的非量化因素对因变量的影响(如:转折点、季节因素、政策因素、教育程度、民族、性别、地区和资料分组等)、提高模型的可靠性。
Econometrics第五章虚拟变量回归模型(教材第六章)第五章虚拟变量回归模型第一节虚拟变量的性质和引入的意义第二节虚拟变量的引入第三节交互作用效应第四节含虚拟变量的回归模型学习要点虚拟变量的性质,虚拟变量的设定5.1 虚拟变量的性质和引入的意义虚拟变量的性质f定性变量性别(男,女)婚姻状况(已婚,未婚)受教育程度(高等教育,其他)收入水平(高收入,中低收入)肤色(白人,有色人种)政治状况(和平时期,战争时期)f引入虚拟变量(Dummy Variables)1、分离异常因素的影响,例如分析我国GDP的时间序列,必须考虑“文革”因素对国民经济的破坏性影响,剔除不可比的“文革”因素。
2、检验不同属性类型对因变量的作用,例如工资模型中的文化程度、季节对销售额的影响。
3、提高模型的精度,相当与将不同属性的样本合并,扩大了样本量,从而提高了估计精度)。
5.1 虚拟变量的性质和引入的意义5.2 虚拟变量的引入虚变量引入的方式主要有两种f加法方式虚拟变量与其它解释变量在模型中是相加关系,称为虚拟变量的加法引入方式。
加法引入方式引起截距变动5.2 虚拟变量的引入f 虚拟变量的作用在于把定性变量“定量化”:通过赋值0和1,0表示变量不具备某种性质,1表示具备。
f 例,0代表男性,1代表女性;0代表未婚,1代表已婚;等等。
f 这类取值为0和1的变量称为虚拟变量(dummy variables ),通常用符号D 表示。
f 事实上,模型可以只包括虚拟变量(ANOVA 模型):其中,0,1,i i D D ==男性;女性。
12i i iY B B D u =++5.2 虚拟变量的引入虚拟变量的性质f 假定随机扰动项满足男性的期望:5.2 虚拟变量的引入虚拟变量的性质f 食品支出对性别虚拟变量(男=0,女=1)回归的结果:f 结果怎么解释?f 由于男性赋值为0,女性赋值为1,因此,截距项表示取值为0的一类(这里是男性)的均值。