第五章1 虚拟变量模型PPT课件
- 格式:ppt
- 大小:1.24 MB
- 文档页数:31
第七讲 经典单方程计量经济学模型:专门问题虚拟变量模型学习目标:1. 了解什么是虚拟变量以及什么是虚拟变量模型;2. 理解虚拟变量的设置原则;3. 掌握虚拟变量模型的两种基本引入方式(加法方式和乘法方式);4. 能够自行设计虚拟变量模型,并能够解释其中蕴含的经济意义; 教学基本内容一、 虚拟变量许多经济变量是可以定量度量,例如:商品需求量、价格、收入、产量等;但有一些影响经济变量的因素是无法定量度量。
例如:职业、性别对收入的影响,战争、自然灾害对GDP 的影响,季节对某些产品(如冷饮)销售的影响等。
定性变量:把职业、性别这样无法定量度量的变量称为定性变量。
定量变量:把价格、收入、销售额这样可以可以定量度量的变量称为定量变量。
为了能够在模型中能够反映这些因素的影响,提高模型的精度,拓展回归模型的功能,需要将它们“量化”。
这种“量化”通常是通过引入“虚拟变量”来完成的。
根据这些因素的属性类型,构造只取“0”或“1”的人工变量,通常称为虚拟变量(dummy variables ) ,记为D 。
虚拟变量只作为解释变量。
例如:反映性别的虚拟变量⎩⎨⎧=女男;0;1D 反映文化程度的虚拟变量⎩⎨⎧=非本科学历本科学历;0;1D 一般地,基础类型和肯定类型取值为1;比较类型和否定类型取值为0。
二、 虚拟变量的设置原则设置原则:每一定性变量(qualitative variable)所需的虚拟变量个数要比该定性变量的状态类别数(categories)少1。
即如果有m 种状态,只在模型中引入m-1个虚拟变量。
例如,冷饮的销售量会受到季节变化的影响。
季节定性变量有春、夏、秋、冬4种状态,只需要设置3个虚拟变量:⎩⎨⎧=其他春季;0;11D ⎩⎨⎧=其他夏季;0;12D ⎩⎨⎧=其他秋季;0;13D错误设置:⎩⎨⎧=其他春季;0;11D ⎩⎨⎧=其他夏季;0;12D ⎩⎨⎧=其他秋季;0;13D ⎩⎨⎧=其他冬季;0;14D 如果设置第4个虚变量,则出现“虚拟变量陷井”(Dummy Variable Trap )问题。
王中昭制作主要内容:§5.1 虚拟变量模型第五章经典单方程计量经济学模型:专门问题§5.1 、虚拟变量模型王中昭制作一、什么叫虚拟变量•在回归模型中,除了定量变量外,有时还必须引入一些不可量化的经济变量,例如,研究职工的收入问题,需考虑到职工的受教育程度,研究冷饮的需求量或某个旅游胜地的旅游人数,需引入季节因素。
这些都是非量化因素,但又非常重要,需引入模型中。
这些不可量化因素可称为虚拟变量。
•一般地,在模型中的定性变量称为虚拟变量。
或称为二元变量或分类变量等等。
用D表示虚拟变量,以强调它与其它定量变量的区别。
二、引入虚拟变量的方式与特点王中昭制作•①、加法方式:虚拟变量与各解释变量之间存在相加关系。
•特点:模型的截距不同,斜率相同。
•例如:Y=a1+a2D t+b1X t+μtt•当D=1时,截距=a1+a2;t•当D=0时,截距=a1t•②、乘法方式:虚拟变量与各解释变量之间存在相乘关系。
•特点:模型的截距相同,斜率不同。
•例如:Y=a1+ b1X t+b2D t*X t+μtt•当D=1时,斜率=b1+b2;t•当D=0时,斜率=b王中昭制作•③、混合方式:虚拟变量与各解释变量之间同时存在相乘和相加关系。
•特点:模型的截距和斜率均不相同。
•例如:Y t=a1+a2D t+b1X t+b2D t*X t+μt•当Dt =1时,截距=a1+a2,斜率=b1+b2;•当Dt=0时,截距=a1,斜率=b1。
王中昭制作•还可将多个虚拟变量引入模型中以考察多种“定性”因素的影响。
一个以性别为虚拟变量考察企业职工薪金的模型:D 1为性别,D 2为学历。
ii i D D X Y μββββ++++=231210⎩⎨⎧=012D 本科及以上学历本科以下学历职工薪金的加法方式引入的模型为:其中:Y 为企业职工的薪金,X 为工龄,D 1=1,若是男性,D 1=0,若是女性。
王中昭制作引入虚拟变量的作用是:消除异常值、体现其它重要的非量化因素对因变量的影响(如:转折点、季节因素、政策因素、教育程度、民族、性别、地区和资料分组等)、提高模型的可靠性。
Econometrics第五章虚拟变量回归模型(教材第六章)第五章虚拟变量回归模型第一节虚拟变量的性质和引入的意义第二节虚拟变量的引入第三节交互作用效应第四节含虚拟变量的回归模型学习要点虚拟变量的性质,虚拟变量的设定5.1 虚拟变量的性质和引入的意义虚拟变量的性质f定性变量性别(男,女)婚姻状况(已婚,未婚)受教育程度(高等教育,其他)收入水平(高收入,中低收入)肤色(白人,有色人种)政治状况(和平时期,战争时期)f引入虚拟变量(Dummy Variables)1、分离异常因素的影响,例如分析我国GDP的时间序列,必须考虑“文革”因素对国民经济的破坏性影响,剔除不可比的“文革”因素。
2、检验不同属性类型对因变量的作用,例如工资模型中的文化程度、季节对销售额的影响。
3、提高模型的精度,相当与将不同属性的样本合并,扩大了样本量,从而提高了估计精度)。
5.1 虚拟变量的性质和引入的意义5.2 虚拟变量的引入虚变量引入的方式主要有两种f加法方式虚拟变量与其它解释变量在模型中是相加关系,称为虚拟变量的加法引入方式。
加法引入方式引起截距变动5.2 虚拟变量的引入f 虚拟变量的作用在于把定性变量“定量化”:通过赋值0和1,0表示变量不具备某种性质,1表示具备。
f 例,0代表男性,1代表女性;0代表未婚,1代表已婚;等等。
f 这类取值为0和1的变量称为虚拟变量(dummy variables ),通常用符号D 表示。
f 事实上,模型可以只包括虚拟变量(ANOVA 模型):其中,0,1,i i D D ==男性;女性。
12i i iY B B D u =++5.2 虚拟变量的引入虚拟变量的性质f 假定随机扰动项满足男性的期望:5.2 虚拟变量的引入虚拟变量的性质f 食品支出对性别虚拟变量(男=0,女=1)回归的结果:f 结果怎么解释?f 由于男性赋值为0,女性赋值为1,因此,截距项表示取值为0的一类(这里是男性)的均值。