计量经济学——虚拟解释变量模型
- 格式:ppt
- 大小:1.51 MB
- 文档页数:97
[计量经济学讲义] 第九章:虚拟解释变量本章及下一章将变量类型由定量变量拓展到定性变量。
§1虚拟变量的性质1、变量的分类:定量变量:如收入、产量、价格、成本、高度等取值在一定分为内连续变化;定性变量:如性别、种族、肤色、宗教、国际、战争、地震、沿海省份等。
“量化”:将定性变量量化,可以根据其不同情况取值0或1。
2、虚拟变量(dummy variable ):取值为0、1等这样的变量。
虚拟变量有时也称为二值变量(binary variable)、二分变量(dichotomous variable)、定性变量(qualitative variable)、指标变量(indicator variable )3、ANOV A (方差分析analysis of variance ):解释变量全为虚拟变量例:i Y =α+βi D +i u其中i Y 表示教授年薪,i D =1,男教授i D =0,女教授(假定年龄、学位和经验可以忽略)女教授的平均年薪为:E(i Y |i D =0)=α;男教授的平均年薪为:E(i Y |i D =1)=α+β;一个例子(略)§2 一个定量变量和一个二分定性变量1、例子:i Y =1α+2αi D +βi X +i u其中i Y 表示教授年薪,i X 表示年龄,则有:女教授的平均年薪为:E(i Y |i X ,i D =0)=1α+βi X ;男教授的平均年薪为:E(i Y |i X ,i D =1)= 1α+2α+βi X ;(假设共同斜率)2、问:有截距项的情况下,区分两个类别要几个虚拟变量?答案是一个,否则有完全贡献性。
结论:有截距项的情况下,若一个定性变量有m 个类别,则仅引入m-1个虚拟变量。
3、0与1的分配问题。
4、基准(benchmark ):0类别的情况5、级差截距系数:D 的系数§3 一个定量变量和一个多分变量例子:假设在横截面数据的基础上,做个人保健支出对个人收入和教育水平的回归。
第八章虚拟变量模型1. 回归模型中引入虚拟变量的作用是什么?答:在模型中引入虚拟变量,主要是为了寻找某(些)定性因素对解释变量的影响。
加法方式与乘法方式是最主要的引入方式,前者主要适用于定性因素对截距项产生影响的情况,后者主要适用于定性因素对斜率项产生影响的情况。
除此外,还可以加法与乘法组合的方式引入虚拟变量,这时可测度定性因素对截距项与斜率项同时产生影响的情况。
2. 虚拟变量有哪几种基本的引入方式? 它们各适用于什么情况?答:在模型中引入虚拟变量的主要方式有加法方式与乘法方式,前者主要适用于定性因素对截距项产生影响的情况,后者主要适用于定性因素对斜率项产生影响的情况。
除此外,还可以加法与乘法组合的方式引入虚拟变量,这时可测度定性因素对截距项与斜率项同时产生影响的情况。
3.什么是虚拟变量陷阱?答:根据虚拟变量的设置原则,一般情况下,如果定性变量有m个类别,则需在模型中引入m-1个变量。
如果引入了m个变量,就会导致模型解释变量出现完全的共线性问题,从而导致模型无法估计。
这种由于引入虚拟变量个数与类别个数相等导致的模型无法估计的问题,称为“虚拟变量陷阱”。
4.在一项对北京某大学学生月消费支出的研究中,认为学生的消费支出除受其家庭的每月收入水平外,还受在学校中是否得到奖学金,来自农村还是城市,是经济发达地区还是欠发达地区,以及性别等因素的影响。
试设定适当的模型,并导出如下情形下学生消费支出的平均水平:(1) 来自欠发达农村地区的女生,未得到奖学金;(2) 来自欠发达城市地区的男生,得到奖学金;(3) 来自发达地区的农村女生,得到奖学金;(4) 来自发达地区的城市男生,未得到奖学金。
解答: 记学生月消费支出为Y,其家庭月收入水平为X,则在不考虑其他因素的影响时,有如下基本回归模型:Y i=β0+β1X i+μi有奖学金1 来自城市无奖学金0 来自农村来自发达地区 1 男性0 来自欠发达地区0 女性Y i=β0+β1X i+α1D1i+α2D2i+α3D3i+α4D4i+μi由此回归模型,可得如下各种情形下学生的平均消费支出:(1) 来自欠发达农村地区的女生,未得到奖学金时的月消费支出:E(Y i|= X i, D1i=D2i=D3i=D4i=0)=β0+β1X i(2) 来自欠发达城市地区的男生,得到奖学金时的月消费支出:E(Y i|= X i, D1i=D4i=1,D2i=D3i=0)=(β0+α1+α4)+β1X i(3) 来自发达地区的农村女生,得到奖学金时的月消费支出:E(Y i |= X i , D 1i =D 3i =1,D 2i =D 4i =0)=(β0+α1+α3)+β1X i (4) 来自发达地区的城市男生,未得到奖学金时的月消费支出: E(Y i |= X i ,D 2i =D 3i =D 4i =1, D 1i =0)= (β0+α2+α3+α4)+β1X i5. 研究进口消费品的数量Y 与国民收入X 的模型关系时,由数据散点图显示1979年前后Y 对X 的回归关系明显不同,进口消费函数发生了结构性变化:基本消费部分下降了,而边际消费倾向变大了。
第七讲 经典单方程计量经济学模型:专门问题虚拟变量模型学习目标:1. 了解什么是虚拟变量以及什么是虚拟变量模型;2. 理解虚拟变量的设置原则;3. 掌握虚拟变量模型的两种基本引入方式(加法方式和乘法方式);4. 能够自行设计虚拟变量模型,并能够解释其中蕴含的经济意义; 教学基本内容一、 虚拟变量许多经济变量是可以定量度量,例如:商品需求量、价格、收入、产量等;但有一些影响经济变量的因素是无法定量度量。
例如:职业、性别对收入的影响,战争、自然灾害对GDP 的影响,季节对某些产品(如冷饮)销售的影响等。
定性变量:把职业、性别这样无法定量度量的变量称为定性变量。
定量变量:把价格、收入、销售额这样可以可以定量度量的变量称为定量变量。
为了能够在模型中能够反映这些因素的影响,提高模型的精度,拓展回归模型的功能,需要将它们“量化”。
这种“量化”通常是通过引入“虚拟变量”来完成的。
根据这些因素的属性类型,构造只取“0”或“1”的人工变量,通常称为虚拟变量(dummy variables ) ,记为D 。
虚拟变量只作为解释变量。
例如:反映性别的虚拟变量⎩⎨⎧=女男;0;1D 反映文化程度的虚拟变量⎩⎨⎧=非本科学历本科学历;0;1D 一般地,基础类型和肯定类型取值为1;比较类型和否定类型取值为0。
二、 虚拟变量的设置原则设置原则:每一定性变量(qualitative variable)所需的虚拟变量个数要比该定性变量的状态类别数(categories)少1。
即如果有m 种状态,只在模型中引入m-1个虚拟变量。
例如,冷饮的销售量会受到季节变化的影响。
季节定性变量有春、夏、秋、冬4种状态,只需要设置3个虚拟变量:⎩⎨⎧=其他春季;0;11D ⎩⎨⎧=其他夏季;0;12D ⎩⎨⎧=其他秋季;0;13D错误设置:⎩⎨⎧=其他春季;0;11D ⎩⎨⎧=其他夏季;0;12D ⎩⎨⎧=其他秋季;0;13D ⎩⎨⎧=其他冬季;0;14D 如果设置第4个虚变量,则出现“虚拟变量陷井”(Dummy Variable Trap )问题。
计量虚拟被解释变量模型引言在计量经济学中,虚拟被解释变量模型是一种统计技术,用于解决因果关系研究中的端点问题。
在这种模型中,被解释变量是通过处理虚拟(或二元)自变量所产生的。
虚拟被解释变量模型常用于实证研究,尤其是在经济学领域。
模型设定虚拟被解释变量模型的基本设定如下:$$ Y_i = \\alpha + \\beta D_i + \\gamma X_i + \\epsilon_i $$其中,Y i是被解释变量,$\\alpha$是常数项,D i是虚拟自变量,$\\beta$是虚拟自变量对被解释变量的系数,X i是其他自变量,$\\gamma$是其他自变量对被解释变量的系数,$\\epsilon_i$是误差项。
虚拟自变量D i通常是二元的,它代表了某一特定性质或条件。
例如,在教育研究中,D i可以表示某人是否接受过高等教育。
虚拟自变量模型的基本思想是比较接受和不接受某一特定条件的个体之间的差异。
性质和假设虚拟被解释变量模型基于以下性质和假设:1.线性性假设:模型假设自变量和被解释变量之间的关系是线性的,即线性回归模型。
2.独立性假设:模型假设误差项$\\epsilon_i$与自变量D i和X i之间不相关。
3.恰当性假设:模型假设虚拟自变量D i是恰当的,并且与被解释变量Y i之间存在着因果关系。
4.无多重共线性假设:模型假设自变量之间不存在高度相关性。
估计和推断对于虚拟被解释变量模型,可以使用最小二乘法进行参数估计,以获取对$\\alpha$、$\\beta$和$\\gamma$的估计值。
通常还可以利用t统计量和F统计量对参数进行假设检验,评估虚拟自变量对被解释变量的影响。
此外,还可以计算模型的拟合优度度量,如决定系数R2和调整决定2,来评估模型的拟合程度和解释能力。
系数R adj实证研究虚拟被解释变量模型在实证研究中有广泛的应用。
以下是一些实证研究领域的例子:在经济学中,虚拟被解释变量模型常用于研究各种政策对经济变量的影响。