计量虚拟变量模型
- 格式:ppt
- 大小:179.00 KB
- 文档页数:26
第八章虚拟变量模型1. 回归模型中引入虚拟变量的作用是什么?答:在模型中引入虚拟变量,主要是为了寻找某(些)定性因素对解释变量的影响。
加法方式与乘法方式是最主要的引入方式,前者主要适用于定性因素对截距项产生影响的情况,后者主要适用于定性因素对斜率项产生影响的情况。
除此外,还可以加法与乘法组合的方式引入虚拟变量,这时可测度定性因素对截距项与斜率项同时产生影响的情况。
2. 虚拟变量有哪几种基本的引入方式? 它们各适用于什么情况?答:在模型中引入虚拟变量的主要方式有加法方式与乘法方式,前者主要适用于定性因素对截距项产生影响的情况,后者主要适用于定性因素对斜率项产生影响的情况。
除此外,还可以加法与乘法组合的方式引入虚拟变量,这时可测度定性因素对截距项与斜率项同时产生影响的情况。
3.什么是虚拟变量陷阱?答:根据虚拟变量的设置原则,一般情况下,如果定性变量有m个类别,则需在模型中引入m-1个变量。
如果引入了m个变量,就会导致模型解释变量出现完全的共线性问题,从而导致模型无法估计。
这种由于引入虚拟变量个数与类别个数相等导致的模型无法估计的问题,称为“虚拟变量陷阱”。
4.在一项对北京某大学学生月消费支出的研究中,认为学生的消费支出除受其家庭的每月收入水平外,还受在学校中是否得到奖学金,来自农村还是城市,是经济发达地区还是欠发达地区,以及性别等因素的影响。
试设定适当的模型,并导出如下情形下学生消费支出的平均水平:(1) 来自欠发达农村地区的女生,未得到奖学金;(2) 来自欠发达城市地区的男生,得到奖学金;(3) 来自发达地区的农村女生,得到奖学金;(4) 来自发达地区的城市男生,未得到奖学金。
解答: 记学生月消费支出为Y,其家庭月收入水平为X,则在不考虑其他因素的影响时,有如下基本回归模型:Y i=β0+β1X i+μi有奖学金1 来自城市无奖学金0 来自农村来自发达地区 1 男性0 来自欠发达地区0 女性Y i=β0+β1X i+α1D1i+α2D2i+α3D3i+α4D4i+μi由此回归模型,可得如下各种情形下学生的平均消费支出:(1) 来自欠发达农村地区的女生,未得到奖学金时的月消费支出:E(Y i|= X i, D1i=D2i=D3i=D4i=0)=β0+β1X i(2) 来自欠发达城市地区的男生,得到奖学金时的月消费支出:E(Y i|= X i, D1i=D4i=1,D2i=D3i=0)=(β0+α1+α4)+β1X i(3) 来自发达地区的农村女生,得到奖学金时的月消费支出:E(Y i |= X i , D 1i =D 3i =1,D 2i =D 4i =0)=(β0+α1+α3)+β1X i (4) 来自发达地区的城市男生,未得到奖学金时的月消费支出: E(Y i |= X i ,D 2i =D 3i =D 4i =1, D 1i =0)= (β0+α2+α3+α4)+β1X i5. 研究进口消费品的数量Y 与国民收入X 的模型关系时,由数据散点图显示1979年前后Y 对X 的回归关系明显不同,进口消费函数发生了结构性变化:基本消费部分下降了,而边际消费倾向变大了。
一、实验背景与目的随着计量经济学的发展,虚拟变量(也称为指示变量)在数据分析中扮演着重要角色。
虚拟变量主要用于处理定性变量,将定性因素量化,以便于进行统计分析。
本实验旨在通过Eviews软件,掌握虚拟变量的基本原理,并运用虚拟变量构建模型,分析定性因素对定量变量的影响。
二、实验数据与模型设定实验数据来源于我国某地区某年度的居民消费数据,包括居民人均收入、消费支出、教育程度、是否为城市居民等变量。
根据研究目的,我们选取人均收入、消费支出和教育程度作为因变量,是否为城市居民作为虚拟变量。
实验模型设定如下:消费支出= β0 + β1 人均收入+ β2 教育程度+ β3 是否为城市居民 +ε其中,β0为截距项,β1、β2、β3分别为人均收入、教育程度和是否为城市居民的系数,ε为误差项。
三、实验步骤与结果分析1. 数据处理首先,将原始数据进行整理,删除缺失值和异常值。
然后,根据研究目的,将教育程度分为小学、初中、高中、大学及以上四个等级,并分别对应虚拟变量D1、D2、D3、D4。
是否为城市居民变量直接作为虚拟变量D5。
2. 模型估计利用Eviews软件,对上述模型进行最小二乘法(OLS)估计。
结果如下:消费支出 = 620.5 + 0.5 人均收入 + 0.4 教育程度 + 0.3 是否为城市居民3. 结果分析(1)截距项β0为620.5,表示当人均收入为0、教育程度为0、是否为城市居民为0时,消费支出的大致水平。
(2)人均收入的系数β1为0.5,表示在其他条件不变的情况下,人均收入每增加1元,消费支出将增加0.5元。
(3)教育程度的系数β2为0.4,表示在其他条件不变的情况下,教育程度每提高一个等级,消费支出将增加0.4元。
(4)是否为城市居民的系数β3为0.3,表示在其他条件不变的情况下,城市居民的消费支出比非城市居民高0.3元。
四、结论与展望通过本实验,我们掌握了虚拟变量的基本原理和建模方法,并成功分析了定性因素对消费支出的影响。
虚拟变量(dummy variable)在实际建模过程中,被解释变量不但受定量变量影响,同时还受定性变量影响。
例如需要考虑性别、民族、不同历史时期、季节差异、企业所有制性质不同等因素的影响。
这些因素也应该包括在模型中。
由于定性变量通常表示的是某种特征的有和无,所以量化方法可采用取值为1或0。
这种变量称作虚拟变量,用D表示。
虚拟变量应用于模型中,对其回归系数的估计与检验方法与定量变量相同。
1.截距移动设有模型,y= β0 + β1 x t + β2D + u t ,t其中y t,x t为定量变量;D为定性变量。
当D = 0 或1时,上述模型可表达为,β0 + β1x t + u t , (D = 0) y t D = 1 y t = β0+β2 D = 0(β0 + β2) + β1x t + u t , (D = 1) β0x t D = 1或0表示某种特征的有无。
反映在数学上是截距不同的两个函数。
若β显2著不为零,说明截距不同;若β2为零,说明这种分类无显著性差异。
例:中国成年人体重y(kg)与身高x(cm)的回归关系如下:–105 + x D = 1 (男)y = - 100 + x - 5D =– 100 + x D = 0 (女)注意:①若定性变量含有m个类别,应引入m-1个虚拟变量,否则会导致多重共线性,称作虚拟变量陷阱(dummy variable trap)。
②关于定性变量中的哪个类别取0,哪个类别取1,是任意的,不影响检验结果。
③定性变量中取值为0所对应的类别称作基础类别(base category)。
④对于多于两个类别的定性变量可采用设一个虚拟变量而对不同类别采取赋值不同的方法处理。
如:1 (大学)D = 0 (中学)-1 (小学)。
2.斜率变化以上只考虑定性变量影响截距,未考虑影响斜率,即回归系数的变化。
当需要考虑时,可建立如下模型:y= β0 + β1 x t + β2 D+ β3 x t D + u t ,t其中x t为定量变量;D为定性变量。
数学与统计学院实验报告院〔系〕:数学与统计学学院学号::实验课程:计量经济学指导教师:实验类型〔验证性、演示性、综合性、设计性〕:验证性实验时间:2017年 3 月29 日一、实验课题虚拟变量模型估计二、实验目的和意义1 建立财政支出模型表1给出了1952-2004年中国财政支出〔Fin〕的年度数据〔以1952年为基期,用消费价格指数进行平减后得数据〕。
试根据财政支出随时间变化的特征建立相应的模型。
表1obs Fin obs Fin obs Fin1952 1970 19881953 1971 19891954 1972 19901955 1973 691 19911956 1974 19921957 1975 19931958 1976 19941959 1977 19951960 1978 19961961 1979 19971962 1980 19981963 1981 19991964 1982 20001965 1983 20011966 1984 20021967 1985 20031968 1986 20041969 1987步骤提示:〔1〕做变量fin的散点图,观察规律,看在不同时期是否有结构性变化。
〔2〕建立时间变量t=1,2,…,做Fin关于t的线性回归模型,并对其做参数结构稳定性检验〔Chow检验或Chow预测检验〕〔建立变量t的方法是:t=@trend()+1〕〔3〕假设有结构性变化,建立虚拟变量,对模型进行回归。
假设要建立虚拟变量D1为〔这里的断点时间1996是我随意给定的,你可以根据实际情况进行调整〕0,〔1952-1996〕D1=1,〔1997-2004〕用EViews生成虚拟变量D1序列,采用的方法为:在工作文件窗口点击Quick/Generate Series,在弹出的由方程生成序列的窗口,输入D1=0,同时更改下面的样本范围为1952-1996,这时只生成了第一段〔1952-1996〕中的D1=0。
计量经济学实验报告实验三:虚拟变量模型姓名:班级:序号:学号:1. 问题描述:2009年我国各地区城镇居民和农村居民家庭人均可支配收入与人均生活消费支出之间的关系。
2. 理论模型:μββ++=110X Y3. 数据1.城镇居民:121i i y x ββμ=++Dependent Variable: Y Method: Least Squares Date: 12/26/11 Time: 14:15 Sample: 1 31Included observations: 31VariableCoefficient Std. Error t-Statistic Prob.X 0.668059 0.030926 21.60193 0.0000 C755.0114520.3031 1.4510990.1575R-squared0.941490 Mean dependent var 11628.97 Adjusted R-squared 0.939473 S.D. dependent var 2978.791 S.E. of regression 732.8515 Akaike info criterion 16.09410 Sum squared resid 15575067 Schwarz criterion 16.18662 Log likelihood -247.4586 F-statistic 466.6435 Durbin-Watson stat1.644234 Prob(F-statistic)0.000000所以,模型一为:x 66806.00114.755+=城镇Y (1.4511) (21.602)2. 农村居民:122i i y x ααμ=++Dependent Variable: Y Method: Least Squares Date: 12/26/11 Time: 14:15 Sample: 1 31Included observations: 31VariableCoefficient Std. Error t-Statistic Prob.X 0.692746 0.040826 16.96817 0.0000 C350.9498244.7179 1.4340990.1622R-squared0.908494 Mean dependent var 4170.339 Adjusted R-squared 0.905338 S.D. dependent var 1737.704 S.E. of regression 534.6414 Akaike info criterion 15.46341 Sum squared resid 8289402. Schwarz criterion 15.55593 Log likelihood -237.6829 F-statistic 287.9187 Durbin-Watson stat1.864618 Prob(F-statistic)0.000000所以,模型二为:x 6928.095.350+=农村Y (1.4341) (16.968)三、模型检验为比较居民和农村消费指数是否有显著差异,设虚拟变量:{10D ===城市居民农村居民并将两函数合并,估计以下模型:01134()i i i i i y x D D x ββββμ=++++ 其中,311ββα=-,422ββα=-,i i i i x D x D =•。