模型中的特殊解释变量(虚拟变量)08经济
- 格式:ppt
- 大小:890.50 KB
- 文档页数:16
虚拟变量在金融和经济中的作用摘要在现代经济计量分析中,利用模型进行回归分析是应用比较广泛的一种数量分析技术。
一般回归分析中变量都是定量变量,这是因为模拟回归需要样本数据。
但实际中有时模型仅考虑定量变量是不够的。
因为经济现象不仅受一些定量因素的影响,还可能受到一些定性因素的影响。
比如,不同时期的不同政策、战争、自然灾害等非常时期,人的不同性别、文化程度、婚姻状况等。
如果某一应变量的确存在这种定性影响,那么仅用定量变量对被解释变量进行解释显然是不够的,利用虚拟变量技术可以解决此类问题。
所谓虚拟变量技术就是把定性变量虚拟化,并把它作为解释变量或者是自变量纳入回归模型的一种方法。
在这里,定性变量就是虚拟化的变量,即虚拟变量。
一般可根据定性因素的二分特性进行人工赋值,即0和1,其中“1”表示具备某种属性或受到某种因素影响,而“0”则表示不受某种因素影响或不具备某种属性。
定性变量虚拟化后就可以纳入回归模型,从而进行模拟分析或预测。
一.虚拟变量模型的性质与方法1. 为了区分两个类别,只引入一个虚拟变量Di。
一般规则是:如果一个定性变量有m个属性值,则仅引入m-1个虚拟变量。
2. 虚拟变量0,1值的分配可以是任意的,但解释模型时一定注意1,0是怎样分配的。
3. 被分配0的类别或级别通常被用于比较的基础。
4. 虚拟变量的系数可以称为级差截距系数,表明取值1的类别截距项与基底类的截距项的差距虚拟的通常使用方法是,对一些通常表明“品质”或“属性”是否存在的属性变量,将其量化,给其赋值为“1”或“0”来表示虚拟变量出现某种属性和未出现某种属性。
设某个回归模型含有p个数量变量和一个品质变量,该品质变量可以有k+1个(k≥1)水平,据此,可建立以下回归模型:其中x i,p+1 ,…x i,p+k为k个引入的虚拟变量,并且需要拟合的回归方程为通常情况下,该方程能较好地通过线性性检验,弥补仅用数量变量拟合的不足。
二.虚拟变量的其他使用方法除此之外,虚拟变量也有一些其他的使用方法,例如将虚拟变量出现某种属性赋值为任意常数“a”,未出现某种属性赋值为“0”,并验证这种赋值方式,所得到的参数估计值是赋值“1”或“0”时的1/a,预测结果相一致。
第八章虚拟变量模型1. 回归模型中引入虚拟变量的作用是什么?答:在模型中引入虚拟变量,主要是为了寻找某(些)定性因素对解释变量的影响。
加法方式与乘法方式是最主要的引入方式,前者主要适用于定性因素对截距项产生影响的情况,后者主要适用于定性因素对斜率项产生影响的情况。
除此外,还可以加法与乘法组合的方式引入虚拟变量,这时可测度定性因素对截距项与斜率项同时产生影响的情况。
2. 虚拟变量有哪几种基本的引入方式? 它们各适用于什么情况?答:在模型中引入虚拟变量的主要方式有加法方式与乘法方式,前者主要适用于定性因素对截距项产生影响的情况,后者主要适用于定性因素对斜率项产生影响的情况。
除此外,还可以加法与乘法组合的方式引入虚拟变量,这时可测度定性因素对截距项与斜率项同时产生影响的情况。
3.什么是虚拟变量陷阱?答:根据虚拟变量的设置原则,一般情况下,如果定性变量有m个类别,则需在模型中引入m-1个变量。
如果引入了m个变量,就会导致模型解释变量出现完全的共线性问题,从而导致模型无法估计。
这种由于引入虚拟变量个数与类别个数相等导致的模型无法估计的问题,称为“虚拟变量陷阱”。
4.在一项对北京某大学学生月消费支出的研究中,认为学生的消费支出除受其家庭的每月收入水平外,还受在学校中是否得到奖学金,来自农村还是城市,是经济发达地区还是欠发达地区,以及性别等因素的影响。
试设定适当的模型,并导出如下情形下学生消费支出的平均水平:(1) 来自欠发达农村地区的女生,未得到奖学金;(2) 来自欠发达城市地区的男生,得到奖学金;(3) 来自发达地区的农村女生,得到奖学金;(4) 来自发达地区的城市男生,未得到奖学金。
解答: 记学生月消费支出为Y,其家庭月收入水平为X,则在不考虑其他因素的影响时,有如下基本回归模型:Y i=β0+β1X i+μi有奖学金1 来自城市无奖学金0 来自农村来自发达地区 1 男性0 来自欠发达地区0 女性Y i=β0+β1X i+α1D1i+α2D2i+α3D3i+α4D4i+μi由此回归模型,可得如下各种情形下学生的平均消费支出:(1) 来自欠发达农村地区的女生,未得到奖学金时的月消费支出:E(Y i|= X i, D1i=D2i=D3i=D4i=0)=β0+β1X i(2) 来自欠发达城市地区的男生,得到奖学金时的月消费支出:E(Y i|= X i, D1i=D4i=1,D2i=D3i=0)=(β0+α1+α4)+β1X i(3) 来自发达地区的农村女生,得到奖学金时的月消费支出:E(Y i |= X i , D 1i =D 3i =1,D 2i =D 4i =0)=(β0+α1+α3)+β1X i (4) 来自发达地区的城市男生,未得到奖学金时的月消费支出: E(Y i |= X i ,D 2i =D 3i =D 4i =1, D 1i =0)= (β0+α2+α3+α4)+β1X i5. 研究进口消费品的数量Y 与国民收入X 的模型关系时,由数据散点图显示1979年前后Y 对X 的回归关系明显不同,进口消费函数发生了结构性变化:基本消费部分下降了,而边际消费倾向变大了。
第一章绪论一、填空题:1.计量经济学是以揭示经济活动中客观存在的__________为内容的分支学科,挪威经济学家弗里希,将计量经济学定义为__________、__________、__________三者的结合。
数量关系、经济理论、统计学、数学2.数理经济模型揭示经济活动中各个因素之间的__________关系,用__________性的数学方程加以描述,计量经济模型揭示经济活动中各因素之间的__________关系,用__________性的数学方程加以描述。
理论、确定、定量、随机3.经济数学模型是用__________描述经济活动。
数学方法4.计量经济学根据研究对象和内容侧重面不同,可以分为__________计量经济学和__________计量经济学。
理论、应用5.计量经济学模型包括__________和__________两大类。
单方程模型、联立方程模型6.建模过程中理论模型的设计主要包括三部分工作,即__________、____________________、____________________。
选择变量,确定变量之间的数学关系,拟定模型中待估计参数的数值范围7.确定理论模型中所包含的变量,主要指确定__________。
解释变量8.可以作为解释变量的几类变量有__________变量、__________变量、__________变量和__________变量。
外生经济,外生条件,外生政策,滞后被解释9.选择模型数学形式的主要依据是__________。
经济行为理论10.研究经济问题时,一般要处理三种类型的数据:__________数据、__________数据和__________数据。
时间序列,横截面,虚变量11.样本数据的质量包括四个方面__________、__________、__________、__________。
完整性,准确性,可比性,一致性12.模型参数的估计包括__________、__________和软件的应用等内容。
第一章导论1、截面数据:截面数据是许多不同的观察对象在同一时间点上的取值的统计数据集合,可理解为对一个随机变量重复抽样获得的数据。
2、时间序列数据:时间序列数据是同一观察对象在不同时间点上的取值的统计序列,可理解为随时间变化而生成的数据。
3、虚变量数据:虚拟变量数据是人为设定的虚拟变量的取值。
是表征政策、条件等影响研究对象的定性因素的人工变量,其取值一般只取“0”或“1”。
4、内生变量与外生变量:。
内生变量是由模型系统决定同时可能也对模型系统产生影响的变量,是具有某种概率分布的随机变量,外生变量是不由模型系统决定但对模型系统产生影响的变量,是确定性的变量。
第二章一元线性回归模型1、总体回归函数:是指在给定X i下Y分布的总体均值与X i所形成的函数关系(或者说将总体被解释变量的条件期望表示为解释变量的某种函数)2、最大似然估计法(ML): 又叫最大或然法,指用产生该样本概率最大的原则去确定样本回归函数的方法。
3、OLS估计法:指根据使估计的剩余平方和最小的原则来确定样本回归函数的方法。
4、残差平方和:用RSS表示,用以度量实际值与拟合值之间的差异,是由除解释变量之外的其他因素引起的被解释变量变化的部分。
5、拟合优度检验:指检验模型对样本观测值的拟合程度,用表示,该值越接近1表示拟合程度越好。
第三章多元线性回归模型1、多元线性回归模型:在现实经济活动中往往存在一个变量受到其他多个变量影响的现象,表现在线性回归模型中有多个解释变量,这样的模型被称做多元线性回归模型,多元是指多个解释变量2、调整的可决系数:又叫调整的决定系数,是一个用于描述多个解释变量对被解释变量的联合影响程度的统计量,克服了随解释变量的增加而增大的缺陷,与的关系为。
3、偏回归系数:在多元回归模型中,每一个解释变量前的参数即为偏回归系数,它测度了当其他解释变量保持不变时,该变量增加1单位对被解释变量带来的平均影响程度。
4、正规方程组:采用OLS方法估计线性回归模型时,对残差平方和关于各参数求偏导,并令偏导数为0后得到的方程组,其矩阵形式为。