计量经济学经典eviews 离散和受限因变量模型
- 格式:doc
- 大小:92.50 KB
- 文档页数:3
如何用EViews进行计量经济学分析EViews是一个功能强大的计量经济学软件,广泛应用于经济学和金融学领域。
本文将介绍如何使用EViews进行计量经济学分析。
一、EViews的基本功能和特点EViews是一款广泛用于经济学分析的软件,具有以下几个特点:1. 数据管理:EViews可以方便地导入、处理和管理各种类型的数据,包括时间序列数据和截面数据。
2. 统计分析:EViews提供了丰富的统计分析和计量经济学方法,如描述统计、回归分析、时间序列分析等。
3. 模型建立:EViews支持各种经济模型的建立和估计,如线性回归模型、ARMA模型、VAR模型等。
4. 图表展示:EViews具有强大的图表绘制功能,可以帮助用户直观地展示数据和分析结果。
二、使用EViews进行计量经济学分析的步骤下面将以线性回归模型为例,介绍如何使用EViews进行计量经济学分析。
1. 导入数据首先,将需要分析的数据导入EViews。
通过点击"File"菜单,选择"Import",然后选择合适的数据文件类型进行导入。
2. 创建工作文件在导入数据后,可以创建一个新的工作文件,以便进行后续的分析和建模操作。
点击"File"菜单,选择"New",然后选择"Workfile"创建一个新的工作文件。
3. 创建方程在工作文件中,可以创建一个回归模型方程。
点击"Quick"菜单,选择"Estimate Equation",然后在弹出的对话框中输入回归方程的表达式和变量。
4. 估计模型在创建回归方程后,可以进行模型的估计。
点击"EViews"菜单,选择"Estimate Equation",然后选择适当的估计方法和设置。
5. 解释结果估计模型后,EViews将显示回归结果的详细报告。
第18章离散选择模型和受限因变量模型18.1概述在经典计量经济学模型中,被解释变量通常被假定为连续变量,但在现实的经济决策中经常面临许多选择问题。
在这样的决策问题中,或者选择问题中,人们必须对可供选择的方案作出选择。
通常被解释变量是连续的变量,但此时的因变量只取有限多个离散的值。
例如:人们对交通工具的选择,是选择坐轻轨、地铁还是公共汽车;某大型企业是否合并另一企业;对某一方案的建议持强烈反对、反对、中立、支持和强烈支持5种态度,可以分别用0,1,2,3和4表示。
以这样的选择结果作为被解释变量建立的计量经济学模型,称为离散被解释变量数据计量经济学模型(models with discrete dependent variables),或称为离散选择模型(DCM,discrete choice model)。
如果被解释变量只能有两种选择,称为二元选择模型(binary choice model);如果被解释变量有多种选择,称为多元选择模型(multiple choice model)。
20世纪70和80年代,离散选择模型普遍应用于经济布局、企业定点、交通问题、就业问题、购买决策等经济决策领域的研究。
在实际中,还会经常遇到因变量受到某种限制的情况,这种情况下,取得样本数据来自总体的一个子集,可能不能完全反映总体。
例如,小时工资、住房价格和名义利率都必须大于零。
这时需要建立的经济计量模型称为受限因变量模型(limited dependent variable model)。
这两类模型经常用于调查数据的分析中。
本章将讨论三类模型及其估计方法和软件操作。
一是定性(观测值为离散的或者表示排序);二是截取或者截断问题;三是观测值为整数值的计数模型。
18.2二元因变量模型在这个模型中,被解释变量只取两个值,可以是代表某件事发生与否的虚拟变量,也可以是两个决策中选一个,称为二元因变量模型。
例如:对样本个体是否就业的研究,个体的年龄、教育背景、种族、婚姻状况以及其他可观测的特征,作为解释变量,目的是研究个体这些特征对个体就业概率的研究。
离散和受限因变量模型前面所描述的回归方法要求能在连续和无限制的规模上观察到因变量。
然而,也经常出现违背上述条件的情形,即产生非连续或受限因变量。
我们将会识别三种类型的变量:1.定性(在离散或排序的规模上);2.审查或截断;3.整数估值(计数数据)。
在这章里我们讨论这几种定性和受限因变量模型的估计方法。
EViews提供了二元或排序(普罗比特probit、逻辑logit、威布尔gompit),审查或截断(托比特tobit等),和计数数据模型的估计程序。
§17.1二元因变量模型二元因变量模型(Binary Dependent Variable Models)估计方法主要发展与20世纪80年代初期。
普遍应用于经济布局、企业定点、交通问题、就业问题、购买决策领域的研究。
例如,公共交通工具和私人交通工具的选择问题。
选择利用公共交通工具还是私人交通工具,取决于两类因素:一类是诸如速度、耗费时间、成本等两种交通工具所具有的属性;一类是决策个体所具有的属性,诸如职业、年龄、收入水平、健康状况等。
从大量的统计中,可以发现选择结果与影响因素之间具有一定的因果关系。
研究这一关系对制定交通工具发展规划无疑是十分重要的。
在本节介绍的模型中,因变量只具有两个值:1或者0。
可能是代表某一事件出现的虚拟变量,或者是两种选择中的一种。
例如,可能是每个人(被雇佣或不被雇佣)雇用状况的模型,每一人在年龄、教育程度、种族、婚姻状况和其它可观测的特征方面存在差异,我们将其设为。
目标是将个体特征和被雇用的概率之间的关系量化。
假定一个二元因变量,具有0和1两个值。
对简单的线性回归是不合适的。
而且从简单的线性回归中得到的的拟合值也不局限于0和1之间。
替代地,我们采用一种设定用于处理二元因变量的特殊需要。
假定我们用以下模型刻画观察值为1的概率为:Pr这里是一个连续、严格单调递增的函数,它采用实际值并返回一个介于0和1之间的数。
函数的选择决定了二元模型的类型。
计量经济学4种常用模型计量经济学是经济学的一个重要分支,主要研究经济现象的数量关系及其解释。
在计量经济学中,常用的模型有四种,分别是线性回归模型、时间序列模型、面板数据模型和离散选择模型。
下面将对这四种模型进行详细介绍。
第一种模型是线性回归模型,也是计量经济学中最常用的模型之一。
线性回归模型是通过建立自变量与因变量之间的线性关系来解释经济现象的模型。
在线性回归模型中,自变量通常包括经济学理论认为与因变量相关的变量,通过最小二乘法估计模型参数,得到经济现象的解释。
线性回归模型的优点是简单易懂,计算方便,但其前提是自变量与因变量之间存在线性关系。
第二种模型是时间序列模型,它主要用于分析时间序列数据的模型。
时间序列模型假设经济现象的变化是随时间演变的,通过分析时间序列的趋势、周期性和随机性,可以对经济现象进行预测和解释。
时间序列模型的常用方法包括自回归移动平均模型(ARMA)、自回归条件异方差模型(ARCH)等。
时间序列模型的优点是能够捕捉到时间的动态变化,但其局限性是对数据的要求较高,需要足够的时间序列观测样本。
第三种模型是面板数据模型,也称为横截面时间序列数据模型。
面板数据模型是将横截面数据和时间序列数据结合起来进行分析的模型。
面板数据模型可以同时考虑个体间的差异和时间的变化,因此能够更全面地解释经济现象。
面板数据模型的常用方法包括固定效应模型、随机效应模型等。
面板数据模型的优点是能够控制个体间的异质性,但其需要对个体间的相关性进行假设。
第四种模型是离散选择模型,它主要用于分析离散选择行为的模型。
离散选择模型假设个体在面临多种选择时,会根据一定的规则进行选择,通过建立选择概率与个体特征之间的关系,可以预测和解释个体的选择行为。
离散选择模型的常用方法包括二项Logit模型、多项Logit模型等。
离散选择模型的优点是能够分析个体的选择行为,但其局限性是对选择行为的假设较强。
综上所述,计量经济学中常用的模型有线性回归模型、时间序列模型、面板数据模型和离散选择模型。
第18章 离散选择模型和受限因变量模型18.1概述在经典计量经济学模型中,被解释变量通常被假定为连续变量,但在现实的经济决策中经常面临许多选择问题。
在这样的决策问题中,或者选择问题中,人们必须对可供选择的方案作出选择。
通常被解释变量是连续的变量,但此时的因变量只取有限多个离散的值。
例如:人们对交通工具的选择,是选择坐轻轨、地铁还是公共汽车;某大型企业是否合并另一企业;对某一方案的建议持强烈反对、反对、中立、支持和强烈支持5种态度,可以分别用0,1,2,3和4表示。
以这样的选择结果作为被解释变量建立的计量经济学模型,称为离散被解释变量数据计量经济学模型(models with discrete dependent variables ),或称为离散选择模型(DCM ,discrete choice model )。
如果被解释变量只能有两种选择,称为二元选择模型(binary choice model );如果被解释变量有多种选择,称为多元选择模型(multiple choice model )。
20世纪70和80年代,离散选择模型普遍应用于经济布局、企业定点、交通问题、就业问题、购买决策等经济决策领域的研究。
在实际中,还会经常遇到因变量受到某种限制的情况,这种情况下,取得样本数据来自总体的一个子集,可能不能完全反映总体。
例如,小时工资、住房价格和名义利率都必须大于零。
这时需要建立的经济计量模型称为受限因变量模型(limited dependent variable model )。
这两类模型经常用于调查数据的分析中。
本章将讨论三类模型及其估计方法和软件操作。
一是定性(观测值为离散的或者表示排序);二是截取或者截断问题;三是观测值为整数值的计数模型。
18.2二元因变量模型在这个模型中,被解释变量只取两个值,可以是代表某件事发生与否的虚拟变量,也可以是两个决策中选一个,称为二元因变量模型。
例如:对样本个体是否就业的研究,个体的年龄、教育背景、种族、婚姻状况以及其他可观测的特征,作为解释变量,目的是研究个体这些特征对个体就业概率的研究。
居民消费水平与居民家庭课支配收入、CPI、税收及GDP之间关联度的实证分析姓名:司武俊班级:093物流一班学号:20093089013摘要在中国经济发展进程中,消费是伴随其发展的一个重要内容,伴随着经济增长的加快,消费形式的变化也越来越快,消费作为我国经济增长的三驾马车之一,起着不可替代的作用,只有把经济增长转变为依靠内容的增长,才能真正实现惠国惠民国策。
凯恩斯认为,短期影响个人消费的因素比较稳定,消费者的消费主要取决于收入的多少。
但是大家都知道,收入的变化并非影响消费的全部因素。
尤其,在短期内,有时边际消费倾向可以为负数,即收入增加时消费反而减少,收入减少时消费反而增加;有时边际消费倾向会大于1,即消费增加额大于收入增加额。
这些现象告诉我们,在日常生活中,除了收入,还有其他一些因素会影响消费行为。
本文利用1990年—2009的二十年数据,选取了居民可支配收入、CPI、税收、GDP四个因素分析对居民消费的影响,旨在说明其中的相互关系,为国家政策的制定与实施提供参考意见。
目录摘要·····················································一,引言·················································二,模型建设与参数估计···································三,假设检验··············································四,确定解释变量个数·····································五,结构稳定性检验·······································六,多重共线性的诊断及相应的补救措施·····················七,自相关诊断及相应的补救措施···························八,异方差诊断及相应的补救措施···························九,预测模型选择·········································十,小结·················································一,引言改革开放以来,我国居民收入与消费水平不断提高,居民消费结构升级和消费需求扩张成为我国经济高速增长的主要动力,特别是进入20世纪90年代以来,居民消费需求对国民经济发展的影响不断增大,对国民经济产生了拉动作用。
离散和受限因变量模型
前面所描述的回归方法要求能在连续和无限制的规模上观察到因变量。
然而,也经常出现违背上述条件的情形,即产生非连续或受限因变量。
我们将会识别三种类型的变量:
1.定性(在离散或排序的规模上);
2.审查或截断;
3.整数估值(计数数据)。
在这章里我们讨论这几种定性和受限因变量模型的估计方法。
EViews 提供了二元或排序(普罗比特probit 、逻辑logit 、威布尔gompit ),审查或截断(托比特tobit 等),和计数数据模型的估计程序。
§17.1 二元因变量模型
二元因变量模型(Binary Dependent V ariable Models )估计方法主要发展与20世纪80年代初期。
普遍应用于经济布局、企业定点、交通问题、就业问题、购买决策领域的研究。
例如,公共交通工具和私人交通工具的选择问题。
选择利用公共交通工具还是私人交通工具,取决于两类因素:一类是诸如速度、耗费时间、成本等两种交通工具所具有的属性;一类是决策个体所具有的属性,诸如职业、年龄、收入水平、健康状况等。
从大量的统计中,可以发现选择结果与影响因素之间具有一定的因果关系。
研究这一关系对制定交通工具发展规划无疑是十分重要的。
在本节介绍的模型中,因变量y 只具有两个值:1或者0。
y 可能是代表某一事件出现的虚拟变量,或者是两种选择中的一种。
例如,y 可能是每个人(被雇佣或不被雇佣)雇用状况的模型,每一人在年龄、教育程度、种族、婚姻状况和其它可观测的特征方面存在差异,我们将其设为x 。
目标是将个体特征和被雇用的概率之间的关系量化。
假定一个二元因变量y ,具有0和1两个值。
y 对x 简单的线性回归是不合适的。
而且从简单的线性回归中得到y 的的拟合值也不局限于0和1之间。
替代地,我们采用一种设定用于处理二元因变量的特殊需要。
假定我们用以下模型刻画观察值为1的概率为:
Pr )(1),1(ββi i i x F x y '--==
这里F 是一个连续、严格单调递增的函数,它采用实际值并返回一个介于0和1之间的数。
F 函数的选择决定了二元模型的类型。
可以得到
Pr )(),0(ββi i i x F x y '-==
给出了这样的设定以后,我们能用极大似然估计方法估计模型的参数。
极大似然函数为 ∑=--+'--==n i i i i i x F y x F y
L 0))(log )1())(1log(()(log )(ββββ
极大似然函数的一阶条件是非线性的,所以得到参数估计需要一种迭代的解决方法。
缺省地,EViews 使用二阶导数用于参数估计的协方差矩阵的迭代和计算。
有两种对这种设定的重要的可选择的解释。
首先,二元变量经常作为一种潜在的变量规定被生成。
假定有一个未被观察到的潜在变量*i y ,它与x 是线性相关的:
i i i u x y +'=β*
这里i u 是随机扰动。
然后被观察的因变量由*i y 是否超过临界值来决定
⎪⎩⎪⎨⎧≤>=000
1*
*i i i y if y if y
为了估计一个二元因变量模型,从主菜单中选择Object/New Object/Equation 选项。
从Equation
Specification 对话框中,选择Binary estimation method 。
EViews 既允许你计算拟合概率,)ˆ(1ˆβx F p
'--=,也可以计算指标β
ˆx '的拟合值或预测值。
§17.2 排序因变量模型
在实际经济生活中,经常会遇到多元离散选择问题。
例如,一类问题是将选择对象按照某个准则排队,由决策者从中选择,称为排序因变量模型(Ordered Dependent V ariable Models)。
在排序因变量模型中,被观察的y 指出了代表排序或排列的种类的结果。
例如,我们可以观察选择处于四种教育结果之一的个体:低于高中、高中、大学、高级学位。
或者我们也可以观察被雇用、半退休、全退休的个体。
或者是选举问题,选举哪一个候选人。
如同在二元因变量模型中,我们可以通过考虑线性地依赖于解释变量x 的潜在变量*i y 模仿被观察的反应。
εβ+'=i i x y *
这里ε是一个独立的,分布可识别的随机变量。
被观察的i y 由*i y 根据以下规则确定:
⎪⎪⎩⎪⎪⎨⎧<≤<≤=*
2*11*10i M i i i y if M y if y if y γγγγ i γ是临界值。
M 是分类的个数。
为了估计这个模型,从Equation Specification 对话框,选择估计方法Ordered 。
§17.3 检查回归模型
受限被解释变量(Limited dependent variable )指被解释变量的观测值是连续的,但是受到某种限制,得到的观测值并不反映被解释变量的实际状态。
例如在一些环境中,只能部分地观察到因变量。
在调查数据中,在特定水平之上的收入数据经常被编成密码以保护其机密性。
这类问题经常出现在“检查”、“调查”活动中,因此也称为“检查(Censored Regression Models)。
例如,以居民对某一种商品的需求量为解释变量,建立需求函数模型。
需求量的观测值是无法得到的,一般用实际购买量作为需求量的观测值。
如果这种商品是限量购买的,正象我国过去长期所实行的那样,比如每户最多只能购买100,那么得到的观测值将处于0与100之间,而且会有相当比例的观测值为100。
对于购买量小于100的个体,有理由认为这个购买量代表了他的需求;但是对于购买量等于100的个体,他的需求量很可能是大于100,所以这个购买量并不代表了他的需求量。
也就是说,凡是实际需求量大于100的,都用100作为样本观测值,等于是将大于100的观测值作了归并。
这类问题在微观经济活动调查中普遍存在。
从这样的样本数据出发,如果采用经典的方法估计模型,显然是不合适的。
EViews 提供了工具用于完成这些模型的最大似然估计,并将这些结果用于进一步分析。
考虑下面的潜在变量回归模型
σεβ+'=i i x y *,
这里σ是一个比例参数。
注意同二元因变量模型相比,比例参数σ被识别出来,并将同β一起被估
计。
在规范的检查回归模型中,被称作tobit ,被观察的数据y 由下式给出:
⎪⎩⎪⎨⎧>≤=00
0*
**i i i y if y y if y
换句话说,*i y 的所有负值被定义为0值。
我们称这些数据在0处进行了左归并(left censored )。
更一般地,Eviews 允许在任意有限点上的左边和右边截取(归并),所以
⎪⎩⎪⎨⎧≤<<≤=****i i i
i i i i i i i i y c if c c y c if y c y if c y 这里i c ,i c 是代表归并点的固定数值。
为估计此模型,从Equation Specification 对话框,选择Censored
估计方法。
§17.4 截断回归模型
截断回归模型(Truncated Regression Models )也是受限因变量模型的一种。
截断问题,即“掐头”或“去尾”。
即不能从全部个体,而只能从一部分个体中随机抽取因变量的样本观测值,而这部分个体的观测值都大于或者小于某个确定值。
例如,用居民收入为因变量建立居民收入模型。
从理论上讲,居民收入样本数据应该从0到无穷大,但是由于客观条件所限,只能在收入处于某一数值以上或者某一数值以下的个体中取得样本观测值。
当因变量小于一个临界值或大于另一个临界值,观察值都无法观察到。
一般的两个有限点的截断回归模型可以表示如下:
i i i x y εβ+'=
i i i i c x c <+'<εβ。
如果没有较低的截断点,那么我们将设-∞=i c 。
如果没有较高的截断点,那么我们将设∞=i c 。
为估计此模型,从Equation Specification 对话框,选择Censored 估计方法。
再选择Truncated sample 选项估计截断模型。
§17.5 计数模型
当y 取代表事件发生次数的整数值时,使用计数模型(Count Models)。
例如,一个公司提出申请的专利的数目,和在一个固定的时间间隔内经历的失业人数段的数目。
Eviews 提供了对于计数数据的几个模型估计的支持。
除了标准泊松和负的二项式的极大似然(ML )设定,Eviews 为计数数据提供了大量的准极大似然(QML )的估计量。
为估计此模型,从Equation Specification 对话框,选择Count 估计方法,在对话框中键入因变量和解释变量回归项,必须通过列表指定模型,然后选择一种计数模型的类型,如果需要的话,设置Option 选项项。