Tobit模型估计方法与应用(二)
- 格式:doc
- 大小:1.85 MB
- 文档页数:22
tobit法-回复[tobit法],以中括号内的内容为主题,写一篇1500-2000字文章,一步一步回答Tobit法是一种统计分析方法,常用于处理有截断部分的数据。
本文将逐步介绍和解释Tobit法的原理、应用和实施步骤。
第一步:原理Tobit法源自经济学家James Tobin的研究,用于处理因变量存在下界截断或上界截断的情况。
例如,当我们研究家庭的支出时,支出金额不能低于零,即存在下界截断。
同样地,当我们研究收入时,上界截断可能对于高收入家庭是存在的。
Tobit法就是用来处理这样的数据,以便可以正确估计模型和变量的影响。
第二步:应用Tobit法广泛应用于经济学、市场研究、社会科学等领域。
它可以用来分析食品支出、医疗费用、教育支出等非负连续变量,并可以在样本中避免出现负值或高度集中在上界的情况。
Tobit法还可用于分析等级数据、时效数据和半定量数据。
第三步:实施步骤1. 数据准备:首先,收集有关因变量、自变量和截断值的数据。
确保数据没有错误和缺失,并检查是否存在截断现象。
2. 模型选择:根据研究目的和数据性质,选择适当的Tobit模型。
有两种常见的Tobit模型,一种是左截断模型,另一种是右截断模型。
左截断模型用于处理因变量有下界截断的数据,右截断模型用于处理因变量有上界截断的数据。
3. 估计参数:使用最大似然估计或贝叶斯估计方法,估计Tobit模型中的参数。
最大似然估计法是最常用的方法,它可以基于样本数据找到最可能的参数估计值。
4. 解释结果:解释Tobit模型的结果,包括变量的显著性、符号、影响方向等。
通常来说,显著性水平低于0.05的变量被认为是显著的。
第四步:实例分析为了更好地理解Tobit法的应用和实施步骤,我们举个例子。
假设我们研究某个地区家庭的购物支出,并且存在下界截断。
我们收集了100个家庭的数据,其中包括家庭购物支出、家庭收入、家庭规模等变量。
首先,我们检查数据,确认购物支出没有负值。
[Tobit模型估计方法与应用的关系]模型估计人们为了纪念Tobin对这类模型的贡献,把被解释变量取值有限制、存在选择行为的这类模型称之为Tobit模型。
这类模型实际上包含两种方程,一种是反映选择问题的离散数据模型;一种是受限制的连续变量模型。
第二种模型往往是文献中人们更感兴趣的部分。
本文试图从一些经典文献著作的简单介绍中,向有兴趣用这个方法分析这类问题的研究者们提供一个参考,为做实证分析的研究者们提供一个分析此类问题的方法。
本文的结构安排如下:第二部分介绍Tobit模型的分类与结构,概括了Tobit模型的特点以及其与两部模型的区别,按照不同的特征对Tobit模型进行了分类。
第三部分介绍Tobit模型的估计与应用,按照Tobit模型的特征从三个方面介绍了每种模型的估计:一是关于非联立方程的Tobit模型估计;二是关于联立方程的Tobit模型的估计,这两类文献的估计方法主要是针对截面数据或者时间序列数据;三是关于面板Tobit模型的估计。
第四部分是简要的结论,指出Tobit模型的发展方向。
二、Tobit模型:概念与分类Tobit模型也称为样本选择模型、受限因变量模型,是因变量满足某种约束条件下取值的模型。
这种模型的特点在于模型包含两个部分,一是表示约束条件的选择方程模型;一种是满足约束条件下的某连续变量方程模型。
研究感兴趣的往往是受限制的连续变量方程模型,但是由于因变量受到某种约束条件的制约,忽略某些不可度量(即:不是观测值,而是通过模型计算得到的变量)的因素将导致受限因变量模型产生样本选择性偏差。
两部模型(two-partmodel)与Tobit模型有很大的相似之处,也是研究受限因变量问题的模型;但是这两种模型在模型结构形式、估计方法、假设条件等方面也存在一定的区别。
Tobit模型的估计方法与模型结构形式有密切关系,不同类型的模型估计方法存在较大的差异,本文按照三种属性特征对Tobit模型进行了分类。
Tobit模型估计方法与应用一、本文概述本文旨在全面探讨Tobit模型估计方法及其应用。
Tobit模型,也称为截取回归模型或受限因变量模型,是一种广泛应用于经济学、社会学、生物医学等领域的统计模型。
该模型主要处理因变量在某一范围内被截取或受限的情况,例如,当因变量只能取正值或只能在某一特定区间内变动时。
本文首先将对Tobit模型的基本理论进行阐述,包括模型的设定、参数的估计方法以及模型的检验等方面。
随后,文章将详细介绍Tobit模型在各个领域中的应用案例,包括工资水平、耐用消费品需求、医疗支出等方面的研究。
通过这些案例,我们将展示Tobit模型在处理受限因变量问题时的独特优势和应用价值。
文章还将对Tobit模型的发展趋势和前景进行展望,以期为相关领域的研究提供有益的参考和启示。
二、Tobit模型的基本原理Tobit模型,也称为受限因变量模型或截取回归模型,是一种广泛应用于经济学、社会学、生物医学等领域的统计模型。
该模型主要处理因变量受到某种限制或截取的情况,例如因变量只能取正值、只能在某个区间内取值等。
Tobit模型的基本原理基于最大似然估计法,通过构建似然函数来估计模型的参数。
截取机制:在Tobit模型中,因变量的取值受到某种截取机制的限制。
这种截取机制可以是左截取、右截取或双侧截取。
左截取意味着因变量只能取大于某个阈值的值,右截取则意味着因变量只能取小于某个阈值的值,而双侧截取则限制了因变量的取值范围在两个阈值之间。
潜在变量:在Tobit模型中,通常假设存在一个潜在变量(latent variable),它是没有受到截取限制的因变量。
潜在变量与观察到的因变量之间的关系由截取机制决定。
潜在变量通常假设服从某种分布,如正态分布。
最大似然估计:在给定截取机制和潜在变量分布的假设下,可以通过构建似然函数来估计Tobit模型的参数。
似然函数反映了观察到的数据与模型参数之间的匹配程度。
通过最大化似然函数,可以得到模型参数的估计值。
首先对面板数据进行声明:前面是截面单元,后面是时间标识:tsset company yeartsset industry year产生新的变量:gen newvar=human*lnrd产生滞后变量Gen fiscal(2)=L2.fiscal产生差分变量Gen fiscal(D)=D.fiscal描述性统计:xtdes :对Panel Data截面个数、时间跨度的整体描述Xtsum:分组内、组间和样本整体计算各个变量的基本统计量xttab 采用列表的方式显示某个变量的分布Stata中用于估计面板模型的主要命令:xtregxtreg depvar [varlist] [if exp] , model_type [level(#) ]Model type 模型be Between-effects estimatorfe Fixed-effects estimatorre GLS Random-effects estimatorpa GEE population-averaged estimatormle Maximum-likelihood Random-effects estimator主要估计方法:xtreg:Fixed-, between- and random-effects, and population-averaged linear modelsxtregar:Fixed- and random-effects linear models with an AR(1) disturbance xtpcse :OLS or Prais-Winsten models with panel-corrected standard errors xtrchh :Hildreth-Houck random coefficients modelsxtivreg :Instrumental variables and two-stage least squares for panel-data modelsxtabond:Arellano-Bond linear, dynamic panel data estimatorxttobit :Random-effects tobit modelsxtlogit :Fixed-effects, random-effects, population-averaged logit models xtprobit :Random-effects and population-averaged probit modelsxtfrontier :Stochastic frontier models for panel-dataxtrc gdp invest culture edu sci health social admin,betaxtreg命令的应用:声明面板数据类型:tsset sheng t描述性统计:xtsum gdp invest sci admin1.固定效应模型估计:xtreg gdp invest culture sci health admin techno,fe固定效应模型中个体效应和随机干扰项的方差估计值(分别为sigma u 和sigma e),二者之间的相关关系(rho)最后一行给出了检验固定效应是否显著的F 统计量和相应的P 值2.随机效应模型估计:xtreg gdp invest culture sci health admin techno,re检验随机效应模型是否优于混合OLS 模型:在进行随机效应回归之后,使用xttest0检验得到的P 值为0.0000,表明随机效应模型优于混合OLS 模型3. 最大似然估计Ml:xtreg gdp invest culture sci health admin techno,mleHausman检验Hausman检验究竟选择固定效应模型还是随机效应模型:第一步:估计固定效应模型,存储结果xtreg gdp invest culture sci health admin techno,feest store fe第二步:估计随机效应模型,存储结果xtreg gdp invest culture sci health admin techno,reest store re第三步:进行hausman检验hausman feHausman检验量为:H=(b-B)´[Var(b)-Var(B)]-1(b-B)~x2(k)Hausman统计量服从自由度为k的χ2分布。
stata tobit最大似然估计法摘要:一、引言- 介绍Stata 软件- 介绍Tobit 模型- 介绍最大似然估计法二、Stata 中Tobit 模型的最大似然估计- Tobit 模型的基本形式- 使用Stata 进行Tobit 模型的最大似然估计- 结果解读三、实例分析- 数据介绍- Tobit 模型的假设检验- 结果分析四、总结- 最大似然估计法在Tobit 模型中的应用- 需要注意的问题正文:一、引言Stata 是一款广泛应用于统计分析、计量经济学、社会学、医学等领域的高效、易用的软件。
Tobit 模型是一种常用的计量经济学模型,用于分析censored 数据,即因变量观测值被限制在一定范围内的数据。
最大似然估计法是一种参数估计方法,它通过最大化似然函数来估计参数。
在Stata 中,我们可以使用最大似然估计法来估计Tobit 模型的参数。
二、Stata 中Tobit 模型的最大似然估计Tobit 模型的基本形式如下:$ln(Y_{i}) = alpha + beta X_{i} + gamma Z_{i} + delta I(X_{i} geq 0) + epsilon_{i}$其中,$Y_{i}$表示因变量,$X_{i}$表示自变量,$Z_{i}$表示其他控制变量,$I(X_{i} geq 0)$表示$X_{i}$的非负限制,$epsilon_{i}$表示误差项。
使用Stata 进行Tobit 模型的最大似然估计,可以通过以下步骤完成:1.导入数据:use "your data", clear2.指定模型:tobit y x1 x2 x3, absorb(x4 x5)3.估计模型:ml在上述命令中,y 表示因变量,x1、x2、x3 表示自变量,x4、x5 表示其他控制变量。
absorb 命令用于指定固定效应,ml 命令用于进行最大似然估计。
结果解读:Stata 会输出Tobit 模型的估计结果,包括参数估计值、标准误差、z 统计量、p 值等。
Tobit模型估计方法与应用(二)周华林李雪松2012-10-25 10:12:04 来源:《经济学动态》(京)2012年5期第105~119页三、Tobit模型的估计Ⅰ:非联立方程模型1.Tobit模型的MLE。
1974年之前的文献对Tobit模型的估计都是采用了MLE,这种方法的特点是估计过程比较复杂,计算相当繁琐,而且需要选择一个合理的初始值,但是用这种方法估计出来的结果具有较好的性质,估计值的有效性较好。
Tobin(1958)采用MLE,并给出选择初始值的方法,Heckman(1974)将Tobit模型扩展成联立(simultaneous)系统方程,沿袭了Tobin(1958)及Gronau(1974)的MLE。
Tobin(1958)关注了被解释变量有下限、上限或者存在极限值这类问题的研究,后来人们把具有这种特征的问题研究的模型称为Tobit模型。
Tobin认为受限因变量的重点主要有两个方面,一是受限因变量和别的变量之间的关系,另一是这种关系的假设检验问题。
在这样的问题的研究中,解释变量不仅影响受限变量的概率,也影响非受限因变量的规模大小。
对于这类问题,如果不考虑非受限因变量的解释,而是只考虑受限因变量或是非受限因变量的概率问题,那么Probit分析就能提供一个合适的统计模型;如果不关注观测值的限制性,只是要解释某些变量,多元回归分析也是一种合适的统计技术。
不过,当因变量的信息是有用的时候,丢失这些信息显然会使得研究丧失效率。
Tobin以不同家庭的不同行为选择问题为例,建立了如下受限因变量模型。
假设W是受限因变量,具有下限L:根据一阶条件公式,带入初始值运用牛顿迭代法计算,这就是著名的“得分法”,迭代直到Δa的值的变化非常小时,得到的估计值就是受限因变量模型的估计值。
Tobin选择的初始值是函数-Z(x)/Q(x)的线性近似值,也可以说是lnQ(x)的二次方程的近似值。
为了研究这类模型的特点,Tobin用1952年和1953年的数据对耐用品的支出问题进行了分析,目的是探求耐用品支出与年龄及流动性资产持有之间的关系。
2.Tobit模型的Heckman两步法估计。
1974年以后对Tobit模型的估计方法不再以MLE为核心进行突破,而是对Heckman两步法不断扩充和改进,主要是因为Heckman两步法计算比较简单,而且估计的结果是一致的,也无须考虑初值的问题。
但是两步法的估计效率不如MLE,且这种估计方法要求两个方程的解释变量不能完全相同。
Heckman(1976)介绍了两步法的推导过程,并证明了两步法的估计性质,以及应用两步法需要注意的问题。
Amemiya(1974)将Tobit模型扩展到多变量模型,推导了模型估计方法。
Heckman(1976)对样本选择、截断、受限因变量等统计模型做了一个概括性的分析,扩展了Gronau(1974)和Lewis(1974)等的研究成果,证明了文中所提到的估计方法的应用环境、估计值的性质等。
Heckman指出审查(censored)数据模型和截断(truncated)的区别在于截断数据不能使用有用的数据估计有完整数据的观测值的概率,但是审查数据可以。
受限因变量模型需要考虑选择性偏差的影响,样本选择性偏差问题的研究最初起源于Gronau(1974)和Lewis(1974)关于工资选择偏差问题的研究,把未出现在工资方程中的额外的变量引起的工资率的变化称为选择性偏差。
如劳动工资方程中,婚姻状态、小孩数量等虽然不是工资率的直接解释变量,但这些因素影响了工作选择的决定,因而通过限制性条件的方式对受限变量产生了选择性偏差。
在实证部分Heckman用美国33-44岁女性的纵向(longitudinal)调查数据研究了女性工资率及工作时间的问题。
Amemiya(1974)将截断(truncated)因变量的单方程回归模型扩展到多变量方程模型和联立方程模型,提出了一个简单的可计算的一致估计法。
对这类模型的研究主要集中于三个方面:一是参数值及协方差的估计;二是考虑估计值的一致性及有效性;三是渐进分布的推导用于对估计值进行假设检验。
对于多变量回归方程模型,假设n维随机变量:Amemiya为了解决上述三个核心问题,对多变量回归模型作了如下假设:假设1:参数空间是紧致的并且是一个具有真实值的开邻域。
四、Tobit模型的估计Ⅱ:联立方程模型联立方程Tobit模型估计方法与非联立Tobit模型有较大的区别。
这种模型估计涉及到两个问题,一是如何判断所建立的方程是否是联立方程的问题。
Lee(1978)明确提出了检验的方法。
二是如何估计模型的问题,以往研究文献提出了不同的估计方法,总体上来说这些估计方法都是将联立方程估计方法与Heckman两步法估计方法结合的结果,但是各文献中具体估计方法之间是存在差异的。
Amemiya(1978)建立了多变量联立方程模型,模型基本结构如下:与以往的受限因变量联立方程模型不同,Amemiya的模型中考虑了只有部分因变量受限的联立方程模型的估计方法、估计性质以及识别条件的问题。
Amemiya指出要识别结构式模型,需要作如下几点假设:假设5:Γ的每个主子式最小值是正的。
Amemiya(1979)认为FMLE(完全极大似然法)求解Tobit模型太耗成本而且估计结果往往是最不可行的。
Amemiya提出了求解联立方程Tobit模型的一致性估计值的广义最小二乘法(GLS)方法。
作者在文中主要比较了普通最小二乘值、Nelson & Olson(1977)估计值、广义最小二乘估计值、Heckman估计值等几种估计值的方法以及估计值的效率的问题。
Nelson & Olson(1977)的联立方程模型的基本结构如下:当审查或者截断的两方程模型含有内生变量时,这种模型就具备了一般联立方程模型的特征,文中计算估计值以及渐进方差、协方差很直接,但是渐进方差、协方差的计算难度随着方程个数的增加而增加。
对于联立方程Tobit模型,先计算简化式再计算结构式得到的参数估计值,比间接最小二乘估计法得到的估计值更有效。
Lee(1976)主要关注了受限因变量模型的两阶段估计的问题,论文主要围绕着两个问题展开分析:一是寻找一致的初始估计值的问题;另一个问题是寻找估计模型的更简单一些的估计方法。
Lee提出用工具变量法估计模型,用全部样本代替子样本估计模型,这个方法在简单的受限因变量模型中一方面可以获得好的一致的初始值,计算也比较简单,但是如果是复杂模型,该方法的计算量将非常大。
包含内生变量的迭代模型与非市场均衡模型是转换回归模型的一种,Lee建议对后四种模型采用两阶段估计法。
具有联立结构的转换回归模型假定转换取决于潜在条件:可以实现样本分割。
因变量是截断数据的多变量联立方程模型的估计方法,与Amemiya(1974)的间接最小二乘估计法不同,对每种类型模型采用两阶段最小二乘法进行估计,计算比较方便,也容易解决模型的过度识别问题,模型的识别条件沿用了Amemiya(1974)中的结论。
Lee将这一方法用于分析工资率的问题,比较了两阶段最小二乘法与间接最小二乘法,发现用修正后的OLS估计简化式方程的两阶段最小二乘法得到的估计值,比较恰当地反映了各影响因素对受限因变量的作用。
Lee(1978)研究了受限变量模型估计在住房需求中的应用问题,这篇文章的主要目的有两个:一是推荐一个获得某类受限变量模型的较好的初始估计值的方法,另一个是证明这种模型和估计技术如何被用于研究住房需求问题。
在实证部分,Lee(1978)将需求面的参与主体分成租房者和买房者两大类,分析中低收入者住房需求问题。
政府对公共住房的政策分两个方面,公共住房及FHA补贴的贷款是对供给面的调控,住房补贴及转移支付是对需求面调控。
中低收入者住房需求问题的分析要研究的实际上是两个问题,第一个问题是购买或是租住的选择问题,第二个问题是支出多少的问题,对这类问题分析的关键在于确定模型是联立方程还是非联立方程,并选择恰当的估计方法。
Lee(1978)用购房支出量、租房支出量、选择买房还是租房作为因变量,以家庭支柱者(年龄、种族、性别)、家庭背景(移动、家庭持久收入、家庭规模)、区域性变量(城市规模、距离中心城区的距离)、房屋的相对价格作为解释变量。
Lee(1978)指出检验模型是否是联立方程的统计量是似然比率Lee(1978)认为在一般情况下,受限因变量使用Heckman两步法在一般情况下可以得到一致估计量,在这个估计量的基础上,得到的两步法极大似然估计(2SML)值是渐进有效的。
买方或者租房的问题不同于以往样本选择模型,因为要考虑模型是否存在联立性的问题。
理论证明和实践结果都表明,2SML法在标准误以及解释波动方面的效果很好,经验结论与经济理论也很吻合。
Lee(1979)介绍了具有离散和连续内生变量的一般联立方程的统计模型,这种模型可以被看成是转换联立方程模型的新形式,建议使用一些简单的二阶段方法估计模型,并证明了这些估计值的一致性问题。
Lee(1979)的联立方程不同于Tobin(1958)、Heckman(1974)、Nelson(1976)的受限因变量模型,主要区别在于Lee(1979)的方程中考虑了选择方程中含有内生变量的情况。
模型基本结构为:该系统方程中的误差项序列相互独立,具有0均值和协方差矩阵∑。
2SML得到的估计值是一致的,协方差矩阵∑也可通过方程之间的关系式估计出来。
Lee(1999)分析了动态Tobit模型、具有自回归条件异方差(ARCH)或者广义条件异方差(GARCH)的扰动项的Tobit模型在时间序列中的仿真(simulation)估计问题。
激励Lee研究这类问题的经济活动,如政府对商品、金融股票、外币市场的干预活动,防止价格跌得低于某个水平,或者涨得高于某个水平,变量的动态行为也可能受限。
对这类模型的估计,Lerman & Manski(1981)建议使用仿真(simulation)极大似然估计(SML),McFadden(1989)建议使用仿真矩估计法(MSM),Hajivassiliou & McFadden(1990)建议用仿真得分法(simulation scores)、Gourieroux & Monfort(1993)建议采用仿真伪极大似然法(pseudo-maximum likelihood),McFadden(1989)提出了SML估计值(SMLE)。
基本模型如下;Lee(1999)详细介绍了似然仿真法(likelihood simulation)在Tobit ARCH(p)、Tobit GARCH(p,q)及动态Tobit模型估计中的应用,也分析了方差递减以及在似然仿真中可能出现的数值下溢的问题,用蒙特卡洛(Mente Carlo)实验验证了SL法在这三种估计模型中的效果。