使用GMM方法分析动态面板数据.
- 格式:doc
- 大小:236.50 KB
- 文档页数:5
动态面板数据模型:对微观数据的方法和实践指南摘要本文回顾了动态面板数据模型的计量方法,并给出例子,说明这些程序的使用。
其中一个重点是个人或企业大量的时间段为数量少,典型的数据应用与微观经济观察小组。
重点是与自回归动态及未严格外生解释变数,因此对广义矩估计方法,即在这方面被广泛采用单方程模型。
有两个例子使用企业级别小组进行了详细讨论:一个简单的投资率自回归模型和基本生产功能。
介绍面板数据是目前广泛使用的动态计量经济模型来估算。
它过去在这方面的横截面数据的优点是显而易见的:我们不能估计一个时间点从观察动态模型,这是罕见的单一断面进行调查调查,以提供有关动态关系较早时期的足够信息。
在总的时间序列数据,其优点包括以下可能性:可能是潜在的微观动力学通过聚集偏见,遮蔽的范围1,该小组以调查数据之间提供个人,家庭或企业的不同类型的调整力度异质性。
虽然这些优势是共同的重复交叉部分或队列的数据,从观测伪于分组面板数据可以构造,二真正的面板数据 - 与同一个人重复观测 - 通常的变异allowmore的微观数据将用于建造参数估计,以及允许相对简单的经济计量技术的使用。
动态模型是在经济应用范围广泛,包括欧拉方程家庭消费,为企业的要素需求调整成本模型,以及经济增长的实证模型的兴趣。
即使在因变量的滞后系数不是直接利害关系的,允许在底层的动态过程,可用于恢复,其他参数一致的估计是至关重要的。
一个例子发生在生产函数估计当生产率冲击是序列相关和相对要素投入应对这些冲击,这是下文第3节中讨论进一步。
本文的重点将是对单方程估计,从一个截面单位数目众多面板自回归,分布滞后模型,每个观察了一段时间少数。
这种情况是对个人或公司的微观面板数据,并估算方法不需要时间维变大,以获得一致的参数估计值调用的典型。
对初始条件的属性假设在这种背景下也发挥了重要作用,因为最初的结论性意见以后每次观测的影响不能安全地被忽略的时间维度是短暂的。
我们还着眼于可用于任何严格外生解释变量或文书的情况下,而且容易扩展与预定或内源性的解释变量模型的方法。
动态面板数据估计方法
动态面板数据估计方法主要有以下几种:
1. 差分GMM(DIF-GMM)和系统GMM(SYS-GMM)估计方法:这两
种方法主要适用于短动态面板数据。
差分GMM估计方法被使用的较多,在学术界被广泛用来处理动态面板数据模型中的严重内生性问题。
为了克服这一问题,Blundell和Bond提出了系统广义矩估计即系统GMM估计方法。
系统GMM估计方法是基于差分GMM之上形成的,结合了差分方程和水
平方程,此外,还增加了一组滞后的差分变量作为水平方程相应的工具变量,更具有系统性。
2. 传统的固定效应(FE)、Pesaran和Smith的平均组估计量MG(估计
动态异质面板的长期关系)、Pesaran、Shin和Smith的混合平均组估计PMG(估计动态异质面板中的长期关系)。
此外,还有一些其他的方法如固定效应或随机效应估计、固定效应估计和工具变量估计的组合等。
以上内容仅供参考,建议查阅专业书籍或者咨询专业人士获取更准确的信息。
收稿日期:2010-10-25作者简介:陈芳(1983-),女,湖南新化人,华南理工大学经济与贸易学院管理科学与工程专业博士研究生;研究方向:区域经济的空间经济计量。
中国县域经济差距的收敛性研究———基于动态面板数据的GMM 方法陈芳,龙志和(华南理工大学经济与贸易学院,广东广州510006)Dynamic Panel GMM Analysis of Economic Growth Convergence in ChinaChen Fang,Long Zhihe(School of Economics and Commerce,South China University of Technology,Guangzhou 510006,China )Abstract:In this paper,we use the unbalanced panel data including 1994counties of China from 2000to 2007.We construct a dynamic panel model based on the regional economic structure and growth characteristics of China.Then we analyze the conditional beta-convergence across the counties of China with a GMM dynamic panel estimation method.Empirical results turn out the existence of conditional beta -convergence trend among counties of China.Moreover,we also prove that it is helpful to control the regional disparity if the regional differences of population growth,industrial structure,fiscal expenditure and investment gradually reduced.Key words:economic growth,conditional beta-convergence,county economy,dynamic panel data,GMM摘要:基于我国2000—2007年1994个县(及县级市)的非平衡面板数据,采用动态面板分析方法,对我国县域经济发展差距的条件β收敛性进行验证。
数字普惠金融如何影响实体经济的发展基于系统GMM模型和中介效应检验的分析一、本文概述本文旨在深入探索数字普惠金融如何影响实体经济的发展,利用系统GMM模型和中介效应检验的分析方法,对这一问题进行全面而细致的研究。
随着科技的快速发展,数字普惠金融作为一种新型的金融模式,已经逐渐成为推动实体经济发展的重要力量。
然而,其影响机制和作用路径尚未得到充分的理解和阐述。
因此,本文旨在揭示数字普惠金融与实体经济之间的内在联系,为政策制定者和实践者提供有价值的参考。
本文首先将对数字普惠金融和实体经济的概念进行界定,明确研究范围和对象。
接着,通过文献综述的方式,梳理国内外关于数字普惠金融与实体经济关系的研究现状,找出研究的空白点和不足之处。
在此基础上,本文构建了一个理论框架,提出了研究假设,即数字普惠金融的发展会促进实体经济的增长,并且这种影响是通过一系列中介变量实现的。
为了验证这一假设,本文采用了系统GMM模型和中介效应检验的方法。
系统GMM模型可以充分考虑数据的动态性和内生性问题,使得估计结果更加准确可靠。
而中介效应检验则可以揭示数字普惠金融影响实体经济的具体路径和机制。
通过这两种方法的结合使用,本文希望能够全面揭示数字普惠金融与实体经济之间的内在联系。
本文将对研究结果进行详细的解释和讨论,提出相应的政策建议和实践启示。
也会对研究的局限性和未来研究方向进行说明,以期为后续研究提供参考和借鉴。
二、文献综述随着数字技术的飞速发展,数字普惠金融作为新兴的金融业态,正在逐步渗透到全球经济的每一个角落,并对实体经济产生深远影响。
近年来,国内外学者围绕数字普惠金融与实体经济发展的关系进行了大量研究,旨在揭示这一影响机制的内在逻辑。
在理论框架方面,学者们普遍认为,数字普惠金融通过降低金融服务门槛、提高金融可得性,为实体经济提供了更加便捷、高效的融资渠道。
这一观点得到了许多实证研究的支持。
例如,一些研究发现,数字普惠金融的发展能够有效缓解小微企业融资难、融资贵的问题,从而促进实体经济的发展。
动态面板模型系统GMM 差分GMM Hansen过度识别检验AR检验SPSSAU动态面板模型分析如果在面板模型中,解释变量包括被解释变量的滞后值,此时则称之为“动态面板模型”,其目的是处理内生性问题。
动态面板模型发展分为3个阶段,第1阶段是由Arellano and Bond(1991)提出的差分GMM(difference GMM),第2阶段由Arellano and Bover(1995)提出水平GMM,第3阶段是Blundell and Bond(1998)将差分GMM和水平GMM结合一起进行GMM估计即系统GMM(System GMM)。
SPSSAU默认当前提供差分GMM和系统GMM两种类型,多数情况下使用系统GMM法。
需要注意的是,动态面板模型通常只针对‘大N小T’这样的面板数据,如果T 过大这会导致滞后项很多,待估计参数值可能过多无法拟合等。
动态面板模型时,通常会涉及到几种变量,分别说明如下:显著,就用到第几期。
例如,被解释变量的2期滞后项作为解释变量,1期和2期滞后项都显著,但加上3期滞后项后第2期不显著,第1期仍然显著,则一般只使用滞后的1和2期作为解释变量,不能用3期。
并且必须用1和2期,不能只用1期或2期。
因为结果表明1期和2期都显著,如果只用1期或2期,则会人为造成遗漏变量。
系统GMM在选择被解释变量和解释变量的几期滞后项作为IV时,有较大选择空间。
只要能满足系统GMM的两个检验就行。
系统GMM的两个检验是Hansen过度识别检验和扰动项无自相关AR检验,Hansen过度识别检验研究是否工具变量均为外生变量,如果其对应的p值大于0.05则意味着工具变量均外生,与此同时还需要通过AR检验,AR检验扰动项是否无自相关性,一般来说AR(2)对应的p值>0.05则接受原假设意味着模型通过自相关检验。
动态面板模型构建时,工具变量参数的设置尤其复杂,但无论如何均需要通过Hansen过度识别检验和AR检验,才意味着模型可用,因而建议实际研究中让SPSSAU自动进行参数配置,即设置参数时让系统自动识别寻找最佳模型,当SPSSAU无法自动找出最优模型时,此时结合自身数据及专业实际情况进行逐一参数设置和调整。
对外经济贸易大学金融学院张海洋 S EN ( Z ' ε ( z ' z 1 1 ˆ ˆ E'Z( Z'Z
1 Z'E N
2 j k 然而,该统计量有时候是不一致的,如果在命令中要求报告稳健的Sargan统计量,软件ˆ ;再根会做两阶段GMM估计(先找任意合理的H,令 A=( Z'HZ ,估计出第一步参数β 1 1 ˆ ˆ ,令 A=( Z'ˆ ˆ Z ,估计出第二部参数β ˆ ,计算出残差项的方差-协方差矩阵ˆ )据β 1 2 ,β β 1 1 1 根据第二步的参数结果,默默报告出Hansen统计量。
整体上说,Hansen统计量好像更靠谱一点,所以报告的时候,更多关注Hansen统计量。
(三)动态面板数据现在回到我们的动态面板数据,对数据和模型有如下假定: 1 2
3
4 动态。
模型中包含了因变量的滞后项;有个体的固定效应;可以有一些自变量是内生的;除了固定效应之外的误差项 it 可以异方差,可以序列相关;
5 不同个体之间的误差项 it 和 jt 不会相关。
6
7 可以有前定的(Predetermined)但不是完全外生的变量。
“大N,小T” ,即个体数量要足够多,但时间不用太长。
如果时间足够长的话,动态面板误差不会太大,用固定效应即可。
从上述要求可以看出,GMM方法特别适合宏观的面板数据分析,因为宏观变量中,很难找出绝对外生的变量,变量之间多少会互相影响。
而GMM方法可以“有一些自变量是内生的” ,这可能也是GMM
方法在文献中这么常用的原因。
此前已经说过,不能用传统的OLS方法或者固定效应模型进行动态面板数据的分析,那样会得到有偏的估计量。
先要对数据进行一定的变换,然后根据不同的矩条件设定开展矩估计。
其中数据变换有两种方法,矩条件的设定也有两种方法。
6
对外经济贸易大学金融学院张海洋 1、数据的变换方法:一阶差分还是垂直离差为了消除动态面板数据中的固定效应,通常用的有两种方法:一阶差分 (first difference和垂直离差(orthogonal deviations。
一阶差分之前已经介绍过了,这种方法是difference GMM 中默认的方法。
缺点是如果数据中有缺失值,那么最终的估计会缺失很多样本,原始数据缺一行往往会导致差分后的数据缺两行。
一种替代的方案是用垂直离差(xtabond2 命令中用 orthogonal 选项实现),每个变量减去该变量未来所有观测值的平均值,即: wi ,t 1 cit ( wi ,t 1 Tit w s t is 式子中, cit Tit / (Tit 1 为调整权重变量, Tit 是从t 期开始以后观测值的数量。
对于非平衡面板,和数据有缺失的面板,这种方法避免了因缺失数据带来的样本损失,因为调整的时候只是把未来的平均值减去,样本数不会因缺失未来个别观测值而受损。
然而,对于平衡面板数据,一阶差分和垂直离差估计出来的结果会完全一样。
2、 Different GMM 还是 System GMM 令数据变换之后的回归方程变为 Yi ,t * Yi ,t 1 * X it * it (5)这种变换可以是一阶差分,也可以是垂直离差。
Different GMM的逻辑是,如果是垂直离差变换,用 Yi ,t 2 作为 Yi ,t 1 * 的工具变量;如果是一阶差分变换,用Yi ,t 2 作为 Yi ,t 1 * 的工具变量,此时 Yi ,t 1*=Yi ,t 1 。
X it * 对应的工具变量也类似,如果是垂直离差,就用滞后一阶的,如果是差分就用滞后一阶的差分作为工具变量。
在实现的时候,为了提高估计的有效性,通常还会加入更高阶的滞后项(滞后差分)作为工具变量。
这些变量的加入利用了更多的信息,然而也会带来麻烦,让工具变量的数量随T平方成比例增加。
为了控制工具变量的数量,一个选择就是采用collapse选项把这些工具变量变成一列。
如果因变量的变化过程接近随机游走,那么Difference GMM的估计量会有较大偏差。
7
对外经济贸易大学金融学院张海洋 System GMM的方法和Different GMM完全不同,它不需要对自变量和因变量进行数据变换。
它假定工具变量的差分,即wit =wit wi ,t 1 ,应该外生于固定效应: E ( wit ui =0 。
如果 w 是内生的,wi ,t -1 就可以作为工具变量,更高阶的差分也可以做工具变量。
如果 w 是前定的但不是完全外生的,wi ,t 可以作为工具变量,更高阶的差分也可以做工具变量。
当然,更高阶差分加入后,还是会增加工具变量数量,需要在具体计算时想办法控制。
(四)使用 GMM 方法的注意事项可以尝试先做(2)式的OLS,再做(3)式的固定效应。
当然这两个估计都是有偏误的,然而这两个估计的系数应该是真实系数的上限和下限,可以给最后的 GMM 估计限定参考范围。
“大 N,小T” ,如果 N 太小了,则估计出来的标准差可能不太靠谱。
实际上如果用省际面板去做的话,不满足“大N”这个条件,但中文文献中充斥着这样的研究。
如果样本的 N 较小,但还可以接受(比如 N=70),然而又想用此方法,那么加上 small 选项。
解释变量中,放入时间虚拟变量。
比如,数据有 10 年,则放入 9 个虚拟变量。
加入后,可以让“误差项 it 和 jt 不会相关”这个条件更容易满足。
如果数据中间有间隙,尽量利用垂直离差(对于每个变量,包括自变量和因变量,wit 减去它未来值的平均值,就是加上 orthogonal 选项,见Roodman(2009)),这会减少样本量的损失。
因为数据中间缺一行,一阶差分( wit wi ,t 1 )后就会缺两行数据。
但对平衡面板数据,两种数据变换方法结果一样。
通常,每个自变量都要出现两次(除了系统外的工具变量)。
先作为自变量出现在在 xtabond2 命令中逗号的左边,再以某种形式作为工具变量出现在逗号右边。
如果变量 w 是完全外生的,那么放到 ivstyle(w(表示直接作为工具变量);如果 w 是前定的,但不是完全外生的,则放到 gmmstyle(w (表示从滞后一期开始都作为工具变量) ; 如果 w 是内生的,则放到 gmmstyle(L.w(表示从滞后两期开始都作为工具变量)。
报告工具变量的数量。
如果按照上一条的做法,工具变量的数量会很多。
这样会导致 overidentification test 不准确,【一个标志就是 Hansen 统计量的 p 值变为 1,Hansen test 的 p 值在(0.1,0.25)之外都要小心,太小表明拒绝工具变量有效的假设,太大表明选的工具变量太多, hansen 检验变弱了】。
通常,需要限制工具变量数量,可以用 collapse 选项,也可以用
laglimits(选项。
习惯做法是,选择不同数量的工具变量以显示估计系数的稳健性。
工具变量数量的上限就是模型中个体的数量(也就是 N),超出此上限,xtabond2 命令会报警。
使用 system GMM 的时候要注意,能使用该模型的前提是,工具变量的变化 wit wi ,t 1 8
对外经济贸易大学金融学院张海洋要和固定效应垂直。
因此数据应该在稳态附近,否则这些变量的变化就会和固定效应关系比较大,从而不满足 system GMM 适用的条件。
由于 GMM 方法有很多设定选项,在报告结果时,报告你的选项。
System GMM 还是 Difference GMM;是用垂直离差还是一阶差分;选用什么工具变量,滞后几期;选择什么样的 robust 标准差,等等。
参考文献 [1] Angrist, J. D. and J. Pischke , Mostly Harmless Econometrics. Princeton, New Jersey: Princeton University Press, 2009. [2] Roodman, D. , "How to Do Xtabond2: An Introduction to Difference and System GMM in Stata", The Stata Journal, 2009, 1( 9, 86-136. 9。