当前位置:文档之家› FDI对中国劳动就业的影响效应实_省略_究_基于面板VAR模型的动态分析_阎敏

FDI对中国劳动就业的影响效应实_省略_究_基于面板VAR模型的动态分析_阎敏

FDI对中国劳动就业的影响效应实_省略_究_基于面板VAR模型的动态分析_阎敏
FDI对中国劳动就业的影响效应实_省略_究_基于面板VAR模型的动态分析_阎敏

第27卷第7期Vol.27 No.7

统计与信息论坛

Statistics &Information Forum

2012年7月

Jul.,2012

【统计应用研究】

FDI对中国劳动就业的影响效应实证研究

———基于面板VAR模型的动态分析

阎 敏,郭 婷

(西安交通大学经济与金融学院,陕西西安710061)

摘要:近年来,随着国内的外商投资企业经营逐步向资本和技术密集型转化,FDI的就业创造效应受到质疑,学者们的研究结论也不尽一致。本文选取了1998-2010年中国引进外商投资的面板数据,运用面板VAR方法就FDI对中国劳动就业的影响效应进行了研究。得出的结论是:FDI在短期内对中国的劳动就业具有负向直接效应,但是能够通过拉动国内投资、促进经济增长,进而间接地推动内资企业就业的增加。该结论为中国政府通过继续扩大引进外资来改善中国劳动就业的政策提供了理论支持。

关键词:外商直接投资;中国劳动就业;面板VAR;影响效应研究

中图分类号:F830.59 文献标志码:A 文章编号:1007-3116(2012)07-0052-06

一、引 言

通过引进FDI增加东道国的就业机会历来被经济学家认为是有效之举,各国的引资实践也充分证明,外资在带来资金与技术的同时,对东道国的就业也会产生一定的正面影响。然而,近年来随着国内外商投资企业经营逐步向资本和技术密集型转化,FDI的就业创造效应受到质疑,理论界出现了FDI的“就业挤出效应”、“就业损失效应”甚至“就业摧毁效应”之说。那么,对中国而言,FDI对劳动就业的影响效应究竟是正还是负,其影响程度究竟如何,这些具体问题值得认真分析和深入研究。

二、文献综述

关于外商直接投资的就业效应问题一直受到理论界的关注,但和其他效应问题的研究相比,理论界

收稿日期:2012-03-09

基金项目:国家社会科学基金项目《全球经济调整与中国经济发展方式转变研究—基于FDI传导机制与国际市场结构变化的分析》(09XJL011)

作者简介:阎敏,男,陕西户县人,副教授,博士生导师,研究方向:金融市场与国际投融资;

郭婷,女,辽宁大连人,硕士研究生,研究方向:金融市场。

analyze the regional differences of R&D efficiency and influencing factors.This paper use the classic DEAmodel,empirical analyzing the R&D efficiency condition of China's high-tech service industry.The resultshows:Liaoning,Fujian,Shandong,Yunnan and other provinces is DEA effective.However,the R&Defficiency of Beijing,Shanghai,Jiangsu,Guangdong,Henan,Hunan,Anhui and other provinces is low,and the internal efficiency diversity largely.To narrow the gap of R&D efficiency of regional high-techservice industry,improve the development lever of national high-tech service industry,must rely onoptimizing the structure of resources,increasing its investment efforts,innovating talent cultivationmechanism,cultivating market demand and guiding the industry agglomeration.

Key words:high-tech service industry;R&D efficiency;the second national R&D resources inventorydata;DEA

(责任编辑:李 勤)2

在此方面的具体研究文献要少得多。具体讲,在国外方面,UNCTAD在《World Investment Report1994》中指出,FDI对发展中国家的就业影响呈正效应,进一步认为FDI在参与东道国的经济活动中直接或间接地创造了就业机会,提高了就业水平[1]163-209;Christoph Ernst以阿根廷、巴西和墨西哥三个国家1990年至2002年的时间序列数据为样本,研究了FDI对就业的总体影响,结果表明20世纪90年代后期大量涌入的FDI并不能明显地带动就业量的增加[2]。在国内,钟辉通过设定简单函数关系来分析FDI短期、中期和长期对中国就业的影响程度,研究得出短期FDI可以起到“发动机”的功能,中期的影响尚不明确,长期FDI对就业的影响是积极的[3];王剑、张会清基于微观和宏观经济理论构建了FDI与东道国就业的联立方程,采用时间序列数据进行实证研究,结果显示FDI每增加1%,带动实际就业增加0.008%[4];沙文兵、陶爱萍利用1979-2005年的年度数据对FDI与中国就业量进行了协整分析,结果显示两者之间存在长期均衡关系,FDI每增长1%,长期会带动中国就业增长0.13%[5];黄旭平,张明之通过建立面板VAR模型分析了FDI对就业和工资的动态影响,研究结果表明FDI对就业有正向影响,但是影响程度有限[6];王美今、钱金保利用1985-2004年省级面板数据构建联立方程模型,实证结果表明FDI对中国产生显著的正向就业效用[7];姜鹏、熊涓从理论上分析了FDI影响就业规模的时期效应及其影响因素,认为外商投资动机、外资流入方式、外资流入对象等因素都会影响FDI的就业效应[8];潘益兴利用时间序列数据建立回归模型来研究FDI对中国总体就业量的影响,实证结果显示FDI每增加1%,会导致就业量增加接近0.144 2%[9]。

从上述对国内外的文献回顾来看,国内外学者针对FDI对东道国就业影响这一问题的研究方法各异,得出的结论也不尽一致。从研究方法上来看,目前国内外大多数学者均采用静态的分析方法,得出的结论总体上倾向于正面效应。然而,从现实情况来看,FDI对就业的影响效应是一个动态的、不断变化的过程,静态的研究结果显然不够准确。此外,从现有的文献中可以发现,大多数学者采用时间序列数据进行分析,只有极少数学者使用面板数据对该问题进行研究。与标准的时间序列相比,面板数据能够提供更多的信息、更多的变化和更高的估计效率,因此仅仅从FDI总量的时间序列数据考察其对就业的影响显然有局限性。另外,从研究内容上来看,在以往大多数的研究中,无论是理论分析还是实证研究都基本集中于FDI对就业量的直接影响方面,而缺乏对国内资本这一间接影响路径的考虑,即使有个别文献引入了国内投资这一变量,但是仍然忽略了FDI与国内投资之间的相互作用关系及其对就业量水平的影响。显然,其研究方法的局限性客观上影响了研究结论的科学性。

本文针对现有文献的不足之处,根据柯布-道格拉斯生产函数引入就业量、FDI、国内总产出和国内投资四个变量,通过建立面板VAR模型,并采用最新的数据来分析FDI对中国就业量的影响,以期得出更为客观的研究结论。

三、FDI的劳动就业效应实证分析

本文采用面板VAR模型分析方法,具体是将所有变量均视为内生变量,并采用正交脉冲响应函数来分析一个变量冲击对另一个变量的冲击反应,这样能够真实反映各变量之间的动态关系,以便动态地考察FDI对就业产生的直接影响和间接影响。

(一)模型构建与变量选取

本文采用柯布-道格拉斯生产函数q=AKαLβ并将其做相应变换,其中q表示总产出,K表示资本投入,L表示劳动投入,α、β分别表示资本和劳动的产出弹性。两边取对数,系数用c(i)替代,得到:lnL=c(1)+c(2)lnq+c(3)lnK。为了考察外商直接投资对就业的影响,特将K拆分为外商直接投资FDI与国内投资DI,国内总产出水平用国内生产总值GDP衡量,就业量用L表示。因此可以得到:lnL=c(1)+c(2)lnGDP+c(3)lnFDI+

c(4)lnDI+ε(1)本文将以式(1)作为基本回归方程,同时建立包含四个方程的动态系统,从宏观层面研究外商直接投资、国内总产出、国内投资与就业之间的动态效应关系。

根据基本理论模型,本文选取四个变量:就业量、国内总产出水平、外商直接投资和国内投资。采用的数据为1998-2010年中国28个省级面板数据(由于西藏、青海数据的缺失,因此本文将该两省的数据剔除,同时将重庆的数据与四川合并)。数据均来源于《中国统计年鉴》、《新中国60年统计年鉴》,经作者整理所得,共计1 456个观测值。

阎 敏,郭 婷:FDI对中国劳动就业的影响效应实证研究

(二)实证分析与检验

面板VAR模型在进行回归分析之前应该进行单位根检验,这是为避免出现伪回归的前提条件。本文首先利用Eviews6.0分析软件对各个变量进行LLC检验、IPS检验和Fisher-PP检验,检验结果显示引入的四个变量均为5%显著性水平下的平稳数据。此后则根据AIC准则,经多次试验后确定最优滞后阶数为三阶,建立PVAR模型如下:

yit=αi+βt+Ayit-1+Byit-2+Cyit-3+εit

(2)其中yit={lnLit,lnGDPit,lnFDIit,lnDIit},i表示省份,t表示年份;本文在模型设定过程中还引入个体效应αi,即允许变量中存在地域性的差异;此外引入时间效应βt,以用来解释系统变量的内部趋势;εit是服从正态分布的随机扰动项。面板VAR模型包括三个主要估计步骤:(1)利用面板矩(GMM)方法对面板数据进行估计,说明变量之间的回归关系;(2)估计脉冲响应函数,通过动态脉冲反应图来观察各变量对冲击的反映情况;(3)误差项的方差分解,可以进一步说明影响因素的程度。本文主要运用STATA11.0统计软件,并使用世界银行金融研究部Lnessa Love博士提供的PVAR程序。

1.面板矩估计(GMM)。由于上述模型包含时间效应和个体效应,可能影响面板矩系数估计的准确性,因此在估计时应将其消除。为此本文对数据做如下处理:即运用均值差分法对各个变量消除时间效应,而后用一阶向前差分法消除个体效应(运用Helmert进程变换),以避免由于个体效应和回归因素相关而造成的系数估计有偏。具体GMM回归结果见表1。

表1 PVAR模型的GMM估计结果表

被解释变量

lnL lnFDI lnDI lnGDPb GMM t GMM b GMM t GMM b GMM t GMM b GMM t GMML.h_lnL 0.838 08 6.570 68-1.394 65-0.706 62-0.469 14-2.164 32-0.735 86-1.782 01L.h_lnFDI-0.006 81-1.096 77 0.728 29 6.235 57 0.021 45 1.213 19 0.021 08 1.054 52L.h_lnDI 0.038 88 1.027 79-0.203 03-1.254 55 1.627 67 9.940 97 0.652 01 3.798 74L.h_lnGDP-0.011 53-0.239 02 1.159 61 2.353 61 0.326 82 1.973 65 0.895 19 5.189 62L2.h_lnL 0.025 52 0.324 21 0.280 20 0.222 52 0.126 99 1.511 61 0.777 98 3.543 60L2.h_lnFDI 0.000 75 0.196 92 0.032 34 0.408 65-0.013 88-1.409 12-0.008 25-0.663 22L2.h_lnDI-0.063 08-1.797 01 1.588 00 2.908 77-0.568 23-4.105 05-0.358 44-2.438 69L2.h_lnGDP 0.219 63 2.549 99-1.853 01-1.546 75-0.442 04-1.908 45-0.447 43-1.698 37L3.h_lnL-0.038 74-0.498 65 0.391 86 0.414 25 0.225 34 0.871 696-0.156 49-0.596 81L3.h_lnFDI-0.000 94-0.237 87-0.042 87-0.672 07-0.016 48-1.559 12-0.017 48-1.383 21L3.h_lnDI 0.023 73 0.997 62-1.211 55-2.552 27-0.049 86-0.644 73-0.008 11-0.087 27L3.h_lnGDP-0.179 97-2.751 45 0.849 21 1.971 31 0.067 203 0.363 783 0.117 72 0.586 43

从上表的第四列数据可以看到,面对FDI的变动,就业量在第一期表现为负效应,在第二、三期FDI对就业量呈正向影响,可见外商直接投资对就业量一开始存在挤出效应,后来会渐渐带动就业量增加。然而,从系数总和上来看,FDI仍然会对就业产生挤出效应(但从t检验的结果来看这种影响并不显著)。

再从上表的第六列数据可以看出,国内投资的变化对就业的影响在第一期呈负向影响,而第二、三期则呈正向影响,从t检验值来看这种影响相比较于外商直接投资要更加明显。同时,面对国内总产出的变动,就业量在第一期、第三期表现出负效应,在第二期表现出正效应且效果很显著。此外表中显示,FDI对国内投资的影响在第一、二、三期的数值分别为-0.203 03、1.588 00、-1.211 55,说明外商直接投资对国内投资呈波动性影响,在第一、三期会挤出国内投资,在第二期会挤入国内投资。FDI对国内总产出的影响值为1.159 6、-1.853 01、

统计与信息论坛

0.849 21,也呈波动性影响。总体而言,外商直接投资的扩张对国内投资及国内经济增长均具有明显的促进作用,这和国内外学者研究得出的基本结论是完全吻合的。

2.

脉冲响应函数估计。为了进一步检验各个变量之间的动态关系,本文采用了系统方程的脉冲响应函数,即研究每个内生变量的变动或冲击对变量本身和其他内生变量的影响作用。具体而言,第i个内生变量的一个冲击不仅能够影响到本身,还可以通过VAR模型的动态结构传递给其他的内生变量。这样,通过脉冲响应函数就可以清晰刻画这些影响的轨迹,

进而显示任意一个变量的扰动是如何通过模型影响其他所有变量的过程。

(1)FDI对劳动就业的直接影响。图1显示,FDI一个正交化新息的冲击对就业量的影响一直为

负,期间虽然有上升趋势但反应不是很强烈,最终趋于影响值很小的负向影响。这说明面对FDI的冲击,中国的就业量在短期内会出现很小程度的负向变动,

究其原因可能与近年来外资进入方式的变化有直接的关系,因为近年来随着外商直接投资规模在中国的扩大,越来越多的跨国公司采取节约劳动的技术,或直接以技术作为投资的条件,采取合资、参股以及兼并收购等经营方式进入中国,这样跨国公司会以利润最大化为动机促使他们通过减员增效来降低经营成本。同时跨国公司对原有企业进行人员整合时,往往会保留高素质的人才而相应减少低技能的劳动力,

这样非但不能增加就业反而会对就业产生负向影响。为了进一步研究外商直接投资对就业的作用机制,这里加入国内投资、国内总产出两个变量从间接影响的角度加以分析

图1 脉冲响应函数图

(2)FDI对劳动就业的间接影响。图1中显示FDI对就业量的间接影响可以通过多种途径进行传导。FDI的冲击使国内投资受到了较为明显的影响,

国内投资显示出正向积极的响应,总体趋势表现为较平稳的上升后略有下降,但是最后仍然维持正向效应。由此说明FDI在短期内对国内投资非但不存在挤出效应,反而还会持续的带动国内投资的增长。而随着国内投资的增加,国内投资的新息又会对就业产生影响。面对国内投资的一个正交化冲击后,就业只在当期表现为负效应,此后便表现为比较明显的正向效应,并且保持着平稳的上升趋势,因此从短期看国内投资受外资促动进而会对劳动就业产生拉动作用。我们可将其理解为FDI可以通过带动国内投资的增加间接促进国内就业量的增长,其传导途径为FDI→DI→L。此外,国内总产出也会受到国内投资的影响,

面对国内投资的一个正交化新息的冲击,国内总产出在当期表现出积极的正响应,并且正响应在随后的几期内不断扩大。而国内总产出也会拉动就业量的增长,

面对国内总产出的一个正交化新息的冲击,

就业量呈现倒V型波动,即在第一期显示出微弱的正效应后拉动作用开始逐期增加,拉动效应在第三期达到峰值后便逐渐下降,但是从总体上来看仍然呈现出正效应。该传导机制可以总结为FDI→DI→G

DP→L。此外,图1中还显示国内总产出面对FDI一个正交化新息的冲击在当期就显示出正效应,在第三期达到峰值之后正效应便逐渐减弱。从中国现行经济运行状况来看,外商直接投资可以通过直接增加中国的资本存留量,

改善资产质量和转移技术,进而产生技术溢出效应和外在效应等方式来促进国内总产出的增长。基于上文的分析,国内总产出的新息也会对就业造成影响。该传导机制可以概括为FDI

5阎 敏,郭 婷:FDI对中国劳动就业的影响效应实证研究

→GDP→L。不可忽视的是国内总产出的变动势也必然会影响国内投资,国内投资受到国内总产出的一个正交化新息冲击后在当期表现出正效应,但是正效应在保持了三期后便逐步下降,最终表现出负面消极的影响。但从总体上来看国内总产出对国内投资的带动作用十分微弱,因此FDI几乎不能通过这条路径的作用来提升中国的就业水平,其作用可忽略不计。

表2 方差分解表

变量S lnL lnFDI lnDI lnGDP

lnL 10 0.252 476 0.006 77 0.678 605 0.062 149lnFDI 10 0.072 25 0.491 32 0.423 609 0.012 822lnDI 10 0.039 782 0.011 815 0.932 23 0.016 173lnGDP 10 0.041 164 0.014 499 0.891 99 0.052 347lnL 20 0.219 324 0.037 828 0.674 763 0.068 085lnFDI 20 0.073 686 0.458 475 0.448 062 0.019 777lnDI 20 0.040 74 0.024 998 0.904 821 0.029 441lnGDP 20 0.041 755 0.026 155 0.872 096 0.059 993

3.方差分解。方差分解是通过分析每一个结构冲击对内生变量变化的贡献度,进一步评价不同结构冲击的重要性。因此,方差分解给出了对面板VAR模型中的变量产生影响的每个随机扰动的相对重要性。因为动态系统的方差分解是基于正交化的,所以本文所得到的影响是“纯粹”的影响,即不包括其他因素的影响。从表2可以看出:FDI对就业、国内投资和国内总产出的影响都不显著,第10期就业的变动只有0.677%是由于外商直接投资引起,国内投资的变动有1.18%由外商直接投资引起,国内总产出的变动有1.45%由外商直接投资引起。从影响就业的另外两个宏观因素(国内投资和国内总产出)看,国内投资对就业的贡献度为67.86%,国内总产出的贡献度为6.21%,国内投资对就业量的贡献度要远远大于外商直接投资与国内总产出对就业的贡献度。而在第20期,FDI对就业、国内投资和国内总产出的解释程度有所增加,达到3.78%、2.50%和2.61%;另一方面,国内投资与国内总产出对就业的影响分别为67.48%与6.81%,基本与第10期的水平保持一致。综上可充分说明:国内投资是影响中国就业量的关键因素,国内总产出对就业的解释程度居中,而外商直接投资对就业的直接解释作用很微弱。

四、结论与建议

本文运用基于面数据的向量自回归模型,对中国28个省市13年的FDI与就业量关系进行了实证研究,分析结论如下:第一,从直接效应来看,FDI的增长并未完全带动中国总体就业量的同步上升,这可能与近些年来进入中国的外资主要投向于资本密集型和技术密集型行业有关。这也构成了社会上出现“就业损失”、“就业挤出”和“就业摧毁”等声音的直接证据。但值得一提的是这种影响并不显著,这是因为外商直接投资对就业量的影响具有滞后性。一般来说,外资进入东道国不能立刻产生显著的影响,而是需要一个长期的过程;第二,从间接效应来看,FDI对国内投资产生“挤入效应”的同时也对国内总产出也有一定程度的促进作用。总之,通过实证结果可看出,FDI在短期内不会对中国的就业量起到直接的带动作用,但是综合间接影响来看,FDI可以通过对国内投资及国内总产出的推动而间接地对中国的劳动就业产生积极和深远的影响。这和国内外多数学者的研究结论也基本一致。基于上述结论,作者有以下思考和建议:

第一,应该正确理解FDI对中国劳动就业所造成的直接负面影响。实证分析表明,近年来由于外商对华投资方式的转变而造成的直接“就业挤出效应”、“就业损失效应”甚至“就业摧毁效应”确实存在,但这并不能否定外商直接投资还正在给中国劳动就业带来巨大的“就业创造效应”。无论是“就业挤出”、“就业损失”甚至“就业摧毁”等,均是一个相对概念,这些负面效应仅仅表明了近年来FDI给中国劳动就业带来的现实巨大“创造效应”在短期里和一定程度上有所“降低”和“减小”罢了。从现实情况来看,外商直接投资对国内就业的长期促进和推动作用仍然是现实存在的,相对而言比上述负面影响要大很多。仅从这一点上讲,不但不应该“因噎废食”,反而更应该进一步扩大引进外商直接投资,以此来保证外资对中国劳动就业的积极正面效应不至于因短期里的部分负面影响而降低和减小。

第二,通过各种途径不断提高国内劳动力的素质,以此扩宽劳动力的就业渠道。因为近年来随着外商对华投资战略的转变,外资企业已经从投资于劳动密集型产业逐步过渡到投资于资本、技术密集型产业,因此对劳动力素质方面的要求也越来越高。为此,政府部门应该加大教育投资,提供专业技能培训,普及科学技术知识,促进人力资本开发,尽一切可能拓宽劳动力获取知识和技能的渠道,从而促进低技能、非熟练劳动力向高技能、熟练劳动力的转

统计与信息论坛

变,以满足外资企业对中国高素质劳动力的需求。此外,中国现今仍然具有二元经济结构特点,针对欠发达地区,政府应该适当地引进劳动密集型外资企业,如纺织、轻工、农林产业等,以此吸纳农村剩余劳动力的就业需求,从根本上减轻以至消除因外商投资战略转变给中国劳动就业造成的负面影响。

第三,有选择地引进外商投资,以充分发挥其“积极的间接就业促进效应”。上述实证已经表明,FDI的间接影响效应已明显超过其直接影响作用。因此,国家应该更有针对性地选择和引导外资流向,通过协调外商投资结构促进国内经济结构优化和产业结构升级,同时进一步协调外商投资企业的产业分布与国内投资的产业分布之间的关联和互补,使其与国内投资具有垂直关联,在产业价值链上具有前后向关联并具有显著的就业乘数效应。此外,应该给予投资于与国内产业结构互补和关联性强的外资优惠待遇,同时限制与国内投资产业竞争激烈的外资流入,以保护国内投资,更好地发挥外商直接投资对中国总体就业量增长的正向间接促进作用。

参考文献:

[1] UNCTAD.World Investment Report 1994:“Transnational corporations,employment and the workplace”[M].NewYork and Geneva,United States,1994.

[2] Christoph Ernst.The FDI-employment Link in a Globalizing World:the Case of Argentina,Brazil and Mexico[J].In-ternational Labor Office,2005(17).

[3] 钟辉.FDI对中国就业影响的动态分析[J],世界经济研究,2005(12).

[4] 王剑,张会清.外国直接投资对中国就业效应的实证研究[J],世界经济研究,2005(9).

[5] 沙文兵,陶爱萍.外商直接投资的就业效应分析—基于协整理论的分析实证[J].财经科学,2004(4).

[6] 黄旭平,张明之.外商直接投资对我国就业的影响—基于面板VAR的分析[J].中央财经大学学报,2007(1).

[7] 王美今,钱金保.外商直接投资对我国就业的影响—基于误差成分联立方程模型的估计[J].中山大学学报:社会科学版,2008(6).

[8] 姜鹏,熊涓.FDI影响东道国就业规模的效应分析[J].学术交流,2010(12).

[9] 潘益兴.外商直接投资对我国就业量的实证研究[J].经济问题探索,2011(2).

The Empirical Study of Effects of FDI on Chinese Employment:

Based on Dynamic Analysis of Panel VAR

YAN Min,GUO Ting

(School of Economics and Finance,Xi'an Jiaotong University,Xi'an 710061,China)Abstract:As the FDI has gradually flowed into capital-intensive and technology-intensive industriesin recent years,the FDI job creation effect has been questioned.Facing the same question,the scholars'study results are not consistent.This paper selects the sample panel data of FDI from 1998to 2010to em-pirically study the effect of FDI on Chinese employment.The results show that the direct effect of FDI onChinese employment is negative;however,FDI can increase the employment indirectly through stimulatingdomestic investment and promoting economy growth.This conclusion can provide China's government withtheoretical support to improve the current situation of Chinese employment by introducing more FDI.Key words:foreign direct investment;Chinese employment;panel VAR;effect study

(责任编辑:王南丰)

阎 敏,郭 婷:FDI对中国劳动就业的影响效应实证研究

STATA面板数据模型操作命令要点

STATA 面板数据模型估计命令一览表 一、静态面板数据的STATA 处理命令 εαβit ++=x y it i it 固定效应模型 μβit +=x y it it ε αμit +=it it 随机效应模型 (一)数据处理 输入数据 ●tsset code year 该命令是将数据定义为“面板”形式 ●xtdes 该命令是了解面板数据结构 ●summarize sq cpi unem g se5 ln 各变量的描述性统计(统计分析) ●gen lag_y=L.y /////// 产生一个滞后一期的新变量

gen F_y=F.y /////// 产生一个超前项的新变量 gen D_y=D.y /////// 产生一个一阶差分的新变量 gen D2_y=D2.y /////// 产生一个二阶差分的新变量 (二)模型的筛选和检验 ●1、检验个体效应(混合效应还是固定效应)(原假设:使用OLS混合模型)●xtreg sq cpi unem g se5 ln,fe 对于固定效应模型而言,回归结果中最后一行汇报的F统计量便在于检验所有的个体效应整体上显著。在我们这个例子中发现F统计量的概率为0.0000,检验结果表明固定效应模型优于混合OLS模型。 ●2、检验时间效应(混合效应还是随机效应)(检验方法:LM统计量) (原假设:使用OLS混合模型) ●qui xtreg sq cpi unem g se5 ln,re (加上“qui”之后第一幅图将不会呈现) xttest0

可以看出,LM检验得到的P值为0.0000,表明随机效应非常显著。可见,随机效应模型也优于混合OLS模型。 ●3、检验固定效应模型or随机效应模型(检验方法:Hausman检验) 原假设:使用随机效应模型(个体效应与解释变量无关) 通过上面分析,可以发现当模型加入了个体效应的时候,将显著优于截距项为常数假设条件下的混合OLS模型。但是无法明确区分FE or RE的优劣,这需要进行接下来的检验,如下: Step1:估计固定效应模型,存储估计结果 Step2:估计随机效应模型,存储估计结果 Step3:进行Hausman检验 ●qui xtreg sq cpi unem g se5 ln,fe est store fe qui xtreg sq cpi unem g se5 ln,re est store re hausman fe (或者更优的是hausman fe,sigmamore/ sigmaless) 可以看出,hausman检验的P值为0.0000,拒绝了原假设,认为随机效应模型的基本假设得不到满足。此时,需要采用工具变量法和是使用固定效应模型。

面板数据的F检验固定效应检验

面板数据的F检验固定 效应检验 标准化工作室编码[XX968T-XX89628-XJ668-XT689N]

面板数据模型(P A N E L D A T A)F检验,固定效应检验1.面板数据定义。 时间序列数据或截面数据都是一维数据。例如时间序列数据是变量按时间得到的数据;截面数据是变量在截面空间上的数据。面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合数据(pool data)。面板数据是同时在时间和截面空间上取得的二维数据。面板数据示意图见图1。面板数据从横截面(cross section)上看,是由若干个体(entity, unit, individual)在某一时刻构成的截面观测值,从纵剖面(longitudinal section)上看是一个时间序列。 面板数据用双下标变量表示。例如 y , i= 1, 2, …, N; t= 1, 2, …, T i t N表示面板数据中含有N个个体。T表示时间序列的最大长度。若固定t不变,y , ( i i . = 1, 2, …, N)是横截面上的N个随机变量;若固定i不变,y. t, (t= 1, 2, …, T)是纵剖面上的一个时间序列(个体)。 图1 N=7,T=50的面板数据示意图 例如1990-2000年30个省份的农业总产值数据。固定在某一年份上,它是由30个农业总产总值数字组成的截面数据;固定在某一省份上,它是由11年农业总产值数据组成的一个时间序列。面板数据由30个个体组成。共有330个观测值。 对于面板数据y i t, i = 1, 2, …, N; t= 1, 2, …, T来说,如果从横截面上看,每个变量都有观测值,从纵剖面上看,每一期都有观测值,则称此面板数据为平衡面板数据(balanced panel data)。若在面板数据中丢失若干个观测值,则称此面板数据为非平衡面板数据(unbalanced panel data)。 注意:EViwes 、、既允许用平衡面板数据也允许用非平衡面板数据估计模型。

基于面板数据模型及其固定效应的模型分析

基于面板数据模型及其固定效应的模型分析 在20世纪80年代及以前,还只有很少的研究面板数据模型及其应用的文献,而20世纪80年代之后一直到现在,已经有大量的文献使用同时具有横截面和时间序列信息的面板数据来进行经验研究(Hsiao,20XX)。同时,大量的面板数据计量经济学方法和技巧已经被开发了出来,并成为现在中级以上的计量经济学教科书的必备内容,面板数据计量经济学的理论研究也是现在理论计量经济学最热的领域之一。 面板数据同时包含了许多横截面在时间序列上的样本信息,不同于只有一个维度的纯粹横截面数据和时间序列数据,面板数据是同时有横截面和时序二维的。使用二维的面板数据相对于只使用横截面数据或时序数据,在理论上被认为有一些优点,其中一个重要的优点是面板数据被认为能够控制个体的异质性。在面板数据中,人们认为不同的横截面很可能具有异质性,这个异质性被认为是无法用已知的回归元观测的,同时异质性被假定为依横截面不同而不同,但在不同时点却是稳定的,因此可以用横截面虚拟变量来控制横截面的异质性,如果异质性是发生在不同时期的,那么则用时期虚拟变量来控制。而这些工作在只有横截面数据或时序数据时是无法完成的。 然而,实际上绝大多数时候我们并不关心这个异质性究竟是多少,我们关心的仍然是回归元参数的估计结果。使用面板数据做过实际研究的人可能会发现使用的效应①不同,对回归元的估计结果经常有十分巨大的影响,在某个固定效应设定下回归系数为正显着,而另外一个效应则变为负显着,这种事情经常可以碰到,让人十分困惑。大多数的研究文献都将这种影响解释为控制了固定效应后的结果,因为不可观测的异质性(固定效应)很可能和回归元是相关的,在控制了这个效应后,由于变量之间的相关性,自然会对回归元的估计结果产生影响,因而使用的效应不同,估计的结果一般也就会有显着变化。 然而,这个被广泛接受的理论假说,本质上来讲是有问题的。我们认为,估计的效应不同,对应的自变量估计系数的含义也不同,而导致估计结果有显着变化的可能重要原因是由于面板数据是二维的数据,而在这两个不同维度上,以及将两个维度的信息放到一起时,样本信息所显现出来的自变量和因变量之间的相关关系可能是不同的。因此,我们这里提出另外一种异质性,即样本在不同维度上的相关关系是不同的,是异质的,这个异质性是发生在回归元的回归系数上,而 不是截距项。我们试图从面板数据的横截面维度和时间序列维度的样本相关异质性角

面板数据的F检验固定效应检验

面板数据模型(P A N E L D A T A)F检验,固定效应检验1.面板数据定义。 时间序列数据或截面数据都是一维数据。例如时间序列数据是变量按时间得到的数据;截面数据是变量在截面空间上的数据。面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合数据(pool data)。面板数据是同时在时间和截面空间上取得的二维数据。面板数据示意图见图1。面板数据从横截面(cross section)上看,是由若干个体(entity, unit, individual)在某一时刻构成的截面观测值,从纵剖面(longitudinal section)上看是一个时间序列。 面板数据用双下标变量表示。例如 y i t, i= 1, 2, …, N; t= 1, 2, …, T N表示面板数据中含有N个个体。T表示时间序列的最大长度。若固定t不变,y i ., ( i= 1, 2, …, N)是横截面上的N个随机变量;若固定i不变,y. t, (t= 1, 2, …, T)是纵剖面上的一个时间序列(个体)。 图1 N=7,T=50的面板数据示意图 例如1990-2000年30个省份的农业总产值数据。固定在某一年份上,它是由30个农业总产总值数字组成的截面数据;固定在某一省份上,它是由11年农业总产值数据组成的一个时间序列。面板数据由30个个体组成。共有330个观测值。

对于面板数据y i t, i= 1, 2, …, N; t= 1, 2, …, T来说,如果从横截面上看,每个变量都有观测值,从纵剖面上看,每一期都有观测值,则称此面板数据为平衡面板数据(balanced panel data)。若在面板数据中丢失 若干个观测值,则称此面板数据为非平衡面板数据(unbalanced panel data)。注意:EViwes 、、既允许用平衡面板数据也允许用非平衡面板数据估计模型。 例1(file:panel02):1996-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(不变价格)和人均收入数据见表1和表2。数据是7 年的,每一年都有15个数据,共105组观测值。 人均消费和收入两个面板数据都是平衡面板数据,各有15个个体。人均消 费和收入的面板数据从纵剖面观察分别见图2和图3。从横截面观察分别见图4和图5。横截面数据散点图的表现与观测值顺序有关。图4和图5中人均消费和收入观测值顺序是按地区名的汉语拼音字母顺序排序的。 表1 1999-2002年中国东北、华北、华东15个省级地区的居民家庭人均消 费数据(不变价格) 地区人均消费1996 1997 1998 1999 2000 2001 2002 CP-AH(安徽) CP-BJ(北京) CP-FJ(福建) CP-HB(河北)

Eviews面板大数据之固定效应模型

Eviews 面板数据之固定效应模型 在面板数据线性回归模型中,如果对于不同的截面或不同的时间序列,只是模型的截距项是不同的,而模型的斜率系数是相同的,则称此模型为固定效应模型。固定效应模型分为三类: 1.个体固定效应模型 个体固定效应模型是对于不同的纵剖面时间序列(个体)只有截距项不同的模型: 2 K it i k kit it k y x u λβ==++∑ (1) 从时间和个体上看,面板数据回归模型的解释变量对被解释变量的边际影响均是相同的,而且除模型的解释变量之外,影响被解释变量的其他所有(未包括在回归模型或不可观测的)确定性变量的效应只是随个体变化而不随时间变化时。 检验:采用无约束模型和有约束模型的回归残差平方和之比构造F 统计量,以检验设定个体固定效应模型的合理性。F 模型的零假设: 01231:0N H λλλλ-===???== ()1 (1,(1)1)(1) RRSS URSS N F F N N T K URSS NT N K --= ---+--+ RRSS 是有约束模型(即混合数据回归模型)的残差平方和,URSS 是无约束模型ANCOVA 估计的残差平方和或者LSDV 估计的残差平方和。 实践: 一、数据:已知1996—2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(cp ,不变价格)和人均收入(ip ,不变价格)居民,利用数据(1)建立面板数据(panel data )工作文件;(2)定义序列名并输入数据;(3)估计选择面板模型;(4)面板单位根检验。年人均消费(consume )和人均收入(income )数据以及消费者价格指数(p )分别见表1,2和3。 表1 1996—2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(元)数据

固定效应与随机效应的比较

方差分析主要有三种模型:即固定效应模型(fixed effects model),随机效应模型(random effects model),混合效应模型(mixed effects model)。 所谓的固定、随机、混合,主要是针对分组变量而言的。 固定效应模型,表示你打算比较的就是你现在选中的这几组。例如,我想比较3种药物的疗效,我的目的就是为了比较这三种药的差别,不想往外推广。这三种药不是从很多种药中抽样出来的,不想推广到其他的药物,结论仅限于这三种药。“固定”的含义正在于此,这三种药是固定的,不是随机选择的。 随机效应模型,表示你打算比较的不仅是你的设计中的这几组,而是想通过对这几组的比较,推广到他们所能代表的总体中去。例如,你想知道是否名牌大学的就业率高于普通大学,你选择了北大、清华、北京工商大学、北京科技大学4所学校进行比较,你的目的不是为了比较这4所学校之间的就业率差异,而是为了说明他们所代表的名牌和普通大学之间的差异。你的结论不会仅限于这4所大学,而是要推广到名牌和普通这样的一个更广泛的范围。“随机”的含义就在于此,这4所学校是从名牌和普通大学中随机挑选出来的。 混合效应模型就比较好理解了,就是既有固定的因素,也有随机的因素。一般来说,只有固定效应模型,才有必要进行两两比较,随机效应模型没有必要进行两两比较,因为研究的目的不是为了比较随机选中的这些组别。 固定效应和随机效应的选择是大家做面板数据常常要遇到的问题,一个常见的方法是做huasman检验,即先估计一个随机效应,然后做检验,如果拒绝零假设,则可以使用固定效应,反之如果接受零假设,则使用随机效应。但这种方法往往得到事与愿违的结果。另一个想法是在建立模型前根据数据性质确定使用那种模型,比如数据是从总体中抽样得到的,则可以使用随机效应,比如从N个家庭中抽出了M个样本,则由于存在随机抽样,则建议使用随机效应,反之如果数据是总体数据,比如31个省市的Gdp,则不存在随机抽样问题,可以使用固定效应。同时,从估计自由度角度看,由于固定效应模型要估计每个截面的参数,因此随机效应比固定效应有较大的自由度. 固定效应模型 固定效应模型(fixed effects model)的应用前提是假定全部研究结果的方向与效应大小基本相同,即各独立研究的结果趋于一致,一致性检验差异无显著性。因此固定效应模型适用于各独立研究间无差异,或差异较小的研究。 固定效应模型是指实验结果只想比较每一自变项之特定类目或类别间的差异及其与其他自变项之特定类目或类别间交互作用效果,而不想依此推论到同一自变项未包含在内的其他类目或类别的实验设计。例如:研究者想知道教师的认知类型在不同教学方法情境中,对儿童学习数学的效果有何不同,其中教师和学生的认知类型,均指场地依赖型和场地独立型,而不同的教学方法,则指启发式、讲演式、编序式。当实验结束时,研究者仅就两种类型间的交互作用效果及类型间的差异进行说明,而未推论到其他认知类型,或第四种教学方法。象此种实验研究模式,即称为固定效果模式。与本词相对者是随机效应模型(random effect model)、混合效应模型(mixed effect model)。 随机效应模型 random effects models 随机效应模型(random effects models)是经典的线性模型的一种推广,

固定效应模型的估计原理说明

固定效应模型的估计原理说明

————————————————————————————————作者: ————————————————————————————————日期: ?

固定效应模型的估计原理说明 在面板数据线性回归模型中,如果对于不同的截面或不同的时间序列,只是模型的截距项是不同的,而模型的斜率系数是相同的,则称此模型为固定效应模型。固定效应模型分为三类: 1.个体固定效应模型 个体固定效应模型是对于不同的纵剖面时间序列(个体)只有截距项不同的模型: 2 K it i k kit it k y x u λβ==++∑ (1) 从时间和个体上看,面板数据回归模型的解释变量对被解释变量的边际影响均是相同的,而且除模型的解释变量之外,影响被解释变量的其他所有(未包括在回归模型或不可观测的)确定性变量的效应只是随个体变化而不随时间变化时。 检验:采用无约束模型和有约束模型的回归残差平方和之比构造F 统计量,以检验设定个体固定效应模型的合理性。F 模型的零假设: 01231:0N H λλλλ-===???== ()1 (1,(1)1)(1) RRSS URSS N F F N N T K URSS NT N K --= ---+--+ RR SS是有约束模型(即混合数据回归模型)的残差平方和,URSS 是无约束模型ANC OV A 估计的残差平方和或者L SDV 估计的残差平方和。 实践: 一、数据:已知1996—2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(cp ,不变价格)和人均收入(ip ,不变价格)居民,利用数据(1)建立面板数据(pa nel data)工作文件;(2)定义序列名并输入数据;(3)估计选择面板模型;(4)面板单位根检验。年人均消费(consume )和人均收入(incom e)数据以及消费者价格指数(p)分别见表1,2和3。 表1 1996—2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(元)数据 人均消费 1996 1997 1998 1999 2 CO NS UM EA H 3607.43 3693.55 3777.41 3901.81 4232.9 8 4517.6 5 4736.52 CONSU ME BJ 5729.52 6531.81 6970.83 7498.48 8493.49 8922.72 10284.6 CONSUM EFJ 4248.47 4935.95 5181.45 5266.69 5638.74 6015.11 6631.68 CONSUMEHB 3424.35 4003.71 3834.43 4026.3 4348.47 4479.75 5069.28 CONSUMEH LJ 3110.92 3213.4 2 3303.15 3481.74 3824.44 4192.36 4462.08 CO NSUMEJ L 3037.32 3408.0 3 3449.74 3661.68 4020.87 4337.22 4973.8 8

MATLAB空间面板数据模型操作简介

MATLAB空间面板数据模型操作简介 MATLAB安装:在民主湖资源站上下载MA TLAB 2009a,或者2010a,按照其中的安装说明安装MATLAB。(MATLAB较大,占用内存较大,安装的话可能也要花费一定的时间) 一、数据布局: 首先我们说一下MA TLAB处理空间面板数据时,数据文件是怎么布局的,熟悉eviews的同学可能知道,eviews中面板数据布局是:一个省份所有年份的数据作为一个单元(纵截面:一个时间序列),然后再排放另一个省份所有年份的数据,依次将所有省份的数据排放完,如下图,红框中“1-94”“1-95”“1-96”“1-97”中,1是省份的代号,94,95,96,97表示年份,eviews是将每个省份的数据放在一起,再将所有省份堆放在一起。 与eviews不同,MATLAB处理空间面板数据时,面板数据的布局是(在excel中说明):先排放一个横截面上的数据(即某年所有省份的数据),再将不同年份的横截面按时间顺序堆放在一起。如图:

这里需要说明的是,MA TLAB中省份的序号需要与空间权重矩阵中省份一一对应,我们一般就采用《中国统计年鉴》分地区数据中省份的排列顺序。(二阶空间权重矩阵我会在附件中给出)。 二、数据的输入: MATLAB与excel链接:在excel中点击“工具→加载宏→浏览”,找到MA TLAB的安装目录,一般来说,如果安装时没有修改安装路径,此安装目录为:C:\Programfiles\MATLAB\R2009a\toolbox\exlink,点击excllink.xla即可完成excel与MATLAB的链接。这样的话excel中的数据就可以直接导入MATLAB中形成MATLAB的数据文件。操作完成后excel 的加载宏界面如图: 选中“Spreadsheet Link EX3.0.3 for use with MATLAB”即表示我们希望excel 与MATLAB实现链

最新固定效应模型的估计原理说明资料

固定效应模型的估计原理说明 在面板数据线性回归模型中,如果对于不同的截面或不同的时间序列,只是模型的截距项是不同的,而模型的斜率系数是相同的,则称此模型为固定效应模型。固定效应模型分为三类: 1.个体固定效应模型 个体固定效应模型是对于不同的纵剖面时间序列(个体)只有截距项不同的模型: 2 K it i k kit it k y x u λβ==++∑ (1) 从时间和个体上看,面板数据回归模型的解释变量对被解释变量的边际影响均是相同的,而且除模型的解释变量之外,影响被解释变量的其他所有(未包括在回归模型或不可观测的)确定性变量的效应只是随个体变化而不随时间变化时。 检验:采用无约束模型和有约束模型的回归残差平方和之比构造F 统计量,以检验设定个体固定效应模型的合理性。F 模型的零假设: 01231:0N H λλλλ-===???== ()1 (1,(1)1)(1) RRSS URSS N F F N N T K URSS NT N K --= ---+--+ RRSS 是有约束模型(即混合数据回归模型)的残差平方和,URSS 是无约束模型ANCOV A 估计的残差平方和或者LSDV 估计的残差平方和。 实践: 一、数据:已知1996—2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(cp ,不变价格)和人均收入(ip ,不变价格)居民,利用数据(1)建立面板数据(panel data )工作文件;(2)定义序列名并输入数据;(3)估计选择面板模型;(4)面板单位根检验。年人均消费(consume )和人均收入(income )数据以及消费者价格指数(p )分别见表1,2和3。 表1 1996—2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(元)数据 人均消费 1996 1997 1998 1999 2000 2001 2002 CONSUMEAH 3607.43 3693.55 3777.41 3901.81 4232.98 4517.65 4736.52 CONSUMEBJ 5729.52 6531.81 6970.83 7498.48 8493.49 8922.72 10284.6 CONSUMEFJ 4248.47 4935.95 5181.45 5266.69 5638.74 6015.11 6631.68 CONSUMEHB 3424.35 4003.71 3834.43 4026.3 4348.47 4479.75 5069.28 CONSUMEHLJ 3110.92 3213.42 3303.15 3481.74 3824.44 4192.36 4462.08 CONSUMEJL 3037.32 3408.03 3449.74 3661.68 4020.87 4337.22 4973.88 CONSUMEJS 4057.5 4533.57 4889.43 5010.91 5323.18 5532.74 6042.6 CONSUMEJX 2942.11 3199.61 3266.81 3482.33 3623.56 3894.51 4549.32 CONSUMELN 3493.02 3719.91 3890.74 3989.93 4356.06 4654.42 5342.64 CONSUMENMG 2767.84 3032.3 3105.74 3468.99 3927.75 4195.62 4859.88

面板数据的F检验,固定效应检验

面板数据模型(PANEL DATA)F检验,固定效应检验 1.面板数据定义。 时间序列数据或截面数据都是一维数据。例如时间序列数据是变量按时间得到的数据;截面数据是变量在截面空间上的数据。面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合数据(pool data)。面板数据是同时在时间和截面空间上取得的二维数据。面板数据示意图见图1。面板数据从横截面(cross section)上看,是由若干个体(entity, unit, individual)在某一时刻构成的截面观测值,从纵剖面(longitudinal section)上看是一个时间序列。 面板数据用双下标变量表示。例如 y i t,i = 1, 2, …, N; t = 1, 2, …, T N表示面板数据中含有N个个体。T表示时间序列的最大长度。若固定t不变,y i ., ( i= 1, 2, …, N)是横截面上的N个随机变量;若固定i不变,y. t, (t = 1, 2, …, T)是纵剖面上的一个时间序列(个体)。 图1 N=7,T=50的面板数据示意图 例如1990-2000年30个省份的农业总产值数据。固定在某一年份上,它是由30个农业总产总值数字组成的截面数据;固定在某一省份上,它是由11年农业总产值数据组成的一个时间序列。面板数据由30个个体组成。共有330个观测值。 对于面板数据y i t, i = 1, 2, …, N; t = 1, 2, …, T来说,如果从横截面上看,每个变量都有观测值,从纵剖面上看,每一期都有观测值,则称此面板数据为平衡面板数据(balanced panel data)。若在面板数据中丢失若干个观测值,则称此面板数据为非平衡面板数据(unbalanced panel data)。

相关主题
文本预览
相关文档 最新文档