当前位置:文档之家› 基于面板数据和空间计量模型的研究

基于面板数据和空间计量模型的研究

基于面板数据和空间计量模型的研究
基于面板数据和空间计量模型的研究

第二组数量经济与理论方法(二)(数理经济学等),全文11932字。

我国教育投资与经济增长的关系研究

——基于面板数据和空间计量模型的研究

朱璐璐肖腊珍①

(中南财经政法大学统计与数学学院)

【摘要】教育投资是人力资本形成的重要途径。在对教育投资等内涵的理解基础上,从教育投资规模、教育投资质量和教育投资公平度三个方面选取反映教育投资状况的指标,运用教育基尼系数量化了我国1997-2007年30个省份的教育投资公平程度。运用单位根检验、协整检验、格兰杰因果检验研究我国教育资和经济增长之间的互动因果关系,建立合适的Panel Data和空间计量模型进行实证研究。研究结果表明教育投资规模对经济增长的促进作用非常明显,但是当基础教育提高到一定水平后,对经济增长的促进作用开始逐步递减;各区域的高等学历人才并不多,对经济增长的贡献率非常低;目前东、中部地区的教育投资的公平状况明显好于西部地区,公平的教育资源分配可以较好促进经济的发展。并提出要继续加大各地区教育投入,同时注重高等人才的培养,继续解决好教育投资公平问题。

关键词:教育投资规模教育投资质量教育投资公平教育基尼系数

引言

中国是世界上最大的发展中国家,经济增长是实现人民生活达到小康水平以及赶上中等发达国家经济发展水平目标的主要途径,因而经济增长理所当然地成为了中国经济理论研究的重点。中国幅员辽阔、自然资源丰富,人口众多,劳动力资源充足,但是人口质量不高,人力资本存量不多,人力资本结构与经济发展的需求严重失衡。人力资本低质量,低存量造成的人力资本缺乏使其外在效应的产出受到严重限制,人力资本收益递增的规律难以发挥。

自改革开放以来,我国各区域发展差距不断扩大,东部地区发展形势较好,西部地区经济发展较差。除了政策以及地域、气候因素外,劳动者的素质有着非常大的影响作用。地区差异的拉大使得高素质的劳动力继续往东部流动,尤其集中在北京、上海、江苏、浙江和广东等地,促使这些地区的经济发展更快,而东西部的差异继续增大。因此本文希望通过实证分析找出我国各省、市教育投资与经济发展程度的关系,也分析经济增长对教育投资在各不同区域所带来的反作用,同时寻找我国目前教育投资状况不足的原因,给出相关建议。

一、文献综述

最早正视教育投资问题的英国古典经济学创始人威廉·配第(William Petty,1676)指出劳动创造价值、复杂劳动比简单劳动创造更多的价值。1776年,英国古典政治经济学奠基人亚当·斯密(Adam Smith,1776)最早明确提出并重视教育投资问题,他认为资本的累积、就业人口的增加及技术进步构成经济理论发展基础的三要素。进入19世纪,德国历史学派的

①作者简介:朱璐璐,1985.4出生,女,中南财经政法大学统计与数学学院,统计学研究生;

肖腊珍,1964.1出生,女,中南财经政法大学统计与数学学院,硕士,副教授。中国数量经

济学会会员。

先驱弗里德里希·李斯特(Friedrich List,1819)明确提出将教师列入生产者范围内,间接提出了教育投资促进国家经济的原理。

英国著名的经济学家阿尔弗里德·马歇尔(A.Marshall,1890)认为“在所有资本之中,最有价值的就是对人投资而形成的资本”。20世纪40年代前后,英国经济学家哈罗德(Harrod)和美国经济学家多马(Domar)几乎同一时期各自提出了相类似的增长模型,合称为“哈罗德—多马模型”。

索洛(Solow,1957)和丹尼森(E.Dennison)的理论统称为新古典经济增长理论,他们把教育投资当成经济增长的内生变量。

二战后这一时期对教育投资的研究,是与人力资本理论的发展密不可分的。“人力资本”概念是由美国经济学家沃尔什在1935年第一次正式提出,到20世纪60年代形成了比较完善的人力资本理论,其代表人物主要是美国著名经济学家舒尔茨、罗默等。舒尔茨等对人力资本的理解较为一般化,仅把人力资本作为一个影响产出增长的要素。真正用人力资本来解释持续的经济增长还应归功于新经济增长理论的代表人物卢卡斯和罗默。阿罗(Arrow,1962)建立了“边干边学”模型,将技术进步的一部分作用内生化了。罗默(Romer,1986)在《收益递增经济增长模型》中提出了一个具有外溢性知识的内生经济增长模型。卢卡斯(Lucas, 1988)认为专业化的人力资本积累才是经济增长的真正源泉。

关于我国教育投资对经济增长的推动作用,国内学者也进行过一些研究分析。厉以宁(1984)开始强调智力投资的生产性问题,最早提出“教育的社会经济功能”、“能力工资”以及“知识与技能标准分”等概念。范先佐(1999)提出“通过教育提高人口的质量,对社会经济发展和生产增长,具有直接或间接的作用①”。沈利生等(1999)认为人力资本投资的收益率高于物质资本。熊春文(2002)提出从制度的角度考察教育的经济价值显得更有新意。周天勇(1994)的研究结果表明1952-1990年间人力资本增长对中国经济增长的贡献率分别为22%和27%。蔡增正(1999)考察了1965-1990年世界上194个国家和地区教育对经济增长的贡献。研究结果显示教育对于经济增长的贡献巨大而具实质性,外溢作用是正的且颇为可观。王家赠(2002)发现居民人均受教育年限的增加促进经济增长,而教育基尼系数的增加阻碍经济增长。王淑芬(2007)采用回归分析和灰色关联分析方法,分析了百强县的教育和经济发展水平的关系。结果表明教育与经济发展之间具有正相关关系;教育与经济发展的一致性水平与其发展综合水平呈同向变化。吴舒卉(2010)实证分析得出华东地区的教育支出对经济增长有显著的正向影响,影响超过了固定资本对经济增长的显著正向影响。

从我国以往的相关研究来看,存在三方面的不足:第一,绝大部分学者只是强调了教育投资对经济增长的作用,而经济增长对教育的反向作用却鲜有人提及。第二,到目前为止,大多数文献集中研究教育投资的数量与规模对经济增长的影响,没有考虑到教育投资质量上的差异对经济增长的作用。第三,目前的研究较少在面板数据模型中考虑到教育投资公平程度的差异对经济增长的影响。

①范先佐,《教育经济学》,人民教育出版社,1999 年,第78 页。

二、变量选择和模型介绍 (一)变量选择及数据处理

为了解各个经济地带的教育投资与经济增长间的关系以及地区间的差异性,笔者把我国划分东、中、西部三大地带进行研究①。1996年以后才有教育经费支出数据,且教育经费在统计上有2年的滞后期。为将1997年才从四川省独立出来的直辖市重庆的数据包括在内,最终选取1997-2007年30个省市(不含西藏)的样本数据进行分析。所用数据均来自《中国统计年鉴》(1997-2009)。

1.经济增长指标

考虑到我国各区域人口的差异与价格的变动,为消除人口和价格因素的影响,以人均实际GDP 增长率来衡量各地区经济增长情况。本文对各省市历年人均国内生产总值(GDP )以1996年为基年的GDP 平减指数进行了平减处理并取对数,记为LGDP 。

笔者在对教育投资内涵的理解基础上,结合我国教育投资发展的现实情况,从三个方面选取反映教育投资状况的指标:教育投资规模、教育投资质量和教育投资公平。

2.教育投资规模指标

我国教育经费的投入直接促进了我国基础教育的发展,也促进了我国各等级的受教育人才的增加,是人力资本形成的必要途径之一。从教育投资的投入规模和投入的产出成果这两个方面考虑,本文选用教育经费近似反映教育投资的总规模,用居民的平均受教育年限反映教育投资的成就。对各省教育经费(含国家财政教育支出的全社会宽口径)以1996年为基年的居民消费价格指数(CPI )进行了平减处理,然后除以该地区总人数得到人均教育经费,记为FU 。

本文采用国际通行的方法测算人均受教育年限,记为AVE :

,,5

1

t

t i

t i

AVE i x p ==∑ (式1)

式1中,t AVE 为平均受教育年限(按总人口计算);1212t = 、

、、,分别代表1997、…、2007年; 12345i =,

,,,,分别代表不识字或识字很少、小学、初中、高中和中专、大专及以上受教育程度;,t i x 为t 年度的i 级受教育水平的累积受教育年限,将各级受教育年限分别定义为1、6 、9 、12 、16 年;

,t i

p 为t 年度的i 级受教育水平的人口比重。

3.教育投资质量指标

人口对教育的制约和影响是人口数量影响教育规模、结构与质量,人口结构影响教育结构,人口质量影响教育质量。从教育投资对人口的受教育程度和高等学历人力资本的培养效

东部包括北京、天津、河北、上海、辽宁、山东、江苏、浙江、福建、广东和海南十一个省(市),中部

地区包括山西、吉林、黑龙江、安徽、江西、河南、湖南、湖北八个省,西部地区包括内蒙古、广西、重庆、四川、贵州、云南、陕西、甘肃、青海、宁夏、新疆十一个省(市)。

率方面来考虑,高等学历人力资本的增加体现了教育投资的质量。国际上已经有评估教育投资质量对于经济增长影响的研究,里克· 哈努谢克和丹尼斯·金科(Eric Hanushek and Dennis Kimko , 2000)使用学生学习能力的国际测试结果来评估劳动力素质对于国家产出和增长的影响,对教育投资质量的估计正是通过大量反映教育投资产生的效果的这一类变量完成。从教育投资提高人力资本素质的结果来看,教育投资质量的好坏,直接体现在我国人口高等学历差异上,因此本文选取各省大专以上学历人数比例反映教育投资质量。用各省大专以上学历调查人数除以该省的调查比例和总人数,并乘以一万,得到万人大专以上学历的人数,记为DZ 。

4.教育投资公平指标

Amparo Castello 和Rafael Domenech (2002)研究表明,教育投资不平等会阻碍经济增长,并且这种阻碍作用要大于于教育投资规模本身所具有的促进作用。教育投资分布相对不平等的国家其经济增长情况也相对较差。考虑到数据可得性,本文选取教育基尼系数来衡量我国各省教育投资资源分布的相对不平等程度。教育基尼系数在0.2以下表示高度平均;0.2-0.3之间表示相对平均;0.3-0.4之间表示较为合理;0.4-0.5之间表示差距偏大;0.5以上表示差距悬殊。本文采用Vinod Thomas (2000)提出的方法计算教育基尼系数,记为GINI : 1

21

1

n i i

i j j i j L GINI p

y y p μ

-===

-∑∑ (式2)

式2中,L GINI 是大样本下的教育基尼系数,μ为相关人口的人均受教育年限,i j p p 、为一定教育水平下的人口比重,i j y y 、表示不同层次教育水平的受教育年限。

(二)模型介绍 1.Panel Data 模型

面板数据(Panel Data )是指在时间序列上取多个截面,在这些截面上同时选取样本观测值所构成的样本数据。根据约束条件不同分为混合模型、变截距模型、变系数模型。混合模型,在横截面上无个体影响、无结构变化;变截距模型,在横截面上个体影响不同,个体影响表现为模型中被忽略的反映个体差异的变量的影响;变系数模型,除了存在个体影响外,在横截面上还存在变化的经济结构,因而结构参数在不同横截面单位上是不同的。

2.空间计量模型 (1)空间相关性检验

根据空间统计和空间计量经济学原理方法,首先应采用空间统计分析Moran 指数法检验因变量是否存在空间自相关性或集聚现象。Moran ’s I 的取值范围为11I -≤≤。若各地区间经济行为为空间正相关,I 的数值应当较大;负相关则较小。

(2)空间变系数回归模型

当用横截面数据建立计量经济学模型时,由于数据在空间上表现出的复杂性、自相关性和变异性,使得解释变量对被解释变量的影响在不同区域之间可能不同。本文主要采用空间

变系数回归模型中的地理加权回归模型(GWR )探析全国各省市教育投资与经济增长的关系在空间上的异质性差异。地理加权回归扩展了传统的回归框架,扩展后的模型如下: 0(,)(,)i i i k

i

i

ik

i k

y u v u v X

ββε=+

+∑ 1,2,,i n =?

(式3) 三、教育投资与经济增长的地区差异影响分析 (一)、教育投资的地区差异比较 1. 教育投资规模地区差异

图1和图2分别反映1997-2007年我国东、中、西部人均教育经费、平均受教育年限变化。

图1 我国东、中、西部地区人均实际教育经费(1997-2007年)

结合图1和人均实际教育经费数据(见附表6)可以看出:

(1)经济相对发达的东部地区的教育投资总体水平比中西部地区高。从1997年到2007年,北京、上海地区的人均实际教育经费呈直线上升趋势,到2007年超过20元/人。天津、浙江、广东地区的人均实际教育经费于2007年也超过了10元/人。

(2)虽然西部地区的整体教育投资水平远低于东部地区,但是海南、宁夏等西部省市的教育投资水平上升幅度非常大,且人均实际教育经费达到了8元/人。

图2 我国东、中、西部地区人均受教育年限(1997-2007年)

结合图2和平均受教育年限数据(见附表7)可以看出:

(1)我国东、中、西部地区的人均受教育年限不断增加。1997-2007年,北京市地区人

均受教育年限11年期间增长了44.5%,湖北省增长了22.6%,而四川省增长了18.7%。

1997-2007年,西部地区各省市的人均受教育年限均超过6年。这表明近几年国家实施的西部大开发政策取得一定成效,加大了教育投入力度,实现了小学6年义务教育。

(2)东部地区人均受教育年限明显高于中部和西部。这与中部、西部地区收入水平低、教育投入低有很大关系。

东部地区的人均受教育年限从1997到2007年一直位于较高水平,处于7.5-10.5年之间,2007年北京、上海地区甚至超过了10年;而2007年中部地区的人均受教育年限处于7-8.5年之间;西部地区各省市的人均受教育年限最低,大约在6-7.9年之间。可见东部地区的教育总体水平比中、西部地区高。

西部地区的总体教育水平明显较低,这与西部地区的经济发展水平相对落后,居民的收入水平较低有关。近几年,国家实施西部大开发政策,促进了西部地区的经济发展,取得一定的成效,但要改变西部教育水平较低的状况需要一定时间。

2.教育投资质量地区差异

为了解我国各地区教育投资质量,笔者计算东、中、西部地区省市的万人大专以上学历人数,见图3。

图3 我国东、中、西部地区万人大专以上学历人数(1997-2007年)结合图3和万人大专以上学历人数数据(见附表8)可知:

(1)我国东、中、西部地区的30个省市的大专以上学历人数不断增加。30个省市中增长幅度最高的五个地区是:广西、江苏、山东、江西、青海;增长幅度都在300%附近;增长幅度最低的五个地区是:黑龙江、吉林、新疆、贵州,都在40%-70%之间波动。西部地区部分省市的万人大专以上学历人数增长幅度较高,这与近几年国家实施的西部大开发政策相关,这一政策的实施促进了西部地区的经济技术的发展和教育水平的大幅度提升。

(2)东部地区各省市的万人大专以上学历人数明显多于中部和西部。这与中部、西部地区收入水平低与东部地区,教育投入低有很大关系。1997年,北京市的万人大专以上学历人数已经超过了1300人,上海市也高达860人,2007年北京、上海地区均超过2000人,天津市的万人大专以上学历人数也近1500人。而2007年中部、西部地区各省市的万人大专以上学历人数都低于900人。可见东部地区的教育总体水平比中、西部地区高。

3.教育投资公平度地区差异

为了解我国教育水平以及教育资源的分布情况,本文计算了东、中、西部地区省市的教育基尼系数,见图5。

图4 我国东、中、西部地区教育基尼系数(1997-2007年)由图4和教育基尼系数数据(见附表9)可知:

(1)1997-2007年,我国东、中、西部地区教育投资状况一直处于较平均的状态。我国30个省市的教育基尼系数均处于0.18-0.3之间,说明我国的教育投资现状处于高度平均或者相对的状态。

从1997年到2007年,东、中、西部地区的各省市的教育基尼系数普遍降低了,全国的教育投资不平等程度有所改善。我国30个省市中教育基尼系数降低幅度最大的五个地区是:青海、山东、宁夏、河北、江苏,其中青海地区较1997年相比降低了48.8%,故就平均水平而言,西部地区教育基尼系数降低的变动趋势最明显。

(2)东部地区的教育投资公平程度高于中、西部地区。2007年东部地区大部分省市的教育基尼系数处于0.2以下,东部地区的教育资源分配大约处于高度公平的程度。

中部地区的教育基尼系数在0.18-0.26之间波动,教育投资公平度略低于东部地区各省市。西部地区大部分省市的教育基尼系数都在0.25-0.3左右波动,其中,甘肃省和青海省的教育基尼系数最高,都是0.29。可见,越是经济相对落后的地区,教育资源分布就越不平等。

(二)地区教育投资与经济增长的实证分析

1.各指标的单位根检验和协整检验

由于选取的数据较多,因此在分析东中西区域之间的差异时,为保证分析结果的稳健性,本文选用同质面板的LLC检验和异质面板的IPS检验和Fisher-PP检验对各变量的水平值进行单位根检验,检验模型包含有截距项和趋势项,检验结果如表1所示。

表1 教育投资面板数据的单位根检验结果

注:检验模型中均包含截距项和趋势项,*、**、***代表各变量在1%、5%、10%的水平下通过单位根检验。

由表1,从单位根检验结果看,在LLC检验和IPS检验以及Fisher-PP检验三种方法的综合考虑下,笔者认定LGDP、FU、A VE、DZ、GINI这5个被检验变量不能拒绝变量非平稳的假设,但是它们的一阶差分项都显著地拒绝了变量非平稳的假设。因此,可以将继续进行变量间的面板数据协整检验,检验结果见表2。

表2 教育投资面板数据的协整检验结果

注:*表示5%的水平下通过协整检验。

由表2,Kao检验的原假设是面板数据没有协整关系,检验结果P值小于0.05,能够拒绝原假设,因此,笔者认定LGDP、FU、A VE、DZ、GINI这5个被检验变量具有协整关系。因此可以进行变量间的Granger因果关系检验。

2.各指标的Granger因果检验

与时间序列一样,如果面板数据间存在协整关系,就可以建立误差修正模型来估计变量间的Granger 因果关系。本文将Engle和Granger提出的Granger因果关系、误差修正模型引入到面板数据分析中,用基于面板的误差修正模型去估计变量间的因果关系。估计结果见表3。

表3 教育投资面板数据的因果关系检验结果

注:当滞后阶数为2 时,*、**、***分别代表各变量在1%、5%、10%的水平下拒绝原假设。

从表3可见,在10%显著性水平下,除了教育基尼系数和平均受教育年限外,东部地区存在着人均GDP 与人均教育经费、万人大专以上学历人数两个指标的单向因果关系。

中部地区的检验结果同于西部地区,而在5%和10%显著性水平下,除教育基尼系数外,中部、西部地区存在人均GDP 与人均教育经费、平均受教育年限、万人大专以上学历人数三个指标的单向因果关系;同时中、西部地区存在人均GDP 与万人大专以上学历人数的双向因果关系。

检验结果表明,教育投资规模随着人均GDP 的增长而增长;而教育投资质量与人均GDP 相互影响;教育投资公平度却并不影响着人均GDP 。这是因为我国东、中、西部各省市的教育基尼系数都处于0.18-0.3之间,而且1997-2007年11年之间波动变化不大,教育投资的公平程度较高,教育资源分配合理,已经处于有利于经济发展的公平状态。

3.模型估计

(1)Panel Data 模型选择

使用面板数据模型,第一步需要确定使用哪种模型,主要是检验两个假设:

11242124124

::H H βββαααβββ=========

在假设1H ,2H 下检验统计量 1F ,2F 服从相应自由度下的F 分布:

[][]

[]

2313()(1)(1),(1)(1)S S N k F F N k N T k S N T k -=

----- -[][]

[]1323()(1)(1)(1)(1),(1)(1)S S N k F F N k N T k S N T k -+=

-+---- -

123S S S 、、分别为混合估计模型、变截距模型和变系数模型的残差平方和, N T K

、、分别表示截面个数、时间和待估参数个数。若不能拒绝假设2H ,则可以认为样本数据符合不变系数模型,无需进行进一步检验。而若拒绝假设2H ,则还需要检验假设1H 。若不能拒绝1H 假设,则认为符合变截距模型,反之符合变系数模型。检验结果见表4。

表4 东、中、西部地区面板数据模型的选择

如表4所示,统计量2F 大于临界值,不能拒绝假设2H ,即可以认为东部、中部以及西部地区样本数据不符合不变系数模型。统计量1F 大于临界值,不能拒绝假设1H ,即可以认为东部、中部以及西部地区样本数据符合变系数模型。

(2)Panel Data 模型估计

根据检验结果,运用Eviews6.0软件建立Panel Data 变系数模型分析我国各东、中、西部地区教育投资对经济增长产生的区域经济差异效应。得到各影响因素的回归结果如表5所示。

表5 我国东、中、西部地区面板模型回归结果

表5回归结果表明:

①教育投资规模和教育投资质量对经济增长均有显著的促进作用,教育投资不公平度对经济增长有阻碍作用。

总体来说各地区的教育投资规模扩大和教育投资质量提高会推动经济增长,但是各地区回归模型中的斜率系数不同,故全国各地区的教育投资对经济增长的贡献不同。而截距项数据表明东部地区教育投资对经济增长的影响最大,其次是中部和西部。

②教育投资规模对于经济增长的作用在经济发展的过程中表现为先弱、后强、最后稍有降低的趋势。

从教育投资规模来看,西部地区的人均教育经费对经济增长的贡献率最大,高达21%,其次是中部、东部地区,分别是11%、6%。由于目前西部地区教育经费投入不足,加大教育经费的投入,明显促进了西部地区的经济增长,东部地区教育经费投入较充足,故加大教育经费的投入对经济增长的促进作用明显低于中、西部地区。因此可以推断出,随着教育投资规模从小到大,可以明显促进经济发展,但是随着教育投资规模的加强,对经济增长的贡献率却是逐渐递减的。

平均受教育年限对经济增长的影响为负,但是目前负面影响较小。这表明过度的注重教育投资规模的扩大,反而不利于经济的发展。美国、德国、芬兰、日本和韩国的发展历程都揭示了高等学历人才对于经济发展的乘数作用远高于基础教育的发展。国家和地方政府制订教育发展战略时,需要重视回收期相对较长,显性收益时间滞后的高等教育的投资。

③目前各地区教育投资质量对经济增长的促进作用处于较低水平。从教育投资质量方

面来看,东、中、西部地区万人大专以上学历人数的增加对经济发展具有相同的效用,但是贡献率非常低。我国目前东、中、西部地区的高等学历人才并不多,相对于教育投资规模简单地扩大,高素质人才队伍的扩增能够在后续发展上增强经济发展后劲。但是我国目前仍处于发展中国家,还是粗放式经济,以投资驱动为主,相较于发达国家,高级人力资本对经济增长的贡献并不明显。

④目前各地区教育投资公平度阻碍经济增长,西部地区抑制作用比东、中部明显。从教育投资公平度方面来看,由于东、中、西部地区的教育基尼系数对经济增长均是反作用。东、中部地区的教育不平等对经济增长的抑制作用不明显,西部地区教育不平等对经济增长的阻碍作用较为明显。目前东、中部地区的教育投资的公平状况明显好于西部地区,这说明公平的教育资源分配可以促进经济的发展。

四、教育投资与经济增长的空间影响因素分析

为了进一步探索不同省市之间教育与经济增长间的地域因素影响差异,本文选取2007年人均GDP、人均教育经费、人均受教育年限、万人大专以上学历人数、教育基尼系数,同时引入29个省市省会地区之间的公路营运里程(不含海南省、西藏省)作为衡量各省之间距离的指标,建立地理加权模型,考察2007年省级截面数据中教育投资规模、质量以及公平度对经济增长的影响。数据来源于《中国高速公路及各等级公路网地图册》。

(一)空间相关性检验

本文采用R软件对自变量和因变量进行了空间相关性检验。截面数据回归估计残差的Moran’s I统计量值见表6。

表6 空间相关性检验结果

注:*分别代表各变量在1%的水平下拒绝原假设。

由表6可以说明,五个变量的Moran’s I统计量的P值都小于0.01,故能够拒绝原假设,认为各变量的截面数据均具有显著正空间相关性。因此在进行实证研究时,有必要考虑空间因素,下面将建立空间计量模型来估计我国各省市间教育投资对经济增长影响的差异性。

(二)地理加权回归模型的建立及分析

通过上述初步分析可以看出,我国省域之间由于地理因素存在着一定差距。应该用地理加权回归方法(GWR)为进一步研究复杂的空间变化。

直接用SAS进行编程建模,建模后得到的各省域的GWR系数估计结果见表11(编程过

程见附件2)。

表7 地理加权回归模型参数估计结果

由表7可以得出:

1.我国各省市现阶段存在较大教育投资规模差距;各省市教育投资规模扩大对经济增

长均具有积极重要的作用,东部地区省市教育投资规模的扩大对经济增长的促进作用略高于其他省市。

分析地区间的差异可以发现,不同地区人均教育经费对人均GDP增长率的促进作用略有差异,最高的是福建省、浙江、上海紧随其后,人均教育经费对人均GDP正效应比较大的地方还有广东、江苏、江西、吉林、湖南、辽宁。不同地区的人均受教育年限对人均GDP 增长率的促进作用有差异性,最高的是广东省,贵州、福建、广西、江西、湖南紧随其后,正效应较大的地方还有上海、江苏、浙江、安徽。

2.我国各省市高等人力资本带来的贡献率并不高。

东、中部地区万人大专以上学历人数的增加对经济发展具有相同的负效用,但是贡献率并不高,平均只有0.01%。我国目前各经济区域的高度学历人才并不多,对经济增长的贡献率非常低。中国的经济增长主要还是依靠物质资本的投入,高等人力资本带来的贡献率并不高。相对于教育投资规模的扩大,高素质的人才队伍的增强能够更好的促进经济发展。但是我国目前处于发展中国家,以投资驱动为主,相较于发达国家,高级人力资本对经济增长的贡献不明显,教育投资质量对于经济增长的促进作用仍然处于较低水平。

3.各省市地区的教育基尼系数对经济增长均是反作用。

进一步考虑地区间教育公平程度的差异,不同省市的教育基尼系数对经济增长的负效应具有差异性,其中负效应最高的是浙江省,高达-1.9969,其次吉林、黑龙江、辽宁、内蒙古、北京,负效应最低的是广西、广东、福建、贵州、重庆。结合目前各省市的教育投资基尼系数,在地理加权模型中考虑了地理距离因素的影响,因此教育资源的分配产生的教育投资不公平程度与经济增长的阻碍作用并不是完全正相关关系。这与面板模型估计结果得出的结论有差异,正是因为考虑了各省市之间地理差距因素对教育投资公平度的影响。

五、主要结论和政策启示

(一)主要结论

本文要的结论如下:

1.我国东、中、西部各省市存在较大的经济差距和教育投资差距。东部地区各省市的经济增长速度快于中、西部地区。同时,西部地区各省市在教育投资方面较落后。

2.基础教育和高等教育取得很大进展,受教育程度普遍提高。经济较发达的东部地区人均受教育年限以及高等教育的人口比例都高于中部和西部。

3.随着教育水平的提高,我国各地区教育不平等程度有所下降。但经济发展相对落后的西部的教育不平等程度仍大于东部和中部。

4.我国各地区的教育投资规模扩大对经济增长均具有积极重要的作用。东、中部地区的大部分省市的教育投资规模对经济增长的促进作用略高于其他省市。

5.我国各省市高等人力资本带来的贡献率并不高。教育投资质量对于经济增长的促进作用仍然处于较低的水平。

6.各地区的教育投资的不公平程度阻碍经济增长。西部地区抑制作用比东、中部明显。

(二)政策启示

充分认识教育投资对于我国经济增长的重要性,着力改变目前我国教育投资不足的问题,促进经济增长的良性循环,应该注意以下几项措施:

1.加大教育投资,基础教育和高等教育兼备

我国人均教育经费、人均受教育年限、万人大专以上学历人数等都处于世界落后国家行列中。我国的人均受教育年限不断增加,教育基尼系数有所下降,但仍存在一定程度上的教育不平等。政府教育投资的不足在一定程度上制约了教育部门的发展。因此政府教育投资的重点是义务教育投资,政府应当成为义务教育的完全责任主体,确保义务教育真正成为普适性的、完全公平的福利教育。现代化进程离不开人力资本的有效开发,其中包括高等人力资本的开发,过度注重教育投资规模的扩大,反而不利于经济发展。高等人力资本对经济发展是具有无法替代的高效作用,因此也要适当的加大对高等教育的投资,将整个国民经济建立在劳动力素质不断提高并得到充分利用的基础上,也是我国经济可持续发展的必要条件。

2.缩小地区差距,加快中、西部地区的发展

西部地区的人力资本对经济的弹性都比较大,加大西部的经济发展力度,加强对西部地区的教育投资是提高我国总体人力资本的有效途径。西部地区的落后对当地的教育事业也有不利影响,人力资本状况也落后于东部。为了发展西部,国家责无旁贷地需要发挥平衡教育资源的作用,将资源更多地投向中西部地区。中西部地区经济发展的突破口就在于抓住机遇,全方位、多层次、宽领域对外开放,重点是扩宽利用外资的渠道,以投资促进发展。其次,中央政府对中西部地区的资金支持应集中在基础教育领域,可以降低儿童的失学率,提高总体的国民素质;另外,应加快中西部地区的经济发展,改善中西部地区教育不平等状况。

3.划分教育层次和类别,确定教育投资主体

随着知识经济时代的到来,知识产业正在逐渐成为社会的主导产业,拥有高素质的人才已经成为衡量一国竞争力的重要因素。作为提供知识、培养人才的教育事业,也必将成为经济发展和社会进步的重要动力源。在教育投资的战略中,应注重高素质人才队伍的发展,培养经济增长的动力和后劲。

政府包办教育的时代已经成为历史,面对教育需求的持续扩张和国民不同的教育需求,有必要走官民结合的发展道路。在高等教育和职业教育投资上,形成政府、民间资本共存的局面。这样,一方面能够有效地弥补我国教育投入经费不足的问题,满足人们的不同需求;另一方面还可以形成一个政府与民间教育共存的竞争局面,有利于教育质量的提高。

主要参考文献

[1] 舒尔茨,《人力资本投资》[M],北京经济学院出版社,1992年。

[2] 蔡增正,《教育对经济增长贡献的计量分析——科教兴国战略的实证依据》[J],《经济研究》,1999(2):第39-48。

[3] 徐宽,《基尼系数的研究文献在过去八十年是如何拓展的》[J],《经济学季刊》,2003(4):第757-778页。

[4] 叶茂林,郑晓齐等,《教育对经济增长贡献的计量分析》[J],《数量经济技术研究》,2003(1):第89-92页。

[5] 王淑芬,《全国百强县教育与经济协调发展的定量研究》[J],《统计与决策》,2007(4):第86-88页。

[6]刘云忠,徐映梅,《我国城乡教育差距与城乡居民教育投入差距的协整研究》[J],《教育与经济》,2007(4):第42-46页。

[7] 吴舒卉,《华东地区教育支出与经济增长关系的实证分析》[J],《教育经济研究》,2010年:第178-179页。

Investment of Education and Economic Growth : An regional Study

of Panel Data

Abstract : Education is an important route to t he formation of human capital. Based on the Index of scale, quality and equality of education investment, this paper uses Gini coefficient to measure education inequality for 30 provinces in China during 1997-2007 , the results show that : the scale of investment obviously promoting economic growth , but when basic education raised to a certain level, the role in promoting economic growth gradually declining; the regional quality of education investment contribute little to the economic growth. The equality of eastern and central regions better than the western region, which shows a fair distribution of educational resources could promote economic development. But is not the main factor affected the economic development . To fundamentally solve the problem between the various areas development, we should continuously increase the education investment, also should pay attention to advance development of the high level of human capital, and continuously to resolve the equity of education investment.

Key words : Scale of Investment; Quality of Investment; Equality of Investment; Education Inequality; GINI Coefficient

MATLAB空间面板数据模型操作介绍

MATLAB空间面板数据模型操作简介 MATLAB安装:在民主湖资源站上下载MA TLAB 2009a,或者2010a,按照其中的安装说明安装MATLAB。(MATLAB较大,占用内存较大,安装的话可能也要花费一定的时间) 一、数据布局: 首先我们说一下MA TLAB处理空间面板数据时,数据文件是怎么布局的,熟悉eviews的同学可能知道,eviews中面板数据布局是:一个省份所有年份的数据作为一个单元(纵截面:一个时间序列),然后再排放另一个省份所有年份的数据,依次将所有省份的数据排放完,如下图,红框中“1-94”“1-95”“1-96”“1-97”中,1是省份的代号,94,95,96,97表示年份,eviews是将每个省份的数据放在一起,再将所有省份堆放在一起。 与eviews不同,MATLAB处理空间面板数据时,面板数据的布局是(在excel中说明):先排放一个横截面上的数据(即某年所有省份的数据),再将不同年份的横截面按时间顺序堆放在一起。如图:

这里需要说明的是,MA TLAB中省份的序号需要与空间权重矩阵中省份一一对应,我们一般就采用《中国统计年鉴》分地区数据中省份的排列顺序。(二阶空间权重矩阵我会在附件中给出)。 二、数据的输入: MATLAB与excel链接:在excel中点击“工具→加载宏→浏览”,找到MA TLAB的安装目录,一般来说,如果安装时没有修改安装路径,此安装目录为:C:\Programfiles\MATLAB\R2009a\toolbox\exlink,点击excllink.xla即可完成excel与MATLAB的链接。这样的话excel中的数据就可以直接导入MATLAB中形成MATLAB的数据文件。操作完成后excel 的加载宏界面如图: 选中“Spreadsheet Link EX3.0.3 for use with MATLAB”即表示我们希望excel 与MATLAB实现链

六步学会用MATLAB做空间计量回归详细步骤

1.excel与MATLAB链接: Excel: 选项——加载项——COM加载项——转到——没有勾选项 2. MATLAB安装目录中寻找toolbox——exlink——点击,启用宏 E:\MATLAB\toolbox\exlink 然后,Excel中就出现MATLAB工具 (注意Excel中的数据:) 3.启动matlab (1)点击start MATLAB (2)senddata to matlab ,并对变量矩阵变量进行命名(注意:选取变量为数值,不包括各变量) (data表中数据进行命名) (空间权重进行命名) (3)导入MATLAB中的两个矩阵变量就可以看见 4.将elhorst和jplv7两个程序文件夹复制到MATLAB安装目录 的toolbox文件夹

5.设置路径: 6.输入程序,得出结果 T=30; N=46; W=normw(W1); y=A(:,3); x=A(:,[4,6]); xconstant=ones(N*T,1); [nobs K]=size(x); results=ols(y,[xconstant x]); vnames=strvcat('logcit','intercept','logp','logy'); prt_reg(results,vnames,1); sige=results.sige*((nobs-K)/nobs); loglikols=-nobs/2*log(2*pi*sige)-1/(2*sige)*results.resid'*results.resid % The (robust)LM tests developed by Elhorst LMsarsem_panel(results,W,y,[xconstant x]); % (Robust) LM tests 解释

贝叶斯空间计量模型

贝叶斯空间计量模型集团企业公司编码:(LL3698-KKI1269-TM2483-LUI12689-ITT289-

贝叶斯空间计量模型一、采用贝叶斯空间计量模型的原因 残差项可能存在异方差,而ML估计方法的前提是同方差,因此,当残差项存在异方差时,采用ML方法估计出的参数结果不具备稳健性。二、贝叶斯空间计量模型的估计方法 (一)待估参数 对于空间计量模型(以空间自回归模型为例) 假设残差项是异方差的,即 上述模型需要估计的参数有: 共计n+2个参数,存在自由度问题,难以进行参数检验。 服从自由度为r的卡方分布。如为此根据大数定律,增加了新的假设:v i 此以来,待估参数将减少为3个。 (二)参数估计方法 采用MCMC(MarkovChainMonteCarlo)参数估计思想,具体的抽样方法选择吉布斯抽样方法(Gibbssamplingapproach) 在随意给定待估参数一个初始值之后,开始生成参数的新数值,并根据新数值生成其他参数的新数值,如此往复,对每一个待估参数,将得到一组生成的数值,根据该组数值,计算其均值,即为待估参数的贝叶斯估计值。 三、贝叶斯空间计量模型的类型 空间自回归模型far_g()

空间滞后模型(空间回归自回归混合模型)sar_g() 空间误差模型sem_g() 广义空间模型(空间自相关模型)sac_g() 四、贝叶斯空间模型与普通空间模型的选择标准 首先按照参数显着性,以及极大似然值,确定普通空间计量模型的具体类型,之后对于该确定的类型,再判断是否需要进一步采用贝叶斯估计方法。 标准一:对普通空间计量模型的残差项做图,观察参数项是否是正态分布,若非正态分布,则考虑使用贝叶斯方法估计。 技巧:r=30的贝叶斯估计等价于普通空间计量模型估计,此时可以做出v的分布图,观察其是否基本等于1,若否,则应采用贝叶斯估计方法。 标准二:若按标准一发现存在异方差,采用贝叶斯估计后,如果参数结果与普通空间计量方法存在较大差异,则说明采用贝叶斯估计是必要的。 例1:选举投票率普通SAR与贝叶斯SAR对比: loadelect.dat; loadford.dat; y=elect(:,7)./elect(:,8); x1=elect(:,9)./elect(:,8); x2=elect(:,10)./elect(:,8); x3=elect(:,11)./elect(:,8);

贝叶斯空间计量模型

贝叶斯空间计量模型 Prepared on 22 November 2020

贝叶斯空间计量模型 一、采用贝叶斯空间计量模型的原因 残差项可能存在异方差,而ML估计方法的前提是同方差,因此,当残差项存在异方差时,采用ML方法估计出的参数结果不具备稳健性。 二、贝叶斯空间计量模型的估计方法 (一)待估参数 对于空间计量模型(以空间自回归模型为例) 假设残差项是异方差的,即 上述模型需要估计的参数有: 共计n+2个参数,存在自由度问题,难以进行参数检验。 为此根据大数定律,增加了新的假设:v i服从自由度为r的卡方分布。如此以来,待估参数将减少为3个。 (二)参数估计方法 采用MCMC(Markov Chain Monte Carlo)参数估计思想,具体的抽样方法选择吉布斯抽样方法(Gibbs sampling approach) 在随意给定待估参数一个初始值之后,开始生成参数的新数值,并根据新数值生成其他参数的新数值,如此往复,对每一个待估参数,将得到一组生成的数值,根据该组数值,计算其均值,即为待估参数的贝叶斯估计值。

三、贝叶斯空间计量模型的类型 空间自回归模型 far_g() 空间滞后模型(空间回归自回归混合模型) sar_g() 空间误差模型 sem_g() 广义空间模型(空间自相关模型) sac_g() 四、贝叶斯空间模型与普通空间模型的选择标准 首先按照参数显着性,以及极大似然值,确定普通空间计量模型的具体类型,之后对于该确定的类型,再判断是否需要进一步采用贝叶斯估计方法。 标准一:对普通空间计量模型的残差项做图,观察参数项是否是正态分布,若非正态分布,则考虑使用贝叶斯方法估计。 技巧:r=30的贝叶斯估计等价于普通空间计量模型估计,此时可以做出v的分布图,观察其是否基本等于1,若否,则应采用贝叶斯估计方法。 标准二:若按标准一发现存在异方差,采用贝叶斯估计后,如果参数结果与普通空间计量方法存在较大差异,则说明采用贝叶斯估计是必要的。 例1:选举投票率普通SAR与贝叶斯SAR对比: load ; load ; y=elect(:,7)./elect(:,8);

面板数据的计量方法

1.什么是面板数据? 面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合数据(pool data)。面板数据是截面数据与时间序列综合起来的一种数据资源,是同时在时间和截面空间上取得的二维数据。 如:城市名:北京、上海、重庆、天津的GDP分别为10、11、9、8(单位亿元)。这就是截面数据,在一个时间点处切开,看各个城市的不同就是截面数据。如:2000、2001、2002、2003、2004各年的北京市GDP分别为8、9、10、11、12(单位亿元)。这就是时间序列,选一个城市,看各个样本时间点的不同就是时间序列。 如:2000、2001、2002、2003、2004各年中国所有直辖市的GDP分别为: 北京市分别为8、9、10、11、12; 上海市分别为9、10、11、12、13; 天津市分别为5、6、7、8、9; 重庆市分别为7、8、9、10、11(单位亿元)。 这就是面板数据。 2.面板数据的计量方法 利用面板数据建立模型的好处是:(1)由于观测值的增多,可以增加估计量的抽样精度。(2)对于固定效应模型能得到参数的一致估计量,甚至有效估计量。(3)面板数据建模比单截面数据建模可以获得更多的动态信息。例如1990-2000 年30 个省份的农业总产值数据。固定在某一年份上,它是由30 个农业总产值数字组成的截面数据;固定在某一省份上,它是由11 年农业总产值数据组成的一个时间序列。面板数据由30 个个体组成。共有330 个观测值。 面板数据模型的选择通常有三种形式:混合估计模型、固定效应模型和随机效应模型 第一种是混合估计模型(Pooled Regression Model)。如果从时间上看,不同个体之间不存在显著性差异;从截面上看,不同截面之间也不存在显著性差异,那么就可以直接把面板数据混合在一起用普通最小二乘法(OLS)估计参数。 第二种是固定效应模型(Fixed Effects Regression Model)。在面板数据散点图中,如果对于不同的截面或不同的时间序列,模型的截距是不同的,则可以采用在模型中加虚拟变量的方法估计回归参数,称此种模型为固定效应模型(fixed effects regression model)。 固定效应模型分为3种类型,即个体固定效应模型(entity fixed effects regression model)、时刻固定效应模型(time fixed effects regression model)和时刻个体固定效应模型(time and entity fixed effects regression model)。(1)个体固定效应模型。 个体固定效应模型就是对于不同的个体有不同截距的模型。如果对于不同的时间序列(个体)截距是不同的,但是对于不同的横截面,模型的截距没有显著性变化,那么就应该建立个体固定效应模型。注意:个体固定效应模型的EViwes输出结果中没有公共截距项。 (2)时刻固定效应模型。 时刻固定效应模型就是对于不同的截面(时刻点)有不同截距的模型。如果确知

MATLAB空间面板数据模型操作介绍

MATLAB 空间面板数据模型操作简介 MATLAB 安装: 在民主湖资源站上下载 MA TLAB 2009a ,或者 2010a ,按照其中的安装说明 安装 MATLAB 。( MATLAB 较大,占用内存较大,安装的话可能也要花费一定的时间) 一、数据布局 首先我们说一下 MA TLAB 处理空间面板数据时,数据文件是怎么布局的,熟悉 eviews 的同学 可能知道, eviews 中面板数据布局是:一个省份所有年份的数据作为一个单元(纵截面:一个时间 序列),然后再排放另一个省份所有年份的数据,依次将所有省份的数据排放完,如下图,红框中 “1-94”“1-95” “1-96” “ 1-97”中, 1是省份的代号, 94,95,96,97 表示年份, eviews 是将每个省 份的数据放在一起,再将所有省份堆放在一起。 与 eviews 不同, MATLAB 处理空间面板数据时,面板数据的布局是(在 excel 中说明): 先排 放一个横截面上的数据(即某年所有省份的数据) ,再将不同年份的横截面按时间顺序堆放在一起。 如图:

这里需要说明的是, MA TLAB 中省份的序号需要与空间权重矩阵中省份一一对应,我们一般就采用《中国统计年鉴》分地区数据中省份的排列顺序。(二阶空间权重矩阵我会在附件中给出)。二、数据的输入: MATLAB 与 excel链接:在 excel中点击“工具→加载宏→浏览” ,找到 MA TLAB 的安装目录,一般来说,如果安装时没有修改安装路径,此安装目录为: C:\Programfiles\MATLAB\R2009a\toolbox\exlink ,点击 excllink.xla 即可完成 excel 与 MATLAB 的链接。这样的话 excel 中的数据就可以直接导入 MATLAB 中形成 MATLAB 的数据文件。操作完成后 excel 的加载宏界面如图: 选中“Spreadsheet Link EX3.0.3 for use with MATLAB ”即表示我们希望 excel 与

空间面板数据分析——R的splm包资料

空间面板数据分析——R的splm包 (任建辉,暨南大学) The splm package provides methods for fitting spatial panel data by maximum likelihood and GM. 安装R软件及其编辑器Rstudio 网址:https://www.doczj.com/doc/d410397694.html, https://www.doczj.com/doc/d410397694.html,/ 下载好Rstudio以后,操作都可以Rstudio中完成了,包括命令的编写、命令运行、图形展示,最方便的要数查看数据了。 R界面 Rstudio界面,形如matlab

下面进入正题,了解splm包中的数据、命令及结果展示。所有命令都写在编辑窗口(studio 左上区域),可以单独的运行每行命令,也可选取一段一起执行,点run按钮。 1、首先,安装splm包并导入,命令如下: intall.packages(“splm”),选择最近的下载点 library(splm) > library(splm) 载入需要的程辑包:MASS 载入需要的程辑包:nlme 载入需要的程辑包:spdep 载入需要的程辑包:sp 载入需要的程辑包:Matrix 载入需要的程辑包:plm 载入需要的程辑包:bdsmatrix 载入程辑包:‘bdsmatrix’ 下列对象被屏蔽了from ‘package:base’: backsolve 载入需要的程辑包:Formula 载入需要的程辑包:sandwich 载入需要的程辑包:zoo 载入程辑包:‘zoo’ 下列对象被屏蔽了from ‘package:base’: as.Date, as.Date.numeric 载入需要的程辑包:spam 载入需要的程辑包:grid Spam version 0.40-0 (2013-09-11) is loaded. Type 'help( Spam)' or 'demo( spam)' for a short introduction and overview of this package. Help for individual functions is also obtained by adding the suffix '.spam' to the function name, e.g. 'help( chol.spam)'. 载入程辑包:‘spam’ 下列对象被屏蔽了from ‘package:bdsmatrix’:

面板数据的计量方法

面板数据的计量方法 1.什么是面板数据? 面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合数据(pool data)。面板数据是截面数据与时间序列综合起来的一种数据资源,是同时在时间和截面空间上取得的二维数据。 如:城市名:北京、上海、重庆、天津的GDP分别为10、11、9、8(单位亿元)。这就是截面数据,在一个时间点处切开,看各个城市的不同就是截面数据。如:2000、2001、2002、2003、2004各年的北京市GDP分别为8、9、10、11、12(单位亿元)。这就是时间序列,选一个城市,看各个样本时间点的不同就是时间序列。 如:2000、2001、2002、2003、2004各年中国所有直辖市的GDP分别为: 北京市分别为8、9、10、11、12; 上海市分别为9、10、11、12、13; 天津市分别为5、6、7、8、9; 重庆市分别为7、8、9、10、11(单位亿元)。 这就是面板数据。 2.面板数据的计量方法 利用面板数据建立模型的好处是:(1)由于观测值的增多,可以增加估计量的抽样精度。(2)对于固定效应模型能得到参数的一致估计量,甚至有效估计量。(3)面板数据建模比单截面数据建模可以获得更多的动态信息。例如1990-2000 年30 个省份的农业总产值数据。固定在某一年份上,它是由30 个农业总产值数字组成的截面数据;固定在某一省份上,它是由11 年农业总产值数据组成的一个时间序列。面板数据由30 个个体组成。共有330 个观测值。 面板数据模型的选择通常有三种形式:混合估计模型、固定效应模型和随机效应模型 第一种是混合估计模型(Pooled Regression Model)。如果从时间上看,不同个体之间不存在显著性差异;从截面上看,不同截面之间也不存在显著性差异,那么就可以直接把面板数据混合在一起用普通最小二乘法(OLS)估计参数。 第二种是固定效应模型(Fixed Effects Regression Model)。在面板数据散点图中,如果对于不同的截面或不同的时间序列,模型的截距是不同的,则可以采用在模型中加虚拟变量的方法估计回归参数,称此种模型为固定效应模型(fixed effects regression model)。 固定效应模型分为3种类型,即个体固定效应模型(entity fixed effects regression model)、时刻固定效应模型(time fixed effects regression model)和时刻个体固定效应模型(time and entity fixed effects regression model)。(1)个体固定效应模型。 个体固定效应模型就是对于不同的个体有不同截距的模型。如果对于不同的时间序列(个体)截距是不同的,但是对于不同的横截面,模型的截距没有显著性变化,那么就应该建立个体固定效应模型。注意:个体固定效应模型的EViwes输

空间面板数据计量经济分析

空间面板数据计量经济分析 空间面板数据计量经济分析 *以上分别介绍了区域创新过程中空间效应(依赖性和异质性)的空间计量检测,以及纳入空间效应的计量模型的估计方法——空间常系数回归模型(空间滞后模型,SLM 和空间误差模型,SEM )和空间变系数回归模型(地理加权回归模型,GWR );同时还介绍和分析了面板数据(Panel Data )计量经济学方法的估计和检验。 *可以看出,目前的空间计量经济学模型使用的数据集主要是截面数据,只考虑了空间单元之间的相关性,而忽略具有时空演变特征的时间尺度之间的相关性,这显然是一个美中不足。 *Anselin (1988)也认识到这一点。当然,大多学者通过将多个时期截面数据变量计算多年平均值的办法来综合消除时间波动的影响和干扰,但是这种做法仍然造成大量具有时间演变特征的创新行为信息的损失,从而无法科学和客观地认识和揭示具有时空二维特征的研发与创新过程的真实机制。*面板数据(Panel Data )计量经济模型作为目前一种前沿的计量经济估计技术,由于其可以综合创新行为变量时间尺度的信息和截面(地域空间)单元的信息,同时集成考虑了时间相关性和空间(截面)相关性,因而能够科学而客观地反映受到时空交互相关性作用的创新行为的特征和规律,是定量揭示研发、知识溢出与区域创新相互作用关系的有效方法。但是,限于在所有时刻对所有个体(空间)均相等的假定(即不考虑空间效应),面板数据计量经济学理论也有其美中不足之处,具有很大的改进余地。 *鉴于空间计量经济学理论方法和面板数据计量经济学理论方法各有所长,把面板数据模型的优点和空间计量经济学模型的特点有机结合起来,构建一个综合考虑了变量时空二维特征和信息的空间面板数据计量经济模型,则是一种新颖的研究思路。以下根据空间计量经济模型和标准的面板数据模型[1]的建模思路,提出空间面板数据(Spatial Panel Data Model ,SPDM )模型的建模思路和过程。 [1]与动态面板数据模型的建模思路类似,只要施加一些假定,引入因变量的滞后项,则为空间动态面板数据模型。 空间滞后面板数据计量分析 *考虑一个标准的面板数据模型: it it it it it y αx βμ=++*如果将变量的真实的区域空间自相关性(依赖性)(Anselin &Florax ,1995)考虑到创新行为中来,这种创新行为的空间自相关性可以视为区域创新过程中的一种外部溢出形式,这样则可以设定如下模型: it it it it it it y αWy x βμρ=+++*上式为空间滞后面板数据(Spatial Lag Panel Data Model ,SLPDM )计量经济模型。其中,是创新的空间滞后变量,主要度量在地理空间上邻近地区的外部知识溢出,是一个区域在地理上邻近的区域在时期创新行为变量的加权求和。 空间误差面板数据计量分析 *如果在创新行为的空间依赖性存在误差扰动项中来测度邻近地区创新因变量的误差冲击对本地区创新行为的影响程度,则可以通过空间误差模型的空间依赖性原理可得: it it it it it y αx βμ=++it it it W μλμε=+*上式即为空间误差面板数据(Spatial Error Panel Data Model ,SEPDM )计量经济模型。其中,参数衡量了样本观察值的误差项引进的一个区域间溢出成分。 *因为已经在面板数据模型中考虑了创新行为变量的空间依赖性,因此采用一般面板数据模型的估计技术如OLS 或GLS 等将具有良好的估计效果。如果能够综合考虑面板数据模型中的一些假定,如时间加权(Period Weights )或截面加权(Cross-section Weights ),则可获得更加符合创新现实的估计结果。

六步学会用做空间计量回归详细步骤

与MATLAB链接: Excel: 选项——加载项——COM加载项——转到——没有勾选项 2. MATLAB安装目录中寻找toolbox——exlink——点击,启用宏 E:\MATLAB\toolbox\exlink 然后,Excel中就出现MATLAB工具

(注意Excel中的数据:) 3.启动matlab (1)点击start MATLAB (2)senddata to matlab ,并对变量矩阵变量进行命名(注意:选取变量为数值,不包括各变量)

(data表中数据进行命名) (空间权重进行命名) (3)导入MATLAB中的两个矩阵变量就可以看见

4.将elhorst和jplv7两个程序文件夹复制到MATLAB安装目录的toolbox文件夹 5.设置路径:

6.输入程序,得出结果 T=30; N=46; W=normw(W1); y=A(:,3);

x=A(:,[4,6]); xconstant=ones(N*T,1); [nobs K]=size(x); results=ols(y,[xconstant x]); vnames=strvcat('logcit','intercept','logp','logy'); prt_reg(results,vnames,1); sige=*((nobs-K)/nobs); loglikols=-nobs/2*log(2*pi*sige)-1/(2*sige)*'* % The (robust)LM tests developed by Elhorst LMsarsem_panel(results,W,y,[xconstant x]); % (Robust) LM tests 解释 每一行分别表示:

空间面板数据分析R的splm包

空间面板数据分析——R的s p l m包 (任建辉,暨南大学) The splm package provides methods for fitting spatial panel data by maximum likelihood and GM. 安装R软件及其编辑器Rstudio 网址:https://www.doczj.com/doc/d410397694.html, 下载好Rstudio以后,操作都可以Rstudio中完成了,包括命令的编写、命令运行、图形展示,最方便的要数查看数据了。 R界面 Rstudio界面,形如matlab 下面进入正题,了解splm包中的数据、命令及结果展示。所有命令都写在编辑窗口(studio左上区域),可以单独的运行每行命令,也可选取一段一起执行,点run按钮。 1、首先,安装splm包并导入,命令如下: intall.packages(“splm”),选择最近的下载点 library(splm) > library(splm) 载入需要的程辑包:MASS 载入需要的程辑包:nlme 载入需要的程辑包:spdep 载入需要的程辑包:sp 载入需要的程辑包:Matrix 载入需要的程辑包:plm 载入需要的程辑包:bdsmatrix 载入程辑包:‘bdsmatrix’ 下列对象被屏蔽了from ‘package:base’: backsolve

载入需要的程辑包:Formula 载入需要的程辑包:sandwich 载入需要的程辑包:zoo 载入程辑包:‘zoo’ 下列对象被屏蔽了from ‘package:base’: 载入需要的程辑包:spam 载入需要的程辑包:grid Spam version 0.40-0 (2013-09-11) is loaded. Type 'help( Spam)' or 'demo( spam)' for a short introduction and overview of this package. Help for individual functions is also obtained by adding the suffix '.spam' to the function name, e.g. 'help( chol.spam)'. 载入程辑包:‘spam’ 下列对象被屏蔽了from ‘package:bdsmatrix’: backsolve 下列对象被屏蔽了from ‘package:base’: backsolve, forwardsolve 载入需要的程辑包:ibdreg 载入需要的程辑包:car 载入需要的程辑包:lmtest 载入需要的程辑包:Ecdat 载入程辑包:‘Ecdat’ 下列对象被屏蔽了from ‘package:car’: Mroz 下列对象被屏蔽了from ‘package:nlme’: Gasoline 下列对象被屏蔽了from ‘package:MASS’: SP500 下列对象被屏蔽了from ‘package:datasets’: Orange 载入需要的程辑包:maxLik 载入需要的程辑包:miscTools Please cite the 'maxLik' package as: Henningsen, Arne and Toomet, Ott (2011). maxLik: A package for maximum likelihood es timation in R. Computational Statistics 26(3), 443-458. DOI 10.1007/s00180-010-0217 -1. If you have questions, suggestions, or comments regarding the 'maxLik' package, plea se use a forum or 'tracker' at maxLik's R-Forge site: Warning message: 程辑包‘Matrix’是用R版本3.0.3 来建造的 注意:在导入splm时,如果发现还有其他配套的包没有安装,需要先安装。 2、接着,查看数据及结构,命令如下:

Stata命令大全-面板数据计量分析与软件实现

Stata命令大全面板数据计量分析与软件实现 说明:以下do文件相当一部分内容来自于中山大学连玉君STATA教程,感谢他的贡献。本人做了一定的修改与筛选。 *----------面板数据模型 * 1.静态面板模型:FE 和RE * 2.模型选择:FE vs POLS, RE vs POLS, FE vs RE (pols混合最小二乘估计) * 3.异方差、序列相关和截面相关检验 * 4.动态面板模型(DID-GMM,SYS-GMM) * 5.面板随机前沿模型 * 6.面板协整分析(FMOLS,DOLS) *** 说明:1-5均用STATA软件实现, 6用GAUSS软件实现。 * 生产效率分析(尤其指TFP):数据包络分析(DEA)与随机前沿分析(SFA) *** 说明:DEA由DEAP2.1软件实现,SFA由Frontier4.1实现,尤其后者,侧重于比较C-D与Translog生产函数,一步法与两步法的区别。常应用于地区经济差异、FDI 溢出效应(Spillovers Effect)、工业行业效率状况等。 * 空间计量分析:SLM模型与SEM模型 *说明:STATA与Matlab结合使用。常应用于空间溢出效应(R&D)、财政分权、地方政府公共行为等。 * --------------------------------- * --------一、常用的数据处理与作图----------- * --------------------------------- * 指定面板格式 xtset id year (id为截面名称,year为时间名称) xtdes /*数据特征*/ xtsum logy h /*数据统计特征*/ sum logy h /*数据统计特征*/ *添加标签或更改变量名 label var h "人力资本"

空间计量经济学模型归纳

空间计量经济学模型 空间相关性是指 () ,i j y f y i j =≠即i y 与j y 相关 模型可表示为() (),1i j j i i y f y x i j βε=++≠ 其中,()f g 为线性函数,(1)式的具体形式为 () ()2,0,2i ij j i i i i j y a y x N βεεδ≠=++∑: 如果只考虑应变量空间相关性,则(2)式变为(3)式 ()()21 ,0,,1,2...3n i ij j i i i y W y N i n ρεεδ==+=∑: 式中 1 n ij j i W y =∑为空间滞后算子,ij W 为维空间权重矩阵n n W ?中的元素,ρ为待估的空间自相 关系数。0ρ≠,存在空间效应 (3)式的矩阵形式为() ()21, 0,4u n y Wy N I ρεδ?=: (4)式称为一阶空间自回归模型,记为FAR 模型 当在模型中引入一系列解释变量X 时,形式如下 () ()2,0,5n y Wy X N I ρβεεδ=++: (5)式称为空间自回归模型,记为SAR 模型 当个体间的空间效应体现在模型扰动项时有 () ()21,,0,6u n y X u u Wu N I βλεδ?=+=: (6)式成为空间误差模型,记为SEM 模型 当应变量与扰动项均存在空间相关时有 () ()2121,,0,7u n y W y X u u W u N I ρβλεεδ?=++=+: (7)式称为一般空间模型,记为SAC 模型 当0X =且20W =时,SAC →FAR ;当20W =时,SAC →SAR 当10W =时,SAC →SEM

第十六章-面板数据模型一

第16章静态面板数据模型时间序列数据或截面数据都是一维数据。例如时间序列数据是变量按时间得到的数据;截面数据是变量在截面空间上的数据。 面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合数据(pool data)。面板数据是同时在时间和截面空间上取得的二维数据。面板数据从横截面(cross section)上看,是由若干个体(entity, unit, individual)在某一时刻构成的截面观测值,从纵剖面(longitudinal section)上看是一个时间序列。 对于面板数据y it(i=1,2,…,N,t=1,2,…,T)来说,如果从横截面上看,每个变量都有观测值,从纵剖面上看,每一期都有观测值,则称此面板数据为平衡面板数据(balanced panel data)。若在面板数据中丢失若干个观测值,则称此面板数据为非平衡面板数据(unbalanced panel data)。 本章主要讨论静态面板数据模型的相关理论及软件操作,首先从模型的检验开始到介绍变截距模型中的固定影响变截距模型和随机影响变截距模型,然后到变系数模型。本章的流程图如下:

16.1面板数据模型建模的基本原理 在应用多元回归分析建立的计量经济模型时,如果所建的模型中缺失了某些不可观测的重要解释变量,使得回归模型随机误差项常常存在自相关。于是回归参数的最小二乘法OLS 估计量不再是无偏估计或有效估计。但是,运用面板数据建立的计量经济模型时,对于一些忽略的解释变量可以不需要其实际观察值,而通过控制该变量对被解释变量的影响的方法获得模型参数的无偏估计。 由此可见,面板数据不仅可以同时利用截面数据和时间序列数据建立计量经济模型,而且能更好地识别和度量单纯的时间序列模型和单纯截面数据模型所不能发现的影响因素,它能够构造和检验更复杂的行为模型。例如:在宏观领域,它被广泛用于劳动经济学、国际金融、经济增长、产业结构、技术创新、税收政策等领域。 16.1.1面板数据模型基本框架 面板数据能更好地识别和度量时间序列或截面数据不可发觉的效应,有助于建立和检验更复杂的行为模型,其基本模型是如下形式的一般回归模型: 1,2,,,1,2,,it it it i t it y x i N t T αβδγε=++++==L L (16.1.1) 其中:it y 是个体i 在时间t 时期的观测值,α表示模型的常数项,i δ代表固定或者随机的截面效应,t γ代表固定或者随机的时期效应,it x 表示k 阶解释变量观测值向量。β表示解释变量的系数向量,并且在根据其条件的限制分为三种值,一是对所有截面和时期都是相同的常数,二是在不同的截面是不同的系数,三是在不同的时期是不同的。it ε是独立同分布的误差项,即()0it E ε=。 在公式(16.1.1)中,如果考虑k 个解释变量,自由度NT 远小于参数个数,对于截面成员方程,待估计参数的个数为((1))NT k N ++,对于时间截面方程,待估计参数的个数为((1))NT k T ++,这使得该模型无法估计。为了对模型进行估计,则可以建立以下的两类模型:从个体成员角度考虑,建立含有N 个个体成员方程的面板数据模型;在时间点上截面,建立含有T 个时间点截面方程的面板数据模型。 1)含有N 个个体成员方程的面板数据模型 模型形式如下: i T i it i T T i y l x l I αβδγε=++++ (16.1.2) 其中:i y 是个体i 的观观测值的时间序列。系数向量β取值受不同个体的影响,i x 表示个体i 解释变量观测值时间序列。T l 是T 阶的单位行向量,T I 是T 阶的单位列向量。 '12()T γγγγ=L ,,,,包括所有的时点效应。该式含有N 个截面方程。

基于面板数据和空间计量模型的研究

第二组数量经济与理论方法(二)(数理经济学等),全文11932字。 我国教育投资与经济增长的关系研究 ——基于面板数据和空间计量模型的研究 朱璐璐肖腊珍① (中南财经政法大学统计与数学学院) 【摘要】教育投资是人力资本形成的重要途径。在对教育投资等内涵的理解基础上,从教育投资规模、教育投资质量和教育投资公平度三个方面选取反映教育投资状况的指标,运用教育基尼系数量化了我国1997-2007年30个省份的教育投资公平程度。运用单位根检验、协整检验、格兰杰因果检验研究我国教育资和经济增长之间的互动因果关系,建立合适的Panel Data和空间计量模型进行实证研究。研究结果表明教育投资规模对经济增长的促进作用非常明显,但是当基础教育提高到一定水平后,对经济增长的促进作用开始逐步递减;各区域的高等学历人才并不多,对经济增长的贡献率非常低;目前东、中部地区的教育投资的公平状况明显好于西部地区,公平的教育资源分配可以较好促进经济的发展。并提出要继续加大各地区教育投入,同时注重高等人才的培养,继续解决好教育投资公平问题。 关键词:教育投资规模教育投资质量教育投资公平教育基尼系数 引言 中国是世界上最大的发展中国家,经济增长是实现人民生活达到小康水平以及赶上中等发达国家经济发展水平目标的主要途径,因而经济增长理所当然地成为了中国经济理论研究的重点。中国幅员辽阔、自然资源丰富,人口众多,劳动力资源充足,但是人口质量不高,人力资本存量不多,人力资本结构与经济发展的需求严重失衡。人力资本低质量,低存量造成的人力资本缺乏使其外在效应的产出受到严重限制,人力资本收益递增的规律难以发挥。 自改革开放以来,我国各区域发展差距不断扩大,东部地区发展形势较好,西部地区经济发展较差。除了政策以及地域、气候因素外,劳动者的素质有着非常大的影响作用。地区差异的拉大使得高素质的劳动力继续往东部流动,尤其集中在北京、上海、江苏、浙江和广东等地,促使这些地区的经济发展更快,而东西部的差异继续增大。因此本文希望通过实证分析找出我国各省、市教育投资与经济发展程度的关系,也分析经济增长对教育投资在各不同区域所带来的反作用,同时寻找我国目前教育投资状况不足的原因,给出相关建议。 一、文献综述 最早正视教育投资问题的英国古典经济学创始人威廉·配第(William Petty,1676)指出劳动创造价值、复杂劳动比简单劳动创造更多的价值。1776年,英国古典政治经济学奠基人亚当·斯密(Adam Smith,1776)最早明确提出并重视教育投资问题,他认为资本的累积、就业人口的增加及技术进步构成经济理论发展基础的三要素。进入19世纪,德国历史学派的 ①作者简介:朱璐璐,1985.4出生,女,中南财经政法大学统计与数学学院,统计学研究生; 肖腊珍,1964.1出生,女,中南财经政法大学统计与数学学院,硕士,副教授。中国数量经 济学会会员。

步学会用MATLAB做空间计量回归详细步骤.docx

与MATLAB链接: Excel : 选项——加载项——COM 加载项——转到——没有勾选项 2.MATLAB安装目录中寻找 toolbox —— exlink ——点击 , 启用宏 E:\MATLAB\toolbox\exlink 然后, Excel 中就出现MATLAB 工具

(注意 Excel 中的数据:) 3. 启动 matlab (1)点击 start MATLAB (2 )senddata to matlab,并对变量矩阵变量进行命名(注意:选取变量为数值,不包括各变量)

(data 表中数据进行命名) (空间权重进行命名) (3 )导入MATLAB中的两个矩阵变量就可以看见

4.将 elhorst 和 jplv7 两个程序文件夹复制到MATLAB 安装目录的 toolbox文件夹 5.设置路径:

6.输入程序,得出结果 T=30; N=46; W=normw(W1); y=A(:,3);

x=A(:,[4,6]); xconstant=ones(N*T,1); [nobs K]=size(x); results=ols(y,[xconstant x]); vnames=strvcat('logcit','intercept','logp','logy'); prt_reg(results,vnames,1); sige=*((nobs-K)/nobs); loglikols=-nobs/2*log(2*pi*sige)-1/(2*sige)*'* % The (robust)LM tests developed by Elhorst LMsarsem_panel(results,W,y,[xconstant x]); % (Robust) LM tests 解释 每一行分别表示: 该面板数据的时期数为30( T=30 ), 该面板数据有30 个地区( N=30 ), 将空间权重矩阵标准化(W=normw(w1)), 将名为 A(以矩阵形式出现在MATLABA 中)的变量的第 3 列数据定义为被解释变量y, 将名为 A 的变量的第4、 5、 6 列数据定义为解释变量矩阵x, 定义一个有N*T 行, 1 列的全 1 矩阵,该矩阵名为:xconstant ,( ones 即为全 1 矩阵) 说明解释变量矩阵x 的大小:有nobs 行, K 列。( size 为描述矩阵的大小)。

互助问答125问 动态空间计量模型的估计问题

您好!使用动态空间计量模型对问题进行估计时,同时使用的是矩估计的方法,如何实现那个AR(1)和AR(2)的检验呢?相应的代码是什么? AR(1),AR(2)是用来检验动态面板,如差分或系统GMM是否存在扰动项一阶和二阶自相关的。动态空间计量模型的使用未见推广的这些检验。空间计量中有SAR模型,即空间自相关(回归)模型。动态空间计量,动态空间面板模型的构建与检验仍然处在前沿的研究阶段,Elhost(2010)对Arrelano和bond的差分GMM估计量进行扩展,使其包括一个内生交互效应,且同时发现这种估计量仍然可能存在严重的偏误,特别是Wy t的参数的估计。 Kukenova andMonteiro(2009)、Jacobs et al(2009)同时研究了动态面板数据模型(Y t-1,Wy t-1),并扩展了Blundell and Bond(1998)的系统GMM估计,使之包含内生交互效应(Wy t),前者同时研究了内生解释变量Z t,后者研究了误差项 的空间自相关W t。他们发现系统GMM估计量要优于差分GMM,且减小了参数估计。动态空间面板模型的stata程序如下: clear *清空 ssc install spregdpd(or spregdhp) *安装spregdpd或spregdhp动态空间面板模板 help spregdpd(or spregdhp) *参阅帮助文件(有案例) help输出: Title+-------------------------------------------------------------spregdpd: Spatial Panel Arellano-Bond Linear Dynamic Regression:Lag & Durbin Mo > dels Syntax+------------------------------------------------------------ spregdpd depvarindepvars [weight] , nc(#) wmfile(weight_file) [ model(sar|sdm)run(xtabond|xtdhp|xtdpd|xtdpdsys) be fe re lmspac lmhet lmnormdiag tests stand inv inv2 mfx(lin, log) noconstant predict(new_var)resid(new_var) inst(vars) diff(vars) endog(vars) pre(vars) dgmmiv(varlist) collzero tolog twostep level(#) vce(vcetype) ] Model Options +----------------------------------------------------- 1- model(sar) MLE Spatial Panel Lag Model (SAR) 2- model(sdm) MLE Spatial Panel Durbin Model (SDM) Run Options+------------------------------------------------------- 1- run(xtdhp) [NEW]Han-Philips (2010) Linear Dynamic Panel Regression 2- run(xtabond) [xtabond]Arellano-Bond Linear Dynamic Panel Regression 3- run(xtdpd) [xtdpd]Arellano-Bond (1991) Linear Dynamic Panel Regression 4- run(xtdpdsys) [xtdpdsys] Arellano-Bover/Blundell-Bond (1995, 1998)

相关主题
文本预览
相关文档 最新文档