计量经济学模型设定及数据问题.
- 格式:ppt
- 大小:729.00 KB
- 文档页数:62
第9章模型设定和数据问题的深入探讨9.1复习笔记考点一:函数形式设误检验(见表9-1)★★★★表9-1函数形式设误检验考点二:对无法观测解释变量使用代理变量★★★1.代理变量代理变量就是某种与分析中试图控制而又无法观测的变量相关的变量。
(1)遗漏变量问题的植入解假设在有3个自变量的模型中,其中有两个自变量是可以观测的,解释变量x3*观测不到:y=β0+β1x1+β2x2+β3x3*+u。
但有x3*的一个代理变量,即x3,有x3*=δ0+δ3x3+v3。
其中,x3*和x3正相关,所以δ3>0;截距δ0容许x3*和x3以不同的尺度来度量。
假设x3就是x3*,做y对x1,x2,x3的回归,从而利用x3得到β1和β2的无偏(或至少是一致)估计量。
在做OLS之前,只是用x3取代了x3*,所以称之为遗漏变量问题的植入解。
代理变量也可以以二值信息的形式出现。
(2)植入解能得到一致估计量所需的假定(见表9-2)表9-2植入解能得到一致估计量所需的假定2.用滞后因变量作为代理变量对于想要控制无法观测的因素,可以选择滞后因变量作为代理变量,这种方法适用于政策分析。
但是现期的差异很难用其他方法解释。
使用滞后被解释变量不是控制遗漏变量的唯一方法,但是这种方法适用于估计政策变量。
考点三:随机斜率模型★★★1.随机斜率模型的定义如果一个变量的偏效应取决于那些随着总体单位的不同而不同的无法观测因素,且只有一个解释变量x,就可以把这个一般模型写成:y i=a i+b i x i。
上式中的模型有时被称为随机系数模型或随机斜率模型。
对于上式模型,记a i=a+c i和b i=β+d i,则有E(c i)=0和E(d i)=0,代入模型得y i=a+βx i+u i,其中,u i=c i+d i x i。
2.保证OLS无偏(一致性)的条件(1)简单回归当u i=c i+d i x i时,无偏的充分条件就是E(c i|x i)=E(c i)=0和E(d i|x i)=E(d i)=0。
城镇居民家庭人均可支配收入及城市政府支出驱动经济增长的计量分析:1979~2009一.问题的提出2010年上海世界博览会已经圆满落下帷幕,在“城市让生活更美好”的主题下,这场持续184天的盛会向世界呈现了中国城市化进程中所取得的成就。
所谓城市化,就是指随着社会生产力的发展,人类的生产和生活有农村向城市转化的过程,表现为城市数量的增加和规模的扩大,城市消费、投资持续增加,进而改变经济发展的空间方向和基本方式。
二.模型设定统计表明,改革开放以来,特别是进入21世纪之后,在中国的城市化进程中,城市化率、城镇居民家庭人均可支配收入、城市政府支出以及城镇居民消费水平都有了显著的上升,因此,我们把这四个指标作为反映城市化的变量。
根据GDP 的取决于消费、投资、政府支出的基本原理,这四个变量应该可以很好的解揭示城市化对经济的驱动作用。
本实验主要选取1979~2009年的以下数据:1.城市化率:该指标主要反映的是城市人口规模。
2.经济增长:大多数的研究采用的是以人均GDP表示经济增长,也有使用单位资本GDP 来体现的,我们采用了前者。
3.城镇居民家庭人均可支配收入:4.城市政府支出:这里较为理想的指标是城镇人均政府支出,限于数据的可获得性,我们采用的是人均政府消费支出作为替代。
这是因为,政府消费支出多集中于城镇级别的政府,而农村基层行政部门消费支出比重较低。
5.城镇居民消费水平:这里采用城镇人均消费水平,而不是全社会人均消费水平以便能更好的反映出城市消费对经济增长的拉动作用。
模型形式的设计:Y=β1+β2X1+β3X2+β4X3+β5X4+μ其中,Y:人均GDPX1:城市化率X2:城镇居民家庭人均可支配收入X3:城市政府支出X4:城镇居民消费水平三.数据的搜集本实验获取的是1979~2009年的数据,如下表:年份人均GDP 城市化率城镇居民家庭人均可支配收入政府支出城镇居民消费水平1978 381 17.92 343.4 1122.09 405 1979 419 18.96 405.0 1281.79 425 1980 463 19.39 477.6 1228.83 489 1981 492 20.16 500.4 1138.41 521 1982 528 21.13 535.3 1229.98 536 1983 583 21.62 564.6 1409.52 558 1984 695 23.01 652.1 1701.02 618 1985 858 23.71 739.1 2004.25 765 1986 963 24.52 900.9 2204.91 872 1987 1112 25.32 1002.1 2262.18 998 1988 1366 25.81 1180.2 2491.21 1311 1989 1519 26.21 1373.9 2823.78 1466 1990 1644 26.41 1510.2 3083.59 1596 1991 1893 26.94 1700.6 3386.62 1840 1992 2311 27.46 2026.6 3742.20 2262 1993 2998 27.99 2577.4 4642.30 2924 1994 4044 28.51 3496.2 5792.62 3852 1995 5046 29.04 4283.0 6823.72 4931 1996 5846 30.48 4838.9 7937.55 5532 1997 6420 31.91 5160.3 9233.56 5823 1998 6796 33.35 5425.1 10798.18 6109 1999 7159 34.78 5854.0 13187.67 6405 2000 7858 36.22 6280.0 15886.50 6850 2001 8622 37.66 6859.6 18902.58 7113 2002 9398 39.09 7702.8 22053.15 7387 2003 10542 40.53 8472.2 24649.95 7901 2004 12336 41.76 9421.6 28486.89 8679 2005 14185 42.99 10493.0 33930.28 9410 2006 16500 43.90 11759.5 40422.73 10423 2007 20169 44.94 13785.8 49781.35 11904 2008 23708 45.68 15780.8 62592.66 13526 2009 25575 46.59 17174.7 76299.93四.模型的估计与调整(一).散点图020000400006000080000100002000030000Y(二).OLS 回归结果:Dependent Variable: Y Method: Least Squares Date: 06/19/11 Time: 23:27 Sample(adjusted): 1979 2008Included observations: 30 after adjusting endpointsVariable Coefficient Std. Error t-Statistic Prob. C 1675.936 502.4538 3.335504 0.0027 X1 -85.42903 23.51347 -3.633196 0.0013 X2 0.694786 0.332357 2.090482 0.0469 X3 0.161081 0.034738 4.636982 0.0001 X40.3637490.2269861.6025140.1216R-squared0.998932 Mean dependent var 5882.433 Adjusted R-squared 0.998761 S.D. dependent var 6258.838 S.E. of regression 220.3462 Akaike info criterion 13.77929 Sum squared resid 1213812. Schwarz criterion 14.01282 Log likelihood -201.6893 F-statistic 5843.189Y=1675.936-85.42903X1+0.694786X2+0.161081X3+0.363749X4由此可见:该模型的R^2=0.998932,Adjusted R-squared=0.998761可决系数很高,F检验值为5843.189,明显显著。
简述建立计量经济学模型的基本步骤计量经济学模型是经济学研究中的一个重要工具,它能够用来理解经济现象、分析经济政策以及预测经济变量的变化趋势。
建立计量经济学模型可以帮助经济学家对经济现象进行量化分析,揭示经济规律。
下面将简要介绍建立计量经济学模型的基本步骤。
第一步:明确研究目的和问题在建立计量经济学模型之前,首先需要明确研究的目的和问题。
研究目的可以是解释某一经济现象的原因,预测某一经济变量的未来趋势,或评估某一经济政策的效果等。
明确研究目的和问题有助于确定模型的结构和变量选择。
第二步:选择适当的模型框架选择适当的模型框架是建立计量经济学模型的关键一步。
模型框架决定了模型的基本结构和变量之间的关系。
常用的模型框架包括线性回归模型、时间序列模型、面板数据模型等。
选择适当的模型框架要考虑研究问题的特点和数据的性质,以及模型的可解释性和预测准确性等因素。
第三步:收集和整理数据建立计量经济学模型需要大量的数据支持。
在收集数据时,要注意数据的准确性和可靠性。
对于时间序列数据,需要收集一段时间内的连续观测值;对于截面数据,需要收集同一时间点上的多个观测值;对于面板数据,既需要收集多个时间点上的连续观测值,也需要收集同一时间点上的多个观测值。
收集和整理数据需要耐心和细心,以确保数据的完整性和一致性。
第四步:制定假设和建立模型在建立计量经济学模型时,需要制定一些假设,以简化模型和提高模型的可解释性。
假设通常包括线性关系假设、正态分布假设、无多重共线性假设等。
制定假设后,可以根据模型框架和变量之间的关系来建立模型。
模型的建立要根据经济理论和实际情况进行合理的假设和推断,以保证模型的有效性和可靠性。
第五步:估计模型参数在建立计量经济学模型后,需要通过统计方法来估计模型的参数。
常用的估计方法包括最小二乘法、极大似然估计法等。
通过估计模型参数,可以获得模型的具体数值,以及各个变量对目标变量的影响程度。
估计模型参数需要注意数据的性质和假设的合理性,以及估计结果的稳健性和显著性等。
建立计量经济学模型的步骤和要点一、理论模型的设计对所要研究的经济现象进行深入的分析,根据研究的目的,选择模型中将包含的因素,根据数据的可得性选择适当的变量来表征这些因素,并根据经济行为理论和样本数据显示出的变量间的关系,设定描述这些变量之间关系的数学表达式,即理论模型。
生产函数就是一个理论模型。
理论模型的设计主要包含三部分工作,即选择变量、确定变量之间的数学关系、拟定模型中待估计参数的数值范围。
1、确定模型所包含的变量在单方程模型中,变量分为两类。
作为研究对象的变量,也就是因果关系中的“果”,例如生产函数中的产出量,是模型中的被解释变量;而作为“原因”的变量,例如生产函数中的资本、劳动、技术,是模型中的解释变量。
确定模型所包含的变量,主要是指确定解释变量。
可以作为解释变量的有下列几类变量:外生经济变量、外生条件变量、外生政策变量和滞后被解释变量。
其中有些变量,如政策变量、条件变量经常以虚变量的形式出现。
严格他说,上述生产函数中的产出量、资本、劳动、技术等,只能称为“因素”,这些因素间存在着因果关系。
为了建立起计量经济学模型,必须选择适当的变量来表征这些因素,这些变量必须具有数据可得性。
于是,我们可以用总产值来表征产出量,用固走资产原值来表征资本,用职工人数来表征劳动,用时间作为一个变量来表征技术。
这样,最后建立的模型是关于总产值、固定资产原值、职工人数和时间变量之间关系的数学表达式。
下面,为了叙述方便,我们将“因素”与“变量”间的区别暂时略去,都以“变量”来表示。
关键在于,在确定了被解释变量之后,怎样才能正确地选择解释变量。
首先,需要正确理解和把握所研究的经济现象中暗含的经济学理论和经济行为规律。
这是正确选择解释变量的基础。
例如,在上述生产问题中,已经明确指出属于供给不足的情况,那么,影响产出量的因素就应该在投入要素方面,而在当前,一般的投入要素主要是技术、资本与劳动。
如果属于需求不足的情况,那么影响产出量的因素就应该在需求方面,而不在投入要素方面。
1.计量经济学的研究过程及内容:(1)模型设定(要有科学的理论依据、选择适当的数学形式、模型要兼顾真实性和实用性、包含随机误差项、方程中的变量要具有可观测性);(2)估计参数(参数是未知的,又是不可直接观测的。
由于随机误差项的存在,参数也不能通过变量值去精确计算。
只能通过变量样本观测值选择适当方法去估计);(3)模型检验(经济意义检验、统计推断检验、计量经济学检验、模型预测检验)(4)模型应用(经济结构分析、经济预测、政策评价、检验发展经济理论)2.数据的要求:真实性、完整性、可比性3.可利用来建立计量经济模型的关系:行为关系(如生产、投资、消费)、生产技术关系(如投入产出关系)、制度关系(如税率)、定义关系(根据定义表达的恒等式) 6.相关关系的特点(1)X 和Y 都是相互对称的随机变量YX XYγγ=(2)线性相关系数只反映变量间的线性相关程度,不能说明非线性相关关系(3)样本相关系数是总体相关系数的样本估计值,由于抽样波动,样本相关系数是个随机变量,其统计显著性有待检验(4)相关系数只能反映线性相关程度,不能确定因果关系,不能说明相关关系具体接近哪条直线7.回归是关于一个变量对另一个变量或多个变量依存关系的研究,用适当的数学模型去近似地表达或估计变量之间的平均变化关系,其目的是要根据解释变量的估计数值去估计所研究的被解释变量的总体平均值。
8.回归函数:应变量Y 的条件期望E(Y/Xi)随解释变量X 的的变化而有规律的变化,如果把Y 的条件期E(Y/Xi)望表现为X 的某种函数()()i i E Y X f X =,这个函数称为回归函数。
9.线性回归模型主要指就参数而言是“线性”,因为只要对参数而言是线性的,都可以用类似的方法估计其参数。
10.引入随机扰动项的原因:是未知影响因素的代表(理论的模糊性)、是无法取得数据的已知影响因素的代表(数据欠缺)、 是众多细小影响因素的综合代表(非系统性影响)、模型的设定误差(变量、函数形式的设定)、变量的观测误差(变量数据不符合实际)、经济现象的内在随机性(人类经济行为的内在随机性)11.样本回归函数与总体回归函数的区别:(1)总体回归函数虽然未知,但它是确定的;样本回归线却是随抽样波动而变化的,可以有许多条。