第七章-工具变量、2SLS、GMM
- 格式:ppt
- 大小:1.58 MB
- 文档页数:61
工具变量法(二):弱工具变量世上没有完美的计量方法,因为所有的计量方法与模型均依赖于一定的前提假设。
因此,在估计完计量模型后,通常需要对模型的前提假设进行检验,称为“诊断性检验”(diagnostic checking)或“模型检验”(model checking)。
工具变量法也不例外。
工具变量法的成立依赖于有效的工具变量(valid instruments),即所使用的工具变量须满足相关性(与内生解释变量相关)与外生性(与扰动项不相关)。
工具变量的相关性(Instrument Relevance)在大样本下,2SLS为一致估计。
但对于大多数实践中的有限样本(finite sample),2SLS估计量依然存在偏差(bias),并不以真实参数为其分布的中心,即而且,如果工具变量与内生变量的相关性较弱,则 2SLS 的偏差会变得更为严重。
直观来看,2SLS 的基本思想是通过外生的工具变量,从内生变量中分离出一部分外生变动(exogenous variations),以获得一致估计。
如果工具变量与内生变量的相关性很弱,则通过工具变量分离出的内生变量之外生变动仅包含很少的信息。
因此,利用这些少量信息进行的工具变量法估计就不准确,即使样本容量很大也很难收敛到真实的参数值。
这种工具变量称为“弱工具变量”(weak instruments)。
弱工具变量的后果弱工具变量的后果类似于样本容量过小,会导致 2SLS 的小样本性质变得很差,而 2SLS 的大样本分布也可能离正态分布相去甚远,致使基于大样本理论的统计推断失效。
下面通过蒙特卡洛模拟(Monte Carlo simulation)来直观地考察弱工具变量的后果。
考虑最简单的一元回归模型,假设其数据生成过程(data generating process)为:其中,为内生变量,与扰动项相关;而的真实系数为 2。
假设样本容量为10,000,并使用工具变量进行2SLS 回归。
2sls原理2sls原理解析1. 什么是2sls原理2sls(Two Stage Least Squares)是一种用于解决内生性问题的统计方法。
它通过两个阶段的回归来解决内生性引起的估计偏误问题。
2. 内生性问题内生性是指研究对象之间的关系使得同一方程中的一个变量可能同时被其他变量影响。
在经济学研究中,内生性是非常常见的问题,特别是当我们试图通过回归分析来确定因果效应时。
例如,我们想要研究教育对工资的影响,但我们发现教育水平与个体的家庭背景也存在相关性。
这个相关性可能存在因果关系,即教育决定了个体的家庭背景,也可能存在相反的因果关系,即个体的家庭背景决定了他们的教育水平。
在这种情况下,我们无法准确估计教育对工资的真实影响,因为我们无法将教育与家庭背景的影响区分开来。
3. 第一阶段回归为了解决内生性问题,2sls方法首先进行第一阶段回归。
在第一阶段,我们选择一个外生变量(Instrumental Variable,IV)来替代内生变量,该外生变量与内生变量相关但不与因变量相关。
继续上述的例子,我们可以选择政府实施的教育政策作为我们的外生变量。
政府实施教育政策可能会影响到个体的教育水平,但与个体的家庭背景无关。
我们将家庭背景作为内生变量,使用政府实施的教育政策作为工具变量。
我们先对教育水平与政府实施的教育政策进行回归分析,得到第一阶段的回归系数。
该回归系数代表了教育水平对政府实施的教育政策的影响程度。
4. 第二阶段回归在第一阶段回归得到的第一阶段系数为有效的工具变量后,我们进一步进行第二阶段回归分析。
第二阶段回归分析的目标是估计教育对工资的真实影响,而不受内生性的偏误影响。
我们将工资与个体的教育水平以及其他外生变量进行回归,使用第一阶段得到的有效工具变量作为教育水平的替代。
这样,第二阶段回归的系数代表了教育对工资的真实影响。
5. 2sls的优点与局限性2sls方法可以有效地解决内生性问题,从而得到更准确的因果效应估计。
工具变量法2SLS与GMM1第 10 章工具变量,2SLS 与 GMM10.1 解释变量与扰动项相关的例子例农产品市场均衡模型q d = α + α p + u (需求)t 0 1 t t ? q s = β + β p + v(供给) t ? q d 0 1 t t = q s(均衡)tt令q ≡q d=q s,可得t t tq t =α0+α1 p t +u tq =β+βp +vt 0 1 t t两个方程中的被解释变量与解释变量完全一样。
如直接作回归q ?O?LS?→p,估计的是需求函数还是供给函数?t t2图10.1 需求与供给决定市场均衡341 1 1 11 1把线性方程组中的( p t , q t )看成是未知数(内生变量),把(u t , v t ) 看作已知,可求解( p t , q t )为(u t , v t ) 的函数:p = p (u ,v ) = β0 - α0 + v t - u t ? t t t t α - β α - β ? 1 1 1 1 ?q = q (u ,v ) = α1β0 - α0 β1 + α1v t - β1u t ?? t t t t α - β α - β由于 p t 为(u t , v t ) 的函数,故Cov( p t , u t ) ≠ 0,Cov( p t , v t ) ≠ 0。
OLS 估计值α?1, β? 不是α , β 的一致估计量。
称这种偏差为“联立方程偏差”(simultaneity bias)或“内生变量偏差”(endogen eity bias)。
1如能将内生变量分成两部分,一部分与扰动项相关,另一部分与扰动项不相关,可用与扰动项不相关的那部分得到一致估计。
这种分离常借助另一“工具变量”来实现。
假设在图10.1 中,存在某个因素(变量)使得供给曲线经常移动,而需求曲线基本不动,则可估计需求曲线,参见图10.2。
这个使得供给曲线移动的变量就是工具变量。