stata上机实验第五讲 工具变量(IV)
- 格式:ppt
- 大小:597.50 KB
- 文档页数:48
工具变量法(四):GMMProf. Lars Peter HansenWhat Hansen did with the generalized method of moments is show that when we have more moment conditions than parameters we can best estimate those parameters by giving more weight to the conditions that we have better information about. -- Alex Tabarrok (Marginal Revolution Blog)传统的工具变量法为2SLS,因为它操作方便,且同时适用于恰好识别与过度识别的情形。
然而,2SLS 仅在扰动项同方差的情况下,才是最有效率的。
理由很简单,如果每位个体的扰动项方差不相同(比如,大企业的方差一般不同于小企业的方差),则方差小的个体观测值所包含的信息量更大,而 2SLS 却对所有数据等量齐观地进行处理,故在异方差的情况下不是最有效率的。
在过度识别且存在异方差的情况下,更有效率的做法是“广义矩估计”(Generalized Method of Moments,简记 GMM)。
该方法由芝加哥大学的 Lars Peter Hansen 教授所提出 (Hansen, 1982),已成为最流行的计量方法之一,Hansen 也因此获得 2013年的诺贝尔经济学奖。
顾名思义,广义矩估计为矩估计的推广,故先介绍矩估计。
矩 (Moment)何为矩?简单说,矩就是随机变量之函数的期望。
比如,对于随机变量,其一阶原点矩为其期望,二阶中心矩为其方差,以此类推。
更一般地,考虑随机变量的函数。
显然,仍为随机变量,其期望也称为“矩”(moment)。
进一步推广,随机向量的函数之期望,也称为“矩”。
stata工具变量面板数据、工具变量选择和HAUSMAN检验的若干问题*第一节关于面板数据PANEL DATA1、面板数据回归为什么好一般而言,面板数据模型的误差项由两部分组成,一部分是与个体观察单位有关的,它概括了所有影响被解释变量,但不随时间变化的因素,因此,面板数据模型也常常被成为非观测效应模型;另外一部分概括了因截面因时间而变化的不可观测因素,通常被成为特异性误差或特异扰动项(事实上这第二部分误差还可分成两部分,一部分是不因截面变化但随时间变化的非观测因素对应的误差项Vt,这一部分一般大家的处理办法是通过在模型中引入时间虚拟变量来加以剥离和控制,另一部分才是因截面因时间而变化的不可观测因素。
不过一般计量经济学的面板数据分析中都主要讨论两部分,在更高级一点的统计学或计量经济学中会讨论误差分量模型,它一般讨论三部分误差)。
非观测效应模型一般根据对时不变非观测效应的不同假设可分为固定效应模型和随机效应模型。
传统上,大家都习惯这样分类:如果把非观测效应看做是各个截面或个体特有的可估计参数,并且不随时间而变化,则模型为固定效应模型;如果把非观测效应看作随机变量,并且符合一个特定的分布,则模型为随机效应模型。
不过,上述定义不是十分严谨,而且一个非常容易让人产生误解的地方是似乎固定效应模型中的非观测效应是随时间不变的,是固定的,而随机效应模型中的非观测效应则不是固定的,而是随时间变化的。
一个逻辑上比较一致和严谨,并且越来越为大家所接受的假设是(参见Wooldridge的教材和Mundlak1978年的论文),不论固定效应还是随机效应都是随机的,都是概括了那些没有观测到的,不随时间而变化的,但影响被解释变量的因素(尤其当截面个体比较大的时候,这种假设是比较合理的)。
非观测效应究竟应假设为固定效应还是随机效应,关键看这部分不随时间变化的非观测效应对应的因素是否与模型中控制的观测到的解释变量相关,如果这个效应与可观测的解释变量不相关,则这个效应成为随机效应。
Stata面板数据回归分析中的工具变量法如何选择合适的工具变量工具变量法(Instrumental Variable,简称IV)在面板数据回归分析中被广泛应用。
它通过引入外生变量作为工具变量来解决内生性问题,从而使得回归结果更具可靠性和稳健性。
在Stata软件中,选择合适的工具变量对于IV估计的准确性起着至关重要的作用。
本文将介绍在Stata面板数据回归分析中如何选择合适的工具变量。
一、IV方法简介在介绍IV方法如何选择合适的工具变量之前,先简要介绍一下IV方法的原理和步骤。
IV方法是通过引入工具变量来解决内生性问题,从而得到一致性的估计。
其基本思想是找到一个与内生变量相关但与误差项不相关的变量作为工具变量,从而通过工具变量的外生性来消除内生性引起的估计偏误。
IV方法的具体步骤如下:1. 识别工具变量:首先需要找到一个与内生变量相关但与误差项不相关的变量作为工具变量。
工具变量的选择要满足两个条件:与内生变量有相关性,与误差项无相关性。
2. 检验工具变量:选择好的工具变量需要经过检验,以确保其满足与内生变量相关但与误差项不相关的要求。
常用的检验方法有Hausman检验和Sargan检验。
3. 使用工具变量进行回归:将选定的工具变量引入回归方程中,通过工具变量的外生性来消除内生性引起的估计偏误。
二、选择合适的工具变量在选择合适的工具变量时,需要考虑以下几个因素:1. 相关性:工具变量应该与内生变量有一定的相关性,才能正确地估计内生变量对因变量的影响。
相关性可以通过计算相关系数来衡量,一般要求相关系数大于0.1。
2. 排除性:工具变量与误差项无相关性,即工具变量不能受到其他未观测到的因素的影响。
排除性通常通过进行统计检验来验证,常用的检验方法有Hausman检验和Sargan检验。
3. 弱工具变量:如果工具变量过弱,即相关系数过小,会导致估计结果的方差增大,同时降低估计的准确性和稳健性。
一般来说,工具变量的F统计量应大于10,同时第一阶段回归的R-squared要大于0.1。
应用计量之一——工具变量(IV)本期推文来自首都经贸大学朱超的博客,关于上海对外经贸大学左翔老师暑期课上工具变量的介绍。
今年上海对外经贸大学李辉文老师和YES团队继续办暑期班(/thread-3742527-1-1.html),一个很好的福利,国内青年经济学者愿意分享的精神值得推广。
一个好的工具变量可以直接MIT博士毕业,可见找工具变量是一件有挑战性的事情。
在我看来,找工具变量是一项有趣的智力活动,除了需要一个人有经济学的素养和逻辑,还需要这个人知识面广,自然、地理、人文、世俗智慧和经验等,通常,这跟一个人熟悉的领域,由长期观察和思考产生的洞见有关。
当然还需要一点运气,学术不是苦思冥想,也许做一个梦,喝一杯下午茶,灵感就闪现了。
工具变量的原理最早出现在菲利普·莱特( Philip G.Wright) 1928年写的书《The Tariff on Animal and Vegetable Oils》里。
为了进一步解释这个原理,首先给出一个典型的线性回归模型:y = β0 + β1x1 + βX + ε (1)这里y为被解释变量,x1为自变量,或者解释变量,也即“因”。
大写的 X 为外生控制项向量( 也即一组假定为外生的其他控制变量,例如年龄、性别等等) ,ε则为误差项。
如果ε与x1不相关,那么我们可以利用OLS 模型对方程进行无偏估计。
然而,如果一个重要变量x2被模型(1) 遗漏了,且x1和x2也相关,那么对β1的OLS 估计值就必然是有偏的。
此时,x1被称作“内生”的解释变量,这就是“内生性”问题。
遇到“内生性”问题肿木办?有一个方法就是找工具变量Z。
工具变量(IV)可以用来解决1 )遗漏变量偏差2)经典的测量误差问题3)联立性(逆向因果)工具变量的条件·变量z可以作为变量x的有效工具变量,当满足:·工具变量必须外生·即, Cov(z,u) = 0·工具变量必须与内生变量x相关·即, Cov(z,x) ≠0 Cov(z,u) = 0无法验证,Cov(z,x) ≠0可以验证对工具变量的两个要求之间有一个非常重要的差别。
stata工具变量法案例Stata工具变量法是一种经济学研究中常用的方法,用于解决内生性问题。
它通过利用某些外生性强的变量作为工具变量,来估计内生变量与因果变量之间的关系。
下面是10个以Stata工具变量法案例为题的内容介绍。
1. 工具变量法的基本原理:介绍工具变量法的基本思想和理论基础,解释为什么需要使用工具变量来解决内生性问题。
2. 数据准备:讲解如何在Stata中导入和准备数据,包括变量的选择和处理,确保数据的质量和可用性。
3. 内生性问题的存在:说明内生性问题在经济学研究中的重要性和普遍存在性,以及内生性问题对实证结果的影响。
4. 工具变量的选择:介绍如何选择合适的工具变量,包括外生性、相关性和可用性等因素的考虑,以及常用的工具变量选择方法。
5. 工具变量法的估计:详细介绍Stata中的工具变量法估计命令,包括IVREG、IVREG2等命令的使用方法和参数解释。
6. 结果解读:解释工具变量法估计结果的含义和解读方法,包括工具变量估计量的一致性和有效性等统计性质。
7. 内生性检验:介绍如何在Stata中进行内生性检验,包括第一阶段回归、Hausman检验等常用的内生性检验方法。
8. IV回归的问题和限制:讨论工具变量法的局限性和可能存在的问题,如工具变量的有效性和外推性等问题。
9. 实证案例分析:以某个具体的经济学研究问题为例,使用Stata 进行实证分析,展示工具变量法的应用过程和结果。
10. 结论和讨论:总结工具变量法的优点和局限性,讨论工具变量法在经济学研究中的应用前景和发展方向。
以上是以Stata工具变量法案例为题的内容介绍,通过对工具变量法的原理、数据准备、工具变量选择、估计方法、结果解读、内生性检验、案例分析等方面的介绍,可以帮助读者更好地理解和应用Stata工具变量法。
stata中工具变量法在Stata 中,工具变量法(Instrumental Variables, IV)是一种处理内生性(endogeneity)问题的方法,通常用于解决因果关系中的回归模型。
内生性问题指的是模型中的某些变量可能与误差项相关,从而导致OLS估计结果的偏误。
工具变量法通过引入一个或多个外生性足够相关但与误差项不相关的变量(称为工具变量)来解决这个问题。
以下是在Stata 中使用工具变量法的一般步骤:1. 确定内生性问题:确定模型中是否存在内生性问题,即某些解释变量与误差项相关。
2. 选择工具变量:选择足够相关但与误差项不相关的工具变量。
这些变量通常被认为是外生的,与误差项独立。
3. 估计工具变量模型:使用Stata 中的`ivregress` 命令估计工具变量模型。
语法如下:```stataivregress 2sls dependent_variable (endogenous_variable = instruments) other_exogenous_variables```其中,`dependent_variable` 是因变量,`endogenous_variable` 是内生变量,`instruments` 是工具变量,`other_exogenous_variables` 是其他外生变量。
例如:```stataivregress 2sls y (x = z) controls```4. 检验工具变量的有效性:使用`ivregress` 命令的`ivendog` 选项来检验工具变量的有效性。
```stataivregress 2sls y (x = z) controls, ivendog(x)```此命令将进行工具变量的内生性检验。
5. 诊断:进行模型诊断,检查模型的合理性和有效性。