Chapter4-工具变量法
- 格式:doc
- 大小:603.50 KB
- 文档页数:18
工具变量法及其应用一、工具变量法简介工具变量法是一种在统计分析中常用的技术,主要用于解决回归分析中的内生性问题。
内生性问题通常出现在一个或多个解释变量与误差项相关的情况下,这会导致回归模型的估计结果有偏且不一致。
为了解决这个问题,工具变量法通过引入一个或多个与内生解释变量相关,但与误差项无关的工具变量,来替代内生解释变量。
二、工具变量的选择工具变量的选择是工具变量法的关键步骤。
理想的工具变量应满足与内生解释变量相关,但与误差项无关的条件。
在实践中,通常需要根据研究问题的具体情况和理论依据来选择工具变量。
一些常见的选择方法包括使用先前的研究、使用相关行业的平均值、使用其他相关变量的滞后值等。
三、工具变量法的优缺点工具变量法的优点主要包括:可以解决内生性问题,提高回归模型的估计精度和一致性;可以扩大解释变量的范围,使得模型更全面地反映被解释变量的影响因素;可以降低误差项的相关性,从而降低模型的标准误,提高模型的置信度。
但是,工具变量法也存在一些缺点,如工具变量的选择困难、可能导致过度拟合和模型过度设定等问题。
四、工具变量法在经济学中的应用工具变量法在经济学中有着广泛的应用。
例如,在研究货币政策时,工具变量法可以用来解决货币供应量与通货膨胀之间的内生性问题,从而提高模型的预测精度;在研究劳动市场时,工具变量法可以用来解决工资与就业之间的内生性问题,从而更准确地估计模型的参数。
五、工具变量法在金融学中的应用工具变量法在金融学中也有着广泛的应用。
例如,在研究股票市场时,工具变量法可以用来解决市场收益率与风险之间的内生性问题,从而提高模型的预测能力和风险管理水平;在研究信贷市场时,工具变量法可以用来解决利率与信贷风险之间的内生性问题,从而更准确地估计模型的参数。
六、工具变量法在其他领域的应用工具变量法在其他领域也有着广泛的应用。
例如,在环境科学中,工具变量法可以用来解决环境污染与经济增长之间的内生性问题,从而更准确地估计模型的参数;在医学研究中,工具变量法可以用来解决吸烟与健康之间的内生性问题,从而更准确地估计模型的参数。
工具变量法工具变量法一、工具变量法得主要思想在无限分布滞后模型中,为了估计回归系数,通常得做法就是对回归系数作一些限制,从而对受限得无限分布滞后模型进行估计。
在这里,考伊克模型、适应性期望模型与部分调整模型给出了很好得解决此类问题得思路。
经过变换,新得模型中,随机扰动项得表达式为:考伊克模型: ( ,为衰减率) (1、1);适应性期望模型:(,为期望系数)(1、2);部分调整模型:( ,为调整系数) (1、3)。
为原无限分布滞后模型中得扰动项,为变换后得扰动项。
在原模型中得随机扰动项满足经典假设得前提下,部分调整模型也满足经典假设,但就是考伊克模型与适应性期望模型得随机扰动项由于存在原随机扰动项得滞后项,也就就是说考伊克模型与适应性期望模型得解释变量势必与误差项相关,因此,可能会出现上述两个模型得最小二乘估计甚至就是有偏得这样严重得问题。
那么,我们就是否可以找到一个与高度相关但与不相关得变量来替代?在这里,一个可行得估计方法就就是工具变量法。
在讨论工具变量法之前,我们先来了解一下外生变量与内生变量。
一般来说:一个回归模型中得解释变量有得与随机扰动项无关,我们称这样得解释变量为外生变量;而模型中有得解释变量与随机扰动项相关,我们可称这样得解释变量为内生解释变量。
内生解释变量得典型情况之一就就是滞后应变量为解释变量得情形,如上述考伊克模型与适应性期望模型中得。
外生解释变量:回归模型中得解释变量与随机扰动项无关;内生解释变量:回归模型中得解释变量与随机扰动项无关;了解了内生变量与外生变量得概念,我们接着讨论工具变量法得主要思想:工具变量法与普通最小二乘法就是模型参数估计得两类重要方法,在多元线性回归模型中,如果出现解释变量与随机误差项相关(即出现内生变量)时,其回归系数得普通最小二乘估计就是非一致得,这时就需要引入工具变量。
工具变量,顾名思义就是在模型估计过程中被作为工具使用,以替代模型中与随机误差性相关得随机解释变量(即内生变量)。
工具变量法工具变量法具体步骤工具变量法(Instrumental Variable Method)是一种用于处理内生性问题的统计方法,它通过引入一个“工具变量”来解决内生性问题。
工具变量是一个有着良好相关性但不会受到内生性干扰的变量,它可以用来代替内生变量,从而解决内生性的影响。
1.确定内生变量和工具变量:首先,需要确定研究中存在的内生变量和可能的工具变量。
内生变量是对所研究问题有影响的变量,而工具变量是与内生变量具有相关性但不会受到内生性干扰的变量。
内生性问题是由于内生变量的存在而导致的因果关系估计偏倚。
2.检验工具变量的相关性:接下来,需要检验所选取的工具变量与内生变量之间的相关性。
这可以通过计算相关系数或进行统计检验来实现。
如果工具变量与内生变量存在显著相关性,那么它可能是一个有效的工具变量。
3.确定工具变量的外生性:除了相关性外,工具变量还需要满足外生性的要求,即工具变量对因变量的影响是通过内生变量而不是其他方式引起的。
这可以通过进行实证分析来判断,例如通过回归模型来检验工具变量对因变量的影响是否通过内生变量进行中介。
如果工具变量的影响仅通过内生变量介导,则可以认为工具变量满足外生性的要求。
4.估计工具变量模型:一旦确定了有效的工具变量,可以使用工具变量法来估计因果关系。
工具变量法的核心思想是通过回归模型来解释内生变量对因变量的影响,并利用工具变量对内生变量进行替代。
通过将工具变量引入估计方程中,可以消除内生性的影响,从而得到无偏的因果关系估计。
5.进行统计推断:在估计了工具变量模型之后,可以进行统计推断来评估估计结果的显著性。
这可以通过计算标准误差、置信区间和假设检验等来实现。
统计推断可以帮助判断估计结果的可靠性,并验证因果关系的存在与否。
总结而言,工具变量法是一种用于解决内生性问题的统计方法。
它通过引入一个有效的工具变量来代替内生变量,消除内生性的干扰,从而得到无偏的因果关系估计。
工具变量法的具体步骤包括确定内生变量和工具变量、检验工具变量的相关性和外生性、估计工具变量模型,并进行统计推断。
工具变量法一、工具变量法得主要思想在无限分布滞后模型中,为了估计回归系数,通常得做法就是对回归系数作一些限制,从而对受限得无限分布滞后模型进行估计。
在这里,考伊克模型、适应性期望模型与部分调整模型给出了很好得解决此类问题得思路。
经过变换,新得模型中,随机扰动项得表达式为:考伊克模型: ( ,为衰减率) (1、1);适应性期望模型:(,为期望系数)(1、2);部分调整模型:( ,为调整系数) (1、3)。
为原无限分布滞后模型中得扰动项,为变换后得扰动项。
在原模型中得随机扰动项满足经典假设得前提下,部分调整模型也满足经典假设,但就是考伊克模型与适应性期望模型得随机扰动项由于存在原随机扰动项得滞后项,也就就是说考伊克模型与适应性期望模型得解释变量势必与误差项相关,因此,可能会出现上述两个模型得最小二乘估计甚至就是有偏得这样严重得问题。
那么,我们就是否可以找到一个与高度相关但与不相关得变量来替代?在这里,一个可行得估计方法就就是工具变量法。
在讨论工具变量法之前,我们先来了解一下外生变量与内生变量。
一般来说:一个回归模型中得解释变量有得与随机扰动项无关,我们称这样得解释变量为外生变量;而模型中有得解释变量与随机扰动项相关,我们可称这样得解释变量为内生解释变量。
内生解释变量得典型情况之一就就是滞后应变量为解释变量得情形,如上述考伊克模型与适应性期望模型中得。
外生解释变量:回归模型中得解释变量与随机扰动项无关;内生解释变量:回归模型中得解释变量与随机扰动项无关;了解了内生变量与外生变量得概念,我们接着讨论工具变量法得主要思想:工具变量法与普通最小二乘法就是模型参数估计得两类重要方法,在多元线性回归模型中,如果出现解释变量与随机误差项相关(即出现内生变量)时,其回归系数得普通最小二乘估计就是非一致得,这时就需要引入工具变量。
工具变量,顾名思义就是在模型估计过程中被作为工具使用,以替代模型中与随机误差性相关得随机解释变量(即内生变量)。
工具变量法Document serial number【UU89WT-UU98YT-UU8CB-UUUT-UUT108】工具变量法一、工具变量法的主要思想在无限分布滞后模型中,为了估计回归系数,通常的做法是对回归系数作一些限制,从而对受限的无限分布滞后模型进行估计。
在这里,考伊克模型、适应性期望模型与部分调整模型给出了很好的解决此类问题的思路。
经过变换,新的模型中,随机扰动项的表达式为:考伊克模型:1t t t v u u λ-=- (01λ<< ,λ为衰减率) (); 适应性期望模型:1(1)t t t v u u λ-=--(01λ<< ,λ为期望系数)();部分调整模型:(1)t t v u γ=-(01γ≤< ,1γ-为调整系数) ()。
t u 为原无限分布滞后模型中的扰动项,t v 为变换后的扰动项。
在原模型中的随机扰动项满足经典假设的前提下,部分调整模型也满足经典假设,但是考伊克模型与适应性期望模型的随机扰动项由于存在原随机扰动项的滞后项,也就是说考伊克模型与适应性期望模型的解释变量1t Y - 势必与误差项t v 相关,因此,可能会出现上述两个模型的最小二乘估计甚至是有偏的这样严重的问题。
那么,我们是否可以找到一个与1t Y -高度相关但与t v 不相关的变量来替代1t Y -在这里,一个可行的估计方法就是工具变量法。
在讨论工具变量法之前,我们先来了解一下外生变量和内生变量。
一般来说:一个回归模型中的解释变量有的与随机扰动项无关,我们称这样的解释变量为外生变量;而模型中有的解释变量与随机扰动项相关,我们可称这样的解释变量为内生解释变量。
内生解释变量的典型情况之一就是滞后应变量为解释变量的情形,如上述考伊克模型与适应性期望模型中的1t Y 。
外生解释变量:回归模型中的解释变量与随机扰动项无关; 内生解释变量:回归模型中的解释变量与随机扰动项无关;了解了内生变量和外生变量的概念,我们接着讨论工具变量法的主要思想:工具变量法和普通最小二乘法是模型参数估计的两类重要方法,在多元线性回归模型中,如果出现解释变量与随机误差项相关(即出现内生变量)时,其回归系数的普通最小二乘估计是非一致的,这时就需要引入工具变量。
工具变量法回归符号相反1. 引言工具变量法(Instrumental Variable, IV)是一种经济计量学中常用的方法,用于解决因果推断中的内生性问题。
在回归分析中,内生性是指自变量与误差项之间存在相关性,导致OLS估计结果偏误。
为了解决这一问题,可以使用工具变量法来进行估计。
本文将详细介绍工具变量法的原理、步骤以及应用,并讨论使用工具变量法时出现回归符号相反的情况。
2. 工具变量法原理工具变量法的基本原理是利用一个或多个与内生变量相关但与误差项不相关的工具变量,将内生变量替换为工具变量进行回归分析。
通过工具变量的使用,可以实现对内生性的控制,从而得到一致且有效的估计结果。
为了有效使用工具变量,需要满足两个关键假设:•工具变量的相关性:工具变量与内生变量之间存在相关性,即工具变量对内生变量产生影响。
•工具变量的无直接效应:工具变量对因变量的影响只通过内生变量来传导,不存在直接效应。
在满足上述假设的情况下,可以使用两阶段最小二乘法(Two-Stage Least Squares, 2SLS)来进行工具变量回归分析。
3. 工具变量法步骤工具变量法的步骤可以分为两个阶段:第一阶段第一阶段是利用工具变量对内生变量进行回归,得到内生变量的预测值。
具体步骤如下:1.确定内生变量:首先需要明确研究中的内生变量,即与误差项相关的自变量。
2.选择合适的工具变量:根据相关性的要求,选择与内生变量相关但与误差项不相关的工具变量。
3.进行第一阶段回归:使用工具变量对内生变量进行回归,得到内生变量的预测值。
第二阶段第二阶段是利用内生变量的预测值进行回归,得到最终的估计结果。
具体步骤如下:1.构建结构方程:根据研究问题,构建包含内生变量和其他自变量的结构方程。
2.进行第二阶段回归:将内生变量的预测值与其他自变量一起,进行回归分析,得到最终的估计结果。
4. 工具变量法回归符号相反的情况在使用工具变量法进行回归分析时,有时会出现回归符号相反的情况。
工具变量法工具变量法具体步骤工具变量法目录概念某一个变量与模型随机解释变量高度相关,但却不与为丛藓科扭口藓项相关,那么就可以用此变量与模型中相应回归系数的一个一致估计量,这个变量就称为方法变量,这种估计方法就叫工具基本原理变量法。
缺点工具变量法的关键是选择一个有效的优先选择工具变量,由于工具自变量变量可以选择中的困难,工具变量法本身存在两方面不足:一是由于工具变量不是惟一的,因而工具变量估计量有一定的任意性;其二由于误差项实际上是不可观测的,因而要寻找严格意义上与误差项无关的与所替代而随机解释变量高度相关的变量总的来说事实上是困难的。
工具变量法与内生解释变量可持续性解释变量会造成解读严重的后果:不一致性inconstent 和有偏biased ,因为频域不满足误差以解释线性为条件的期望值为0。
产生解释变量招盛纯一般有三个原因:一、遗漏变量二、测量误差三、联立性第三种情况是无法逐步解决的,前两种可以采用工具变量(IV )法。
IV 会带来的唯一坏处是估计方差的增大,也就是说同时采用OLS 和IV 估计,则前者的方差小于后者。
但IV 的应用是有前提条件的:1.IV 与内生解释函数相关,2.IV 与u 不相关。
在小样本情况下,一般用内生解释变量对IV 进行回归,如果R -sq 值很小的话,一般t值也很小,所以对IV 质量的评价没有大的风险问题,但是当采用大样本时,情况则相反,往往是t 值很大,而R -sq 很小,这时如果采用t 值进行关键问题评价则可能出现出现问题。
这时IV 与内生解释变量之间的若干程度不是阐释太大,但是如果与u 之间有轻微的相关机构的话,则:1、导致很小的不一致性;2、有偏性,并且这种有偏性随着R -sq趋于0而趋于OLS 的有偏性。
所以现在在采用IV 时最好采用R -sq 或F -sta 作为评价标准,另外为了观测IV 与u 的关系,可以将IV 作为解释变量放入方程进行回归,如果没有其他的系数没有多的变化,则说明IV 满足第二个条件。
第1章 两阶段最小二乘法在模型的基本假定中,解释变量与误差项正交保证了参数估计量的无偏性和一致性。
当这一假定被违背时,称解释变量是内生的。
常见的几种情况会导致内生问题:忽略重要的解释变量、变量的测量误差、变量的联立性。
工具变量估计是解决解释变量内生问题的基本方法。
本章介绍工具变量法和两阶段最小二乘法,以及模型内生性检验和过度识别约束检验等问题。
1.1 变量的内生性如果模型中的解释变量与误差项出现相关,即(')E =X u 0,称解释变量是内生的。
导致解释变量内生性的原因有很多,主要的几个原因包括:模型中忽略了重要的解释变量、变量因果关系的双向性、变量的测量误差等。
模型中出现内生解释变量时,OLS 估计量是不一致的。
根据OLS 估计量:11111ˆ(')(')(')(')(')(')N N -----==+=+βX X X y βX X X u βX X X u (1.1) 由假定Rank(X)=K 和大数定律,样本均值的概率极限等于总体均值,可得:1Plim(')E(')N -=≡X X X X A , 1Plim(')E(')N -=≠X u X u 0。
(1.2)又由Slustky 定理,111Plim(')N ---=X X A1ˆPlim E(')-=+≠ββA X u β (1.3) 1.2工具变量估计1.2.1 工具变量在如下模型中,y = X β+ u第i 个解释变量x i 为内生解释变量。
如果存在变量z ,z 满足如下两个条件: 正交条件:与u 不相关,即cor(z, u) = 0相关条件:与x 相关,即cor(z, x i ) ≠ 0,也称为识别约束条件。
那么,z 被称作x i 的工具变量。
1.2.2 工具变量估计设回归模型为:y =X β+u (1.4)其中,解释变量为X (1×K )工具变量为Z (1×K )。
Z 作为工具变量满足正交条件和识别约束条件。
在正规方程组ˆ'()-=X y X β0中,用Z 替换X , ˆ'()-=Z y X β0 (1.5) 解此方程组,可得IV 估计量为:1ˆ(')'-=βZ X Z y (1.6) 将y =X β+u 带入估计量中,可得11ˆ(')'()(')'--=+=+βZ X Z X βu βZ X Z u 可以证明,1ˆE()(')'E()-=+=ββZ X Z u β 1121121ˆVar()E[(')''(')](')'(')(')σσ-----==≠βZ X Z uu Z X Z Z X Z Z X Z X X即IV 估计量是无偏的,但不是有效的。
同时,由111111ˆPlim()Plim[(')(')]Plim(')Plim(')E()n n n i i n N N N N ---→∞→∞--→∞-→∞=+===ββZ X Z u Z X AZ u Z u 0可知,IV 估计量是一致的。
1.3 两阶段最小二乘法设模型中存在K 个内生解释变量,存在L=K 个工具变量。
每个工具变量都必须满足正交条件和相关条件。
如果L=K ,称为恰好识别;如果L>K ,称为过度识别。
即利用其中不同的K 个工具变量,都可以得到不同的估计量。
当然,用任何一组工具变量得到的估计量都是一致的。
因此,现在的问题是如何在这L 个工具变量中找到K 个工具变量使其估计量最有效。
这即是两阶段最小二乘法。
1.3.1 TSLS 估计设模型为:=+y X βu (1.7)其中,解释变量为X (1×K )工具变量为Z (1×L )。
用Z 作为工具变量,Z 满足正交条件和识别约束条件。
首先回归模型=+X Z Πv (1.8)可得1ˆ(')-=ΠZ Z ZX ,并提取拟合值1ˆˆ(')-==X Z ΠZ Z Z ZX 。
令1(')'-=ZP Z Z Z Z ,P Z 为对称幂等矩阵,则ˆ=ZX P X 。
然后,利用ˆX 做为工具变量回归模型,可得IV 估计量为: 11ˆˆˆ(')'(')(')--==ZZβX X X y X P X X P y (1.9) 而ˆˆˆ''''()''====Z Z Z Z ZX X X P X X P P X P X P X X X 。
由此可得: 11ˆˆˆˆˆˆ(')'(')'--==βX X X y X X X y (1.10) 而1ˆˆˆ(')'-X X X y 是y 对ˆX 的OLS 回归估计量。
因此,利用ˆX作为工具变量作IV 回归与利用ˆX 替换X 作LS 回归是等价的。
也正因为此,我们称之为两阶段最小二乘法。
估计步骤归纳如下。
Step1:利用X 对Z 作OLS 回归:=+X Z Πv ;提取拟合值ˆX。
Step2:用ˆX替换X ,直接作OLS 回归。
1.3.22SLS 的渐进特征假定1:令X 表示解释变量(包括常数变量1)。
假定存在L 个工具变量构成的(1×L )向量Z ,满足E(Z 'u )=0。
Z 包含模型中的外生解释变量。
如果模型中存在内生变量,则Z 必须包含模型以外的外生变量。
假定2:(A )Rank(Z 'Z )=L ;(B )Rank(Z 'X )=K 。
(A )条件是指L 个向量Z 不存在完全的线性关系;条件(B )是指Z 与X 充分线性相关,即所有工具变量都必须满足识别约束条件。
条件(B )称为秩条件。
秩条件成立的必要条件是L ≥K 。
即,工具变量的个数至少等于解释变量的个数,称之为阶条件。
由X =Z ∏+v (其中,∏为L ×K 矩阵),两侧同时乘Z 并求期望可得:1'''E(')E(')[E(')]E(')-=+⇒=⇒=Z X Z Z ΠZ v Z X Z Z ΠΠZ Z Z X (1.11)令X *=Z ∏ = Z[E(Z 'Z )]-1 E(Z 'X )。
在X β+u =y 两边同时乘以X *可得,X *'X β + X *'u = X *'y (1.12)求期望可得:E(X *'X )β= E(X *'y ) (1.13)而X *'X = X *'Z ∏ + X *'v , E(X *'X ) = E(X *'Z )∏ + E(X *'v ) = E(X *'Z )∏ E(X *'Z )= E[(X -v ) 'Z ] = E[X 'Z - v 'Z ] = E(X 'Z )将∏ = [E(Z 'Z )]-1 E(Z 'X )带入上两个式子中,可得:E(X *'X ) = E(X 'Z ) [E(Z 'Z )]-1 E(Z 'X )= E(X 'Z ) [E(Z 'Z )]-1 E(Z 'X ) (1.14) E(X *'y ) = E(X 'Z ) [E(Z 'Z )]-1 Z ' y注意,上式中Z 是(1×L )阶,X 是(1×K )阶。
因此, X 'Z 是(K ×L )阶,Z 'Z 是(L ×L )阶,Z 'X 是(L ×K )阶。
如果要估计出β,E(X *'X )必须是非奇异的,当且仅当E(Z 'X )的秩为K 。
将其带入β = [E(X *'X )]-1 E(X *'y ),可得β = [E(X *'X )]-1 E(X *'y )= {E(X 'Z ) [E(Z 'Z )]-1 E(Z 'X )} -1{E(X 'Z ) [E(Z 'Z )]-1Z 'y} (1.15)β的TSLS 估计量为:{}{}-1112ˆ'(')(')'(')'SLS--=βX Z Z Z Z X X Z Z Z Z y (1.16) 1.一致性由2SLS 估计量可得:1-1121-111111-11111ˆ['(')(')]['(')'()]['(')(')]['(')'][(')(')(')][(')(')(')]SLS N N N N N N ------------=+ =+ =+βX Z Z Z Z X X Z Z Z Z X βu βX Z Z Z Z X X Z Z Z Z u βX Z Z Z Z X X Z Z Z Z u (1.17)由大数定律和Slustky 定理,可得:2ˆPlim SLS =ββ。
即2SLS 估计量具有一致性。
2.渐进正态性根据1Plim(')E(')i i N -==Z u Z u 0,并由中心极限定理,1/2'~(,)N Normal -Z u 0B 。
同方差假定下,22E(')E(')i i i i u σ==B Z Z Z Z ,2=var()i u σ。
根据Slutsky 定理,1111-11111/22ˆ)[(')(')(')][(')(')(')]SLSN N N N N N ---------=ββX Z Z Z Z X X Z Z Z Z u (1.18)定理:在假定1、22ˆ)SLS -ββ渐进服从正态分布,均值为0,方差矩阵为{}-121E(')E(')E(')σ-X Z Z Z Z X (1.19)其中,1E(')E(')E(')-X Z Z Z Z X 可以用样本进行估计,2σ的估计量公式为:2121ˆˆ()Ni i N K u σ-==-∑ 其中,2ˆˆi i i SLS u y =-x β,而不是第二阶段的残差项。