内生性问题
- 格式:doc
- 大小:393.00 KB
- 文档页数:9
证明模型存在内生性问题一、什么是内生性内生性是社会科学中常见的概念,它指的是两个或多个变量的相互关系受到被观察影响的现象,这样的现象提示观察变量之间存在某种内在的关系,或者由于观察技术的限制,导致观察自身的习惯受到影响,也可能产生内生性现象。
内生性问题出现的原因主要有以下四点:1. 错误的变量分析。
有时,研究者可能未能充分地对变量进行详细的分析,未能发现变量之间的相关性,从而导致内生性问题。
2. 观察结果受到主观影响。
有些研究结果来自于观察者的主观判断,由于观察者本身的主观偏见,研究结果也可能受到影响,从而受到内生性影响。
3. 研究设计问题。
研究者在设计研究时,可能没有考虑到有可能出现的内生性问题,也就是说,研究者并未采用一些技术手段去排除内生性的影响,从而使研究结果出现偏差。
4. 模型中未考虑的因素。
研究人员可能过于依赖于历史资料,而未能考虑模型中未预料到的影响因素对研究结果的影响,从而使模型受到内生性影响。
二、如何证明模型存在内生性1.引入新变量。
一般来说,引入新变量是检验模型中内生性的有效方法,研究人员可以引入新变量,重新计算结果,看看新变量是否会影响模型的结果。
如果模型的结果受到新变量的影响,说明模型存在内生性问题。
2.采用控制研究。
研究人员可以尝试采用控制研究的方法,即比较因变量不变的情况下,采取相同措施却遭遇不同结果的研究,从而分析是否存在内生性问题。
3.采用模糊绝对正确样本试验。
模糊绝对正确样本试验(FAT)是一种对模型有效性进行检验的方法。
研究者运用FAT技术,可以分析出模型的收敛程度,从而判断模型是否存在内生性问题。
4.采用序列组研究法。
序列组研究法是一种能够检测内生性的方法,它采用多个重复发生的事件作为研究对象,分别记录不同变量的变化,从而确定不同变量对研究结果的影响,看看其是否存在内生性问题。
通过上述几种检验方法,研究人员可以检验模型中是否存在内生性问题,从而为模型的改进提供有效的参考。
经济学实证研究中常见的40个误区你掌握了可以发AER经济学实证研究中常见的40个误区近年来,经济学实证研究在解决社会经济问题中发挥着日益重要的作用。
然而,在进行研究的过程中,经济学家们可能会陷入一些常见的误区,导致研究结果的准确性和可靠性受到影响。
本文将介绍经济学实证研究中常见的40个误区,希望能够引起研究者的重视,并提供一些改进的方法。
第一、样本选择偏误(Sample Selection Bias)样本选择偏误是指在研究中的样本选择过程中,由于某些原因导致样本与总体之间存在系统性的差异,从而使得研究结果产生偏误。
为避免样本选择偏误,研究者需要在样本选择过程中尽可能地随机选择样本。
第二、回归截距偏误(Regression Intercept Bias)回归截距偏误是指在进行回归分析时,由于观测变量存在某种特殊的统计性质,导致回归方程的截距估计值与真实值存在偏离。
为避免回归截距偏误,研究者应该仔细选择合适的控制变量,并对回归方程进行修正。
第三、自我选择偏误(Self-Selection Bias)自我选择偏误是指在研究中,个体根据自身的特点或偏好自主选择参与或退出的一种偏误。
为避免自我选择偏误,研究者可以采用实验设计等方法,尽可能地减少自主选择的影响。
第四、内生性问题(Endogeneity Problem)内生性问题是指研究中的解释变量与被解释变量之间存在相互影响,从而导致回归分析结果出现偏误。
为解决内生性问题,研究者可以使用工具变量或进行双重差分等方法来进行估计。
第五、冲击持续性误解(Misunderstanding Persistence of Shocks)冲击持续性误解是指研究者在分析冲击对经济变量的影响时,错误地将冲击持续性与冲击大小混淆。
为避免冲击持续性误解,研究者应该对冲击进行正确度量,并考虑其对经济变量的长期影响。
第六、遗漏变量偏误(Omitted Variable Bias)遗漏变量偏误是指在回归分析中,由于故意或者疏忽排除了与解释变量和被解释变量相关的某个变量,导致回归结果产生偏误。
计量经济学试题计量经济学中的内生性问题与解决方法计量经济学是经济学领域中重要的研究方法之一,通过使用统计分析和经济理论,可以用来研究经济现象的数量关系。
在计量经济学中,内生性问题是研究过程中常常面临的一个重要挑战。
本文将探讨内生性问题的定义、原因以及解决方法。
1. 内生性问题的定义内生性问题是指在计量经济分析中,变量间的相关关系可能不准确反映真实因果关系的情况。
简而言之,研究中的内生性问题会导致我们很难判断变量之间的因果关系。
为了更好地理解内生性问题,我们可以考虑以下案例:假设我们研究肥胖与健康之间的关系。
然而,我们发现肥胖与健康之间的关系并不简单,而是与收入也有关系。
这意味着收入可能同时影响到肥胖和健康的变量,从而产生内生性问题。
2. 内生性问题的原因内生性问题的产生可以归因于多种因素,其中最常见的原因包括遗漏变量、反向因果、同时发生性等。
首先,遗漏变量是内生性问题最常见的原因之一。
如果在研究中忽略了对结果变量和解释变量的同时影响的变量,我们将难以判断因果关系,从而产生内生性问题。
其次,反向因果指的是因果关系被反向解释的情况。
例如,我们研究教育对收入的影响,如果我们并未考虑到择业选择方面的影响,而单独将教育与收入联系起来,就可能存在内生性问题。
另外,同时发生性也是导致内生性问题的原因之一。
即两个或多个变量同时发生,导致我们无法准确地判断它们之间的因果关系。
3. 解决内生性问题的方法为了解决内生性问题,计量经济学提出了一系列的方法和技术。
下面将介绍几种常见的解决方法。
第一种方法是工具变量法。
工具变量是一种可以在研究中代表其他变量的变量。
通过引入工具变量,我们可以使用工具变量回归来估计原因变量对结果变量的效应。
当然,工具变量的选择应满足一定的条件,以确保其有效性。
第二种方法是差分法。
差分法是通过对同一个体或群体在不同时期的数据进行比较,来控制内生性问题。
通过比较不同时间点的数据,我们可以消除一些可能导致内生性问题的因素。
调查问卷内生性问题的方法调查问卷是社会科学研究中常用的数据收集工具,通过问卷可以获得大量的信息和数据。
然而,在设计和实施调查问卷时,我们常常会面临内生性问题。
内生性问题指的是调查对象的回答可能受到问题本身的影响,导致结果的偏倚。
为了减少内生性问题的影响,我们可以采用以下方法:首先,问题的顺序要合理。
研究者在设计问卷时应该注意问题的逻辑顺序,将相关的问题放在一起。
这样可以减少被调查者因为前面的问题而对后续问题产生偏见或者疲劳感,从而提高问卷的有效性。
其次,问题的表述要清晰明了。
研究者在设计问卷时应该避免使用模糊或含糊不清的语言,确保问题的表述准确无误。
模糊的问题容易导致被调查者的回答不准确或者不符合实际情况,从而影响结果的可靠性。
第三,问题的选择要多样化。
研究者在设计问卷时应该尽量提供多个选择,以满足不同被调查者的需求和观点。
如果一个问题只提供了两个选择,可能会限制被调查者的回答范围,从而导致结果的偏倚。
第四,问题的顺序要随机化。
研究者在实施问卷调查时应该采用随机抽样的方法,将问题的顺序随机排列。
这样可以降低被调查者的回答顺序对结果的影响,减少内生性问题的可能性。
最后,问题的回答要保证匿名性。
研究者在设计问卷时应该保证被调查者的回答是匿名的,不会暴露个人隐私。
这样可以增加被调查者的回答的真实性和可靠性,减少内生性问题的可能性。
综上所述,调查问卷内生性问题会对研究结果产生偏倚,影响研究的可靠性和有效性。
为了减少内生性问题的影响,研究者在设计和实施问卷时应该注意问题的顺序、表述、选择、顺序随机化以及回答的匿名性。
通过合理的设计和实施,我们可以提高问卷的质量,获得更加准确和可靠的数据,为研究提供有力的支持。
内生性和外生性问题研究一、引言内生性和外生性是经济学中两个重要的概念,它们在经济学研究中具有着举足轻重的地位。
内生性是指一个变量对自身的影响,外生性则是指一个变量对其他变量的影响。
本文将分别讨论内生性和外生性的概念、研究方法以及实际应用。
二、内生性问题的概述内生性问题是经济学中的重要问题之一。
当研究一个因变量Y 时,我们可能会发现它被可能影响它的一个或多个自变量X所依赖,而这些自变量与Y之间可能存在着关联,然而这种关联是否是因果关系却是不确定的。
这种情况下,我们称这些自变量为内生变量。
内生性问题在经济学研究中常见,在实证经济学中也经常遇到。
如果我们在经济学研究中忽略了内生性问题,那么我们会得到误导性的结论。
三、内生性问题的研究方法为了解决内生性问题,经济学家们提出了一些方法来控制内生性问题。
其中最常用的方法是工具变量法。
工具变量是一种与具体因变量相关的变量。
通过工具变量法,我们可以解决内生性问题。
具体来说,工具变量法是利用第三方变量来独立地影响自变量,进而解决内生性问题。
例如,假设我们要研究教育水平对收入的影响。
由于教育水平与收入存在内生性问题,我们需要引入一个工具变量,例如出生时所处的家庭收入来独立地影响教育水平,以此控制内生性问题。
除了工具变量法外,还存在其他的方法来解决内生性问题,例如差分法、匹配法等。
四、外生性问题的概述外生性是指一个变量对其他变量的影响。
在经济学研究中,我们常常需要区分内生性和外生性。
当我们把一个因变量对自身的影响分离出来,而其他变量对其影响被排除,这个因变量就是外生变量。
外生性问题在经济学研究中也经常遇到。
例如,在研究一个国家经济增长的影响因素时,我们可能会遭遇风险和政治稳定性等外生因素的问题,这些外生因素的影响我们需要进行控制。
控制外生因素能使我们在研究中得到更加准确的结论。
五、外生性问题的研究方法为了解决外生性问题,我们需要控制外生变量的影响。
合适的控制方法可以使我们得到准确的结果。
内生性问题的研究与解决近年来,内生性问题成为各领域面临的一大挑战。
然而,什么是内生性问题呢?简单来说,内生性问题是指一个系统内部因素所导致的一系列负面影响。
例如,在经济领域中,内生性问题指的是因为一个系统内部的因素,如政策、市场失灵等,导致经济衰退、通货膨胀等问题。
这类问题在各个领域中都有着普遍性,如医学、教育、社会等领域。
内生性问题的研究已经成为了很多学者的研究方向。
许多学者已经开始研究内生性问题的原因以及如何解决它们,以期帮助政策制定者和其他相关方应对这一问题。
在研究内生性问题时,我们需要了解其产生的原因。
例如,在经济领域中,内生性问题通常是由市场失灵引起。
市场失灵是由于各种原因,如外界的干扰、不完全信息以及市场力量的不平衡等。
这些因素都会导致市场效率下降,从而引发内生性问题。
解决内生性问题需要寻找办法来消除其根源。
例如,在医学领域中,内生性问题可能是由于缺乏预防措施而引起的。
解决问题的方法可能是通过提供更好的预防措施,以便确保治疗措施的有效性。
同样在经济领域中,解决内生性问题需要通过增加市场透明度、改善监管等手段来减少市场失灵现象。
然而,解决内生性问题需要一个系统的方法来处理。
这个方法可能包括政策制定、数据分析、模型建立等。
例如,在教育领域中,政策制定者需要考虑如何建立一个能够激励学生继续学习的环境。
这需要分析教育系统中的所有因素,并确保适当的政策被制定出来。
总之,内生性问题是一个在各个领域中都存在的问题。
研究内生性问题和解决这些问题需要跨学科的方法。
我们需要用系统的方法来分析和解决这一问题,以实现更可持续的发展和更好地解决社会问题。
社会学定量分析中的内生性问题一、本文概述本文旨在探讨社会学定量分析中的内生性问题,分析其对研究结果的影响,以及提出相应的处理策略。
内生性问题在社会学研究中具有重要的理论和实践意义,因为它可能导致研究结果的偏误,甚至改变研究结论的方向。
本文首先将对内生性问题的概念进行界定,明确其在社会学定量分析中的地位。
接着,我们将回顾内生性问题在社会学领域的研究现状,包括已有的理论探讨和实证分析。
在此基础上,本文将深入剖析内生性问题的产生原因,探讨其对研究结果的具体影响。
我们将提出一些处理内生性问题的策略和方法,以期为社会学定量分析提供更为准确、可靠的研究结果。
通过本文的研究,我们希望能够增强社会学研究者对内生性问题的认识和理解,推动社会学定量分析方法的不断完善和发展。
二、内生性问题的定义与类型内生性问题在社会学定量分析中是一个核心概念,它涉及到因果关系的准确识别。
简单来说,内生性问题指的是在回归分析中,解释变量与误差项之间存在相关性,这种相关性会导致回归系数的估计值出现偏差,从而影响我们对因果关系的判断。
内生性问题的出现通常源于以下两种情况:一是遗漏变量,即模型中未包含所有与因变量和自变量相关的变量,这些遗漏的变量可能会导致估计结果的偏误;二是测量误差,即变量的观测值与其真实值之间存在差异,这种差异也可能引起内生性问题。
内生性问题的类型多样,常见的主要有以下几种:选择偏差(Selection Bias)、遗漏变量偏差(Omitted Variable Bias)、同时性偏差(Simultaneity Bias)以及样本选择偏差(Sample Selection Bias)等。
选择偏差通常发生在样本选择过程中,导致样本不具有代表性;遗漏变量偏差则是因为模型中遗漏了与因变量和自变量都相关的变量;同时性偏差多发生在自变量和因变量相互影响的情况下,使得传统的回归分析方法无法准确识别因果关系;样本选择偏差则是因为样本选择过程中存在的某种系统性偏差,导致估计结果不准确。
两阶段最小二乘工具变量估计法【知识专栏】探究两阶段最小二乘工具变量估计法在经济学和社会科学领域,研究者常常面临着解决内生性问题的挑战。
内生性问题的存在会导致统计结果的偏误,从而影响对因果关系的准确性。
为了解决内生性问题,学者们提出了一种被广泛应用的估计方法,即两阶段最小二乘工具变量估计法(Two-Stage Least Squares,2SLS)。
一、深入解读内生性问题内生性是什么?从宏观角度看,内生性指的是解释变量与误差项之间存在相关关系,从而引发了对因果关系的混淆。
举个例子来说,假设我们想研究教育对收入的影响。
然而,由于教育受到家庭背景的影响,可能存在潜在的内生性问题。
也就是说,收入水平的高低可能既受到教育程度的影响,又受到家庭背景的影响,使得教育对收入的影响难以单独量化。
二、引入工具变量的作用为了解决内生性问题,我们需要引入工具变量。
什么是工具变量?简单来说,工具变量应该满足两个条件:与内生性解释变量相关,但与误差项不相关。
直观上理解,工具变量可以被看作是用来"替代"内生性解释变量的。
在前面教育与收入的例子中,一个可能的工具变量是父母的受教育水平。
虽然父母的教育水平与学生的收入相关,但从概念上来说,父母的教育水平与学生的收入并没有直接的关系。
父母的教育水平既可以用来代替学生的教育水平,也可以帮助我们解决内生性问题。
三、两阶段最小二乘法在引入工具变量后,我们需要进行两个阶段的回归分析。
在第一阶段,我们使用工具变量来回归解释变量,得到预测值。
我们再在第二阶段,使用这些预测值来估计因果效应。
在这两个阶段中,我们使用最小二乘法进行回归分析。
四、两阶段最小二乘法的具体步骤1. 选择合适的工具变量。
2. 在第一阶段,使用工具变量回归解释变量,得到预测值。
3. 确认预测值的有效性和合理性,进行合理性检验。
4. 在第二阶段,使用预测值和其他解释变量,进行回归分析并估计因果效应。
5. 进行统计显著性检验,判断估计结果的可靠性。
内生性问题引言:内生性问题是指与一个系统、组织或现象内在联系紧密、相互影响、互为因果的问题。
这些问题既不是纯粹由外部因素所引起,也不是完全由内部因素所导致,而是两者相互作用的结果。
内生性问题在社会科学领域尤为常见,包括经济学、政治学、社会学等。
一、内生性问题的定义内生性问题在研究中意味着变量之间存在相互影响关系,不仅自变量影响因变量,同时也可能因变量对自变量产生影响。
这种相互影响可以是正向的也可以是负向的,有时甚至是复杂的回馈关系。
内生性问题的存在使得我们需要更加谨慎地解读数据和分析结果,以避免产生误导性的结论。
二、内生性问题的原因内生性问题的主要原因在于变量之间的复杂关系。
一方面,变量之间可能存在遗漏变量问题。
在研究中,我们不能将所有可能影响因变量的因素都纳入考虑,有些变量可能被忽略而导致结果出现偏差。
另一方面,变量之间也可能存在反向因果关系。
因变量可能同时作为自变量影响其他因变量,这种复杂的关系造成了内生性问题的存在。
三、内生性问题的解决方法为了解决内生性问题,研究者可以采用以下方法:1. 仔细控制变量:通过控制可能产生内生性问题的其他变量,使得自变量与因变量之间的关系更加可靠。
这可以通过实验设计、随机分配处理组和对照组等方法来实现。
2. 使用工具变量:工具变量是一种在经济学领域中常用的解决内生性问题的方法。
它通过引入一个与自变量相关但不直接影响因变量的变量来进行分析。
通过工具变量的引入,可以排除内生性问题对研究结果的影响。
3. 进行因果推断:通过仔细验证变量之间的因果关系,可以帮助我们更清楚地了解内生性问题的存在。
借助因果推断的方法,可以准确地解释变量之间的相互作用,并确定影响因变量的主要因素。
四、内生性问题的影响内生性问题的存在会对研究结果产生明显的影响。
如果不加以解决,内生性问题可能导致对因果关系的错误解读,使得研究结论产生偏差,缺乏可靠性和有效性。
此外,内生性问题还可能使得研究结果的泛化能力受到限制,难以推广到其他情境或群体。
内生性问题与工具变量和两阶段最小二乘一、背景虽然在OLS的大样本性质中,我们放宽了强外生性的假定,用弱外生条件来进行替代,即()0E xε'=。
但是,在实际的问题中,弱外生性的条件往往也是不容易满足的。
也就是说,变量的内生性问题总是不可避免的。
内生性引起的问题主要是引起参数估计的不一致。
可以说,内生性问题是在实际应用中最经常遇到的问题。
这个部分讨论的就是如何解决由内生性问题引起的参数估计的不一致。
二、知识要点1、引起内生性的原因及其对参数估计的影响2、代理变量法解决内生性问题3、工具变量法和2SLS的性质三、要点细纲1、引起内生性的原因及其对参数估计的影响(1)模型设定偏误(遗漏变量)这主要是因为实际的问题中,一个变量往往受到许多变量的影响,在实际建模过程中无法将解释变量全部列出。
在这样的情况下,遗漏的变量的影响就被纳入了误差项中,在该遗漏变量与其他解释变量相关的情况下,就引起了内生性问题。
即()0E xε'≠。
(2)测量误差关于测量误差引起内生性的问题要基于测量误差的假设。
测量误差可能是对被解释变量y的测量误差,也可能是由于对解释变量x的测量误差。
这两种情况引发的结果是不一样的。
A. 被解释变量y的测量误差。
不妨假设y的真实值是*y,测量值为y,则可以将测量误差表示成:*0e y y =-。
假设理论的回归方程为:*011k k y x x βββε=+++将测量误差方程带入得到:0110k k y x x e βββε=++++011k k x x v βββ=+++其中0v e ε=+是实际回归方程的残差。
显然,由于y 的测量误差0e 是与i x 相互独立的,所以实际回归方程的残差v 也与各解释变量相互独立(无关)。
外生性条件满足。
B. 解释变量x 的测量误差 假设在回归式011k k y x x βββε=+++中,测量误差产生于k x ,即实际回归式为:*011k k y x x βββε=+++并有*kk k e x x =-如果假设cov(,)0k k x e =,则将测量误差带入方程得到:011k k k k y x x e βββεβ=++++011k k x x v βββ=+++显然,外生性条件满足。
如果假设**2cov(,)0cov(,)cov(,)k k k k k k k e x e x e x e e σ=⇒=+=。
该假设条件称为Classical error-in-variables (CEV )假定。
由上述方程可以看出,此时测量误差会引起内生性问题。
( 3) 双向交互影响(或者同时受其他变量的影响)这种情况引起的内生性问题在现实中最为常见。
其基本的原理可以阐述为,被解释变量y 和解释变量x 之间存在一个交互影响的过程。
x 的数值大小会引起y 取值的变换,但同时y 的变换又会反过来对x 构成影响。
这样,在如下的回归方程中:011k k y x x βββε=+++如果残差项ε的冲击影响了y 的取值,而这样的影响会通过y 传导到x 上,从而造成了x 和残差项ε的相关。
也就是引起了内生性问题。
这里举几个简单、但经常遇到的例子说明。
例1:金融发展与经济增长例2:外商直接投资FDI 与经济增长 例3:犯罪率与警备投入2、代理变量(Proxy)法解决内生性问题 考虑如下的回归方程011k k y x x q βββγε=++++其中,q 是不可观测的变量(遗漏),假定z 是对q 的一个代理,z 必须满足下列条件:(1)(|,,)(|,)E y q z E y q =x x (2)(|,)(|)E q z E q z =x01q z r θθ=++ 代理变量的缺点:A 、当有交互效应时会引起异方差问题B 、在实际问题中,通常对遗漏的变量是难以意识到的。
C 、约束条件太强。
3、工具变量法和2SLS 的性质这里先讨论简单工具变量法,两阶段最小二乘2SLS 是简单工具变量法的一个扩展。
关于工具变量的大样本假设Ⅰ、lim p 'zz Z Z =Q n是一个有限、可逆的L L ⨯维正定矩阵。
Ⅱ、lim p 'zx Z X =Q n 是一个有限的L K ⨯的矩阵,并且该矩阵的秩是K 。
Ⅲ、lim p 'Z ε=0n(1)简单工具变量考虑如下一个回归方程:011k k y x x βββε=++++现在假设k x 是内生的,也就是说,k x 与残差项ε相关。
在这样的情况下,得到的参数估计值是有偏的。
再次强调,此时参数估计的偏差不仅仅存在于参数k β上,而是所有的参数估计值都会受到影响。
看普通最小二乘的结果:[][]11lim ()()()()p b E E E E β--''''==+x x x y x x x ε 其中,不妨设2k =,则有:()211121222212x x x x x x x x x x ⎛⎫⎛⎫'==⎪ ⎪⎝⎭⎝⎭x x ,12x x εεε⎛⎫'= ⎪⎝⎭x []1111212122()lim ()q q X X p E x x n q q --⎛⎫'⎡⎤'== ⎪⎢⎥⎣⎦⎝⎭,1122lim x X p x nεεε'⎛⎫⎛⎫= ⎪ ⎪⎝⎭⎝⎭则可以看出:1112111211112221222122221122x q x q x q q x q x q x q q εεεεεε⎛⎫⎛⎫+⎛⎫= ⎪ ⎪ ⎪+⎝⎭⎝⎭⎝⎭ 显然,当现在回到一般的回归方程:011k k y x x βββεε=++++=+x β仍然假设k x 是内生的,如果可以找到一个工具变量1z ,使得1z 满足如下两条假定:Ⅰ、1()0k E z x ≠ Ⅱ、1()0E z ε=那么,就可以定义1211(,,,,)k x x x z -=z ,方程两边左乘'z ,同取期望,得到参数估计值,使得:[][]11lim ()()()()p E E E E β--''''==+IV b z x z y z x z ε但是,这样的简单工具变量得到的估计并不是无偏的(特殊的得到无偏估计的情况是:k x 与其他外生变量无关,只和1z 相关)。
正确的做法是,将内生变量k x 对所有的外生变量进行投影(回归),也就是按照如下的公式计算:011111k k k k x x x z r αααθ--=+++++只要系数0θ≠,该工具变量就是有效的。
也就是说,必须保证1z 与k x 是在扣除了其他外生变量的影响下,仍然是相关的!这样,根据回归得到了k x 的估计值011111ˆˆˆˆˆk k k xx x z αααθ--=++++ 用估计出的ˆk x代替原来的k x ,进行OLS 估计,就可以得到产生的无偏估计。
这实际上是将内生变量分成了内生部分和外生部分,通过投影得到了外生的部分,然后进入回归方程。
(2)多工具变量和两阶段最小二乘(2SLS )多工具变量是简单工具变量的一个扩展。
当我们可以找到的工具变量不只一个的时候,我们可以提高对内生变量的拟合优度。
得到一个更好的估计值。
另外一方面,如果一个多元回归方程中含有的内生变量个数不只一个,那么我们就必须分别找到它们各自的工具变量。
总得来说,需要注意的是,工具变量的个数必须大于方程中内生变量的个数。
每一个内生变量,都必须是对所有的外生变量进行投影,这样得到的参数估计才是一致的。
下面用一个具体的例子来说明。
为了方便,我们仍然假设回归方程中只含有一个内生变量k x011k k y x x βββεε=++++=+x β现在假设我们可以找到一组外生变量12(,,,)L z z z ,正确的做法是:(1)将k x 对所有外生变量进行回归:011111k k k L k k x x x z z r r αααθθ--=+++++++=+z α其中111(,,,,)k L x x z z -=z于是可以得到:[]1ˆ()()k k xE E x -''=z z z z同理,对每一个外生的i x 进行投影,也就是如下的回归:011111i k k L k k x x x z z r r αααθθ--=+++++++=+z α,可以得到如下的结果:[]1ˆ()()i k i xE E x x -''==z z z z (2)于是定义1212ˆˆˆˆˆ(,,)(,,)k k x x x x x x==x[]1ˆ()()E E -'''==xz z z z x z Π ˆˆˆˆ⎛⎫ ⎪= ⎪ ⎪⎝⎭12k xx X x 得到:ˆ''==-1zX Z(Z Z)Z X P X 111ˆˆˆˆˆ()()[()()][()]()()---''''''===2SLS z z zb X X X Y P X P X P X Y X X X Y 带入ˆ''=-1XZ(Z Z)Z X ,得到: 1ˆˆˆ()()[()()][]-''''''''''==-1-1-12SLS b XX X Y X Z(Z Z)Z Z(Z Z)Z X X Z(Z Z)Z Y[()][]''''''=-1-1X Z(Z Z)Z X X Z(Z Z)Z Y(3)Proxy 和IV 的区别Proxy 方法是将不可观测的变量用近似的变量进行替代,也就是说,是在残差项中提取出有用的信息,但是并没有对现有的解释变量进行处理。
而IV 方法恰恰相反,它是对现有回归式中的内生变量进行的处理,找到另外一个变量对其进行“替代”,但是对于方程的残差项没有进行任何的处理。
IV 方法对工具变量有严格的外生假定条件,而Proxy 不一定成立。
(4)两阶段最小二乘的性质 ①一致性[()][]''''''=-1-12SLS b X Z(Z Z)Z X X Z(Z Z)Z Y[()][]''''''=+-1-1βX Z(Z Z)Z X X Z(Z Z)Z εlim[()][]p ''''''-1-1X Z(Z Z)Z X X Z(Z Z)Z εlim p n n n n n n ⎡⎤⎡⎤''''''⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫=⎢⎥⎢⎥ ⎪⎪ ⎪ ⎪⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎢⎥⎢⎥⎣⎦⎣⎦-1-1X Z Z Z Z X X Z Z Z Z ε()()()()()lim p n '⎛⎫⎡⎤''== ⎪⎣⎦⎝⎭-1-1xz zz xz xz zz Z εQ Q Q Q Q 0 所以,lim p =2SLS b β但是,如果在第一阶段的回归中没有包括方程中原有的外生变量,那么,一致性就不能得到保证。