计量经济学伍德里奇第5版答案
- 格式:pdf
- 大小:98.18 MB
- 文档页数:312
第17章限值因变量模型和样本选择纠正17.1复习笔记一、二值响应的对数单位和概率单位模型1.线性概率模型的不足(1)拟合出来的概率可能小于0或大于1;(2)任何一个解释变量(以水平值形式出现)的偏效应都是不变的。
二值响应模型的核心是响应概率:()()12P 1x P 1 k y y x x x ===⋅⋅⋅,,,其中,用x 表示全部解释变量所构成的集合。
2.设定对数单位和概率单位模型(1)二值响应模型在LPM 中,响应概率对一系列参数j β是线性的,为避免LPM 的局限性,考虑二值响应模型:()()()01101x k k P y G x x G x βββββ==++⋅⋅⋅+=+其中,G 是一个取值范围严格介于0和1之间的函数:对所有实数z,都有0﹤G(z)﹤1。
这就确保估计出来的响应概率严格地介于0和1之间。
(2)函数G 的各种非线性形式①对数单位模型中,G 是对数函数:()()()()exp /1exp G z z z z =+=Λ⎡⎤⎣⎦对所有的实数z,它都介于0和1之间。
它是一个标准逻辑斯蒂随机变量的累积分布函数。
②概率单位模型中,G 是标准正态的累积分布函数,可表示为积分()()()d z G z z v vφ-∞=Φ≡⎰其中,()z φ是标准正态密度函数()()()1/222exp /2z z φπ-=-也确保了对所有参数和x j 的值都严格介于0和1之间。
③两个模型中G 函数都是增函数,在z=0时增加的最快,在z →-∞时,()0G z →,而在z →∞时,()1G z →。
(3)两种函数形式的推导对数单位和概率单位模型都可以由一个满足经典线性模型假定的潜变量模型推导出来。
令y *为一个由0y x e ββ*=++,y=1[y *﹥0]决定的无法观测变量或潜变量。
在其中引入记号1[·]来定义一个二值结果。
函数1[·]被称为指标函数,它在括号中的事件正确时取值1,而在其他情况下取值0。
第11章OLS 用于时间序列数据的其他问题11.1复习笔记一、平稳和弱相关时间序列1.平稳和非平稳时间序列平稳时间序列过程,就是概率分布在如下意义上跨时期稳定的时间序列过程:如果从这个序列中任取一个随机变量集,并把这个序列向前移动h 个时期,那么其联合概率分布仍然保持不变。
(1)平稳随机过程对于随机过程{ 1 2 }t x t =:,,…,如果对于每一个时间指标集121m t t t ≤<<⋅⋅⋅<和任意整数h≥1,()12m t t t x x x ⋅⋅⋅,,,的联合分布都与()12 m t h t h t h x x x ++⋅⋅⋅+,,,的联合分布相同,那么这个随机过程就是平稳的。
这种平稳经常称为严平稳,它是从概率分布的角度去定义的。
其含义之一是(取m=1和t 1=1):对所有t=2,3,…,x 1与x t 都有相同的分布。
序列{ 1 2 }t x t =:,,…是同分布的。
不平稳的随机过程称为非平稳过程。
因为平稳性是潜在随机过程而非其某单个实现的性质,所以很难判断所搜集到的数据是否由一个平稳过程生成。
但是,要指出某些序列不是平稳的却很容易。
(2)协方差平稳过程(宽平稳,弱平稳)对于一个具有有限二阶矩()2t E x ⎡⎤∞⎣⎦<的随机过程{ 1 2 }t x t =:,,…,若:(i)E(x t )为常数;(ii)Var(x t )为常数;(iii)对任何t,h≥1,Cov(x t ,x t+h )仅取决于h,而不取决于t,那它就是协方差平稳的。
协方差平稳只考虑随机过程的前两阶矩:这个过程的均值和方差不随着时间而变化,而且,x t 和x t+h 的协方差只取决于这两项之间的距离h,与起始时期t 的位置无关。
由此立即可知x t 与x t+h 之间的相关性也只取决于h。
如果一个平稳过程具有有限二阶矩,那么它一定是协方差平稳的,但反过来未必正确。
由于严平稳的条件比较苛刻,在实际中从概率分布的角度去验证是无法实现的,所以在实际运用中所指的平稳都是指宽平稳,即协方差平稳。
伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第7章含有定性信息的多元回归分析:二值(或第7章含有定性信息的多元回归分析:二值(或虚拟)变量7.1复习笔记一、对定性信息的描述定性信息通常以二值信息的形式出现。
在计量经济学中,二值变量最常见的称呼是虚拟变量。
二、只有一个虚拟自变量1.只有一个虚拟自变量的简单模型考虑如下决定小时工资的简单模型:001wage female educ uβδβ=+++用0δ表示female 的参数,以强调虚拟变量参数的含义。
假定零条件均值假定() 0E u female educ =,成立,那么:()()0| 1 |0 E wage female educ E wage female educ δ==-=,,由于female=1对应于女性且female=0对应于男性,所以可以简单的把模型写为:()()0| | E wage female educ E wage male educ δ=-,,这种情况可以在图形上描绘成男性与女性之间的截距变化。
男性线的截距是0β,女性线的截距是00βδ+。
由于只有两组数据,所以只需要两个不同的截距。
这意味着,除了0β之外,只需要一个虚拟变量。
因为female +male=1,意味着male 是female 的一个完全线性函数,如果使用两个虚拟变量就会导致完全多重共线性,这就是虚拟变量陷阱。
2.当因变量为log(y)时,对虚拟解释变量系数的解释在应用研究中有一个常见的设定,当自变量中有一个或多个虚拟变量时,因变量则以对数形式出现。
在这种情况下,此系数具有一种百分比解释。
当log(y)是一个模型的因变量时,将虚拟变量的系数乘以100,可解释为y 在保持所有其他因素不变情况下的百分数差异。
当一个虚拟变量的系数意味着y 有较大比例的变化时,可以得到精确的百分数差异。
一般地,如果1β是一个虚拟变量(比方说x 1)的系数,那么,当log(y)是因变量时,在x 1=1时预测的y 相对于在x 1=0时预测的y,精确的百分数差异为:()1?100exp 1β-??三、使用多类别虚拟变量1.在方程中包括虚拟变量的一般原则如果回归模型具有g 组或g 类不同截距,那就需要在模型中包含g-1个虚拟变量和一个截距。
第2章简单回归模型2.1复习笔记一、简单回归模型的定义1.简单线性回归模型一个简单的方程是:01y x uββ=++假定方程在所关注的总体中成立,它便定义了一个简单线性回归模型。
因为它把两个变量x 和y 联系起来,所以又把它称为两变量或者双变量线性回归模型。
变量u 称为误差项或者干扰项,表示除x 之外其他影响y 的因素。
1β就是y 与x 的关系式中的斜率参数,表示在其他条件不变的情况下,x 变化一个单位y 平均变化。
0β被称为截距参数,在一般的模型中除非有很强的理论依据说明模型没有截距项,否则一般情况下都要带上截距项。
2.回归术语表2-1简单回归的术语3.零条件均值假定(1)零条件均值u 的平均值与x 值无关。
可以把它写作:()()|E u x E u =当方程成立时,就说u 的均值独立于x。
(2)零条件均值假定的意义①零条件均值假定给出1β的另一种非常有用的解释。
以x 为条件取期望值,并利用()|0E u x =,便得到:()01|E y x xββ=+方程表明,总体回归函数(PRF)()|E y x 是x 的一个线性函数,线性意味着x 变化一个单位,将使y 的期望值改变1β。
对任何给定的x 值,y 的分布都以()|E y x 为中心。
1β就是斜率参数。
②给定零条件均值假定()|0E u x =,把方程中的y 看成两个部分是比较有用的。
一部分是表示()|E y x 的01x ββ+,被称为y 的系统部分,即由x 解释的那一部分,另一个部分是被称为非系统部分的u,即不能由x 解释的那一部分。
二、普通最小二乘法的推导1.最小二乘估计值从总体中找一个样本。
令(){} 1 i i x y i n =,:,…,表示从总体中抽取的一个容量为n 的随机样本。
01i i iy x u ββ=++在总体中,u 与x 不相关。
因此有:()()()0cov 0E u x u E xu ===,和用可观测变量x 和y 以及未知参数0β和1β表示为:()010E y x ββ--=()010E x y x ββ--=⎡⎤⎣⎦得到()0111ˆˆ0ni ii y x n ββ=--=∑和()0111ˆˆ0ni i ii x y x n ββ=--=∑这两个方程可用来解出0ˆβ和1ˆβ01ˆˆy x ββ=+则01ˆˆy x ββ=-一旦得到斜率估计值1ˆβ,则有:()111ˆˆ0niiii x y y x x ββ=⎡⎤---=⎣⎦∑整理后便得到:()()111ˆnniii i i i x yy x x x β==-=-∑∑根据求和运算的基本性质,有:()()211n ni i i i i x x x x x ==-=-∑∑()()()11nniii i i i x yy x x y y==-=--∑∑因此,只要有()21nii x x =->∑估计的斜率就为:()()()1121ˆnii i ni i xx y yx x β==--=-∑∑所给出的估计值称为0β和1β的普通最小二乘(OLS)估计值。
第14章高级的面板数据方法14.1复习笔记一、固定效应估计法1.固定效应变换固定效应变换又称组内变换,考虑仅有一个解释变量的模型:对每个i,有1 12 it it i it y x a u t Tβ=++=,,,…,对每个i 求方程在时间上的平均,便得到1i i i iy x a u β=++其中,11T it t y T y-==∑(关于时间的均值)。
因为a i 在不同时间固定不变,故它会在原模型和均值模型中都出现,如果对于每个t,两式相减,便得到()1 1 2 it i it i it i y y x x u u t Tβ-=-+-=,,,…,或1 12 it it it y x u t Tβ=+= ,,,…,其中,it it i y y y =- 是y 的除时间均值数据;对it x和it u 的解释也类似。
方程的要点在于,非观测效应a i 已随之消失,从而可以使用混合OLS 去估计式1 1 2 it it it y x u t T β=+= ,,,…,。
上式的混合OLS 估计量被称为固定效应估计量或组内估计量。
组间估计量可以从1i i i i y x a u β=++的OLS 估计量而得到,即同时使用y 和x 的时间平均值做一个横截面回归。
如果a i 与i x 相关,估计量是有偏误的。
而如果认为a i 与x it 无关,则使用随机效应估计量要更好。
组间估计量忽视了变量如何随着时间而变化。
2.原始的非观测效应模型1122 1 2 it it it k itk i it y x x x a u t Tβββ=++⋅⋅⋅+++=,,,…,只需对每个解释变量(包括诸如时期虚拟变量)都除去其时间均值,然后利用全部除时间均值后的变量做混合OLS 回归即可。
在解释变量的严格外生性假定下,固定效用估计量是无偏的:粗略地说,特异误差u it 应与所有时期的每个解释变量都无关。
固定效应估计量如一阶差分估计量一样,容许a i 与任何时期的解释变量任意相关,因为在时间上恒定的解释变量都必定随固定效应变换而消失。
第18章时间序列高级专题18.1复习笔记一、无限分布滞后模型1.无限分布滞后模型令{(y t ,z t ):t=…,-2,-1,0,1,2,…}代表一个双变量时间序列过程。
将y t 与z 的当期和所有过去值相联系的一个无限分布滞后模型(IDL)为:01122t t t t ty z z z u αδδδ--=+++++…其中,z 的滞后可以一直追溯到无限过去,因此IDL 模型不要求在某个特定时刻截断滞后。
为了使IDL 模型有意义,随着j 趋于无穷大,滞后系数j δ必须趋于0。
这并不意味着2δ在数量上比1δ小,只是要求z t-1对y t 的影响必须随着j 无限递增而最终变得很小。
相应的经济含义:遥远过去的z 对y 的解释能力不如新近过去的z。
如果IDL 模型不加限制,那么是无法估计的,因为模型中有无数个参数,而只能观测到有限的样本数据。
(1)无限分布滞后模型的短期倾向01122t t t t t y z z z u αδδδ--=+++++…的短期倾向就是0δ。
假设s﹤0时,z s =0;s ﹥0时z s =1,z 1=0。
也就是说,z 在t=0时期暂时性地增加一个单位,然后又回到它的初始值0。
对所有h≥0,都有h h h y u αδ=++ ,所以有()h hE y αδ=+给定z 在0时期的一个单位的暂时变化,h δ就是E (y k )的改变值。
因为在IDL 模型中,h δ必须随着h 渐增而趋于0,所以z 的一个暂时变化对y 的期望值没有长期影响:随着h →∞,()h h E y αδα=+→。
如果z 在t 时期暂时增加一个单位,那么h δ就度量了h 个时期后y 的期望值变化。
滞后分布显示了给定z 暂时增加一个单位,未来的y 所服从的期望路径。
(2)无限分布滞后模型的长期倾向长期倾向等于所有滞后系数之和:0123LRP δδδδ=++++…因为假定j δ必须收敛于0,所以对于足够大的p,LRP 常常用01....p δδδ+++近似,LRP 度量了给定z 一个单位的永久性增加,y 的期望值的长期变化。
第12章时间序列回归中的序列相关和异方差性12.1复习笔记一、含序列相关误差时OLS 的性质1.无偏性和一致性在时间序列回归的前3个高斯—马尔可夫假定(TS.1~TS.3)之下,OLS 估计量是无偏的。
特别地,只要解释变量是严格外生的,无论误差中的序列相关程度如何,ˆjβ都是无偏的。
这类似于误差中的异方差不会造成ˆjβ产生偏误。
把严格外生性假定放松到()|0t t E u X =,并证明了当数据是弱相关的时候,ˆj β仍然是一致的(但不一定无偏)。
这一结论不以对误差中序列相关的假定为转移。
2.效率和推断高斯—马尔可夫定理要求误差的同方差性和序列无关性,所以,在出现序列相关时,OLS 便不再是BLUE 的了。
通常的OLS 标准误和检验统计量也不再确当,而且连渐近确当都谈不上。
假定误差存在序列相关,1,1,2,...,ρ-=+=tt t u u e t n ,1ρ<。
其中e t 是均值为0方差为2e σ满足经典假定的误差,对于简单回归模型:01ββ=++t t ty x u 假定x t 的样本均值为零,于是1111ˆn x t t i SST x u ββ-==+∑其中21n x t i SST x ==∑,计算1ˆβ的方差,()()22221111ˆ/2/n n n t j x t t x x t t j i i j Var SST Var x u SST SST x x βσσρ--+===⎛⎫==+ ⎪⎝⎭∑∑∑其中()2σ=t Var u 由1ˆβ的方差表达形式可知,第一项为2/xSST σ,为经典假定条件下的简单回归模型中参数的方差,所以当模型中的误差项存在序列相关时,按照OLS 估计的方差是有偏的。
在出现序列相关的时候,使用通常的OLS 标准误就不再准确。
因此,检验单个假设的t 统计量也不再正确。
因为较小的标准误意味着较大的t 统计量,所以当ρ﹥0时,通常的t 统计量常常过大。
用于检验多重假设的通常的F 统计量和LM 统计量也不再可靠。
第16章联立方程模型16.1复习笔记解释变量另一种重要的内生性形式是联立性。
当一个或多个解释变量与因变量联合被决定时,就出现联立性问题。
一、联立方程模型的性质联立方程组中的每个方程都具有其他条件不变的因果性解释。
SEM(联立方程模型)的经典例子是某个商品或要素投入的供给和需求方程:劳动供给函数与需求函数是从经济理论推导出来并具有因果性解释的事实,是结构方程。
这两个方程一起构成了一个联立方程模型。
联立方程模型的重要特征:①给定z i1、z i2、u i1和u i2,这两个方程就决定了h i和w i。
h i和w i是这个SEM中的内生变量。
z i1和z i2由于在模型外决定,是外生变量。
②从统计观点来看,关于z i1和z i2的关键假定是,它们都与u i1和u i2无关。
由于这些误差出现在结构方程中,所以它们是结构误差。
③SEM中的每个方程自身都应该有一个行为上的其他条件不变解释。
二、OLS中的联立性偏误在一个简单模型中,与因变量同时决定的解释变量一般都与误差项相关,这就导致OLS中存在偏误和不一致性。
1.约简型方程考虑两个方程的结构模型:112111y y z u αβ=++221222y y z u αβ=++专门估计第一个方程。
变量z 1和z 2都是外生的,所以每个都与u 1和u 2无关。
如果将式112111y y z u αβ=++的右边作为y 1代入式221222y y z u αβ=++中,得到()212211222121y z z u u αααββα-=+++为了解出y 2,需对参数做一个假定:211αα≠这个假定是否具有限制性则取决于应用。
如果上式的条件成立,y 2可写成22112222y z z v ππ=++其中,()212121/1παβαα=-、()22221/1πβαα=-和()()221221/1v u u ααα=+-,用外生变量和误差项表示y 2的方程22112222y z z v ππ=++是y 2的约简型。
第8章异方差性8.1复习笔记一、异方差性对OLS 所造成的影响1.异方差性对无偏性的影响多元线性回归模型表达式为:01122k k y x x x uββββ=+++⋅⋅⋅+异方差性并不会导致j β的OLS 估计量出现偏误或产生不一致性,但诸如省略一个重要变量之类的情况出现则具有这种影响。
2.异方差性对拟合优度的影响对拟合优度指标R 2和2R 的解释不受异方差性的影响。
通常的R 2和调整2R 都是估计总体R 2的不同方法,而总体R 2无非就是221/u y σσ-(因为2/11/SSR SSR n R SST SST n=-=-),其中2u σ是总体误差方差,2y σ是y 的总体方差。
关键是,由于总体R 2中这两个方差都是无条件方差,所以总体R 2不受()1Var | k u x x ⋅⋅⋅,,中出现异方差性的影响。
无论()1Var | k u x x ⋅⋅⋅,,是否为常数,SSR/n 都一致地估计了2u σ,SSR/n 也一致地估计了2y σ。
当使用自由度调整时,依然如此。
因此,无论同方差假定是否成立,R 2和2R 都一致地估计了总体R 2。
3.估计量的方差()ˆVar jβ在没有同方差假定的情况下,估计量的方差ˆ()jVar β是有偏的。
由于OLS 标准误直接以这些方差为基础,所以它们都不能用来构造置信区间和t 统计量。
4.对统计检验的影响在出现异方差性的情况下,在高斯-马尔可夫假定下用来检验假设的统计量都不再成立。
(1)在出现异方差性时,通常普通最小二乘法的t 统计量就不具有t 分布,使用大样本容量也不能解决这个问题。
(2)F 统计量也不再是F 分布。
(3)LM 统计量也不服从渐近2χ分布。
二、OLS 估计后的异方差—稳健推断1.单个自变量模型01i i iy x u ββ=++假定前4个高斯-马尔可夫假定成立。
如果误差包含异方差性,那么()2Var |i i iu x σ=其中,给2σ加上下标i,表示误差方差2i σ不再是固定的值,而是随着x i 的不同而不同。
计量经济学导论:现代观点(第5版)
伍德里奇
配套答案与整理归纳
内容简介
《计量经济学导论》用简洁、准确的语言阐述了计量
经济学研究的特点。
与传统的教材不同,在陈述和解释假
定时,作者完全放弃了非*的或在重复样本中加以固定的
回归元假定。
这种方法更便于读者对计量经济学的理解和
运用,是对传统计量经济学教学和研究的一个突破。
本书
含有大量例题,许多是取自或受启发于应用经济学或其他
领域的作品。
《计量经济学导论》适合各大专院校经济管理类专业
本科生用作教材,也可供经济管理类教师及科研人员用作
参考书。
作者简介
(美)伍德里奇,密歇根州立大学经济学教授,曾在
国际知名期刊发表学术论文三十余篇,参与过多种书籍的
写作。
他获得过Alfred P.Sloan研究员基金、应用计量
经济学期刊的R.Stone爵士奖等奖项。
他还是《商业与经济统计学》杂志(Journal of Business and Economic)的编委,并供职于《计量经济学》杂志(Journal of Econometrics)和《经济统计学评论》(Review of Economics andStatistics)的编委会。
log
mlr5。