计量经济学第五章
- 格式:doc
- 大小:353.00 KB
- 文档页数:13
第五章 异方差二、简答题1.异方差的存在对下面各项有何影响? (1)OLS 估计量及其方差; (2)置信区间;(3)显著性t 检验和F 检验的使用。
2.产生异方差的经济背景是什么?检验异方差的方法思路是什么? 3.从直观上解释,当存在异方差时,加权最小二乘法(WLS )优于OLS 法。
4.下列异方差检查方法的逻辑关系是什么? (1)图示法 (2)Park 检验 (3)White 检验5.在一元线性回归函数中,假设误差方差有如下结构:()i i i x E 22σε=如何变换模型以达到同方差的目的?我们将如何估计变换后的模型?请列出估计步骤。
三、计算题1.考虑如下两个回归方程(根据1946—1975年美国数据)(括号中给出的是标准差):t t t D GNP C 4398.0624.019.26-+= e s :(2.73)(0.0060) (0.0736)R ²=0.999t t t GNP D GNP GNP C ⎥⎦⎤⎢⎣⎡-+=⎥⎦⎤⎢⎣⎡4315.06246.0192.25 e s : (2.22) (0.0068)(0.0597)R ²=0.875式中,C 为总私人消费支出;GNP 为国民生产总值;D 为国防支出;t 为时间。
研究的目的是确定国防支出对经济中其他支出的影响。
(1)将第一个方程变换为第二个方程的原因是什么?(2)如果变换的目的是为了消除或者减弱异方差,那么我们对误差项要做哪些假设? (3)如果存在异方差,是否已成功地消除异方差?请说明原因。
(4)变换后的回归方程是否一定要通过原点?为什么?(5)能否将两个回归方程中的R²加以比较?为什么?2.1964年,对9966名经济学家的调查数据如下:资料来源:“The Structure of Economists’Employment and Salaries”, Committee on the National Science Foundation Report on the Economics Profession, American Economics Review, vol.55, No.4, December 1965.(1)建立适当的模型解释平均工资与年龄间的关系。
第五章经典单方程计量经济学模型:专门问题一、内容提要本章主要讨论了经典单方程回归模型的几个专门题。
第一个专题是虚拟解释变量问题。
虚拟变量将经济现象中的一些定性因素引入到可以进行定量分析的回归模型,拓展了回归模型的功能。
本专题的重点是如何引入不同类型的虚拟变量来解决相关的定性因素影响的分析问题,主要介绍了引入虚拟变量的加法方式、乘法方式以及二者的组合方式。
在引入虚拟变量时有两点需要注意,一是明确虚拟变量的对比基准,二是避免出现“虚拟变量陷阱”。
第二个专题是滞后变量问题。
滞后变量包括滞后解释变量与滞后被解释变量,根据模型中所包含滞后变量的类别又可将模型划分为自回归分布滞后模型与分布滞后模型、自回归模型等三类。
本专题重点阐述了产生滞后效应的原因、分布滞后模型估计时遇到的主要困难、分布滞后模型的修正估计方法以及自回归模型的估计方法。
如对分布滞后模型可采用经验加权法、Almon多项式法、Koyck方法来减少滞项的数目以使估计变得更为可行。
而对自回归模型,则根据作为解释变量的滞后被解释变量与模型随机扰动项的相关性的不同,采用工具变量法或OLS 法进行估计。
由于滞后变量的引入,回归模型可将静态分析动态化,因此,可通过模型参数来分析解释变量对被解释变量影响的短期乘数和长期乘数。
第三个专题是模型设定偏误问题。
主要讨论当放宽“模型的设定是正确的”这一基本假定后所产生的问题及如何解决这些问题。
模型设定偏误的类型包括解释变量选取偏误与模型函数形式选取取偏误两种类型,前者又可分为漏选相关变量与多选无关变量两种情况。
在漏选相关变量的情况下,OLS估计量在小样本下有偏,在大样本下非一致;当多选了无关变量时,OLS估计量是无偏且一致的,但却是无效的;而当函数形式选取有问题时,OLS估计量的偏误是全方位的,不仅有偏、非一致、无效率,而且参数的经济含义也发生了改变。
在模型设定的检验方面,检验是否含有无关变量,可用传统的t检验与F检验进行;检验是否遗漏了相关变量或函数模型选取有错误,则通常用一般性设定偏误检验(RESET检验)进行。
第五章 多元线性回归模型在第四章中,我们讨论只有一个解释变量影响被解释变量的情况,但在实际生活中,往往是多个解释变量同时影响着被解释变量。
需要我们建立多元线性回归模型。
一、多元线性模型及其假定 多元线性回归模型的一般形式是i iK K i i i x x x y εβββ++++= 2211令列向量x 是变量x k ,k =1,2,的n 个观测值,并用这些数据组成一个n ×K 数据矩阵X ,在多数情况下,X 的第一列假定为一列1,则β1就是模型中的常数项。
最后,令y 是n 个观测值y 1, y 2, …, y n 组成的列向量,现在可将模型写为:εββ++=K K x x y 11构成多元线性回归模型的一组基本假设为 假定1. εβ+=X y我们主要兴趣在于对参数向量β进行估计和推断。
假定2. ,0][][][][21=⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=n E E E E εεεε 假定3. n I E 2][σεε='假定4. 0]|[=X E ε我们假定X 中不包含ε的任何信息,由于)],|(,[],[X E X Cov X Cov εε= (1)所以假定4暗示着0],[=εX Cov 。
(1)式成立是因为,对于任何的双变量X ,Y ,有E(XY)=E(XE(Y|X)),而且])')|()([(])')((),(EY X Y E EX X E EY Y EX X E Y X Cov --=--=))|(,(X Y E X Cov =这也暗示 βX X y E =]|[假定5 X 是秩为K 的n ×K 随机矩阵 这意味着X 列满秩,X 的各列是线性无关的。
在需要作假设检验和统计推断时,我们总是假定: 假定6 ],0[~2I N σε 二、最小二乘回归 1、最小二乘向量系数采用最小二乘法寻找未知参数β的估计量βˆ,它要求β的估计βˆ满足下面的条件 22min ˆ)ˆ(ββββX y X y S -=-∆ (2)其中()()∑∑==-'-=⎪⎪⎭⎫ ⎝⎛-∆-nj Kj j ij i X y X y x y X y 1212ββββ,min 是对所有的m 维向量β取极小值。
第5章 OLS 的渐近性(样本容量无限增大的情况:OLS 的大样本性质)5.1一致性(1) 依概率收敛定义 (2) 均方收敛定义 (3) 概率极限法则(4) 大数定律(弱大数定律,切比雪夫和辛钦) (5)一致性z 假定:MLR.1- MLR.4 z 不一致性:源于MLR.4不满足 简单回归模型 多元回归模型:一般而言,如果x1和u 相关,其他自变量x 都和u 无关,所有的1ˆβ……ˆkβ都是不一致的。
特殊情况:如果x1和u 相关,其他自变量x 都和u 无关,而且,其他自变量x和x1也无关,则只有1ˆβ是不一致的。
和偏误的比较:相似和区别(样本和总体的区别)5.2渐近正态性(作用:大样本情形下,可替代MLR.6假定)(1) 依分布收敛定义:符号d→,极限分布 (2) 中心极限定理(3) 渐近分布(来源于极限分布,又区别于极限分布),符号a∼z 假定:MLR.1- MLR.5同方差假定不成立,会如何?实际上渐近正态性仍然成立。
但是渐近方差计算方式改变,所以t 和F 分布要改变。
z 理解:当n →∞,ˆj β是均方收敛的,即收敛于期望,而且方差收敛于0。
但是,当n 是有限数时,n 很大的话,ˆjβ可近似看作服从正态分布,其方差还没有变为0,而是渐近方差。
见式5.7。
随着n →∞渐近方差的估计值,即se 是以1/n 的速度趋向于0的。
z 5.7式怎么来的?)12ˆijr −∑来5.3渐近有效性z 渐近有效性定义:“致,且渐近正态”的估计量,其渐近协方差阵小于等于任何一个一致且渐近正态的估计量的协方差阵,则它是渐近有效的。
z 格林P76:我们还没有在大样本中证明OLS 按照“任何”一种标准都是最优的。
定理5.3也不过是告诉我们:在某一类估计量中,OLS 是最优的,即渐近有效的。
第五章练习题参考解答5.1 设消费函数为i i i i u X X Y +++=33221βββ式中,i Y 为消费支出;i X 2为个人可支配收入;i X 3为个人的流动资产;i u 为随机误差项,并且222)(,0)(i i i X u Var u E σ==(其中2σ为常数)。
试回答以下问题:(1)选用适当的变换修正异方差,要求写出变换过程;(2)写出修正异方差后的参数估计量的表达式。
5.2 根据本章第四节的对数变换,我们知道对变量取对数通常能降低异方差性,但须对这种模型的随机误差项的性质给予足够的关注。
例如,设模型为u X Y 21ββ=,对该模型中的变量取对数后得如下形式u X Y ln ln ln ln 21++=ββ(1)如果u ln 要有零期望值,u 的分布应该是什么? (2)如果1)(=u E ,会不会0)(ln =u E ?为什么? (3)如果)(ln u E 不为零,怎样才能使它等于零?5.3 由表中给出消费Y 与收入X 的数据,试根据所给数据资料完成以下问题: (1)估计回归模型u X Y ++=21ββ中的未知参数1β和2β,并写出样本回归模型的书写格式;(2)试用Goldfeld-Quandt 法和White 法检验模型的异方差性; (3)选用合适的方法修正异方差。
Y X Y X Y X 55 80 152 220 95 140 65 100 144 210 108 145 70 85 175 245 113 150 80 110 180 260 110 160 79 120 135 190 125 165 84115140205115180981301782651301859514019127013519090125137230120200759018925014020574105558014021011016070851522201131507590140225125165651001372301081457410514524011518080110175245140225841151892501202007912018026014524090125178265130185981301912705.4由表中给出1985年我国北方几个省市农业总产值,农用化肥量、农用水利、农业劳动力、每日生产性固定生产原值以及农机动力数据,要求:(1)试建立我国北方地区农业产出线性模型;(2)选用适当的方法检验模型中是否存在异方差;(3)如果存在异方差,采用适当的方法加以修正。
地区农业总产值农业劳动力灌溉面积化肥用量户均固定农机动力(亿元)(万人)(万公顷)(万吨)资产(元)(万马力)北京19.6490.133.847.5394.3435.3天津14.495.234.95 3.9567.5450.7河北149.91639 .0357.2692.4706.892712.6山西55.07562.6107.931.4856.371118.5内蒙古60.85462.996.4915.41282.81641.7辽宁87.48588.972.461.6844.741129.6吉林73.81399.769.6336.92576.81647.6黑龙江104.51425.367.9525.81237.161305.8山东276.552365.6456.55152.35812.023127.9河南200.022557.5318.99127.9754.782134.5陕西68.18884.2117.936.1607.41764新疆49.12256.1260.4615.11143.67523.35.5表中的数据是美国1988研究与开发(R&D)支出费用(Y)与不同部门产品销售量(X)。
试根据资料建立一个回归模型,运用Glejser方法和White方法检验异方差,由此决定异方差的表现形式并选用适当方法加以修正。
单位:百万美元工业群体销售量X R&D费用Y利润Z1.容器与包装6375.362.5185.12.非银行业金融11626.492.91569.53.服务行业14655.1178.3276.84.金属与采矿21869.2258.42828.15.住房与建筑26408.3494.7225.96.一般制造业32405.610833751.97.休闲娱乐35107.71620.62884.18.纸张与林木产品40295.4421.74645.79.食品70761.6509.25036.410.卫生保健80552.86620.113869.911.宇航952943918.64487.812.消费者用品101314.31595.310278.913.电器与电子产品116141.36107.58787.314.化工产品122315.74454.116438.815.五金141649.93163.99761.416.办公设备与电算机175025.813210.719774.517.燃料230614.51703.822626.618.汽车2935439528.218415.45.6 由表中给出的收入和住房支出样本数据,建立住房支出模型。
假设模型为i i i u X Y ++=21ββ,其中Y 为住房支出,X 为收入。
试求解下列问题: (1)用OLS 求参数的估计值、标准差、拟合优度(2)用Goldfeld-Quandt 方法检验异方差(假设分组时不去掉任何样本值)(3)如果模型存在异方差,假设异方差的形式是222i i X σσ=,试用加权最小二乘法重新估计1β和2β的估计值、标准差、拟合优度。
5.7 表中给出1969年20个国家的股票价格(Y )和消费者价格年百分率变化(X )的一个横截面数据。
国家 股票价格变化率%Y消费者价格变化率%X1.澳大利亚 5 4.32.奥地利 11.1 4.63.比利时 3.2 2.44.加拿大 7.9 2.45.智利 25.5 26.4 6.丹麦 3.8 4.27.芬兰 11.1 5.58.法国9.9 4.7 9.德国 13.3 2.2 10.印度 1.5 4 11.爱尔兰 6.4 4 12.以色列 8.9 8.4 13.意大利 8.1 3.3 14.日本 13.5 4.7 15.墨西哥 4.7 5.2 16.荷兰 7.5 3.6 17.新西兰 4.7 3.6 18.瑞典 8 4 19.英国 7.5 3.9 20.美国92.1试根据资料完成以下问题:(1)将Y 对X 回归并分析回归中的残差;(2)因智利的数据出现了异常,去掉智利数据后,重新作回归并再次分析回归中的残差; (3)如果根据第1条的结果你将得到有异方差性的结论,而根据第2条的结论你又得到相反的结论,对此你能得出什么样的结论?5.8 表中给出的是1998年我国重要制造业销售收入与销售利润的数据资料试完成以下问题:(1)求销售利润岁销售收入的样本回归函数,并对模型进行经济意义检验和统计检验; (2)分别用图形法、Glejser 方法、White 方法检验模型是否存在异方差; (3)如果模型存在异方差,选用适当的方法对异方差性进行修正。
5.9 下表所给资料为1978年至2000年四川省农村人均纯收入t X 和人均生活费支出tY 的数据。
四川省农村人均纯收入和人均生活费支出 单位:元/人时间农村人均纯收入X农村人均生活费支出Y时间农村人均纯收入X农村人均生活费支出Y1978 127.1 120.3 1990 557.76 509.16 1979155.9142.11991590.21552.391980 187.9 159.5 1992 634.31 569.461981 220.98 184.0 1993 698.27 647.431982 255.96 208.23 1994 946.33 904.281983 258.39 231.12 1995 1158.29 1092.911984 286.76 251.83 1996 1459.09 1358.031985 315.07 276.25 1997 1680.69 1440.481986 337.94 310.92 1998 1789.17 1440.771987 369.46 348.32 1999 1843.47 1426.061988 448.85 426.47 2000 1903.60 1485.341989 494.07 473.59数据来源:《四川统计年鉴》2001年。
(1)求农村人均生活费支出对人均纯收入的样本回归函数,并对模型进行经济意义检验和统计检验;(2)选用适当的方法检验模型中是否存在异方差;(3)如果模型存在异方差,选用适当的方法对异方差性进行修正。
5.10 在题5.9中用的是时间序列数据,而且没有剔除物价上涨因素。
试分析如果剔除物价上涨因素,即用实际可支配收入和实际消费支出,异方差的问题是否会有所改善?由于缺乏四川省从1978年起的农村居民消费价格定基指数的数据,以1978年—2000年全国商品零售价格定基指数(以1978年为100)代替,数据如下表所示:数据来源:《中国统计年鉴2001》练习题参考解答练习题5.1 参考解答(1)因为22()i i f X X =,所以取221i iW X =,用i W 乘给定模型两端,得312322221i i i i i i iY X u X X X X βββ=+++ 上述模型的随机误差项的方差为一固定常数,即 22221()()i i i iu Var Var u X X σ== (2)根据加权最小二乘法及第四章里(4.5)和(4.6)式,可得修正异方差后的参数估计式为***12233ˆˆˆY X X βββ=-- ()()()()()()()***2****22232322322*2*2**2223223ˆii i i i i i i i i i i ii ii i iW y x W x W y x W x x W xW xW x xβ-=-∑∑∑∑∑∑∑()()()()()()()***2****23222222332*2*2**2223223ˆii i i i i i i i i i i ii ii i iW y x W x W y x W x x WxWxWx xβ-=-∑∑∑∑∑∑∑其中22232***23222,,i ii ii iiiiW X W XW Y X X Y WWW===∑∑∑∑∑∑******222333i i i i i x X X x X X y Y Y =-=-=-练习题5.3参考解答(1)该模型样本回归估计式的书写形式为2ˆ9.34750.6371(2.5691)(32.0088)0.9464,..9.0323,1023.56i iY X R s e F =+===(2)首先,用Goldfeld-Quandt 法进行检验。