第八章 虚拟变量回归 思考题
- 格式:doc
- 大小:218.00 KB
- 文档页数:4
第八章复习思考题及答案一、基本概念1、系统动力学(Systems Dynamics,SD)是美国麻省理工学院(MIT)的弗雷斯特(J. W. Forrester)教授于1956年提出的一种以反馈控制理论为基础,以计算机仿真技术为辅助手段的计算机仿真模型。
2、因果关系分析是系统动力学的基础,起着指明系统的变量间因果关系、作用方向和说明系统的反馈回路的作用。
通常事件间因果关系的逻辑可描述为“如果……那么就……”。
因果关系可以用因果关系图来表示。
3、因果链是用因果箭来描述的递推性的因果关系。
例如,A是B的原因,B是C的原因,则A也成为C的原因。
4、一般系统内变量间的因果关系用箭头图表示,一个箭头连接两个有因果关系的相关变量,称之为因果箭。
5、当因果链中“原因”引起“结果”,“结果”又引起“结果的结果”,最终又作用于最初的“原因”,形成一个封闭的回路,则称为因果关系的反馈回路或因果反馈回路、因果反馈环。
6、流程图中可以根据流率等因素的影响,描述系统状态变量的变化,并通过相应的系统动力学方程来精确表示变量的变化机制。
7、系统动力学中,流率变量用来表示决策函数。
“流率”描述的是系统中的流随时间而变化的活动状态,如人口出生率、死亡率、提货速度等,用一个表示阀门的符号来标记。
8、Vensim是由美国Ventana Systems公司开发的一款可视化系统动力学软件,它提供了相对简单灵活的方式,建立仿真模型,观察变量的因果关系和反馈回路,便于修改、优化和探索模型。
二、选择题(1-4单选,5-8多选)1、如果变量A的增加使变量B也增加,那么两者为()A. 正因果关系B. 负因果关系C. 负因果链D. 正因果链2、全部因果箭都是负极性的反馈回路()A.一定是负反馈回路B.一定是正反馈回路C.可能是正反馈回路也可能是负反馈回路D.既不是正反馈回路也不是负反馈回路3、描述系统积累效应的变量是()A.系统变量B.状态变量C.决策变量D.流率变量4、()的多少是系统复杂程度的标志。
计量经济学课程教案授课题目(教学章、节或主题):第8章 虚拟变量回归授课时间安排第16周共2课时教学器材与工具多媒体授 课 类 型(请打√)理论课√讨论课□ 实验课□ 习题课□ 双语课程□ 其他□教学目的、要求(分掌握、熟悉、了解三个层次):1、熟悉虚拟变量的含义;2、掌握虚拟变量设置原则;3、掌握虚拟变量回归引入方法;4、了解虚拟被解释变量模型。
教学重点及难点:虚拟变量回归引入方法与估计方法教 学 基 本 内 容§1 虚拟变量§2 虚拟解释变量的回归§3 虚拟被解释变量*§4 案例分析教学过程设计: 一、引入二、讲授三、小结教学方法及手段(请打√):讲授√、讨论□、多媒体讲解√、模型、实物讲解□、挂图讲解□、音像讲解□等。
作业、讨论题、思考题:1、什么是虚拟变量?它在模型中有什么作用?参考资料(含参考书、文献等):《计量经济学》,(美)D.Gujarati 著,林少宫译;《计量经济学》,李子奈编著;《经济计量学精要》,(美)D.Gujarati著,张寿等译。
课后小结:虚拟变量从本质上说是“数据分类器”,它根据样本的属性(性别、婚姻状况、种族、宗教等等)将样本分为各个不同的子群体并对每个子群体进行回归分析。
若模型包含多个定性变量,而且每个定性变量有多种分类,则引入模型的虚拟变量将消耗大量的自由度。
因此,应当权衡进入模型的虚拟变量的个数以免超过样本观察值的个数。
第8章 虚拟变量回归§8.1 虚拟变量一、虚拟变量的基本含义许多经济变量是可以定量度量的,如:商品需求量、价格、收入、产量等。
但也有一些影响经济变量的因素无法定量度量,如:职业、性别对收入的影响,战争、自然灾害对GDP的影响,季节对某些产品(如冷饮)销售的影响等等。
为了在模型中能够反映这些因素的影响,并提高模型的精度,需要将它们“量化”, 这种“量化”通常是通过引入“虚拟变量”来完成的。
根据这些因素的属性类型,构造只取“0”或“1”的人工变量,通常称为虚拟变量(dummy variables),记为D。
第八章 虚拟变量回归 思考题8.1 什么是虚拟变量 ? 它在模型中有什么作用 ?8.2 虚拟变量为何只选 0 、 1, 选 2 、 3 、 4 行吗 ? 为什么 ? 8.3 对 (8.10) 式的模型 , 如果选择一个虚拟变量1,01D ⎧⎪=⎨⎪-⎩大专及大专以上,高中,高中以下这样的设置方式隐含了什么假定 ? 这一假定合理吗 ?8.4 引入虚拟解释变量的两种基本方式是什么 ? 它们各适用于什么情况 ? 8.5 四种加法方式引入虚拟变量会产生什么效应?8.6 引入虚拟被解释变量的背景是什么?含有虚拟被解释变量模型的估计方法有哪些 ? 8.7 设服装消费函数为12233ti i i i Y D D X u αααβ=++++其中,i X =收入水平 ;Y = 年服装消费支出 ;1,30D ⎧=⎨⎩大专及大学以上,其他 ;1,20D ⎧=⎨⎩女性,其他试写出不同人群组的服装消费函数模型。
8.8 利用月度数据资料 ,为了检验下面的假设,应引入多少个虚拟解释变量 ?1) 一年里的 12 个月全部表现出季节模式 ;2) 只有 2 月、 6 月、 8 月、 10 月和 12 月表现出季节模式。
练习题8.1 1971 年 ,Sen 和 Sztvastava 在研究贫富国之间期望寿命的差异时 , 利用 101 个国家的数据 , 建立了如下回归模型[]ˆ 2.409.39ln 3.36(ln 7)i i i i Y X D X =-+--(4.37)(0.857)(2.42) R2=0.752其中 ,X 是以美元计的人均收入 ;Y 是以年计的期望寿命 ;Sen 和 Srimstava 认为人均收入的临界值为 1097 美元 (ln1097=7), 若人均收入超过 1097 美元 , 则被认定为富国 ; 若人均收入低于1097美元 , 被认定为贫穷国。
括号内的数值为对应参数估计值的t 值。
1) 解释这些计算结果。
第一章绪论你能分别举出三个时间序列数据、截面数据、面板数据、虚拟变量数据的实际例子,并分别说明这些数据的来源吗?答:时间序列数据:中国1981年至2010年国内生产总值,可从中国统计年鉴查得数据。
截面数据:中国2010年各省、区、直辖市的国内生产总值,中国统计年鉴查得数据。
面板数据:中国1981年至2010年各省、区、直辖市的国内生产总值,中国统计年鉴查得数据。
虚拟变量数据:自然灾害状态,1表示该状态发生,0表示该状态不发生。
为什么对已经估计出参数的模型还要进行检验?你能举一个例子说明各种检验的必要性吗?答:模型中的参数被估计以后,一般说来这样的模型还不能直接加以应用,还需要对其进行检验。
首先,在设定模型时,对所研究经济现象规律性的认识可能并不充分,所依据的经济理论对所研究对象也许还不能作出正确的解释和说明。
或者经济理论是正确的,但可能我们对问题的认识只是从某些局部出发,或者只是考察了某些特殊的样本,以局部去说明全局的变化规律,可能导致偏差。
其次,我们用以估计参数的统计数据或其它信息可能并不十分可靠,或者较多地采用了经济突变时期的数据,不能真实代表所研究的经济关系,或者由于样本太小,所估计参数只是抽样的某种偶然结果。
此外,我们所建立的模型、采用的方法、所用的统计数据,都有可能违反计量经济的基本假定,这也可能导出错误的结论。
第二章简单线性回归模型2.1相关分析与回归分析的关系是什么?答:相关分析与回归分析有密切的关系,它们都是对变量间相关关系的研究,二者可以相互补充。
相关分析可以表明变量间相关关系的性质和程度,只有当变量间存在一定程度的相关关系时,进行回归分析才有实际的意义。
同时,在进行相关分析时如果要具体确定变量间相关的具体数学形式,又要依赖于回归分析,而且相关分析中相关系数的确定也是建立在回归分析基础上的。
相关分析与回归分析的区别。
从研究目的上看,相关分析是用一定的数量指标(相关系数)度量变量间相互联系的方向和程度;回归分析却是要寻求变量间联系的具体数学形式,是要根据解释变量的固定值去估计和预测被解释变量的平均值。
第 8 章非线性回归思考与练习参考答案8.1 在非线性回归线性化时,对因变量作变换应注意什么问题?答:在对非线性回归模型线性化时,对因变量作变换时不仅要注意回归函数的形式,还要注意误差项的形式。
如:(1)乘性误差项,模型形式为y AK L e,(2)加性误差项,模型形式为y AK L。
对乘法误差项模型(1)可通过两边取对数转化成线性模型,(2)不能线性化。
一般总是假定非线性模型误差项的形式就是能够使回归模型线性化的形式,为了方便通常省去误差项,仅考虑回归函数的形式。
8.2为了研究生产率与废料率之间的关系,记录了如表8.15所示的数据,请画出散点图,根据散点图的趋势拟合适当的回归模型。
表8.15生产率x(单位/周)1000 2000 3000 3500 4000 4500 5000废品率y(% ) 5.2 6.5 6.8 8.1 10.2 10.3 13.0解:先画出散点图如下图:12.0010.008.006.001000.00 2000.00 3000.00 4000.00 5000.00从散点图大致可以判断出 x 和 y 之间呈抛物线或指数曲线,由此采用二次方程式和指数函数进行曲线回归(1)二次曲线SPSS输出结果如下:ANOVA从上表可以得到回归方程为:y? 5.843 0.087 x 4.47 10 7x2由 x 的系数检验 P 值大于 0.05,得到 x 的系数未通过显著性检验。
由x2的系数检验 P值小于 0.05,得到 x2的系数通过了显著性检验。
(2)指数曲线ANOVASum ofSquares df Mean Square F Sig.Regression .573 1 .573 79.538 .000Residual .036 5 .007Total .609 6Unstandardized Coefficients StandardizedCoefficientst Sig.B Std. Error Betax .000 .000 .970 8.918 .000(Constant) 4.003 .348 11.514 .000从上表可以得到回归方程为:y? 4.003e0.0002t由参数检验 P 值≈0<0.05,得到回归方程的参数都非常显著。
第八章 虚拟变量回归一、判断题1.虚拟变量只能作为解释变量。
(F )2. 引入虚拟变量后,用普通最小二乘法得到的估计量仍是无偏的。
( T )3.引入虚拟变量的个数与模型有无截距项无关。
(F )4.虚拟变量用来表示某些具有若干属性的变量。
(T )5.引入虚拟变量的个数与样本容量大小有关。
(F )二、单项选择题1.设消费函数011t t t y a a D b x u =+++,其中虚拟变量10D ⎧=⎨ ⎩东中部西部,如果统计检验表明10a =成立,则东中部的消费函数与西部的消费函数是( D )。
A. 相互平行的B. 相互垂直的C. 相互交叉的D. 相互重叠的2.虚拟变量( A )A.主要来代表质的因素,但在有些情况下可以用来代表数量因素B.只能代表质的因素C.只能代表数量因素D.只能代表季节影响因素3.分段线性回归模型的几何图形是( D )A. 平行线B. 垂直线C. 光滑曲线D. 折线4.如果一个回归模型中(包含截距项),对一个具有m 个特征的质的因素要引入虚拟变量数目为( B )。
A.mB.m-1C.m-2D.m+15.设某商品需求模型为01t t t y b b x u =++,其中Y 是商品的需求量,X 是商品的价格,为了考虑全年12个月份季节变动的影响,假设模型中引入了12个虚拟变量,则会产生的问题为( D )。
A .异方差性B .序列相关C .不完全的多重共线性D .完全的多重共线性6.设消费函数为i i i 33i 22i 11o i u bx D D D y +++++=αααα,其中y 为消费,x 为收入,虚拟变量⎩⎨⎧=⎩⎨⎧=⎩⎨⎧=其他季度第三季度,其他季度第二季度,其他季度第一季度 0 0 0 321D 1D 1D 1,该模型中包含了几个定性影响因素?( A )。
A.1B. 2C. 3D. 47. 设消费函数为i i i o i u Dx b x b D y ++++=101αα,其中虚拟变量⎩⎨⎧=农村家庭城镇家庭 0 1D ,当统计检验表明下列哪项成立时,表示城镇家庭与农村家庭有一样的消费行为( A )。
第五章 异方差性思考题5.1 简述什么是异方差?为什么异方差的出现总是与模型中某个解释变量的变化有关?答 :设模型为),....,,(....n 21i X X Y i i 33i 221i =μ+β++β+β=,如果其他假定均不变,但模型中随机误差项的方差为),...,,()(n 21i Var 2i i =σ=μ,则称i μ具有异方差性。
由于异方差性指的是被解释变量观测值的分散程度是随解释变量的变化而变化的,所以异方差的出现总是与模型中某个解释变量的变化有关。
5.2 试归纳检验异方差方法的基本思想,并指出这些方法的异同。
答:各种异方差检验的共同思想是,基于不同的假定,分析随机误差项的方差与解释变量之间的相关性,以判断随机误差项的方差是否随解释变量变化而变化。
其中,戈德菲尔德-跨特检验、怀特检验、ARCH 检验和Glejser 检验都要求大样本,其中戈德菲尔德-跨特检验、怀特检验和Glejser 检验对时间序列和截面数据模型都可以检验,ARCH 检验只适用于时间序列数据模型中。
戈德菲尔德-跨特检验和ARCH 检验只能判断是否存在异方差,怀特检验在判断基础上还可以判断出是哪一个变量引起的异方差。
Glejser 检验不仅能对异方差的存在进行判断,而且还能对异方差随某个解释变量变化的函数形式进行诊断。
5.3 什么是加权最小二乘法?它的基本思想是什么?答:以一元线性回归模型为例:12i i i Y X u ββ=++经检验i μ存在异方差,公式可以表示为22var()()i i i u f X σσ==。
选取权数 i w ,当2i σ 越小 时,权数i w 越大。
当 2i σ越大时,权数i w 越小。
将权数与 残差平方相乘以后再求和,得到加权的残差平方和:2i 21i 2i i X Y w e w )(**β-β-=∑∑,求使加权残差平方和最小的参数估计值**ˆˆ21ββ和。
这种求解参数估计式的方法为加权最小二乘法。
第八章虚拟变量回归作业及答案一单选题1、设某地区消费函数中,消费支出不仅与收入x有关,而且与消费者的年龄构成有关,若将年龄构成分为小孩、青年人、成年人和老年人4个层次。
假设边际消费倾向不变,考虑上述年龄构成因素的影响时,该消费函数引入虚拟变量的个数为( C )。
A. 1个B. 2个C. 3个D. 4个2、对于含有截距项的计量经济模型,若想将含有m个互斥类型的定性因素引入到模型中,则应该引入虚拟变量个数为( B )。
A.mB.m-1C.m+1D.m-k3、对于一个不包含截距项的回归模型,若将一个具有m个特征的质的因素引入进计量经济模型,则虚拟变量数目为( A ) 。
A.mB.m-1C.m-2D.m+14、在利用月度数据构建计量经济模型时,如果一年里的1、3、5三个月表现出季节模式,则应该引入虚拟变量个数为( A )。
A.3B.12C.11D.75、设某计量经济模型为:Yi=a+b*Di+ui,其中Yi表示大学教授年薪,D为虚拟变量,D=1:男教授;D=0:女教授。
对于参数b的含义,下列解释正确的是( C )。
A. b表示大学女教授的平均年薪B. b表示大学男教授的平均年薪C. b表示大学男教授与女教授平均年薪的差异D. b表示大学男教授和女教授平均年薪6、当质的因素引进经济计量模型时,需要使用( D )。
A.外生变量B.前定变量C.内生变量D.虚拟变量7、某商品需求函数为Yi=a+b*Xi+ui,其中Y为需求量,X为价格。
为了考虑“地区”(农村、城市)和“季节”(春、夏、秋、冬)两个因素的影响,拟引入虚拟变量,则应引入虚拟变量的个数为( B )。
A.2B.4C.5D.6二多选题1、关于虚拟变量,下列表述正确的有( ABC )A.是质的因素的数量化 B.可取值为l和0C.代表质的因素 D.代表数量因素2、虚拟变量的特殊作用有( BCD )A.检验模型结构的显著性 B.检验模型结构的稳定性C.分段回归 D.混合回归3、虚拟变量的取值为0和1,分别代表某种属性的存在与否,其中( BC )A. 0表示存在某种属性B.0表示不存在某种属性C. 1表示存在某种属性D.0和1代表的内容可以随意设定4、下面关于虚拟变量的引入方式的说法,正确的有( AD )A.以加法方式引入虚拟变量,反映的是定性因素对截距的影响B.以加法方式引入虚拟变量,反映的是定性因素对斜率的影响C.以乘法方式引入虚拟变量,反映的是定性因素对截距的影响D.以乘法方式引入虚拟变量,反映的是定性因素对斜率的影响5、关于虚拟变量,下列说法正确的是( AC )。
练习题8.1参考解答:(1)在其它条件不变的情况下,对数人均收入提高1%,则平均预期寿命可能提高约0.0939年。
但从统计检验结果看,对数人均收入lnX 对期望寿命Y 的影响并不显著。
方程的拟合情况良好,可进一步进行多重共线性等其他计量经济学的检验。
(2)引入()ln 7i i D X -的原因是想从截距和斜率两个方面考证将人均收入超过1097美元的国家定义为富国的话,贫国和富国的预期寿命是否存在显著的区别。
如果人均收入大于1097美元,那么虚拟变量取值为1,否则为0。
即:1 1097(l n()7)0 1097i i D X ⎧-=⎨⎩人均收入大于美元人均收入低于美元(3) 对于贫穷国,其回归方程为:2.409.39ln i X -+ 对于富国,其回归方程为:2.40(9.39-3.36)ln 3.36*721.12 6.03ln i i X X -++=+习题8.2参考答案由于有四个季度,因此引入三个季度虚拟变量1 1 1 1220 0 0 D D D ⎧⎧⎧===⎨⎨⎨⎩⎩⎩一季度二季度三季度其它其它其它(1)按照加法模型引入三个虚拟变量,模型为:(加法模型的作用是改变了设定模型的截距水平)i 0112233i i Y =D D D X ααααβμ+++++回归结果如下:123i 22ˆ=6910.449187.7317D 1169.32D 417.1182D 0.038008X t= (3.594792) (-0.28439 (1.835446) 065093256914 R =0.517642 R =0.416093 F=5.097454 DW=0.39625i Y -+-+)(-.) (.) (2)由于考虑利润对销售额的变化率发生变异,即斜率的改变,因此按照乘法模型引入三个虚拟变量,模型为:i 01i 1i 12i 23i 3i Y =X X D X D X D ββαααμ+++++回归结果如下:i i 1i 2i 322ˆ=7014.7570.037068X -0.000933X D 0.00791X D 0.002385X D t= (3.934394) (3.273896 (-0.216776) 0.0040180.58529 R =0.519733 R =0.418624 F=5.140311 DW=0.429628i Y ++--)() () (3)按照加法和乘法相结合的方式引入三个虚拟变量,模型为:i 01122331i 2i 13i 24i 3i Y =D D D X X D X D X D ααααββββμ++++++++回归结果为:i 123i i 1i 2i 322ˆY =10457.394752.26D 3764.21D 4635.46D 0.0159X 0.029X D 0.03X D 0.0266X D t= (2.566) (-0.87 (-0.6860.8320.6280824089960749 R =0.546701 R =0.348383 F=2---++++-)) () () (.) (.)(.).756686 DW=0.464982通过对三个模型对比分析可以看出,第三个模型的系数均不显著,模型一和二销售额的系数显著,其余系数也不显著。
第五章 异方差性思考题5.1 简述什么是异方差?为什么异方差的出现总是与模型中某个解释变量的变化有关?答 :设模型为),....,,(....n 21i X X Y i i 33i 221i =μ+β++β+β=,如果其他假定均不变,但模型中随机误差项的方差为),...,,()(n 21i Var 2i i =σ=μ,则称i μ具有异方差性。
由于异方差性指的是被解释变量观测值的分散程度是随解释变量的变化而变化的,所以异方差的出现总是与模型中某个解释变量的变化有关。
5.2 试归纳检验异方差方法的基本思想,并指出这些方法的异同。
答:各种异方差检验的共同思想是,基于不同的假定,分析随机误差项的方差与解释变量之间的相关性,以判断随机误差项的方差是否随解释变量变化而变化。
其中,戈德菲尔德-跨特检验、怀特检验、ARCH 检验和Glejser 检验都要求大样本,其中戈德菲尔德-跨特检验、怀特检验和Glejser 检验对时间序列和截面数据模型都可以检验,ARCH 检验只适用于时间序列数据模型中。
戈德菲尔德-跨特检验和ARCH 检验只能判断是否存在异方差,怀特检验在判断基础上还可以判断出是哪一个变量引起的异方差。
Glejser 检验不仅能对异方差的存在进行判断,而且还能对异方差随某个解释变量变化的函数形式进行诊断。
5.3 什么是加权最小二乘法?它的基本思想是什么?答:以一元线性回归模型为例:12i i i Y X u ββ=++经检验i μ存在异方差,公式可以表示为22var()()i i i u f X σσ==。
选取权数 i w ,当2i σ 越小 时,权数i w 越大。
当 2i σ越大时,权数i w 越小。
将权数与 残差平方相乘以后再求和,得到加权的残差平方和:2i 21i 2i i X Y w e w )(**β-β-=∑∑,求使加权残差平方和最小的参数估计值**ˆˆ21ββ和。
这种求解参数估计式的方法为加权最小二乘法。
第一章习题1.1变量间统计关系和函数关系的区别是什么?1.2回归分析与相关分析的区别和联系是什么?1.3回归模型中随机误差项的意义是什么?1.4线性回归模型中的基本假设是什么?1.5回归变量设置的理论依据是什么?在设置回归变量时应注意哪些问题?1.6收集、整理数据包括哪些基本内容?1.7构造回归理论模型的基本依据是什么?1.8为什么要对回归模型进行检验?1.9回归模型有哪几个方面的应用?1.10为什么强调运用回归分析研究经济问题要定性分析和定量分析相结合?第二章 习题2.1一元线性回归模型有哪些基本假定? 2.2 考虑过原点的线性回归模型1,1,,i i i y x i n βε=+=误差1,,n εε仍满足基本假定。
求1β的最小二乘估计。
2.3证明(2.27)式,10nii e==∑,10ni i i x e ==∑。
2.4回归方程01Ey x ββ=+的参数01,ββ的最小二乘估计与极大似然估计在什么条件下等价?给出证明。
2.5 证明0ˆβ是0β的无偏估计。
2.6 证明(2.42)式 ()()222021,i x Var n x x βσ⎡⎤=+⎢⎥-⎢⎥⎣⎦∑成立 2.7 证明平方和分解式SST SSR SSE =+2.8 验证三种检验的关系,即验证:(1)t ==(2)2212ˆ1ˆ2xx L SSR F t SSE n βσ===-2.9 验证(2..63)式:()()221var 1i i xx x x e n L σ⎡⎤-=--⎢⎥⎢⎥⎣⎦2.10 用第9题证明()2211ˆˆ2n i ii y y n σ==--∑是2σ的无偏估计。
2.11* 验证决定系数2r 与F 值之间的关系式 22Fr F n =+-以上表达式说明2r 与F 值是等价的,那么我们为什么要分别引入这两个统计量,而不是只使用其中的一个。
2.12* 如果把自变量观测值都乘以2,回归参数的最小二乘估计0ˆβ和1ˆβ会发生什么变化?如果把自变量观测值都加上2,回归参数的最小二乘估计0ˆβ和1ˆβ会发生什么变化? 2.13 如果回归方程01ˆˆˆy x ββ=+相应的相关系数r 很大,则用它预测时,预测误差一定较小。
第八章 虚拟变量回归 思考题
8.1 什么是虚拟变量 ? 它在模型中有什么作用 ?
8.2 虚拟变量为何只选 0 、 1, 选 2 、 3 、 4 行吗 ? 为什么 ? 8.3 对 (8.10) 式的模型 , 如果选择一个虚拟变量
1,01D ⎧⎪
=⎨⎪-⎩
大专及大专以上,高中
,高中以下 这样的设置方式隐含了什么假定 ? 这一假定合理吗 ?
8.4 引入虚拟解释变量的两种基本方式是什么 ? 它们各适用于什么情况 ? 8.5 四种加法方式引入虚拟变量会产生什么效应?
8.6 引入虚拟被解释变量的背景是什么?含有虚拟被解释变量模型的估计方法有哪些 ? 8.7 设服装消费函数为
12233t
i i i i Y D D X u αααβ=++++
其中,
i X =收入水平 ;Y
= 年服装消费支出 ;
1,30D ⎧=⎨
⎩大专及大学以上
,其他
;1,20D ⎧=⎨⎩女性,其他 试写出不同人群组的服装消费函数模型。
8.8 利用月度数据资料 ,为了检验下面的假设,应引入多少个虚拟解释变量 ?
1) 一年里的 12 个月全部表现出季节模式 ;
2) 只有 2 月、 6 月、 8 月、 10 月和 12 月表现出季节模式。
练习题
8.1 1971 年 ,Sen 和 Sztvastava 在研究贫富国之间期望寿命的差异时 , 利用 101 个国家的数据 , 建立了如下回归模型
[]ˆ 2.409.39ln 3.36(ln 7)i i i i Y X D X =-+--
(4.37)(0.857)(2.42) R2=0.752
其中 ,X 是以美元计的人均收入 ;Y 是以年计的期望寿命 ;
Sen 和 Srimstava 认为人均收入的临界值为 1097 美元 (ln1097=7), 若人均收入超过 1097 美元 , 则被认定为富国 ; 若人均收入低于1097美元 , 被认定为贫穷国。
括号内的数值为对应参数估计值的t 值。
1) 解释这些计算结果。
2) 回归方程中引入(ln 7)i
i D X =-的原因是什么?如何解释这个回归解释变量?
3) 如何对贫穷国进行回归 ? 又如何对富国进行回归 ? 4)这个回归结果中可得到的一般结论是什么 ?
8.2 表 8.4 给出 1965-1970 年美国制造业利润和销售额的季度数据。
假定利润不仅与 销售额有关 , 而且和季度因素有关。
1) 如果认为季度影响使利润平均值发生变异 , 应如何引入虚拟变量 ?
2) 如果认为季度影响使利润对销售额的变化率发生变异 , 应当如何引入虚拟变量 ?
3) 如果认为上述两种情况都存在 , 又应当如何引入虚拟变量 ? 的对上述三种情况分别估计利润模型 , 进行对比分析。
表 8.4 1965-1970 年美国制造业利润和销售额的季度数据 ( 单位 : 美元 )
8.3 在统计学教材中 , 采用了方差分析方法分析了不同班次对劳动效率的影响 , 其样本数据为
试采用虚拟解释变量回归的方法对上述数据进行方差分析。
8.4Joseph Camelld 基于 1961 斗 1966 年的 200 只 Aa 级和 Baa 级债券的数据 ( 截面数据和时间序列数据的合并数据 ), 分别建立了 LPM 和 IAgit 模型 1)LPM
2
122334455i i i i i i Y X X X X u βββββ=+++++
2)IAgit 模型
2122334455ln 1i i
i i i i i i p L X X X X u p βββββ⎛⎫==+++++ ⎪-⎝⎭
其中 , i Y =1[ 债券信用等级为a A ( 穆迪信用等级 )];
i L = [债券信用等级为aa B (穆迪信用等级)];
2i X =⨯长期债券的市值
债券的资本化率(作为杠杆的测度=
100)总资本的市值
3i X =⨯税后收入
利润率(
100)总资产净值
4i X = 利润率的标准差( 测度利润率的变异性 ): 5i X = 总资产净值 ( 测度规模 ) 。
上述模型中 , 2β和4β事先期望为负值 , 而3β和5β 期望为正值。
对于 LPM,Cappelleri 经过异方差和一阶自相关校正 , 得到以下结果
272345ˆ0.68600.01790.04860.05720.37810i i i i i
Y X X X X -=-+++⨯ se =(0.1775)(0.0024) (0.0486)(0.0178)(0.039⨯8
10
-)
20.6933R =
对于LDgit 模型 ,Cappelleri 在没有对异方差进行弥补的情形下用 ML 得以下结果 :
26
2345ln 1.66220.31850.62480.90410.92101i i i i i i p X X X X p -⎛⎫=--+-+⨯ ⎪-⎝⎭
试解下列问题 :
1) 为什么要事先期望2β和4β为负值 ? 2) 在 LPM 中 , 当4β>0 是否合理 ? 3) 对 LPM 的估计结果应做什么样的解释 ? 的已知
2
2
X =9.67%,3X =7.77%,4X =0.5933%,5X =3429000( 元 ), 问债券晋升 Aa 信用等级的概率有多大?
8.5 Greene 在分析讲授某门经济学课程采用新的教学方法效应时,搜集了如表 8.5 所示的数据 , 其中 ,GRADE 是学生在接受新教学方法 (PSI,PSI=1,0⎧⎨
⎩接受新教学方法,没有采用新方法
) 后学习
成绩是否有所提高的虚拟变量 ,GRADE=1,0⎧⎨⎩
有所提高
,没有提高; 其他变量分别为平均级点 GPA 、非期末考试成绩分数 TUCE 。
试用对数单位模
型对此进行估计,并分析相应的边际效应。
表8.5采用新的教学方法讲授某门经济学课程的数据
obs GRADE
GPA
TUCE
PSI
obs GRADE
GPA
TUCE
1
2.66
20
17
2.75
25
2 0 2.89 22 0 18 0 2.8
3 19
3 0 3.28 2
4 0 19 0 3.12 23
4 0 2.92 12 0 20 1 3.16 25
5 1 4 21 0 21 0 2.0
6 22
6 0 2.86 1
7 0 22 1 3.62 28
7 0 2.76 17 0 23 0 2.89 14
8 0 2.87 21 0 24 0 3.51 26
9 0 3.03 25 0 25 1 3.54 24
10 1 3.92 29 0 26 1 2.83 27
11 0 2.63 20 0 27 1 3.39 17
12 0 3.32 23 0 28 0 2.67 24
13 0 3.57 23 0 29 1 3.65 21
14 1 3.26 25 0 30 1 4 23
15 0 3.53 26 0 31 0 3.1 21
16 0 2.74 19 0 32 1 2.39 19
8.6 依据某大型超市的调查数据表8.6,分析股份制因素是否对销售规模产生影响。
表8.6某大型超市的调查数据。