Eviews7章含虚拟变量的回归模型
- 格式:ppt
- 大小:316.50 KB
- 文档页数:22
§5.5 含有虚拟变量的回归模型 1.带虚变量的回归预测前述变量均是用某种意义明确的尺度加以定量的变数。
暂时性影响:经济行为受特定因素的影响,因而促使一期或数期变数与其他各期有明显的差异。
虚拟变量:用来表现暂时性影响的变量,或者说,表明某种“品质”或属性是否存在的的变量。
2.基本概念(1)水平:当自变量以虚拟变量的形式出现时,虚拟变量的出现形式称为“水平”。
(2)反应:用()k j i,δ表示第i 个样本第j 个自变量取第k 个水平的反应:()k j i ,δ=⎩⎨⎧否则个水平时个自变量取第个样本第当第01k j i(3)反应表:将各样本的资料排列得到的表格称为反应表。
(4)反应矩阵:把反应表中的反应()k j i,δ写成矩阵形式,称为反应矩阵。
记为X=(()k j i,δ)。
3.基本方法(1)建模原则:如果一个属性变数有m 个类型,只引入m —1个虚拟变量。
否则,会陷入所谓的虚拟变数陷阱之中,出现完全多重共线性的情况。
在解释采用虚拟变量的模型结果时,要弄清楚水平值是如何确定的。
指定取值为0的类型或组通常用来指明基础类型、控制类型、对比类型或被省略的类型。
附属于虚拟变量D 的系数α1称为不同的截距系数,它说明D 取值为1的那种类型的截距项与基础类型的截距系数的数值差异有多大。
(2)建立数学模型:将虚拟变量视为普通变量,建立回归模型。
(3)对参数作出估计。
(4)进行预测。
(5)一般情况:指模型自变量中同时含有虚拟变量和普通变量。
4.应用实例研究1958年第四季度到1971年第二季度期间英国的失业率和职务空缺率之间的关系。
原始作出散点图解释:1966年第四季度起,失业—职位空缺的关系发生变化,表示两者之间关系的曲线在该季度开始上移。
这种上移的含义是指对于一定的职位空缺率来说,1966年第四季度比以前有更多的失业者。
其原因是1966年10月(即第四季度),当时的英国政府通过以统一收费率和(以前的)有关救济金收入的混合制度,取代短期失业救济的统一收费率制度,从而放宽了国民保险条例,这明显地增加了失业救济金的水平。
实验报告课程名称:计量经济学实验项目名称:单方程线性回归模型的扩展——虚拟变量回归模型院(系):专业班级:姓名:学号:实验地点:实验日期:年月日实验目的:掌握虚拟变量回归模型的建立、参数估计和统计检验。
实验内容:1)生成趋势变量2)生成季节虚拟变量3)生成分段虚拟变量4)建立虚拟变量回归模型5)虚拟变量回归模型的参数估计和统计检验实验方法、步骤和结果:⑴生成趋势变量打开EViews,新建工作文件并输入数据重新命名ser01为gdp打开gdap,选择view-Graph-Line,即可显示趋势图⑵点击quick-generate series,输入公式如此即可生成季节性虚拟变量⑶点击quick-generate series,输入公式d5=0,并将sample中2002Q4改为1997Q4再次点击quick-generate series,输入公式d5=1,并将sample中1990Q1改为1998Q1如此即可生成分段虚拟变量D5⑷引入季节性虚拟变量应该用加法,又从趋势图中可以看出,两端曲线的截距和斜率均有所变化,所以应该用乘法加法方式引入分段虚拟变量,虚拟变量回归模型为Gdp=ß1+ ß2*D2+ ß3*D3+ ß4*D4+ ß5*D5+ ß5D5*T+ų⑸选择Quick-estimate equation,输入公式点击确定,即可出现OLS结果从上述结果中可以看出R^2=0.993780很大,P值极小,模型具有总体显著性成绩评定__________________________。
建模方法之回归分析简介数学模型一元线性回归分析模型:),,0(~,2σεεN bx a Y ++= 多元线性回归分析模型:ε+++++=p p x b x b x b a Y Λ2211设随机变量Y 与X 有相关关系,就是说当X 取一确定值时,随机变量Y 有一个确定的分布.这个分布大多数情况下不能具体知道,但在实践中只需要的观测值.而数学期望(假设存在)在一定程度上能反映出其观测值的大小,所以人们感兴趣的是当X 取确定值x 时, Y 的数学期望)(x μ是多少.称)(x μ为Y 对X 的回归函数.在实际问题中,回归函数是未知的,需要我们根据实测样本以及以往的经验来确定回归函数的类型及求出函数中的未知参数的估计,得到经验公式.例1 20℃时在铜线含碳量%x 对于电阻Y (为一正态变量,单位:微欧)变化的研究中,得到如下一测试结果表明,随着铜线含碳量的增加,其电阻有增大的趋势.为了确定回归函数)(x μ的类型, 我们将这9组数据作为坐标在平面直角坐标系中描出它们相应的点,这种图称为散点图。
变量X -Y 的散点图因此估计)(x μ大致具有线性函数bx a +的形式,即可认为X 与Y 具有如下关系:),,0(~,2σεεN bx a Y ++= (1)其中b a ,及2σ是常数.这就是X 、Y 之间的(一元正态线性)回归模型.对n 根铜线进行独立观测,能得到n 个含碳量n x x x ,,,21Λ及对应的n Y Y Y ,,,21Λ,把i Y 看成随即变量,则它们可以表示成⎭⎬⎫=++=.,,,),,0(~,,,2,1,212相互独立n i i i i N n i bx a Y εεεσεεΛΛ (2)记⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=n x x x X 11121M M ,⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=n Y Y Y Y M 21,⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=n εεεεM 21, 则(2)式也可表示为ε+⎪⎪⎭⎫⎝⎛=b a X Y .在一元线性回归中主要解决下列问题: (I ) 对未知参数b a ,及2σ进行估计; (II ) 对线性模型的假设进行检验; (III ) 对Y 进行预测和控制.参数的估计:对未知参数b a ,的估计,一个直观的想法便是希望选取这样的a 与b ,使得他们在n x x x ,,,21Λ各处计算的理论值i bx a +与实测值i y 的偏离达到最小.为此人们常用最小二乘法:求b a ,使∑=−−=ni i ibx a yQ 12)(为最小.在几何上,即是在平面上选取一条直线,使直线在横坐标为n x x x ,,,21Λ处的纵坐标与相应的实测点的纵坐标之差的平方和为最小.利用求极值的方法求b a ,,令⎪⎪⎩⎪⎪⎨⎧=−−−=∂∂=−−−=∂∂∑∑==.0)(2,0)(211ni i i i ni i i x bx a y b Q bx a y a Q整理得⎪⎪⎩⎪⎪⎨⎧=+=+∑∑∑∑∑=====ni i i n i i n i i ni i n i i y x x b x a y x b na 112111解此方程组得到的不是b a ,的真值,而是b a ,的估计值,ˆ,ˆb a它们为 ,)())((ˆ1212121∑∑∑∑====−−−=−−=ni ini i ini ini ii x xy y x xx n xyx n yx b(3),ˆˆx b y a−= (4) 其中.,111∑∑====ni i ni i y y x n x 具体计算得Y 对X 的线性回归方程为.59.1297.13ˆx y+= 等价公式:Y X X X ba TT 1)(ˆˆ−=⎥⎦⎤⎢⎣⎡. (5)方差分析:总平方和:,)(12∑=−=ni iT Y YQ 自由度为1−n回归平方和:∑=−=ni iR Y Y Q 12)ˆ(,)(ˆ122∑=−=ni i x x b 自由度为1=p 残差平方和:,)ˆ(12∑=−=ni iiE Y YQ 自由度为1−−p n 关系式:.E R T Q Q Q += 性质:2)1(σ=−−p n Q E E 。
实验五实验项目:运用EVIEWS 软件进行含虚拟变量问题的回归分析实验目的:掌握运用EVIEWS 软件对解释变量中含有虚拟变量的情况进行回归分析的基本操作方法和步骤,并能够对软件运行结果进行解释。
实验内容提要:1.根据具体的经济现象,选择合适的虚拟变量。
2.建立关于虚拟变量的回归模型,并进行估计和检验。
3.对软件运行的结果给出合理的经济学解释。
实验内容及步骤: 1.模型假设将某大学学生的绩分点设为因变量Y ,统计成绩设为自变量1X ,是否使用计算机设为自变量2X ,建立虚拟变量回归模型,得: 01122++i i i i Y X X βββε=+其中,1,20={i X 有使用计算机,没有使用计算机其原始数据如下表1:统计成绩绩分点是否使用计算机100 4 是 95 3.4 是 56 1.2 是 是否75 2.1 是86 3.1 是63 1.7 是96 4 是80 3.4 否90 2.9 否84 3.1 否62 1.9 否68 2.2 否92 3.7 是66 1.9 是60 1.7 否92 4 否63 1.1 是否2.模型估计将数据录入EVIEWS软件中,采用这些数据对模型进行OLS回归,结果如表2:表2Dependent Variable: YMethod: Least SquaresDate: 06/02/12 Time: 20:09Sample: 1 20Included observations: 20Variable Coefficient Std. Error t-Statistic Prob. X1 0.063385 0.004848 13.07383 0.0000 X2 -0.372084 0.137953 -2.697176 0.0153 C-2.0356990.376632-5.4050100.0000R-squared 0.909538 Mean dependent var 2.710000 Adjusted R-squared 0.898896 S.D. dependent var 0.944736 S.E. of regression 0.300396 Akaike info criterion 0.570054 Sum squared resid 1.534047 Schwarz criterion 0.719414 Log likelihood -2.700541 Hannan-Quinn criter. 0.599211 F-statistic 85.46258 Durbin-Watson stat 2.403154 Prob(F-statistic)0.00000012ˆ 2.0360.0630.372i i iY X X =-+- (0.377)(0.005) (0.138) t=(-5.405)(13.074) (-2.697)20.909r = 85.463F = 由模型的2r 可知,该模型的回归拟合效果比较好。