实验异方差地检验与修正
- 格式:doc
- 大小:250.64 KB
- 文档页数:10
一、异方差问题检验与修正
1、使用双对数模型
Ln Y = β0+β1 ln X1 + β2 ln X2 + μ
回归分析:
Ln Y尖=3.266 + 0.1502 ln X1 + 0.4775 ln X2
(3.14) (1.38) (9.25)
R^2=0.7798 D.W.=1.78 F=49.60 RSS=0.8357
估计结果显示,其他来源的纯收入对农户人均消费支出的增长更有刺激作用。
2、异方差性检验
(1)图示法
Log(E)=-6.010808+0.451832 log(lx2)
(-0.679156) (0.102484)
可以看出,有91%的概率认为 X2的参数为0.451832是显著的,因此X2存在异方差性。
可知 X2可能存在异方差性。
(4)怀特(White)检验
从图中可得,X2项的参数的t检验是显著的且怀特统计量n R^2=31*0.7648=23.70
因此,X2具有异方差性
3、异方差的修正
根据帕克检验算权重:w=1/残差
Log(E)=-6.010808+0.451832 log(lx2)
(-0.679156) (0.102484)
W=1/(lx2^0.6721845)
可以看出,对原模型进行加权最小二乘估计得到
Ln y尖=3.005048+ 0.201401 ln X1 + 0.463065 ln X2 修正前 R^2=0.775025
修正后R^2=0.999999。
第1篇一、实验目的1. 掌握异方差性的基本概念和检验方法。
2. 学会运用统计软件进行异方差的检验和修正。
3. 提高对计量经济学模型中异方差性处理能力的实践应用。
二、实验原理1. 异方差性:在回归分析中,若回归模型的误差项(残差)的方差随着自变量或因变量的取值而变化,则称模型存在异方差性。
2. 异方差性的检验方法:图形检验、统计检验(如F检验、Breusch-Pagan检验、White检验等)。
3. 异方差性的修正方法:加权最小二乘法(WLS)、广义最小二乘法(GLS)等。
三、实验步骤1. 数据准备1. 收集实验所需数据,确保数据质量和完整性。
2. 对数据进行初步处理,如剔除异常值、缺失值等。
2. 模型设定1. 根据研究问题,选择合适的回归模型。
2. 利用统计软件(如Eviews、Stata等)进行初步的回归分析。
3. 异方差性检验1. 图形检验:绘制散点图,观察残差与自变量或因变量的关系,初步判断是否存在异方差性。
2. 统计检验:- F检验:检验回归系数的显著性。
- Breusch-Pagan检验:检验残差平方和与自变量或因变量的关系。
- White检验:检验残差平方和与自变量或因变量的多项式关系。
4. 异方差性修正1. 若检验结果表明存在异方差性,则需对模型进行修正。
2. 选择合适的修正方法:- 加权最小二乘法(WLS):根据残差平方与自变量或因变量的关系,计算权重,加权最小二乘法进行回归分析。
- 广义最小二乘法(GLS):根据残差平方与自变量或因变量的关系,选择合适的方差结构,广义最小二乘法进行回归分析。
5. 结果分析1. 对修正后的模型进行回归分析,观察回归系数的显著性、拟合优度等指标。
2. 对实验结果进行分析,解释实验现象,验证研究假设。
6. 实验报告撰写1. 撰写实验报告,包括以下内容:- 实验目的- 实验原理- 实验步骤- 实验结果- 分析与讨论- 结论2. 实验报告应结构清晰、逻辑严谨、语言简洁。
西安财经学院本科实验报告学院(部)统计学院实验室 313 课程名称计量经济学学生姓名学号 1204100213 专业统计学教务处制2014年12 月 15 日《异方差》实验报告开课实验室:313 2014年12月22第六部分异方差与自相关4. 在本例中,参数估计的结果为:2709030.01402097.01402.728X X Y ++=Λ(2.218) (2.438) (16.999)922173.02=R D.W.=1.4289 F=165.8853 SE=395.2538三.检查模型是否存在异方差 1.图形分析检验 (1)散点相关图分析分别做出X1和Y 、X2和Y 的散点相关图,观察相关图可以看出,随着X1、X2的增加,Y 也增加,但离散程度逐步扩大,尤其表现在X1和Y.这说明变量之间可能存在递增的异方差性。
在Graph/scatter 输入log(x2) e^2,结果如下:(2)残差相关图分析建立残差关于X1、X2的散点图,可以发现随着X 的增加,残差呈现明显的扩大趋势,表明模型很可能存在递增的异方差性。
但是否确实存在异方差还应通过更进一步的检验。
2.GQ 检验首先在主窗口Procs菜单里选Sort current page命令,输入排序变量x2,以递增型排序对解释变量X2进行排序,然后构造子样本区间,分别为1-12和20-31,再分别建立回归模型。
(1)在Sample菜单里,将区间定义为1—12,然后用OLS方法求得如下结果(2)在Sample菜单里,将区间定义为20—31,然后用OLS方法求得如下结果则F的统计量值为:6699.834542929948192122===∑∑iieeF在05.0=α下,式中分子、分母的自由度均为9,查F分布表得临界值为:18.3)9,9(05.0=F,因为F=8.6699>18.3)9,9(05.0=F,所以拒绝原假设,表明模型确实存在异方差。
实验五异方差性一、实验目的掌握异方差的检验方法与处理方法.二、实验要求应用教材第116页案例做异方差模型的图形法检验、Goldfeld-Quanadt检验与White检验,使用WLS法对异方差进行修正;三、实验原理异方差性检验:图形法检验、Goldfeld-Quanadt检验、White检验与加权最小二乘法;四、实验步骤一、模型的OLS估计(1)录入数据打开EViews6,点“File”→“New”→“Workfile”选择“Unstructured/Undated”,在Observations 后输入21,如下所示:点击“ok”。
在命令行输入:DATA Y X,回车。
将数据复制粘贴到Group中的表格中,如下图:(2)估计回归方程在命令行输入命令:LS Y C X ,回车。
或者在主菜单中点“Quick ”→“Estimate Equation ”,在Specification 中输入 Y C X ,点“确定”。
得到如下估计结果: 写出回归方程:i ˆ562.9075 5.3728iY X =-+t=(-1.9306) (8.3398)2R=0.7854 F=69.55二、模型的异方差检验1、图示检验法(1)作散点图:X——Y在命令行输入命令:scat X Y ,回车(2)作散点图:X——2~ei首先生成残差的平方序列,在命令行输入命令:GENR E2=resid^2 ,回车。
作散点图:在命令行输入命令: SCAT X 2~e E2 ,回车,结果如下图。
i由上图可以看出,残差平方2~i e 对解释变量X 的散点图主要分布在图形中的下三角部分,大致看出残差平方2~i e 随i X 的变动呈增大的趋势,因此,模型很可能存在异方差。
2、模型的G-Q 检验 原假设0H :同方差 备择假设1H :异方差(1)首先将样本按X 由小到大的顺序排列,在命令行输入命令:SORT X 回车(2)去除掉中间的5个样本(n/4=5.25,为了使剩下的样本能被平均分成两份,去掉7个),将剩余的16个样本平均分为两份,每一份8个样本。
实验二:异方差和自相关模型的检验和处理二、实验目的(1) 熟悉EViews软件在自相关模型中的根本使用方法;(2) 掌握异方差、自相关模型的检验和处理方法;三、实验的软硬件环境要求硬件环境要求:科学计算与经济分析实验室,计算机网络设备,需要连接Internet使用的软件名称、版本号以及模块带Windows操作系统以及EViews应用演示软件。
四、知识准备前期要求掌握的知识:了解EViews软件在自相关和异方差分析中的根本概念和根本功能,理解违背线性回归模型的根本假设中的自相关和异方差产生的原因,解决这两类问题的根本理论。
实验相关理论或原理:(1)理解线性模型违背根本假设:误差项同方差性、无序列相关性的含义及其在实际经济问题中产生的原因;(2)掌握线性模型异方差性和序列相关性的检验的统计思想和EViews实现。
(3) 掌握线性模型异方差性和序列相关性的处理方法统计思想和EViews实现。
实验流程:线性回归模型假设→线性回归模型异方差和序列相关性检验→线性回归模型异方差和序列相关性的处理→线性回归模型的修正。
五、实验材料和原始数据表2.1 各地区农村居民家庭人均纯收入与消费支出〔单位:元〕表2.2 1978~2001年中国商品进口与国内生产总值六、实验要求和考前须知能用EViews软件完成线性回归模型的异方差和序列相关性的检验和处理,以及对模型的修正。
能对软件输出的结果能做较详细的分析,能结合数据提出自己的见解。
七、实验内容及步骤〔一〕异方差1.加载工作文件。
(1)建立工作文件的方法是点击,选择新建对象类型为工作文件,选择数据类型,注意本数据是截面数据。
建立工作文件,建立新序列,建立空组。
创立三个序列Y(人均消费支出)、X1(从事农业经营的收入)、X2(其他收入)并输入数据。
进入界面后输入数据如图3-1,3-2所示。
图3-1 图3-22.选择方程〔1〕根据消费理论,中国农村居民人均消费主要由人均纯收入决定,为了考察从事农业经营的收入和其他收入对农村居民消费支出增长的影响,考虑双对数模型:01122ln ln ln Y X X βββμ=+++〔2〕先对模型进展估计。
经济计量分析实验报告一、实验项目异方差的检验及修正二、实验日期2015.12.06三、实验目的对于国内旅游总花费的有关影响因素建立多元线性回归模型,对变量进行多重共线性的检验及修正后,进行异方差的检验和补救。
四、实验内容建立模型,对模型进行参数估计,对样本回归函数进行统计检验,以判定估计的可靠程度,包括拟合优度检验、方程总体线性的显著性检验、变量的显著性检验,以及参数的置信区间估计。
检验变量是否具有多重共线性并修正。
检验是否存在异方差并补救。
五、实验步骤1、建立模型。
以国内旅游总花费Y 作为被解释变量,以年底总人口表示人口增长水平,以旅行社数量表示旅行社的发展情况,以城市公共交通运营数表示城市公共交通运行状况,以城乡居民储蓄存款年末增加值表示城乡居民储蓄存款增长水平。
2、模型设定为:t t t t t μβββββ+X +X +X +X +=Y 443322110t 其中:t Y — 国内旅游总花费(亿元) t 1X — 年底总人口(万人) t 2X — 旅行社数量(个) t 3X — 城市公共交通运营数(辆)t 4X — 城乡居民储蓄存款年末增加值(亿元)3、对模型进行多重共线性检验。
4、检验异方差是否存在。
六、实验结果(一)、消除多重共线性之后的模型多元线性回归模型估计结果如下:4321000779.0053329.0151924.0720076.0-99.81113ˆX +X +X +X =Y i SE=(26581.73) (0.230790) (0.108223) (0.013834) (0.020502) t =(3.051494) (-3.120046) (1.403805) ( 3.854988) (0.038020)R2=0.969693R2=0.957571F=79.98987(1)拟合优度检验:可决系数R 2=0.969693较高,修正的可决系数R 2=0.957571也较高,表明模型拟合较好。
异方差性的概念类型后果检验及其修正方法异方差性(heteroscedasticity)是指随着自变量的变化,被解释变量的方差不保持恒定,呈现出不同的分散特征。
异方差性可能会导致线性回归模型的参数估计不精确,误差项的标准误差的估计不准确,常见的检验和修正方法包括Breusch-Pagan检验和White检验,同时,还可以采取加权最小二乘法或者转换变量的方法来修正异方差性。
异方差性可以分为条件异方差和非条件异方差两种类型。
条件异方差是指在给定自变量的情况下,被解释变量方差的大小存在差异;非条件异方差则是指被解释变量的方差在整个样本空间内都存在差异。
异方差性的后果是导致参数估计的不准确性和偏误。
当存在异方差性时,OLS(普通最小二乘法)估计的标准误差会低估真实标准误差,从而使得参数显著性以及模型拟合效果可能出现问题。
此外,在存在异方差性的情况下,t检验、F检验等假设检验的结果也会受到影响。
在进行线性回归模型时,常常需要对异方差性进行检验。
一种常用的检验方法是Breusch-Pagan检验,其基本思想是对残差的平方与自变量进行回归,然后通过F检验来判断异方差的存在与否。
另一种常用的检验方法是White检验,它是在一个包含自变量和交互项的扩展模型中对残差的平方与自变量进行回归,通过Wald检验统计量来判断异方差的存在与否。
异方差性可以通过多种修正方法来处理。
其中,一种常用的方法是采用加权最小二乘法(WLS)来估计参数。
WLS的基本思想是将方差不恒定的观测值加权,使得每个观测值的权重与方差的倒数成正比。
另一种常用的方法是通过转换变量,使得原始数据变换成具有恒定方差的形式,例如对数变换、平方根变换等。
下面以一个案例来说明如何检验和修正异方差性。
假设我们研究了城市的房价(被解释变量)与房屋面积和所在地区(自变量)之间的关系。
我们采集了100个样本数据,并构建了线性回归模型进行分析。
1.检验异方差性:使用Breusch-Pagan检验来检验模型的异方差性。
实验异方差的检验与修正
实验目的
1、理解异方差的含义后果、
2、学会异方差的检验与加权最小二乘法
实验容
一、准备工作。
建立工作文件,并输入数据,用普通最小二乘法估计方程(操作
步骤与方法同前),得到残差序列。
表2列出了1998年我国主要制造工业销售收入与销售利润的统计资料,请利用统计软件Eviews建立我国制造业利润函数模型。
表2 我国制造工业1998年销售利润与销售收入情况
二、异方差的检验
1、图形分析检验
⑴观察销售利润(Y)与销售收入(X)的相关图(图3-1):SCAT X Y
图3-1 我国制造工业销售利润与销售收入相关图
从图中可以看出,随着销售收入的增加,销售利润的平均水平不断提高,但离散程度也逐步扩大。
这说明变量之间可能存在递增的异方差性。
⑵残差分析
首先将数据排序(命令格式为:SORT 解释变量),然后建立回归方程。
在方程窗口中点击Resids按钮就可以得到模型的残差分布图(或建立方程后在Eviews工作文件窗口中点击resid对象来观察)。
图3-2 我国制造业销售利润回归模型残差分布
图3-2显示回归方程的残差分布有明显的扩大趋势,即表明存在异方差性。
2、Goldfeld-Quant检验
⑴将样本安解释变量排序(SORT X)并分成两部分(分别有1到10共11个样本合19到28共10个样本)
⑵利用样本1建立回归模型1(回归结果如图3-3),其残差平方和为2579.587。
SMPL 1 10
LS Y C X
图3-3 样本1回归结果
⑶利用样本2建立回归模型2(回归结果如图3-4),其残差平方和为63769.67。
SMPL 19 28 LS Y C X
图3-4 样本2回归结果
⑷计算F 统计量:12/RSS RSS F ==63769.67/2579.59=24.72,21RSS RSS 和分别是模型1和模型2的残差平方和。
取05.0=α时,查F 分布表得44.3)1110,1110(05.0=----F ,而
44.372.2405.0=>=F F ,所以存在异方差性
3、White 检验
⑴建立回归模型:LS Y C X ,回归结果如图3-5。
图3-5 我国制造业销售利润回归模型
⑵在方程窗口上点击View\Residual\Test\White Heteroskedastcity,检验结果如图3-6。
图3-6 White 检验结果
其中F 值为辅助回归模型的F 统计量值。
取显著水平05.0=α,由于
2704.699.5)2(2205.0=<=nR χ,所以存在异方差性。
实际应用中可以直接观察相伴概
率p 值的大小,若p 值较小,则认为存在异方差性。
反之,则认为不存在异方差性。
4、斯皮尔曼等级相关系数检验
其操作步骤为:
A. 对X 排序:命令行输入SORT X
B. 输入X 的等级:data d1(依次输入1-n 的自然数);
C. 对残差绝对值排序:命令行输入SORT abs(resid);
D. 输入残差绝对值的等级:data d2(依次输入1-n 的自然数);
E. 依据公式计算等级相关系数检验统计量,并查表得出结论。
5、异方差的消除—加权最小二乘法
加权最小二乘法中,最重要的是确定权重的确定,一般而言,采用残差绝对值的倒数作为权重,也可以采用其他形式。
A. 首先,用SMPL 命令设定样本的区间(包括所有观测值),如:SMPL 1 31
B. 进行最小二乘回归,得到残差序列,LS Y C X
C. 根据残差确定权重, GENR W1=1/ABS(RESID)
D.进行加权最小二乘估计,LS(W=W1) Y C X;或在方程窗口中点击
Estimate\Option按钮,并在权数变量栏里依次输入W1
回归结果如下图3-7所示:
图3-7
E. 对回归方程在进行White 检验,观察异方差的调整情况
对所估计的模型再进行White检验,其结果如下图3-8所示:
图3-8
nR的值,这表示异方差性已经得到很图3-8对应的White检验没有显示F值和2
好的解决。
实验四 序列相关的检验与修正
实验目的
1、理解序列相关的含义后果、
2、学会序列相关的检验与消除方法
实验容
利用下表资料,试建立我国城乡居民储蓄存款模型,并检验模型的自相关性。
表3 我国城乡居民储蓄存款与GDP 统计资料(1978年=100)
一、模型的估计
0、准备工作。
建立工作文件,并输入数据。
1、相关图分析 SCAT X Y
相关图表明,GDP 指数与居民储蓄存款二者的曲线相关关系较为明显。
现将函数初步设定为线性、双对数等不同形式,进而加以比较分析。
2、估计模型,利用LS 命令分别建立以下模型 ⑴线性模型: LS Y C X
x y
5075.9284.14984ˆ+-=
=t (-6.706) (13.862)
2R =0.9100 F =192.145 S.E =5030.809 ⑵双对数模型:GENR LNY=LOG(Y) GENR LNX=LOG(X) LS LNY C LNX
x y
ln 9588.20753.8ˆln +-= =t (-31.604) (64.189)
2R =0.9954 F =4120.223 S.E =0.1221 3、选择模型
比较以上模型,可见各模型回归系数的符号及数值较为合理。
各解释变量及常数项都通过了t 检验,模型都较为显著。
比较各模型的残差分布表。
线性模型的残差在较长时期呈连续递减趋势而后又转为连续递增趋势,残差先呈连续递增趋势而后又转为连续递减趋势,因此,可以初步判断这种函数形式设置是不当的。
而且,这个模型的拟合优度也较双对数模型低,所以又可舍弃线性模型。
双对数模型具有很高的拟合优度,因而初步选定回归模型为双对数回归模型。
二、模型自相关的检验
1.图示法
其一,残差序列e t 的变动趋势图。
菜单:Quick →Graph →line ,在对话框中输入resid ;或者用命令操作,直接在命令行输入:line X 。
其二,作e t-1和e t 之间的散点图。
菜单:Quick →Graph →Scatter ,在对话框中输入resid(-1) resid ;或者用命令操作,直接在命令行输入:scat resid(-1) resid 。
2.DW 检验
因为n =21,k =1,取显著性水平α=0.05时,查表得L d =1.22,
U d =1.42,而0<0.7062=DW<L d ,所以存在(正)自相关。
3.LM(BG)检验
在方程窗口中点击View/Residual Test/Series Correlation LM Test ,并选择滞后期为2,则会得到如图4-1所示的信息。
图4-1 双对数模型的BG 检验
图中,2nR =11.31531,临界概率P=0.0034,因此辅助回归模型是显著的,即存在自相关性。
又因为1-t e ,2-t e 的回归系数均显著地不为0,说明双对数模型存在一阶和二阶自相关性。
三、自相关的修正 (1)自相关系数ρ的估计 主要的方法有:
A. 根据ρ和DW 统计量之间的近似关系,取ρ的估计为:1-DW/2
B. 直接取ρ=1
C. 采用杜宾两步法估计。
LS Y C Y(-1) X X(-1),Y(-1)的系数估计即为ρ
的估计
D. 科克伦-奥科特迭代法。
首先产生残差序列,命名为e ,然后e 对其滞后
1阶回归(无常数项),LS e e(-1),e(-1) 的系数估计作为ρ的估计 (2)加入AR 项
在LS 命令中加上AR(1)和AR(2),使用迭代估计法估计模型。
键入命令: LS LNY C LNX AR(1) AR(2) 则估计结果如图4-2所示。
图4-2 加入AR 项的双对数模型估计结果
图4-2表明,调整后模型的DW =1.6445,n =19,k =1,取显著性水平α=0.05时,查表得L d =1.18,U d =1.40,而U d <1.6445=DW<4-U d ,说明模型不存在一阶自相关性;再BG 检验(图4-3),也表明不存在高阶自相关性,因此,中国城乡居民储蓄存款的双对数模型为:
x y
ln 9193.28445.7ˆln +-= =t (-25.263) (52.683)
2R =0.9982 F =2709.985 S.E =0.0744 DW =1.6445
图4-3。