[精选]异方差——怀特的一般异方差检验--资料
- 格式:ppt
- 大小:2.38 MB
- 文档页数:14
七、 异方差与自相关一、背景我们讨论如果古典假定中的同方差和无自相关假定不能得到满足,会引起什么样的估计问题呢?另一方面,如何发现问题,也就是发现和检验异方差以及自相关的存在性也是一个重要的方面,这个部分就是就这个问题进行讨论。
二、知识要点1、引起异方差的原因及其对参数估计的影响2、异方差的检验(发现异方差)3、异方差问题的解决办法4、引起自相关的原因及其对参数估计的影响5、自相关的检验(发现自相关)6、自相关问题的解决办法 (时间序列部分讲解) 三、要点细纲1、引起异方差的原因及其对参数估计的影响原因:引起异方差的众多原因中,我们讨论两个主要的原因,一是模型的设定偏误,主要指的是遗漏变量的影响.这样,遗漏的变量就进入了模型的残差项中.当省略的变量与回归方程中的变量有相关关系的时候,不仅会引起内生性问题,还会引起异方差.二是截面数据中总体各单位的差异。
后果:异方差对参数估计的影响主要是对参数估计有效性的影响。
在存在异方差的情况下,OLS 方法得到的参数估计仍然是无偏的,但是已经不具备最小方差性质.一般而言,异方差会引起真实方差的低估,从而夸大参数估计的显著性,即是参数估计的t 统计量偏大,使得本应该被接受的原假设被错误的拒绝.2、异方差的检验 (1)图示检验法由于异方差通常被认为是由于残差的大小随自变量的大小而变化,因此,可以通过散点图的方式来简单的判断是否存在异方差.具体的做法是,以回归的残差的平方2i e 为纵坐标,回归式中的某个解释变量i x 为横坐标,画散点图。
如果散点图表现出一定的趋势,则可以判断存在异方差。
(2)Goldfeld-Quandt 检验Goldfeld-Quandt 检验又称为样本分段法、集团法,由Goldfeld 和Quandt 1965年提出.这种检验的思想是以引起异方差的解释变量的大小为顺序,去掉中间若干个值,从而把整个样本分为两个子样本.用两个子样本分别进行回归,并计算残差平方和.用两个残差平方和构造检验异方差的统计量。
怀特检验详细报告背景怀特检验是一种常用的统计方法,用于检验数据中是否存在异方差性。
在许多统计分析中,假设方差是常数,但现实中数据往往呈现出不同的方差,这就需要对数据进行方差齐性检验。
本报告将详细介绍怀特检验的原理、假设、步骤和解释结果的方法。
原理怀特检验是利用方差齐性假设进行统计检验的一种方法。
在经典线性回归模型中,我们假设误差项的方差在不同的条件下是相同的。
然而,在现实数据中,方差往往是变化的。
怀特检验可以用来检验误差项的方差是否与某些解释变量相关。
假设怀特检验基于以下两个假设: 1. 假设零:方差齐性,即不同组别或条件下的方差是相同的。
2. 对立假设:方差异质性,即不同组别或条件下的方差是不同的。
步骤进行怀特检验的步骤如下: 1. 收集数据:收集需要进行方差齐性检验的数据。
2. 构建模型:根据研究问题和数据类型,选择合适的统计模型。
3. 拟合模型:使用拟合数据的方法来拟合模型,并获取残差。
4. 进行怀特检验:计算怀特统计量,并对怀特统计量进行显著性检验。
5. 判断结论:根据怀特统计量的显著性检验结果,判断数据的异方差性。
解释结果在进行怀特检验后,我们可以根据统计显著性来判断数据是否具有异方差性。
如果怀特统计量的p值小于显著性水平(通常为0.05),则存在异方差性。
反之,如果p值大于显著性水平,则不存在异方差性。
需要注意的是,即使存在异方差性,也不一定会对统计分析结果产生严重的影响。
但是,在存在异方差性的情况下,使用传统的统计方法可能会导致统计推断的错误。
总结怀特检验是一种用于检验数据异方差性的方法。
通过对数据进行怀特检验,我们可以得出数据是否存在异方差性的结论。
在统计分析中,方差齐性是一个重要的假设,如果假设不成立,需要采取相应的调整方法。
对于数据分析人员来说,掌握怀特检验的原理和应用方法,可以帮助他们更好地理解和解释数据,提高数据分析的准确性和可靠性。
希望本报告对读者理解怀特检验有所帮助,有助于他们在实际数据分析中的应用。
异方差异方差的性质● 经典回归的一个重要假定之一是:u i 的条件方差为常数, 即:E (2i u )= 2σ● 异方差(heterscedasticity ):E (2iu )=2i σ, 不同的(heter )分散程度(scedasticity )● (图)消费和收入, 消费随收入的增加而增加,但变异也在增加● u i 变动的几个理由:- 按照边错边改学习模型(error-learning models ),人们在学习的过程中,其行为误差随时间而减少,如:打字出错的个数- 随着收入的增长,人们有更多的备用收入,从而如何支配他们的收入有更大的选择范围- 随着数据采集技术的改进,2iσ可能减少- 异方差性还会因为异常值的出现而产生。
包括一个异常值,尤其样本较小时,会在很大程度上改变回归分析的结果- 异方差性的另一来源来自CLRM 的假定9的破坏,即:回归模型的设定是不正确的。
● 异方差常见于横截面数据中,因为观测范围大小不一● 异方差的后果:仍然是无偏的,但不是最有效的了(1) 无偏性βββ=+==-- )](')'[(]')'[()ˆ(11U X X X X E Y X X X E E(2) 非有效性1121111)'(')'()'()'(')'(]'')'][(')'[()'ˆ)(ˆ(------Φ==--=--X X X X X X X X X UU E X X X Y X X X Y X X X E E σββββββ● 同方差性时,βˆ的协方差矩阵为: 12)'(-X X σ,会夸大或缩小真实的方差和协方差● 由此会导致β的相关检验和置信区间失效,进而引起预测失效● 以双变量模型为例:i i i u X Y ++=10ββ进行显著性检验时,构造的t 统计量)ˆ(ˆ11ββS t =)ˆ(1βS 变动,所以1ˆβ的置信区间也不稳定异方差性的侦察● 侦破异方差性并没有严明的法则,只有少数的经验规则● 因为除非我们知道对应于选定的X 值的整个Y 总体,否则2i σ是无从获知的●大多数的方法都基于对我们所能观测到的OLS残差i uˆ的分析,而不是对干扰u i的分析非正式的方法●问题的性质:-往往根据所考虑的性质就能判别是否会遇到异方差性-例如:围绕消费对收入的回归,残差的方差随收入的增加而增加●图解法:-可先在无异方差性的假定下做回归分析,然后对残差的平方2ˆi u作一事后检查,看看这些2ˆi u是否呈现任何系统性的样式-(图)-2ˆi u是对应于i Yˆ而描绘的,除此之外,还可将他们对解释变量之一描点-当我们考虑2个或多个X变量的模型时,可将2ˆi u 相对于模型中的任一个变量描点正式方法(1)帕克(park )检验● 提出2i σ是解释变量X i 的某个函数,他建议的函数形式为:iv i ie X βσσ22=或:i i i v X ++=ln ln ln 22βσσ● 由于2iσ通常是未知的,帕克建议用2ˆi u 作为替代变量并作如下回归:ii i i v v X u++=++=i 22lnX ln ln ˆln βαβσ **● 如果β表现为统计上显著的,就表明数据中有异方差性● 帕克检验分两阶段:一是做回归,而不考虑异方差性问题,从这一回归获得i uˆ,然后在第二阶段作如** 的回归戈德菲尔德-匡特检验 (Goldfeld-Quandt test )● 适用于异方差性方差2i σ同回归模型中的解释变量之一有正相关的情形● 步骤一:从最小X 值开始,按X 值的大小顺序将观测值排列步骤二:略去居中的C 个观测值,其中C 是预定的,并将其余的(n-c )个观测值分成两组,每组(n-c)/2个步骤三:分别对头(n-c )/2个观测值和末(n-c)/2 个观测值各拟合一个回归,并分别获得残差平方和RSS 1 和RSS 2步骤四:计算比值:dfRSS dfRSS //12=λ, 如果假定i uˆ是正态分布的,并且如果同方差性假定真实,则λ遵循分子和分母自由度各为(n-c-2k )/2 的F 分布● C 个观测值是为了突出或激化小方差组(即RSS 1)与大方差组(即RSS 2 )之间的差异● 通常当n=30 时,取c =4, 当n=60 时,取c=10为宜● 当模型中有多于1个X 变量时,在检验的步骤一中,就可按任一个X 的大小顺序将观测值排列● 例:消费支出 – 收入, 30 观测值,略去居中4 个观测值后,对开头的13个和末尾的13个观测值分别作OLS 回归:17.377RS S 6968.04094.3ˆ1=+=i i X Y 8.1536RS S 7941.00272.28ˆ2=+-=i iX Y得:07.411/17.37711/8.1536//12===df RSS df RSS λ怀特(white )的一般异方差性检验● Goldfeld-Quandt 检验要求按照被认为是引起异方差性的X 变量把观测值重新排序● White 检验并不要求排序,而且易于付诸实施● 步骤一: 对给定的数据回归(两个解释变量),并获得残差i uˆ步骤二:再做如下(辅助)回归:ii i i i i i i v X X a X a X a X a X a a u ++++++=326235224332212ˆ从这个(辅助)回归中求得R 2步骤三:在无异方差性的虚拟假设下,2nR 渐进的遵循自由度等于辅助回归元(不包括常数项)个数的2χ分布步骤四:如果2χ值超过临界值,结论就是有异方差性,如果不超过,就没有,即:065432=====a a a a a● 例: Y= 贸易税收(进口与出口税收)与政府总收入之比,X 2 =进出口总和与GNP 之比,X 3 =人均GNP , 假设Y 与X 2 正相关,Y 与X 3 成反比White test :1148.0R ))(ln T rade 0.0015(ln )(ln 0491.0)(ln 4081.0 ln 6918.0ln 5629.28417.5ˆ2i 222=+--++-=i i i i i i GNP GNP Trade GNP Trade u7068.4)1148.0(41.2==R n● 如果模型有多个回归元,回归元的平方(或更高次方)项以及它们的交叉项就会耗掉许多的自由度● 遇到统计量显著的情形,原因也许不一定是异方差性异方差的修正方法 – 加权最小二乘法(广义最小二乘法)● 以消费-收入为例,消费异方差,设计一种估计方案:对来自变异较大的总体的观测值作较小的加权,而对来自较小的总体的观测值作较大的加权● OLS 方法对每一观测之同样重视或同等加权● 广义最小二乘法(generalized least square-GLS )利用了异方差的信息,因而能产生BLUE估计量● 利用双变量模型:i i i i u X X Y ++=201ββ其中对每个i, X0i=1● 假定相异的方差2i σ已知,用σ通除上式得:)()()(201iiiiiiiiu X X Y σσβσβσ++=为了易于阐述,将它写为:i i i i u X X Y ******201++=ββ● 转换原始模型中,转换干扰项i u *的方差,现在有了同方差性1)(1)(1)()*()*var(2222i22=====iiiiii i u E u E u E u σσσσ● OLS应用到转换模型将产生BLUE估计量● GLS是对满足标准最小二乘假定的转换变量的OLS● 21*ˆ*ˆββ和的估计步骤是最小化: 220112)**ˆ**ˆ*(*ˆii i X X Y u ββ--=∑∑● *ˆ2β的GLS 估计量为: ∑∑∑∑∑∑∑--=222)())(())(())((*ˆi i i i i i i i i i i i i X w X w w Y w X w Y X w w β 其中2/1i i w σ=● OLS和GLS 的差别:OLS要求最小化:2212)ˆˆ(ˆii i X Y u ββ--=∑∑ GLS要求最小化:2212)ˆˆ(ˆii i i i X Y w u w ββ--=∑∑● GLS中最小化一个以2/1i i w σ=为权的加权残差平方和,而在OLS中最小化一个无权或等权的残差平方和● 这种形式的GLS 被称为加权最小二乘法(weighted least square – WLS )● 若i σ是已知的,异方差的问题似乎已经得到了解决,但大多数情况下,方差是未知的●加权最小二乘法至多只能用于未知方差容易被描述的那些情况●看一下课本中的例子。
怀特检验简介怀特检验(White’s test)是一种统计学上用来检验回归模型(尤其是线性回归模型)的异方差性的方法。
通过用残差的平方与自变量的平方作为回归方程的附加变量,怀特检验可以检测出模型中的异方差性问题。
异方差性是指残差的方差与自变量存在一定的关系,即随着自变量的变化,残差的方差也发生变化。
异方差性会导致参数估计不准确,误差项的标准误差不可靠,从而影响到统计推断的结果。
因此,通过进行怀特检验,可以检验回归模型是否存在异方差性问题,进而采取适当的调整措施。
怀特检验的原理怀特检验的原理是基于OLS(Ordinary Least Squares)估计方法的残差的特点。
在普通最小二乘法中,残差的方差是一个常数,即残差的平方与自变量之间不存在线性关系。
而如果存在异方差性,残差的平方与自变量之间就会呈现出一定的线性关系。
怀特检验基于以下零假设和备择假设: - 零假设(H0):回归模型中不存在异方差性。
- 备择假设(H1):回归模型中存在异方差性。
通过计算残差的平方与自变量的平方之间的相关系数,来判断残差是否与自变量存在线性关系。
若相关系数显著不为零,则拒绝零假设,认为模型存在异方差性。
怀特检验的步骤怀特检验的步骤如下:1.根据已有数据,拟合回归模型,并计算得到残差。
2.将残差平方作为因变量,将自变量平方作为自变量,重新拟合回归模型。
3.计算新回归模型的残差,并计算残差与自变量平方之间的相关系数。
4.根据计算得到的相关系数,在给定显著性水平下,判断是否拒绝零假设。
怀特检验的计算示例假设有以下数据,我们要拟合一个回归模型,并进行怀特检验:序号自变量因变量1 2 32 4 53 6 84 8 105 10 13首先,我们进行回归得到的模型为:因变量 = α + β * 自变量接下来,计算残差:序号自变量因变量预测值残差1 2 3 2.4 0.62 4 5 2.8 2.23 6 8 3.2 4.84 8 10 3.6 6.45 10 13 4.0 9.0将残差平方作为因变量,将自变量平方作为自变量,进行新的回归得到的模型为:残差平方= γ + δ * 自变量平方接下来,计算新回归模型的残差,并计算残差与自变量平方之间的相关系数:序号自变量平方残差平方1 4 0.362 16 4.843 36 23.044 64 40.965 100 81.00根据计算得到的相关系数,可以使用统计假设检验方法判断是否拒绝零假设。
异⽅差性及其检验异⽅差性及其检验I 概念对于多元线性回归模型同⽅差性假设为如果出现即对于不同的样本点,随机⼲扰项的⽅差不再是常数,⽽是互不相同,不具有等同的分散程度,则认为出现了异⽅差(Heteroskedasticity ) II 类型同⽅差性假定是指,回归模型中不可观察的随机误差项i u 以解释变量X 为条件的⽅差是⼀个常数,因此每个i u 的条件⽅差不随X 的变化⽽变化,即有2()i i f X σ=≠常数在异⽅差的情况下,总体中的随机误差项i u 的⽅差 2i σ不再是常数,通常它随解释变量值的变化⽽变化,即异⽅差⼀般可归结为三种类型:01122 1,2,,i i i k ki i Y X X X i n ββββµ=+++++=2(), 1,2,...,i Var i n µσ==2(), 1,2,...,i i Var i nµσ==2()i i f X σ=异⽅差类型图:III来源(1)截⾯数据(不同样本点除解释变量外其他影响差异⼤)(2)时间序列(规模差异)(3)分组数据、异常值等(4)模型函数形式设置不正确和数据变形不正确(5)边错边改学习模型IV影响计量经济学模型⼀旦出现异⽅差,如果仍然⽤普通最⼩⼆乘法估计模型参数,会产⽣⼀系列不良后果。
(1)参数估计量⾮有效(2)OLS估计的随机⼲扰项的⽅差不再是⽆偏的(3)基于OLS估计的各种统计检验⾮有效(4)模型的预测失效V检验异⽅差性,即相对于不同的样本点,也就是相对于不同的解释变量观测值,随机⼲扰项具有不同的⽅差,那么检验异⽅差性,也就是检验随机⼲扰项的⽅差与解释变量观测值之间的相关性。
⼀般检验⽅法如下:(1)图⽰检验法(2)帕克(Park)检验与⼽⾥瑟(Gleiser)检验(3)G-Q(Goldfeld-Quandt)检验(4)F检验(5)拉格朗⽇乘⼦检验(6)怀特检验(具体步骤随后介绍)VI修正⽅法加权最⼩⼆乘法定义:加权最⼩⼆乘法是对原模型加权,使之变成⼀个新的不存在异⽅差性的模型,然后采⽤OLS法估计其参数。
目录案例引入 (2)数据分析 (4)建立多元线性模型及检验 (5)经济检验: (6)统计检验 (6)异方差检验 (7)异方差修正 (12)结果解释 (13)一、案例引入随着国内生产生产总值和城乡居民可支配收入的不断增长,使得人们的收入成倍增长,无论微观经济理论还是人们的感受,收入的增加能够满足人们的更多需求,从而是人们对生活状况的满意程度增加,即提升主观幸福感,增加生命质量得分。
同时,研究结果现实收入较低人群的生命质量得分均较低且与其他组间差异大。
随着收入的增加,生命质量有提升的趋势。
而在社会五大保险之中,只有医保与我们的生命息息相关,堪称社保之中的重中之重,医保的价值让我们的健康得到了保证。
数据(表1)为我们研究收入水平与医保对生命预期的影响提供了重要数据基础。
我们选择58国收入、医保、生命预期这3个变量的相关数据作为样本,进行研究。
观察值生命预期收入医保观察值生命预期收入医保1 71.8 2046 81 44 74.7 13410 1002 60.2 686 74 45 55.6 884 413 76.4 14862 100 46 77.4 14784 1004 75.9 11760 100 47 64.7 360 805 73.2 7944 100 48 45.0 150 306 49.8 296 18 49 46.8 230 497 51.6 3288 90 50 73.7 5842 1008 50.3 156 45 51 62.5 784 849 52.6 482 64 52 54.3 330 7310 64.5 1456 76 53 75.1 17714 10011 52.6 324 75 54 66.7 1322 10012 62.8 462 89 55 52.2 292 6113 50.3 292 56 56 49.5 306 4514 75.7 11924 100 57 77.7 14280 10015 48.0 294 28 58 49.3 360 5116 48.3 244 61 59 65.2 1124 6417 63.2 2560 90 60 47.5 472 4018 55.0 392 80 61 65.6 804 8019 66.8 1094 63 62 47.7 13730 10020 66.3 1038 89 63 46.7 186 1521 52.6 248 81 64 61.4 1056 3422 67.9 7794 100 65 51.5 270 2623 72.3 994 90 66 76.6 16192 10024 59.3 522 80 67 47.4 166 4925 53.6 384 61 68 70.4 2328 7226 70.7 4956 99 69 54.3 342 5527 74.6 13408 100 70 74.5 10490 10028 71.3 1974 100 71 76.8 19782 10029 62.1 3954 80 72 64.6 862 7030 45.5 420 30 73 65.1 1180 9131 44.0 252 43 74 60.9 604 7232 71.4 1472 97 75 70.1 396 9333 52.0 744 31 76 69.0 2736 9434 63.5 780 74 77 70.1 2142 10035 70.4 19182 90 78 74.4 1506 8036 74.7 11076 100 79 76.9 14472 10037 60.8 1078 75 80 72.9 15506 10038 52.2 980 81 81 68.0 1246 6039 74.1 16624 100 82 76.6 11060 10040 75.0 9898 100 83 46.5 160 2841 71.8 2036 82 84 61.0 862 5842 76.5 9532 100 85 50.1 638 4643 70.8 2366 100 ————数据来源:老师提供数据无需处理。
异方差检验方法异方差检验是统计学中常用的一种方法,用于检验数据的方差是否存在差异。
在实际应用中,我们经常会遇到数据的方差不同的情况,而异方差检验就可以帮助我们判断这种差异是否显著。
本文将介绍异方差检验的基本原理、常用的检验方法以及实际应用中的注意事项。
一、基本原理。
异方差检验的基本原理是通过比较不同组数据的方差来判断它们是否存在显著差异。
在进行假设检验时,我们通常会提出原假设和备择假设,其中原假设是指数据的方差相等,备择假设是指数据的方差不等。
通过计算检验统计量,我们可以得出在原假设成立的情况下,观察到当前样本数据或更极端情况的概率,从而进行假设检验。
二、常用的检验方法。
1. Bartlett检验。
Bartlett检验是一种常用的异方差检验方法,适用于数据呈正态分布的情况。
它的原假设是各组数据的方差相等,备择假设是各组数据的方差不等。
通过计算检验统计量,我们可以得出在原假设成立的情况下,观察到当前样本数据或更极端情况的概率,从而进行假设检验。
2. Levene检验。
Levene检验是另一种常用的异方差检验方法,它相对于Bartlett检验更加稳健,对数据的正态性要求较低。
它的原假设和备择假设与Bartlett检验相同,通过计算检验统计量来进行假设检验。
三、实际应用中的注意事项。
在进行异方差检验时,我们需要注意以下几点:1. 数据的正态性,Bartlett检验对数据的正态性要求较高,如果数据不满足正态分布的假设,可以考虑使用Levene检验。
2. 样本量的影响,样本量较大时,即使数据的方差存在一定差异,也可能通过检验。
因此,在进行异方差检验时,需要考虑样本量的影响。
3. 多重比较的问题,在进行多组数据的异方差检验时,需要注意多重比较的问题,避免出现假阳性的情况。
四、结论。
异方差检验是一种常用的统计方法,用于检验数据的方差是否存在差异。
在实际应用中,我们可以根据数据的正态性和样本量的大小选择合适的检验方法,并注意多重比较的问题,以得到准确的检验结果。