[精选]异方差——怀特的一般异方差检验--资料
- 格式:ppt
- 大小:2.38 MB
- 文档页数:14
七、 异方差与自相关一、背景我们讨论如果古典假定中的同方差和无自相关假定不能得到满足,会引起什么样的估计问题呢?另一方面,如何发现问题,也就是发现和检验异方差以及自相关的存在性也是一个重要的方面,这个部分就是就这个问题进行讨论。
二、知识要点1、引起异方差的原因及其对参数估计的影响2、异方差的检验(发现异方差)3、异方差问题的解决办法4、引起自相关的原因及其对参数估计的影响5、自相关的检验(发现自相关)6、自相关问题的解决办法 (时间序列部分讲解) 三、要点细纲1、引起异方差的原因及其对参数估计的影响原因:引起异方差的众多原因中,我们讨论两个主要的原因,一是模型的设定偏误,主要指的是遗漏变量的影响.这样,遗漏的变量就进入了模型的残差项中.当省略的变量与回归方程中的变量有相关关系的时候,不仅会引起内生性问题,还会引起异方差.二是截面数据中总体各单位的差异。
后果:异方差对参数估计的影响主要是对参数估计有效性的影响。
在存在异方差的情况下,OLS 方法得到的参数估计仍然是无偏的,但是已经不具备最小方差性质.一般而言,异方差会引起真实方差的低估,从而夸大参数估计的显著性,即是参数估计的t 统计量偏大,使得本应该被接受的原假设被错误的拒绝.2、异方差的检验 (1)图示检验法由于异方差通常被认为是由于残差的大小随自变量的大小而变化,因此,可以通过散点图的方式来简单的判断是否存在异方差.具体的做法是,以回归的残差的平方2i e 为纵坐标,回归式中的某个解释变量i x 为横坐标,画散点图。
如果散点图表现出一定的趋势,则可以判断存在异方差。
(2)Goldfeld-Quandt 检验Goldfeld-Quandt 检验又称为样本分段法、集团法,由Goldfeld 和Quandt 1965年提出.这种检验的思想是以引起异方差的解释变量的大小为顺序,去掉中间若干个值,从而把整个样本分为两个子样本.用两个子样本分别进行回归,并计算残差平方和.用两个残差平方和构造检验异方差的统计量。
怀特检验详细报告背景怀特检验是一种常用的统计方法,用于检验数据中是否存在异方差性。
在许多统计分析中,假设方差是常数,但现实中数据往往呈现出不同的方差,这就需要对数据进行方差齐性检验。
本报告将详细介绍怀特检验的原理、假设、步骤和解释结果的方法。
原理怀特检验是利用方差齐性假设进行统计检验的一种方法。
在经典线性回归模型中,我们假设误差项的方差在不同的条件下是相同的。
然而,在现实数据中,方差往往是变化的。
怀特检验可以用来检验误差项的方差是否与某些解释变量相关。
假设怀特检验基于以下两个假设: 1. 假设零:方差齐性,即不同组别或条件下的方差是相同的。
2. 对立假设:方差异质性,即不同组别或条件下的方差是不同的。
步骤进行怀特检验的步骤如下: 1. 收集数据:收集需要进行方差齐性检验的数据。
2. 构建模型:根据研究问题和数据类型,选择合适的统计模型。
3. 拟合模型:使用拟合数据的方法来拟合模型,并获取残差。
4. 进行怀特检验:计算怀特统计量,并对怀特统计量进行显著性检验。
5. 判断结论:根据怀特统计量的显著性检验结果,判断数据的异方差性。
解释结果在进行怀特检验后,我们可以根据统计显著性来判断数据是否具有异方差性。
如果怀特统计量的p值小于显著性水平(通常为0.05),则存在异方差性。
反之,如果p值大于显著性水平,则不存在异方差性。
需要注意的是,即使存在异方差性,也不一定会对统计分析结果产生严重的影响。
但是,在存在异方差性的情况下,使用传统的统计方法可能会导致统计推断的错误。
总结怀特检验是一种用于检验数据异方差性的方法。
通过对数据进行怀特检验,我们可以得出数据是否存在异方差性的结论。
在统计分析中,方差齐性是一个重要的假设,如果假设不成立,需要采取相应的调整方法。
对于数据分析人员来说,掌握怀特检验的原理和应用方法,可以帮助他们更好地理解和解释数据,提高数据分析的准确性和可靠性。
希望本报告对读者理解怀特检验有所帮助,有助于他们在实际数据分析中的应用。
异方差异方差的性质● 经典回归的一个重要假定之一是:u i 的条件方差为常数, 即:E (2i u )= 2σ● 异方差(heterscedasticity ):E (2iu )=2i σ, 不同的(heter )分散程度(scedasticity )● (图)消费和收入, 消费随收入的增加而增加,但变异也在增加● u i 变动的几个理由:- 按照边错边改学习模型(error-learning models ),人们在学习的过程中,其行为误差随时间而减少,如:打字出错的个数- 随着收入的增长,人们有更多的备用收入,从而如何支配他们的收入有更大的选择范围- 随着数据采集技术的改进,2iσ可能减少- 异方差性还会因为异常值的出现而产生。
包括一个异常值,尤其样本较小时,会在很大程度上改变回归分析的结果- 异方差性的另一来源来自CLRM 的假定9的破坏,即:回归模型的设定是不正确的。
● 异方差常见于横截面数据中,因为观测范围大小不一● 异方差的后果:仍然是无偏的,但不是最有效的了(1) 无偏性βββ=+==-- )](')'[(]')'[()ˆ(11U X X X X E Y X X X E E(2) 非有效性1121111)'(')'()'()'(')'(]'')'][(')'[()'ˆ)(ˆ(------Φ==--=--X X X X X X X X X UU E X X X Y X X X Y X X X E E σββββββ● 同方差性时,βˆ的协方差矩阵为: 12)'(-X X σ,会夸大或缩小真实的方差和协方差● 由此会导致β的相关检验和置信区间失效,进而引起预测失效● 以双变量模型为例:i i i u X Y ++=10ββ进行显著性检验时,构造的t 统计量)ˆ(ˆ11ββS t =)ˆ(1βS 变动,所以1ˆβ的置信区间也不稳定异方差性的侦察● 侦破异方差性并没有严明的法则,只有少数的经验规则● 因为除非我们知道对应于选定的X 值的整个Y 总体,否则2i σ是无从获知的●大多数的方法都基于对我们所能观测到的OLS残差i uˆ的分析,而不是对干扰u i的分析非正式的方法●问题的性质:-往往根据所考虑的性质就能判别是否会遇到异方差性-例如:围绕消费对收入的回归,残差的方差随收入的增加而增加●图解法:-可先在无异方差性的假定下做回归分析,然后对残差的平方2ˆi u作一事后检查,看看这些2ˆi u是否呈现任何系统性的样式-(图)-2ˆi u是对应于i Yˆ而描绘的,除此之外,还可将他们对解释变量之一描点-当我们考虑2个或多个X变量的模型时,可将2ˆi u 相对于模型中的任一个变量描点正式方法(1)帕克(park )检验● 提出2i σ是解释变量X i 的某个函数,他建议的函数形式为:iv i ie X βσσ22=或:i i i v X ++=ln ln ln 22βσσ● 由于2iσ通常是未知的,帕克建议用2ˆi u 作为替代变量并作如下回归:ii i i v v X u++=++=i 22lnX ln ln ˆln βαβσ **● 如果β表现为统计上显著的,就表明数据中有异方差性● 帕克检验分两阶段:一是做回归,而不考虑异方差性问题,从这一回归获得i uˆ,然后在第二阶段作如** 的回归戈德菲尔德-匡特检验 (Goldfeld-Quandt test )● 适用于异方差性方差2i σ同回归模型中的解释变量之一有正相关的情形● 步骤一:从最小X 值开始,按X 值的大小顺序将观测值排列步骤二:略去居中的C 个观测值,其中C 是预定的,并将其余的(n-c )个观测值分成两组,每组(n-c)/2个步骤三:分别对头(n-c )/2个观测值和末(n-c)/2 个观测值各拟合一个回归,并分别获得残差平方和RSS 1 和RSS 2步骤四:计算比值:dfRSS dfRSS //12=λ, 如果假定i uˆ是正态分布的,并且如果同方差性假定真实,则λ遵循分子和分母自由度各为(n-c-2k )/2 的F 分布● C 个观测值是为了突出或激化小方差组(即RSS 1)与大方差组(即RSS 2 )之间的差异● 通常当n=30 时,取c =4, 当n=60 时,取c=10为宜● 当模型中有多于1个X 变量时,在检验的步骤一中,就可按任一个X 的大小顺序将观测值排列● 例:消费支出 – 收入, 30 观测值,略去居中4 个观测值后,对开头的13个和末尾的13个观测值分别作OLS 回归:17.377RS S 6968.04094.3ˆ1=+=i i X Y 8.1536RS S 7941.00272.28ˆ2=+-=i iX Y得:07.411/17.37711/8.1536//12===df RSS df RSS λ怀特(white )的一般异方差性检验● Goldfeld-Quandt 检验要求按照被认为是引起异方差性的X 变量把观测值重新排序● White 检验并不要求排序,而且易于付诸实施● 步骤一: 对给定的数据回归(两个解释变量),并获得残差i uˆ步骤二:再做如下(辅助)回归:ii i i i i i i v X X a X a X a X a X a a u ++++++=326235224332212ˆ从这个(辅助)回归中求得R 2步骤三:在无异方差性的虚拟假设下,2nR 渐进的遵循自由度等于辅助回归元(不包括常数项)个数的2χ分布步骤四:如果2χ值超过临界值,结论就是有异方差性,如果不超过,就没有,即:065432=====a a a a a● 例: Y= 贸易税收(进口与出口税收)与政府总收入之比,X 2 =进出口总和与GNP 之比,X 3 =人均GNP , 假设Y 与X 2 正相关,Y 与X 3 成反比White test :1148.0R ))(ln T rade 0.0015(ln )(ln 0491.0)(ln 4081.0 ln 6918.0ln 5629.28417.5ˆ2i 222=+--++-=i i i i i i GNP GNP Trade GNP Trade u7068.4)1148.0(41.2==R n● 如果模型有多个回归元,回归元的平方(或更高次方)项以及它们的交叉项就会耗掉许多的自由度● 遇到统计量显著的情形,原因也许不一定是异方差性异方差的修正方法 – 加权最小二乘法(广义最小二乘法)● 以消费-收入为例,消费异方差,设计一种估计方案:对来自变异较大的总体的观测值作较小的加权,而对来自较小的总体的观测值作较大的加权● OLS 方法对每一观测之同样重视或同等加权● 广义最小二乘法(generalized least square-GLS )利用了异方差的信息,因而能产生BLUE估计量● 利用双变量模型:i i i i u X X Y ++=201ββ其中对每个i, X0i=1● 假定相异的方差2i σ已知,用σ通除上式得:)()()(201iiiiiiiiu X X Y σσβσβσ++=为了易于阐述,将它写为:i i i i u X X Y ******201++=ββ● 转换原始模型中,转换干扰项i u *的方差,现在有了同方差性1)(1)(1)()*()*var(2222i22=====iiiiii i u E u E u E u σσσσ● OLS应用到转换模型将产生BLUE估计量● GLS是对满足标准最小二乘假定的转换变量的OLS● 21*ˆ*ˆββ和的估计步骤是最小化: 220112)**ˆ**ˆ*(*ˆii i X X Y u ββ--=∑∑● *ˆ2β的GLS 估计量为: ∑∑∑∑∑∑∑--=222)())(())(())((*ˆi i i i i i i i i i i i i X w X w w Y w X w Y X w w β 其中2/1i i w σ=● OLS和GLS 的差别:OLS要求最小化:2212)ˆˆ(ˆii i X Y u ββ--=∑∑ GLS要求最小化:2212)ˆˆ(ˆii i i i X Y w u w ββ--=∑∑● GLS中最小化一个以2/1i i w σ=为权的加权残差平方和,而在OLS中最小化一个无权或等权的残差平方和● 这种形式的GLS 被称为加权最小二乘法(weighted least square – WLS )● 若i σ是已知的,异方差的问题似乎已经得到了解决,但大多数情况下,方差是未知的●加权最小二乘法至多只能用于未知方差容易被描述的那些情况●看一下课本中的例子。
怀特检验简介怀特检验(White’s test)是一种统计学上用来检验回归模型(尤其是线性回归模型)的异方差性的方法。
通过用残差的平方与自变量的平方作为回归方程的附加变量,怀特检验可以检测出模型中的异方差性问题。
异方差性是指残差的方差与自变量存在一定的关系,即随着自变量的变化,残差的方差也发生变化。
异方差性会导致参数估计不准确,误差项的标准误差不可靠,从而影响到统计推断的结果。
因此,通过进行怀特检验,可以检验回归模型是否存在异方差性问题,进而采取适当的调整措施。
怀特检验的原理怀特检验的原理是基于OLS(Ordinary Least Squares)估计方法的残差的特点。
在普通最小二乘法中,残差的方差是一个常数,即残差的平方与自变量之间不存在线性关系。
而如果存在异方差性,残差的平方与自变量之间就会呈现出一定的线性关系。
怀特检验基于以下零假设和备择假设: - 零假设(H0):回归模型中不存在异方差性。
- 备择假设(H1):回归模型中存在异方差性。
通过计算残差的平方与自变量的平方之间的相关系数,来判断残差是否与自变量存在线性关系。
若相关系数显著不为零,则拒绝零假设,认为模型存在异方差性。
怀特检验的步骤怀特检验的步骤如下:1.根据已有数据,拟合回归模型,并计算得到残差。
2.将残差平方作为因变量,将自变量平方作为自变量,重新拟合回归模型。
3.计算新回归模型的残差,并计算残差与自变量平方之间的相关系数。
4.根据计算得到的相关系数,在给定显著性水平下,判断是否拒绝零假设。
怀特检验的计算示例假设有以下数据,我们要拟合一个回归模型,并进行怀特检验:序号自变量因变量1 2 32 4 53 6 84 8 105 10 13首先,我们进行回归得到的模型为:因变量 = α + β * 自变量接下来,计算残差:序号自变量因变量预测值残差1 2 3 2.4 0.62 4 5 2.8 2.23 6 8 3.2 4.84 8 10 3.6 6.45 10 13 4.0 9.0将残差平方作为因变量,将自变量平方作为自变量,进行新的回归得到的模型为:残差平方= γ + δ * 自变量平方接下来,计算新回归模型的残差,并计算残差与自变量平方之间的相关系数:序号自变量平方残差平方1 4 0.362 16 4.843 36 23.044 64 40.965 100 81.00根据计算得到的相关系数,可以使用统计假设检验方法判断是否拒绝零假设。