异方差与自相关
- 格式:doc
- 大小:1.71 MB
- 文档页数:13
自相关和异方差处理顺序引言自相关和异方差是时间序列分析中常见的两种问题,它们影响了模型的准确性和可靠性。
在进行时间序列建模时,需要处理这些问题,以确保模型的有效性。
本文将深入探讨自相关和异方差处理的顺序,并讨论不同处理顺序的影响。
什么是自相关和异方差自相关自相关是指时间序列中当前观测值与之前观测值之间的相关性。
它衡量的是时间序列中各个观测值之间的依赖关系。
自相关可以用自相关函数(ACF)图来表示,通过观察ACF图,可以判断时间序列是否存在自相关。
异方差异方差是指时间序列中方差不稳定的特征。
在时间序列中,方差可能随着时间的推移发生变化,这会导致模型的拟合不准确。
异方差可以用方差函数(VCF)图来表示,通过观察VCF图,可以判断时间序列是否存在异方差。
自相关和异方差处理的重要性自相关和异方差对时间序列建模的准确性和可靠性有重要影响,它们需要被处理以获得可靠的模型结果。
•自相关的存在会导致参数估计不准确,预测结果失真。
如果存在自相关,模型会无法捕捉到序列的真实动态,导致预测结果不准确。
•异方差使得模型的残差不符合正态分布,违背了建模的基本假设。
这会使得模型的显著性检验和置信区间估计不可靠,影响模型的有效性。
因此,为了获得可靠的模型结果,需要对自相关和异方差进行处理。
自相关和异方差处理顺序的影响自相关和异方差的处理顺序会对最终的模型结果产生影响。
不同的处理顺序可能导致不同的模型结构和参数估计。
先处理自相关后处理异方差如果先处理自相关再处理异方差,可能会导致如下影响:1.自相关处理可能会改变时间序列的动态特征。
当我们去除自相关时,可能会削弱序列中的一些重要信息,导致模型无法准确捕捉到序列的动态变化。
2.异方差处理可能会影响自相关的结构。
当我们对残差进行异方差处理时,可能会改变残差序列的结构,从而使得自相关的估计失真。
先处理异方差后处理自相关如果先处理异方差再处理自相关,可能会产生如下影响:1.异方差处理可能改变原始序列的动态特征。
第六章异方差与自相关第一节异方差与自相关的定义一、例子例1,研究我国制造业利润函数,选取销售收入作为解释变量,数据为1998年的食品年制造业、饮料制造业等28个截面数据(即n=28)。
数据如下表,其中Y表示制造业利润函数,X表示销售收入(单位为亿元)。
Y对X的散点图为从散点图可以看出,在线性的基础上,有的点分散幅度较小,有的点分散幅度较大。
因此,这种分散幅度的大小不一致,可以认为是由于销售收入的影响,使得制造业利润偏离均值的程度发生了变化,而这种偏离均值的程度大小不同是一种什么现象?如何定义?下面给出制造业利润对销售收入的回归估计。
模型的书写格式为2ˆ12.03350.1044(0.6165)(12.3666)0.8547,..84191.34,152.9322213.4639,146.4905Y YX R S E F Y s =+=====通过变量的散点图、参数估计、残差图,可以看出尽管表面上模型的估计效果还不错,但随机误差(残差)可能存在一种系统性的表现。
例2,研究中国城镇居民消费函数,其中选取了两个变量,城镇家庭商品性支出(现价)和城镇家庭可支配收入(现价),分别记为CSJTZC 和CSJTSR ,时间从1978年到1997年,n=20。
但为了剔除物价的影响,分别对CSJTZC 和CSJTSR 除以物价(用CPI 表示),这里CPI 为城镇居民消费物价指数(以1990年为100%),经过扣除价格因素以后,记CPICSJTSRX CPICSJTZCY ==即如下表回归以后得到的残差为Dependent Variable: Y Method: Least Squares Date: 10/27/04 Time: 09:39 Sample: 1978 1997 Included observations: 20Variable Coefficient Std. Error t-Statistic Prob. C -103.3692 78.80739 -1.311669 0.2061 X0.9235510.01603357.603880.0000 R-squared0.994605 Mean dependent var 3939.341 Adjusted R-squared 0.994305 S.D. dependent var 2124.467 S.E. of regression 160.3247 Akaike info criterion 13.08692 Sum squared resid 462671.9 Schwarz criterion 13.18649 Log likelihood -128.8692 F-statistic 3318.207 Durbin-Watson stat1.208037 Prob(F-statistic)0.000000通过残差图可以看出,残差有随时间的系统性表现。
七、 异方差与自相关一、背景我们讨论如果古典假定中的同方差和无自相关假定不能得到满足,会引起什么样的估计问题呢?另一方面,如何发现问题,也就是发现和检验异方差以及自相关的存在性也是一个重要的方面,这个部分就是就这个问题进行讨论。
二、知识要点1、引起异方差的原因及其对参数估计的影响2、异方差的检验(发现异方差)3、异方差问题的解决办法4、引起自相关的原因及其对参数估计的影响5、自相关的检验(发现自相关)6、自相关问题的解决办法 (时间序列部分讲解) 三、要点细纲1、引起异方差的原因及其对参数估计的影响原因:引起异方差的众多原因中,我们讨论两个主要的原因,一是模型的设定偏误,主要指的是遗漏变量的影响。
这样,遗漏的变量就进入了模型的残差项中。
当省略的变量与回归方程中的变量有相关关系的时候,不仅会引起内生性问题,还会引起异方差。
二是截面数据中总体各单位的差异。
后果:异方差对参数估计的影响主要是对参数估计有效性的影响。
在存在异方差的情况下,OLS 方法得到的参数估计仍然是无偏的,但是已经不具备最小方差性质。
一般而言,异方差会引起真实方差的低估,从而夸大参数估计的显著性,即是参数估计的t 统计量偏大,使得本应该被接受的原假设被错误的拒绝。
2、异方差的检验 (1)图示检验法由于异方差通常被认为是由于残差的大小随自变量的大小而变化,因此,可以通过散点图的方式来简单的判断是否存在异方差。
具体的做法是,以回归的残差的平方2i e 为纵坐标,回归式中的某个解释变量i x 为横坐标,画散点图。
如果散点图表现出一定的趋势,则可以判断存在异方差。
(2)Goldfeld-Quandt 检验Goldfeld-Quandt 检验又称为样本分段法、集团法,由Goldfeld 和Quandt 1965年提出。
这种检验的思想是以引起异方差的解释变量的大小为顺序,去掉中间若干个值,从而把整个样本分为两个子样本。
用两个子样本分别进行回归,并计算残差平方和。
异方差自相关豪斯曼检验异方差性(Heteroscedasticity)是指数据的方差不是常数,而是随着自变量的变化而变化。
当数据呈现异方差性时,固定效应模型可能会产生无偏但不一致的估计,而随机效应模型通常能够更好地处理异方差性。
因此,豪斯曼检验可以帮助确定在存在异方差性时应该选择哪种模型。
同时,时间序列数据中还可能存在自相关性(Autocorrelation),即误差项之间存在相关性。
如果数据中存在自相关性,那么OLS估计量可能不再是最佳线性无偏估计。
通过进行豪斯曼检验,可以确定在存在自相关性时是否需要使用修正的OLS估计方法。
要进行豪斯曼检验,首先需要建立两个模型:一个固定效应模型和一个随机效应模型。
然后通过计算两个模型的估计值的差异来进行检验。
在检验中,我们感兴趣的是这个差异是否由异方差性或自相关性引起的。
具体来说,豪斯曼检验的原假设是两个模型没有系统性的差异。
如果原假设被拒绝,说明两个模型之间存在显著差异,这可能是由于异方差性或自相关性导致的。
为了说明豪斯曼检验的方法和步骤,我们将考虑一个实际的研究示例。
假设我们对一个国家的 GDP 进行研究,我们想分析GDP 与劳动力投入之间的关系。
我们建立了一个固定效应模型和一个随机效应模型,用来估计 GDP 对劳动力投入的影响。
在固定效应模型中,我们假设不同国家之间的劳动力投入是不同的,即随着时间的推移,劳动力投入在各国之间也可能存在差异。
而在随机效应模型中,我们假设劳动力投入在各国之间是同质的,即不同的劳动力投入只是由于随机误差所致。
接下来,我们用豪斯曼检验来检验这两个模型之间的差异。
我们首先估计这两个模型,并计算它们之间的差异。
接着,我们对这些差异进行统计检验,以确定差异是否显著。
如果实证结果表明固定效应模型比随机效应模型更好,那么我们可以得出结论,数据中存在异方差性和自相关性。
在这种情况下,我们可能需要对模型进行修正,以更准确地描述数据。
总的来说,豪斯曼检验是一种在经济学和其他社会科学研究中经常使用的方法,用于检验两个模型之间的差异。
newey-west 异方差和自相关一
致的标准误
Newey-West是一种用于处理异方差和自相关问题的一致标准误估计方法,也被称为HAC(Heteroskedasticity and Autocorrelation Consistent)标准误。
在时间序列分析中,异方差和自相关是两个常见的问题。
异方差是指数据的方差随着时间变化而变化,而自相关则是指数据自身的过去值与其现在值之间的相关性。
Newey-West标准误考虑了异方差和自相关的问题,提供了一个更加准确的估计方法。
这种标准误估计方法通过使用加权平均的方式,将不同的观察值之间的相关性考虑在内,从而提高了标准误的准确性和可信度。
在实践中,Newey-West标准误通常需要在回归模型中添加滞后项(即过去的观察值)以考虑自相关问题。
同时,为了处理异方差问题,还需要对异方差性进行检验并采用适当的统计方法进行修正。
计量经济学作业一、异方差(1)Dependent Variable: YMethod: Least SquaresDate: 09/29/11 Time: 22:09Sample: 1 29Included observations: 29Variable Coefficient Std. Error t-Statistic Prob.C 58.31791 49.04935 1.188964 0.2448X 0.795570 0.018373 43.30193 0.0000R-squared 0.985805 Mean dependent var 2111.931 Adjusted R-squared 0.985279 S.D. dependent var 555.5470 S.E. of regression 67.40436 Akaike info criterion 11.32577 Sum squared resid 122670.4 Schwarz criterion 11.42006 Log likelihood -162.2236 F-statistic 1875.057 Durbin-Watson stat 1.893970 Prob(F-statistic) 0.000000(1)戈徳菲尔德—匡特检验:简单步骤如下:1、先排列2、分成两组1-11,19-29,做回归检验,得残差平方和3、得 F ,查表比较。
Dependent Variable: YMethod: Least SquaresDate: 09/29/11 Time: 19:38Sample: 1 11Included observations: 11Variable Coefficient Std. Error t-Statistic Prob.C 55.84840 60.15527 0.928404 0.3774X 0.802769 0.021586 37.18930 0.0000R-squared 0.993535 Mean dependent var 2203.182 Adjusted R-squared 0.992816 S.D. dependent var 660.2351 S.E. of regression 55.95928 Akaike info criterion 11.05009 Sum squared resid 28182.97 Schwarz criterion 11.12244 Log likelihood -58.77550 F-statistic 1383.044Durbin-Watson stat 1.657950 Prob(F-statistic) 0.000000第一组:Sum squared resid(残差平方和)=28182.97Dependent Variable: YMethod: Least SquaresDate: 09/29/11 Time: 19:39Sample: 19 29Included observations: 11Variable Coefficient Std. Error t-Statistic Prob.C 92.44615 96.01293 0.962851 0.3608X 0.782281 0.035369 22.11798 0.0000R-squared 0.981935 Mean dependent var 2141.455Adjusted R-squared 0.979928 S.D. dependent var 590.5276S.E. of regression 83.66352 Akaike info criterion 11.85445Sum squared resid 62996.26 Schwarz criterion 11.92679Log likelihood -63.19947 F-statistic 489.2051Durbin-Watson stat 1.770865 Prob(F-statistic) 0.000000第二组:Sum squared resid(残差平方和)=62996.26F=62996.26/28182.97=2.23526,给定显著性水平a=0.05查F分布临界值表可得临界值F0.05(11,11)=2.85,所以统计量F< F0.05(11,11),支出模型不存在异方差。
自相关和异方差处理顺序在统计学和计量经济学中,自相关和异方差是两个常见的问题,需要进行相应的处理才能保证模型的准确性和可靠性。
本文将以人类的视角,采用准确的中文进行描述,详细介绍自相关和异方差的处理顺序及其重要性。
一、自相关处理自相关是指时间序列数据中观测值之间存在的相关性。
当序列中的观测值之间存在一定的相关性时,会导致统计模型的参数估计不准确,假设检验无效,预测结果不可靠。
因此,需要进行自相关的处理。
自相关处理的一种常见方法是使用自相关函数(ACF)和偏自相关函数(PACF)进行分析。
ACF表示观测值与不同滞后期的观测值之间的相关性,PACF表示观测值与滞后期观测值之间的相关性,探究观测值之间的相关性结构。
在进行自相关处理时,可以采取以下步骤:1. 绘制时间序列图,观察序列的趋势和波动性。
2. 进行序列的平稳性检验,确保序列满足平稳性的要求。
3. 绘制ACF和PACF图,分析观测值之间的相关性结构。
4. 根据ACF和PACF的图形特征,选择合适的自回归移动平均模型(ARMA模型)。
5. 估计模型参数,进行模型拟合。
6. 检验模型的残差序列是否存在自相关,如果存在,则返回第3步,重新选择模型。
通过以上步骤,可以有效地处理自相关问题,提高模型的准确性和可靠性。
二、异方差处理异方差是指随着自变量的变化,因变量的方差也发生变化。
当存在异方差时,会导致模型的参数估计不准确,假设检验无效,预测结果不可靠。
因此,需要进行异方差的处理。
异方差处理的一种常见方法是使用加权最小二乘法(Weighted Least Squares, WLS)。
WLS是一种在回归分析中常用的方法,通过对误差项进行加权,降低异方差对回归结果的影响。
在进行异方差处理时,可以采取以下步骤:1. 绘制残差图,观察残差的分布特征。
2. 进行异方差检验,判断是否存在异方差。
3. 如果存在异方差,可以使用加权最小二乘法进行回归估计。
4. 根据异方差的特点,选择合适的加权函数,对误差项进行加权。
1.5 假定条件的不成立用OLS 法得到的估计模型通过统计检验后,还要检验摸型是否满足假定条件。
由1.3 节知,只有模型的4个假定条件都满足时,用OLS 法得到的估计量才具有最佳线性无偏特性。
当一个或多个假定条件不成立时,OLS 估计量将丧失上述特性。
本节讨论当假定条件不成立时,对参数估计带来的影响以及相应的补救措施。
以下讨论都是在某一个假定条件被违反,而其他假定条件都成立的情况下进行。
分为5个步骤。
(1)回顾假定条件。
(2)假定条件不成立对模型参数估计带来的影响。
(3)定性分析假定条件是否成立。
(4)假定条件是否成立的检验(定量判断)。
(5)假定条件不成立时的补救措施。
1.5.1 同方差假定-224681012050100150200XY图5.1 同方差情形 图5.2 同方差情形模型的假定条件⑴ 给出V ar(u ) 是一个对角矩阵, Var(u ) = E(u u ' ) = σ 2I = σ 21011⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦(5.1) 且u 的方差协方差矩阵主对角线上的元素都是常数且相等,即每一误差项的方差都是有限的相同值(同方差假定);且非主对角线上的元素为零(非自相关假定),当这个假定不成立时,Var(u ) 不再是一个纯量对角矩阵。
Var(u ) = σ 2 Ω = σ 211220..00...0 00...TT σσσ⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦≠σ 2 I (5.2)当误差向量u 的方差协方差矩阵主对角线上的元素不相等时,称该随机误差系列存在异方差,即误差向量u 中的元素u t 取自不同的分布总体。
非主对角线上的元素表示误差项之间的协方差值。
比如 Ω 中的 σi j 与σ 2的乘积 ,(i ≠ j )表示与第i 组和第j 组观测值相对应的u i 与 u j 的协方差。
若 Ω 非主对角线上的部分或全部元素都不为零,误差项就是自相关的。
本节讨论异方差。
下一节讨论自相关问题。
以两个变量为例,同方差假定如图5.1和5.2所示。
对于每一个x t 值,相应u t 的分布方差都是相同的。
1.5.2 异方差表现与来源 异方差通常有三种表现形式,(1)递增型,(2)递减型,(3)条件自回归型。
递增型异方差见图5.3和5.4。
图5.5为递减型异方差。
图5.6为条件自回归型异方差。
123456720406080100120140160180200Y图5.3 递增型异方差情形 图5.4 递增型异方差01234567050100150200XY-8-6-4-20246400500600700800900100011001200DJ PY图5.5 递减型异方差 图5.6 复杂型异方差(1) 时间序列数据和截面数据中都有可能存在异方差。
(2) 经济时间序列中的异方差常为递增型异方差。
金融时间序列中的异方差常表现为自回归条件异方差。
无论是时间序列数据还是截面数据。
递增型异方差的来源主要是因为随着解释变量值的增大,被解释变量取值的差异性增大。
0.0E+002.0E+114.0E+116.0E+118.0E+111.0E+121.2E+1284868890929496980002GDP of Philippin-8.0E+10-4.0E+100.0E+004.0E+108.0E+101.2E+1184868890929496980002RESID图5.7 菲律宾的季度数据 图5.8 剔出2次趋势后的残差序列1.5.3 异方差的后果下面以简单线性回归模型为例讨论异方差对参数估计的影响。
对模型y t = β0 + β1 x t + u t当Var(u t ) = σt 2,为异方差时(σt 2是一个随时间或序数变化的量),回归参数估计量仍具有无偏性和一致性。
以1ˆβ为例 E(1ˆβ)= E(∑∑---2)())((x x y y x x t t t ) = E(∑∑-+--21)(])()[(x x u x x x x t t t t β)= β1 +∑∑--2)()()(x x u E x x t t t = β1 在上式的推导中利用了E(u t ) = 0的假定。
但是回归参数估计量不再具有有效性。
仍以1ˆβ为例, Var (1ˆβ) = E(1ˆβ-β1)2 = E 22()()t tt x x u x x ⎛⎫- ⎪ ⎪-⎝⎭∑∑= E 222(())(())t t t x x u x x ⎛⎫- ⎪ ⎪-⎝⎭∑∑ =∑∑--2222))(()(E )(x x u x x t t t =∑∑--2222))(()(x x x x t t t σ≠ ∑-22)(x x t σ(在上式的推导中利用了u t 的非自相关假定、x t 与u t 非相关假定)。
上式不等号右侧项分子中的σt 2不是一个常量,不能从累加式中提出,所以不等号右侧项不等于不等号左侧项。
而不等号右侧项是同方差条件下β1的最小二乘估计量1ˆβ的方差。
因此异方差条件下的1ˆβ失去有效性。
另外回归参数估计量方差的估计是真实方差的有偏估计量。
例如E(∧Var (1ˆβ)) ≠ Var (1ˆβ) (证明略)下面用矩阵形式讨论。
因为OLS 估计量无偏性的证明只依赖于模型的一阶矩,所以当Var(u ) 如(5.2)式所示时,OLS 估计量βˆ仍具有无偏性和一致性。
E(βˆ) = E[ (X 'X )-1 X 'Y ] = E[ (X 'X )-1 X ' (X β + u ) ] = β + (X 'X )-1 X ' E(u ) = β 但不具有有效性和渐近有效性。
而且βˆ的分布将受到影响。
Var(βˆ) = E [(βˆ- β ) (βˆ- β )' ] = E [(X 'X )-1 X ' u u ' X (X 'X )-1 ] = (X ' X )-1 X ' E (u u ' ) X (X ' X )-1 = σ 2 (X 'X )-1 X ' Ω X (X ' X )-1 不等于σ 2 (X ' X )-1,所以异方差条件下βˆ是非有效估计量。
1.5.4 异方差检验1.5.4.1 定性分析异方差(1) 经济变量规模差别很大时容易出现异方差。
如个人收入与支出关系,投入与产出关系。
(2) 利用散点图做初步判断。
(3) 利用残差图做初步判断。
123456720406080100120140160180200Y-3-2-1012350100150200TY1.5.4.2 异方差检验(1) White 检验White 检验由H. White 1980年提出。
Goldfeld-Quandt 检验必须先把数据按解释变量的值从小到大排序。
Glejser 检验通常要试拟合多个回归式。
White 检验不需要对观测值排序,也不依赖于随机误差项服从正态分布,它是通过一个辅助回归式构造 χ2 统计量进行异方差检验。
White 检验的具体步骤如下。
以二元回归模型为例,y t = β0 +β1 x t 1 +β2 x t 2 + u t (5.9)①首先对上式进行OLS 回归,求残差t uˆ。
②做如下辅助回归式,2ˆt u= α0 +α1 x t 1 +α2 x t 2 + α3 x t 12 +α4 x t 22 + α5 x t 1 x t 2 + v t (5.10) 即用2ˆt u对原回归式中的各解释变量、解释变量的平方项、交叉积项进行OLS 回归。
注意,上式中要保留常数项。
求辅助回归式(5.10)的可决系数R 2。
③White 检验的零假设和备择假设是H 0: (5.9)式中的u t 不存在异方差, H 1: (5.9)式中的u t 存在异方差。
④在不存在异方差假设条件下,统计量T R 2 ~ χ 2(5) (5.11) 其中T 表示样本容量,R 2是辅助回归式(5.10)的OLS 估计式的可决系数。
自由度5表示辅助回归式(5.10)中解释变量项数(注意,不计算常数项)。
T R 2属于LM 统计量。
⑤判别规则是若 T R 2 ≤ χ2α (5), 接受H 0(u t 具有同方差)若 T R 2 > χ2α (5), 拒绝H 0(u t 具有异方差) 附录:White 检验的EViwes 操作。
在回归式窗口中点击View 键选Residual Tests/White Heteroskedasticity 功能。
检验式存在有无交叉项两种选择。
(2) Goldfeld-Quandt 检验H 0: u t 具有同方差, H 1: u t 具有递增型异方差。
构造F 统计量。
① 把原样本分成两个子样本。
具体方法是把成对(组)的观测值按解释变量的大小顺序排列,略去m 个处于中心位置的观测值(通常T > 30时,取m ≈ T / 4,余下的T - m 个观测值自然分成容量相等,(T - m ) / 2,的两个子样本。
){x 1, x 2, …, x i -1, x i , x i +1, …, x T -1, x T }n 1 = (T -m ) / 2 m = T / 4 n 2 = (T -m ) / 2② 用两个子样本分别估计回归直线,并计算残差平方和。
相对于n 2 和n 1 分别用SSE 2 和SSE 1表式。
③ F 统计量是 F =)/()/(1122k n SSE k n SSE -- = 12SSE SSE ,(k 为模型中被估参数个数)在H 0成立条件下,F ~ F ( n 2 - k , n 1 - k )01234567050100150200X Y Y④ 判别规则如下,若 F ≤ F α (n 2 - k , n 1 - k ) , 接受H 0 (u t 具有同方差) 若 F > F α (n 2 - k , n 1 - k ) , 拒绝H 0 (递增型异方差)注意:① 当摸型含有多个解释变量时,应以每一个解释变量为基准检验异方差。
② 此法只适用于递增型异方差。
③ 对于截面样本,计算F 统计量之前,必须先把数据按解释变量的值从小到大排序。
(3)Glejser 检验检验 |t uˆ| 是否与解释变量x t 存在函数关系。
若有,则说明存在异方差;若无,则说明不存在异方差。
通常应检验的几种形式是|t uˆ| = a 0 + a 1 x t |t uˆ| = a 0 + a 1 x t 2 |t uˆ| = a 0 + a 1t x , …. Glejser 检验的特点是:① 既可检验递增型异方差,也可检验递减型异方差。