异方差性
- 格式:doc
- 大小:202.50 KB
- 文档页数:5
第六章异方差性Chapter 6 异方差性二、异方差的类型同方差:i2 = 常数f(Xi) 异方差:i2 = f(Xi) 四、异方差性的后果总而言之,在异方差情况下,我们建立在高斯马尔科夫定理基础上的用来检验各种假设的统计量都不再是有效的,因而OLS 估计量不再是最佳线性无偏估计量(即不具有BLUE 性质)。
五、异方差性的检验检验思路:辅助回归: 6. 怀特(White )检验怀特检验不需要排序,且适合任何形式的异方差。
怀特检验的基本思想与步骤(以二元为例):去掉交互项是一种方法,另一种方法也可以用原来模型OLS 回归得到的Y的拟合值作为辅助回归中的解释变量:在进行怀特异方差检验时,建立如下辅助回归:然后在计算LM 统计量例子6-5 异方差检验的说明性例子P160 图示法G-Q 检验F 检验LM 检验怀特检验一旦获得了异方差稳健标准差,就可以构造异方差稳健t统计量。
稳健标准差的优点在于:不需要知道总体模型是否存在异方差以及是何种形式的异方差。
异方差稳健标准差比普通的OLS 标准差更有效。
在大样本下,截面数据分析中我们可以仅仅报告异方差稳健标准差,一般软件都提供。
例子6-6 P164 运用EViews 报告异方差稳健估计。
打开OLS 估计结果,Estimate, options, 在LS&TSLS 中选择Heteroskedasticity consistent coefficient\white 异方差稳健标准差通常大于OLS 标准差。
STATA :reg y x1 x2, vce(robust) (一)异方差为已知的解释变量的某一函数形式时的加权最小二乘估计模型检验出存在异方差性,可用加权最小二乘法(Weighted Least Squares, WLS )进行估计。
如果直接用作为权数,则容易验证变换后模型的随机干扰项的方差等于1,也满足同方差性。
此时加权最小二乘法就是对如下加了权的模型采取OLS 法:指数函数,我们需要估计FWLS 估计量的性质例子6-7 :FWLS 若以指数函数求权函数fx OLS 回归后,log(resid^2) gene fx=exp(…….) 权数1/sqr(fx) 第五节:案例分析P172 1988 年美国18 个工业群体的研发注意:辅助回归仍是检验与解释变量可能的组合的显著性,因此,辅助回归方程中还可引入解释变量的更高次方。
计量经济学第五章异⽅差性第五章异⽅差性本章教学要求:根据类型,异⽅差性是违背古典假定情况下线性回归模型建⽴的另⼀问题。
通过本章的学习应达到,掌握异⽅差的基本概念包括经济学解释,异⽅差的出现对模型的不良影响,诊断异⽅差的⽅法和修正异⽅差的若⼲⽅法。
经过学习能够处理模型中出现的异⽅差问题。
第⼀节异⽅差性的概念⼀、⼆个例⼦例1,研究我国制造业利润函数,选取销售收⼊作为解释变量,数据为1998年的⾷品年制造业、饮料制造业等28个截⾯数据(即n=28)。
数据如下表,其中y表⽰制造业利润函数,x表⽰销售收⼊(单位为亿元)。
Y对X的散点图为从散点图可以看出,在线性的基础上,有的点分散幅度较⼩,有的点分散幅度较⼤。
因此,这种分散幅度的⼤⼩不⼀致,可以认为是由于销售收⼊的影响,使得制造业利润偏离均值的程度发⽣变化,⽽偏离均值的程度⼤⼩的不同,就是所谓的随机误差的⽅差存在变异,即异⽅差。
如果⾮线性,则属于哪类⾮线性,从图形所反映的特征看,并不明显。
下⾯给出制造业利润对销售收⼊的回归估计。
模型的书写格式为212.03350.1044(0.6165)(12.3666)0.8547,..56.9046,152.9322213.4639,146.4905Y Y X R S E F Y s =+=====通过变量的散点图、参数估计、残差图,可以看到模型中(随机误差)很有可能存在异⽅差性。
例2,改⾰开放以来,各地区的医疗机构都有了较快发展,不仅政府建⽴了⼀批医疗机构,还建⽴了不少民营医疗机构。
各地医疗机构的发展状况,除了其他因素外主要决定于对医疗服务的需求量,⽽医疗服务需求与⼈⼝数量有关。
为了给制定医疗机构的规划提供依据,分析⽐较医疗机构与⼈⼝数量的关系,建⽴卫⽣医疗机构数与⼈⼝数的回归模型。
根据四川省2000年21个地市州医疗机构数与⼈⼝数资料对模型估计的结果如下:i iX Y 3735.50548.563?+-= (291.5778) (0.644284) t =(-1.931062) (8.340265)785456.02=R 774146.02=R 56003.69=F式中Y 表⽰卫⽣医疗机构数(个),X 表⽰⼈⼝数量(万⼈)。
异方差性名词解释异方差性是指在数据集中出现的变量间存在不同变差差异的现象,并且这种差异存在于不同群体或者分类之间。
它是数据分析中常见的一种统计现象,主要表现为数据集中成员之间的变量有着显著的差异性。
异方差性一词主要指的是在不同群体中测量的样本变量之间的方差不相同,而在相同组中的变量的方差相同,因此这是在不同群体中可以有差异性的变量间差异。
异方差性是建立在统计假设及其检验基础上的,它的检验主要是检查两组(或多组)数据的方差差异,以证明两组(或多组)数据具有显著差异性。
而检验方法可以使用 F 检验或卡方检验,或其他统计检验技术。
异方差性在很多领域都得到了广泛的应用,可以说它是统计分析最重要的基础部分之一,在检验不同群体的差异性时,检验的重点往往便放在异方差性上。
例如在进行社会科学研究时,受某种区别考虑的不同群体间存在着差异,则需要使用异方差性检验,以监测不同群体之间差异的显著性。
同样,当分析多组实验数据时,使用异方差性去判断实验组间有无显著差异也是很重要的。
例如,在药学和医学研究中,药物或治疗疾病时,需要对实验组与对照组进行对比,此时可以使用一项工具来检验实验组和对照组的方差之间的差异,即异方差性检验。
异方差性也可以用于评估投资策略的有效性,当有多个独立的投资策略时,可以使用异方差性检验来判断这些策略的有效性。
如果它们之间差异可用,就可以说明这些策略之间是有益的。
总而言之,异方差性是一种重要的统计分析技术,它可以用来检测变量之间的差异性,在很多领域都有重要的应用,例如在社会科学研究和药物研究中检测两组(或多组)样本之间差异;在投资策略评估中评估多个策略的有效性。
因此,异方差性在变量方差分析中有着重要的意义。
几种异方差检验方法的比较上海师范大学商学院 龚秀芳摘 要:经典线性回归模型的一个重要假设就是回归方程的随机扰动项具有相同的方差,也称同方差性。
但在大多数经济现象中,回归方程的扰动项的方差随观察值的不同而变化,这种模型称为异方差模型。
如果对异方差模型进行OLS 估计,就会产生严重的后果,因此,选取适当的异方差的检验方法是极其重要的。
本文对帕克检验、格莱舍尔检验、戈德菲尔德-匡特检验作随机模拟,并对这几种方法略作比较。
关键词:异方差模型;异方差检验;随机模拟。
一、异方差模型经典线性回归模型可以表示为u x b x b x b b y k k +++++= 33221 (1-1) 假设有n 组观察值),,2,1(),,,,,(32n i x x x y ik i i i =,则(1-1)可表示为i ik k i i i u x b x b x b b y +++++= 33221 (1-2)在经典线性回归模型中,假设随机误差项u 是一个随机变量,且服从数学期望为零,方差为一常数的正态分布,即i u ~N (0,2u σ)。
这一假设称为随机误差项u 的同方差性假设。
另外还假设不同观察值的随机误差项之间是不相关的,而且随机误差项与x 项不趋于共同变化。
但在实际的经济问题中,上述假设不一定满足。
比如,当自变量x 变化较大时(如在一些横截面数据中),u 的方差可能随x 的变化而变化;而当i u 和1+i u 之间存在一定的顺序关系时(如在时间序列中),i u 可能与j u 并不独立(j ≠i )。
当同方差(homosce dasticity )或等方差(equal variance )性假定不满足,也就是说, 随机误差项i u 的方差不等于一个常数,即)常数()()(n i u E u Var i i i ,,2,122 =≠==σ (1-3) 则称随机误差项u 具有异方差(heteroscedasticity )或非同方差(unequal variance )性。
在模型(1-3)中,除随机误差项具有异方差性外,其它基本假设都能满足,则称这种模型为异方差的线性回归模型,简称异方差模型。
现在假定同方差性不满足,允许随机误差项方差随观察值而异,但其他假定不变。
此时,若仍用普通最小二乘法(Ordinary Least Squares , 简称OLS )处理这种异方差模型,可能会产生以下的后果:1、 参数的OLS 估计量不具有最小方差性2、 降低估计与预测的精度因此,有必要选取适当的异方差的检验方法对数据进行异方差检验。
二、随机模拟验证常用的检验异方差的方法有图示法、斯皮尔曼(Spearman )的秩相关系数检验法、帕克(Park )检验法、格莱舍尔(Glejser )检验法、戈德菲尔德-匡特(Goldfeld-Quandt )检验法等。
对于这些方法,如何根据实际情况选择最好的检验方法是值得研究的。
本节选用三种不同的异方差形式,用随机模拟方法产生异方差数据,然后再用帕克检验、格莱舍尔检验、G-Q 检验对这些异方差数据进行检验,以观察三种检验方法哪种更有效。
取自变量x 为x =[4.36 4.50 4.5 4.51 4.55 4.62 4.68 4.73 4.75 4.8 4.92 4.95 5.1 5.23 5.36 5.38 5.39 5.51 5.65 5.84 5.86 5.92 6.23 6.59 6.91 6.96 7.67 8.48 9.21 9.24 10.99]' 共有31个观察值。
另外,相对于每个x 有一因变量y 。
假设x 与y 之间的关系为如下模型: i i i u x y ++-=8.02.0 (2-1)其中,i u 是异方差的。
本小节讨论三种情形:),0(~i i x N u 、),0(~2i i x N u 和)ln ,0(~i i x N u 。
在每种情形下,分别用帕克检验、格莱舍尔检验、G-Q 检验作1000次的随机模拟。
模拟的方法如下:首先根据模型(2-1),利用正态随机函数产生具有异方差性的数据i y ,31,,2,1 =i ,然后对()i i y x ,利用最小二乘法计算出残差i e ,继而再利用各种检验方法检验数据中有无异方差性。
在显著性水平05.0=α时,如果在1000次的检验中,得出异方差结论的次数占总次数的比重较大,则说明此种检验方法较好。
1、 帕克检验(Park test )/*假定2ln i e 对i x ln 的回归模型为:[1]i i i x b b e γ++=ln ln 212 (2-2)对回归模型(2-2)作显著性检验。
检验的原假设为0H :02=b ,即认为(2-1)中的i u 是等方差性的;备择假设1H :02≠b ,即认为i u 是异方差性的。
检验统计量[2]2ˆ2b s bt = (2-3)其中,k =2,()∑∑∑-==2222ˆ2ˆ2iiib xn e x s s 。
当0H 成立时,)(~2k n t t -α。
如果)(2k n t t ->α,则拒绝原假设,认为2b 显著不为零,即认为原模型中存在异方差;若)(2k n t t -<α,则接受原假设,即认为2b 显著为零,即认为原模型中不存在异方差。
2、格莱舍尔检验(Glezser test )假定i hji i x e γδδ++=10 (2-4) 检验的原假设0H :01=δ,即认为不存在异方差;备择假设1H :01≠δ,即认为存在异方差。
当h 分别取1、1/2、 -1时,就有[3]i ji i x e γδδ++=10 (2-5)i ji i x e γδδ++=10 (2-6) i jii x e γδδ++=110 (2-7)对所选择的最优回归形式进行显著性检验。
如果回归方程显著成立,即01≠δ,则认为异方差性存在;否则再换作其它的回归形式进行检验。
3、戈德菲尔德-匡特检验(Glodfeld-Quandt test )戈德菲尔德-匡特检验,简称G-Q 检验,这种检验适用于大样本。
这种检验要求随机项iu 服从正态分布且i u 无序列相关。
检验的方法以F 检验为基础,它把随机样本分为三段,去掉中间一段。
假定低样本组的数据具有同方差性,高样本组的数据也具有同方差性,然后比较高样本组与低样本组的方差是否相同。
若方差相同,说明数据中不存在异方差;若方差不同,说明数据中存在异方差。
检验原假设0H :i u 是等方差性的;备择假设1H :i u 是异方差性的。
G-Q 检验的步骤为: (1)、把观察值按照解释变量x 的由小到大的顺序排列,对应的被解释变量及其原先与解释变量的对应关系不变。
(2)、略去c 个中心观察值,c 的大小约为样本容量n 的四分之一到三分之一,为了计算上的方便最好使n -c 为偶数。
(3)、把剩下n -c 个样本观察值划分为大小相等的两个样本,第一个样本包含的观察值相应于解释变量x 的较小部分,第二个子样本包含的观察值相应于解释变量x 的较大部分。
(4)、应用普通最小二乘法对每个子样本分别进行回归,并计算出相应的残差平方和1ESS 和2ESS 。
(5)、选择统计量[4] F =]2)2([]2)2([12k c n ESS k c n ESS ----=12ESS ESS (2-8)在0H 为真时,F 服从自由度为[2/)2(k c n --,2/)2(k c n --]的F 分布。
这里的k 为回归模型中参数的个数。
如果选定显著性水平α,那么可利用F 分布的临界值αF 进行显著性检验。
当αF F >时,拒绝原假设0H ,认为存在异方差性;当αF F <时,接受原假设0H ,认为i u 是等方差性的。
表1用随机模拟方法对模型(2-1)分别产生三类不同的异方差数据,并列出了各种异方差下各种检验方式下的检验结果。
表1 不同异方差下的几种检验方法的检验结果三、比较从以上的模拟结果看,当i b i i ax εσ=2或i i x ln 2=σ时,帕克检验的检验结果是令人满意的。
在上述三种情况下得出异方差结论的次数占总次数的比重都是100%。
但这并不表明此种方法是检验异方差的最好方法,因为这还要看帕克所建议的模型(2-2)中本身有没有异方差的存在。
在此例中,通过对模型(2-1)的残差图观察,模型中恰好不存在异方差,故结果比较满意。
因此,如果模型(2-1)是同方差性的,则帕克检验可以说是一种较好的检验异方差存在性的方法。
对于格莱舍尔检验,模型(2-6)、(2-7)的模拟结果都比较好。
因为,在第一种情况下,2i σ与i x 成正比,即i σ与i x 成正比,因此,模型(2-6)的模拟结果较好,而模型(2-5)的模拟结果不太理想。
至于模型(2-7),由于x 1可以在某点展开成有关x 的泰勒级数,所以,若2i σ是i x 的幂函数,模拟的结果也较好。
对于G-Q 检验,三种情况下检验数据中存在异方差的结果的百分比分别6%、17.6%和8%。
随机模拟结果都不好,甚至可以说是很差。
原因很显然,因为由异方差模型(2-1)产生的数据其高数值组的数据不具有同方差性,低数值组的数据也不具有同方差性,因而检验的前提条件就不满足。
因此,运用G-Q 检验时,必须注意高低数值组是否分别具有同方差性。
异方差的检验除了上述叙述的方法外,还有很多的方法。
如何根据实际情况选择最好的检验方法是值得研究的。
由以上叙述可知,异方差的检验没有一个固定的检验方法,它依赖于数据本身的特性,即要观察数据本身的特性来决定用哪一种检验方法。
本人认为可以先用图示法,即根据散点图或残差图来判断异方差是否存在,观察残差与各解释变量之间的大致关系,以确定异方差的形式。
然后,再根据此异方差的形式,寻求适当的检验方法。
例如,当i b i i ax εσ=2或i i x ln 2=σ时,可用帕克检验方法或格莱舍尔检验方法;当数据中高、低数值组的方差各自具有同方差性而又不等时,可用G-Q 检验方法。
当然,最优检验方法的选择不是固定的,George G.Jude[3]等人认为,最优检验方法的选择还依赖于人们对可能的异方差形式的先验认识。
参考资料:[1] R.E.Park .Estimation With Heteroscedastic Error Terms[J] .《Econometrica》,1966,V ol.34,No.4:P888[2] 刘余善唐五湘。
《经济计量学原理与方法》[M].北京理工大学出版社,1989年.P80-82[3] 姜诗章王锦功.《计量经济学教程》[M].吉林大学出版社,1989年.P135[4] 威廉H.格林.《经济计量分析》[M].上海科学技术出版社,1991年.P427。