异方差及其处理讲解
- 格式:ppt
- 大小:2.92 MB
- 文档页数:54
Stata面板数据回归分析中的异方差问题及解决方法面板数据回归分析是经济学领域常用的一种方法,它旨在研究一个或多个因变量如何受到一个或多个自变量的影响。
然而,在实际应用中,我们常常会遇到异方差问题,即误差项的方差并不相等,从而导致分析结果的不准确性。
本文将探讨Stata面板数据回归分析中的异方差问题,并提供解决方法。
1. 异方差问题的背景异方差问题在面板数据回归分析中很常见。
它的存在可能是由于不同个体之间的方差差异,也可能是由于时间序列上的方差差异。
无论是个体效应还是时间效应,异方差都会对回归结果的解释和统计推断产生不良影响。
2. 异方差问题的影响异方差问题会导致普通最小二乘法(Ordinary Least Squares, OLS)估计出现偏误和无效性。
当误差项方差呈现某种模式时,OLS估计量可能对某些变量的系数进行过度调整或忽略重要的影响。
这使得统计推断变得不可靠,造成错误的结论。
3. 异方差问题的检验在面板数据回归中,有多种方法可用于检验异方差问题,其中最常见的是Breusch-Pagan检验和White检验。
Breusch-Pagan检验基于残差平方与解释变量之间是否存在关系来判断异方差问题的存在。
White检验则基于残差平方与所有自变量值之间的关系来检验异方差。
如果检验的p值小于设定的显著水平(如0.05),则可以判断存在异方差问题。
4. 异方差问题的解决方法(1)异方差稳健标准误(Robust Standard Errors):该方法通过对OLS估计进行修正,使用异方差稳健标准误来替代传统的标准误。
这样可以降低估计的标准误,从而得到更准确的参数估计和显著性检验。
(2)异方差稳健回归(Robust Regression):除了使用异方差稳健标准误外,还可以使用异方差稳健回归来解决异方差问题。
异方差稳健回归可以通过加权最小二乘法来处理异方差,缓解异方差对估计的影响。
(3)固定效应模型(Fixed Effects Model)和随机效应模型(Random Effects Model):面板数据回归中,可以使用固定效应模型或随机效应模型来控制个体效应和时间效应。
实验四异方差性的检验及处理(2学时)一、实验目的(1)、掌握异方差检验的基本方法;(2)、掌握异方差的处理方法。
二、实验学时:2学时三、实验要求(1)掌握用MATLAB软件实现异方差的检验和处理;(2)掌握异方差的检验和处理的基本步骤。
四、实验原理1、异方差检验的常用方法(1) 用X-Y的散点图进行判断(2).22ˆ(,)(,)e x e y%%或的图形,),x)i iy%%i i((e或(e的图形)(3) 等级相关系数法(又称Spearman检验)是一种应用较广的方法,既可以用于大样本,也可与小样本。
检验的三个步骤①ˆt ty y=-%ie②|i x %%i i 将e 取绝对值,并把|e 和按递增或递减次序排序,计算Spearman 系数rs ,其中:21n i i d =∑s 26r =1-n(n -1)③ 做等级相关系数的显着性检验。
n>8时,/2(2),t t n α>-反之,若||i i e x %说明与之间存在系统关系,异方差问题存在。
(4) 帕克(Park)检验帕克检验常用的函数形式:若?在统计上是显着的,表明存在异方差性。
2、异方差性的处理方法: 加权最小二乘法如果在检验过程中已经知道:222()()()i i i ji u Var u E u f x σσ===则将原模型变形为:121i i p pi i y x x u βββ=+⋅+⋅+L 在该模型中: 即满足同方差性。
于是可以用OLS 估计其参数,得到关于参数12,,,p βββL 的无偏、有效估计量。
五、实验举例例1、某地区居民的可支配收入x(千元)与居民消费支出y(千元)的数据如下:01i i i y x u ββ=++若用线性模型,研究不同收入家庭的消费情况,试问原数据有无异方差性?如果存在异方差性,应如何处理?解:(一)编写程序如下:(1)等级相关系数法(详见test4_1.m 文件)%%%%%%%%%%%%%%% 用等级相关系数法来检验异方差性 %%%%%%%%[data,head]=xlsread('test4.xlsx');x=data(:,1); %提取第一列数据,即可支配收入xy=data(:,2); %提取第二列数据,即居民消费支出yplot(x,y,'k.'); % 画x和y的散点图xlabel('可支配收入x(千元)') % 对x轴加标签ylabel('居民消费支出y(千元)') % 对y轴加标签%%%%%%%% 调用regres函数进行一元线性回归 %%%%%%%%%%%%xdata=[ones(size(x,1),1),x]; %在x矩阵最左边加一列1,为线性回归做准备[b,bint,r,rint,s]=regress(y,xdata);yhat=xdata*b; %计算估计值y% 定义元胞数组,以元胞数组形式显示系数的估计值和估计值的95%置信区间head1={'系数的估计值','估计值的95%置信下限','估计值的95%置信上限'};[head1;num2cell([b,bint])]% 定义元胞数组,以元胞数组形式显示y的真实值,y的估计值,残差和残差的95%置信区间head2={'y的真实值','y的估计值','残差','残差的95%置信下限','残差的95%置信上限'};[head2;num2cell([y,yhat,r,rint])]% 定义元胞数组,以元胞数组形式显示判定系数,F统计量的观测值,检验的P值和误差方差的估计值head3={'判定系数','F统计量的观测值','检验的P值','误差方差的估计值'}; [head3;num2cell(s)]%%%%%%%%%%%%% 残差分析 %%%%%%%%%%%%%%%%%%figure;rcoplot(r,rint) % 按顺序画出各组观测值对应的残差和残差的置信区间%%% 画估计值yhat与残差r的散点图figure;plot(yhat,r,'k.') % 画散点图xlabel('估计值yhat') % 对x轴加标签ylabel('残差r') % 对y轴加标签%%%%%%%%%%%% 调用corr函数计算皮尔曼等级相关系数res=abs(r); % 对残差r取绝对值[rs,p]=corr(x,res,'type','spearman')disp('其中rs为皮尔曼等级相关系数,p为p值');(2)帕克(park)检验法(详见test4_2.m文件)%%%%%%%%%%%%%%% 用帕克(park)检验法来检验异方差性 %%%%%%%[data,head]=xlsread('test4.xlsx'); %导入数据x=data(:,1);y=data(:,2);%%%%%% 调用regstats函数进行一元线性回归,linear表带有常数项的线性模型,r表残差ST=regstats(y,x,'linear',{'yhat','r','standres'});scatter(x,(ST.r).^2) % 画x与残差平方的散点图xlabel('可支配收入(x)') % 对x轴加标签ylabel('残差的平方') %对y轴加标签%%%%%%% 对原数据x和残差平方r^2取对数,并对log(x)和log(r^2)进行一元线性回归ST1=regstats(log((ST.r).^2),log(x),'linear',{'r','beta','tstat','fstat'})ST1.tstat.beta % 输出参数的估计值ST1.tstat.pval % 输出回归系数t检验的P值ST1.fstat.pval % 输出回归模型显着性检验的P值(3)加权最小二乘法(详见test4_3.m文件)%%%%%%%%%%% 调用robustfit函数作稳健回归 %%%%%%%%%%%%[data,head]=xlsread('test4.xlsx'); % 导入数据x=data(:,1);y=data(:,2);% 调用robustfit函数作稳健回归,返回系数的估计值b和相关统计量stats[b,stats]=robustfit(x,y) %调用函数作稳健回归stats.p % 输出模型检验的P值%%% 绘制残差和权重的散点图 %%%%%%%plot(stats.resid,stats.w,'o') %绘制残差和权重的散点图xlabel('残差')ylabel('权重'(二)实验结果与分析:第一步::用OLS方法估计参数,并保留残差(1)散点图图4.1 可支配收入(x)居民消费支出(y)散点图因每个可支配收入x的值,都有5个居民消费收入y与之对应,所以上述散点图呈现此形状。
异方差的名词解释引言:在实际应用中,我们常常会遇到一种数据特征,即样本的方差不稳定的现象。
这种现象称为异方差,是统计分析中一个重要的概念。
本文将从定义、原因、影响以及如何处理异方差等方面进行探讨,以帮助读者更好地理解异方差的概念及其应用。
一、定义异方差(Heteroscedasticity)指的是在统计学中,方差并不是恒定的,而是与自变量的某些特征相关联。
换句话说,样本的方差会随着自变量的不同取值而发生变化。
二、原因异方差可能由多种因素引起。
常见的原因包括以下几个方面:1. 异常值:样本中存在极端值或异常值,使得方差的测量结果被拉大或压缩;2. 比例误差:不同自变量取值下,因变量的测量误差有一定的比例关系;3. 数据收集:数据收集过程中的误差,或者是相关变量的选择问题,可能导致异方差的出现。
三、影响异方差存在对统计分析结果产生不良影响的情况,对回归分析尤为关键。
以下是几个常见的影响:1. 回归系数估计值的不准确:异方差可能导致回归系数估计值的偏倚,进而影响模型的解释和预测能力;2. 统计检验结果的误导:异方差使得恰当的统计检验成为挑战,常见的问题是标准误估计的错误;3. 置信区间和预测区间的准确性下降:异方差可能导致对未来观测值进行预测时的不确定性增加。
四、处理方法针对异方差问题,有一些常用的方法可以帮助我们处理。
以下是几种常见的处理方法:1. 权重最小二乘法(Weighted Least Squares, WLS):根据异方差的特征,使用加权最小二乘法来估计回归系数。
即根据样本的方差-均值关系,为每个样本赋予相应的权重,从而平衡不同自变量值下对模型的贡献。
2. 魏布尔-克劳修斯检验(White-Huber test):该检验用于检验异方差的存在。
若检验结果表明存在异方差,则可以尝试使用WLS进行回归估计。
3. 变量转换(Variable Transformation):通过将特征变量进行线性或非线性的转换,以消除异方差的影响。
异方差的现实意义-概述说明以及解释1.引言1.1 概述概述异方差是指在统计学中,随机变量的方差在不同取值下发生变化的现象。
它是一种常见的统计数据特征,广泛存在于现实中的各种数据集中。
异方差的存在可能会导致统计分析结果的偏差和误判,因此对于异方差的理解和应对策略具有重要意义。
本文旨在探讨异方差的定义、特点以及其在现实中的影响和重要性。
首先,我们将介绍异方差的定义和特点,包括在不同取值下方差的变化趋势和原因。
然后,我们将探讨异方差在现实中的影响,包括统计分析结果的偏差、参数估计的不准确性等。
最后,我们将提出对异方差的认识与应对策略,以及强调异方差的重要性和现实意义。
通过对异方差的深入了解,我们可以更好地理解统计数据的特点,在分析和解释数据时更加准确和全面。
同时,对于异方差的应对策略的掌握,有助于改善统计模型的拟合效果,提高预测和决策的准确性。
因此,对于异方差的研究具有重要的理论和实际价值。
在接下来的部分中,我们将详细介绍异方差的定义和特点,并探讨其在现实中的影响和重要性。
同时,我们将提出对异方差的认识与应对策略,以期为读者提供指导和启示。
让我们一同进入这个有关异方差的探索之旅吧!1.2 文章结构文章结构部分的内容可以如下编写:文章结构部分旨在向读者介绍本篇长文的组织框架和内容安排。
通过清晰明了的文章结构,读者可以更好地理解整篇文章的逻辑顺序和主要论点。
本文的文章结构如下:第一部分是引言部分,通过对异方差的引入和分析,概述了整篇文章的背景和意义。
在概述中,我们将提供对异方差概念的简明扼要的描述,同时阐明本文的目的和意义。
第二部分是正文部分,主要分为两个小节。
首先,我们将在2.1小节详细介绍异方差的定义和特点。
这一小节将对异方差的背景和相关概念进行深入探讨,并分析其特点和表现形式。
其次,在2.2小节中,我们将重点探讨异方差的现实影响。
通过具体的案例研究和数据分析,我们将展示异方差对实证研究和数据分析的影响,并探讨其可能带来的结果偏差和误判。
(完整版)异⽅差性的white检验及处理⽅法实验⼆异⽅差模型的white检验与处理【实验⽬的】掌握异⽅差性的white检验及处理⽅法【实验原理】1. 定性分析异⽅差(1) 经济变量规模差别很⼤时容易出现异⽅差。
如个⼈收⼊与⽀出关系,投⼊与产出关系。
(2) 利⽤散点图做初步判断。
(3) 利⽤残差图做初步判断。
2、异⽅差表现与来源异⽅差通常有三种表现形式(1)递增型(2)递减型(3)条件⾃回归型。
3、White检验(1)不需要对观测值排序,也不依赖于随机误差项服从正态分布,它是通过⼀个辅助回归式构造χ2 统计量进⾏异⽅差检验。
White检验的零假设和备择假设是H0: (4-1)式中的ut不存在异⽅差,H1: (4-2)式中的ut存在异⽅差。
(2)在不存在异⽅差假设条件下,统计量T R 2 ~χ2(5) 其中T表⽰样本容量,R2是辅助回归式(4-3)的OLS估计式的可决系数。
⾃由度5表⽰辅助回归式(4-3)中解释变量项数(注意,不计算常数项)。
T R 2属于LM统计量。
(3)判别规则是若T R 2 ≤χ2α (5), 接受H0(ut 具有同⽅差)若T R 2 > χ2α (5), 拒绝H0(ut 具有异⽅差)【实验软件】Eview6【实验要求】熟练掌握异⽅差white检验⽅法【实验内容】建⽴并检验我国部分城市国民收⼊y和对外直接投资FDI异⽅差模型【实验⽅案设计】下表列出了我国部分城市国民收⼊y和对外直接投资FDI的统计资料,并利⽤统计软件Eviews建⽴异⽅差模型。
地区Y FDI北京32061219126天津26532153473河北1051396405⼭西743521361内蒙古89758854辽宁14258282410吉林933819059⿊龙江1161532180上海46718546849江苏168091056365浙江20147498055安徽645536720福建14979259903江西6678161202⼭东136********河南757053903湖北9011156886湖南7554101835⼴东17213782294⼴西596941856海南831642125重庆720926083四川641841231贵州36034521云南56628384陕西648033190⽢肃50222342青海72772522宁夏66911743新疆97001534【实验过程】1、启动Eviews6软件,建⽴新的workfile.在主菜单中选择【File】--【New】--【Workfile】,弹出Workfile Create对话框,在Workfile structure typ中选择unstructured/undted.然后在observations中输⼊30.在WF中输⼊Work1,点击OK按钮。
异方差知识点总结异方差的存在可能会导致回归模型下列问题:1. 预测的不确定性增加:当异方差存在时,回归模型的预测区间可能会变得更宽,因为方差的不稳定性会使得预测更加不确定。
2. 参数估计的失真:在存在异方差的情况下,最小二乘法(OLS)回归的方法可能会导致参数估计的偏误。
3. 统计推断的失真:在存在异方差时,通常使用的标准误差可能被低估或高估,从而影响统计推断的结果。
因此,我们有必要了解异方差的特征、检验方法和处理方法。
本文将从以下几个方面对异方差进行总结。
一、异方差的特征和识别方法二、检验异方差的统计方法三、处理异方差的方法一、异方差的特征和识别方法1. 异方差的特征异方差的特征主要包括两个方面:方差的不稳定性和误差项的相关性。
首先是方差的不稳定性,即随着自变量的变化,因变量的方差也会跟着变化。
这种不稳定性可能出现在回归模型的残差中,表现为残差的离散程度随着自变量的变化而变化。
其次是误差项的相关性,即自变量与误差项之间存在相关性。
这种相关性可能是由于遗漏变量、测量误差或其他未知因素导致的,而这种相关性可能会影响到回归模型的假设前提,从而影响到参数的估计和统计推断的结果。
2. 异方差的识别方法在实际应用中,我们可以通过以下几种方法来识别是否存在异方差:(1)绘制残差图:同时绘制残差与预测值的散点图和残差与自变量的散点图,观察残差的离散程度是否与自变量相关。
(2)利用统计检验:利用统计学中的异方差检验方法,如BP检验、White检验等。
(3)利用经验判断:在经验分析中,我们也可以通过观察实际数据的特征,来判断是否存在异方差。
比如,如果数据中存在明显的带状结构或呈现出明显的异方差现象,那么可能存在异方差问题。
二、检验异方差的统计方法1. BP检验BP检验是一种常用的异方差检验方法,它的原假设是误差的方差是恒定的,备择假设是误差的方差是非恒定的。
BP检验的具体步骤为:(1)先对相关变量进行回归分析,得到残差eˆ2;(2)在残差的平方的基础上,增加自变量的平方和自变量与自变量的乘积,得到新的残差变量;(3)利用新的残差变量进行正态性检验,判断残差是否服从正态分布;(4)最后,利用新的残差变量进行F检验,检验自变量的平方及其交叉项是否显著。
什么是异方差性如何进行异方差性的检验与处理异方差性,它是统计学中一种常见的现象,指的是观测值的方差在不同的条件下不相等。
在数据分析和建模过程中,异方差性可能会导致模型参数估计不准确,假设检验无效以及预测效果下降等问题。
因此,了解异方差性并进行检验和处理是非常重要的。
1. 异方差性的表征异方差性通常表现为残差的方差与预测值的关系不稳定。
在回归分析中,当残差的方差与预测值的关系呈现出一定的模式时,可以初步判断存在异方差性。
常见的异方差性模式有以下几种:(1)线性模式:残差的方差与预测值呈线性关系,即残差的方差随着预测值的增大而增大或减小。
(2)指数模式:残差的方差与预测值呈指数关系,即残差的方差随着预测值的增大呈指数级别增大或减小。
(3)对数模式:残差的方差与预测值呈对数关系,即残差的方差随着预测值的增大呈对数级别增大或减小。
(4)多重峰值模式:残差的方差具有多个峰值,表示不同分组或条件之间存在不同的方差水平。
2. 异方差性的检验针对上述异方差性模式,可以进行一些统计检验来验证异方差性的存在。
常用的异方差性检验方法包括帕金森-斯皮尔曼检验(Park test)、布劳什-帕甘检验(Breusch-Pagan test)和韦斯特曼检验(White test)等。
这些检验方法都是基于残差的方差与预测值之间的关系建立的。
以布劳什-帕甘检验为例,该检验的原假设是残差的方差与预测变量之间不存在显著相关关系,即不存在异方差性。
在进行检验时,首先需要对模型进行拟合,并获得残差。
然后,根据拟合残差和预测变量的关系构建辅助回归模型,并进行显著性检验。
如果辅助回归模型的显著性检验结果小于设定的显著性水平(通常为0.05),则可以拒绝原假设,认为存在异方差性。
3. 异方差性的处理在实际数据分析中,如果检验结果表明存在异方差性,需要对数据进行处理以减小或消除其影响。
常用的异方差性处理方法包括以下几种:(1)对数或平方根变换:通过对原始数据进行对数或平方根变换,可以降低数据的异方差性。
实验四异方差性的检验及处理〔2学时〕一、实验目的〔1〕、掌握异方差检验的基本方法; 〔2〕、掌握异方差的处理方法.二、实验学时:2学时 三、实验要求〔1〕掌握用MATLAB 软件实现异方差的检验和处理; 〔2〕掌握异方差的检验和处理的基本步骤.四、实验原理1、异方差检验的常用方法<1> 用X-Y 的散点图进行判断<2>.22ˆ(,)(,)e x e y 或的图形,),x )i i y i i ((e 或(e 的图形)<3> 等级相关系数法〔又称Spearman 检验〕是一种应用较广的方法,既可以用于大样本,也可与小样本. 检验的三个步骤 ①ˆt t y y=-i e②|i x i i 将e 取绝对值,并把|e 和按递增或递减次序排序,计算Spearman 系数rs ,其中:21ni i d =∑s 26r =1-n(n -1)③做等级相关系数的显著性检验.n>8时,/2(2),t t n α>-反之,若||i i e x 说明与之间存在系统关系,异方差问题存在.<4> 帕克<Park>检验帕克检验常用的函数形式:若α在统计上是显著的,表明存在异方差性. 2、异方差性的处理方法: 加权最小二乘法 如果在检验过程中已经知道:222()()()i i i ji u Var u E u f x σσ===则将原模型变形为:1211(i i p pi iy x x u f x βββ=+⋅++⋅+在该模型中:即满足同方差性.于是可以用OLS 估计其参数,得到关于参数12,,,pβββ的无偏、有效估计量.五、实验举例例101i i i ,研究不同收入家庭的消费情况,试问原数据有无异方差性?如果存在异方差性,应如何处理?解:〔一〕编写程序如下:〔1〕等级相关系数法〔详见test4_1.m 文件〕%%%%%%%%%%%%%%% 用等级相关系数法来检验异方差性%%%%%%%% [data,head]=xlsread<'test4.xlsx'>; x=data<:,1>; %提取第一列数据,即可支配收入x y=data<:,2>; %提取第二列数据,即居民消费支出y plot<x,y,'k.'>; % 画x 和y 的散点图xlabel<'可支配收入x 〔千元〕'> % 对x 轴加标签 ylabel<'居民消费支出y<千元>'> % 对y 轴加标签%%%%%%%% 调用regres 函数进行一元线性回归 %%%%%%%%%%%%xdata=[ones<size<x,1>,1>,x]; %在x 矩阵最左边加一列1,为线性回归做准备 [b,bint,r,rint,s]=regress<y,xdata>; yhat=xdata*b; %计算估计值y% 定义元胞数组,以元胞数组形式显示系数的估计值和估计值的95%置信区间 head1={'系数的估计值','估计值的95%置信下限','估计值的95%置信上限'}; [head1;num2cell<[b,bint]>]% 定义元胞数组,以元胞数组形式显示y 的真实值,y 的估计值,残差和残差的95%置信区间 head2={'y 的真实值','y 的估计值','残差','残差的95%置信下限','残差的95%置信上限'};[head2;num2cell<[y,yhat,r,rint]>]% 定义元胞数组,以元胞数组形式显示判定系数,F统计量的观测值,检验的P值和误差方差的估计值head3={'判定系数','F统计量的观测值','检验的P值','误差方差的估计值'};[head3;num2cell<s>]%%%%%%%%%%%%% 残差分析 %%%%%%%%%%%%%%%%%%figure;rcoplot<r,rint> % 按顺序画出各组观测值对应的残差和残差的置信区间%%% 画估计值yhat与残差r的散点图figure;plot<yhat,r,'k.'> % 画散点图xlabel<'估计值yhat'> % 对x轴加标签ylabel<'残差r'> % 对y轴加标签%%%%%%%%%%%%调用corr函数计算皮尔曼等级相关系数res=abs<r>; % 对残差r取绝对值[rs,p]=corr<x,res,'type','spearman'>disp<'其中rs为皮尔曼等级相关系数,p为p值'>;〔2〕帕克〔park〕检验法〔详见test4_2.m文件〕%%%%%%%%%%%%%%% 用帕克〔park〕检验法来检验异方差性%%%%%%%[data,head]=xlsread<'test4.xlsx'>; %导入数据x=data<:,1>;y=data<:,2>;%%%%%% 调用regstats函数进行一元线性回归,linear表带有常数项的线性模型,r表残差ST=regstats<y,x,'linear',{'yhat','r','standres'}>;scatter<x,<ST.r>.^2> % 画x与残差平方的散点图xlabel<'可支配收入<x>'> % 对x轴加标签ylabel<'残差的平方'> %对y轴加标签%%%%%%% 对原数据x和残差平方r^2取对数,并对log<x>和log〔r^2〕进行一元线性回归ST1=regstats<log<<ST.r>.^2>,log<x>,'linear',{'r','beta','tstat','fsta t'}>% 输出参数的估计值% 输出回归系数t检验的P值% 输出回归模型显著性检验的P值<3>加权最小二乘法〔详见test4_3.m文件〕%%%%%%%%%%% 调用robustfit函数作稳健回归 %%%%%%%%%%%%[data,head]=xlsread<'test4.xlsx'>; % 导入数据x=data<:,1>;y=data<:,2>;% 调用robustfit函数作稳健回归,返回系数的估计值b和相关统计量stats[b,stats]=robustfit<x,y> %调用函数作稳健回归stats.p% 输出模型检验的P值%%% 绘制残差和权重的散点图%%%%%%%plot<stats.resid,stats.w,'o'> %绘制残差和权重的散点图xlabel<'残差'>ylabel<'权重'〔二〕实验结果与分析:第一步::用OLS方法估计参数,并保留残差〔1〕散点图图4.1 可支配收入〔x〕居民消费支出〔y〕散点图因每个可支配收入x的值,都有5个居民消费收入y与之对应,所以上述散点图呈现此形状.〔2〕回归模型参数估计值与显著性检验表1'系数的估计值' '估计值的95%置信下限' '估计值的95%置信上限'[ -0.5390] [ -3.7241] [ 2.6460][ 0.8091] [ 0.6768] [ 0.9415]'判定系数' 'F统计量的观测值' '检验的P值' '误差方差的估计值'[ 0.8485] [ 156.8387] [5.4040e-13] [ 9.1316]由输出结果看,常数项和回归系数的估计值分别为-0.539和0.8091,从而可以写出线性回归方程为^=−0.539+0.8091∗xy回归系数的估计值的95%置信区间为[0.6768,0.9415].对回归直线进行显著性检验,原假设和对立假设分别为H0:β1=0 H1:β1≠0检验的P值为5.4040×10−13<0.01,可知在显著性水平α=0.01下应拒绝原假设H0,可认为y〔居民消费收入〕与x〔可支配收入〕的线性关系是显著的.〔3〕方差分析图4.2原始数据对应残差图从残差图可以看到有2条线段〔红色虚线〕与水平线y=0没有交点,它对应的观测号为22和29,也就是说这两组观测对应的残差的置信区间不包含0点,可认为这两组观测数据为异常数据.它们分别是〔30,16.7〕,〔35,20〕.第二步:异方差性检验〔1〕图示法图4.3<2> 等级相关系数法在y与x 的OLS 回归的基础上计算出残差的绝对值,并记为res,并计算出皮尔曼等级相关系数rs=0.4860与对应的p值为0.0065<0.05〔*〕,说明残差r与x 存在系统关系,即存在异方差问题.〔3〕帕克<Park>检验法1〕散点图图4.4可支配收入与残差平方的散点图从图4.4可知,可考虑拟合指数曲线.现将其取对数,即可进行一元线性拟合.2〕回归系数与模型检验做ln<r^2>对ln<x>回归,得到表2β0=-8.49730.02950.0207β1=2.96790.0207从上表可以看出,得到的回归模型为ln (r 2)=−8.4973+2.9679∗ln (x),常数项和线性项的t 检验的P 值均小于0.05,说明回归方程中常数项和线性项均是显著的.并且,检验的P 值为0.0207小于0.05,说明整个回归方程是显著的,表明存在异方差性.综上所述,通过以上3种方法的检验,我们得到原数据存在异方差性.第三步:用加权最小二乘法处理异方差性表3‘回归系数’回归系数t 检验的P 值β0=-1.6091 0.2375β1=0.8870 0.0000由表3得:回归方程为 y ^=−1.6091+0.887x ,由p 值可知x 的回归系数是显著的,常数项未显著,说明其无实际意义.图4.5 残差和权重的散点图由图4.5知:权重集中在最上方的1附近的点比较多,说明稳健性比较好.六、实验内容01i i i FDI u ββ=++若用线性模型GDP ,研究不同地区FDI 和GDP 的关系,试问原数据有无异方差性?如果存在异方差性,应如何处理?七、思考练习现用线性模型01i i i y x u ββ=++ ,研究不同收入水平家庭的消费情况,试问原数据有无异方差性?如果存在异方差性,应如何处理?八、参考文献[1].李宝仁.计量经济学[M].机械工业出版社,2007.12 [2].何晓群. 应用回归分析[M].中国人民大学出版,2002.9。