实验四异方差性的检验与处理
- 格式:docx
- 大小:46.65 KB
- 文档页数:14
实验四异方差性的检验与处理集团标准化工作小组 [Q8QX9QT-X8QQB8Q8-NQ8QJ8-M8QMN]实验四 异方差性的检验及处理(2学时)一、实验目的(1)、掌握异方差检验的基本方法; (2)、掌握异方差的处理方法。
二、实验学时:2学时 三、实验要求(1)掌握用MATLAB 软件实现异方差的检验和处理; (2)掌握异方差的检验和处理的基本步骤。
四、实验原理1、异方差检验的常用方法(1) 用X-Y 的散点图进行判断(2). 22ˆ(,)(,)e x e y 或的图形 ,),x )i i y i i ((e 或(e 的图形)(3) 等级相关系数法(又称Spearman 检验)是一种应用较广的方法,既可以用于大样本,也可与小样本。
检验的三个步骤 ① ˆt t y y=-i e②|i x i i 将e 取绝对值,并把|e 和按递增或递减次序排序,计算Spearman 系数rs ,其中:21ni i d =∑s 26r =1-n(n -1)③ 做等级相关系数的显着性检验。
n>8时,/2(2),t t n α>-反之,若||i i e x 说明与之间存在系统关系,异方差问题存在。
(4) 帕克(Park)检验帕克检验常用的函数形式:若在统计上是显着的,表明存在异方差性。
2、异方差性的处理方法: 加权最小二乘法 如果在检验过程中已经知道:222()()()i i i ji u Var u E u f x σσ===则将原模型变形为:121(i i p pi iy x x uf xβββ=+⋅++⋅+在该模型中:即满足同方差性。
于是可以用OLS估计其参数,得到关于参数12,,,pβββ的无偏、有效估计量。
五、实验举例例101i i iy x u=++若用线性模型,研究不同收入家庭的消费情况,试问原数据有无异方差性如果存在异方差性,应如何处理解:(一)编写程序如下:(1)等级相关系数法(详见文件)%%%%%%%%%%%%%%% 用等级相关系数法来检验异方差性 %%%%%%%%[data,head]=xlsread('');x=data(:,1); %提取第一列数据,即可支配收入xy=data(:,2); %提取第二列数据,即居民消费支出yplot(x,y,'k.'); % 画x和y的散点图xlabel('可支配收入x(千元)') % 对x轴加标签ylabel('居民消费支出y(千元)') % 对y轴加标签%%%%%%%% 调用regres函数进行一元线性回归 %%%%%%%%%%%%xdata=[ones(size(x,1),1),x]; %在x矩阵最左边加一列1,为线性回归做准备[b,bint,r,rint,s]=regress(y,xdata);yhat=xdata*b; %计算估计值y% 定义元胞数组,以元胞数组形式显示系数的估计值和估计值的95%置信区间head1={'系数的估计值','估计值的95%置信下限','估计值的95%置信上限'};[head1;num2cell([b,bint])]% 定义元胞数组,以元胞数组形式显示y的真实值,y的估计值,残差和残差的95%置信区间head2={'y的真实值','y的估计值','残差','残差的95%置信下限','残差的95%置信上限'};[head2;num2cell([y,yhat,r,rint])]% 定义元胞数组,以元胞数组形式显示判定系数,F统计量的观测值,检验的P值和误差方差的估计值head3={'判定系数','F统计量的观测值','检验的P值','误差方差的估计值'};[head3;num2cell(s)]%%%%%%%%%%%%% 残差分析 %%%%%%%%%%%%%%%%%%figure;rcoplot(r,rint) % 按顺序画出各组观测值对应的残差和残差的置信区间%%% 画估计值yhat与残差r的散点图figure;plot(yhat,r,'k.') % 画散点图xlabel('估计值yhat') % 对x轴加标签ylabel('残差r') % 对y轴加标签%%%%%%%%%%%% 调用corr函数计算皮尔曼等级相关系数res=abs(r); % 对残差r取绝对值[rs,p]=corr(x,res,'type','spearman')disp('其中rs为皮尔曼等级相关系数,p为p值');(2)帕克(park)检验法(详见文件)%%%%%%%%%%%%%%% 用帕克(park)检验法来检验异方差性 %%%%%%%[data,head]=xlsread(''); %导入数据x=data(:,1);y=data(:,2);%%%%%% 调用regstats函数进行一元线性回归,linear表带有常数项的线性模型,r表残差ST=regstats(y,x,'linear',{'yhat','r','standres'});scatter(x,.^2) % 画x与残差平方的散点图xlabel('可支配收入(x)') % 对x轴加标签ylabel('残差的平方') %对y轴加标签%%%%%%% 对原数据x和残差平方r^2取对数,并对log(x)和log(r^2)进行一元线性回归ST1=regstats(log(.^2),log(x),'linear',{'r','beta','tstat','fstat'})% 输出参数的估计值% 输出回归系数t检验的P值% 输出回归模型显着性检验的P值(3)加权最小二乘法(详见文件)%%%%%%%%%%% 调用robustfit函数作稳健回归 %%%%%%%%%%%%[data,head]=xlsread(''); % 导入数据x=data(:,1);y=data(:,2);% 调用robustfit函数作稳健回归,返回系数的估计值b和相关统计量stats[b,stats]=robustfit(x,y) %调用函数作稳健回归% 输出模型检验的P值%%% 绘制残差和权重的散点图 %%%%%%%plot,,'o') %绘制残差和权重的散点图xlabel('残差')ylabel('权重'(二)实验结果与分析:第一步::用OLS方法估计参数,并保留残差(1)散点图图可支配收入(x)居民消费支出(y)散点图因每个可支配收入x的值,都有5个居民消费收入y与之对应,所以上述散点图呈现此形状。
第1篇一、实验目的1. 掌握异方差性的基本概念和检验方法。
2. 学会运用统计软件进行异方差的检验和修正。
3. 提高对计量经济学模型中异方差性处理能力的实践应用。
二、实验原理1. 异方差性:在回归分析中,若回归模型的误差项(残差)的方差随着自变量或因变量的取值而变化,则称模型存在异方差性。
2. 异方差性的检验方法:图形检验、统计检验(如F检验、Breusch-Pagan检验、White检验等)。
3. 异方差性的修正方法:加权最小二乘法(WLS)、广义最小二乘法(GLS)等。
三、实验步骤1. 数据准备1. 收集实验所需数据,确保数据质量和完整性。
2. 对数据进行初步处理,如剔除异常值、缺失值等。
2. 模型设定1. 根据研究问题,选择合适的回归模型。
2. 利用统计软件(如Eviews、Stata等)进行初步的回归分析。
3. 异方差性检验1. 图形检验:绘制散点图,观察残差与自变量或因变量的关系,初步判断是否存在异方差性。
2. 统计检验:- F检验:检验回归系数的显著性。
- Breusch-Pagan检验:检验残差平方和与自变量或因变量的关系。
- White检验:检验残差平方和与自变量或因变量的多项式关系。
4. 异方差性修正1. 若检验结果表明存在异方差性,则需对模型进行修正。
2. 选择合适的修正方法:- 加权最小二乘法(WLS):根据残差平方与自变量或因变量的关系,计算权重,加权最小二乘法进行回归分析。
- 广义最小二乘法(GLS):根据残差平方与自变量或因变量的关系,选择合适的方差结构,广义最小二乘法进行回归分析。
5. 结果分析1. 对修正后的模型进行回归分析,观察回归系数的显著性、拟合优度等指标。
2. 对实验结果进行分析,解释实验现象,验证研究假设。
6. 实验报告撰写1. 撰写实验报告,包括以下内容:- 实验目的- 实验原理- 实验步骤- 实验结果- 分析与讨论- 结论2. 实验报告应结构清晰、逻辑严谨、语言简洁。
异方差性的检验和补救一、研究目的和要求表1列出了1998年我国主要制造工业销售收入与销售利润的统计资料,请利用统计软件Eviews建立我国制造业利润函数模型,检验其是否存在异方差,并加以补救。
表1 我国制造工业1998年销售利润与销售收入情况二、参数估计EVIEWS 软件估计参数结果如下Dependent Variable: Y Method: Least Squares Date: 06/01/16 Time: 20:16 Sample: 1 28Included observations: 28Variable Coefficient Std. Error t-Statistic Prob. C 12.03349 19.51809 0.616530 0.5429 X0.1043940.008442 12.366580.0000R-squared 0.854694 Mean dependent var 213.4639 Adjusted R-squared 0.849105 S.D. dependent var 146.4905 S.E. of regression 56.90455 Akaike info criterion 10.98938 Sum squared resid 84191.34 Schwarz criterion 11.08453 Log likelihood -151.8513 Hannan-Quinn criter. 11.01847 F-statistic 152.9322 Durbin-Watson stat 1.212781 Prob(F-statistic)0.000000用规范的形式将参数估计和检验结果写下2ˆ12.033490.104394(19.51809)(0.008442) =(0.616530) (12.36658)0.854694152.9322iY X t R F =+ = =三、 检验模型的异方差(一) 图形法 1. 相关关系图X YX Y 相关关系图2. 残差图形生成残差平方序列22e resid ,做2e 与解释变量 X 的散点图如下。
实验报告三实验名称:异方差性与自相关性的检验与处理一、实验预习报告内容(一)实验目的与任务实验目的:掌握异方差性与自相关性的检验方法与处理方法;实验任务:建立并估计我国北方地区农业产出线性模型;建立合适的北京市城镇居民家庭简单消费函数。
(二)实验内容及要求1、异方差性的检验与处理方法(1)异方差性的图形法检验、Goldfeld-Quandt检验法;White检验法;(2)使用加权最小二乘法(WLS)对异方差性进行修正;2、自相关性的检验与处理方法(1)自相关性的图形法检验;杜宾-沃特森(D-W)检验(2)利用广义差分法、科克伦-奥克特(Cochrane-Orcutt)迭代法对自相关性进行修正;(三)实验设备与数据(1)计算机与Eviews3.1软件包(2)使用数据:异方差性实验数据:(见表3.1)自相关性实验数据:(见表3.2)二、实验操作原始数据任务一:表3.1给出的是1998年我国中药制造业销售收入与销售利润数据,试完成:(1)求销售收入与销售利润的样本回归函数,并对模型进行经济意义检验和统计检验;(2)分别用图形法、White检验法检验模型是否存在异方差;(3)如果模型存在异方差,选用一定方法对异方差进行修正。
任务二:表3.2是北京市城镇居民家庭人均收入与消费支出数据。
试完成:(1)运用OLS方法建立该市城镇居民家庭的消费函数。
(2)选用适当的方法检验是否存在序列相关(自相关)问题。
(3)如果存在自相关,选用适当估计方法加以修正。
表3.2 北京市城镇居民家庭人均收入和消费支出数据来源:各年《中国统计年鉴》三、实验报告内容(参见课程上机指导文件(PDF格式))(一)实验的主要步骤,内容及其结果分析异方差性检验和处理设原假设H0:模型中不存在异方差;备择假设H1:模型中存在异方差1.样本回归在Eviews软件中对序列X和序列Y进行操作,得到X和Y的简单散点图如下,可以看出X与Y是带有截距的近似线性关系。
西安财经学院本科实验报告学院(部)统计学院实验室313课程名称计量经济学学生姓名学号1204100213专业统计学教务处制2014年12 月15 日《异方差》实验报告五、实验过程原始记录(数据、图表、计算等) 一.选择数据1.建立工作文件并录入数据File\New\workfile, 弹出Workfile create 对话框中选择数据类型.Object\new object\group,按向上的方向键,出现两个obs 后输入数据.中国内地2006年各地区农村居民家庭人均纯收入与消费支出 单位:元城市 y x1 x2 城市 y x1 x2 北京 5724。
5 958.3 7317。
2 湖北 2732。
5 1934。
6 1484。
8 天津 3341。
1 1738.9 4489 湖南 3013。
3 1342.6 2047 河北 2495。
3 1607。
1 2194。
7 广东 3886 1313。
9 3765.9 山西 2253.3 1188。
2 1992.7 广西 2413。
9 1596。
9 1173。
6 内蒙古 2772 2560.8 781.1 海南 2232。
2 2213。
2 1042.3 辽宁 3066。
9 2026。
1 2064。
3 重庆 2205。
2 1234.1 1639。
7 吉林 2700.7 2623。
2 1017。
9 四川 2395 1405 1597.4 黑龙江 2618。
2 2622.9 929.5 贵州 1627。
1 961。
4 1023。
2 上海 8006 532 8606.7 云南 2195.6 1570。
3 680。
2 江苏 4135.2 1497。
9 4315.3 西藏 2002。
2 1399.1 1035.9 浙江 6057。
2 1403.1 5931。
7 陕西 2181 1070。
4 1189。
8 安徽 2420。
9 1472。
8 1496。
3 甘肃 1855.5 1167。
第1篇一、实验目的本实验旨在通过实际操作,验证计量经济学中异方差性的存在,并掌握相应的检验和修正方法。
通过实验,加深对异方差性概念的理解,提高在实际应用中识别和处理异方差问题的能力。
二、实验内容1. 数据来源与处理- 数据来源:本实验使用某地区某年度的居民消费支出数据,包括居民可支配收入和消费性支出两个变量。
- 数据处理:将原始数据进行整理,剔除异常值,并对数据进行对数化处理,以降低异方差性的影响。
2. 模型设定与估计- 模型设定:根据理论分析,设定居民消费支出与可支配收入之间的线性关系模型为:\[ Y = \beta_0 + \beta_1X + \epsilon \]其中,\( Y \) 为居民消费支出,\( X \) 为可支配收入,\( \beta_0 \)和 \( \beta_1 \) 为模型参数,\( \epsilon \) 为随机误差项。
- 模型估计:采用最小二乘法(OLS)对模型进行估计,得到模型参数的估计值。
3. 异方差性检验- 检验方法:采用以下方法检验模型是否存在异方差性:- 观察法:观察残差图,若残差图呈现出明显的曲线关系,则可能存在异方差性。
- Goldfeld-Quandt 检验:通过分组检验残差平方与解释变量之间的关系,判断是否存在异方差性。
- White 检验:采用 White 检验对模型进行异方差性检验,得到统计量值和p 值。
- 检验结果:根据检验结果,判断模型是否存在异方差性。
4. 异方差性修正- 修正方法:若检验结果表明模型存在异方差性,则采用以下方法进行修正:- 加权最小二乘法(WLS):对模型进行加权最小二乘法估计,以降低异方差性的影响。
- 拉格朗日乘数法(LM):采用 LM 检验对模型进行修正,得到修正后的模型参数估计值。
- 修正结果:根据修正结果,比较修正前后模型参数估计值的变化,并分析修正效果。
三、实验结果与分析1. 模型估计结果- 根据最小二乘法估计,得到模型参数的估计值如下:\[ \beta_0 = 1000, \beta_1 = 0.5 \]- 模型拟合优度为 0.8,说明模型对数据的拟合程度较好。
经济计量分析实验报告一、实验项目异方差的检验及修正二、实验日期2015.12.06三、实验目的对于国内旅游总花费的有关影响因素建立多元线性回归模型,对变量进行多重共线性的检验及修正后,进行异方差的检验和补救。
四、实验内容建立模型,对模型进行参数估计,对样本回归函数进行统计检验,以判定估计的可靠程度,包括拟合优度检验、方程总体线性的显著性检验、变量的显著性检验,以及参数的置信区间估计。
检验变量是否具有多重共线性并修正。
检验是否存在异方差并补救。
五、实验步骤1、建立模型。
以国内旅游总花费Y 作为被解释变量,以年底总人口表示人口增长水平,以旅行社数量表示旅行社的发展情况,以城市公共交通运营数表示城市公共交通运行状况,以城乡居民储蓄存款年末增加值表示城乡居民储蓄存款增长水平。
2、模型设定为:t t t t t μβββββ+X +X +X +X +=Y 443322110t 其中:t Y — 国内旅游总花费(亿元) t 1X — 年底总人口(万人) t 2X — 旅行社数量(个) t 3X — 城市公共交通运营数(辆)t 4X — 城乡居民储蓄存款年末增加值(亿元)3、对模型进行多重共线性检验。
4、检验异方差是否存在。
六、实验结果(一)、消除多重共线性之后的模型多元线性回归模型估计结果如下:4321000779.0053329.0151924.0720076.0-99.81113ˆX +X +X +X =Y i SE=(26581.73) (0.230790) (0.108223) (0.013834) (0.020502) t =(3.051494) (-3.120046) (1.403805) ( 3.854988) (0.038020)R2=0.969693R2=0.957571F=79.98987(1)拟合优度检验:可决系数R 2=0.969693较高,修正的可决系数R 2=0.957571也较高,表明模型拟合较好。
Z N UE L异方差性的检验方法和修正一、 实验目的熟练掌握异方差性的检验方法和修正处理方法二、实验原理异方差(heteroskedasiticity )是计量经济工作红线性回归模型经常遇到的问题,异方差的存在对线性回归分析有很强的破坏作用。
利用异方差的图形检验、戈德菲尔特-夸特检验、怀特检验方法,检验案例中线性回归模型的异方差是否存在,若存在的话,如何通过加权最小二乘法进行修正,建立能够真正反应案例的经济模型,实现对经济的正确指导作用。
三、实验要求通过Eviews 软件应用给定的案例做异方差模型的图形检验法、Glodfeld-Quanadt(戈德菲尔特-夸特)检验与White(怀特)检验,并使用加权最小二乘法(WLS)对异方差进行修正。
四、 实验步骤在现实经济活动中,最小二乘法的基本假定并非都能满足,本案例讲讨论随机误差项违背基本假定的一个方面—异方差性。
本案例将介绍:异方差模型的图形检验、戈德菲尔特-夸特检验、怀特检验;异方差模型的加权最小二乘法修正。
1、建立workfile 和对象,录入2007年城镇居民收入X 和消费额Y 的数据。
2、参数估计按住ctrl 键,同时选中序列X 和序列Y ,点右键,在所出现的右键菜单中,选择open\as Group 弹出一对话框,点击其上的“确定”,可生成并打开一个群对象。
在群对象窗口工具栏中点击view\Graph\Scatter\Simple Scatter, 可得X 与Y 的简单散点图,可以看出X 与Y 是带有截距的近似线性关系。
点击朱界面菜单Quick\Estimate Equation, 在弹出的对话框中输入 Y C X,点确定即可到回归结果,如下:VariableCoefficientStd. Errort-StatisticProb. C 756.6871570.1912 1.3270760.1948X0.3076930.01908216.124970.0000R-squared0.899659 Mean dependent var 8689.161Durbin-Watson stat1.694571 Prob(F-statistic)0.0000003、异方差检验本案例用的是2007年的全国各个诚实城镇居民收入和消费额,由于地区之间这种差异使得模型很容易产生异方差,从而影响模型的估计和运行,为此必须对该模型是否存在异方差进行检验。
实验四异方差性的检验与处理集团标准化工作小组 [Q8QX9QT-X8QQB8Q8-NQ8QJ8-M8QMN]实验四 异方差性的检验及处理(2学时)一、实验目的(1)、掌握异方差检验的基本方法; (2)、掌握异方差的处理方法。
二、实验学时:2学时 三、实验要求(1)掌握用MATLAB 软件实现异方差的检验和处理; (2)掌握异方差的检验和处理的基本步骤。
四、实验原理1、异方差检验的常用方法(1) 用X-Y 的散点图进行判断(2). 22ˆ(,)(,)e x e y 或的图形 ,),x )i i y i i ((e 或(e 的图形)(3) 等级相关系数法(又称Spearman 检验)是一种应用较广的方法,既可以用于大样本,也可与小样本。
检验的三个步骤 ① ˆt t y y=-i e②|i x i i 将e 取绝对值,并把|e 和按递增或递减次序排序,计算Spearman 系数rs ,其中:21ni i d =∑s 26r =1-n(n -1)③ 做等级相关系数的显着性检验。
n>8时,/2(2),t t n α>-反之,若||i i e x 说明与之间存在系统关系,异方差问题存在。
(4) 帕克(Park)检验帕克检验常用的函数形式:若在统计上是显着的,表明存在异方差性。
2、异方差性的处理方法: 加权最小二乘法 如果在检验过程中已经知道:222()()()i i i ji u Var u E u f x σσ===则将原模型变形为:121(i i p pi iy x x uf xβββ=+⋅++⋅+在该模型中:即满足同方差性。
于是可以用OLS估计其参数,得到关于参数12,,,pβββ的无偏、有效估计量。
五、实验举例例101i i iy x u=++若用线性模型,研究不同收入家庭的消费情况,试问原数据有无异方差性如果存在异方差性,应如何处理解:(一)编写程序如下:(1)等级相关系数法(详见文件)%%%%%%%%%%%%%%% 用等级相关系数法来检验异方差性 %%%%%%%%[data,head]=xlsread('');x=data(:,1); %提取第一列数据,即可支配收入xy=data(:,2); %提取第二列数据,即居民消费支出yplot(x,y,'k.'); % 画x和y的散点图xlabel('可支配收入x(千元)') % 对x轴加标签ylabel('居民消费支出y(千元)') % 对y轴加标签%%%%%%%% 调用regres函数进行一元线性回归 %%%%%%%%%%%%xdata=[ones(size(x,1),1),x]; %在x矩阵最左边加一列1,为线性回归做准备[b,bint,r,rint,s]=regress(y,xdata);yhat=xdata*b; %计算估计值y% 定义元胞数组,以元胞数组形式显示系数的估计值和估计值的95%置信区间head1={'系数的估计值','估计值的95%置信下限','估计值的95%置信上限'};[head1;num2cell([b,bint])]% 定义元胞数组,以元胞数组形式显示y的真实值,y的估计值,残差和残差的95%置信区间head2={'y的真实值','y的估计值','残差','残差的95%置信下限','残差的95%置信上限'};[head2;num2cell([y,yhat,r,rint])]% 定义元胞数组,以元胞数组形式显示判定系数,F统计量的观测值,检验的P值和误差方差的估计值head3={'判定系数','F统计量的观测值','检验的P值','误差方差的估计值'};[head3;num2cell(s)]%%%%%%%%%%%%% 残差分析 %%%%%%%%%%%%%%%%%%figure;rcoplot(r,rint) % 按顺序画出各组观测值对应的残差和残差的置信区间%%% 画估计值yhat与残差r的散点图figure;plot(yhat,r,'k.') % 画散点图xlabel('估计值yhat') % 对x轴加标签ylabel('残差r') % 对y轴加标签%%%%%%%%%%%% 调用corr函数计算皮尔曼等级相关系数res=abs(r); % 对残差r取绝对值[rs,p]=corr(x,res,'type','spearman')disp('其中rs为皮尔曼等级相关系数,p为p值');(2)帕克(park)检验法(详见文件)%%%%%%%%%%%%%%% 用帕克(park)检验法来检验异方差性 %%%%%%%[data,head]=xlsread(''); %导入数据x=data(:,1);y=data(:,2);%%%%%% 调用regstats函数进行一元线性回归,linear表带有常数项的线性模型,r表残差ST=regstats(y,x,'linear',{'yhat','r','standres'});scatter(x,.^2) % 画x与残差平方的散点图xlabel('可支配收入(x)') % 对x轴加标签ylabel('残差的平方') %对y轴加标签%%%%%%% 对原数据x和残差平方r^2取对数,并对log(x)和log(r^2)进行一元线性回归ST1=regstats(log(.^2),log(x),'linear',{'r','beta','tstat','fstat'})% 输出参数的估计值% 输出回归系数t检验的P值% 输出回归模型显着性检验的P值(3)加权最小二乘法(详见文件)%%%%%%%%%%% 调用robustfit函数作稳健回归 %%%%%%%%%%%%[data,head]=xlsread(''); % 导入数据x=data(:,1);y=data(:,2);% 调用robustfit函数作稳健回归,返回系数的估计值b和相关统计量stats[b,stats]=robustfit(x,y) %调用函数作稳健回归% 输出模型检验的P值%%% 绘制残差和权重的散点图 %%%%%%%plot,,'o') %绘制残差和权重的散点图xlabel('残差')ylabel('权重'(二)实验结果与分析:第一步::用OLS方法估计参数,并保留残差(1)散点图图可支配收入(x)居民消费支出(y)散点图因每个可支配收入x的值,都有5个居民消费收入y与之对应,所以上述散点图呈现此形状。
实验四异方差性的检验及处理(2学时)一、实验目的(1)、掌握异方差检验的基本方法;(2)、掌握异方差的处理方法。
二、实验学时:2学时三、实验要求(1)掌握用MATLAB软件实现异方差的检验和处理;(2)掌握异方差的检验和处理的基本步骤。
四、实验原理1、异方差检验的常用方法(1) 用X-Y的散点图进行判断(2).22ˆ(,)(,)e x e y%%或的图形,),x)i iy%%i i((e或(e的图形)(3) 等级相关系数法(又称Spearman检验)是一种应用较广的方法,既可以用于大样本,也可与小样本。
检验的三个步骤①ˆt ty y=-%ie②|i x %%i i 将e 取绝对值,并把|e 和按递增或递减次序排序,计算Spearman 系数rs ,其中:21n i i d =∑s 26r =1-n(n -1)③ 做等级相关系数的显着性检验。
n>8时,/2(2),t t n α>-反之,若||i i e x %说明与之间存在系统关系,异方差问题存在。
(4) 帕克(Park)检验帕克检验常用的函数形式:若?在统计上是显着的,表明存在异方差性。
2、异方差性的处理方法: 加权最小二乘法如果在检验过程中已经知道:222()()()i i i ji u Var u E u f x σσ===则将原模型变形为:121i i p pi i y x x u βββ=+⋅+⋅+L 在该模型中: 即满足同方差性。
于是可以用OLS 估计其参数,得到关于参数12,,,p βββL 的无偏、有效估计量。
五、实验举例例1、某地区居民的可支配收入x(千元)与居民消费支出y(千元)的数据如下:01i i i y x u ββ=++若用线性模型,研究不同收入家庭的消费情况,试问原数据有无异方差性?如果存在异方差性,应如何处理?解:(一)编写程序如下:(1)等级相关系数法(详见test4_1.m 文件)%%%%%%%%%%%%%%% 用等级相关系数法来检验异方差性 %%%%%%%%[data,head]=xlsread('test4.xlsx');x=data(:,1); %提取第一列数据,即可支配收入xy=data(:,2); %提取第二列数据,即居民消费支出yplot(x,y,'k.'); % 画x和y的散点图xlabel('可支配收入x(千元)') % 对x轴加标签ylabel('居民消费支出y(千元)') % 对y轴加标签%%%%%%%% 调用regres函数进行一元线性回归 %%%%%%%%%%%%xdata=[ones(size(x,1),1),x]; %在x矩阵最左边加一列1,为线性回归做准备[b,bint,r,rint,s]=regress(y,xdata);yhat=xdata*b; %计算估计值y% 定义元胞数组,以元胞数组形式显示系数的估计值和估计值的95%置信区间head1={'系数的估计值','估计值的95%置信下限','估计值的95%置信上限'};[head1;num2cell([b,bint])]% 定义元胞数组,以元胞数组形式显示y的真实值,y的估计值,残差和残差的95%置信区间head2={'y的真实值','y的估计值','残差','残差的95%置信下限','残差的95%置信上限'};[head2;num2cell([y,yhat,r,rint])]% 定义元胞数组,以元胞数组形式显示判定系数,F统计量的观测值,检验的P值和误差方差的估计值head3={'判定系数','F统计量的观测值','检验的P值','误差方差的估计值'}; [head3;num2cell(s)]%%%%%%%%%%%%% 残差分析 %%%%%%%%%%%%%%%%%%figure;rcoplot(r,rint) % 按顺序画出各组观测值对应的残差和残差的置信区间%%% 画估计值yhat与残差r的散点图figure;plot(yhat,r,'k.') % 画散点图xlabel('估计值yhat') % 对x轴加标签ylabel('残差r') % 对y轴加标签%%%%%%%%%%%% 调用corr函数计算皮尔曼等级相关系数res=abs(r); % 对残差r取绝对值[rs,p]=corr(x,res,'type','spearman')disp('其中rs为皮尔曼等级相关系数,p为p值');(2)帕克(park)检验法(详见test4_2.m文件)%%%%%%%%%%%%%%% 用帕克(park)检验法来检验异方差性 %%%%%%%[data,head]=xlsread('test4.xlsx'); %导入数据x=data(:,1);y=data(:,2);%%%%%% 调用regstats函数进行一元线性回归,linear表带有常数项的线性模型,r表残差ST=regstats(y,x,'linear',{'yhat','r','standres'});scatter(x,(ST.r).^2) % 画x与残差平方的散点图xlabel('可支配收入(x)') % 对x轴加标签ylabel('残差的平方') %对y轴加标签%%%%%%% 对原数据x和残差平方r^2取对数,并对log(x)和log(r^2)进行一元线性回归ST1=regstats(log((ST.r).^2),log(x),'linear',{'r','beta','tstat','fstat'})ST1.tstat.beta % 输出参数的估计值ST1.tstat.pval % 输出回归系数t检验的P值ST1.fstat.pval % 输出回归模型显着性检验的P值(3)加权最小二乘法(详见test4_3.m文件)%%%%%%%%%%% 调用robustfit函数作稳健回归 %%%%%%%%%%%%[data,head]=xlsread('test4.xlsx'); % 导入数据x=data(:,1);y=data(:,2);% 调用robustfit函数作稳健回归,返回系数的估计值b和相关统计量stats[b,stats]=robustfit(x,y) %调用函数作稳健回归stats.p % 输出模型检验的P值%%% 绘制残差和权重的散点图 %%%%%%%plot(stats.resid,stats.w,'o') %绘制残差和权重的散点图xlabel('残差')ylabel('权重'(二)实验结果与分析:第一步::用OLS方法估计参数,并保留残差(1)散点图图4.1 可支配收入(x)居民消费支出(y)散点图因每个可支配收入x的值,都有5个居民消费收入y与之对应,所以上述散点图呈现此形状。
(2)回归模型参数估计值与显着性检验表1'系数的估计值' '估计值的95%置信下限' '估计值的95%置信上限'[ -0.5390] [ -3.7241] [ 2.6460] [ 0.8091] [ 0.6768] [ 0.9415]'判定系数' 'F统计量的观测值' '检验的P值' '误差方差的估计值' [ 0.8485] [ 156.8387] [5.4040e-13] [ 9.1316]由输出结果看,常数项和回归系数的估计值分别为-0.539和0.8091,从而可以写出线性回归方程为^=−0.539+0.8091∗xy回归系数的估计值的95%置信区间为[0.6768,0.9415]。
对回归直线进行显着性检验,原假设和对立假设分别为y0:y1=0y1:y1≠0检验的P值为5.4040×10−13<0.01,可知在显着性水平α=0.01下应拒绝原假设y0,可认为y(居民消费收入)与x(可支配收入)的线性关系是显着的。
(3)方差分析图4.2原始数据对应残差图从残差图可以看到有2条线段(红色虚线)与水平线y=0没有交点,它对应的观测号为22和29,也就是说这两组观测对应的残差的置信区间不包含0点,可认为这两组观测数据为异常数据。
它们分别是(30,16.7),(35,20)。
第二步:异方差性检验(1)图示法图4.3(2) 等级相关系数法在y与x 的OLS 回归的基础上计算出残差的绝对值,并记为res,并计算出皮尔曼等级相关系数rs= 0.4860与对应的p值为0.0065<0.05(*),说明残差r与x存在系统关系,即存在异方差问题。
(3)帕克(Park)检验法1)散点图图4.4可支配收入与残差平方的散点图从图4.4可知,可考虑拟合指数曲线。
现将其取对数,即可进行一元线性拟合。
2)回归系数与模型检验做ln(r^2)对ln(x)回归,得到表2‘回归系数’回归系数t检验的P值显着性检验P值y0=-8.4973 0.0295 0.0207y1=2.9679 0.0207从上表可以看出,得到的回归模型为ln(y2)=−8.4973+2.9679∗ln?(y),常数项和线性项的t检验的P值均小于0.05,说明回归方程中常数项和线性项均是显着的。
并且,检验的P值为0.0207小于0.05,说明整个回归方程是显着的,表明存在异方差性。
综上所述,通过以上3种方法的检验,我们得到原数据存在异方差性。
第三步:用加权最小二乘法处理异方差性表3‘回归系数’回归系数t检验的P值y0=-1.6091 0.2375y1=0.8870 0.0000由表3得:回归方程为y^=−1.6091+0.887y,由p值可知x的回归系数是显着的,常数项未显着,说明其无实际意义。
图4.5 残差和权重的散点图由图4.5知:权重集中在最上方的1附近的点比较多,说明稳健性比较好。
六、实验内容下表是我国各地区2003年FDI和GDP的数据,01i i i FDI u ββ=++若用线性模型GDP ,研究不同地区FDI 和GDP 的关系,试问原数据有无异方差性?如果存在异方差性,应如何处理?七、思考练习某地区家庭年收入(x)和每年生活必需品综合支出(y)的样本数据如下表:现用线性模型01i i i y x u ββ=++,研究不同收入水平家庭的消费情况,试问原数据有无异方差性?如果存在异方差性,应如何处理?八、参考文献[1].李宝仁.计量经济学[M].机械工业出版社,2007.12[2].何晓群. 应用回归分析[M].中国人民大学出版,2002.9。