异方差完整案例分析
- 格式:docx
- 大小:42.97 KB
- 文档页数:6
第1篇一、实验目的1. 掌握异方差性的基本概念和检验方法。
2. 学会运用统计软件进行异方差的检验和修正。
3. 提高对计量经济学模型中异方差性处理能力的实践应用。
二、实验原理1. 异方差性:在回归分析中,若回归模型的误差项(残差)的方差随着自变量或因变量的取值而变化,则称模型存在异方差性。
2. 异方差性的检验方法:图形检验、统计检验(如F检验、Breusch-Pagan检验、White检验等)。
3. 异方差性的修正方法:加权最小二乘法(WLS)、广义最小二乘法(GLS)等。
三、实验步骤1. 数据准备1. 收集实验所需数据,确保数据质量和完整性。
2. 对数据进行初步处理,如剔除异常值、缺失值等。
2. 模型设定1. 根据研究问题,选择合适的回归模型。
2. 利用统计软件(如Eviews、Stata等)进行初步的回归分析。
3. 异方差性检验1. 图形检验:绘制散点图,观察残差与自变量或因变量的关系,初步判断是否存在异方差性。
2. 统计检验:- F检验:检验回归系数的显著性。
- Breusch-Pagan检验:检验残差平方和与自变量或因变量的关系。
- White检验:检验残差平方和与自变量或因变量的多项式关系。
4. 异方差性修正1. 若检验结果表明存在异方差性,则需对模型进行修正。
2. 选择合适的修正方法:- 加权最小二乘法(WLS):根据残差平方与自变量或因变量的关系,计算权重,加权最小二乘法进行回归分析。
- 广义最小二乘法(GLS):根据残差平方与自变量或因变量的关系,选择合适的方差结构,广义最小二乘法进行回归分析。
5. 结果分析1. 对修正后的模型进行回归分析,观察回归系数的显著性、拟合优度等指标。
2. 对实验结果进行分析,解释实验现象,验证研究假设。
6. 实验报告撰写1. 撰写实验报告,包括以下内容:- 实验目的- 实验原理- 实验步骤- 实验结果- 分析与讨论- 结论2. 实验报告应结构清晰、逻辑严谨、语言简洁。
异方差的例子异方差指的是在统计分析中,不同观测值的方差不相等。
这种情况下,使用传统的线性回归模型可能会导致结果的偏差和误差。
因此,为了得到更准确的结果,需要采取一些方法来处理异方差性。
下面将列举一些常见的异方差的例子,并介绍相应的处理方法。
1. 股票价格波动:股票价格的波动通常呈现出非常明显的异方差性。
在股票市场中,有些股票的价格非常波动,而有些股票的价格相对稳定。
这种情况下,可以使用加权最小二乘法来处理异方差。
2. 学生考试成绩:学生考试成绩的方差通常也会存在异方差性。
一些学生的考试成绩波动较大,而一些学生的考试成绩相对稳定。
在分析学生的考试成绩时,可以考虑使用方差齐性检验来确定是否存在异方差,并选择相应的处理方法。
3. 经济增长率:经济增长率在不同的时间段和地区通常也会呈现出异方差性。
一些地区的经济增长率波动较大,而一些地区的经济增长率相对稳定。
在分析经济增长率时,可以使用异方差稳健标准误来处理异方差。
4. 气温变化:气温在不同的季节和地区通常也会呈现出异方差性。
一些地区的气温波动较大,而一些地区的气温相对稳定。
在分析气温变化时,可以使用加权最小二乘法或者异方差稳健标准误来处理异方差。
5. 金融市场波动:金融市场的波动性也会导致异方差的问题。
一些金融资产的价格波动较大,而一些金融资产的价格相对稳定。
在分析金融市场波动时,可以使用加权最小二乘法或者异方差稳健标准误来处理异方差。
6. 人口增长率:人口增长率在不同的国家和地区也会呈现出异方差性。
一些国家的人口增长率波动较大,而一些国家的人口增长率相对稳定。
在分析人口增长率时,可以使用加权最小二乘法或者异方差稳健标准误来处理异方差。
7. 网络流量:网络流量在不同的时间段和地区也会呈现出异方差性。
一些地区的网络流量波动较大,而一些地区的网络流量相对稳定。
在分析网络流量时,可以使用加权最小二乘法或者异方差稳健标准误来处理异方差。
8. 土地价格:土地价格在不同的地区和时间段也会呈现出异方差性。
异方差实验报告异方差实验报告引言在统计学中,方差是一种衡量数据分布离散程度的重要指标。
然而,在实际应用中,我们常常会遇到方差不稳定的情况,即异方差。
异方差的存在会对统计分析结果产生显著影响,因此,我们需要探索异方差的原因和解决方法。
本实验旨在通过模拟数据和实际案例来探讨异方差的现象、原因和处理方法。
一、异方差现象的模拟实验为了更好地理解异方差的现象,我们首先进行了一系列的模拟实验。
我们生成了两组数据,一组是服从正态分布的数据,另一组是服从泊松分布的数据。
然后,我们分别对两组数据进行方差分析,并比较其结果。
实验结果显示,当数据服从正态分布时,方差分析的结果较为稳定,各组之间的方差差异不大。
然而,当数据服从泊松分布时,方差分析的结果却出现了明显的差异。
这说明泊松分布的数据具有异方差性质。
二、异方差的原因分析为了深入理解异方差的原因,我们进一步探究了几个可能导致异方差的因素。
1. 数据的变换我们对泊松分布的数据进行了对数变换,然后再进行方差分析。
实验结果显示,经过对数变换后,数据的异方差性质得到了明显改善。
这说明,数据的变换可以在一定程度上解决异方差问题。
2. 数据的离散程度我们生成了两组服从正态分布的数据,一组具有较小的离散程度,另一组具有较大的离散程度。
实验结果显示,离散程度较大的数据组具有更明显的异方差性质。
这表明,数据的离散程度与异方差之间存在一定的关联。
3. 样本容量我们通过不断调整样本容量,观察方差分析结果的变化。
实验结果显示,随着样本容量的增加,方差分析结果的稳定性得到了明显改善。
这说明,样本容量的大小对异方差的影响是显著的。
三、处理异方差的方法针对异方差问题,统计学家们提出了多种处理方法。
以下是一些常见的方法:1. 方差齐性检验在进行统计分析之前,我们可以先对数据进行方差齐性检验。
常用的方差齐性检验方法包括Levene检验和Bartlett检验。
如果检验结果表明数据存在异方差,我们可以采取相应的处理方法。
14异方差案例分析异方差(heteroscedasticity)是指随着自变量的变化,因变量的方差也发生变化的一种情况。
在统计分析中,当异方差存在时,会影响到参数估计的准确性和统计检验的可靠性,因此需要进行异方差的诊断和处理。
下面通过一个案例来分析异方差的问题。
假设有一家电子产品公司,想要研究其产品销售量与广告投入的关系。
公司从10个城市中随机选择了200家零售店作为样本,并分别统计了广告投入金额(自变量)和产品销售量(因变量)。
数据如下:店铺编号,广告投入金额(万元),产品销售量(千件)---------,-----------------,-----------------1,1.2,102,1.8,113,1.5,94,2.3,155,2.0,86,1.6,107,1.9,128,1.1,99,2.5,1610,2.2,14...,...,...200,3.4,18```pythonimport matplotlib.pyplot as pltadvertising = [1.2, 1.8, 1.5, 2.3, 2.0, 1.6, 1.9, 1.1, 2.5, 2.2, ...]sales = [10, 11, 9, 15, 8, 10, 12, 9, 16, 14, ...]plt.scatter(advertising, sales)plt.xlabel("Advertising Investment (million yuan)")plt.ylabel("Product Sales (thousand units)")plt.show```从散点图中我们可以看出,随着广告投入的增加,产品销售量并没有呈现出明显的线性增长趋势,同时也可以看到在销售量较低和高投入时,方差较大的情况。
为了进一步确定是否存在异方差的问题,我们可以进行异方差的诊断检验,最常用的方法是利用残差图。
第五章 案例分析一、问题的提出和模型设定根据本章引子提出的问题,为了给制定医疗机构的规划提供依据,分析比较医疗机构与人口数量的关系,建立卫生医疗机构数与人口数的回归模型。
假定医疗机构数与人口数之间满足线性约束,则理论模型设定为i i i u X Y ++=21ββ (5.31)其中i Y 表示卫生医疗机构数,i X 表示人口数。
由2001年《四川统计年鉴》得到如下数据。
表5.1 四川省2000年各地区医疗机构数与人口数地区人口数(万人) X医疗机构数(个)Y地区人口数(万人) X医疗机构数(个)Y成都 1013.3 6304 眉山 339.9 827 自贡 315 911 宜宾 508.5 1530 攀枝花 103 934 广安 438.6 1589 泸州 463.7 1297 达州 620.1 2403 德阳 379.3 1085 雅安 149.8 866 绵阳 518.4 1616 巴中 346.7 1223 广元 302.6 1021 资阳 488.4 1361 遂宁 371 1375 阿坝 82.9 536 内江 419.9 1212 甘孜 88.9 594 乐山345.91132 凉山 402.41471 南充 709.24064二、参数估计进入EViews 软件包,确定时间范围;编辑输入数据;选择估计方程菜单,估计样本回归函数如下表5.2估计结果为56.69,2665.508..,7855.0)3403.8()9311.1(3735.50548.563ˆ2===-+-=F e s R X Y ii (5.32) 括号内为t 统计量值。
三、检验模型的异方差本例用的是四川省2000年各地市州的医疗机构数和人口数,由于地区之间存在的不同人口数,因此,对各种医疗机构的设置数量会存在不同的需求,这种差异使得模型很容易产生异方差,从而影响模型的估计和运用。
为此,必须对该模型是否存在异方差进行检验。
第五章案例分析一、问题的提出和模型设定为了分析不同省份或城市的交通和通讯支出的规划提供依据,支配收入的关系,建立交通和通讯支出与可支配收入的回归模型。
支配收入满足线性约束,则理论模型设定为得到如下数据注:见数据文件 cumexp_income.csv利用最小二乘法估计模型(1 )的参数:mydata .lm <- lm(cumexp ~ in come) summary(mydata .Im) R 软件输出的结果为: Call:lm(formula = cumexp ~ in come) -97.465 -19.986 -5.111 15.532 184.115cum iin come i u i(1)其中cum i 表示交通和通讯支出,income i 表示可支配收入。
由1999年《中国统计年鉴》分析交通和通讯支出与可 假定交通和通讯支出与可f t . 可丸配收入 地 &t Ie宁n.尚議总江 内薫古 卅 中 北 南4009. 6] MSC 73 4112+ 41 4206. 61 421P. 42 4220.24 4240,13 4251. A2 4258. 50 4353.02 4&65+ 39 4617. 24 4770.47 4826, 36 ^852. 87159. 60137.11 231.51 172.65 bl 65 19】,76 197. 04 176.39 1S5. 7S 20«. 91 227. 2]201, &7237. lfi 2H. 37 265,朋册 河广t ;£云5000. 795084+ 64 5127,08 53S0. 085412. 24 5434.26 51G6. 57 6017, 85 6042. 78 £485.637110.54 7B36. 76 847 L 98 8773.10B839. 6Bcum212. 30270, Q9212,46 255.53 252.37255. 79 337. 83吳娠来画:中耳施计卑蓦,申M 皱计出蚤社卿参数估计Residuals:Min 1Q Median 3Q MaxI 单位=元}*4. I丈逋釦诞iff,支出incumJi &哥jt 配收人|交遇和道酬JI 出 ”- 一卜inCoefficie nts:Estimate Std. Error t value Pr(>|t|)(In tercept) -56.91798 36.20624 -1.5720.127in come 0.058080.006488.962 1.02e-09 ***Signif. codes: 0' *** ' 0.001' ** ' 0.01'* ' 1 0.05'. ' 0.1Residual sta ndard error: 50.48 on 28 degrees of freedom Multiple R-squared: 0.7415, Adjusted R-squared: 0.7323 F-statistic: 80.32 on 1 and 28 DF, p-value: 1.021e-09估计结果为:cuifl 56.92 0.06i ncome (36.21) (0.01)R 2 0.74 s.e. 5048 F 80.32括号内为标准差。
10.5 一个更完整的例子让我们来看一个更完整的基于横殿面的异方差的例子。
20世纪70年代中期,美国能源部门试图基于各地过去的汽油消耗量和人口变动情况以及其他一些因素给各地区、各州甚至各零售点直接分配汽油。
实现这种分配必须将大量因素作为各州(各地区)的燃油消耗量(应变量)的函数而建立模型。
而对于这样的横截面模型,即使是估计的模型,也很可能会具有异方差问题。
在模型中,应变量为各州的燃油消耗量,可能的解释变量包括:与各州规模大小相关的变量(例如公路里程数、注册的机动车数量和人口),以及与各州规模大小无关的变量(例如燃油税率和最高限速)。
因为在模型中反映各州规模大小的变量不应多于一个(如果包含过多变量容易导致多重共线性),因为有许多州的最高限速相同(但在时间序列模型中,它将是一个有用的变量)。
因此,一个合理的模型为:012(,)i i i i i PCON f REG TAX REG TAX εβββε+-=+=+++ (10-20)式中 i PCON ——第i 个州的燃油消耗量(百万BTU ), i REG ——第i 个州的注册机动车数量(千辆), i TAX ——第i 个州的燃油税率(美分/加仑), i ε——经典误差项。
我们可以认为一个州注册的汽车数量越多,该州所消耗的燃油也越多;而一个州的燃油税率越高则该州的燃油消耗量越小1。
我们搜集那一时期的数据(见表10-1)用于估计方程(10-20),得到:i i i TAX REG PCON 59.531861.07.551-+=∧(10-21)(0.0117) (16.86)15.88t = 3.18-20.861R =50N =表10-1 燃油消费例子中的数据PCON UHM TAX REG POP e state270 2.2 9 743 1136 62.335 Maine 122 2.4 14 774 948 176.52 New Hampshire58 0.7 11 351 520 30.481 Vermont 82120.69.937505750101.87Massachusetts1在方程中我们也可用*TAX REG 或者*TAX PO P (iPOP 代表第i 个州的人口)取代TAX 作为方程的解释变量。
异方差性案例分析异方差性是统计学中一种常见的问题,指的是随机变量具有不同的方差或者方差不稳定的情况。
当异方差性存在时,会影响到统计模型的效果和结果的可信度。
本文将通过一个实际案例来分析异方差性的问题,并探讨如何解决这一问题。
假设我们进行了一项研究,调查了一批学生的学业成绩和上网时间的关系。
我们收集了60位学生的数据,其中包括学习时间(以小时为单位)和平均每周上网时间(以小时为单位)。
我们的研究目的是确定学生的学习时间与上网时间是否存在相关性,并且构建一个合适的回归模型来预测学生成绩。
首先,我们绘制了学习时间和上网时间的散点图,以探索两个变量之间的关系。
从散点图中,我们可以看到数据的分布情况和可能的相关性。
接下来,我们使用线性回归模型来分析学习时间和上网时间的关系。
我们假设学习时间是因变量,上网时间是自变量。
模型的形式为:学习时间=β0+β1*上网时间+ε其中,β0和β1是回归系数,ε是误差项。
我们利用最小二乘法估计出回归系数,进而得到回归模型。
然而,在进行异方差性检验时,我们发现了一个令人担忧的问题:残差的方差并不是恒定的。
简单说,残差并不是随机地围绕着回归线分布,而是变动的。
异方差性的存在会导致参数估计的不准确性,进而使统计结果产生偏差和误导性。
因此,解决异方差性问题是非常重要的。
为了解决这个问题,我们可以尝试使用加权最小二乘法,即引入一个权重系数来重新估计回归系数。
权重系数的选择与残差的方差相关,即越大的权重用于较小方差的观测值,越小的权重用于较大方差的观测值。
为了确定权重系数,我们可以进行一些统计方法的变换,例如对残差进行平方根、对数转换等。
我们还可以使用一些专门用于解决异方差性的模型,如加权最小二乘法(WLS)、广义最小二乘法(GLS)等。
在我们的案例中,我们尝试了通过对残差进行平方根转换来解决异方差性问题。
具体来说,我们计算了残差的平方根,并重新估计了回归系数。
经过尝试和比较,我们发现使用平方根转换的模型的残差方差相对于未加权的模型有了显著的改善。
R案例分析_异方差异方差是指在统计分析中,随着自变量的不同取值,因变量的方差也随之发生变化的现象。
异方差问题在实际数据分析中经常遇到,其存在会对统计模型的准确性和效果产生重要影响。
本文将以一个实际案例为例,分析异方差问题及其解决办法。
假设我们是一家电商公司的数据分析师,负责分析产品销售情况。
在进行销售数据分析时,我们发现在不同的销售渠道下,产品的销售量存在差异。
为了更准确地分析销售情况,我们希望解决异方差问题。
首先,我们需要通过数据分析手段来确认异方差的存在。
我们可以绘制销售量和销售渠道的散点图,观察销售量在不同渠道下的分布情况。
如果不同渠道下的散点图呈现出不同的方差大小,则可以初步判断存在异方差问题。
确定存在异方差问题后,我们需要采取措施来解决。
以下是几种常见的异方差处理方法:1.数据变换:可以通过对因变量进行一些数学变换,如开方、取对数等。
这样可以将异方差问题转化为方差齐性问题,便于后续的数据分析。
但需要注意的是,变换后的数据在解释上可能会有所改变。
2. 加权最小二乘法(Weighted Least Squares, WLS):WLS是一种适用于异方差数据的回归分析方法。
其基本思想是根据异方差结构,对不同的观测值赋予不同的权重,从而修正回归模型的误差项。
3.方差分析(ANOVA):如果我们可以找到一些能够解释异方差的因素,可以通过方差分析来进行处理。
对于不同的因子水平,通过统计方法比较其差异性,进而确定是否存在异方差问题。
4. 偏最小二乘回归(Partial Least Squares Regression, PLS):PLS是一种非参数化的回归分析方法,可以在一定程度上克服异方差问题。
PLS通过找到主成分来降低变量间的相关性,从而改善模型的准确性。
在实际应用中,我们可以尝试使用上述方法中的一个或多个来解决异方差问题。
需要注意的是,不同的方法适用于不同的数据情况,选择合适的方法需要基于实际情况和数据分析的目的进行综合考虑。
20世纪70年代中期,美国能源 部门试图基于各地过去的汽油消耗量和人口变动情况以及其他一些因素给各地区、各州甚至各零售点直接分配汽油。
实现这种分配必须将大量因素作为各州(各地区)的燃油消耗量(应变量)的函数而建立模型。
而对于这样的横截面 模型,即使是估计的模型,也很可能会具有异 方差问题。
在模型中,应变量为各州的燃油消耗量,可能的解释变量包括:与各州规模大小相关 的变量(例如公路里程数、注册的机动车数量和人口),以及与各州规模大小无关的变量(例 如燃油税率和最高限速)。
因为在模型中反映各州规模大小的变量不应多于一个(如果包含 过多变量容易导致多重共线性),因为有许多州的最高限速相同(但在时间序列模型中,它 将是一个有用的变量)。
因此,一个合理的模型为:PCON i f (REG,TAX ) i oiREG i2TAX i i( 10-20)式中 PCON i ――第i 个州的燃油消耗量(百万 BTU ),REG i ――第i 个州的注册机动车数量(千辆), TAX i ――第i 个州的燃油税率(美分/加仑),i ――经典误差项。
我们可以认为一个州注册的汽车数量越多, 该州所消耗的燃油也越多; 而一个州的燃油税率越高则该州的燃油消耗量越小 (10-20),得到:二我们搜集那一时期的数据(见表 10-1 )用于估计方程 PCON i 551.70.1861REG i 53.59TAX i( 10-21)(0.0117)( 16.86)t 15.883.18R 1 2 0.861 N 50表10-1燃油消费例子中的数据PCONUHMTAX REGPOPe state270 2.2 9 743 1136 62.335 Maine 122 2.4 14 774 948 176.52 New Hampshire 580.7 11 351 520 30.481 Vermont 82120.6 9.937505750101.87Massachusetts1在方程中我们也可用TAX * REG 或者TAX * POP ( POP 代表第i 个州的人口)取代TAX 作为方程的解释变量。
我们在第7.5节中讨论虚拟变量斜率时曾介绍了一个关于交互项的更为复杂的例子。
对于一个给 定的税率,它对一个大州的燃油消耗的影响要比对一个小州的影响大得多,而用反映州的规模大小的变量 乘以TAX 会使所得到的新变量(交互项)能够更好地度量这一效应。
10.5 —个更完整的例子让我们来看一个更完整的基于横殿面的异方差的例子。
98 3.6 13 586 953 133.92 Rhode lsland450 10.1 11 2258 3126 67.527 Connecticut 1819 36.4 8 8235 17567 163.24 New York 1229 22.2 8 4917 7427 190.83 New lersey 1200 27.9 11 6725 11879 -13.924 Pennsylvania 1205 29.2 11.7 7636 10772 -140.98 Ohio650 17.6 11.1 3884 5482 -29.764 lndiana 1198 30.3 7.5 7242 11466 -299.72 minois760 25.1 13 6250 9116 -258.33 Michigan 460 13.8 13 3162 4745 16.446 Wiscolnsin 503 13.0 13 3278 4133 37.855 Minnesota 371 8.1 13 2346 2906 79.330 lowa571 13.9 7 3412 4942 -240.63 Missouri 136 1.6 8 653 672 -108.50 North Dakota 109 1.6 13 615 694 139.52 South Dakota 203 4.3 13.9 1215 1589 170.08 Nebraska 349 8.4 8 2061 2408 -157.58 Kansas118 1.4 11 415 600 78.568 Delaware 487 9.8 13.5 2893 4270 120.31 Maryland 628 12.4 11 3705 5485 -23.806 Uirginia 192 2.9 10.5 1142 1961 -9.5451 West Virginia 642 17.1 12 4583 6019 -119.64 North Carolina 320 7.1 13 1975 3227 97.385 South Carolina 677 15.6 7.5 3916 5648 -201.65 Ceorgia 1459 28.5 8 8335 10446 -215.37 Florida 434 6.9 10 2615 3692 -68.513 Kentuchy 482 11.9 9 3381 4656 -216.68 Temmessee457 13.7 11 3039 3941 -70.842 A;aba,a 325 6.3 9 1593 2569 -40.877 Mississippi 300 7.4 9.5 1481 2307 -18.235 Arkansas 1417 10.1 8 2800 4383 772.87 Louisiana 451 11.4 6.58 2780 3226 -265.51 Oklahoma3572 59.9 5 11388 15329 1168.6 Texas131 2.3 9 758 805 -79.457 Montana105 2.2 7.5 873 977 -207.25 Idaho163 1.5 8 508 509 -54.515 Wyoming323 9.2 9 2502 3071 -212.07 Coiorado192 4.4 11 1193 1367 7.7577 New mexico291 8.9 10 2216 2892 -137.25 Arizona169 5.0 11 1038 1571 13.608 Utah133 2.4 12 710 876 92.250 Nevada562 14.8 12 3237 4276 50.895 Washington364 8.4 8 2075 2668 -145.18 Oregon2840 62.5 9 17130 24697 -417.81 California155 1.2 8 319 444 -27.336 Alaska214 1.3 8.5 586 997 8.7623 Hawaii资料来源:1958 Statistical Abstract (U.S. Department of Commerce),except the residual.注:Data File = GAS10这一方程看起来没什么问题。
所有的系数在假设的方向上都是显著的,方程在统计上也是总体显著的。
回归结果没有给出德宾—沃森(Durbi n-Wats on )d统计值,因为这些观测值不存在“固有的”顺序因而勿需进行序列相关检验(如果你想知道,根据表10-1中的顺序所计算的d统计值为2.20 )。
根据前面所讨论的,让我们考察方程是否存在由各州规模差异引致异方差的可能性。
为了检验这种可能性,我们从方程(10-21 )中得到残差,(这些残差被列于表10-1中),对其进行帕克检验。
在进行帕克检验之前,我们必须首先确定比例因子乙。
几乎所有与规模大小有关的变量都可以考虑作为比例因子乙,但注册机动车数量(REG肯定是一个比较合理的选择。
注意,以燃油税率(TAX)作为帕克检验的比例因子乙将是错误的,因为没有证据表明燃油税率明显随着州的规模的不同而变化。
相反,税收总额倒是可以替代REG乍为比例因子Z j。
我们观察残差和注册机动车数量之间的关系(见图10-7 ),从残差看的确可能存在潜在的异方差。
下一步就是要进行帕克检验:2ln( e i )0 1 In REG i i (10-22)式中e ——从方程(10-21)中获取的残差,经典(具有同方差性)误差项。
进行帕克检验的辅助回归,我们得到:2In(u ) 1.650 0.9521n REG j (10-23)(0.308)t 3.092R 0.148 N 50从统计表B-1中可以看出,在显著性水平为 1 %时,双侧检验的t统计量临界值为2.7,这样我们可以拒绝同方差的虚拟假设,因为合适的判定过程为:拒绝H。
: 1 0 如果t pARK〔 2.7不拒绝H。
:如果t PARK 2.7由于方程(10-20 )的残差显示存在异方差,我们应该如何处理呢?首先,我们应该考察方程的设定看是否存在遗漏的变量。
对于这一方程,尽管存在遗漏变量的可能性,但估计方程非常清晰的显示出纯的异方差。
因此,我们用变量作为比例因子,利用方法来重新估计方程():PCON i/REG i 218.54/REG i 0.168 17.398TAX i / REG i (10-25)(0.014 ) (4.682 )t 12.27 3.71R20.333 N 50把所得到的结果与方程(10-21)认真进行比较,注意:3注意这时整个方程两边都除以了REG i。
这实际上是假定误差项为i Z i i。
然而,帕克检验中ln REG的系数接近于1,显示误差项适当的函数形式应为,Z,,当然我们也不能仅仅根据帕克检验中的系数就采取该种形式的变换。
如果理论基础支持这种形式的变换,则整个方程两边应该除以x Z ,但在本例中,理论并不支持这样的变换。
要更深入地了解这一问题,请参考脚注7。
比较方程(10-28 )和方程(10-21 )。
注意,正如你所预料的那样,他们的斜率系数是相同1方程(10-25 )中1/REG的斜率系数实际上是方程(10-21 )中的截距。
因此,尽管在OLS估计程序中它被当作一个斜率系数看待,但这里并没有计算其t统计值。
2方程(10-25 )中的截距项实际上是方程(10-21 )中REG的斜率系数。
注意,我们所得到的估计值在大小和显著性上都与方程(10-21 )中的结果很接近。
3在WLS估计的方程中,比例因子REG的t统计值比其在潜在异方差方程(10-21 )中的t 统计值要小;总体拟合优度也较低,但这一点非特别重要,因为两个方程的应变量并不相同。
然而,正如在1043节中所提到的,为了避免由于样本规模差异导致谬误相关所引起的异方差,可供选择的方案是重新思考回归的目的和对方程的变量进行重新定义。