第五章练习题及参考解答 设消费函数为
i i i i u X X Y +++=33221βββ
式中,i Y 为消费支出;i X 2为个人可支配收入;i X 3为个人的流动资产;i u 为随机误差项,
并且2
22)(,0)(i i i X u Var u E σ==(其中2σ为常数)。试回答以下问题:
(1)选用适当的变换修正异方差,要求写出变换过程;
(2)写出修正异方差后的参数估计量的表达式。
【练习题参考解答】
(1)因为2
2()i i f X X =,所以取221
i i
W X =
,用2i W 乘给定模型两端,得 312322221i i i
i
i i i Y X u X X X X βββ=+++ 上述模型的随机误差项的方差为一固定常数,即
22221
(
)()i i i i
u Var Var u X X σ==
(2)根据加权最小二乘法,可得修正异方差后的参数估计式为
***12233???Y X X βββ=-- ()()()()()()()
***2****2223232232
2
*2*2**2223223?i
i i i i i i i i i i i i i i i i i W y x W x W y x W x x W x W x W x x β-=-∑∑∑∑∑∑∑
()()()()
()()()
***2****2322222233
2
*2*2**2223223?i
i i i i i i i i i i i i i i i i i W y x W x W y x W x x W x W x W x x β-=
-∑∑∑∑∑∑∑
其中
22232*
**23222,
,
i i
i i
i i i
i
i
W X W X
W Y X X Y W
W
W =
=
=
∑∑∑∑∑∑
****
**222333
i i i i i x X X x X X y Y Y =-=-=-
对于第三章练习题家庭书刊消费与家庭收入及户主受教育年数关系的分析,进一步作以下分析:
1)判断模型123i i i i Y X T u βββ=+++是否存在异方差性。 2。如果模型存在异方差性,应怎样去估计其参数 3)对比分析的结果,你对第三章练习题的结论有什么评价 【练习题参考解答】 建议学生自己独立完成
表是2007年我国各地区农村居民家庭人均纯收入与家庭人均生活消费支出的数据 表 各地区农村居民家庭人均纯收入与家庭人均生活消费支出的数据
数据来源: 中国统计年鉴2008
(1)试根据上述数据建立2007年我国农村居民家庭人均消费支出对人均纯收入的线性回归模型。
(2)选用适当方法检验模型是否在异方差,并说明存在异方差的理由。 (3)如果存在异方差,用适当方法加以修正。
【练习题参考解答】
解: (1)建立样本回归函数。
?179.1916+0.7195Y
X = ()()
20.895260, F=247.8769R =
(2)利用White 方法检验异方差,则White 检验结果见下表:
Heteroskedasticity Test: White
F-statistic Prob. F(2,28) Obs*R-squared Prob. Chi-Square(2) Scaled explained SS
Prob. Chi-Square(2)
由上述结果可知,该模型存在异方差。分析该模型存在异方差的理由是,从数据可以看出,一是截面数据;二是各省市经济发展不平衡,使得一些省市农村居民收入高出其它省市很多,如上海市、北京市、天津市和浙江省等。而有的省就很低,如甘肃省、贵州省、云南省和陕西省等。
(3)用加权最小二乘法修正异方差,分别选择权数
211
1,23w w w X X ===,经过试算,认为用权数3w 的效果最好。结果如下:
结果为
2?787.28470.5615(4.5325)
(10.0747)0.7778,101.4992
Y
X R F =+==
表的数据是2011年各地区建筑业总产值(X )和建筑业企业利润总额(Y )。 表 各地区建筑业总产值(X )和建筑业企业利润总额(Y )(单位:亿元)
地 区
建筑业总产值X
建筑业企业利润
总额Y
地 区
建筑业总产值X
建筑业企业利润
总额Y 北 京 湖 北 天 津 湖 南 河 北 广 东 山 西 广 西 内蒙古 海 南 辽 宁
重 庆
数据来源:国家统计局网站
根据样本资料建立回归模型,分析建筑业企业利润总额与建筑业总产值的关系,并判断模型是否存在异方差,如果有异方差,选用最简单的方法加以修正。
【练习题参考解答】
建议学生自己独立完成
为研究居民收入与交通通讯消费支出的关系,取得了2005年中国各省市区城镇居民人均年可支配收入(X)与人均年交通通讯消费支出(Y)的数据:
表 2005年中国各省市区城镇居民人均可支配收入与交通通讯消费支出(单位:元)
吉林四川
黑龙江贵州
上海云南
江苏西藏
浙江陕西
安徽甘肃
福建青海
江西宁夏
山东新疆
河南
1.作人均交通通讯消费支出对人均可支配收入的线性回归,并检验模型是否存在什么问题。
2.用两种以上的方法检验模型是否存在异方差性。
【练习题参考解答】
1.回归结果
2.检验异方差性
1)Goldfeld-Quanadt检验
将样本数据X递增排序: “Procs/Sort Series/输入”X”/Ascending/ok,
去掉中间7个数据, 分为”1-12”和”20-31”两个样本分别回归
样本区间1-12的回归
2152031.04i
e
=∑
211070530i
e
=∑
F 统计量: 222
11070530
2.0666552031.04
i i
e F e
==
=∑∑
0.05α=,查F 分布表0.05(10,10) 2.98F =
0.052.06665(10,10) 2.98F F =<=,表明不存在异方差
2)White 检验:
点Wiew/Residual Tests/white heteroskedasticity(no cross terms)结果为
220.051.54193
(2) 5.9915nR χ==
由于22
0.051.54193(2) 5.9915nR χ=<=,同时p 值为,表明无异方差性
表为1978年—2011年四川省农村人均纯收入、人均生活费支出、商品零售价格指数的数据。
表 四川省农村人均纯收入、人均生活费支出、商品零售价格指数
时间
农村人均纯
收入
农村人均生
活消费支出
商品零售
价格指数
时间
农村人均纯
收入
农村人均生
活消费支出
商品零售
价格指数
资料来源:中经网统计数据库
1) 如果不考虑价格变动因素,建立回归模型并检验是否存在异方差,如果存在异方差,选用适当方法进行修正。
2)如果考虑价格变动因素,对异方差性的修正应该怎样进行
3)对比以上两个回归模型,你有什么体会
【练习题参考解答】
建议学生自己独立完成
检验异方差性的基本思想,是检验随机误差项的方差与某解释变量X 的变动是否相关。统计学中的Spearman 等级相关系数也可以度量变量间的相关性,是否能够利用Spearman 等级相关系数去检验随机误差项的方差(可用残差的绝对值代表)与解释变量X 是否存在异方差性呢如果可以,用Spearman 等级相关系数检验本章案例中是否存在异方差,并将其检验结果与其他检验方法相比较。
【练习题参考解答】
Spearman 检验计算公式为
216
(1)
i
s d
r n n =--∑
其中,i d 为第i 个现象的两种不同特性样本的等级之差,n 为观测现象的等级个数。
设模型为12i i i Y X u ββ=++,用Spearman 检验检验异方差的步骤如下 1) 做Y 对X 的回归,得到残差e 。
2) 求残差e 的绝对值e ,将X 按递升或递降划分等级并与e 对应的等级相减,即得到
i d 。
3) 将i d 和n 代入计算s r ,根据相关系数的变动范围,可初步判断是否存在异方差。 4)在0:0H ρ=(ρ为总体等级相关系数)成立下,并且8n >,s r 的显著性可通过如下服从自由度为2n -的t 分布的统计量得到检验,即
t =
。给定显著性水平α,查t 分布表,得临界值(2)t n α-,若2(2)t t n α>-,则拒绝原假设,说明序列存在异方差。否则接受原假设,说明不存在异方差。
由本章案例回归估计后得到残差序列i e ,取i e 的绝对值i e 并得到其等级数。同样,将解释变量X 取等级数。计算对应的i e 的等级数与X 的等级数之差i d ,将其平方得到2
i d 。具体计算结果见下表。
等级相关系数检验2
i d 的计算结果
将表中计算的2
i d 代入公式,计算得0.9815s r =。根据相关系数的规则,可判断i e 与解释变量X 高度相关,所以,初步认为模型存在异方差。进一步,将有关数据代入计算得
31.4272t =,给定显著性水平0.05α=,查t 分布表得临界值0.025(19) 2.093t =。比较t
值与临界值,显然,0.02531.4272(19) 2.093t t =>=,所以,拒绝原假设,表明该模型确实存在异方差。检验结果与其他检验方法一致。