当前位置:文档之家› 实用回归分析小论文

实用回归分析小论文

影响成品钢材量的多元回归分析

理论上成品钢材的需求量的影响因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、能源转换技术等因素。在此,收集的数据选择与其相关的四个因素:原油产量、生铁产量、原煤产量、发电量,1980—1997的有关数据如下表。

原始数据(中国统计年鉴)

将中国成品钢材的需求量设为y,作为被解释变量,而原油产量

x、

1

生铁产量

x、原煤产量3x、发电量4x作为解释变量,通过建立这些经

2

济变量的线性模型来研究影响成品钢材需求量的原因。

一、 模型的设定

设因变量y 与自变量1x 、2x 、3x 、4x 的一般线性回归模型为:

y = 0β+11223344x x x x ββββε++++

ε是随机变量,通常满足()0εE =;Var(ε)=2σ

二 参数估计

再用spss 做回归线性,根据系数表得出回归方程为: 1

234170.2870.0410.55417.818

0.389

y x x x x =-+-+ 再做回归预测,得出如下截图:

故当原油产量为16225.86万吨,生铁产量为12044.54万吨,原煤产量为13.87万吨以及发电量为12334.89亿千瓦时时,成品钢材量预测值为10727.33875万吨;当原油产量为17453万吨,生铁产量为12445.96万吨,原煤产量为14.54万吨以及发电量为13457亿千瓦时时,成品钢材量预测值为10727.33875万吨。

三回归方程检验

由相关系数表看出,因变量与各个自变量的相关系数都很高,都在0.9 以上,说明变量间的线性相关程度很高,适合做多元线性回归模型。

由2R=0.997以及调整之后的2R=0.997知,模型对样本观测数据的拟合度很好。

对因变量有显著影响,通过F 检验。

因为3t =-0.154 P 值=0.880远远大于α=0.05,故接受原假设,认为3x 对因变量

y 没有显著影响,故应剔除3x 。用后退法剔除变量后,再做回归线性,得如下表:

最后剔除1x 、3x 两个自变量,得出新的回归方程为:

24309.4030.5910.311y x x =-++

F=2718.023 P 值=0.000 故拒绝原假设,通过F 检验。

四 基本假定检验

1、异方差检验

等级相关系数检验

做abs(e)与x的等级相关系数,得出表如下

由表中P值全大于0.01,故接受原假设,模型中不存在异方差。

2、自相关检验

DW=0.992 n=18 k=5,查表得出0.82, 1.87l u d d ==,故DW 落入无法确定的领域。自相关性不明显,由此也看出DW 检验的局限性。 3、多重共线性

因为VIF 中有两个远远的大于10,故模型存在严重的多重共线性。 由共线性诊断表中数据得出,2x 、3x 、4x 之间存在多重共线性。 故先剔除变量4x ,再做线性回归,得出表如下:

由于模型中仍然存在多重共线性,故继续剔除VIF 最大的变量3x ,再做线性回归,得出表如下

由于剔除变量3x 后,VIF 值都小于10,故多重共线性得以消除,得出新的回归方程:

12282.1310.0170.92y x x =--+

4、异常值和强影响值

因为p/n=4/18=0.22 表中

ch=0.644>0.44 故关于x异常。

ii

相关主题
文本预览
相关文档 最新文档