多元线性回归SPSS实验报告

  • 格式:docx
  • 大小:684.27 KB
  • 文档页数:7

下载文档原格式

  / 7
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

回归分析基本分析:

将毕业生人数移入因变量,其他解释变量移入自变量。在统计量中选择估计和模型拟合度,得到如图

注解:模型的拟合优度检验:

第二列:两变量(被解释变量和解释变量)的复相关系数R=0.999。

第三列:被解释向量(毕业人数)和解释向量的判定系数R2=0.998。

第四列:被解释向量(毕业人数)和解释向量的调整判定系数R2=0.971。在多个解释变量的时候,需要参考调整的判定系数,越接近1,说明回归方程对样本数据的拟合优度越高,被解释向量可以被模型解释的部分越多。

第五列:回归方程的估计标准误差=9.822

回归方程的显著性检验-回归分析的方差分析表

F检验统计量的值=776.216,对应的概率p值=0.000,小于显著性水平0.05,应拒绝回归方程显著性检验原假设(回归系数与0不存在显著性差异),认为:回归系数不为0,被解释变量(毕业生人数)和解释变量的线性关系显著,可以建立线性模型。

注解:回归系数的显著性检验以及回归方程的偏回归系数和常数项的估计值

第二列:常数项估计值=-544.366;其余是偏回归系数估计值。

第三列:偏回归系数的标准误差。

第四列:标准化偏回归系数。

第五列:偏回归系数T检验的t统计量。

第六列:t统计量对应的概率p值;小于显著性水平0.05,拒接原假设(回归系数与0不存在显著性差异),认为回归系数部位0,被解释变量与解释变量的线性关系是显著的;大于显著性水平0.05,接受原假设(回归系数与0不存在显著性差异),认为回归系数为0被解释变量与解释变量的线性关系不显著的。

于是,多元线性回归方程为:

ŷ=-544.366+0.032x1+0.009x2+0.001x3-0.1x5+3.046x6

回归分析的进一步分析:

1.多重共线性检验

从容差和方差膨胀因子来看,在校学生数和教职工总数与其他解释变量的多重共线性很严重。在重新建模中可以考虑剔除该变量

共线性诊断a

模型维数特征值条件索引

方差比例

(常量)

普通高校

数(所)

研究与试

验发展机

构数(个)

发表科技

论文数量

(篇)

专利申请

授权数

(件)

在校学生

数(万人)

教职工总数

(万人)

注解:第二列:特征根

第三列:条件指数

从条件指数看,第3、4、5、6、7个条件指数都大于10,说明变量之间存在多重共线性。

第4-10列:各特征根解释各解释变量的方差比。

从方差比看,第5个特征根解释投入普通高校人数96%;发表科技论文数49%;可以认为:这些变量存在多重共线性。需要建立回归方程。

2.重建回归方程

输入/移去的变量b

模型输入的变量移去的变量方法1教职工总数(万

人),专利申请授

权数(件),研究

与试验发展机构

数(个),普通高

校数(所), 发表

科技论文数量

(篇), 在校学生

数(万人)a

. 输入

2 . 在校学生数(万

人)向后(准则: F-to-remove >=.100 的概率)。

3 .普通高校数(所) 向后(准则: F-

to-remove >= .

100 的概率)。

4 . 研究与试验发展

机构数(个)向后(准则: F-to-remov

e >= .100 的概率)。

注解:引入/剔除变量表

分别剔除在校学生数(万人),普通高校数(所),研究与试验发展机构数(个),专利申请授权数(件)四个变量

注解:利用向后筛选策略建立回归模型,经过四步完成回归方程的建立,最终模型为第五个模型,依次剔除的变量是在校学生数(万人),普通高校数(所),研究与试验发展机构数(个),专利申请授权数(件)

模型五的负相关系数R=0.999。

判别系数R2=0.998.

调整判别系数R2=0.997,若将作用不显著的变量引入方程,则该系数会减少。

估计的标准误差=9.774。

模型二中偏F检验的概率P值=0.749,对于显著性水平0.05,接受原假设(剔除变量的偏回归系数与0无显著性差异),认为:剔除的变量在校大学生人数的偏

回归系数与0无显著性差异。该变量对被解释变量的线性解释没有显著性贡献,

不应保留在回归方程中。

模型三中偏F检验的概率P值=0.526,对于显著性水平0.05,接受原假设(剔除变量的偏回归系数与0无显著性差异),认为:剔除的变量普通高校数的偏回归系数与0无显著性差异。该变量对被解释变量的线性解释没有显著性贡献,不应保留在回归方程中。

模型四中偏F检验的概率P值=0.135,对于显著性水平0.05,接受原假设(剔除变量的偏回归系数与0无显著性差异),认为:剔除的变量研究与试验发展机构数(个)的偏回归系数与0无显著性差异。该变量对被解释变量的线性解释没有显著性贡献,不应保留在回归方程中。

模型五中偏F检验的概率P值=0.304,对于显著性水平0.05,接受原假设(剔除变量的偏回归系数与0无显著性差异),认为:剔除的变量专利申请授权数(件)的偏回归系数与0无显著性差异。该变量对被解释变量的线性解释没有显著性贡献,不应保留在回归方程中。

最终保留的回归方程的变量有:教职工总数和发表论文数

回归方程的DW检验值=1.971,表现残差序列存在正相关。说明该回归方程没有充分说明被解释变量的变化规律,可能方程中遗漏了一些重要的解释变量