SPSS多元线性回归分析实例操作步骤

  • 格式:docx
  • 大小:267.48 KB
  • 文档页数:13

下载文档原格式

  / 13
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

SPSS 统计分析

多元线性回归分析方法操作与分析

实验目的:引入1998~2008年上海市城市人口密度、城市居民人均可支配收入、五年以上平均年贷款利率和房屋空置率作为变量,来研究上海房价的变动因素。

实验变量:以年份、商品房平均售价(元/平方米)、上海市城市人口密度(人/ 平方公里)、城市居民人均可支配收入(元)、五年以上平均年贷款利率(%)和房屋空置率(%)作为变量。

实验方法:多元线性回归分析法软件: spss19.0

操作过程:第一步:导入Excel数据文件

1.open data document——open data——open;

2. Opening excel data source——OK.

第二步:

1.在最上面菜单里面选中 Analyze——Regression——Linear ,Dependent(因变量)选择商品房平均售价,Independents(自变量)选择城市人口密度、城市居民人均可支配收入、五年以上平均年贷款利率、房屋空置率;Method 选择 Stepwise.

进入如下界面:

2.点击右侧 Statistics,勾选 Regression Coefficients(回归系数)选项组中的 Estimates;勾选 Residuals(残差)选项组中的 Durbin-Watson、

Casewise diagnostics 默认;接着选择 Model fit、Collinearity diagnotics;点击 Continue.

3.点击右侧 Plots,选择*ZPRED(标准化预测值)作为纵轴变量,选择DEPENDNT(因变量)作为横轴变量;勾选选项组中的 Standardized Residual Plots(标准化残差图)中的 Histogram、Normal probability plot;点击 Continue.

4.点击右侧Save,勾选Predicted Vaniues(预测值)和Residuals(残差)选项组中的 Unstandardized;点击 Continue.

5.点击右侧 Options,默认,点击 Continue.

6.返回主对话框,单击 OK.

输出结果分析:

1.引入/剔除变量表

a

该表显示模型最先引入变量城市人口密度(人/平方公里),第二个引

入模型的是变量城市居民人均可支配收入(元),没有变量被剔除。

2.模型汇总

Model Summary c

a. Predictors: (Constant), 城市人口密度(人/平方公里)

b. Predictors: (Constant), 城市人口密度(人/平方公里), 城市居民人均可支配收入(元)

c. Dependent Variable: 商品房平均售价(元/平方米)

该表显示模型的拟合情况。从表中可以看出,模型的复相关系数(R)为 1.000,判定系数(R Square)为 1.000,调整判定系数(Adjusted R Square)为 1.000,估计值的标准误差(Std. Error of the Estimate)为 28.351, Durbin-Watson 检验统计量为 2.845,当DW≈2 时说明残差独立。

3.方差分析表

c

a. Predictors: (Constant), 城市人口密度(人/平方公里)

b. Predictors: (Constant), 城市人口密度(人/平方公里), 城市居民人均可支配收入(元)

c. Dependent Variable: 商品房平均售价(元/平方米)

该表显示各模型的方差分析结果。从表中可以看出,模型的 F 统计量的观察值为 23832.156,概率 p 值为 0.000,在显著性水平为 0.05 的情

形下,可以认为:商品房平均售价(元/平方米)与城市人口密度(人/平方公里),和城市居民人均可支配收入(元)之间有线性关系。

4.回归系数

Coefficients a

该表为多元线性回归的系数列表。表中显示了模型的偏回归系数(B)、标准误差(Std. Error)、常数(Constant)、标准化偏回归系数(Beta)、回归系数检验的 t 统计量观测值和相应的概率 p 值(Sig.)、共线性统计量显示了变量的容差(Tolerance)和方差膨胀因子(VIF)。

令 x1 表示城市人口密度(人/平方公里),x2 表示城市居民人均可支配收入(元),根据模型建立的多元多元线性回归方程为:

y=1555.506+1.020 x1 +0.017x2

方程中的常数项为 1555.506,偏回归系数 b1 为 1.020,b2为

0.017,经 T 检验,b1 和 b2的概率 p 值分别为 0.000 和 0.042,按照给定的显著性水平 0.10 的情形下,均有显著性意义。

根据容差发现,自变量间共线性问题严重;VIF 值为 20.126,也可以说明共线性较明显。这可能是由于样本容量太小造成的。

5.模型外的变量

c

a. Predictors in the Model: (Constant), 城市人口密度(人/平方公里)

b. Predictors in the Model: (Constant), 城市人口密度(人/平方公里), 城市居民人均可支配收入(元)

c. Dependent Variable: 商品房平均售价(元/平方米)

该表显示的是回归方程外的各模型变量的有关统计量,可见模型方程外的各变量偏回归系数经重检验,概率 p 值均大于 0.10,故不能引入方程。

6.共线性诊断

a

该表是多重共线性检验的特征值以及条件指数。对于第二个模型,最大特征值为 2.891,其余依次快速减小。第三列的各个条件指数,可以看出有多重共线性。

7.残差统计量