实验7相关及回归分析SPSS应用
- 格式:doc
- 大小:1.47 MB
- 文档页数:20
实验7 相关与回归分析
7.1实验目的
熟练掌握一元线性回归分析的SPSS应用技能,掌握一元非线性回归分析的SPSS应用技能,对实验结果做出解释。
7.2相关知识(略)
7.3实验内容
7.3.1一元线性回归分析的SPSS实验
7.3.2一元非线性回归分析的SPSS实验
7.4实验要求
7.4.1准备实验数据
1.线性回归分析数据
(The Wall 美国各航空公司业绩的统计数据公布在《华尔街日报1999年年鉴》
Street Journal Almanac 1999)上。航班正点到达的比率和每10万名乘客投诉
的次数的数据,见表7-1所示。
表7-1 美国航空公司航空正点率与乘客投诉次数资料
2.非线性回归分析数据
1992~2013年某国保费收入与国内生产总值的数据,试研究保费收入与国内生产
总值的关系的数据,见表7-2所示。
表7-2 1992~2013年某国保费收入与国内生产总值数据 单位:万元
7.4.2完成一元线性回归分析的SPSS 实验,对实验结果作出简要分析。 7.4.3完成一元非线性回归分析的SPSS 实验,对实验结果作出简要分析。
7.5实验步骤
7.5.1 完成一元线性回归分析的SPSS 实验步骤 1.运用SPSS 绘制散点图散点图。 第一步:在excel 中输入数据
图7-1
第二步:将excel 数据导入spss
单击打开数据文档按钮(或选择菜单文件→打开)→选择文件航空公司航班
正点率与投诉率.xls
图7-2
第三步:选择菜单图形→旧对话框→散点/点状,在散点图/点图对话框中,
选择简单分布按钮
图7-3
第三步:在简单散点图对话框中,将候选变量框中的投诉率添加到Y轴,航班正点率添加到X轴,点击确定:
第四步:运行得到:
根据散点图初步判断航班正点率和投诉率呈线性关系
2.计算相关系数,明确变量之间存在的相关关系。
第一步:选择菜单分析(A)相关(C)→双变量相关(B),在双变量相关
对话框中,将候选变量框中的航班正点率和投诉率添加到变量(V)框,点击确
定:
图7-6
第二步:运行得到
根据相关系数判断:航班正点率和投诉率的相关系数为-0.833,显著性水平P为0.002小于0.05,说明航班正点率和投诉率高度负相关。
3.拟合回归方程
第一步:选择菜单分析(A)→回归(R)→线性(L),将候选变量框中的投诉率添加到因变量框(D),航班正点率添加到自变量框(T),点击确定:
图7-7
第二步,运行得到
拟合回归方程为
Y=-0.07 X + 6.018,常数项和自变量t值分别为5.719和-4.967,
显著性水平P分别为0.001和0.002,均小于0.05,说明常数项和自变量X对因变量Y有显著影响。
4.计算回归标准误差,说明回归直线的代表性;计算样本拟合优度,说明模型拟合的效果。
第一步:操作同3
第二步,运行得到
估计标准误差2
)
(2
--=
∑∧
n Y Y S YX =0.16082比较小,说明回归直线代表性较好。
R 2为0.747接近1,表明模型的拟合效果比较好。
5.在不同置信水平下建立回归估计的置信区间
在置信水平
1-α取不同值的情况下,回归估计的置信区间为:
⎥⎦⎤
⎢⎣
⎡++--+-=⎥⎦⎤⎢⎣⎡+-∧∧222216082.0018.67.0,16082.0018.67.0,ααααZ X Z X S Z Y S Z Y YX YX
6.对估计的回归方程的斜率作出解释
回归方程的斜率,即回归系数b=-0.07,表示航班正点率每提高1%,旅客投诉率会降低0.07%。
7.如果航班按时到达的正点率为80%,估计每10万名乘客投诉的次数。 根据回归方程∧
Y =-0.7 X + 6.018,当航班正点率为80%时,每10万名乘客投诉的次数为-0.7×80+6.018=0.418(次)
8.如果航班按时到达的正点率为80%,试在95%可信程度下估计每10万名乘客投诉的置信区间。
如果航班按时到达的正点率为80%,试在95%可信程度下估计每10万名乘客投诉的置信区间为
⎥⎦⎤⎢⎣
⎡++--+-=⎥⎦⎤⎢⎣⎡+-∧∧222216082.0018.67.0,16082.0018.67.0,ααααZ X Z X S Z Y S Z Y YX YX
=[0.1028,0.7332]
7.5.2完成一元非线性回归分析的SPSS实验步骤
1. 画出这些数据的散点图
第一步:在excel中输入数据
图7-1
第二步:将excel数据导入spss
单击打开数据文档按钮(或选择菜单文件→打开)→选择文件国民生产总值与保费收入.xls
图7-2
第三步:选择菜单图形→旧对话框→散点/点状,在散点图/点图对话框中,
选择简单分布按钮
图7-3
第四步:在简单散点图对话框中,将候选变量框中的将保费收入添加到Y轴,
国民生产总值添加到X轴:
第五步:运行得到:
图7-5
根据散点图初步判:国民生产总值与保费收入呈非线性关系。
2.计算不同模型的样本拟合优度,并据此选择拟合效果最好的模型。