SPSS相关分析报告案例讲解要点
- 格式:doc
- 大小:498.00 KB
- 文档页数:15
第一章 SPSS概览--数据分析实例详解1.1 数据的输入和保存1.1.1 SPSS的界面1.1.2 定义变量1.1.3 输入数据1.1.4 保存数据1.2 数据的预分析1.2.1 数据的简单描述1.2.2 绘制直方图1.3 按题目要求进行统计分析1.4 保存和导出分析结果1.4.1 保存文件1.4.2 导出分析结果欢迎加入SPSS使用者的行列,首先祝贺你选择了权威统计软件中界面最为友好,使用最为方便的SPSS来完成自己的工作。
由于该软件极为易学易用(当然还至少要有不太高的英语水平),我们准备在课程安排上做一个新的尝试,即不急于介绍它的界面,而是先从一个数据分析实例入手:当你将这个例题做完,SPSS的基本使用方法也就已经被你掌握了。
从下一章开始,我们再详细介绍SPSS 各个模块的精确用法。
例1.1 某克山病区测得11例克山病患者与13名健康人的血磷值(mmol/L)如下, 问该地急性克山病患者与健康人的血磷值是否不同?患者: 0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11健康人: 0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87让我们把要做的事情理理顺:首先要做的肯定是打开计算机(废话),然后进入瘟98或瘟2000(还是废话,以下省去废话2万字),在进入SPSS后,具体工作流程如下:1.将数据输入SPSS,并存盘以防断电。
2.进行必要的预分析(分布图、均数标准差的描述等),以确定应采用的检验方法。
3.按题目要求进行统计分析。
4.保存和导出分析结果。
下面就按这几步依次讲解。
§1.1 数据的输入和保存1.1.1 SPSS的界面当打开SPSS后,展现在我们面前的界面如下:请将鼠标在上图中的各处停留,很快就会弹出相应部位的名称。
请注意窗口顶部显示为“SPSS for Windows Data Editor”,表明现在所看到的是SPSS的数据管理窗口。
SPSS典型相关分析案例典型相关分析(Canonical Correlation Analysis,CCA)是一种统计方法,用于研究两组变量之间的相关性。
它可以帮助研究人员了解两组变量之间的关系,并提供有关这些关系的详细信息。
在SPSS中,可以使用典型相关分析来探索两个或多个变量之间的关系,并进一步理解这些变量如何相互影响。
下面我们将介绍一个典型相关分析的案例,以展示如何在SPSS中执行该分析。
案例背景:假设我们有一个医学研究数据集,包含30名患者的多个生物标记物和他们的疾病严重程度评分。
我们希望了解这些生物标记物与疾病严重程度之间的关系,并查看是否可以建立一个线性模型来预测疾病严重程度。
以下是执行这个案例的步骤:第1步:准备数据首先,我们需要准备数据,确保所有变量都是数值型。
在SPSS中,我们可以通过检查数据集的描述性统计信息或查看变量视图来做到这一点。
第2步:导入数据在SPSS中,我们可以通过选择菜单中的"File"选项,然后选择"Open"来导入数据集。
我们应该选择包含待分析数据的文件,并确保正确指定变量的类型。
第3步:执行典型相关分析要执行典型相关分析,我们可以选择菜单中的"Analyze"选项,然后选择"Canonical Correlation"。
在弹出的对话框中,我们应该选择我们希望研究的生物标记物变量和疾病严重程度评分变量。
然后,我们可以选择一些选项,如方差-协方差矩阵、相关矩阵和判别系数,并点击"OK"执行分析。
第4步:解释结果完成分析后,SPSS将提供几个输出表。
我们应该关注典型相关系数和标准化典型系数,以了解两组变量之间的关系。
我们可以使用这些系数来解释生物标记物如何与疾病严重程度相关联,并找到最重要的变量。
此外,我们还可以使用SPSS提供的其他统计结果来进一步解释模型的效果和预测能力。
某道路弯道处53车辆减速前观测到的车辆运行速度,试检验车辆运行速度是否服从正态分布。
这道题目的解答可以先通过绘制样本数据的直方图、P-P图和Q-Q图坐车粗略判断,然后利用非参数检验的方法中的单样本K-S检验精确实现。
一、初步判断1.1绘制直方图(1)操作步骤在SPSS软件中的操作步骤如图所示。
(2)输出结果通过观察速度的直方图及其与正态曲线的对比,直观上可以看到速度的直方图与正太去线除了最大值外,整体趋势与正态曲线较吻合,说明弯道处车辆减速前的运行速度有可能符合正态分布。
1.2绘制P-P图(1)操作步骤在SPSS软件中的操作步骤如图所示。
(2)结果输出根据输出的速度的正态P-P 图,发现速度均匀分布在正态直线的附近,较多部分与正态直线重合,与直方图的结果一致,说明弯道处车辆减速前的运行速度可能服从正态分布。
二、单样本K-S 检验2.1单样本K-S 检验的基本思想K-S 检验能够利用样本数据推断样本来自的总体是否服从某一理论分布,是一种拟合优的检验方法,适用于探索连续型随机变量的分布。
单样本K-S 检验的原假设是:样本来自的总体与指定的理论分布无显著差异,即样本来自的总体服从指定的理论分布。
SPSS 的理论分布主要包括正态分布、均匀分布、指数分布和泊松分布等。
单样本K-S 检验的基本思路是:首先,在原假设成立的前提下,计算各样本观测值在理论分布中出现的累计概率值F(x),;其次,计算各样本观测值的实际累计概率值S(x);再次,计算实际累计概率值与理论累计概率值的差D(x);最后,计算差值序列中的最大绝对值差值,即)()(i i x F x S max D -= 通常,由于实际累计概率为离散值,因此D 修正为: )()(1i i x F x S max D -=- D 统计量也称为K-S 统计量。
在小样本下,原假设成立时,D 统计量服从Kolmogorov 分布。
在大样本下,原假设成立时,D n 近似服从K(x)分布:当D 小于0时,K(x)为0;当D 大于0时,)2-(exp )1-()(22x j x K j ∑∞-∞==容易理解,如果样本总体的分布与理论分粗的差异不明显,那么D 不应较大。
SPSS实验分析报告二一、婆媳关系*住房条件检验(一)、提出原假设H0原假设: 婆媳关系的好坏程度与住房条件有关系(二)、两独立样本t检验结果及分析表(一)觀察值處理摘要觀察值有效遺漏總計N百分比N百分比N百分比婆媳关系* 住房条件600100.0%00.0%600100.0%由表(一)可知, 本次调查获得的有效样本为600份, 没有遗漏的个案。
表(二)婆媳关系*住房条件交叉列表住房条件總計差一般好婆媳关系紧张計數577860195預期計數48.868.378.0195.0婆媳关系內的%29.2%40.0%30.8%100.0%住房条件內的%38.0%37.1%25.0%32.5%佔總計的百分比9.5%13.0%10.0%32.5%殘差8.39.8-18.0一般計數458763195預期計數48.868.378.0195.0婆媳关系內的%23.1%44.6%32.3%100.0%住房条件內的%30.0%41.4%26.3%32.5%佔總計的百分比7.5%14.5%10.5%32.5%殘差-3.818.8-15.0好計數4845117210預期計數52.573.584.0210.0婆媳关系內的%22.9%21.4%55.7%100.0%住房条件內的%32.0%21.4%48.8%35.0%佔總計的百分比8.0%7.5%19.5%35.0%殘差-4.5-28.533.0總計計數150210240600預期計數150.0210.0240.0600.0婆媳关系內的%25.0%35.0%40.0%100.0%住房条件內的%100.0%100.0%100.0%100.0%佔總計的百分比25.0%35.0%40.0%100.0%由表(二)可知, 一共调查了600人, 其中婆媳关系紧张的组有195人, 占总人数的32.5%;婆媳关系一般的组有195人, 占总人数的32.5%;婆媳关系好的组有210人, 占总人数的35.0%;数据分布均匀。
spss案例分析报告(精选)本文通过分析一份 SPSS 数据,展示 SPSS 在统计分析中的应用。
数据概述本数据为一家咖啡馆的销售数据,共有 200 条记录,包括 7 个变量:日期、时间、收银员、商品名、销售价格、数量和总价。
SPSS 分析1. 描述性统计使用 SPSS 的描述性统计功能,可以获取数据的基本信息,如均值、标准偏差、最大值、最小值等。
其中,销售价格的均值为 44.71 元,标准偏差为 13.29 元,最小值为 23 元,最大值为 78 元。
数量的均值为 1.62 个,标准偏差为 0.51 个,最小值为 1 个,最大值为3 个。
总价的均值为 73.25 元,标准偏差为 21.89 元,最小值为 23 元,最大值为 156 元。
2. 单样本 t 检验假设一杯咖啡的平均售价为 50 元,我们可以使用单样本 t 检验对这个假设进行检验。
首先,我们需要用 SPSS 的数据透视表功能,计算出每杯咖啡的平均售价。
然后,使用单样本 t 检验功能,输入样本均值、假设的总体均值(50 元)、样本标准差、样本大小以及置信度水平。
在这个数据集中,单样本 t 检验得出的 t 值为 -2.36,P 值为 0.019,显著性水平为 0.05,因此我们可以拒绝原假设,认为该咖啡馆的咖啡售价不是 50 元。
4. 相关分析假设我们想要了解商品数量和销售额之间的关系,我们可以使用 SPSS 的相关分析功能来进行分析。
首先,我们需要使用数据透视表功能,计算出每个订单的总价和数量。
然后,使用相关分析功能,输入这两个变量的值,得出相关系数和显著性水平。
在这个数据集中,商品数量和销售额之间的相关系数为 0.749,P 值为 0,显著性水平非常显著。
因此,我们可以认为商品数量和销售额之间存在极强的正相关关系。
结论本文通过 SPSS 对一份咖啡馆销售数据进行分析,展示了 SPSS 在统计分析中的应用。
通过描述性统计、单样本 t 检验、双样本 t 检验和相关分析等功能,我们可以获得数据的基本信息,检验假设,分析变量之间的关系,从而帮助企业更好地决策和管理。
spss地大数据分析资料报告案例spss 的大数据分析资料报告案例在当今数字化时代,数据已成为企业和组织决策的重要依据。
SPSS (Statistical Product and Service Solutions)作为一款功能强大的统计分析软件,在处理和分析大数据方面发挥着重要作用。
本文将通过一个实际的案例,展示如何运用 SPSS 进行大数据分析,并从中得出有价值的结论。
一、案例背景假设我们是一家电商公司,拥有大量的用户交易数据。
我们希望通过对这些数据的分析,了解用户的购买行为、偏好以及市场趋势,以便优化产品推荐、营销策略和供应链管理。
二、数据收集与整理首先,我们从数据库中提取了相关的数据,包括用户的基本信息(如年龄、性别、地域等)、购买记录(产品类别、购买时间、购买金额等)以及浏览行为等。
这些数据量庞大,可能达到数百万甚至数千万条记录。
在将数据导入 SPSS 之前,我们需要对数据进行预处理,包括数据清洗、缺失值处理和异常值检测。
例如,删除重复的记录、填充缺失的关键信息,并剔除明显不符合常理的异常值。
三、数据分析方法1、描述性统计分析通过计算均值、中位数、标准差等统计量,对用户的年龄、购买金额等变量进行概括性描述,了解数据的集中趋势和离散程度。
2、相关性分析分析不同变量之间的相关性,例如用户年龄与购买金额之间、购买频率与产品类别之间的关系。
3、分类分析使用聚类分析将用户分为不同的群体,以便针对不同群体制定个性化的营销策略。
4、时间序列分析对于购买时间等变量,运用时间序列分析方法预测未来的销售趋势。
四、SPSS 操作与结果解读1、描述性统计分析结果例如,我们发现用户的平均年龄为 30 岁,购买金额的中位数为 500 元,标准差为 200 元。
这表明大部分用户年龄较为年轻,购买金额分布相对较为集中。
2、相关性分析结果发现用户年龄与购买金额之间存在较弱的正相关关系,即年龄较大的用户可能购买金额相对较高。
spss案例大数据分析报告SPSS 案例大数据分析报告在当今数字化时代,数据已成为企业和组织决策的重要依据。
通过对大量数据的分析,可以揭示隐藏在其中的规律和趋势,为决策提供有力支持。
本报告将以一个具体的案例为例,展示如何使用 SPSS 进行大数据分析。
一、案例背景本次分析的对象是一家电商企业的销售数据。
该企业在过去一年中积累了大量的销售记录,包括商品信息、客户信息、订单金额、购买时间等。
企业希望通过对这些数据的分析,了解客户的购买行为和偏好,优化商品推荐和营销策略,提高销售业绩。
二、数据收集与整理首先,从企业的数据库中提取了相关数据,并进行了初步的清理和整理。
删除了重复记录和缺失值较多的字段,对数据进行了标准化处理,使其具有统一的格式和单位。
在整理数据的过程中,发现了一些问题。
例如,部分客户的地址信息不完整,部分商品的分类存在错误。
通过与相关部门沟通和核实,对这些问题进行了修正和补充。
三、数据分析方法本次分析主要采用了以下几种方法:1、描述性统计分析计算了数据的均值、中位数、标准差、最大值、最小值等统计指标,以了解数据的集中趋势和离散程度。
2、相关性分析分析了不同变量之间的相关性,例如商品价格与销量之间的关系,客户年龄与购买金额之间的关系。
3、聚类分析将客户按照购买行为和偏好进行聚类,以便更好地了解客户群体的特征。
4、因子分析提取了影响客户购买行为的主要因素,为进一步的分析和建模提供基础。
四、数据分析结果1、描述性统计分析结果商品的平均价格为_____元,中位数为_____元,标准差为_____元。
销量的最大值为_____件,最小值为_____件,均值为_____件。
客户的平均年龄为_____岁,中位数为_____岁,标准差为_____岁。
购买金额的最大值为_____元,最小值为_____元,均值为_____元。
2、相关性分析结果商品价格与销量之间呈现负相关关系,相关系数为_____。
这表明价格越高,销量越低。
spss案例分析报告一、引言在本次报告中,将使用SPSS软件进行案例分析,对某一具体问题进行统计分析和数据可视化,以便对问题进行深入的了解和解释。
二、问题描述本次案例分析的问题是研究一个新产品在市场上的受欢迎程度与其价格、广告投入和消费者年龄之间的关系。
希望通过统计分析找出这些变量之间的关联,以便制定更好的市场策略。
三、数据收集与准备1. 数据收集从市场调研公司获取了500个有效问卷,并收集了新产品的价格、广告投入以及消费者的年龄等相关数据。
2. 数据清洗对数据进行了清洗和整理,包括去除缺失值、异常值的处理,使得数据集可用于后续的分析。
四、数据分析1. 描述性统计分析通过SPSS软件进行了描述性统计分析,包括对新产品价格、广告投入和消费者年龄的平均值、标准差、最小值和最大值等指标的计算。
2. 相关性分析利用SPSS软件进行了相关性分析,研究新产品受欢迎程度与价格、广告投入以及消费者年龄之间的关系。
结果显示价格与受欢迎程度之间存在较强的负相关,广告投入与受欢迎程度之间存在较强的正相关,而消费者年龄与受欢迎程度之间则没有明显的相关性。
3. 回归分析为了进一步探讨价格和广告投入对受欢迎程度的影响程度,进行了回归分析。
通过SPSS软件计算出了价格和广告投入对受欢迎程度的回归方程,并利用F检验和t检验对该方程的显著性进行了验证。
五、结果与讨论1. 描述性统计分析结果显示,新产品的平均价格为XXX元,标准差为XXX元,对消费者而言具有一定的价格竞争力。
广告投入的平均值为XXX万元,标准差为XXX万元,表明公司在产品推广方面投入了相对较高的资源。
而消费者的年龄平均值为XXX岁,标准差为XXX岁,消费者整体上比较年轻。
2. 相关性分析结果显示,新产品的价格与受欢迎程度之间存在较强的负相关,即价格越高,受欢迎程度越低;广告投入与受欢迎程度之间存在较强的正相关,即广告投入越高,受欢迎程度越高。
这表明在制定市场策略时,应考虑价格和广告投入对受欢迎程度的影响。
相关分析一、两个变量的相关分析:Bivariate1.相关系数的含义相关分析是研究变量间密切程度的一种常用统计方法。
相关系数是描述相关关系强弱程度和方向的统计量,通常用r 表示。
①相关系数的取值范围在-1和+1之间,即:–1≤r ≤ 1。
②计算结果,若r 为正,则表明两变量为正相关;若r 为负,则表明两变量为负相关。
③相关系数r 的数值越接近于1(–1或+1),表示相关系数越强;越接近于0,表示相关系数越弱。
如果r=1或–1,则表示两个现象完全直线性相关。
如果=0,则表示两个现象完全不相关(不是直线相关)。
④3.0<r ,称为微弱相关、5.03.0<≤r ,称为低度相关、8.05.0<≤r ,称为显著(中度)相关、18.0<≤r ,称为高度相关⑤r 值很小,说明X 与Y 之间没有线性相关关系,但并不意味着X 与Y 之间没有其它关系,如很强的非线性关系。
⑥直线相关系数一般只适用与测定变量间的线性相关关系,若要衡量非线性相关时,一般应采用相关指数R 。
2.常用的简单相关系数(1)皮尔逊(Pearson )相关系数皮尔逊相关系数亦称积矩相关系数,1890年由英国统计学家卡尔•皮尔逊提出。
定距变量之间的相关关系测量常用Pearson 系数法。
计算公式如下:∑∑∑===----=n i n i i i n i i i y y x xy y x x r 11221)()())(( (1) (1)式是样本的相关系数。
计算皮尔逊相关系数的数据要求:变量都是服从正态分布,相互独立的连续数据;两个变量在散点图上有线性相关趋势;样本容量30≥n 。
(2)斯皮尔曼(Spearman )等级相关系数Spearman 相关系数又称秩相关系数,是用来测度两个定序数据之间的线性相关程度的指标。
当两组变量值以等级次序表示时,可以用斯皮尔曼等级相关系数反映变量间的关系密切程度。
它是根据数据的秩而不是原始数据来计算相关系数的,其计算过程包括:对连续数据的排秩、对离散数据的排序,利用每对数据等级的差额及差额平方,通过公式计算得到相关系数。
其计算公式为:()16122--=∑n n d r R (2)(2)式中,R r 为等级相关系数;d 为每对数据等级之差;n 为样本容量。
斯皮尔曼等级相关对数据条件的要求没有积差相关系数严格,只要两个变量的观测值是成对的等级评定资料,或者是由连续变量观测资料转化得到的等级资料,不论两个变量的总体分布形态、样本容量的大小如何,都可以用斯皮尔曼等级相关来进行研究。
(3)肯德尔(Kendall )等级相关系数肯德尔(Kendall )等级相关系数是在考虑了结点(秩次相同)的条件下,测度两组定序数据或等级数据线性相关程度的指标。
它利用排序数据的秩,通过计算不一致数据对在总数据对中的比例,来反映变量间的线性关系的。
其计算公式如下:()141--=∑n n i r K (3)(3)式中,K r 是肯德尔等级相关系数;i 是不一致数据对数;n 为样本容量。
计算肯德尔等级相关系数的数据要求与计算斯皮尔曼等级相关系数的数据要求相同。
3.相关系数的显著性检验通常,我们用样本相关系数r 作为总体相关系数ρ的估计值,而r 仅说明样本数据的X 与Y 的相关程度。
有时候,由于样本数据太少或其它偶然因素,使得样本相关系数r 值很大,而总体的X 与Y 并不存在真正的线性关系。
因而有必要通过样本资料来对X 与Y 之间是否存在真正的线性相关进行检验,即检验总体相关系数ρ是否为零(即原假设是:总体中两个变量间的相关系数为0)。
SPSS 的相关分析过程给出了该假设成立的概率(输出结果中的Sig.)。
样本简单相关系数的检验方法为:当原假设0H :0=ρ,50≥n 时,检验统计量为:211rn r Z --= (4) 当原假设0H :0=ρ,50<n 时,检验统计量为:212r n r t --= ()2-=n df (5)式中,r 为简单相关系数;n 为观测值个数(或样本容量)。
4.背景材料设有10个厂家,序号为1,2,…,10,各厂的投入成本记为x ,所得产出记为y 。
各厂家的投入和产出如表7-18-1所示,根据这些数据,可以认为投入和产出之间存在相关性吗?表1 10个厂家的投入产出 单位:万元5.操作步骤5-1 绘制散点图的步骤(1)选择菜单命令“Graphs ”→“Legacy Dialogs ”→“Scatter/Dot ”,打开Scatter/Dot 对话框,如图1所示。
图1 选择散点图窗口(2)选择散点图类型。
SPSS 提供了五种类型的散点图。
(3)根据所选择的散点图类型,单击“Define”按钮设置散点图。
不同类型的散点图的设置略有差别。
①简单散点图(Simple Scatter)简单散点图的设置窗口如图2所示。
图2 简单散点图的设置窗口从对话框左侧的变量列表中指定某个变量为散点图的纵坐标和横坐标,分别选入Y-Axis和X-Axis框中。
这两项是必选项。
可以把作为分组的变量指定到Set Markers by框中,根据该变量取值的不同对同一个散点图中的各点标以不同的颜色(或形状)。
该项可以省略。
把标记变量指定到Label Cases by框中,表示将标记变量的各变量值标记在散点图的旁边。
该项可以省略。
从左侧变量列表框中选择变量到Panel by框中作为分类变量,可以使该变量作为行(Rows)或列(Columns)将数据分成不同的组,便于比较。
该项可以省略。
选择Use Chart Specifications From选项,可以选择散点图的文件模板,单击“File”可以选择指定的文件。
单击“Title”按钮可以对散点图的标题进行设置,单击“Options”按钮可以对缺失值以及是否显示数据的标注进行设置。
②重叠散点图(Overlay Scatter)重叠散点图能同时生成多对相关变量间统计关系的散点图,首先根据分类变量的不同取值对原始数据进行分类,然后对各分类数据做简单散点图。
重叠散点图的设置窗口如图7-18-3所示。
图3 重叠散点图的设置窗口从左侧框中选择一对变量进入Pairs框中,其中前一个为图的纵坐标变量(Y-Variable),后一个作为图的横轴变量(X-Variable),可以通过点击按钮进行横纵轴变量的调换。
其他设置与同简单散点图都相同。
③矩阵散点图(Matrix Scatter)矩阵散点图以方形矩阵的形式在多个坐标轴上分别显示多对变量间的统计关系。
矩阵散点图的关键是弄清各矩阵单元中的横纵变量。
矩阵散点图的设置窗口如图4所示。
图4 矩阵散点图的设置窗口把参与绘图的若干变量指定到Matrix Variables框中。
选择变量的先后顺序决定了矩阵对角线上变量的排列顺序。
其他设置也与简单散点图相同。
④三维散点图(3-D Scatter)三维散点图生成三个相关变量的三维散点图,由三个坐标轴对应变量的数据决定,它以立体图的形式展现三对变量间的统计关系。
设置窗口如图5所示。
图5 三维散点图设置窗口从左侧的变量列表中指定三个变量分别选入Y-Axis、X-Axis、Z-Axis框中。
其他设置均与简单散点图相同。
⑤单点散点图(Sample Dot)单点散点图生成单个变量的散点图,显示数值型变量的每一个观测值,这些值都堆积在X轴附近,由于没有指定Y轴,所以数据点的Y坐标没有特殊的含义。
设置窗口如图6所示。
图6 单点散点图设置窗口从左侧变量列表中选择一个变量选入X-Axis Variable框中。
其他设置与简单散点图相同。
5-2 计算简单相关系数的操作步骤通过散点图可以初步判断变量是否具有线性趋势。
对具有线性趋势的变量计算相应的简单相关系数的步骤如下:(1)选择菜单命令“Analyze”→“Correlate”→“Bivariate”,打开两变量相关分析的对话框,如图7所示。
图7 两变量相关分析窗口(2)选入需要进行相关分析的变量进入Variables框,至少需要选入两个,如选入“投入”、“产出”变量。
(3)在Correlation Coefficients复选框中选择需要计算的相关系数。
主要有:Pearson复选框:选择进行积距相关分析,即最常用的参数相关分析;Kendall's tau-b复选框:计算Kendall's等级相关系数;Spearman复选框:计算Spearman 相关系数,即最常用的非参数相关分析(秩相关)。
(4)Test of Significance单选框用于确定是进行相关系数的单侧(One-tailed)或双侧(Two-tailed)检验,系统默认双侧检验。
(5)Flag significant correlations用于确定是否在结果中用星号标记有统计学意义的相关系数,一般选中。
此时P<0.05的系数值旁会标记一个星号,P<0.01的则标记两个星号。
(6)单击Options按钮,弹出Options对话框,选择需要计算的描述统计量和统计分析,如图8所示。
图8 两变量相关分析的Options子对话框在Statistics复选框中定义各变量输出的描述统计量。
Means and standard deviations选项表示每个变量的样本均值和标准差;Cross-product deviations and covariances选项表示各对变量的离差平方和、样本方差、两变量的叉积离差以及协方差阵。
叉积离差为Pearson相关系数公式中的分子部分;协方差为叉积离差/(n-1)。
在Missing Values单选框中定义分析中对缺失值的处理方法,可以是具体分析用到的两个变量有缺失值才去除该记录(Exclude cases pairwise),或只要该记录中进行相关分析的变量有缺失值(无论具体分析的两个变量是否缺失),则在所有分析中均将该记录去除(Excludes cases listwise)。
(7)单击“OK”按钮完成设置,提交运行。
6.结果解析根据背景资料,利用表1中的数据,建立SPSS数据文件,分别将变量投入、产出选入Variables框中,并在Options子对话框选中Means and standard deviations 选项和Cross-product deviations and covariances选项,其他选择默认。
结果如表2、表3所示。
6-1 表2为描述统计量,表3为相关分析结果。
从表3中可以看出皮尔逊相关系数为0.759,即投入与产出的相关系数为0.759,双侧检验的P值为0.011,明显小于0.05,拒绝二者不相关的原假设。
因此,我们可以得出结论:可以认为投入与产出之间存在正相关,当投入增加时,产出也会相应增加。