第4章 SPSS统计分析模块介绍

  • 格式:ppt
  • 大小:590.50 KB
  • 文档页数:39

下载文档原格式

  / 39
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ChongQing Normal University 4
1.1 Frequencies过程的特色是产生频数表; 1.2 Descriptives过程进行一般性的统计描述; 1.3 Explore过程用于对数据概况不清时的探 索性分析; 1.4 Crosstabs过程则完成计数资料和等级资 料的统计描述和一般的统计检验。看图
ChongQing Normal University 8
好了,既然一般线性模型的能力如此强大, 那么下属的四个子菜单各自的功能是什么呢? 请看: 3.1 Univariate子菜单:四个菜单中的大哥大, 绝大部分的方法分析都在这里面进行。 3.2 Multivariate子菜单:当结果变量(因变量) 不止一个时,可用他来分析。
ChongQing Normal University 20
9、信度分析与多维尺度分析——Baidu NhomakorabeaScale菜单
在Scale菜单提供的几种统计方法都属于尺度分析 的范畴,它们是探索研究事物间的相似性/不相似性 的专用技术。具体来说,这些方法和用途是: 9.1 Reliability Analysis过程:用于评价问卷这种测量 工具的稳定性或可靠性,具体来说就是用问卷对同一 事物进行重复测量时,所得结果的一致性程度。可以 进行内在信度分析,即评价问卷中各个问题是否测量 的是同一个概念。
ChongQing Normal University
看图
3
1、描述性统计分析-- Descriptive Statistics菜单
描述性统计分析是统计分析的第一步, 做好这第一步是下面进行正确统计推断的 先决条件。SPSS的许多模块均可完成描述 性分析,但专门为该目的而设计的几个模 块则集中在Descriptive Statistics菜单中, 最常用的是列在最前面的四个过程:
ChongQing Normal University 14
6、对数线性模型——Loglinear菜单
对数线性模型是一种纯粹应用于分类变量分析的多 元统计方法。它是一种比较新型的分析方法,在分析 高维列联表时优势尤为突出。由以下三个过程组成: 6.1 General过程——用于进行一般对数线性模型分析, 主要用于证实性研究。此时研究人员只对某些特定效 应感兴趣,即已经有关于模型的假设,此时就可以采 用一般模型来检验这一假设是否正确、充分,它可以 对总模型和各个参数给出详细的检验结果。对变量不 分因变量自变量,在分析中一视同仁,最后在结果解 释时才由研究人员来做出判断。
ChongQing Normal University 15
6.2 Logit过程——当研究人员已经有了一些线索,知道因 变量自变量时,如果应变量为两分类,就可以用这个过程 来分析。 6.3 Model Selection过程——分层对数线性模型。一般线 性对数模型可以对每个系数及总模型给出非常丰富和详细 的信息,但是它要求研究人员心中已经有了一定的思路或 线索,或只对某些特定效应项感兴趣,即已经有关于简约 模型的假设。如果在探索性分析中研究人员中只是设想若 干分类变量之间可能有关系,但是并无明确假设,也没有 具体分出哪个是应变量、哪个是自变量,此时比较适宜采 用分层对数线性模型分析。
ChongQing Normal University
2
线性回归与曲线拟合―― Regression菜单 对数线性模型——Loglinear菜单 聚类分析与判别分析——Classify菜单 因子分析与对应分析——Data Reduction菜单 信度分析与多维尺度分析——Scale菜单 非参数检验――Nonparametric Tests菜单 Survival菜单
ChongQing Normal University
11
4.1 Bivariate过程:此过程用于进行两个/多个变量间的参数/非 参数相关分析,如果是多个变量,则给出两两相关的分析结果。 这是Correlate子菜单中最为常用的一个过程,实际上我们对他 的使用可能占到相关分析的95%以上。 4.2 Partial过程:如果需要进行相关分析的两个变量其取值均 受到其他变量的影响,就可以利用偏相关分析对其他变量进行 控制,输出控制其他变量影响后的相关系数。Partial过程就是 专门进行偏相关分析的。 4.3 Distances过程:调用此过程可对同一变量内部各观察单位 间的数值或各个不同变量间进行距离相关分析,前者可用于检 测观测值的接近程度,后者则常用于考察预测值对实际值的拟 合优度。该过程在实际应用中用的非常少。看图
ChongQing Normal University 16
7、聚类分析与判别分析——Classify菜单
聚类分析和判别分析都是将记录或变量分类的方法, 所不同的是聚类分析是把没有分类信息的资料按相似程 度归类,有一定探索性的味道;而判别分析则是从已知 的分类情况中总规律,为以后判断新观测所属类别提供 依据。 Classify菜单提供如下三个过程: 7.1 K-means Cluster过程——对记录进行快速聚类,当 明确所需要分出的类别数时,采用快速聚类可以节省运 算时间。根据经验,如果样本量大于100,则有必要考 虑是否使用快速聚类。
ChongQing Normal University 21
10、非参数检验――Nonparametric Tests菜单
作为二十一世纪统计理论的三大发展方向之一,非参数统计是统 计分析的重要组成部分。可是与之很不相称的是他针对一般性统计 分析的理论发展远远不及参数检验完善,因而比较完善的可供使用 的方法也不多。比如多组均数间的两两比较,虽然已有好几种方法 可资利用,但由于在理论上仍存在争议,几种权威的统计软件(如 SAS和SPSS)均没有提供这方面的方法。 虽然这些洋统计软件没有提供两两比较的非参数方法,但国产的 统计软件大都是提供了的(国情不同嘛),因此建议大家:如果真 的要做这方面的非参数分析,不如直接用PEMS、SPLMWIN、NOSA 等国产软件,免得用SPSS等只能做一半。 在SPSS中,几乎所有的非参数分析方法都被放入了Nonparametric Tests菜单中,具体来讲有以下几种:
第二章 SPSS各统计分析模块介绍
陈道平 重庆师范大学数学与计算机学院
SPSS的主要分析工具 的主要分析工具——Analyze菜单 的主要分析工具 菜单
描述性统计分析--Descriptive Statistics菜单 均数间的比较--Compare Means菜单 一般线性模型――General Linear Model菜单 相关分析――Correlate菜单
看 图
ChongQing Normal University
10
4、相关分析――Correlate菜单
在数据分析中经常要遇到分析两个或多个变量间 关系的情况,有时是希望了解某个变量对另一个变量 的影响强度,有时则是要了解变量间联系的密切程度, 前者用下一章将要讲述的回归分析来实现,后者则需 要用到本章所要讲述的相关分析实现。 SPSS的相关分析功能被集中在Analyze菜单的 Correlate子菜单中,他一般包括以下三个过程:
ChongQing Normal University
17
7.2 Hierarchical Cluster过程——习惯上翻译成 系统聚类法,该过程提供了全面而强大的聚类 分析能力,可对记录或变量进行聚类。更为重 要的是,参与系统聚类分析的变量不再像快速 聚类一样限于连续性变量,它们可以是两分类 或多分类变量。 7.3 Discriminant过程——提供了全面的类别分 析功能,所用变量可一次进入,也可以使用逐 步法筛选出最优类别方程。看图
ChongQing Normal University 13
5.3 Binary Logistic过程——所谓Logistic模型,或者说 Logistic回归模型,就是人们想为两分类的应变量作一个 回归方程出来,可概率的取值在0~1之间,回归方程的应 变量取值可是在实数集中,直接做会出现0~1范围之外的 不可能结果,因此就有人耍小聪明,将概率做了一个Logit 变换,这样取值区间就变成了整个实数集,作出来的结果 就不会有问题了,从而该方法就被叫做了Logistic回归。 随着模型的发展,Logistic家族也变得人丁兴旺起来, 除了最早的两分类Logistic外,还有配对Logistic模型,多 分类Logistic模型、随机效应的Logistic模型等。看图
ChongQing Normal University 18
8、因子分析与对应分析—— Data Reduction菜单
该方法主要目的都是浓缩数据,或称数据化简,即 以最少的信息丢失为代价将众多的观测变量浓缩为少 数几个因素,从而简化问题,或发现事物的内在联系。 8.1 Factor过程——提供因子分析/主成分分析方法, 它们是最为常用的数据简化方法,用于考察多个定量 变量间的内在结构,或者提取数据的主要信息。
ChongQing Normal University
19
8.2 Correspondence Analysis过程——进行简 单对应分析,该方法同样以数据简化的原则力 图直观的给出各两个分类变量各个类别之间的 联系,当各个变量的类别越多时,该方法的优 势就越明显。 8.3 Optimal Scaling过程——进行最优尺度分 析,该方法的核心目的也是力图在低维度空间 表述两个或多个变量之间的内在联系。所分析 的变量以分类变量为主,但也可以为连续性变 量。该方法实际上包括,但不仅仅限于对应分 析方法。看图
ChongQing Normal University 7
3、一般线性模型――General Linear Model菜单
一般线性模型可不是用一章就可以说清楚的,因为它包括 的内容实在太多了。 那么,究竟我们用到的哪些分析会包含在其中呢?简而 言之:凡是和方差分析粘边的都可以用他来做。比如成组设计 的方差分析(即单因素方差分析)、配伍设计的方差分析(即 两因素方差分析)、交叉设计的方差分析、析因设计的方差分 析、重复测量的方差分析、协方差分析等等。因此,能真正掌 握GLM菜单的用法,会使大家的统计分析能力有极大地提高。 实际上一般线性模型包括的统计模型还不止这些,我这里 举出来的只是从用SPSS作统计分析的角度而言的一些。
ChongQing Normal University 6
2.3 Independent-Samples T Test过程 进行两样本均数差别的比较,即通常所说的 两组资料的t检验。 2.4 Paired-Samples T Test过程 进行配对资料的显著性检验,即配对t检验。 2.5 One-Way ANOVA过程 进行两组及多组样本均数的比较,即成组设 计的方差分析,还可进行随后的两两比较。看图
ChongQing Normal University
5
2、均数间的比较--Compare Means菜单
该菜单集中了几个用于计量资料均数间 比较的过程。具体有: 2.1 Means过程 对准备比较的各组计算描述指标,进行 预分析,也可直接比较。 2.2 One-Samples T Test过程 进行样本均数与已知总体均数的比较。
ChongQing Normal University 12
5、线性回归与曲线拟合―― Regression菜单
下面三个过程是Regression菜单的子菜单,是SPSS提 供的用于回归分析的工具: 5.1 Linear过程——调用此过程可完成二元或多元的线性回归 分析。在多元线性回归分析中,用户还可根据需要,选用不同 筛选自变量的方法(如:逐步法、向前法、向后法,等)。 5.2 Curve Estimation过程——Curve Estimation过程可以用与 拟合各种各样的曲线,原则上只要两个变量间存在某种可以被 它所描述的数量关系,就可以用该过程来分析。但这里我们要 指出,由于曲线拟合非常的复杂,而该模块的功能十分有限, 因此最好采用将曲线相关关系通过变量变换的方式转化为直线 回归的形式来分析,或者采用其他专用的模块分析。
ChongQing Normal University
9
3.3 Repeted Measures子菜单:顾名思义,重 复测量的数据就要用他来分析;用前两个菜单似 乎都可以分析出来结果,但在许多情况下该结果 是不正确的,应该用重复测量的分析方法才对。 3.4 Variance Components子菜单:用于作方差 成份模型的(这个模型实在太深,不是一时半会 能说清的,所以在这里就干脆不讲了)。