当前位置:文档之家› 使用SPSS进行探索式因素分析的教程

使用SPSS进行探索式因素分析的教程

使用SPSS进行探索式因素分析的教程
使用SPSS进行探索式因素分析的教程

使用S P S S进行探索式因素分析的教程

第4章探索式因素分析

在社会与行为科学研究中,研究者经常会搜集实证性的量化资料來做验证,而要证明这些资料的可靠性与正确性,则必须依靠测量或调查工具的信度或效度(杨国枢等,2002b)。一份好的量表应该要能够将欲研究的主题构念(Construct,它是心理学上的一种理论构想或特质,无法直接观测得到)清楚且正确的呈现出来,而且还需具有「效度」,即能真正衡量到我们欲量测的特性,此外还有「信度」,即该量表所衡量的结果应具有一致性、稳定性,因此为达成「良好之衡量」的目标,必须有以下两个步骤:第一个步骤是针对量表的题项作项目分析,以判定各项目的区别效果好坏;第二步骤则是建立量表的信度与效度。量表之项目分析、信度检验已于第2、3章有所说明,本章将探讨量表之效度问题。

4-1 效度

效度即为正确性,也就是测量工具确实能测出其所欲测量的特质或功能之程度。一般的研究中最常使用「内容效度」(Content Validity)与「建构效度」(Construct Validity)来检视该份研究之效度。

所谓「内容效度」,是指该衡量工具能足够涵盖主题的程度,此程度可从量表内容的代表性或取样的适切性来加以评估。若测量内容涵盖所有研究计划所要探讨的架构及内容,就可说是具有优良的内容效度。在一般论文中,常使用如下的描述来「交代」内容效度:

而所谓「建构效度」系指测量工具的内容,即各问项是否能够测量到理论上的构念或特质的程度。建构效度包含收敛效度(Convergent Validity)与区别效度(Discriminant Validity),收敛效度主要测试以一个变量(构念)发展出的多项问项,最后是否会收敛于一个因素中(同一构念不同题目相关性很高);而区别效度为判别问项可以与其它构念之问项区别的程度(不

同构念不同题目相关性很低)。衡量收敛效度的统计方式可使用探索式因素分析法(Exploratory factor analysis),简称因素分析。进行因素分析时,若发现各构念的衡量项目皆可收敛于同一个共同因素之下,则表示该量表的收敛效度是可被接受的。至于区别效度,则可采用因素分析与皮尔森相关分析,首先,必须在因素分析法中,各构念的衡量项目皆没有与其它构念的衡量项目收敛于同一个共同因素之下,此外,在皮尔森相关系数矩阵中,不同构念的衡量项目彼此之间关联性很低,如皮尔森系数皆小于0.3,若出现上述两现象显示不同构念的衡量项目间彼此皆不具有强烈的关连性,据此,即可显示出区别效度是可以被接受的。进行量表之建构效度评估时,虽理应同时检视收敛效度与区别效度,然审视国内之硕士论文或一些期刊论文都可发现,大部分都只以因素分析进行收敛效度之评估,并据以说明量表的建构效度,其方法如:同一构念中,若因素负荷量的值愈大(通常取0.5以上者才保留该项目,否则删除后再重新执行一次因素分析),表示收敛效度愈高。此外,也可使用属线性结构方程(Linear Structural Equation)领域的验证性因素分析(Confirmatory Factor Analysis),以进行模式的适合度检定,并检定各构念是否具有足够的收敛效度与区别效度。

4-1因素分析的意义

因素分析(Factor Analysis)属于多元统计分析技术的一种,其主要目的是浓缩数据。它透过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个假想的变量来表示其基本的数据结构。这些假想变量能够反映原来众多的观测变量所代表的主要信息,并解释这些观测变量之间的相互依存关系,我们把这些假想变量称之为基础变量,即因素(Factors)。因素分析就是研究如何以最少的信息遗失,而能把众多的观测变量浓缩为少数几个因素。

一般在对实际问题做研究时,研究者往往希望尽可能地多多收集与研究主题相关的变量,以期能针对问题有比较全面性的、完整性的掌握和认识。虽然收集这些数据需投入许多的人力、物力与时间成本,虽然它们能够较为整体而精确地描述研究主题,但将这些资料实际用在分析、建模时,这些变量未必能真正发挥研究者预期的作用,也就是说研究者的「投入」和「产出」并非呈合理的正比,相反的,这样的搜集资料行为反而会给研究者于统计分析时带来许多问题,这些问题如下:

■计算量的问题

由于研究者所收集的变量相当多,如果这些变量都投入数据的分析与建模,无疑的,这将会增加分析过程中于计算上的工作量。虽然,目前计算机运用普遍且其计算能力亦相当优异,然而对于此种高维的变量和庞大的数据仍是于计算上所不容忽视的。

■变数间的相关性问题

由于研究者针对特定之主题所收集到的诸多变量之间通常或多或少都会存在着相关性。也就是说,变量之间往往具有信息的高度重迭性和高度相关性,这些特质将会给统计方法的应用

带来许多不便。例如,在多元线性回归分析中,如果这些众多的解释变量之间,存在着较强且显着的相关性,即存在着高度的多重共线性,那么于回归方程的参数估计时,将带来许多麻烦,致使回归方程参数不准确甚至模型不可用等。

为解决上述的问题,最简单且最直接的解决方法即是精减变量之个数,但是这又必然会导致信息的漏失和信息不完整等现象产生,这是一个Trade-off的问题。为此,研究者无不希望探索一种更有效的解决方法,期盼它既能大大减少参与数据分析、建模的变量个数,也同时不会造成信息的大量漏失。而因素分析正是这样一种能够有效降低变量维数(个数),并已得到广泛应用的分析方法。因素分析是由心理学家所发展出来的,最初心理学家借助因素分析模型来解释人类的行为和能力,1904年Charles Spearman在美国心理学杂志上发表了第一篇有关因素分析的文章,在往后的三四十年里,因素分析的理论和数学基础理论逐步获得发展和改善,也因此,这个统计分析工具逐渐被人们所认识和接受。50年代以来,随着计算机的普及和各种统计软件的出现,因素分析在社会学、经济学、医学、地质学、气象学和市场营销等越来越多的领域得到了应用。

因素分析以最少的信息漏失为前提,试图将众多的原始变量综合成较少几个综合指标,这些综合指标即名为因素(factor)。一般而言,因素具有以下几个特点:

■因素个数远少于原始变量的个数

原始变量综合成少数几个因素后,因素将可以替代原始变量参与数据建模,这将大大减少分析过程中的计算工作量。

■因素能够反映原始变量的绝大部分信息

因素并不是原始变量的简单取舍,而是原始变量重组后的结果,因此不会造成原始变量信息的大量遗失,并能够代表原始变量的绝大部分信息。

■因素之间的线性关系不显着

由原始变量重组出来的因素之间的线性关系较弱,因素参与数据建模能够有效地解决变量多重共线性等给分析应用带来的诸多问题。

■因素具有命名解释性

通常,因素分析产生的因素能够透过各种方式最终获得命名解释性。因素的命名解释性有助于对因素分析结果的解释评价,对因素的进一步应用有重要意义。例如,对高校科研情况的因素分析中,如果能够得到两个因素,且其中一个因素是对科研人力投入、经费投入、立项项目数等变量的综合,而另一个是对结项项目数、发表论文数、获奖成果数等变量的综合,那么,该因素分析就是较为理想的。因为这两个因素均有命名可解释性,其中一个反映了科研投入方面的情况,可命名为科研投入因素,另一个反映了科研产出方面的情况,可命名为科研产

出因素。总之,因素分析是研究如何以最少的信息遗失将众多原始变量浓缩成少数几个因素,如何使因素具有一定的命名解释性的多元统计分析方法。

4-2 因素分析的数学模型

因素分析的核心价值在于它能使用较少且相互独立的因素来反映原始变量的绝大部分信息。由于任何一个变量都可以透过

x x

x z σ-= (x 为x 的平均数,x σ为x 标准差)

的转换而变成标准化变量,经标准化后的变量并不会改变原始变量之间的相关系数,也就是说不失其一般性。在此我们所讨论的变量都是标准化变量。设原有p 个变数p x x x ,,,21 且每个变量的平均数为0,标准差均为1。现将每个原始变数用)(p k k <个因素k f f f ,,,21 的线性组合来表示,即:

113132121111u f a f a f a f a x k k +++++=

223232221212u f a f a f a f a x k k +++++=

333332321313u f a f a f a f a x k k +++++=

(4-1) … p k pk p p p p u f a f a f a f a x +++++= 332211

式(4-1)就是因素分析的数学模型,此模型在型式上和多元回归模型很相似,也可用矩阵的型式表示为U AF X +=。其中F 称为因素,由于它们出现在每个原始变量的线性表达式中,因此又称为共同因素(Common factors ),它们是各个原始变量所共同拥有的因素,解释了变量之间的相关程度。因素也可被想象成是高维空间中互相垂直的k 个坐标轴。A 称为因素负荷矩阵,ij a 称为因素负荷(Factor loading ),它是第i 个原始变数在第j 个因素上的负荷,相当于多元回归分析中的标准回归系数。U 称为特殊因素(Unique factor ),它是每个原始变量所特有的因素,相当于多元回归中的残差项,它表示了原始变量不能被因素所解释的部分,其平均数为0。

因素分析模型中假设p 个特殊因素之间是彼此独立的,特殊因素和共同因素之间也是彼此独立的。此外该模型中,每一个原始变量都是由k 个共同因素和一个特殊因素的线性组合来表示,而我们所感兴趣的只是这些能够代表较多信息的共同因素,因此往后如果没有特殊说明的话,本书中所经常提到的因素一词,实际上所指的就是共同因素。共同因素的个数最多可以等于原始变量的数量。因为在求因素解时,通常都会使第一个因素之代表性最高(即拥有最多的信息),之后的其它因素之代表性日益衰减,因此,如果忽略掉最后几个因素,则对原始变量的代表性也不会有什么损失。所以,因素分析模型中,共同因素的个数,往往远远小于原始变量的个数。如果把特殊因素当作是残差项看待,那么因素分析模型和多元线性回归模型在型式上非常相近,他们都是用其它变量的线性组合加上一个残差项来表示一个变量,但是回归模型

中的自变量是可观测的,而因素分析模型中的因素是假想变量,是不可观测的,这就使得它有别于一般的线性模型。

4-3 因素分析的相关概念

因素分析之数学模型中蕴藏着几个重要的相关概念,搞懂这些概念不仅有助于因素分析之意义的理解,更有利于明暸因素与原始变量间的关系、因素的重要程度以及辅助评估因素分析的效果。为了进一步了解该模型所蕴含的意义,下面我们将讨论因素分析中常用的几个统计量。

■ 因素负荷

因素负荷可说是因素分析模型中最重要的一个统计量,它连接了原始变量和共同因素。当共同因素之间完全不相关时,我们可以很容易的证明出因素负荷ij a 其实就是第i 个变数和第j 个因素之间的相关系数。在大部分的情况下,我们通常会假设共同因素之间是彼此正交的(Orthogonal ),也就是说假设共同因素之间不相关。因此,因素负荷不仅说明了原始变量是如何由因素线性组合而成,而且也反映了因素和变量之间的相关程度,ij a 的绝对值越大,表示共同因素j f 与变数i x 的关系越紧密。

假设有一个五个原始变量、两个共同因素的模型:

121125.020.096.0u f f x ++=

221232.029.087.0u f f x ++=

321323.088.017.0u f f x ++=

421432.076.057.0u f f x ++=

521541.034.086.0u f f x ++=

从这个因素分析模型中,可以很容易看出,共同因素1f 与变数5421,,,x x x x 的关系密切,

因为其间的因素负荷较大,这说明了共同因素1f 代表了这些变量所共同散发出来的信息,共同因素2f 与变数43,x x 关系密切,因此共同因素2f 主要代表了这两个变量所共同的信息。

此外,因素负荷还可以用来估计原始变量之间的相关系数,当共同因素之间彼此不相关

时,由因素分析模型很容易可以推导出变量j i x x ,之间的相关系数为:

jk ik j i j i ij a a a a a a +++= 2211γ

即任何两个原始变量之间的相关系数等于所对应的因素负荷乘积之和。这说明了因素分析模型假设原始变量之间的潜在关系可以透过共同因素来加以描述,如果我们把变量i x 和因素之间的负荷想象为路径系数,则变量i x 和变数j x 之间的关系可以透过图4-1明确地表示出来。

图4-1 变数i x 和变数j x 之间的关系图 由因素模型所导出的变量间的相关系数可以用来辅助判断因素解是否合适,如果由原始观

测资料所计算出的相关系数和从模型中所导出的变量间的相关系数相差很小,那么我们可以认

为模型非常适切的拟合了原始观测资料,因素解是合适的。因素分析模型是从解释变量之间的相关关系出发的,他的最佳解即是原始变量之间的实际相关关系。

■ 共通性(Communality )

所谓共通性是指原始变量的变异数中由共同因素所决定之部分所占的比例。变数i x 的共通性记做2i h 。当共同因素之间彼此正交时,共通性等于和该变量有关的因素负荷的平方和,用方程式可表示为:

2222112ik i i k j ij i a a a a h +++==∑=

(4-2)

由式4-2可轻易理解,变数i x 的共通性即是因素负荷矩阵A 中第i 列中所有元素的平方和。读者对4-2的公式也可这样来记忆,共通性通常是以2i h 来代表,为何要使用「h 」这个字母,因为水平这个字的英文为「horizontal 」,引申到矩阵中的话即代表一列,故第i 个变量的共通性即为负荷矩阵A 中第i 列中所有元素的平方和。

由于变量i x 是标准化变量,所以变量i x 的变异数可以表示成221i i u h +=,也就是说原始变量i x 的变异数可由两个部分来加以解释:第一部分为共同因素所决定,即共通性2i h ,它是变数i x 之变异数能被共同因素所能解释说明的部份,其说明了所有因素对变量i x 的解释贡献程度。共通性越大,代表变量能被因素说明的程度也越高。共通性越接近1,代表因素解释说明了变量i x 的大部分变异数,也就是说,如果我们使用因素来描述变量i x 时,则变数i x 的信息遗失较少,第二部分则由特殊因素所决定,即特殊因素的平方,它反映了变量i x 的变异数中不能由所有因素解释说明的部份,2i u 越小则说明变量i x 的信息遗失越少。总之,变数i x 的共通性描述了所有因素对变量i x 所蕴含之信息的解释程度,是评价变量i x 之信息遗失程度的重要指针。如果大部份之原始变量的共通性均较高(如高于0.8),则代表所萃取出的因素确实能够反映原始变量的大部分(80%以上)的信息,而仅有较少的信息遗失,因此因素分析的效果较好。所以,共通性是衡量因素分析效果的重要依据。对于上面所举的五个原始变量、两个共同因素的例

i x j x 1f 2f k f

1i a 2j a 1j a

2i a ik a jk a ︰ ︰ ︰ ︰

图解spss探索分析实例

图解spss探索分析实例 最后更新:2012-12-10 阅读次数:【字体:小中大】 探索分析是在对数据的基本特征统计量有初步了解的基础上,对数据进行的更为深入详细的描述性观察分析。它在一般描述性统计指标的基础上,增加了有关数据其他特征的文字与图形描述,显得更加细致与全面,有助于用户思考对数据进行进一步分析的方案。主要的分析如下: (1)观察数据的分布特征:通过绘制箱锁图和茎叶图等图形,直观地反映数据的分布形式和数据的一些规律,包括考察数据中是否存在异常值等。过大或过小的数据均有可能是奇异值、影响点或错误数据。寻找异常值,并分析原因,然后决定是否从分析中删除这些数据。因为奇异值和影响点往往对分析的影响较大,不能真实地反映数据的总体特征。 (2)正态分布检验:检验数据是否服从正态分布。很多检验能够进行的前提即总体数据分布服从正态分布。因此,检验数据是否符合正态分布,就决定了它们是否能用只对正态分布数据适用的分析方法。 (3)方差齐性检验:用Levene检验比较各组数据的方差是否相等,以判定数据的离散程度是否存在差异。例如在进行独立右边的T检验之前,就需要事先确定两组数据的方差是否相同。如果通过分析发现各组数据的方差不同,还需要对数据进行方差分析,那么就需要对数据进行转换使得方差尽可能相同。Levene检验进行方差齐性检验时,不强求数据必须服从正态分布,它先计算出各个观测值减去组内均值的差,然后再通过这些差值的绝对值进行单因素方差分析。如果得到的显著性水平(Significance)小于0.05,那么就可以拒绝方差相同的假设。 探索分析的具体操作步骤如下: 打开数据文件,选择【分析】(Analyze)菜单,单击【描述统计】(Descriptive Statistics)命令下的【探索】(Explore)命令,SPSS将弹出"探索"(Explore)对话框,如图3-9所示。 在"探索"(Explore)对话框中,左边的变量列表为原变量列表,通过单击按钮可选择一个或者几个变量进入右边的"因变量列表"(Dependent List)框、"因子列表"(Factor List)框和"标注个案"(Label Cases by)列表框。因变量是用户所研究的目标变量。因子变量是影响因变量的因素,例如分组变量。标注个案是区分每个观测量的变量,如雇员的ID等。例如,研究同一班级男生和女生的身高差距时,就可将"身高"变量列入"因变量列表"(Dependent List)

统计分析软件SPSS详细教程

10.11统计分析软件&SPSS建立数据 目录 10.11统计分析软件&SPSS建立数据 (1) 10.25数据加工作图 (1) 11. 08绘图解答&描述性分析: (3) 2.描述性统计分析: (4) 四格表卡方检验:(检验某个连续变量的分布是否与某种理论分布一致,如是否符合正态分布) (7) 第七章非参数检验 (10) 1.单样本的非参数检验 (11) (1)卡方检验 (11) (2)二项分布检验 (12) 2.两独立样本的非参数检验 (13) 3.多独立样本的非参数检验 (16) 4.两相关样本的非参数检验 (16) 5.多相关样本的非参数检验 (18) 第五章均值检验与T检验 (20) 1.Means过程(均值检验)( (20) 4. 单样本T检验 (21) 5. 两独立样本T检验 (22) 6.两配对样本T检验 (23) 第六章方差分析 (25) 单因素方差分析: (25) 多因素方差分析: (29) 10.25数据加工作图 1.Excel中随机取值:=randbetween(55,99) 2.SPSS中新建数据,一列40个,正态分布随机数:先在40那里随便输入一个数表示选择40个可用的,然后按一下操作步骤: 3.排序:个案排秩

4.数据选取:数据-选择个案-如果条件满足: 计算新变量: 5.频次分析:分析-统计描述-频率

还原:个案-全部 6.加权: 还原 7.画图: 11. 08绘图解答&描述性分析:1.课后题:长条图

2.描述性统计分析: (1)频数分析:

(2)描述性分析: 描述性统计分析没有图形功能,也不能生成频数表,但描述性分析可以将原始数据转换成标准化得分,并以变量形式存入数据文件中,以便后续分析时应用。 操作: 分析—描述性分析:然后对结果进行筛选,去掉异常值,就得到标准化的数据: 任何形态的数据经过Z标准化处理之后就会是正态分布的<—错误!标准化是等比例缩放的,不会改变数据的原始分布状态, (3)探索分析:(检验是否是正态分布:茎叶图、箱图) 实例:

SPSS探索性因子分析的过程

问题 题项 从未使用 很少使用 有时使用 经常使用 总是使用 1 2 3 4 5 a 1 电脑 a 2 录音磁带 a 3 录像带 a 4 网上资料 a 5 校园网或因特网 a 6 电子邮件 a 7 电子讨论网 a 8 CAI 课件 a 9 视频会议 a 10 视听会议 一.因子分析的定义 在现实研究过程中,往往需要对所反映事物、现象从多个角度进行观测。因此研究者往往设计出多个观测变量,从多个变量收集大量数据以便进行分析寻找规律。多变量大样本虽然会为我们的科学研究提供丰富的信息,但却增加了数据采集和处理的难度。更重要的是许多变量之间存在一定的相关关系,导致了信息的重叠现象,从而增加了问题分析的复杂性。 因子分析是将现实生活中众多相关、重叠的信息进行合并和综合,将原始的多个变量和指标变成较少的几个综合变量和综合指标,以利于分析判定。用较少的综合指标分析存在于各变量中的各类信息,而各综合指标之间彼此是不相关的,代表各类信息的综合指标成为因子。因子分析就是用少数几个因子来描述许多指标之间的联系,以较少几个因子反应原资料的大部分信息的统计方法。 二.数学模型 i m im i i i i U F F F F Z +++++=αααα · · · 332211 i Z 为第i 个变量的标准化分数;(标准分是一种由原始分推导出来的相对地位量数,它是用来说明原始分在所 属的那批分数中的相对位置的。) m F 为共同因子; m 为所有变量共同因子的数目;

i U 为变量i Z 的唯一因素; im α为因子负荷。(也叫因子载荷,统计意义就是第i 个变量与第m 个公共因子的相关系数,它反映了第i 个变 量在第m 个公共因子上的相对重要性也就是第m 个共同因子对第i 个变量的解释程度。) 因子分析的理想情况,在于个别因子负荷im α不是很大就是很小,这样每个变量才能与较少的共同因子产生密切关联,如果想要以最少的共同因素数来解释变量间的关系程度,则i U 彼此间不能有关联存在。 所谓的因子负荷就是因子结构中原始变量与因子分析时抽取出共同因子的相关,即在各个因子变量不相关的情况下,因子负荷im α就是第i 个原有变量和第m 个因子变量间的相关系数,也就是i Z 在第m 个共同因子变量上的相对重要性,因此,im α绝对值越大则公共因子和原有变量关系越强。在因子分析中有两个重要指针:一为“共同性”,二为“特征值”。 所为共同性,也称变量共同度或者公共方差,就是每个变量在每个共同因子的负荷量的平方总和(一横列中所有因子负荷的的平方和),也就是个别变量可以被共同因子解释的变异量百分比,这个值是个别变量与共同因子间多元相关的平方。从共同性的大小可以判断这个原始变量与共同因子间的关系程度。如果大部分变量的共同度都高于0.8,则说明提取出的共同因子已经基本反映了各原始变量80%以上的信息,仅有较少的信息丢失,因子分析效果较好。而各变量的唯一因素就是1减掉该变量共同性的值,就是原有变量不能被因子变量所能解释的部分。 所谓特征值,是每个变量在某一共同因子的因子负荷的平方总和(一直行所有因子负荷的平方和),在因子分析的的共同因子抽取中,特征值最大的共同因子会最先被抽取,其次是次大者,最后抽取的共同因子的特征值会最小,通常会接近于0。将每个共同因子的特征值除以总题数,为此共同因子可以解释的变异量,因子分析的目的之一,即在因素结构的简单化,希望以最少的共同因子能对总变异量做最大的解释,因而抽取的因素越少越好,但抽取的因子的累积变异量越大越好。 三.SPSS 中实现过程 (一)录入数据

使用SPSS进行探索式因素分析的教程

第4章 探索式因素分析 在社会与行为科学研究中,研究者经常会搜集实证性的量化资料來做验证,而要证明这些资料的可靠性与正确性,则必须依靠测量或调查工具的信度或效度(杨国枢等,2002b )。一份好的量表应该要能够将欲研究的主题构念(Construct ,它是心理学上的一种理论构想或特质,无法直接观测得到)清楚且正确的呈现出来,而且还需具有「效度」,即能真正衡量到我们欲量测的特性,此外还有「信度」,即该量表所衡量的结果应具有一致性、稳定性,因此为达成「良好之衡量」的目标,必须有以下两个步骤:第一个步骤是针对量表的题项作项目分析,以判定各项目的区别效果好坏;第二步骤则是建立量表的信度与效度。量表之项目分析、信度检验已于第2、3章有所说明,本章将探讨量表之效度问题。 4-1 效度 效度即为正确性,也就是测量工具确实能测出其所欲测量的特质或功能之程度。一般的研究中最常使用「内容效度」(Content Validity )与「建构效度」(Construct Validity )来检视该份研究之效度。 所谓「内容效度」,是指该衡量工具能足够涵盖主题的程度,此程度可从量表内容的代表性或取样的适切性来加以评估。若测量内容涵盖所有研究计划所要探讨的架构及内容,就可说是具有优良的内容效度。在一般论文中,常使用如下的描述来「交代」内容效度: 而所谓「建构效度」系指测量工具的内容,即各问项是否能够测量到理论上的构念或特质的程度。建构效度包含收敛效度(Convergent Validity )与区别效度(Discriminant Validity ),收敛效度主要测试以一个变量(构念)发展出的多项问项,最后是否会收敛于一个因素中(同一构念不同题目相关性很高) ;而区别效度为判别问项可以与其它构念之问项区别的程度(不同构

SPSS皮尔逊相关分析实例操作步骤

S P S S皮尔逊相关分析实 例操作步骤 Prepared on 21 November 2021

SPSS皮尔逊相关分析实例操作步骤 选题: 对某地29名13岁男童的身高(cm)、体重(kg),运用相关分析法来分析其身高与体重是否相关。 实验目的: 任何事物的存在都不是孤立的,而是相互联系、相互制约的。相关分析可对变量进行相关关系的分析,计算29名13岁男童的身高(cm)、体重(kg),以判断两个变量之间相互关系的密切程度。 实验变量: 编号Number,身高height(cm),体重weight(kg) 原始数据: 实验方法: 软件:

操作过程与结果分析: 第一步:导入Excel数据文件? 1.open data document——open data——open; 2. Opening excel data source——OK. 第二步:分析身高(cm)与体重(kg)是否具有相关性 1.在最上面菜单里面选中Analyze——correlate——bivariate?,首先 使用Pearson,two-tailed,勾选flag significant correlations 进入如下界面: 2.点击右侧options,勾选Statistics,默认Missing Values,点击 Continue 输出结果: 图为基本的描述性统计量的Array输出表格,其中身高的均值 (mean)为、标准差(standard deviation)为、样本容量 (number of cases)为29;体重的均值为、标准差为、样本容量为29。两者的平均值和标准差值得差距不 显着。 Correlations 身高(cm)体重(kg) 身高(cm)Pearson Correlation1.719** Sig. (2-tailed).000 Sum of Squares and Cross- products Covariance N2929 体重(kg)Pearson Correlation.719**1 Sig. (2-tailed).000 Sum of Squares and Cross- products Covariance N2929

SPSS统计分析练习及答案

SPSS 统计分析练习题目 -2012-10-26 学号:________________________ 姓名:___________________________ (注:将本文件以学号+姓名.doc 的形式另存为一个文件,例2008144154葛爽.doc ,然后以附件形式发送至 all689@https://www.doczj.com/doc/705248874.html, ,时间截止到2012年10月31日。没有指明数据文件名称的题目需自行在SPSS 中建立数据文件并录入相应数据,回答问题时应将SPSS 中的主要输出结果粘贴于答案中。) 1.一所国际新闻学校每年从各大高校中招募刚刚毕业的本科生参加培训,进而作为记者参加新闻工作。大多数刚刚毕业的学生以前没有任何做记者的经验,所以在正式成为一名记者之前,必须进行一段时间的学习,作为职业的预备课程。该国际新闻学校于是设计了两种培训方案: 方案A :学生参加为期15周的全天课程听课学习,随后参加预备课程考试; 方案B :学生直接先参加6个月的记者实习,再进行为期15周的全天课程听课学习,最后进行预备课程考试。 为了评估两种方案各自的有效性,学校随机选出了20名学生参加实验。事前还根据他们的文学等相关学科的成绩对这20人进行了分组,20人分成10组,每组中2人的成绩相近,然后随机地将2人分配去参加方案A 和方案B 的培训。 下表是这20人预备课程本学期的成绩单: 1 2 3 4 5 6 7 8 9 10 A 50 68 72 54 42 60 56 72 63 61 B 62 62 58 74 60 66 64 64 78 66 请问上面的数据是否证明了先参加实践对提高平均测试分数的效果显著? Independent Samples Test 1.843.1911.54518.140.60006239921373013731.5455.331.143.6000623993098710987 Equal varia Equal varia assumed X F Sig.vene's Test f ality of Varian t df g. (2-taile Mean ifferenc td. Erro ifferenc Lower Upper 5% Confiden nterval of the Difference t-test for Equality of Means 因p=0.140>0.05,故不能证明先参加实践对提高平均测试分数的效果显著。 2.早在1990年,美国巴维利亚的6个省报道了他们的婴儿死亡率(每1000名活着出生的婴儿的死亡数)以及母乳喂养率(母乳喂养婴儿的比例)的数据如下: 省号码 死亡率(每1000名婴儿中的死亡人数) 母乳喂养率(%) 1 250 60 2 320 30 3 170 90 4 300 60 5 270 40

SPSS因子分析法例子解释

因子分析的基本概念与步骤 一、因子分析的意义 在研究实际问题时往往希望尽可能多地收集相关变量,以期望能对问题有比较全面、完整的把握与认识。例如,对高等学校科研状况的评价研究,可能会搜集诸如投入科研活动的人数、立项课题数、项目经费、经费支出、结项课题数、发表论文数、发表专著数、获得奖励数等多项指标;再例如,学生综合评价研究中,可能会搜集诸如基础课成绩、专业基础课成绩、专业课成绩、体育等各类课程的成绩以及累计获得各项奖学金的次数等。虽然收集这些数据需要投入许多精力,虽然它们能够较为全面精确地描述事物,但在实际数据建模时,这些变量未必能真正发挥预期的作用,“投入”与“产出”并非呈合理的正比,反而会给统计分析带来很多问题,可以表现在: 计算量的问题 由于收集的变量较多,如果这些变量都参与数据建模,无疑会增加分析过程中的计算工作量。虽然,现在的计算技术已得到了迅猛发展,但高维变量与海量数据仍就是不容忽视的。 变量间的相关性问题 收集到的诸多变量之间通常都会存在或多或少的相关性。例如,高校科研状况评价中的立项课题数与项目经费、经费支出等之间会存在较高的相关性;学生综合评价研究中的专业基础课成绩与专业课成绩、获奖学金次数等之间也会存在较高的相关性。而变量之间信息的高度重叠与高度相关会给统计方法的应用带来许多障碍。例如,多元线性回归分析中,如果众多解释变量之间存在较强的相关性,即存在高度的多重共线性,那么会给回归方程的参数估计带来许多麻烦,致使回归方程参数不准确甚至模型不可用等。类似的问题还有很多。 为了解决这些问题,最简单与最直接的解决方案就是削减变量的个数,但这必然又会导致信息丢失与信息不完整等问题的产生。为此,人们希望探索一种更为有效的解决方法,它既能大大减少参与数据建模的变量个数,同时也不会造成信息的大量丢失。因子分析正式这样一种能够有效降低变量维数,并已得到广泛应用的分析方法。 因子分析的概念起源于20世纪初Karl Pearson与Charles Spearmen等人关于智力测验的统计分析。目前,因子分析已成功应用于心理学、医学、气象、地址、经济学等领域,并因此促进了理论的不断丰富与完善。 因子分析以最少的信息丢失为前提,将众多的原有变量综合成较少几个综合指标,名为因子。通常,因子有以下几个特点: ↓因子个数远远少于原有变量的个数 原有变量综合成少数几个因子之后,因子将可以替代原有变量参与数据建模,这将大大减少分析过程中的计算工作量。 ↓因子能够反映原有变量的绝大部分信息 因子并不就是原有变量的简单取舍,而就是原有变量重组后的结果,因此不会造成原有变量信息的大量丢失,并能够代表原有变量的绝大部分信息。 ↓因子之间的线性关系并不显著 由原有变量重组出来的因子之间的线性关系较弱,因子参与数据建模能够有效地解决变量多重共线性等给分析应用带来的诸多问题。 ↓因子具有命名解释性 通常,因子分析产生的因子能够通过各种方式最终获得命名解释性。因子的命名解释

SPSS分析报告实例

SPSS与数据统计分析期末论文影响学生对学校服务满意程度的因素分析

一、数据来源 本次数据主要来源自本校同学,调查了同学们年级、性别、助学金申请情况、生源所在地、学院、毕业学校、游历情况、家庭情况、升高、体重、近视程度、学习时间、经济条件、兴趣、对学校各方面的评价、与对学校总评价以及建议等共41条信息,共收集数据样本724条。我们将运用SPSS,对变量进行频数分析、样本T检验、相关分析等手段,旨在了解同学们对学校提供的满意程度与什么因素有关。 二、频数分析 可靠性统计 克隆巴赫 Alpha 项数 .985 62 对全体数值进行可信度分析

本次数据共计724条,首先从可靠性统计来看,alpha值为0.985,即全体数据绝大部分是可靠的,我们可以在原始数据的基础上进行分析与处理。 其中,按年级来看,绝大多数为大二学生填写(占了总人数的67.13%),之后分别依次为大二(23.76%)、大四(4.14%)、大一(4.97%)。而从专业来看,占据了数据绝大多数样本所在的学院为机械、材料、经管、计通。 三、数据预处理 拿到这份诸多同学填写的问卷之后,我们首先应对一些数据进行处理,对于数据的缺失值处理,由于我们对本份调查的分析重点方面是关于学生的经济情况的,因此对于确实的部分数据,升高、体重、近视度数、感兴趣的事等无关项我们均不需要进行缺失值的处理,而我们可能重点关注的每月家里给的钱、每月收入以及每月支出,由于其具有较强主观性,如果强行处理缺失值反而会破坏数据的完整性,因此我们筛去未填写的数据,将剩余数据当作新的样本进行分析。 而对于一些关键的数据,我们需要做一些必要的预处理,例如一些调查项,我们希望得到数值型变量,但是填写时是字符型变量,我们就应该新建一个数字型变量并将数据复制,以便后续分析。同时一些与我们分析相关的缺省值,一些明显可以看出的虚假信息,我们都需要先进行处理。而具体预处理需要怎么做,这将会在其后具体分析时具体给出。

SPSS概览数据分析实例详解

第一章SPSS概览--数据分析实例详解 1.1 数据的输入和保存 1.1.1 SPSS的界面 1.1.2 定义变量 1.1.3 输入数据 1.1.4 保存数据 1.2 数据的预分析 1.2.1 数据的简单描述 1.2.2 绘制直方图 1.3 按题目要求进行统计分析 1.4 保存和导出分析结果 1.4.1 保存文件 1.4.2 导出分析结果 希望了解SPSS 10.0版具体情况的朋友请参见本网站的SPSS 10.0版抢鲜报道。 例1.1 某克山病区测得11例克山病患者与13名健康人的血磷值(mmol/L)如下, 问该地急性克山病患者与健康人的血磷值是否不同(卫统第三版例4.8)? 患者: 0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11 健康人: 0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87 解题流程如下:

1.将数据输入SPSS,并存盘以防断电。 2.进行必要的预分析(分布图、均数标准差的描述等),以确定应采 用的检验方法。 3.按题目要求进行统计分析。 4.保存和导出分析结果。 下面就按这几步依次讲解。 §1.1 数据的输入和保存 1.1.1 SPSS的界面 当打开SPSS后,展现在我们面前的界面如下: 请将鼠标在上图中的各处停留,很快就会弹出相应部位的名称。 请注意窗口顶部显示为“SPSS for Windows Data Editor”,表明现在所看到的是SPSS的数据管理窗口。这是一个典型的Windows软件界面,有菜单栏、

SPSS因子分析法-例子解释

因子分析的基本概念和步骤 一、因子分析的意义 在研究实际问题时往往希望尽可能多地收集相关变量,以期望能对问题有比较全面、完整的把握和认识。例如,对高等学校科研状况的评价研究,可能会搜集诸如投入科研活动的人数、立项课题数、项目经费、经费支出、结项课题数、发表论文数、发表专著数、获得奖励数等多项指标;再例如,学生综合评价研究中,可能会搜集诸如基础课成绩、专业基础课成绩、专业课成绩、体育等各类课程的成绩以及累计获得各项奖学金的次数等。虽然收集这些数据需要投入许多精力,虽然它们能够较为全面精确地描述事物,但在实际数据建模时,这些变量未必能真正发挥预期的作用,“投入”和“产出”并非呈合理的正比,反而会给统计分析带来很多问题,可以表现在: 计算量的问题 由于收集的变量较多,如果这些变量都参与数据建模,无疑会增加分析过程中的计算工作量。虽然,现在的计算技术已得到了迅猛发展,但高维变量和海量数据仍是不容忽视的。 变量间的相关性问题 收集到的诸多变量之间通常都会存在或多或少的相关性。例如,高校科研状况评价中的立项课题数与项目经费、经费支出等之间会存在较高的相关性;学生综合评价研究中的专业基础课成绩与专业课成绩、获奖学金次数等之间也会存在较高的相关性。而变量之间信息的高度重叠和高度相关会给统计方法的应用带来许多障碍。例如,多元线性回归分析中,如果众多解释变量之间存在较强的相关性,即存在高度的多重共线性,那么会给回归方程的参数估计带来许多麻烦,致使回归方程参数不准确甚至模型不可用等。类似的问题还有很多。 为了解决这些问题,最简单和最直接的解决方案是削减变量的个数,但这必然又会导致信息丢失和信息不完整等问题的产生。为此,人们希望探索一种更为有效的解决方法,它既能大大减少参与数据建模的变量个数,同时也不会造成信息的大量丢失。因子分析正式这样一种能够有效降低变量维数,并已得到广泛应用的分析方法。 因子分析的概念起源于20世纪初Karl Pearson和Charles Spearmen等人关于智力测验的统计分析。目前,因子分析已成功应用于心理学、医学、气象、地址、经济学等领域,并因此促进了理论的不断丰富和完善。 因子分析以最少的信息丢失为前提,将众多的原有变量综合成较少几个综合指标,名为因子。通常,因子有以下几个特点: ↓因子个数远远少于原有变量的个数 原有变量综合成少数几个因子之后,因子将可以替代原有变量参与数据建模,这将大大减少分析过程中的计算工作量。 ↓因子能够反映原有变量的绝大部分信息 因子并不是原有变量的简单取舍,而是原有变量重组后的结果,因此不会造成原有变量信息的大量丢失,并能够代表原有变量的绝大部分信息。 ↓因子之间的线性关系并不显著 由原有变量重组出来的因子之间的线性关系较弱,因子参与数据建模能够有效地解决变量多重共线性等给分析应用带来的诸多问题。 ↓因子具有命名解释性 通常,因子分析产生的因子能够通过各种方式最终获得命名解释性。因子的命名解

SPSS案例分析

某道路弯道处53车辆减速前观测到得车辆运行速度,试检验车辆运行速度就是否服从正态分布. 这道题目得解答可以先通过绘制样本数据得直方图、P-P图与Q-Q图坐车粗略判断,然后利用非参数检验得方法中得单样本K—S检验精确实现。 一、初步判断 1、1绘制直方图 (1)操作步骤 在SPSS软件中得操作步骤如图所示. (2)输出结果

通过观察速度得直方图及其与正态曲线得对比,直观上可以瞧到速度得直方图与正太去线除了最大值外,整体趋势与正态曲线较吻合,说明弯道处车辆减速前得运行速度有可能符合正态分布。 1、2绘制P-P图 (1)操作步骤 在SPSS软件中得操作步骤如图所示。

(2)结果输出

根据输出得速度得正态P-P图,发现速度均匀分布在正态直线得附近,较多部分与正态直线重合,与直方图得结果一致,说明弯道处车辆减速前得运行速度可能服从正态分布。 二、单样本K-S检验 2、1单样本K—S检验得基本思想 K—S检验能够利用样本数据推断样本来自得总体就是否服从某一理论分布,就是一种拟合优得检验方法,适用于探索连续型随机变量得分布。 单样本K-S检验得原假设就是:样本来自得总体与指定得理论分布无显著差异,即样本来自得总体服从指定得理论分布。SPSS得理论分布主要包括正态分布、均匀分布、指数分布与泊松分布等。 单样本K-S检验得基本思路就是: 首先,在原假设成立得前提下,计算各样本观测值在理论分布中出现得累计概率值F(x),;其次,计算各样本观测值得实际累计概率值S(x);再次,计算实际累计概率值与理论累计概率值得差D(x);最后,计算差值序列中得最大绝对值差值,即 通常,由于实际累计概率为离散值,因此D修正为: D统计量也称为K—S统计量。 在小样本下,原假设成立时,D统计量服从Kolmogorov分布。在大样本下,原假设成立时,近似服从K(x)分布:当D小于0时,K(x)为0;当D大于0时, 容易理解,如果样本总体得分布与理论分粗得差异不明显,那么D不应较大。如果D统计量得概率P值小于显著性水平α,则应拒绝原假设,认为样本来自得总体与指定得分布有显著差异如果D统计量得P值大于显著性水平α,则不能拒绝原假设,认为,样本来自得总体与指定得分布无显著差异.在SPSS中,无论就是大样本还就是小样本,仅给出大样本下得与对应得概率P值。 2、2软件操作步骤 单样本K-S检验得操作步骤如图所示

SPSS多元线性回归分析报告实例操作步骤

SPSS 统计分析 多元线性回归分析方法操作与分析 实验目的: 引入1998~2008年上海市城市人口密度、城市居民人均可支配收入、五年以上平均年贷款利率和房屋空置率作为变量,来研究上海房价的变动因素。 实验变量: 以年份、商品房平均售价(元/平方米)、上海市城市人口密度(人/平方公里)、城市居民人均可支配收入(元)、五年以上平均年贷款利率(%)和房屋空置率(%)作为变量。 实验方法:多元线性回归分析法 软件: 操作过程: 第一步:导入Excel数据文件 1.open data document——open data——open;

2. Opening excel data source——OK. 第二步: 1.在最上面菜单里面选中Analyze——Regression——Linear ,Dependent(因变量)选择商品房平均售价,Independents(自变量)选择城市人口密度、城市居民人均可支配收入、五年以上平均年贷款利率、房屋空置率;Method选择Stepwise. 进入如下界面: 2.点击右侧Statistics,勾选Regression Coefficients(回归系数)选项组中的Estimates;勾选Residuals(残差)选项组中的Durbin-Watson、

Casewise diagnostics默认;接着选择Model fit、Collinearity diagnotics;点击Continue. 3.点击右侧Plots,选择*ZPRED(标准化预测值)作为纵轴变量,选择DEPENDNT(因变量)作为横轴变量;勾选选项组中的Standardized Residual Plots(标准化残差图)中的Histogram、Normal probability plot;点击Continue.

SPSS因子分析实例操作步骤

SPSS因子分析实例操作步骤 实验目的: 弓I入2003~2013年全国的农、林、牧、渔业,采矿业,制造业电力、热力、燃气及水生产和供应业,建筑业,批发和零售业,交通运输、仓储和邮政业7个产业的投资值作为变量,来研究其对全国总固定投资的影响。 实验变量: 以年份,合计(单位:千亿元),农、林、牧、渔业,采矿业,制造业电力、热力、燃气及水生产和供应业,建筑业,批发和零售业,交通运输、仓储和邮政业作为变量。 实验方法:因子分析法软件:spss19.0 操作过程: 第一步:导入Excel数据文件 1. open data document ------- o pen data ------- o pen; 2. Opening excel data source OK.

第二步: 1.数据标准化:在最上面菜单里面选中Analyze ----- Descriptive Statistics --------- O K (变量选择除年份、合计以外的所有变量) 2.降维:在最上面菜单里面选中Analyze ----------- Dimension Reduction ----- Factor ,变量选择标准化后的数据.

3. 点击右侧 Descriptive ,勾选Correlation Matrix 选项组中的 Coefficients 和 KMO and Bartlett ' s text of sphericity, Con ti nue. -Statistics ---------------------------- ■ I ■■■■■■:■■ all ■■?■■■■■■■■■■ ■■■ Ml ■■■ ?■ ■ ■ na ■ ■■■ ^Univariate descripbves l^iTlir- ill ii-fillliRtili l?9 II Will M ill i-fBIid-'i III nill^ J Initial solution Correlation Matrix R CoefTidents . Jnv&rss [J Significance leveisLJ Reproduced I : De term j nmnt [. . Ant-image J KMO and BartletTs test of sphericity Continue Cancel Help i\____ — ■— ______________________________________________________________________________ 4. 点击右侧 Extraction, 勾选 Scree Plot 禾口 fixed number with factors 默认3个,点击Continue. 翰 Factor Analysis 点击 壬亠 Factor Analysis; Descriptiv-es

SPSS皮尔逊相关分析实例操作步骤

SPSS皮尔逊相关分析实例操作步骤 选题: 对某地29名13岁男童的身高(cm)、体重(kg),运用相关分析法来分析其身高与体重是否相关。 实验目的: 任何事物的存在都不是孤立的,而是相互联系、相互制约的。相关分析可对变量进行相关关系的分析,计算29名13岁男童的身高(cm)、体重(kg),以判断两个变量之间相互关系的密切程度。 实验变量: 编号Number,身高height(cm),体重weight(kg) 原始数据: 皮尔逊相关分析法 软件:

spss19.0 操作过程与结果分析: 第一步:导入Excel数据文件 1. open data document——open data——open; 2. Opening excel data source——OK. 第二步:分析身高(cm)与体重(kg)是否具有相关性 1.在最上面菜单里面选中Analyze——correlate——bivariate ,首先 使用Pearson,two-tailed,勾选flag significant correlations 进入如下界面: 2.点击右侧options,勾选Statistics,默认Missing Values,点击 Continue 输出结果: 图为基本的描述性统计量的Array输出表格,其中身高的均值 (mean)为152.576cm、标准差 (standard deviation)为 8.3622、样本容量(number of cases)为29;体重的均值为37.65kg、标准差为5.746、样本容量为29。 两者的平均值和标准差值得差距不显著。

SPSS统计分析教程独立样本T检验

独立样本T检验 下面我们要用SPSS来做成组设计两样本均数比较的t检验,选择Analyze==>Compare Means==>Independent-Samples T test,系统弹出两样本t检验对话框如下: 将变量X选入test框内,变量 group选入grouping框内,注意这时 下面的Define Groups按钮变黑,表示 该按钮可用,单击它,系统弹出比较组 定义对话框如右图所示: 该对话框用于定义是哪两组相比,在两 个group框内分别输入1和2,表明是 变量group取值为1和2的两组相比。 然后单击Continue按钮,再单击OK 按钮,系统经过计算后会弹出结果浏览 窗口,首先给出的是两组的基本情况描 述,如样本量、均数等(糟糕,刚才的 半天工夫白费了),然后是t检验的结 果如下: Levene's Test for Equality of Variances t-test for Equality of Means F Sig. t df Sig. (2-tailed) Mean Difference Std. Error Difference 95% Confidence Interval of the Difference Lower Upper X Equal variances .032 .860 2.524 22 .019 .4363 .1729 7.777E-02 .7948

差是否齐,这里的戒严结果为F = 0.032,p = 0.860,可见在本例中方差是齐的;第二部分则分别给出两组所在总体方差齐和方差不齐时的t检验结果,由于前面的方差齐性检验结果为方差齐,第二部分就应选用方差齐时的t检验结果,即上面一行列出的t= 2.524,ν=22,p=0.019。从而最终的统计结论为按α=0.05水准,拒绝H0,认为克山病患者与健康人的血磷值不同,从样本均数来看,可认为克山病患者的血磷值较高。

SPSS方差分析案例实例

S P S S方差分析案例实例 Prepared on 22 November 2020

SPSS第二次作业——方差分析 1、案例背景: 在一些大型考试中,为了保证结果的准确和一致性,通常针对一些主观题,都采取由多个老师共同评审的办法。在评分过程中,老师对学生的信息不可见,同时也无法看到 其他评分,保证了结果的公正性。然而也有特殊情况的发生,导致了成绩的不稳定,这 就使得对不同教师的评分标准考察变得十分必要。 2、案例所需资料及数据的获取方式和表述,变量的含义以及类型: 所需资料:抽样某地某次考试中不同教师对不同的题目的学生成绩的评分; 获取方式:让一组学生前后参加四次考试,由三位教师进行批改后收集数据; 变量含义、类型:一份试卷的每道主观题由三名教师进行评定,3个教师的评定结果可 看成事从同一总体中抽出的3个区组,它们在四次评定的成绩是相关样本。 表1如下: 3、分析方Array法: 用方差分析的方 法对四个总体的 平均数差异进行 综合性的F检 验。 4、数据的检验和预处理: a) 奇异点的剔除:经检验得无奇异点的剔除; b) 缺失值的补齐:无;

c) 变量的转换(虚拟变量、变量变换):无; d) 对于所用方法的假设条件的检验:进行正态性和方差齐性的检验。 ?正态性,用QQ图进行分析得下图: 得到近似满足正态性。 ?对方差齐性的检验: 用SPSS对方差齐性的分析得下表: 易知P〉,接受方差齐性的假设。 5、分析过程: a) 所用方法:单因素方差分析;方差分析中的多重比较。 b) 方法细节: ●单因素方差分析 第一步,提出假设: H0:μ1=μ2=μ3;(教师的评定基本合理,即均值相同) H1:μi(i=1,2,3)不全相等;(教师的评定不够合理,均值有差异) 第二步,为检验H0是否成立,首先计算以下统计量: 1,计算水平均值及总体均值: 表2 三位教师评选结果的均值

SPSS教程中文完整版

SPSS统计与分析 统计要与大量的数据打交道,涉及繁杂的计算和图表绘制。现代的数据分析工 作如果离开统计软件几乎是无法正常开展。在准确理解和掌握了各种统计方法原理 之后,再来掌握几种统计分析软件的实际操作,是十分必要的。 常见的统计软件有SAS,SPSS,MINITAB,EXCEL 等。这些统计软件的功能和作用大同小异,各自有所侧重。其中的SAS 和SPSS 是目前在大型企业、各类院校以及科研机构中较为流行的两种统计软件。特别是SPSS,其界面友好、功能强大、易学、易用,包含了几乎全部尖端的统计分析方法,具备完善的数据定义、操 作管理和开放的数据接口以及灵活而美观的统计图表制作。SPSS 在各类院校以及科研机构中更为流行。 SPSS(Statistical Product and Service Solutions,意为统计产品与服务解决方案)。自20 世纪60 年代SPSS 诞生以来,为适应各种操作系统平台的要求经历了多次版本更新,各种版本的SPSS for Windows 大同小异,在本试验课程中我们选择PASW Statistics 18.0 作为统计分析应用试验活动的工具。 1.SPSS 的运行模式 SPSS 主要有三种运行模式: (1)批处理模式 这种模式把已编写好的程序(语句程序)存为一个文件,提交给[开始]菜单上[SPSS for Windows]→[Production Mode Facility]程序运行。 (2)完全窗口菜单运行模式 这种模式通过选择窗口菜单和对话框完成各种操作。用户无须学会编程,简单 易用。 (3)程序运行模式 这种模式是在语句(Syntax)窗口中直接运行编写好的程序或者在脚本(script)窗口中运行脚本程序的一种运行方式。这种模式要求掌握SPSS 的语句或 脚本语言。本试验指导手册为初学者提供入门试验教程,采用“完全窗口菜单运行模式”。 2.SPSS 的启动 (1)在windows[开始]→[程序]→[PASW],在它的次级菜单中单击“SPSS 12.0 for Windows”即可启动SPSS 软件,进入SPSS for Windows 对话框,如图1.1, 图 1.2 所示。

SPSS统计分析方法及应用教学大纲

《SPSS统计软件》课程教学大纲 一、说明 (一)课程定义: 本课程是网络与新媒体专业的选修课程。SPSS统计软件应用课程,是以计算机科学为支持,将统计软件为运用工具,用所学习的统计学理论与方法为指导,系统介绍对社会经济现象数据的搜集、整理、分析等综合技能。 开设本门课程,能更好的帮助学生理解和掌握统计学的理论及方法,注重学生的实际操作与应用能力的培养。通过该课程的学习,使学生掌握spss统计软件,为其以后的学习和工作打好基础。 (二)编写依据: 本课程大纲根据武汉体育学院体育科技学院人文社科系网络与新媒体专业人才培养方案(2018版)编写。 (三)目的任务: 通过SPSS软件实验教学,培养学生根据实际问题建立SPSS数据文件、利用SPSS软件提供的各种统计功能进行数据的整理与分析,并结合相关的专业知识对分析结果给出解释,为学生以后的工作打下坚实的基础。要求学生课前做好实验准备,课中积极接受和沟通,课后认真总结并写好实验报告。 (四)学时数与学分数: 本课程教学总学时为36课时,2学分。具体学时分配参照下表。 (五)适用对象: 网络与新媒体专业大三学生。 (六)课程编码: KY1810A01

二、教学内容与学时分配 三、教学内容与知识点 第一章SPSS统计分析软件概述 第一节SPSS使用基础 知识点:SPSS软件的基本窗口、退出。 第二节 SPSS的基本运行方式 知识点:窗口菜单方式、程序运行方式、混合运行方式。第二章SPSS数据文件的建立和管理 第一节 SPSS数据文件 知识点:SPSS数据文件的特点、基本组织方法。 第二节 SPSS数据的结构和定义方法

SPSS案例研究分析实例(消费习惯)

SPSS案例分析实例(消费习惯)

————————————————————————————————作者:————————————————————————————————日期:

Spss论文 购物习惯的统计学分析课程名称:SPSS 所在专业:经济学+软件工程 所在班级:09-1 姓名:李丽媛杨晓楠孙同哲胡贞玉 学号:0918250102 0918250104 0918250105 0918250114

一.描述性统计分析 最大似然确定数分析 男性与女性的年龄、家庭成员数量、家庭月收入、购物频率、自用商品、礼 品、消费者类型最大似然确定数的分析 表1-1 M-Estimators e 2.14 2.16 2.14 2.161.83 1.81 1.83 1.81............ 3.17 3.17 3.15 3.171.86 1.84 1.86 1.842.04 2.05 2.04 2.052.14 2.16 2.14 2.161.83 1.81 1.83 1.812.14 2.16 2.14 2.161.78 1.77 1.78 1.77............3.63 3.60 3.60 3.60.... 4.25 4.29 4.17 4.28....3.48 3.46 3.48 3.46....... . 1,男;2女1212121212121212121212 年龄婚否交通状况家庭成员数量家庭月收入购物频率购物场所自用商品礼品消费者类型固定商场购买 Huber's M-Esti m ator a Tukey's Biwei g ht b Hampel 's M-Esti m ator c Andrews' Wave d Th e wei g hti n g constant i s 1.339.a. The wei g hti n g constant i s 4.685.b. The wei g hti n g constants are 1.700, 3.400, and 8.500c. The wei g hti n g constant i s 1.340*pi. d. Some M-Esti m ators cannot be computed because of the hi g hl y centrali z ed di s tri b uti o n a round t he medi a n. e. 表1-1表示的是男性与女性的年龄、家庭成员数量、家庭月收入、购物频率、自用商品、礼品、消费者类型从4个不同权重下分别作中心趋势的粗略最大似然确定数。

相关主题
文本预览
相关文档 最新文档