当前位置:文档之家› SPSS中文教材

SPSS中文教材

SPSS中文教材
SPSS中文教材

常用统计分析方法——SPSS应用

郭显光编

温州大学城市学院

2010年3月

目录

TOC \o "1-3" \h \z \u 第一章数据文件的建立及基本统计描述 (1)

第一节SPSS的启动及数据库的建立 (1)

第二节数据的编辑与整理 (3)

第三节基本描述统计 (8)

第四节交叉表分析 (16)

第五节多响应变量分析 (19)

练习一 (24)

第二章均值比较检验与方差分析 (26)

第一节比较均值 (26)

第二节单个总体的t检验分析 (27)

第三节两个总体的t检验 (28)

第三节单因素方差分析 (31)

第四节双因素方差分析 (34)

练习二 (39)

第三章相关分析与回归模型的建立与分析 (40)

第一节相关分析 (40)

第二节线性回归分析 (45)

第三节曲线估计 (50)

练习三 (53)

第四章非参数检验 (54)

第一节两个独立样本的检验 (55)

第二节两个有联系样本检验 (56)

第三节多个样本的非参数检验 (58)

习题四 (62)

第五章SPSS综合案例 (63)

一、高大图书公司问卷分析案例 (63)

二、啤酒市场调查案例 (65)

三、其他案例 (66)

附录部分常用统计量公式 (70)

第一章数据文件的建立及基本统计描述

在社会各项经济活动和科学研究过程中,经常获得许多数据,而这些数据中包含着大量有用的信息。若要准确地、科学地提取这些信息,就要应用各种统计分析方法,其中最基本的方法是数据的基本统计描述。通过数据的基本统计描述,可以得到数据的分布状况,数据的主要特征值,时间序列的趋势性,是否存在异常值以及数据的大致图形等。当然,要实现对数据的统计分析和描述,首先要从建立数据文件开始。这一章主要介绍数据文件的建立和数据的基本统计描述方法。

第一节SPSS的启动及数据库的建立

一、SPSS简介

SPSS(Statistics Package for Social Science )for Windows是一种运行在Windows 系统下的社会科学统计软件软件包。SPSS软件包集数据整理、分析过程、结果输出等功能为一体,采用窗口操作界面,统计分析方法涵盖面广,用户操作使用方便,输出数据表格图文并貌,并且随着它的功能不断完善,统计分析方法不断充实,大大提高了统计分析工作的效率。至今,已经拥有全球数以万计的用户,分布在通信、医疗、银行、证券、保险、制造、商业、市场研究、科学教育等众多的行业领域,成为世界上应用最广泛的专业统计软件之一。

SPSS的基本功能包括数据管理、统计分析、图表分析、输出管理等,具体内容包括描述统计、列联表分析,总体的均值比较、相关分析、回归模型分析、聚类分析、主成份分析、时间序列分析、非参数检验等多个大类,每个类中还有多个专项统计方法。SPSS设有专门的绘图系统,可以根据使用者的需要将给出的数据绘制各种图形,能够满足用户的不同需求。

二、启动SPSS软件包

当用户在操作系统下运行SPSS软件后,计算机屏幕上出现一个对话框,如图1.1所示:

图1.1 SPSS17启动后操作对话框

三、数据文件的建立

当对话框选择Type in data后,点击OK,系统将显示出SPSS软件包数据编辑主窗口,数据文件的建立就是在数据编辑窗口中完成的。数据编辑窗口可以显示两张表,分别是数据视图(见

图1.2)和变量视图(见图1.3),通过点击下端的2个同名窗口标签按钮实现相互切换。

图1.2 数据视图表

数据编辑区是SPSS的主要操作窗口,是一个二维平面表格,用于对数据进行各种编辑;标尺栏由纵向标尺栏和横向标尺栏,横向标尺栏显示数据变量,纵向标尺栏显示数据顺序(如时间顺序)。

数据视图表可以直接输入观测数据值或存放数据,表的左端列边框显示观测个体的序号,最上端行边框显示变量名。

变量表用来定义和修改变量的名称、类型及其他属性,如图1.3所示。

图1.3 变量视图表

在变量视图表中,每一行描述一个变量,依次是:

变量名。变量名必须以字母、汉字及@开头,英文字母不区别大小写,最后一个字符不能是句号。

变量类型。变量类型有8 种,最常用的是数值型变量。其它常用的类型有:字符型,日期型,逗号型(隔3位数加一个逗号)等。

宽度:变量所占的宽度。

小数:小数点后位数。

标签:变量标签。关于变量涵义的详细说明。

值:变量值标签。关于变量各个取值的涵义说明。

缺失:缺失值的处理方式。

列:变量在数据视图中所显示的列宽(默认列宽为8)。

对齐:数据对齐格式(默认为右对齐)。

度量测度:数据的测度方式。系统给出名义型、定序型和度量型三种(默认为度量型)。

如果输入变量名后回车,将给出变量的默认属性。如果不定义变量的属性,直接输入数据,系统将默认变量1,变量2等。

定义了变量的各种属性后,回到数据视图表中,就可以直接在表中录入数据。输入数据后可以点击保存或另存为作为数据文件保存。另外对于统计分析的结果也可以作为文件保存起来。

为了在统计分析过程中能有效的利用其它软件产生的数据,SPSS软件编辑窗口除可以使用*.sav扩展名数据文件,还可以直接打开和保存.xls等类型的文件。

第二节数据的编辑与整理

当录入数据之后,就可以对原始数据进行整理和分析,关于数据的整理和分析都是在数据窗口完成的。下面将介绍SPSS统计分析软件在数据窗口的主要操作方式和菜单相应的功能。

一、数据窗口菜单栏

数据编辑窗口的主菜单如图1.4所示,主菜单中的具体功能包括:

图1.4 SPSS主菜单

在统计分析过程中常用的功能主要集中在数据操作、数据转换、数据分析、统计图形的建立与编辑等操作。

二、数据功能

数据编辑窗口的数据菜单为用户创建和定义数据提供了方便的功能,如图1.5所示。这个菜单是SPSS统计软件数据整理的特有功能菜单。它的功能包括:对变量、观测量的编辑处理;对变量数据的变换;对观察量数据整理。

这些功能为各种统计分析要求提供极其灵活了数据整理功能,用户可以根据不同统计分析对数据的要求对数据进行整理。

图1.5 数据菜单图1.6 转换菜单

三、转换功能

数据编辑窗口的转换菜单为用户创建和定义复杂的数据提供了方便的功能,如图1.6所示。它与数据菜单共同使用,可对基本的数据进行重新编辑,形成新的变量和观测量。这个菜单主要对变量进行操作,分为三部分的功能。这些功能也为各种统计分析要求提供极其灵活了数据处理功能。

四、数据的编辑

在Data View中,用鼠标左键单击数据表左边框的观测个体序号,这一行值就会被选中,用鼠标左键单击上边框的变量名,这个列就被选中,和其它Windows中的操作类似,也可以用鼠标对选中一部分单元格,选中的行、列、单元格后,单击鼠标右键,可以对它们进行复制、删除、剪切等操作。

如果需要对已经输入的数据进行修改,就要对已经存在的数据进行编辑,SPSS有许多数据编辑功能。下面介绍几种常用的数据编辑功能。

1.观测数据排序

给观测量数据排序的命令是“排序个案”。

打开“排序个案”对话框(见图1.7 )。

图1.7 排序个案对话框

从对话框左侧的变量列表中选择排序变量,点击右箭头按钮加入“排序依据”框中,然后在“排序顺序”栏中选择排序顺序:

注意:观测个体。排序变量可以是一个或多个,当选择多个排序变量时,首先按第一个变量值排序,然后在第一个变量取值相同的那些个体中再按第二个变量值排序,依次类推。

注意在排序的时候,观测个体整行的值一同变到新位置,而不是只有排序变量那一列变动。但数据表中左边框上的序号并不随着变动,因此,为了保留原始数据的信息,最好自己定义一个变量来记录观测个体的序号。

2.在数据中选取子集

如果需要从数据文件中选取一部分数据,可以在数据编辑窗口单击“数据”→“选择个案”,打开“选择个案”对话框,如图1.8所示:

图1.8 选择个案对话框

在该对话框中选择挑选数据子集的方式(单选):

如果要选择受教育年限超过12年的个案:选择“如果条件满足”,输入条件,见图1.9。

如果要选择个案序号为“31-40”的个案:选择“基于时间或个案全距”,输入范围,见图1.10。

图1.9 选择个案:条件对话框图1.10 选择个案:个案范围选择了挑选数据子集的方式后,在数据窗口可看到未选入的个案会打上×。

3.数据分类汇总

用户可以根据需要对数据按指定的变量的数值进行归类分组汇总。以数据库SY-2两个班的学生成绩为例,如果按照性别对数学成绩进行汇总,可以使用分类汇总命令实现。具体操作如下。

⑴指定分类变量和汇总变量。

打开数据库SY-2,在数据窗口单击“数据”-“分类汇总”命令,打开“分类汇总”对话框。如图1.11所示:

图1.11 分类汇总对话框

⑵在变量名列表框中选择分类变量”性别”进入“分组变量”;

⑶在变量名列表框中选择汇总变量“数学”进入“汇总变量”;

⑷单击“函数”按钮,打开“函数”对话框,如图1.12所示。在此对话框中可以选择平均值、标准差等其中之一的方法进行分类汇总。选择分类汇总的函数形式后返回“分类汇总”对话框中。⑸单击“继续”-“确定”,平均数等以新的变量保存在数据文件中。

图1.12 汇总函数对话框

4.数据秩的确定

如果用户需要对已有的数据变量排秩(序),如对数据SY-1中两个班的数学成绩分别排出名次,可以在数据窗口采用以下操作。

⑴单击“转换” “个案排秩”,打开“个案排秩”对话框,如图1.13所示:

图1.13 个案排秩对话框

⑵从左边变量名列表框中选择变量”数学”(也可选择多个变量)进入变量框中,选择变量”班级”进入“排序标准”框中,则系统排序时将按照“班级”进行分别排序。

⑶单击“结”按钮,(结是指两个或两个以上的数据相等的情况)的处理方式。由于秩与数据个数是一一对应的,当数据有相同的时,确定它们相应的秩有三种处理方式:对应秩的平均值、最小值和最大值。点击“确定”,就可以在数据窗口看到排序结果。

五、变量的编辑

1.插入一个新变量

只要在“变量视图”中就可以插入新变量,然后定义变量的格式。

2.已存在的变量生成新变量

对于已存在的数据变量,根据需要进行计算生成新变量的命令是“计算变量”。

在数据窗口单击“转换”- “计算变量”,打开对话框,如图1.14所示。

在对话框左上方“目标变量”栏中,键入即将生成的新变量的名称,在右边“数字表达式”中输入“数学+物理”,单击“确定”,即可生成总成绩。

图1.14 计算变量对话框

3.产生计数变量

如果用户需要对满足某项条件的数据进行计数,可以使用“计数”命令。以学生成绩数据SY-1为例,如果要对数学和物理优良的门数计数,具体操作步骤如下:

在数据窗口单击“转换”-“对个案内的值计数”,打开“计数”对话框,如图1.15所示:

图1.15 计算个案内值的出现次数对话框

单击“定义值”按钮,打开“要统计的值”对话框。如图1.16所示:

图1.16 统计个案内的值对话框

在上面的对话框中,在“范围,从值到最高”中输入“80”,单击“添加”。使选择结果进入“要统计的值”框内。单击“继续”按钮,返回主对话框中。最后点“确定”可在数据窗口得到计数变量。

4.变量分组(编码)

“转换”菜单下有三条编码命令。“重新编码为相同变量”是指给每个变量值重新赋予一个码来描述他们的某些属性。编码也可以看做分组:一个组对应一个组号,新编码替代了原变量值。“重新编码为不同变量”是将编码后的变量用一个新变量保存。

“自动重新编码”是SPSS系统自动设定码为正整数,而重新编码可以根据用户的需要指定特别的码值。

如果要将数学成绩按“60分以下、60-70分、70-80分、80-90分、90分以上”分组,分组后的变量为“数学等级”,对应的得分分别为“1、2、3、4、5”,具体操作如下:在数据窗口单击“转换”-“重新编码为不同变量”,打开对话框,如图1.17所示:

图1.17 重新编码为不同变量对话框

选择“数学”进入“数字变量-输出变量”框中,并在右边的“输出变量”框中定义新的变量名“数学等级”,单击“更改”按钮,单击“旧值和新值”按钮,打开对话框,“旧值和新值”对话框最左侧有六个选项,用来确定原变量的取值区间(或单个变量值),它们将被赋予一个相同的新码值,新的码值在右上方的“新值”栏中填入。填好后“添加”按钮就被激活了。在数学成绩分组中为了遵循“上限不在内”,要先定义“90分以上”组,新值为“5”,重复以上步骤,把所有的区间一个一个都输入后,点“继续”按钮回到“重新编码为不同变量”菜单,点“确定”按钮执行命令,即在数据窗口可得到需要的分组变量“数学等级”。

第三节基本描述统计

在建立了数据文件之后,需要对数据作进一步的考察,如了解数据的基本特征,如数据的均值、标准差、四分位点,数据的分布形态等,这个过程称为对数据进行基本统计描述。所以说,数据的基本统计描述的目的是:了解数据的基本特征和基本分布形状,为进一步分析做好充分准备。

本节主要内容:数据的基本统计描述方法:频数分析、探索分析、交叉表分析及多多响应变量分析等。

频数分析

频数分析适用名义型、有序型和度量型变量。

对于一组数据,考察不同的数据出现的频数,或者是数据所落入指定的区域内的频数,可以了解数据的分布状况。

例1.1数据文件SY-3是一个公司职员表,其中有性别、年龄,受教育年限等五个变量。

1.对名义型变量“性别”进行描述

具体操作如下:

⑴打开数据文件SY-3后,单击“分析”→“描述统计”→“频数”,打开频数分析对话框如图1.18所示。

图1.18 频数分布主对话框图1.19 图表对话框

⑵在左边的变量框中选中“性别”送入变量;

⑶选中“显示频率表格”,要求输出分布表;

⑷单击“图表”按钮,得到对话框图1.19,选择“条形图”-“继续”;

在“频数”对话框中单击“确定”,得到输出结果见图1.20。

图1.20 性别的输出结果

2.对度量型变量“年薪”进行描述

一般不能选择“显示频率表格”,而要单击“统计量”按钮,见图1.21。

图1.21 统计量对话框

⑴反映集中趋势的统计量有:均值、中位数、众数;

⑵反映离散趋势的统计量有:标准差、方差、范围(全距)等;

⑶反映分布的统计量有:偏度、峰度;偏度是描述分布曲线图是否对称的指标,偏度等于零时对称,小于零时左偏,大于零度时右偏。峰度是描述分布曲线图是否集中的指标,峰度等于零与标准正态分布集中程度相同,小于零时更分散,大于零度时更集中。

⑷百分位值中四分位数是将数据按照从小到大的顺序排列后分成四等分,四分之一处为第1四分位数,比该值小的数占四分之一;二分之一处为中位数;四分之三处为第3四分位数,比该值小的数有四分之三。

度量型变量的图表只能在“图表”对话框中选择“直方图”,不宜做“条形图”或“饼图”。

本例中均选择系统默认项。点击“确定”,输出结果见图1.22。

图1.22 年薪的描述性统计量和直方图

从上面的表和直方图中可以观察到该公司平均年薪44211元,20000-50000元的年薪居多,有一半的年薪在35550以下。

3.对有序型变量“受教育年限”进行描述

“受教育年限”的分类不多,既可以按名义型计算频率表,又可以计算统计量,当分类不多时可以作条形图或饼图,输出结果见图1.22。

图1.22 受教育年限的描述性统计量

二、描述性分析

描述统计分析是对数据进行基础性描述。可以得出数据的平均值、标准差、最大值、最小值、方差、极差、峰度、偏度等统计量。

例1.2 以2002年全国职工平均工资表为例(数据库SY-2),介绍描述统计分析的具体操作步骤如下:

首先打开数据表SY-2,按照“分析”-“描述统计”-“描述”打开“描述”对话框,选择有关变量,在“选项”中选择有关统计量,如图1.23所示;

图1.23 描述主对话框及选项对话框

如在此例中选择按平均值升序项,返回主对话框,单击OK,在输出窗口得描述统计分析输出表见表1.1。

在主对话框中还有“将标准化得分另存为变量”功能,可以对变量值进行标准化处理,标准化后的值一般在[-3,3]范围内,可以使得不可比的变量化为可比。

表1.1 描述统计基本描述统计表

三、探索分析

探索分析适用于对度量型数据进行初步的观察分析,主要的分析功能有:

观察数据的分布特征:可通过绘制箱图和茎叶图等图形直观地反映数据的分布形式和数据的一些规律性,包括考察数据中是否存在异常值等。

正态分布检验:检验数据是否服从正态分布。

方差齐性的检验:用Levene检验比较各组的方差是否相等。

以数据库SY-1提供的两个班的学习成绩数据为例,对两个班的数学成绩按照性别进行数据的分布、按照性别检验其数学成绩是否服从正态分布,方差是否相等。

例1.3 打开数据库SY-1,单击“分析”->“描述统计”->“探索”,打开探索主对话框:如图1.24所示:

图1.24 探索分析主对话框和统计量对话框

1.对不同性别的数学成绩进行比较

从左侧的变量列表中选出变量“数学”作为因变量;选择”性别”作为因子变量,选择“班级”作为标注,当输出涉及到观测量时,使用该变量值标识各观测量。

单击“统计量”按钮,打开对话框,选择统计输出量。有四个选择项,分别是:

描述性,同时指定均值的置信区间的置信度,系统默认为95%;

M-估计(M估计在计算时对所有观测量赋予权重,随观测量距分布中心的远近而变化);

界外值:输出分析数据中五个最大值和五个最小值;

百分位数。

本例中选择“描述性”和“界外值”后,返回主对话框,确定,得到输出结果见表1.2。

表1.2 不同性别数学成绩描述性统计量和界外值

2.作出不同性别数学成绩的茎叶图和箱图

单击“绘制”按钮,打开图对话框,选择箱图和茎叶图,如图1.25所示。

图1.25 探索分析图对话框

作出箱图见图1.26。

箱图中,最底部的水平线段是数据的最小值(奇异点除外),顶部的水平线段是数据的最大值(奇异点除外),中间矩形箱子的底所在位置是数据的第一个四分位数(即P25),箱子顶部所在位置是数据的第三个四分位数据(即P75)。箱子中间的水平线段刻画的是数据的中位数(即P50)。

奇异值是指大于P75+1.5(P75-P25)或小于P25-1.5(P75-P25) 的数值,标记为●,而对于大于P75+3(P75-P25)或小于P25-3(P75-P25)的数值称为极值,标记为*。

图1.26 数学成绩箱图

从上面的箱图中可以得出结论:女生的数学成绩的平均水平比男生低且分散程度小,但有一个极端值。作出茎叶图见图1.27。

图1.27 不同性别数学成绩的茎叶图

茎叶图左边第1列为频数,第2列为茎,每个茎为10分,第3列为叶,每个叶为1分。如女生第4行有3人,成绩分别为66、67、68分,第1行是极端值,成绩为46分。茎叶图具有直方图的优点,又弥补了其在各组内没有差异的不足。

3.对不同性别数学成绩进行正态性检验

如果在“绘制”中选择了“带检验的正态图”,则可以进行正态性检验,得到正态性检验表见表1.3。

从表1.3的检验结果可以看出,由于假设检验的P(Sig.)值均大于0.05,故可以认为男女生的数学成绩分布都近似地服从正态分布。

还可以作出标准Q-Q图,女生标准Q-Q图见图1.28。

图1.28 女生数学成绩的标准Q-Q图

上图中间的斜线是服从正态分布的标准线。从上面的分布图中看出,除个别极端点外,数据点都在斜线周围波动,故可以认为女生的数学成绩近似服从正态分布。

还可以作出离散正态分布图,女生离散正态分布图见图1.29。

图1.29 女生数学成绩的离散正态图

从上面的离散正态分布图中看出,除个别极端点外,离散点都在±2的周围波动,故可以认为女生的数学成绩近似服从正态分布。

第四节交叉表分析

当观察的现象与两个因素有关时,如某种服装的销量受价格和居民收入影响;某种产品的生产成本受原材料价格和产量的影响等等,交叉表分析可以比较好的反映出两个因素之间有无关联性,两因素与现象之间的相关关系。因此,数据交叉表分析主要包括两个基本任务:根据收集的样本数据,产生二维或多维交叉表;

在交叉表的基础上,对两两变量间是否存在关联性进行检验。

例1.4 以数据SY-1学生成绩为例,将学生成绩按照五级制分等级后,按照班级形成数学等级和物理等级交叉分析表,并考察学生的物理和数学成绩间有无关联性。

一、交叉表的形成

制作交叉表的具体操作步骤。

⑴打开数据SY-1,单击“分析”-“描述统计”- “交叉表”对话框如图1.30 所示。

⑵如果是二维列联表分析,可以将行变量选择进入行中,将列变量选择进入列框中。如进行三维以上的列联表,可以将其它变量作为控制变量选到层框中。多控制变量可以是同层次的也可以是逐层叠加的。此例中选择数学等级为行变量,物理等级为列变量,班级作为控制变量。

⑶显示复式条形图选择项,可以指定绘制各变量交叉频数分布柱形图。取消表格表示不输出列联表,只有在分析行列变量间关系时选择此项。此例中不选择这一项。

图1.30 交叉表对话框

⑷单击“单元格”按钮,打开“单元显示”对话框,如图1.31所示。从对话框中指定列联表单元格中的输出内容,如果选择“百分比”会计算出行、列或总计百分比。本列中选择默认项观察值。

图1.31 单元显示对话框

从上表中可以看出,1班中数学和物理成绩均为优秀者有4人,数学不及格的两人的物理成绩都是及格。

二、两变量关联性检验(卡方检验)

卡方检验是一种非参数检验方法。可以用来检验两个变量因素之间是否有关联关系。如果要考察学生的数学成绩和物理成绩之间是否有关联,相当于检验假设:

H0:数学成绩和物理成绩之间是相互独立的(无关联关系);

H1:数学成绩和物理成绩之间的关联关系显著。

实施卡方检验的具体操作步骤:

单击“精确”按钮,打开“精确检验”对话框如图1.32,此对话框提供检验方式,一般取默认值。单击“统计量”按钮,打开对话框如图1.32所示,从中选择检验统计量。

图1.32 精确检验对话框和统计量对话框

“卡方“检验复选项,主要检验是行与列变量的独立性检验,本例中只选择此项。

“相关“复选项,要求输出Pearson和Spearman相关系数。

“名义“栏,适用于名义变量统计量。

“有序“栏,适用于有序变量的统计量。

⑴Gamma 选择项,两有序变量之间的关联性的对称检验;

⑵Somer’s两有序变量之间的关联性的检验;

⑶Kendall’s tan-b 复选项,考虑有结的秩或等级变量关联性的非参数检验。

⑷Kendall’s tan-c 复选项,忽略有结的秩或等级变量关联性的非参数检验。

选择完成后,单击“确定“,就可得到相应的检验结果如表1.5所示。

从表1.5中,两个班级的Pearson卡方检验的P值(Sig.)均小于0.05,所以认为数学成绩与物理成绩之间关联性是比较显著的。这个结论与实际情况是相符的。

SPSS基本操作傻瓜教程

目录 一、SPSS界面介绍 (2) 1、如何打开文件 (2) 2、如何在SPSS中打开excel表 (3) 3、数据视图界面 (3) 4、变量视图界面 (4) 二、如何用SPSS进行频数分析 (11) 三、如何用SPSS进行多变量分析 (15) 四、如何对多选题进行数据分析 (18) 1、对多选题进行变量集定义 (18) 2、对多选题进行频数分析 (21) 3、对多选题进行多变量交互分析 (24) 五、如何就SPSS得出的表在excel中作图 (27)

一、SPSS界面介绍 提前说明:第一,我这里用的是SPSS 20.0 中文汉化版。第二,我教的是傻瓜操作,并不涉及理论讲解,具体的为什么和用什么理论公式来解释请认真去听《社会统计学》的课程。第三,因为是根据我自己的操作和理解来写的,所以可能有些地方显的不那么科学,仍然要说请大家认真去听《社会统计学》的课程,那个才是权威的。 1、如何打开文件 这个东西打开之后界面是这样的: 我们打开一个文件:

要提的一点就是,SPSS保存的数据拓展名是.sav: 2、如何在SPSS中打开excel表 在上图的下拉箭头里找到excel这个选项: 然后你就能找到你要打开的excel表了。 3、数据视图界面 我现在打开了一个数据库。 可以看到左下角这个地方有两个框,两个是可以互相切换的,跟excel切换表一样,跟excel切换表一样: 现在的页面是数据视图,也就是说这一页都是原始数据,这里的一行就是一张问卷,一列就是一个问题,白框里的1234代表的是选项。这个表当时录数据的时候为了方便看,是把ABCD都转换成了1234,所以显示的是1234,当然直接录ABCD也可以,根据具体情况看怎么录,只要能看懂。 多选题的录入全部都是细化到每个选项,比如第四题,选项A选了就是“是”,没选就是

SPSS操作步骤汇总

S P S S操作步骤汇总 Company Document number:WUUT-WUUY-WBBGB-BWYTT-1982GT

SPSS学习 第一章数据文件的建立 数据编码 Type:Numeric:数值型 string:字符串型 Missing: Measure:scale定量变量 nominal定性变量 根据已有的变量建立新变量 1、对于数据进行重新编码 Transform—recode into different variables—选择input variable output variable –定义新变量的名称—change—开始定义新旧变量—continue 2、通过SPSS函数建立新变量 Transform—compute variable –从function group中选择公式范围下面选择具体的公式—if 中设置要改变—continue—OK(可以对变量进行各种计算) 第二章清除数据与基本统计分析 1、对不合理的数据检查并清理 检查:analysis-description statistic-frequencies—选入要检查的数据—OK 结果:频数统计表—看是否有错误—missing system 清理: 1.对系统缺失值的清理

Data—select case—if condition is satisfied—if—function group(missing)--下面选 (missing)--continue—output(delete unselected cases)--OK—对num为哪一位的进行修改 2.对sex=3的清理(直接就清除了) Data—select case—if condition is satisfied—if—sex调入再输入=3—continue-- output(delete unselected cases)--OK—对num为哪一位的进行修改 2. 对相关变量间逻辑性检查和清理 Data—select case—if condition is satisfied—if—输入表达式(前后逻辑不相符合的表达式)-- continue-- output(delete unselected cases)--OK—对num为哪一位的进行修改 3.统计描述 正态分布统计描述 1、正态性检验:Analysis—nonparametric tests—legacy dialogs—1-sample K-S—one-sample Kolomogorov Smirnov test –normal—ok/ 2、统计描述:Analysis—descriptives--time选入—options—ok 3、按照男女统计描述:data—split file –compare group –sex调入—ok Analysis-descriptive statistic – descriptive—time 调入—options选择—OK非正态分布资料统计描述 1、正态性检验nonparametric 2、Analysis—descriptive statistics—frequencies 选入-- statistics选择—OK 第三章T检验

SPSS中主成分分析的基本操作1

SPSS 中主成分分析的基本操作 Xiaowenzi22与pinksss 共同制作 阐述主成分分析法的原理 主成分分析是设法将原来众多具有一定相关性(比如P 个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。通常数学上的处理就是将原来P 个指标作线性组合,作为新的综合指标。最经典的做法就是用F 1(选取的第一个线性组合,即第一个综合指标)的方差来表达,即Var(F 1)越大,表示F 1包含的信息越多。因此在所有的线性组合中选取的F 1应该是方差最打的,故称F 1为第一主成分。如果第一主成分不足以代表原来P 个指标的信息,再考虑选取F 2即选第二个线性组合,为了有效地反映原来信息,F 1已有的信息就不需要再出现再F 2中,用数学语言表达就是要求Cov(F 1, F 2)=0,则称F 2为第二主成分,依此类推可以构造出第三、第四,……,第P 个主成分。 主成分模型: F 1=a 11X 11+a 21X 21+……+a p1X p F 2=a 12X 12+a 22X 22+……+a p2X p …… F p =a 1m X 11+a 2m X 22+……+a pm X p 其中a 1i, a 2i, ……,a pi (i=1,……,m)为X 的协差阵Σ的特征值多对应的特征向量,X 1, X 2, ……, X p 是原始变量经过标准化处理的值(因为在实际应用中,往往存在指标的量纲不同,所以在计算之前先消除量纲的影响,而将原始数据标准化)。 A=(ij a )m p ×=(,1α,2α…,m α),i i i R αλα=, R 为相关系数矩阵, i i αλ、是相应的特征值和单位特征向量, 1λ≥2λ≥…≥p λ≥0 上述方程组要求: 1、a 21i +a 22i +……+a 2pi =1 (i=1,……,m) 2、m I A A =′ (A=(ij a )m p ×=(,1α,2α…,m α),A 为正交矩阵) 3、Cov(F i ,F j )=ij i δλ, =01 ij δj i j i ≠= 操作步骤: 一、 数据标准化

SPSS_操作要点整理--详细版解读

Spss操作要点详细版 第一章导论——SPSS介绍 学习目标:初步认识SPSS软件的内容 一、SPSS界面说明 SPSS for Windows是SPSS/PC的Windows版本,具有Windows软件的共同特点,其界面十分友好,打开SPSS程序就会出现图1-2界面。 标题栏 菜单栏 工具栏 数据栏 标签 图1-2 SPSS 11.5 for Windows 界面 该界面为SPSS 的数据编辑窗口,其组成部分及主要功能如下: 1。标题栏:功能与其它Windows软件一致。 2.菜单栏:由10个菜单项组成,每个菜单包括一系列功能。各菜单的主要功能如下。 2.1 File:文件操作菜单。单击Fil e,有图1-3下拉菜单,主要功能包括:·New:新建数据编辑窗口、语句窗口、结果输出窗口等; ·Open和Open Database:打开数据编辑窗口、语句窗口、结果输出窗口等; ·Read Text Data:读入文本文件; ·Save和Save As:保存文件; ·Display Data Info:显示数据的基本信息; ·Prin t和Print Preview:将数据管理窗口中的数据以表格的形式打印出来。

图1-3 File菜单项的下拉菜单 图1-4 Edit菜单项的下拉菜单 2.2 Edit:文件编辑菜单。主要用于数据编辑,如图1-4,主要功能包括:·UndoRedo或modify cell values:撤消或恢复刚修改过的观测值; ·cut,copy,paste:剪切、拷贝、粘贴指定的数据; ·paste variables:粘贴指定的变量; ·clear:清除所选的观测值或变量; ·find:查找数据。 2.3 View:视图编辑菜单。用于视图编辑,进行窗口外观控制。包含显示/隐藏切换、表格特有的隐藏编辑/显示功能及字体设置等功能。 2.4 Data:数据文件建立与编辑菜单。主要用于变量和观测量的编辑和整理。如图1-5,主要功能包括: ·Define Variable Properties:定义变量属性; ·Copy Data Properties:复制数据文件属性; ·Insert Variable:插入变量; ·Insert Cases:插入变量或观测值; ·Sort Cases:按照某个变量值重新排列观测值在数据文件中的顺序; ·Transpose:把数据文件的行列进行转置; ·Restructure:数据重组; ·Aggregate:对数据进行分类汇总,即按指定的变量将观测值进行汇总,以求得每组

SPSS基本操作步骤详解

SPSS基本操作步骤详解 本文采用SPSS21.0版本,其它版本操作步骤大体相同 一、基本步骤 (一)检查数据 在进行项目分析或统计分析之前,要检核输入的数据文件有无错误,即检核missing。 例,“XX量表”采用Likert scale五点量表式填答,每个题项的数据只有五个水平:1,2,3,4,5。 1.执行次数分布表的程序 Analyze(分析)→Descriptive statistics(描述统计)→将题项变量【例,a1—a10】键入至Variables(变量)框中→Frequencies(频率)→Statistics(统计量)→Minimum (最小值)、Maximum(最大值)→Continue(继续)→OK(确定) 2.执行描述统计量的程序 Analyze(分析)→(描述统计)→将题项变量【例,a1—a10】键入至Variables(变量)框中→Descriptives(描述)→Options(选项)→Minimum(最小值)、Maximum(最大值)【此处一般为默认状态即可】→Continue(继续)→OK(确定) (二)反项计分 若是分析的预试量表中没有反向题,则此操作步骤可以省略; 量表或问卷题中如果有反向题,则在进行题项加总之前将反向题反向计分,否则测量分数所表示的意义刚好相反。 例,“XX量表”采用Likert scale五点量表式填答,反向题重向编码计分:1→5,2→4,3→3【可不写】,4→2,5→1。 Transform(转换)→Recode into same Variables(重新编码为相同变量)→将要反向的题目键入至Variables(变量)框中【例,a1,a3,a5】→Old and new values(旧值和新值)→在左边Old value—value中键入1,在右边New value—value中键入5,Add (添加)→……依次进行此步骤……在左边Old value—value中键入5,在右边New value —value中键入1,Add(添加)→Continue(继续)→OK(确定)【注意不同量表计分方式不同,因而反向编码计分也不同,常见的有四点量表、五点量表和六点量表等】 (三)题项加总 量表题项加总的目的在于便于进行观察值得高低分组。 例,“XX量表”采用Likert scale五点量表式填答,题项为:a1,a2……a10,记总分为:az。 Transform(转换)→Computer Variable(计算变量)→在左边Target Variable(目标变量)中键入az,在右边Numeric Expression(数字表达式)中键入a1+a2+……+a10

SPSS操作方法

统计分析软件SPSS操作方法 SPSS for Windows的启动和退出 图2 软件启动 在鼠标顺序单击“开始”——“程序”——“SPSS 10.0 for Windows”——“SPSS 10.0 for Windows”启动条之后,SPSS启动界面如图2所示。

图3 启动界面 如需要退出程序可单击右上角的“×”或左上角“File”下的“Exit”即可退出。如果在本次SPSS期间激活的窗口如DATA窗口、OUTPUT窗口的有关内容已经作为文件存盘,则系统直接退出SPSS系统。否则系统会对各窗口一一提问:是否保存×××窗口的内容。用户可按自己的意愿一一给以回答。随后,结束本次SPSS期间,退出SPSS系统。 菜单及窗口介绍 由图3所示,SPSS软件的主菜单主要包括10项: ①File:文件操作;②Edit:文件编辑;③View:视图;④Data:数据文件建立与编辑;⑤Transform:数据转换;⑥Analyze:统计分析;⑦Graphs:统计图表的建立与编辑;⑧Utilities:实用程序;⑨Window:窗口控制;⑩Help:帮助。 而数据窗口主要包括两部分内容,data view和variable view两个表格,这一点与EXCEL 软件极为相似,data view主要用来显示需要处理的数据,而variable view则用来为数据不同的变量的性质进行设置,如名字name、类型type、宽度width、小数点位数Decimals等。以下为下一级子菜单的介绍。 1 File 鼠标单击“File”后即打开下一级下拉子菜单。共计包括16项。现主要介绍常用的命令。 图4 File子菜单 “New”与“Open”命令分别为新建和打开一个文件(包括数据文件data、程序文件syntax、结果文件output、脚本文件script、其他文件other)。需要注意的是SPSS10.0可以直接打开EXCEL2000和数据库的文件(其他还有systat、文本、Lotus等格式的文件)。

spss操作步骤

Data weight cases Analyze->nonparametric test ->binomial

Ok Binomial Test 例7-1

Data weight cases

Ok Analyze->descriptive statistics->crosstabs statistics Continue->ok Chi-Square Tests

Value df Asymp. Sig. (2-sided) Exact Sig. (2-sided) Exact Sig. (1-sided) Pearson Chi-Square 12.857(b) 1 .000 Continuity Correction(a) 11.392 1 .001 Likelihood Ratio 13.588 1 .000 Fisher's Exact Test .001 .000 Linear-by-Linear Association 12.793 1 .000 N of Valid Cases 200 a Computed only for a 2x2 table b 0 cells (.0%) have expected count less than 5. The minimum expected count is 12.48. 7.3 Data weight cases

Analyze->descriptive statistics->crosstabs Continue->ok Chi-Square Tests Value df Asymp. Sig. (2-sided) Exact Sig. (2-sided) Exact Sig. (1-sided) Pearson Chi-Square 14.154(b) 1 .000 Continuity Correction(a) 11.836 1 .001 Likelihood Ratio 14.550 1 .000 Fisher's Exact Test .000 .000 Linear-by-Linear Association 13.910 1 .000 McNemar Test .013(c)

SPSS操作步骤

【关于SPSS正确操作步骤】------这东西太有用了~作者:张程龙 一、统计报告 l 在线分析处理报告Analyze→Reports→OLAP Cubes l 个案摘要报告Analyze→Reports→Summarize Cases l 行形式摘要报告Analyze→Reports→Report Summaries in Rows l 列形式摘要报告Analyze→Reports→Report Summaries in Columns 二、描述性统计分析 1.频数分析Analyze→Descriptive Statistic→Frequencies (1)频度分布表(2)变量描述统计量的计算(3)显示频度的图形 2.基本描述统计量Analyze→Descriptive Statistic→Descriptives l 集中趋势(Central Tendency)的统计量 l 离散趋势(Dispersion)的统计量 l 分布形态(Distribution)的统计量 3.探索性分析Analyze→Descriptive Statistic→Explore l 茎叶图 l 箱图 l 正态分布检验Q-Q概率图 l 方差齐性检验的散点-分层图 4.交叉列联表分析Analyze→Descriptive Statistic→Crosstabs 三、两总体均值比较 l 单样本T检验Analyze→Compare Means→One-Sample T Test l 独立样本T检验Analyze→Compare Means→Independent-Samples T Test l 配对样本T检验Analyze→Compare Means→Paired-Samples T Test 四、方差分析 l 单因素方差分析Analyze→Compare Means→One-way ANOVA l 多因素方差分析Analyze→General Linear Model→Univariate l 协方差分析Analyze→General Linear Model→Univariate u 假设检验的步骤

实验三-IBM-SPSS软件的基本操作

实验三-IBM-SPSS软件的基本操作

云南大学软件学院 实验报告 课程:大数据分析及应用任课教师:蔡莉实验指导教师(签名): 学号: 20131170142 姓名:郭昱专业:软件工程日期: 2015/11/01 成绩: 实验三 IBM SPSS软件的基本操作 一、实验目的 1.熟悉SPSS的菜单和窗口界面,熟悉SPSS 各种参数的设置; 2.掌握SPSS的数据管理功能。 二、实验内容及步骤 (一)数据的输入和保存 1. SPSS界面 当打开SPSS后,展现在我们面前的界面如下: 菜单栏 工具栏

注意:窗口顶部显示为“SPSS for Windows Data Editor”,表明现在所看到的是SPSS的数据管理窗口。该界面和EXCEL极为相似,很多操 作也与EXCEL类似。 2.定义变量 选择菜单Data==>Define Variable。系统弹出定义变量对话框如下: 对话框最上方为变量名,现在显示为“VAR00001”,这是系统的默认变量名;往下是变量情况描述,可以看到系统默认该变量为数值型,长度为8,有两位小数位,尚无缺失值,显示对齐方式为右对齐;第三部分为四个设置更改按钮,分别可以设定变量类型、标签、缺失值和列显示格式;第四部分实际上是用来定义变量属于数值变量、有序分类变量还是无序分类变量,现在系统默认新变量为数值变量;最下方则依次是确定、取消和帮助按钮。

假如有两组数据如下: GROUP 1: 0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11 GROUP 2: 0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87 先来建立分组变量GROUP。请将变量名改为GROUP,然后单击OK按钮。 现在SPSS的数据管理窗口如下所示: 第一列的名称已经改为了“group”,这就是我们所定义的新变量“group”。 现在我们来建立变量X。单击第一行第二列的单元格,然后选择菜单Data==>Define Variable,同样,将变量名改为X,然后确认。此时SPSS的数据管理窗口如下所示: 现在,第一、第二列的名称均为深色显示,表明这两列已经被定义为变量,其余各列的名称仍为灰色的“var”,表示尚未使用。同样地,各行的标号也为灰色,表明现在还未输入过数据,即该数据集内没有记录。 3.输入数据 我们先来输入变量X的值,请确认一行二列单元格为当前单元格,弃鼠标而用键盘,输入第一

SPSS编程操作入门知识讲解

S P S S编程操作入门

第四章 SPSS编程操作入门 4.1程序编辑窗口操作入门 一、进入程序编辑窗口界面 ①创建一个新程序 File——new——syntax ②打开一个旧程序 File——open——syntax 程序文件的扩展名为*.sps 注:syntax窗口的菜单和SPSS窗口的菜单功能基本一致,区别在于RUN菜单。 RUN ALL——运行全部程序 RUN SELECTION——运行所选择的部分程序 二、熟用Paste 按钮 在SPSS所有菜单对话框中均有Paste功能,在所有对话框选择完毕后,不选择 OK,而使用Paste,则程序编辑窗口会自动生成程序。 此功能使得SPSS编程操作变得简单易行,只需要对生成的程序适当加以修改即可。 示例:运用Paste创建一个程序文件。以xuelin.sav.为例,产生P50页的程序语句,并保存在桌面上备用。

该程序文件可以保存,当下次做相同的分析时,无需重新进行复杂的菜单选择,直接在原有程序文件上进行适当的修改,运行即可。 三、编程进行对话框无法完成的工作 示例1:见书 示例2:怎么产生连续自然数1~200 Input program. Loop #i=1 to 200. Compute x=#i. end case. End loop. End file. End input program. Execute. 4.2结构化语句简介 一、分支语句(条件语句) ①IF语句 SPSS程序格式: IF逻辑表达式目标表达式 逻辑表达式用于给出判断条件。

目标比达式表示如果满足逻辑表达式后该如何操作。 注:编程基本小知识: ①每句命令完成后,以点号结束,否则程序不被执行。 ②全部命令编辑完成后,以Execute.结束,否则程序不被执行. ③学会使用help——command syntax reference自学编程。 示例1:打开案例数据brain1.sav,要求将年龄小于20,性别为1(男)的病人归为第一组(group=1). GET FILE='F:\chenghongli\spss\数据集\brain1.sav'. if age<20 & sex=1( 逻辑表达式) group=1.(目标表达式)Execute. 示例2:打开案例数据brain1.sav,要求将年龄小于等于40岁的女性病人归为组2. GET FILE='F:\chenghongli\spss\数据集\brain1.sav'. if age le 40 group=2. execute. 练习1:将血小板大于等于100的列为组1 练习2:打开brain1.sav,创造一个新的字符型变量sex1,当sex 取值为1时,sex1取值为f, 当sex取值为2时,sex1取值为m. GET

SPSS基本功能及操作

统计分析模型 (1)信度分析文献[558] 操作步骤:分析—度量—可靠性分析(R)—移动变量到项目(I)框内—统计量—描述性(项+度量+如果。)—项之间(相关性)—继续—确定 信度系数界限值:0.60—0.65认为不可信;0.65—0.70认为是最小可接受值:0.70~0.80认为相当好;0.80—0.90就是非常好。因此,—份信度系数好的量表或问卷最好在0.80以上,0.70—0.80之间还算是可以接受的范围;分量表最好在0.70以上:0.60—0.70之间可以接受。若分量表的内部一致性系数在0.60以下或者总量表的信度系数在0.80以下,应该考虑重新修订量表或增删题目。 删除任何题项后的Cronbach’s α系数也无显著提高。可见核心知识性员工激励组合量表的内部一致性高,信度较好。信度分析说明该问卷的整体结构设计具有较高的可信度。由此可以认为,该问卷具有较好的内在信度,依此调查得到的数据是可信的,基于该问卷进行的数据统计分析结果也是比较可靠的。

从工作满意度与员工参与的相关分析结果中可以看出,工作满意度的6个维度均与员工参与有相关关系,且都为正向相关,显著性水平均达到0.05的显著性水平,可证明薪酬激励量表具有较高的收敛效度,可以进行后续研究,他们之间的相关性也可以说明本文的研究具有一定的意义。 对比上面相关系数表,项间相关性矩阵中相关系数判别标准:》=0.1(强相关)

(3)频数分析 P66 文献[558] 操作步骤:分析—描述统计—(123)频率(F)—移动变量到变量(V)框内—显示频率表格√—统计量—分布(偏度+峰度)—继续—确定 频率也称频数,就是一个变量在各个变量值上取值的个案数。SPSS中的频数分析过程可以方便地产生详细的频数分布表,即对数据按组进行归类整理,形成各变量的不同水平的频数分布表和常用的图形,以便对各变量的数据特征和观测量分布状况有一个概括的认识。描述总体分布形态的统计量主要有偏度和峰度两种。偏度(Skewness)是描述取值分布形态对称性的统计量,由Pearson在1895年提出。偏度由样本的3阶中心矩与样本方差的3/2次方的比值而得,偏度的绝对值越大,表示数据分布的偏斜程度越高。来自正态总体的样本偏度近似为0。偏度系数有两种测量方式,分别为皮尔逊偏度系数1和皮尔逊偏度系数2。偏度系数等于0的时候属于正态分布;偏度系数大于0的时候是右偏分布,表明较低的值占多数;偏度系数小于0的时候为左偏分布,表明较高的值占多数。峰度(Kutosis)是描述变量取值分布形态扁平程度的统计量,由Pearson 在1905年提出。峰度等于0的时候表示数据分布的扁平程度适中,即正态分布;峰度大于0的时候表示数据呈扁平分布;峰度小于0表明数据呈尖峰分布。

相关主题
文本预览
相关文档 最新文档