当前位置:文档之家› SPSS概览--数据分析实例详解

SPSS概览--数据分析实例详解

SPSS概览--数据分析实例详解
SPSS概览--数据分析实例详解

SPSS概览--数据分析实例详解

来源:咸富莲的日志

第一章SPSS概览--数据分析实例详解

1.1 数据的输入和保存

1.1.1 SPSS的界面

1.1.2 定义变量

1.1.3 输入数据

1.1.4 保存数据

1.2 数据的预分析

1.2.1 数据的简单描述

1.2.2 绘制直方图

1.3 按题目要求进行统计分析

1.4 保存和导出分析结果

1.4.1 保存文件

1.4.2 导出分析结果

欢迎加入SPSS使用者的行列,首先祝贺你选择了权威统计软件中界面最为友好,使用最为方便的SPSS来完成自己的工作。由于该软件极为易学易用(当然还至少要有不太高的英语水平),我们准备在课程安排上做一个新的尝试,即不急于介绍它的界面,而是先从一个数据分析实例入手:当你将这个例题做完,SPSS的基本使用方法也就已经被你掌握了。从下一章开始,我们再详细介绍SPSS各个模块的精确用法。

我们教学时是以SPSS 10.0版为蓝本讲述的--什么?你还在用7.0版!那好,由于10.0版在数据管理的界面操作上和以前版本有较大区别,本章我们将特别照顾一下老版本,在数据管理界面操作上将按9.0及以前版本的情况讲述,但具体的统计分析功能则按10.0版本讲述。没关系,基本操作是完全一样的。好,说了这么多废话,等急了吧,就让我们开始吧!

希望了解SPSS 10.0版具体情况的朋友请参见本网站的SPSS 10.0版抢鲜报道。

例1.1 某克山病区测得11例克山病患者与13名健康人的血磷值(mmol/L)如下, 问该地急性克山病患者与健康人的血磷值是否不同(卫统第三版例4.8)?

患者: 0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11

健康人: 0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87

让我们把要做的事情理理顺:首先要做的肯定是打开计算机(废话),然后进入瘟98或瘟2000(还是废话,以下省去废话2万字),在进入SPSS后,具体工作流程如下:

1将数据输入SPSS,并存盘以防断电。

2进行必要的预分析(分布图、均数标准差的描述等),以确定应采用的检验方法。

3按题目要求进行统计分析。

保存和导出分析结果。

下面就按这几步依次讲解。

§1.1 数据的输入和保存

1.1.1 SPSS的界面

当打开SPSS后,展现在我们面前的界面如下:

请将鼠标在上图中的各处停留,很快就会弹出相应部位的名称。

请注意窗口顶部显示为“SPSS for Windows Data Editor”,表明现在所看到的是SPSS的数据管理窗口。这是一个典型的Windows软件界面,有菜单栏、工具栏。特别的,工具栏下方的是数据栏,数据栏下方则是数据管理窗口的主界面。该界面和EXCEL极为相似,由若干行和列组成,每行对应了一条记录,每列则对应了一个变量。由于现在我们没有输入任何数据,所以行、列的标号都是灰色的。请注意第一行第一列的单元格边框为深色,表明该数据单元格为当前单元格。

对Windows操作界面不熟悉的朋友可参见SAS入门第一课中的相关内容。对数据表界面操作不熟悉的朋友可先学习一下EXCEL的操作(因为它的帮助是中文的)。

有的SPSS系统打开时会出现一个导航对话框,请单击右下方的Cancer按钮,即可进入上面的主界面。

1.1.2 定义变量

该资料是定量资料,设计为成组设计,因此我们需要建立两个变量,一个变量代表血磷值,习惯上取名为X,另一个变量代表观察对象是健康人还是克山病人,习惯上取名为GROUP。

对数据的统计分析格式不太熟悉的朋友请先学习统计软件第一课。

选择菜单Data==>Define Variable。系统弹出定义变量对话框如下:

该变量定义对话框在SPSS 10.0版中已被取消,这里的操作只适合9.0~7.0版的用户。

对话框最上方为变量名,现在显示为“VAR00001”,这是系统的默认变量名;往下是变量情况描述,可以看到系统默认该变量为数值型,长度为8,有两位小数位,尚无缺失值,显示对齐方式为右对齐;第三部分为四个设置更改按钮,分别可以设定变量类型、标签、缺失值和列显示格式;第四部分实际上是用来定义变量属于数值变量、有序分类变量还是无序分类变量,现在系统默认新变量为数值变量;最下方则依次是确定、取消和帮助按钮。

好,先来建立分组变量GROUP。请将变量名改为GROUP,然后单击OK按钮。

有没有搞错?!折腾了半天就改个名字!难道连变量格式、标签等都不改?是这样的,在SPSS中所有的数据均以最大位数保存(好象是双精度),也就是说,上面虽然默认只有两位小数,但那指的是计算精度,实际保存的数据位数是非常长的(可以输入Pi值试一下)。在绝大多数情况下,SPSS给出的默认数据类型和数据精度完全可以满足需要,只是不太好看而已。至于标签等比较花哨的选项,反正我也很少用。现在我们才刚刚入门,一切从简。以后我会详细介绍各种设置的用法。

在第一列灰色的“var”上双击,同样会弹出定义变量对话框。

现在SPSS的数据管理窗口如下所示:

第一列的名称已经改为了“group”,这就是我们所定义的新变量“group”。

现在我们来建立变量X。单击第一行第二列的单元格,然后选择菜单Data==>Define Variable,同样,将变量名改为X,然后确认。此时SPSS的数据管理窗口如下所示:

现在,第一、第二列的名称均为深色显示,表明这两列已经被定义为变量,其余各列的名称仍为灰色的“var”,表示尚未使用。同样地,各行的标号也为灰色,表明现在还未输入过数据,即该数据集内没有记录。

1.1.3 输入数据

我们先来输入变量X的值,请确认一行二列单元格为当前单元格,弃鼠标而用键盘,输入第一个数据0.84,此时界面显示如图A所示:

图A 图B

请注意:在回车之前,你输入的数据在数据栏内显示,而不是在单元格内显示,现在回车,界面如图B 所示:

首先,当前单元格下移,变成了二行二列单元格,而一行二列单元格的内容则被替换成了0.84;其次,第一行的标号变黑,表明该行已输入了数据;第三,一行一列单元格因为没有输入过数据,显示为“.”,这代表该数据为缺失值。用类似的输入方式,我们将患者的血磷值输入完毕,并将相应的变量GROUP 均取值为1,此时数据管理窗口如下所示:

从第12行开始输入健康人的数据,并将相应的GROUP变量取值为2。最终该数据集应该有24条记录。

1.1.4 保存数据

选择菜单File==>Save,由于该数据从来没有被保存过,所以弹出Save as对话框如下:

单击保存类型列表框,可以看到SPSS所支持的各种数据类型,有DBF、FoxPro、EXCEL、ACCESS等,这里我们仍然将其存为SPSS自己的数据格式(*.sav文件)。在文件名框内键入Li1_1并回车,可以看到数据管理窗口左上角由Untitled变为了现在的变量名Li1_1。

为什么这里的对话框会出现汉字?是这样的,需要从编程的角度来解释:SPSS在弹出该对话框时会调用Windows系统的公用函数,由于我们用的是中文Windows系统,所以调用出来的就是中文。

§1.2 数据的预分析

1.2.1 数据的简单描述

首先我们需要知道数据的基本情况,如均数、标准差等。选择Analyze==>Descriptive Statistics==>Descriptives菜单,系统弹出描述对话框如下:

如果按SPSS标准的叫法,这里应该是调用了Descriptives过程,为了避免太生硬,我们称为调用对话框,等大家熟悉SPSS了以后,在统计分析各章中可能两种称呼会混用。

该对话框可分为左右两大部分,左侧为所有可用的侯选变量列表,右侧为选入变量列表。我们只需要描述X,用鼠标选中X,单击中间的,变量X的标签就会移入右侧,注意这时OK按钮变黑,表明已经可以进行分析了,单击它,系统会弹出一个新的界面如下所示:

该窗口上方的名称为SPSS for Windows Viewer,即(结果)浏览窗口,整个的结构和资源管理器类似,左侧为导航栏,右侧为具体的输出结果。结果表格给出了样本数、最小值、最大值、均数和标准差这几个常用的统计量。从中可以看到,24个数据总的均数为1.2846,标准差为0.4687。

我们以上的做法对吗?当然有问题!光看总的描述是不够的,还应当看看分组的描述情况。这里要用到文件分割功能,请切换回数据管理窗口,选择Data==>Split File菜单,系统弹出文件分割对话框如下:

选择单选按钮Organize output by groups,将变量GROUP选入右侧的选入变量框,单击OK钮,此时界面不会有任何改变,但请再做一次数据描述,你就可以看到现在数据是分Group=1和Group=2两种情况在描述了!从描述可知两组的均数和标准差分别为1.5209、1.0846和0.4218、0.4221。

如果定义了文件分割,则它会在以后的所有统计分析中起作用,直到你重新定义文件分割方式为止。

1.2.2 绘制直方图

统计指标只能给出数据的大致情况,没有直方图那样直观,我们就来画个直方图瞧瞧!选择Graphs==>Histogram,系统会弹出绘制直方图对话框如下:

将变量X选入Variable选择框内,单击OK按钮。此时结果浏览窗口内会绘制出如下两个直方图:

两组的数据没有特别偏的分布,也没有十分突出的离群值,因此无须变换,可以直接采用参数分析方法来分析。综合设计类型,最终确定采用成组设计两样本均数比较的t检验来分析。

最后,我们还要取消变量分割,免得它影响以后的统计分析,再次调出变量分割对话框,选择单选按钮中的“Analyze all cases, do not creat group”,单击OK按钮就可以了。

§1.3 按题目要求进行统计分析

下面我们要用SPSS来做成组设计两样本均数比较的t检验,选择Analyze==>Compare Means==>Independent-Samples T test,系统弹出两样本t检验对话框如下:

将变量X选入test框内,变量group选入grouping框内,注意这时下面的Define Groups

按钮变黑,表示该按钮可用,单击它,系统弹出比较组定义对话框如右图所示:

该对话框用于定义是哪两组相比,在两个group框内分别输入1和2,表明是变量group取值为

1和2的两组相比。然后单击Continue按钮,再单击OK按钮,系统经过计算后会弹出结果浏

览窗口,首先给出的是两组的基本情况描述,如样本量、均数等(糟糕,刚才的半天工夫白费

了),然后是t检验的结果如下:

Independent Samples Test

Levene's

Test for

Equality

of

Variances

t-test for Equality of Means

F Sig. t df Sig.

(2-tail

ed)

Mean

Differ

ence

Std.

Error

Differe

nce

95% Confidence

Interval of the

Difference

Lower Upper

X Equal

variances

assumed

.032 .860

2.52

4

22 .019 .4363 .1729

7.777E-0

2

.7948

Equal

variances

not

assumed

2.52

4

21.3

53

.020 .4363 .1729

7.716E-0

2

.7954

可见该结果分为两大部分:第一部分为Levene's方差齐性检验,用于判断两总体方差是否齐,这里的戒严结果为F = 0.032,p = 0.860,可见在本例中方差是齐的;第二部分则分别给出两组所在总体方差齐和方差不齐时的t检验结果,由于前面的方差齐性检验结果为方差齐,第二部分就应选用方差齐时的t检验结果,即上面一行列出的t= 2.524,ν=22,p=0.019。从而最终的统计结论为按α=0.05水准,拒绝H0,认为克山病患者与健康人的血磷值不同,从样本均数来看,可认为克山病患者的血磷值较高。

§1.4 保存和导出分析结果

1.4.1 保存结果文件

前面我们已经做出了分析结果,但是,可是,可但是,但可是呢?再好的结果只要一断电就会全部消失(废话),对于这一问题人们早已想出了三种解决办法,他们分别是:

?需要结果的时候再运行一次分析程序。

?用笔将结果抄在纸上。

?直接保存结果文件。

显然,最方便快捷、最符合信息时代特征的就是第三种方法,在结果浏览窗口中(注意:一定要在结果浏览窗口中)选择菜单File==>Save,由于该结果也从来没有被保存过,所以弹出和前面保存数据时极为相似的一个Save as对话框,和前面相比,他唯一的区别就是文件的保存类型只有View Files(*.spo)一种。好,闲言少叙,在文件名框中键入“Li1_1”并回车,该结果文件就会按文件名Li1_1.spo 被存储。

不是文件保存类型还有一种“ALL Files(*.*)”吗?别费劲了,这种类型是SPSS公司放在那里哄人的,在该对话框里无论怎么折腾,都只能按SPO文件的格式来保存。

1.4.2 导出分析结果

文件倒是保存了,但问题还没有完全解决:我们从来写文章什么的都用的是文字处理软件,尤其是WORD,可WORD不能直接读取SPO格式的文件,怎么办呢?没关系,SPSS提供了将结果导出为纯

文本格式或网页格式的功能,在结果浏览窗口中选择菜单File==>Export,系统会弹出Exprot Output 对话框如下:

最上方的Export下拉式列表可以选择输出的内容,可以为含图表的输出文档、无图表的输出文档和只有统计图表三种;中部的Exprot File对话框则填入输出的目标文件名;左下方的Export What单选框可以选择输出结果的哪些部分,可以是所有结果、所有可见结果或只输出选择的结果,一般选输出所有可见结果;右下方的输出文件类型下拉式列表已被我打开,可见里面有网页格式和纯文本格式两种,在一切按所需选择完毕后按OK钮,则结果文件就会输出为你想要的类型。

好,到这里,就象我们刚开始所说的一样,你实际上已经完全掌握了SPSS的基本使用方法。我们以后将要做的工作就是“百尺竿头,更进一步”,将从下一章开始详细介绍SPSS各个模块的精确用法,使大家能尽快的从SPSS新手向SPSS高手过度。

第二章数据文件的管理(上)

2.1建立与保存数据文件-File菜单

2.1.1新建数据文件

2.1.2.1直接打开

2.1.2.2使用数据库查询打开

2.1.2.3使用文本导入向导读入文本文件

2.1.2打开其他格式的数据文件

2.1.3保存数据文件

2.1.4File菜单中的其他条目

2.2编辑数据文件

2.2.1定义新变量

2.2.1.1直接定义新变量

2.2.1.2从原有变量计算新变量-Transform菜单

2.2.2数据的录入

2.2.2.1直接录入

2.2.2.2数据录入技巧

2.3进一步整理数据文件-Data菜单

不言而喻,一切统计分析都是以数据为基础的,因此统计软件的数据管理能力非常重要。SPSS以其豪华的界面为依托,为用户提供的便捷的数据管理功能,下面我们就来具体看一下。

§2.1建立与保存数据文件

和大多数应用软件相同,SPSS中数据文件的管理功能基本上都集中在了File菜单上,该菜单的组织结构和WORD等也极为相似,因此这里我们只介绍比较有特色的几个菜单项。

SPSS 10.0有三个主要窗口界面:数据管理窗口、程序编辑窗口和结果浏览窗口;另有两个不常用的窗口:结果草稿浏览窗口和VBs脚本语言编辑窗口。他们共享许多菜单项,如File菜单就大部分相同,这里介绍的许多内容在五个窗口中都是通用的。

2.1.1新建数据文件

如果你正从头开始进行一个新的课题,刚刚把数据收集上来,要做统计分析,自然需要新建一个数据库,然后将所有的数据从纸上请到计算机里。在SPSS中,新建一个数据库容易的不得了--已经到了什么都不用做的地步!是这样,当你进入SPSS系统时,系统就已经生成了一个空数据文件,即你看到的空白的数据管理界面。你只要按自己的需要定义变量,输入数据然后存盘就是了(这些操作马上会讲到)。

2.1.2 打开其他格式的数据文件

凡是做过数据输入工作的人都知道:这活又费眼睛又累人,出错太多了还要挨批评,非常影响个人的光辉形象。算了,还是在有限的经费里划几百美元出来雇个打字小姐吧(怎么用美元?因为我请了个老外!)。可是非常不幸,该同志只会用EXCEL 2000(又是一个被微软成功洗脑的家伙),数据现已输好,怎么转成SPSS数据文件呢?没关系,SPSS提供了以下几种方法来打开其他格式的数据文件。

2.1.2.1 直接打开

SPSS现在可以直接读入许多格式的数据文件,其中就包括EXCEL各个版本的数据文件。选择菜单File==>Open==>Data或直接单击快捷工具栏上的“”按钮,系统就会弹出Open File对话框,单击“文件类型”列表框,在里面能看到直接打开的数据文件格式,分别是:

SPSS(*.sav) SPSS数据文件(6.0~10.0版)

SPSS/PC+(*.sys) SPSS 4.0版数据文件

Systat(*.syd) *.syd格式的Systat数据文件

Systat(*.sys) *.sys格式的Systat数据文件

SPSS portable(*.por) SPSS便携格式的数据文件

EXCEL(*.xls) EXCEL数据文件(从5.0版~2000版)

Lotus(*.w*) Lotus数据文件

SYLK(*.slk) SYLK数据文件

dBase(*.dbf) dBase系列数据文件,(从dBase II~IV)

Text(*.txt) 纯文本格式的数据文件

data(*.dat) 纯文本格式的数据文件

选择所需的文件类型,然后选中需要打开的文件,SPSS就会按你的要求打开你要使用的数据文件,并

自动转换为数据SPSS格式。

也许有视力好的朋友会注意到右下方除了“打开”和“取消”两个按钮外,中间还有一个“Paste”按钮,该按钮在SPSS的大多数对话框中都存在,是用于自动生成SPSS程序的,我们以后会专门讲解该问题。

2.1.2.2 使用数据库查询打开

SPSS可以直接打开许多类型的数据文件,但这并不是说它可以打开所有类型的数据文件(废话),比如FoxPro 3.0以上版本的*.dbf文件就不能直接打开(有兴趣的话你可以试试)。为此,SPSS还提供了另一个适用范围更广、但使用上较为专业的数据接口--数据库查询。

实际上,SPSS在这里使用的是一种叫ODBC(Open Database Capture)的数据接口,该接口被大多数数据库软件和办公软件(如MS Office)支持,通过它,应用程序可以直接访问以结构化查询语言(SQL)做为数据访问标准的数据库管理系统。

由于SPSS 10.0可以直接打开EXCEL所有系列的数据文件,因此数据库查询接口的用处不是很大。但是,在9.0及以前的版本中,该查询仍是直接打开EXCEL 95、97及2000数据文件的唯一办法。

ODBC数据引擎是独立与各种应用软件,直接安装到Windows系统中的,因此你所用的系统中ODBC 所支持的数据类型取决于所安装的ODBC引擎的情况。还好,大多数支持该接口的软件都会在安装光盘上附送该引擎的安装文件(如MS Office)。不过有一点要提醒大家,许多机器的OBDC数据引擎安装有问题(尤其是D版),在SPSS中使用它往往要死机。

选择菜单File==>Open Database==>New Query,系统会弹出数据库向导的第一个窗口,其中会列出你使用的机器上已安装的所有数据库驱动程序,选中所需的数据源,然后单击下一步,向导会一步一步的提示你如何做,直至将数据读入SPSS。

我原来准备举一个具体例子,但后来发现不同版本的ODBC引擎所弹出的对话框并不相同!不仅如此,不同的数据驱动程序其对话框也各不相同!比如说,有的需要你的LoginID和Password,有的又不需要,因此我这里就不再讲了。由于它使用上太专业(尤其在10.0版中,9.0版还好些),如果确实要用,请找一个对数据库接口比较熟的人来帮你。

2.1.2.3 使用文本导入向导读入文本文件

选择菜单File==>Read Text Data,系统就会弹出Open File对话框,对!和前面的情况完全一样,只是文件类型自动跳到了Text (*.txt)。实际上,该功能在SPSS中已被整合到了Open File对话框中之所以在菜单上保留该条目有两个原因:1. 读入纯文本的情况非常普遍,放在这里更加醒目;2. 为了和SPSS老版本的使用上保持兼容。

例2.1 现有一数据文件以纯文本的形式存为“c:\Li2_1.txt”,且第一行为变量名,请将其读入SPSS。解:在Open File对话框选中相应的文件名并单击“确定”,系统会自动启动文本导入向导对话框如下:

在SPSS 10.0中,该向导并没有重新设计,因此仍然有问题被截断无法显示完的情况出现。

可以看到该向导共分6步,这是第一步。中部为一对单选按钮,问题为“你的文本文件和预定义格式相一致吗?”,下方为按预定义格式读入的数据文件的预览。显然,SPSS的预定义格式并没有正确识别该文件。因此选择“No”并单击“下一步”,系统弹出向导的下一个对话框如下:

最上方的问题是“你的变量是如何排列的?”,下面的选项分别为Delimite(用某种字符区分)和Fixed Width(固定宽度),一般都是Delimite,第二个问题是“变量名包括在文件最前面了吗?”,我们当然选“Yes”,单击“下一步”,系统弹出第三个对话框:

最上方的句子意为“第一条记录从第几行开始?”,右侧可以输入行数。由于我们所用的数据第一行为变量名,因此这里输入2。下面的问题是“你的记录是怎样存储在文件中的?”。可以是“每一行代表一条记录”,或者“每**个变量代表一条记录”,数据一般都是第一种情况。下一个问题是“你想导入多少条记录?”,可以是“所有记录”、“前**条”或“随机导入**%的记录”。一般也选前者。单击“下一步”,第四个对话框如下:

我这里写的非常详细,但实际使用中你可以不管大多数问题,因为SPSS一般都能自动正确设置。

最上方的问题为“变量间用的是哪种分隔符?”,可选的有Tab键、空格、逗号、分号或自行定义的其他符号。本数据采用的是空格,可见系统已经自动识别并选择了空格,而下方的数据预览窗口显示出了正确的数据读入情况。单击“下一步”,第五个对话框如下:

上方的提示为“定义在数据预览窗口中所选择的变量。”。顾名思义,在这个对话框中你可以在数据预览窗口中选择某一列变量,然后更改其变量名和类型。当然,在这里我们不用这样做,直接单击“下一步”,系统弹出文本导入向导的最后一个对话框如下:

最上面的问题为“你愿意保存这次的文件(读入)格式设置以备下次使用吗?”,第二个问题为“你是否愿意将以上操作粘贴为SPSS语句?”,一般这两个问题我们都可以不管。单击“完成”,系统最终成功的读入了Li2_1.txt。

2.1.3保存数据文件

在对数据做了修改后,保存数据文件是必不可少的工作之一。选择菜单File==>Save,如果数据文件曾经存储过,则系统会自动按原文件名保存数据;否则,就会弹出和选择Save as 菜单时相同的Save as对话框。里面可以保存的数据类型和可以打开的几乎一样多,选择合适的类型,确定就是了。

Save命令的快捷键为^S,如果你曾经领教过Windows死机的巨大潜力,那么你一定会同意习惯性的随手按^S至少不能算是一个坏习惯。

如果你准备将数据存为SPSS以外的其他类型,要注意有些设置可能会丢失,如标签和缺失值等。尤其是缺失值,如果想存的数据格式不支持缺失值,那你的数据可能会变的面目全非。

2.1.4File菜单中的其他条目

【Disp Data Info】

该菜单项用于显示数据的基本信息,选择它后会弹出非常类似于打开文件的一个对话框用于选择数据文件,选择好后按OK,系统就会在结果窗口中列出所选数据的基本情况,如建立时间、标签设置、记录数、变量设置等。

【Apply Data Dictionary】

即使用数据字典,该功能使你可以直接在新数据集中套用以前定义好的变量设置(格式、标签等,但不包括数据类型),举个例子吧:请打开Li1_1.sav文件,将变量x的长度从8改为4,标签删掉,然后选择菜单File==>Apply Data Dictionary,在文件对话框中选择Li1_1.sav并按OK(即将Li1_1.sav的变量设置按相同变量名一一套用在现在的数据集上),怎么样?一切都变回去了吧。

【Cache Data】

建立数据缓冲区。以前SPSS每执行一条命令都会重新读取所需的数据,如果是从远程用SQL调用数据库,这会非常的费时。现在使用Cache Data,可以将数据全部读入暂存盘,建立活动数据的缓冲区。大大加快处理速度。不过我特意试了一下,如果是处理本机数据的话,该命令对速度的提升不是非常明显:(。

【Print和Print Preview】

这两个菜单项用于将数据管理窗口中的数据以表格的形式打印出来,其中Print Preview是新增加的,使用上和WPS2000的打印预览非常相似(其实用的是同样的程序),不过和SPSS结果的打印程序一样,用SPSS直接打印数据非常的浪费纸张,用不用你自己决定吧。

【Stop Processor】

用于停止执行当前的SPSS命令。由于SPSS处理速度非常的慢,如果你正在对一个大型的数据执行统计命令,等了半天都没有结束,此时你的另一半约你逛街的时间又要到了,可是你的结果还没有存,执行命令时又存不了,怎么办呢?试试这个命令吧。

并非所有的命令都可以喊停的,许多数据库操作命令(计算变量,合并等)好象就停不了。

§2.2编辑数据文件

在SPSS中,数据文件的编辑、整理等功能被集中在了Data和Transform两个菜单项中,这两个菜单的内容如下所示:

Data菜单项 Transform菜单项

下面我们将根据其功能来分别讲述。

2.2.1定义新变量

2.2.1.1直接定义新变量

大多数情况下我们需要从头定义变量,在SPSS 10.0中,定义变量的操作界面和FoxPro等数据库非常相似,只需单击左下方的Variable View标签就可以切换到变量定义界面开始定义新变量。如Li1_1.sav 的变量定义如下所示:

以变量x为例:变量名为x,类型为Numeric,宽度为4,小数位数2位(因小数点还要占一位,故整数位只有一位),变量标签位为“血磷值”。右侧在图中未能看到的依次为Values,用于定义具体变量值的标签;Missing,用于定义变量缺失值;Colomns,定义显示列宽;Align,定义显示对齐方式;Measure,定义变量类型是连续、有序分类还是无序分类。

使用该窗口,我们可以一次定义许多新变量,不会象老版本那样一个一个的定义了。

由于SPSS是英文软件,变量名采用中文会有潜在的冲突(100%的兼容性是不存在的,典型的例子就是微软公司的产品)。

对于喜欢搞点花样的用户,这里有必要介绍一下SPSS中标签和缺失值的定义方法:

标签和老版本不同,现在变量标签和变量值标签被分开设置,变量标签就在Label框中直接输入,变量值标签则在它右侧的Value框定义。以group为例,单击Value框右半部的省略号,会弹出变量值标签对话框如下:

上部的两个文本框分别为变量值输入框和变量值标签输入框,分别在其中输入“1”和“克山病患者”,此时下方的Add钮变黑,单击它,该变量值标签就会被加入下方的标签框内。与此类似定义变量值“2”为“健康人”,最后按OK,变量值标签就设置完成。此时你做任何分析,在结果中都有相应的标签出现。如果你现在就想看效果,切换回Data View界面,然后选择菜单View==>Value Labels,怎么样,看到了吗?

缺失值单击missing框右侧的省略号,会弹出缺失值对话框如下:

界面上有一列三个单选钮,默认值为最上方的“无缺失值”;第二项为“不连续缺失值保 疃嗫梢远ㄒ?个值;最后一项为“缺失值范围加可选的一个缺失值”,文如其意,不用我多解释了吧。

第二章数据文件的管理(下)

2.1建立与保存数据文件-File菜单

2.1.1新建数据文件

2.1.2.1直接打开

2.1.2.2使用数据库查询打开

2.1.2.3使用文本导入向导读入文本文件

2.1.2打开其他格式的数据文件

2.1.3保存数据文件

2.1.4File菜单中的其他条目

2.2编辑数据文件

2.2.1定义新变量

2.2.1.1直接定义新变量

2.2.1.2从原有变量计算新变量-Transform菜单

2.2.2数据的录入

2.2.2.1直接录入

2.2.2.2数据录入技巧

2.3进一步整理数据文件-Data菜单

2.3.1用于数据管理的菜单项

2.3.2正交设计菜单项

2.2.1.2从原有变量计算新变量

从头定义变量的情况多数在建立数据集时出现。但是,当数据集已经建立,需要整理、转换变量时,碰到的更多情况是需要根据某种条件从原有变量计算新变量。下面我们将按菜单条目的顺序依次讲解他们的功能。但是,首先我们需要了解一下所用的对话框界面的情况。

【SPSS对话框元素介绍】

下面是我们在第一章曾经见过的两样本t检验对话框:

这是一个非常典型的SPSS对话框。它包含了许多具有SPSS特色的对话框元素:

?对话框左侧为候选变量列表框,里面列出了可被该对话框使用的变量;

?右上方为Test Variables框,可将变量选入其中;注意在两个框的中间用“”相连,这是变量移动按钮,其方向表明是将变量从那个框移动到哪个框,上图中我们选中了变量group,两个移动按钮均变黑并向右指,表明变量group可以移动到他们右侧的两个框里去,改变当前框(在其他两个框里单击),移动按钮就会转向、变灰等以表明不同的意思(墙头草一个,可别小看这个功能,我想用VB实现这个功能,也是费了些工夫才把它搞定了);

?右侧为一排五个按钮,分别是确定、粘贴、重置、取消和帮助。这五个兄弟也是几乎永远一起出现的,另外四个大家都比较熟悉了,重置(Reset)按钮用于取消对话框内已做的选择,恢复到默认的状态;

?最下方有个Options按钮,用于设置专门用于该对话框的选项;

?OK、Paste两个按钮为灰色,表明所需条件尚未满足,该按钮暂不可用。同理,Grouping Variable 框下方的Define Groups按钮为灰色显示,也表明暂不可用。

【Compute Variable对话框】

例3.2 在li1_1.sav中建立新变量temp,令其值当血磷值大于1时为2,否则为1。

解:这里需要用到Compute Variable对话框,外加一点技巧。首先给变量temp均赋值为1,然后将血磷值大于1的记录其temp变量值改为2即可。选择菜单Transform==>Compute,弹出Compute Variable 对话框如下:

左上角为需要计算的变量名,在其中键入“temp”,此时“Type&Lable”按钮就会变黑,喜欢精确的朋友可以在这里对temp进行详细的定义,但如果你和我一样非常懒,就可以对它视而不见(不要生气,聪明人大多都非常懒:));左下方为候选变量列表,现在还用不着;中部为类似计算器的软键盘,可以用鼠标按键输入数字和符号,这里我们直接输入“1”,输入的内容回立刻在右上方的数值表达式窗口中出现;软键盘右侧为函数窗口,可以在这里找到并使用所需的SPSS函数;这次也用不到。好,现在“OK”按钮已经变黑,单击他,系统就会自动生成一个新变量temp,并且取值均为1。

软键盘上几个奇奇怪怪的符号的含义如下:

~= & | ** ~

不等号,等价于<> 逻辑符号AND 逻辑符号OR 乘方,相当于函数EXP() 逻辑符号NOT

在函数窗口中选中某个函数并单击右键,系统就会弹出该函数的用法说明。

函数主要是和变量名组合起来使用的,比如说ABS(x)就是取变量x的绝对值。

好,现在开始进行第二步,再次选择菜单Transform==>Compute,系统也再次弹出这个对话框--等等!注意到了吗?该对话框自动记住了你上次输入的内容,几乎所有SPSS的对话框都有这个特性,这会大大方便我们的使用。好,将数值表达式窗口中的1改为2,然后单击中下部的“If”按钮,系统弹出记录选择对话框如下:

不需要太多解释,大部分内容都是前面见过的。由于我们这里不是对所有记录做变换,因此选中第二个单选钮“Include if case statisfies confition:”,此时下方的所有窗口变亮,表明现在可用;而“Continue”按钮变灰,表明当前还没有提供所需的信息,好,我们就来提供,在左侧选中血磷值(x),然后单击“”,x就被引入了右侧的变量框,任你用键盘或者用鼠标,总之将下面这个算式补充完:x>1。现在可见“Continue”按钮再度变黑。在它又变灰之前赶快单击它(开个玩笑),系统回到Compute Variable对话框,请注意If按钮右侧的变化:x>2。如果你做的结果不一样,请重来一遍。

现在单击“OK”按钮,由于我们要替换变量值,系统会弹出一个确认对话框,确认替换,马上你就会看到,我们已经把这道题做完了。

【Count对话框】

Count对话框用于计算某个值或某些值在某个变量的取值中是否出现(好象有点拗口),比如我们想看看有哪些记录的血磷值在2~3之间,选择菜单Transform==>Count,系统弹出Count对话框如下:

Target Variable框中用于指定记录变量值是否出现的变量名,在这里输入temp2;选中血磷值(x),将其选入Variables窗口,此时“Define Values”按钮变黑,单击它,系统弹出变量值定义窗口如下:

左半部为变量值定义窗口,可以定义某个值、系统缺失值、系统或用户定义缺失值、变量值范围、小于某值或大于某值。我们这里是第四种情况:选择Range,在through两侧分别键入2、3,然后单击已变黑的“Add”按钮,“2 thru 3”就会被加入“Values to Count”框内。然后单击“Continue”,再单击Count 对话框的“OK”,可以看到系统自动生成变量temp2,其中10、11号记录因血磷值介于2和3之间,temp2取值为1,其余的记录temp2取值均为0。

SOS,SOS,请大家千万注意,Count对话框有一个潜在的bugs,当你需要计算同时满足两个变量取值条件的记录数有多少时,直接用该对话框会得出完全错误的结果。这里有一点技巧,需要对对话框生成的指令加以修改,至于怎么修改嘛,我们将在Syntax(语法)窗口使用详解一章中讲述:)。

【Recode对话框】

Recode对话框用于从原变量值按照某种一一对应的关系生成新变量值,可以将新值赋给原变量,也可以生成一个新变量。

例2.3 在Li1_1.sav中生成新变量temp3,当血磷值小于1时取值为0,1~2时取值为10,大于2时取值为20。

解:选择菜单Transform==>Record==>Into Different Variables,Recode对话框如下:

将血磷值(x)选入Input Variable->Output Variable框,此时Output Variable框变黑,在其中键入新变量名temp3并单击Change,可见原来的x->?变成了x->temp3。现在单击“Old and New Values”,系统弹出变量值定义对话框如下:

许多东西和前面类似,不再重复。按照题目的要求,选择Range:Lowest through,在右侧框中键入1,然后在右上方的Value右侧框中键入对应的新变量值0,此时下方Add键变黑,单击它,Old->New框中就会加入Lowest thru 1->0,按照类似的方法依次加入另两条转换规则,最终Old->New框中共有Lowest thru 1->0、1 thru 2->10、Else->20三条,现在单击Continue,再单击OK,系统就会按要求生成新变量temp3。

哎呀不得了,图片太多了,虽然这样非常直观,但下载速度太慢了。等大家对基本界面操作熟悉了后,我们将对比较简单的对话框试着对操作用文字的方式描述,比如上面的操作我们将用文字表达为:

5Output Variable框:选入x

6Output Variable Name框:键入temp3:单击Change钮

7选中x->temp3:单击Old and New Values钮:

8Range:Lowest through单选钮:键入1:New Value Value单选钮:键入0:单击Add钮9Range: through单选钮:两侧分别键入1、2:New Value Value单选钮:键入10:单击Add 钮

10Range: All other values单选钮:New Value Value单选钮:键入20:单击Add钮

11单击Continue

12单击OK

怎么样,还能理解吧。

【Categorize Variables对话框】

Categorize Variables对话框用于将连续性变量自动按要求分成等间距的几类。其界面非常简单,许多东西都是我们所熟悉的,唯一特别的是右下方的number of categories框,用于输入变量的等级数,默认为4,比如我们希望将血磷值按大小分成5个等级,先将血磷值选入Create Categories框,然后将下面的4改为5,单击OK,就会看到系统产生了一个新变量nx(即number of x之意),其取值就对应了血磷值相应的5个等级(1~5)。重复一下,具体操作步骤为:

13Create Categories框:选入x

14Number of categories框:5

15OK

【Rank Cases对话框】

例2.4 请分组计算血磷值的秩和。

解:选择菜单Transform==>Rank Cases,弹出Rank Cases对话框如下:

将血磷值选入Variable框,分组变量选入By框,单击OK即可。系统会建立一个新变量rx(即原变量名前加r表示Rank之意),其取值为x分组的秩次。

解释一下Rank Cases对话框的其他几个零件:

?左下角的Assign Rank 1 to框架用于选择将秩次1赋给最小值还是最大值;

?中下部的Display summary tables复选框用于确定是否在结果窗口内输出结果报表;

?Rank Types钮用于定义秩次类型,有Rank(秩分数)、Savage评分(新变量值按指数分布)、Fractional rank(新变量值是秩分数除以非缺失值观测量的权重之和)、Fractional rank %(新变量值是秩分数除以非缺失值观测量数乘100)、Sum of case weights(新变量值是各观测量的权重之和)、Ntiles(新变量值是按所选变量的百分位数分组的组序号),默认值为Rank。单击More按钮,还会有更多的设置,这里就不再讲了。

?Ties钮用于定义对相同值观测量的处理方式,可以是取平均秩次、最小值、最大值或当作一个记录处理,默认值为取平均秩次。

【Automatic Record对话框】

该对话框用于按原变量值的大小生成新变量,变量值就是原值的大小次序,功能和Rank Cases对话框重复(等价于相同值观测量当作一个记录处理的情况)。

【Create Time Series对话框】

用于自动生成时间序列变量,由于太专业,这里不做过多解释。

【Replace Missing Value对话框】

用于填充缺失值,结果存入一个新变量。填充方法有:序列的均数、相邻若干点的均数、相邻若干点的中位数、线性内插、线性外延,默认值为序列的均数。

2.2.2 数据的录入

2.2.2.1 直接录入

我想直接录入的问题就不用多讲了吧,直接敲就是了!

2.2.2.2 数据录入技巧

和其他常用统计软件相比,SPSS数据界面最大的优势就是支持鼠标的拖放操作,以及拷贝粘贴等命令,下面的数据录入技巧就是对这些功能的利用。

【连续多个相同值的输入】

如前面group变量有连续多个1,如果直接输入,可以在第一格内输入1并回车,然后回到刚才的单元格并单击右键,选择copy,最后用拖放方式选中所有应输入1的单元格,单击右键并选择paste,所有选中的单元格就会都被刚才拷贝的1填充。

【将EXCEL数据直接引入SPSS】

Excel已经打开原数据,并且数据量较少的时候,可以直接用拷贝粘贴的方法将数据引入SPSS:先在EXCEL中选中所有的数据(不包括变量名),然后选择拷贝命令;然后切换到SPSS,最好使行1列1单元格成为当前单元格,然后执行粘贴命令,数据就会全部转入SPSS,再定义相应的变量即可。

2.3 进一步整理数据文件--Data菜单

在许多情况下,我们需要先对数据进行一些整理(如分组、合并、加权等)才能将其用于最终的统计分析。这些功能基本上都集中在Data菜单项中,下面我们就对这些对话框做逐一介绍。

2.3.1 用于数据管理的菜单项

【Sort Cases对话框】

例2.5 对数据集li1_1.sav按group升序,x降序的次序排列。

解:选择菜单Data==>Sort Cases,系统弹出Sort Cases对话框,该对话框并不复杂,其中比较特殊的是下方的Sort Order单选钮,有升序和降序两种选择。请注意,该单选钮是和上方的Sort By框一起使用的,具体方法如下:

16确认升序单选钮被选择,将Group选入Sort By框;

17选择降序单选钮,将x选入Sort By框。

请注意:group和x后面分别跟着Ascending和Descending,表明前者是按升序、后者按降序排列;由于Group在前,因此排序时以Group优先。

【Transepose对话框】

该对话框用于对数据进行行列转置,可以在原数据文件中指定一个变量记录转置后的变量名。原变量名则自动保存在系统产生的名为case_lbl的字符变量中。

该对话框也非常简单,左侧为候选变量框;右上方为Variable框,用于选入需要转置的变量,一般应选入除名称变量外的所有其他变量,如果有变量未选入,则转置时会被自动丢弃;右下方为Name Variable框,用于指定原数据文件中记录转置后变量名的字符变量,但不是必需的,此时系统会将新变量自动按var001、var002...的顺序命名。

【Merge Files对话框】

用于合并数据文件,实际上包括了两个对话框,分别对应了两种合并方式:

1. 从外部数据文件中增加记录到当前数据文件中,称为纵向合并,用Add Cases对话框完成,相互合并的数据文件中应该有相同的变量。选择菜单Data==>Merge Files==>Add Cases,系统首先弹出打开数据文件对话框,选中需要添加的数据文件并按OK,系统才弹出Add Cases对话框,左侧显示的是新、老数据文件中不匹配的变量名,右侧显示的是已经匹配的变量名。可以用Rename按钮对不匹配变量改名(先选中)或用鼠标强行匹配(即先按Ctrl键选中匹配的两个变量再单击Pair钮)。右下方的Indicate case source as variable复选框用于定义一个新变量以区分哪些记录是后来添加的。选择停当后单击OK,该操作就完成了。

实际上右侧显示的是将要包括在合并后数据集中的变量,如果有哪个你不需要,把它弄到左侧框中即可。

2. 从外部数据文件增加变量到当前数据文件,称为横向合并,用Add Variable对话框完成,相互合并的数据文件中应包含同样的记录。选择菜单Data==>Merge Files==>Add Variable对话框,系统同样先弹出打开数据文件对话框,单击OK后弹出和前面相似的Add Variable对话框。按需选择即可。

【Aggregate对话框】

用于对数据进行分类汇总,所谓分类汇总就是按指定的分类变量对观测值进行分组,对每组记录的各变量值求指定的描述统计量,结果可以存入新数据文件,也可以替换当前数据文件。

上图中各个零件的含义如下:

?· Break Variables框:用于选择分组变量;

?· Aggregate Variables框:用于选择被汇总的变量;

?· Name&Label钮:用于定义新产生的汇总变量的名称和标签;

?·Function钮:用于定义汇总函数,共有三组函数,以最常用的第一组为例,可选的函数有均数、同组的第一个观测值、最后一个观测值、同组记录数、标准差、最小值、和、最大值共8个;

?· Save Number of cases in break group as variable复选框:用于定义一个新变量以存储同组的记录数;

?· Create new data file单选钮:定义一个新文件以存储汇总的结果,右侧的File钮用于具体文件名的定义,默认文件名为AGGR.sav;

?· Replace working data file单选钮:用汇总的结果替换原来的数据。

例2.6 计算Li1_1.sav中两组的血磷值标准差。

解:该题完全可以用更简单的方法完成,这里只是演示一下汇总对话框的用法。

18Break Variables框:Group

19Aggregate Variables框:x

20Function钮:(Standard deviation单选钮:Continue钮)

21Replace working data file单选钮:选中

22OK

【Split File对话框】

用于将数据文件分组进行处理,该对话框我们在第一章时已经使用过了,这里再介绍一下各个对话框元素的用途:

?· Analyze all cases单选框:和下面的两个单选框为一组,选中本框不拆分文件;

?· Compare groups单选框:按所选变量拆分文件,各组分析结果紧挨在一起便于相互比较;

?· Organize output by groups单选框:按所选变量拆分文件,各组分析结果单独放置;

?·Groups based on框:用于选择拆分数据文件的变量;

?· Sort the file by grouping variables单选框:将数据按所用的拆分变量排序;

?· File is already sorted单选框:数据保持原状,不按所用的拆分变量排序。

【Select Cases对话框】

很多时候我们不需要分析全部的数据,而是按某种要求分析其中的一部分(比如只分析男性的身高、只对前200个数据进行分析以了解大概情况),这时使用Select Cases对话框可以大大简化工作。该对话框界面如下所示:

其中主要的对话框元素为:

?· All cases单选钮:和下面的4个单选钮为一组,选中它则分析所有的记录;

?· If condition is satisfied单选钮:只分析满足条件的记录;

?·If按钮:和If单选钮一起使用,单击后弹出If对话框;

?· Random sample of cases单选钮:从原数据中按某种条件抽样;

?·Sample按钮:和Random单选钮一起使用,可以设定按百分比抽取记录,或者精确设定从前若干个记录中抽取多少个记录;

?· Based on time or case range单选钮:基于记录序号来选择记录;

?·Range按钮:和Based单选钮一起使用,用于输入记录序号范围;

?·Use filter variable单选钮:使用筛选指示变量来选择记录,必需在下面选入一个筛选指示变量,该变量取值为非0的记录将被选中,进入以后的分析;

?· Filtered单选钮:和下面的Deleted单选钮为一组,表示未被选中的记录只是被隔离,这些记录的记录号会被加上斜杠以示区别;

?· Deleted单选钮:未被选中的记录将被删除,一般不要使用。

当对数据集做出筛选后,所做的筛选将在以后的分析中一直有效,直到再次改变选择条件为止。同时在多数情况下,系统会自动产生一个名为filter_$的筛选指示变量,被选中的记录该变量取值为1,反之则为0。

【Weight Cases对话框】

在默认情况下,每一行就是一条记录,这在多数情况下没有什么问题,但有时却非常麻烦,想想看如果你需要计算一个四格表卡方,有100例,如果每一行就是一条记录,你就需要输入100条记录!如果希望在计算过程中利用不同的变量对数据进行加权处理,就需要用到Weight Cases对话框。该对话框的使用极为简单,界面上有两个单选钮,分别是不权重记录和用某变量权重记录,如果选择后者,则需要选中一个权重变量。

【Data菜单中的其余对话框】

?· Define dates对话框:可以自动生成时间变量。

?· Insert Variable命令:在当前列插入新变量。

?· Insert cases命令:在当前行插入新记录。

?· Goto cases对话框:到达指定记录号的记录,该命令在记录数极多时(1000条以上)非常有用。

2.3.2 正交设计菜单项

正交设计不包含在SPSS/BASE模块中,因此由于解密范围的问题,有的D版中不含该菜单项,不过我用的10.0版里是有的:)。

以前我以为SPSS不能作正交设计,感谢网友edof@sh的提醒,经研究,在SPSS中可以直接进行正交设计,Orthogonal Design子菜单项就是专门用于完成该任务的,具体做法用下面的例子说明如下:

例2.7 做A、B两个因素的正交设计,A因素有三个水平,B因素有两个水平。

解:选择Data-->Orthogonal Design-->generate,弹出的就是正交设计窗口,操作如下:

23Factor name框:输入A;

24单击ADD钮;

25确定变量A被选中,单击Define value钮;

26Value列:头三行分别输入1、2和3,代表变量A的三个水平;

27单击continue钮;

28Factor name框:输入B;

29单击ADD钮;

30确定变量B被选中,单击Define value钮;

31Value列:头两行分别输入1、2,代表变量B的两个水平;

32单击continue钮;

33单击OK

在第10步定义完后,对话框应如下图所示:

在其他没有用到的选择项中,各种LABELS当然适用于定义相应的各种标签的;Data Files单选框组用来定义产生的数据文件是存为制定的文件名,还是直接替换当前工作文件;而Define Value对话框中的Auto fit框可以自动填充从1到你输入的那个数值这么多个水平的定义,特别适合我这种懒人。

这里我们直接替换当前工作文件,在这个自动产生的正交设计数据集中,前两个变量就是要分析的A 和B,各个水平已经按正交设计的要求排列好了。后面的status_和card_变量是系统产生的LOG变量,可以不管它。现在你再建立一个结果变量,输入实验结果,就可以进行正交设计的分析了。

第三章:程序编辑窗口用法详解

3.0.1程序编辑窗口界面

3.0.2邂逅Paste按钮

3.0.3用程序编辑窗口加快我们的工作

3.0.4用程序编辑窗口完成对话框无法完成的工作

3.0.5再罗嗦几句

在某年某月的某一天,你和你的另一半正在街上为地球表面的平整而贡献自己的绵薄之力。突然(也许是必然),你觉得有些饿了。这是一个问题,当然,不用说大家也知道解决问题的方法就是--吃。不过就是吃也有讲究,可以随便找个面馆简单的填饱肚子;要求高的话还可以去几星级的地方享受一下;当然还有的人觉得自己回去做口味也合适,花费也不多;更有些超级美食家,星级水准也不满意,需要亲自给一级厨师露一手,指点他们一下,才会吃的满意。

好,使用SPSS进行统计分析的方式就象上面填饱肚子的方法一样有几种选择,如果你烹饪工夫还欠火候,或者习惯了享受星级服务,那么直接使用SPSS为你提供的对话框进行操作就是了;而如果你习惯了DIY,甚或对话框也无法满足你的统计分析要求(别瞪眼,下面你就会看到了),就请你在本章学习一下如何写SPSS程序吧。

什么?SPSS还有程序?!是的,如果大家以前用过SPSS/PC+ 4.0,就一定不会对SPSS的程序感到陌生:在那个非常遥远的DOS时代(大约15年前),学习SPSS程序的语法,掌握如何编写SPSS程序是熟练使用SPSS的必要条件(但还不充分)。随着Windows旋风的登陆,软件的易操作性被推进到了前所未有的高度,而SPSS显然是统计软件中做的最成功的一个。他的操作界面是如此的成功,让使用者可以完全无须了解SPSS的语法而使用其99%的功能,使得SPSS程序被人逐渐忘记。其实,适当的使用SPSS程序可以大大提高我们的工作效率,并且SPSS在设计时也充分注意到了编程功能和使用界面的结合--还记得Paste按钮吗?下面我们就结合几个实例来学习如何使用程序编辑窗口。

请注意:我们不准备教大家那些枯燥的SPSS语法,现在写SPSS程序就象在WORD中记录宏一样简单,所需要做的只是略加修改而已。

3.0.1 程序编辑窗口界面

选择菜单File==>new==>syntax,系统会开启一个新的程序编辑窗口如下:

Syntax从字面上应该翻译为句法、语法的意思,这里从实际用途出发,翻译为程序。

和以前见过的数据管理窗口相比,这个窗口简单的不能再简单了。菜单项中的File、Edit、View、Analyze、Graphs等菜单都是通用的,唯一特殊的是Run菜单,该窗口的特殊功能均在这里实现。

3.0.2 邂逅Paste按钮

Paste按钮在几乎所有SPSS对话框中均存在,它是专门为编程准备的。以第一章的那个t检验为例,如果最终选择完毕后不单击OK而是单击Paste,则程序编辑窗中会自动生成以下语句:

T-TEST

GROUPS=group(1 2)

/MISSING=ANALYSIS

/VARIABLES=x

/CRITERIA=CIN(.95) .

这就是你刚才想做的工作,如果运行它,就可以得到t检验的结果!怎么运行?选择菜单Run==>all,看到了吗?

Paste按钮如何能生成程序?在SPSS中,操作界面实际上起的就是“操作界面”的作用。当你用对话框选定某项操作,单击OK后,SPSS就将你的选择翻译成程序语句,然后提交系统执行。如果你单击Paste 按钮,SPSS就不将生成的程序语句提交执行,而是传送到程序编辑窗中供你折腾。说的再广一些,不光SPSS,SAS等其他统计软件也是这么做的。

从上面的语句可以看到SPSS程序的基本结构:一条语句可占多行,最前面为语句主体,具体的选项用斜杠和语句主体相连,最后用小数点结束语句。

3.0.3 用程序编辑窗口加快我们的工作

如果程序编辑窗口只能带来“暂停”功能的话,我也就不用再往下写了。幸好,它的作用还远不止与此。当需要成批次的处理数据时,当你需要重复进行相同的统计分析时,当你要做许多统计分析,每一步均费时较长而你又不想等时...,使用Paste按钮是你的救命稻草。仍以第一章为例,如果从预分析一开始就连续使用Paste按钮,则到分析结束我们会得到如下程序:

DESCRIPTIVES

VARIABLES=x

/STATISTICS=MEAN STDDEV MIN MAX .

SORT CASES BY group .

SPLIT FILE

SEPARATE BY group .

DESCRIPTIVES

VARIABLES=x

/STATISTICS=MEAN STDDEV MIN MAX .

GRAPH

/HISTOGRAM=x .

SPSS数据案例分析

SPSS数据案例分析

SPSS数据案例分析 目录 一.手机 APP 广告点击意愿的模型构建 (3) 1.1构建研究模型 (3) 1.2研究变量及定义 (4) 1.3研究假设 (4) 1.4变量操作化定义 (4) 1.5问卷设计 (5) 二.实证研究 (8) 2.1基础数据分析 (8) 2.2频数分布及相关统计量 (8) 2.3相关分析 (10) 2.4回归分析 (11) 2.5假设检验 (13)

一.手机APP 广告点击意愿的模型构建 1.1构建研究模型 我们知道效用期望、努力期望、社会影响对行为意愿会产生一定的影响,在模型中的性别、年龄、经验与自愿性等四个控制变量,通常都是作为控制变量来观察他们对采用因素与使用意向之间的关系的影响。因此,目前手机 APP 广告的使用人群年龄相对比较年轻,而且年龄特征分布高度集中,年龄在 30 岁以下的人群占到 70%以上,因此本研究考虑性别了这一变量,同时根据手机 APP 广告用户的特性,加入了手机流量作为控制变量,去观察它们对外部变量与点击意愿之间的关系是否有显著影响。 在本研究中,主要把调节变量和控制变量作为两个不同的研究变量,对于调节变量感知风险来说,它是直接影响了感知风险与手机 APP 广告点击意愿二者的关系;而控制变量性别、手机流量这些变量是对广告效用期望、APP 效用期望和社会影响与点击意愿直接的关系是否有显著影响。最后,本文根据手机APP 广告的特点对 UTAUT 模型进行扩展,构建了手机 APP 广告点击意愿的影响因素研究模型。

1.2研究变量及定义 1.3研究假设 (1) 广告效用期望、APP 效用期望、社会影响与手机 APP 点击意向的关系 H1:用户的广告效用期望与点击手机 APP 广告意愿正相关。 H2:用户的 APP 效用期望与点击手机 APP 广告意愿正相关 H3:社会影响与手机 APP 广告点击意愿正相关 (2)感知风险与点击手机 APP 广告意愿的关系 H4:感知风险与手机 APP 广告点击意愿负相关 H5:性别,手机流量对手机 APP 广告点击意愿没有显著影响 1.4变量操作化定义 广告效用期望:广告对我了解某品牌来说很有用 APP 效用期望:使用 APP 能够让我了解到多方面的信息 社会影响:身边的人都在使用手机 APP 广告,所以我也要使用 感知风险:在点击手机 APP 广告时,我担心我的个人隐私安全得不到保护 感知隐私安全重要性:确保点击手机 APP 广告是安全的,对我来说是很重

spss的数据分析案例精选文档

s p s s的数据分析案例 精选文档 TTMS system office room 【TTMS16H-TTMS2A-TTMS8Q8-

关于某公司474名职工综合状况的统计分析报告一、数据介绍: 本次分析的数据为某公司474名职工状况统计表,其中共包含十一变量,分别是:id(职工编号),gender(性别),bdate(出生日期),edcu(受教育水平程度),jobcat(职务等级),salbegin (起始工资),salary(现工资),jobtime(本单位工作经历<月>),prevexp(以前工作经历<月>),minority(民族类型),age(年龄)。通过运用spss统计软件,对变量进行频数分析、描述性统计、方差分析、相关分析、以了解该公司职工上述方面的综合状况,并分析个变量的分布特点及相互间的关系。 二、数据分析 1、频数分析。基本的统计分析往往从频数分析开始。通过频数分 析能够了解变量的取值状况,对把握数据的分布特征非常有用。 此次分析利用了某公司474名职工基本状况的统计数据表,在gender(性别)、edcu(受教育水平程度)、不同的状况下的频数分析,从而了解该公司职工的男女职工数量、受教育状况的基本分布。 Statistics 首先,对该公司的男女性别分布进行频数分析,结果如下:

上表说明,在该公司的474名职工中,有216名女性,258名男性,男女比例分别为%和%,该公司职工男女数量差距不大,男性略多于女性。 其次对原有数据中的受教育程度进行频数分析,结果如下表: Educational Level (years)

16 59 17 11 18 9 19 27 20 2 .4 .4 21 1 .2 .2 Tot al 474 上 表及其直方图说明,被调查的474名职工中,受过12年教育的职工是该组频数最高的,为190人,占总人数的%,其次为15年,共有116人,占中人数的%。且接受过高于20年的教育的人数只有1人,比例很低。 2、 描述统计分析。再通过简单的频数统计分析了解了职工在性别和受教育水平上的总体分布状况后,我们还需要对数据中的其他变量特征有更为精确的认识,这就需要通过计算基本描述统计的方法来实现。下面就对各个变量进行描述统计分析,得到它们的

spss的数据分析案例

关于某公司474名职工综合状况的统计分析报告 一、数据介绍: 本次分析的数据为某公司474名职工状况统计表,其中共包含十一变量,分别是:id(职工编号),gender(性别),bdate(出生日期),edcu(受教育水平程度),jobcat(职务等级),salbegin(起始工资),salary(现工资),jobtime(本单位工作经历<月>),prevexp(以前工作经历<月>),minority(民族类型),age(年龄)。通过运用spss统计软件,对变量进行频数分析、描述性统计、方差分析、相关分析、以了解该公司职工上述方面的综合状况,并分析个变量的分布特点及相互间的关系。 二、数据分析 1、频数分析。基本的统计分析往往从频数分析开始。通过频数分析能够 了解变量的取值状况,对把握数据的分布特征非常有用。此次分析利用了某公司474名职工基本状况的统计数据表,在gender(性别)、edcu(受教育水平程度)、不同的状况下的频数分析,从而了解该公司职工的男女职工数量、受教育状况的基本分布。 Statistics 首先,对该公司的男女性别分布进行频数分析,结果如下:

上表说明,在该公司的474名职工中,有216名女性,258名男性,男女比例分别为45.6%和54.4%,该公司职工男女数量差距不大,男性略多于女性。 其次对原有数据中的受教育程度进行频数分析,结果如下表: Educational Level (years)

14 6 1.3 1.3 52.5 15 116 24.5 24.5 77.0 16 59 12.4 12.4 89.5 17 11 2.3 2.3 91.8 18 9 1.9 1.9 93.7 19 27 5.7 5.7 99.4 20 2 .4 .4 99.8 21 1 .2 .2 100.0 Tot 474 100.0 100.0 al 上表及其 直方图说明,被调查的474名职工中,受过12年教育的职工是该组频数最高的,为190人,占总人数的40.1%,其次为15年,共有116人,占中人数的24.5%。且接受过高于20年的教育的人数只有1人,比例很低。 2、描述统计分析。再通过简单的频数统计分析了解了职工在性别和受教

spss的数据分析报告范例

关于某地区361个人旅游情况统计分析报告 一、数据介绍: 本次分析的数据为某地区361个人旅游情况状况统计表,其中共包含七变量,分别是:年龄,为三类变量;性别,为二类变量(0代表女,1代表男);收入,为一类变量;旅游花费,为一类变量;通道,为二类变量(0代表没走通道,1代表走通道);旅游的积极性,为三类变量(0代表积极性差,1代表积极性一般,2代表积极性比较好,3代表积极性好 4代表积极性非常好);额外收入,一类变量。通过运用spss统计软件,对变量进行频数分析、描述性统计、方差分析、相关分析,以了解该地区上述方面的综合状况,并分析个变量的分布特点及相互间的关系。 二、数据分析 1、频数分析。基本的统计分析往往从频数分析开始。通过频数分地区359个人旅游基本 状况的统计数据表,在性别、旅游的积极性不同的状况下的频数分析,从而了解该地区的男女职工数量、不同积极性情况的基本分布。 统计量 积极性性别 N 有效359 359 缺失0 0 首先,对该地区的男女性别分布进行频数分析,结果如下

性别 频率百分比有效百分 比 累积百分 比 有效女198 55.2 55.2 55.2 男161 44.8 44.8 100.0 合计359 100.0 100.0 表说明,在该地区被调查的359个人中,有198名女性,161名男性,男女比例分别为44.8%和55.2%,该公司职工男女数量差距不大,女性略多于男性。 其次对原有数据中的旅游的积极性进行频数分析,结果如下表: 积极性 频率百分比有效百分 比 累积百分 比 有效差171 47.6 47.6 47.6 一般79 22.0 22.0 69.6 比较 好 79 22.0 22.0 91.6 好24 6.7 6.7 98.3 非常 好 6 1. 7 1.7 100.0 合计359 100.0 100.0 其次对原有数据中的积极性进行频数分析,结果如下表: 其次对原有数据中的是否进通道进行频数分析,结果如下表:

SPSS数据案例分析

SPSS数据案例分析 目录 一.手机 APP 广告点击意愿的模型构建 2 1.1构建研究模型 2 1.2研究变量及定义 2 1.3研究假设 3 1.4变量操作化定义 3 1.5问卷设计 3 二.实证研究 5 2.1基础数据分析 5 2.2频数分布及相关统计量 5 2.3相关分析 7 2.4回归分析 8 2.5假设检验 10

一.手机APP 广告点击意愿的模型构建 1.1构建研究模型 我们知道效用期望、努力期望、社会影响对行为意愿会产生一定的影响,在模型中的性别、年龄、经验与自愿性等四个控制变量,通常都是作为控制变量来观察他们对采用因素与使用意向之间的关系的影响。因此,目前手机APP 广告的使用人群年龄相对比较年轻,而且年龄特征分布高度集中,年龄在30 岁以下的人群占到70%以上,因此本研究考虑性别了这一变量,同时根据手机APP 广告用户的特性,加入了手机流量作为控制变量,去观察它们对外部变量与点击意愿之间的关系是否有显著影响。 在本研究中,主要把调节变量和控制变量作为两个不同的研究变量,对于调节变量感知风险来说,它是直接影响了感知风险与手机APP 广告点击意愿二者的关系;而控制变量性别、手机流量这些变量是对广告效用期望、APP 效用期望和社会影响与点击意愿直接的关系是否有显著影响。最后,本文根据手机APP 广告的特点对UTAUT 模型进行扩展,构建了手机APP 广告点击意愿的影响因素研究模型。

1.2研究变量及定义 1.3研究假设 (1) 广告效用期望、APP 效用期望、社会影响与手机APP 点击意向的关系 H1:用户的广告效用期望与点击手机APP 广告意愿正相关。 H2:用户的APP 效用期望与点击手机APP 广告意愿正相关 H3:社会影响与手机APP 广告点击意愿正相关 (2)感知风险与点击手机APP 广告意愿的关系 H4:感知风险与手机APP 广告点击意愿负相关 H5:性别,手机流量对手机 APP 广告点击意愿没有显著影响

SPSS软件进行主成分分析的应用例子

SPSS软件进行主成分分析的应用例子 2002年16家上市公司4项指标的数据[5]见表2,定量综合赢利能力分析如下: 第一,将EXCEL中的原始数据导入到SPSS软件中; 【1】“分析”|“描述统计”|“描述”。 【2】弹出“描述统计”对话框,首先将准备标准化的变量移入变量组中,此时,最重要的一步就是勾选“将标准化得分另存为变量”,最后点击确定。 【3】返回SPSS的“数据视图”,此时就可以看到新增了标准化后数据的字段。

数据标准化主要功能就是消除变量间的量纲关系,从而使数据具有可比性,可以举个简单的例子,一个百分制的变量与一个5分值的变量在一起怎么比较?只有通过数据标准化,都把它们标准到同一个标准时才具有可比性,一般标准化采用的是Z标准化,即均值为0,方差为1,当然也有其他标准化,比如0--1标准化等等,可根据自己的研究目的进行选择,这里介绍怎么进行数据的Z标准化。 所的结论: 标准化后的所有指标数据。 注意: SPSS 在调用Factor Analyze 过程进行分析时, SPSS 会自动对原始数据进行标准化处理, 所以在得到计算结果后的变量都是指经过标准化处理后的变量, 但SPSS 并不直接给出标准化后的数据, 如需要得到标准化数据, 则需调用Descriptives 过程进行计算。 factor过程对数据进行因子分析(指标之间的相关性判定略)。 【1】“分析”|“降维”|“因子分析”选项卡,将要进行分析的变量选入“变量”列表;

【2】设置“描述”,勾选“原始分析结果”和“KMO与Bartlett球形度检验”复选框; 【3】设置“抽取”,勾选“碎石图”复选框; 【4】设置“旋转”,勾选“最大方差法”复选框; 【5】设置“得分”,勾选“保存为变量”和“因子得分系数”复选框; 【6】查看分析结果。 所做工作: a.查看KMO和Bartlett 的检验 KMO值接近1.KMO值越接近于1,意味着变量间的相关性越强,原有变量越适合作因子分析; Bartlett 球度度检验的Sig值越小于显著水平0.05,越说明变量之间存在相关关系。 所的结论: 符合因子分析的条件,可以进行因子分析,并进一步完成主成分分析。 注意: 1.KMO(Kaiser-Meyer-Olkin) KMO统计量是取值在0和1之间。当所有变量间的简单相关系数平方和远远大于偏相关系数平方和时,KMO值接近1.KMO值越接近于1,意味着变量间的相关性越强,原有变量越适合作因子分析;当所有变量间的简单相关系数平方和接近0时,KMO值接近0.KMO值越接近于0,意味着变量间的相关性越弱,原有变量越不适合作因子分析。 Kaiser给出了常用的kmo度量标准: 0.9以上表示非常适合;0.8表示适合;0.7表示一般; 0.6表示不太适合;0.5以下表示极不适合。 2.Bartlett 球度检验: 巴特利特球度检验的统计量是根据相关系数矩阵的行列式得到的,如果该值较大,且其对应的相伴概率值小于用户心中的显著性水平,那么应该拒绝零假设,认为相关系数矩阵不可能是单位阵,即原始变量之间存在相关性,适合于做主成份分析;相反,如果该统计量比较小,且其相对应的相伴概率大于显著性水平,则不能拒绝零假设,认为相关系数矩阵可能是单位阵,不宜于做因子分析。 Bartlett 球度检验的原假设为相关系数矩阵为单位矩阵,Sig值为0.001小于显著水平0.05,因此拒绝原假设,说明变量之间存在相关关系,适合做因子分析。 所做工作: b. 全部解释方差或者解释的总方差(Total Variance Explained)

SPSS概览--数据分析实例详解

第一章SPSS概览--数据分析实例详解 1.1 数据的输入和保存 1.1.1 SPSS的界面 1.1.2 定义变量 1.1.3 输入数据 1.1.4 保存数据 1.2 数据的预分析 1.2.1 数据的简单描述 1.2.2 绘制直方图 1.3 按题目要求进行统计分析 1.4 保存和导出分析结果 1.4.1 保存文件 1.4.2 导出分析结果 希望了解SPSS 10.0版具体情况的朋友请参见本网站的SPSS 10.0版抢鲜报道。 例1.1 某克山病区测得11例克山病患者与13名健康人的血磷值(mmol/L)如下, 问该地急性克山病患者与健康人的血磷值是否不同(卫统第三版例4.8)? 患者: 0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11 健康人: 0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87 解题流程如下:

1.将数据输入SPSS,并存盘以防断电。 2.进行必要的预分析(分布图、均数标准差的描述等),以确定应采 用的检验方法。 3.按题目要求进行统计分析。 4.保存和导出分析结果。 下面就按这几步依次讲解。 §1.1 数据的输入和保存 1.1.1 SPSS的界面 当打开SPSS后,展现在我们面前的界面如下: 请将鼠标在上图中的各处停留,很快就会弹出相应部位的名称。 请注意窗口顶部显示为“SPSS for Windows Data Editor”,表明现在所看到的是SPSS的数据管理窗口。这是一个典型的Windows软件界面,有菜单栏、

SPSS大数据案例分析实施报告

SPSS数据案例分析 目录 _Toc438655006 一.手机APP 广告点击意愿的模型构建 (2) 1.1构建研究模型 (2) 1.2研究变量及定义 (2) 1.3研究假设 (2) 1.4变量操作化定义 (2) 1.5问卷设计 (2) 二.实证研究 (2) 2.1基础数据分析 (2) 2.2频数分布及相关统计量 (2) 2.3相关分析 (2) 2.4回归分析 (2) 2.5假设检验 (2)

一.手机APP 广告点击意愿的模型构建 1.1构建研究模型 我们知道效用期望、努力期望、社会影响对行为意愿会产生一定的影响,在模型中的性别、年龄、经验与自愿性等四个控制变量,通常都是作为控制变量来观察他们对采用因素与使用意向之间的关系的影响。因此,目前手机APP 广告的使用人群年龄相对比较年轻,而且年龄特征分布高度集中,年龄在30 岁以下的人群占到70%以上,因此本研究考虑性别了这一变量,同时根据手机APP 广告用户的特性,加入了手机流量作为控制变量,去观察它们对外部变量与点击意愿之间的关系是否有显著影响。 在本研究中,主要把调节变量和控制变量作为两个不同的研究变量,对于调节变量感知风险来说,它是直接影响了感知风险与手机APP 广告点击意愿二者的关系;而控制变量性别、手机流量这些变量是对广告效用期望、APP 效用期望和社会影响与点击意愿直接的关系是否有显著影响。最后,本文根据手机APP 广告的特点对UTAUT 模型进行扩展,构建了手机APP 广告点击意愿的影响因素研究模型。

1.3研究假设 (1) 广告效用期望、APP 效用期望、社会影响与手机APP 点击意向的关系 H1:用户的广告效用期望与点击手机APP 广告意愿正相关。 H2:用户的APP 效用期望与点击手机APP 广告意愿正相关 H3:社会影响与手机APP 广告点击意愿正相关 (2)感知风险与点击手机APP 广告意愿的关系 H4:感知风险与手机APP 广告点击意愿负相关 H5:性别,手机流量对手机APP 广告点击意愿没有显著影响

spss 分析案例数据

《数据分析及其应用软件》习题 姓名__学号___成绩 习题1:出钢时所用盛钢水的钢包,因钢水对耐火材料的侵蚀,容积不断增大我们希望找出使用次数与增大的容积之间的关系,试验数据如下: 使用次数x增大容积y 2 6.42 38.20 49.58 59.50 69.70 710.00 89.93 99.99 1010.49 1110.59 1210.60 1310.80 1410.60 1510.90 1610.76 写出分析报告(内容包括以下四点) 1.用双曲线1/y = a+b/x作曲线拟合:(1)画出散点图,(2)写出回 归方程,(3)进行检验,(4)分析结果,(α= 0.05) 2.用指数曲线y = ae b/x 作曲线拟合:(1)画出散点图,(2)写出回 归方程,(3)进行检验,(4)分析结果,(α= 0.05) 3.比较两种曲线后,写出较优的曲线回归方程. 4.使用较优的曲线回归方程预测当使用次数为17次时钢包的容积增大多 少? 习题2:1.研究货运总量(万吨)与工业总值(亿元)、农业总产值(亿元)、居民非商品支出(亿元)的关系。数据见下表 编号货运总量 (万吨)工业总产值 (亿元) 农业总产值 (亿元) 居民非商品支出 (亿元) 1 2 3160 260 210 70 75 65 35 40 40 1.0 2.4 2.0

4 5 6 7 8 9 10265 240 220 275 160 275 250 74 72 68 78 66 70 65 42 38 45 42 36 44 42 3.0 1.2 1.5 4.0 2.0 3.2 3.0 (1)计算出的相关系数矩阵; (2)求关于的三元线性回归方程; (3)对所求得的回归方程作拟合优度检验; (4)对回归方程做显著性检验; (5)对每一个回归系数做显著性检验; (6)如果有的回归系数没有通过显著性检验,将其剔除。 重新建立回归方程,再作回归方程的显著性检验和回归系数显著性检验; (7)求出每一个回归系数的之置信水平为95%的置信区间; (8)求出标准化回归方程; (9)求当=75,=42,=3.1时的值,给定置信水平为99%,用SPSS软件计算精确置信区间,用手工计算近似预测区间; (10)结合回归方程对问题作一些基本分析。 习题3:为研究某地区人口死亡状况,已按某种方法将15个已知样品分为3类,指标及原始数据如下表。利用费歇线性判别函数,判定另外4个待判样品属于哪一类? 某地区人口死亡状况指标及原始数据表 组别序 号 = 0岁 组 死亡概率 =1岁 组死亡概 率 = 1 0岁 组死亡概率 =55岁 组死亡概率 =80岁 组死亡概率 =平均 预期寿命 第一 组 134.167.44 1.127.8795.1969.30 233.06 6.34 1.08 6.7794.0869.70 336.269.24 1.048.9797.3068.80 440.1713.45 1.4313.88101.2066.20 550.0623.03 2.8323.74112.5263.30

【精品管理学】spss因子分析案例 共(13页)

[例11-1]下表资料为25名健康人的7项生化检验结果,7项生化检验指标依次命名为X1至X7,请对该资料进行因子分析。

图 ???对话框(图框。 图 钮返回 图11.3?描述性指标选择对话框 ???点击Extraction...钮,弹出FactorAnalysis:Extraction对话框(图11.4),系统提供如下因子提取方法: 图11.4?因子提取方法选择对话框 ???Principalcomponents:主成分分析法;

???Unweightedleastsquares:未加权最小平方法; ???Generalizedleastsquares:综合最小平方法; ???Maximumlikelihood:极大似然估计法; ???Principalaxisfactoring:主轴因子法; ???Alphafactoring:α因子法; ???对话框。 ???5种因图 ???旋转的目的是为了获得简单结构,以帮助我们解释因子。本例选正交旋转法,之后点击Continue钮返回FactorAnalysis对话框。 ???点击Scores...钮,弹出弹出FactorAnalysis:Scores对话框(图11.6),系统提供3种估计因子得分系数的方法,本例选Regression(回归因子得分),之后点击Continue钮返回FactorAnalysis对话框,再点击OK钮即完成分析。

图11.6?估计因子分方法对话框? ?11.2.3?结果解释 ??在输出结果窗口中将看到如下统计数据: ??系统首先输出各变量的均数(Mean)与标准差(StdDev),并显示共有25例观察单位进入分析;接着输出相关系数矩阵(CorrelationMatrix),经Bartlett检验表明:Bartlett值=326.28484,P<0.0001,即相关矩阵不是一个单位矩阵,故考虑进行因子分析。 好。今KMO值 NumberofCases?=?????25 CorrelationMatrix: X1???????X2???????X3???????X4???????X5???????X6???????X7 X1????????1.00000 X2?????????.58026??1.00000

SPSS分析报告实例

SPSS与数据统计分析期末论文影响学生对学校服务满意程度的因素分析

一、数据来源 本次数据主要来源自本校同学,调查了同学们年级、性别、助学金申请情况、生源所在地、学院、毕业学校、游历情况、家庭情况、升高、体重、近视程度、学习时间、经济条件、兴趣、对学校各方面的评价、与对学校总评价以及建议等共41条信息,共收集数据样本724条。我们将运用SPSS,对变量进行频数分析、样本T检验、相关分析等手段,旨在了解同学们对学校提供的满意程度与什么因素有关。 二、频数分析 可靠性统计 克隆巴赫Alpha项数 .98562 对全体数值进行可信度分析

本次数据共计724条,首先从可靠性统计来看,alpha值为0.985,即全体数据绝大部分是可靠的,我们可以在原始数据的基础上进行分析与处理。 其中,按年级来看,绝大多数为大二学生填写(占了总人数的67.13%),之后分别依次为大二(23.76%)、大四(4.14%)、大一(4.97%)。而从专业来看,占据了数据绝大多数样本所在的学院为机械、材料、经管、计通。 三、数据预处理 拿到这份诸多同学填写的问卷之后,我们首先应对一些数据进行处理,对于数据的缺失值处理,由于我们对本份调查的分析重点方面是关于学生的经济情况的,因此对于确实的部分数据,升高、体重、近视度数、感兴趣的事等无关项我们均不需要进行缺失值的处理,而我们可能重点关注的每月家里给的钱、每月收入以及每月支出,由于其具有较强主观性,如果强行处理缺失值反而会破坏数据的完整性,因此我们筛去未填写的数据,将剩余数据当作新的样本进行分析。 而对于一些关键的数据,我们需要做一些必要的预处理,例如一些调查项,我们希望得到数值型变量,但是填写时是字符型变量,我们就应该新建一个数字型变量并将数据复制,以便后续分析。同时一些与我们分析相关的缺省值,一些明显可以看出的虚假信息,我们都需要先

spss的数据分析报告范例

关于某地区361个人旅游情况统计分析报告一、数据介绍: 本次分析的数据为某地区361个人旅游情况状况统计表,其中共包含七变量,分别是:年龄,为三类变量;性别,为二类变量(0代表女,1代表男);收入,为一类变量;旅游花费,为一类变量;通道,为二类变量(0代表没走通道,1代表走通道);旅游的积极性,为三类变量(0代表积极性差,1代表积极性一般,2代表积极性比较好,3代表积极性好 4代表积极性非常好);额外收入,一类变量。通过运用spss统计软件,对变量进行频数分析、描述性统计、方差分析、相关分析,以了解该地区上述方面的综合状况,并分析个变量的分布特点及相互间的关系。 二、数据分析 1、频数分析。基本的统计分析往往从频数分析开始。通过频数分地 区359个人旅游基本状况的统计数据表,在性别、旅游的积极性不同的状况下的频数分析,从而了解该地区的男女职工数量、不同积极性情况的基本分布。 统计量 积极性性别 N有效359359 缺失00 首先,对该地区的男女性别分布进行频数分析,结果如下

性别 频率百分比有效百分 比 累积百分 比 有效女19855.255.255.2 男16144.844.8100.0 合计359100.0100.0 表说明,在该地区被调查的359个人中,有198名女性,161名男性,男女比例分别为44.8%和55.2%,该公司职工男女数量差距不大,女性略多于男性。 其次对原有数据中的旅游的积极性进行频数分析,结果如下表: 积极性 频率百分比有效百分 比 累积百分 比 有效差17147.647.647.6一般7922.022.069.6 比较 好 7922.022.091.6好24 6.7 6.798.3

SPSS相关分析案例讲解

相关分析 一、两个变量的相关分析:Bivariate 1.相关系数的含义 相关分析是研究变量间密切程度的一种常用统计方法。相关系数是描述相关关系强弱程度和方向的统计量,通常用r 表示。 ①相关系数的取值范围在-1和+1之间,即:–1≤r ≤ 1。 ②计算结果,若r 为正,则表明两变量为正相关;若r 为负,则表明两变量为负相关。 ③相关系数r 的数值越接近于1(–1或+1),表示相关系数越强;越接近于0,表示相关系数越弱。如果r=1或–1,则表示两个现象完全直线性相关。如果=0,则表示两个现象完全不相关(不是直线相关)。 ④3.0

spss的数据分析案例

关于某公司474名职工综合状况的统计分析报告一、数据介绍: 本次分析的数据为某公司474名职工状况统计表,其中共包含十一变量,分别是:id(职工编号),gender(性别),bdate(出生日期),edcu(受教育水平程度),jobcat(职务等级),salbegin(起始工资),salary(现工资),jobtime(本单位工作经历<月>),prevexp(以前工作经历<月>),minority(民族类型),age(年龄)。通过运用spss统计软件,对变量进行频数分析、描述性统计、方差分析、相关分析、以了解该公司职工上述方面的综合状况,并分析个变量的分布特点及相互间的关系。 二、数据分析 1、频数分析。基本的统计分析往往从频数分析开始。通过频数分 析能够了解变量的取值状况,对把握数据的分布特征非常有用。 此次分析利用了某公司474名职工基本状况的统计数据表,在gender(性别)、edcu(受教育水平程度)、不同的状况下的频数分析,从而了解该公司职工的男女职工数量、受教育状况的基本分布。 Statistics 首先,对该公司的男女性别分布进行频数分析,结果如下:

上表说明,在该公司的474名职工中,有216名女性,258名男性,男女比例分别为45.6%和54.4%,该公司职工男女数量差距不大,男性略多于女性。 其次对原有数据中的受教育程度进行频数分析,结果如下表:

Educational Level (years)

上表及其直方图说明,被调查的474名职工中,受过12年教育的职工是该组频数最高的,为190人,占总人数的40.1%,其次为15年,共有116人,占中人数的24.5%。且接受过高于20年的教育的人数只有1人,比例很低。 2、描述统计分析。再通过简单的频数统计分析了解了职工在性别 和受教育水平上的总体分布状况后,我们还需要对数据中的其他变量特征有更为精确的认识,这就需要通过计算基本描述统计的方法来实现。下面就对各个变量进行描述统计分析,得到它们的均值、标准差、片度峰度等数据,以进一步把我数据的集中趋势和离散趋势。 Descriptive Ststistics

SPSS数据案例分析

SPSS数据案例分析 目录

一.手机APP 广告点击意愿的模型构建 构建研究模型 我们知道效用期望、努力期望、社会影响对行为意愿会产生一定的影响,在模型中的性别、年龄、经验与自愿性等四个控制变量,通常都是作为控制变量来观察他们对采用因素与使用意向之间的关系的影响。因此,目前手机APP 广告的使用人群年龄相对比较年轻,而且年龄特征分布高度集中,年龄在30 岁以下的人群占到70%以上,因此本研究考虑性别了这一变量,同时根据手机APP 广告用户的特性,加入了手机流量作为控制变量,去观察它们对外部变量与点击意愿之间的关系是否有显着影响。 在本研究中,主要把调节变量和控制变量作为两个不同的研究变量,对于调节变量感知风险来说,它是直接影响了感知风险与手机APP 广告点击意愿二者的关系;而控制变量性别、手机流量这些变量是对广告效用期望、APP 效用期望和社会影响与点击意愿直接的关系是否有显着影响。最后,本文根据手机APP 广告的特点对UTAUT 模型进行扩展,构建了手机APP 广告点击意愿的影响因素研究模型。 研究变量及定义

研究假设 (1) 广告效用期望、APP 效用期望、社会影响与手机APP 点击意向的关系 H1:用户的广告效用期望与点击手机APP 广告意愿正相关。 H2:用户的APP 效用期望与点击手机APP 广告意愿正相关 H3:社会影响与手机APP 广告点击意愿正相关 (2)感知风险与点击手机APP 广告意愿的关系 H4:感知风险与手机APP 广告点击意愿负相关 H5:性别,手机流量对手机APP 广告点击意愿没有显着影响 变量操作化定义 ?广告效用期望:广告对我了解某品牌来说很有用 ?APP 效用期望:使用APP 能够让我了解到多方面的信息 ?社会影响:身边的人都在使用手机APP 广告,所以我也要使用 ?感知风险:在点击手机APP 广告时,我担心我的个人隐私安全得不到保护?感知隐私安全重要性:确保点击手机APP 广告是安全的,对我来说是很重要的 ?使用意向:我愿意把手机APP 广告推荐给我周围的人 问卷设计 1.使用APP 能够让我了解到多方面的信息[单选题] [必答题] ???很不同意?????○?1???○?2???○?3???○?4???○?5??很同意 2.广告对我了解某品牌来说很有用[单选题] [必答题] ???很不同意?????○?1???○?2???○?3???○?4???○?5??很同意 3.身边的人都在使用手机APP 广告,所以我也要使用[单选题] [必答题] ???很不同意?????○?1???○?2???○?3???○?4???○?5??很同意 4.在点击手机APP 广告时,我担心我的个人隐私安全得不到保护[单选题] [必答题] ???很不同意?????○?1???○?2???○?3???○?4???○?5??很同意 5.确保点击手机APP 广告是安全的,对我来说是很重要的[单选题] [必答题] ???很不同意?????○?1???○?2???○?3???○?4???○?5??很同意 6.我愿意把手机APP 广告推荐给我周围的人[单选题] [必答题]

SPSS操作实例-重复测量

1 重复测方差分析实例操作 分析过程 1.数据格式 2.软件实验步骤 3.结果解释与描述 原始数据 group t0 t1 t2 t3 group t0 t1 t2 t3 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0

1.1 数据格式 1.2 软件实验步骤

些处的描述过程输出无标准差, group=2时可用Analyze\ Explorer过程实现描述, group=3时可用Analyze→General Lineal Model→Multivariate去实现描述。 1.3 结果解释与描述 表1 有无合并症患者LC含量(s x ) 例数 重复测量时间 麻醉前麻醉后20分钟电切手术30分钟手术结束时 无合并症42 ±±±±有合并症18 ±±±± 统计描述可以通过Analyze\ Explorer过程实现,该过程较简单不赘述。

统计分析教程.(高级篇)张文彤P37 也就是说,在分析时,我们首先要判断,重复测量的不同时间点之间的结果是否存在相关性,也就是进行球形检验,即Mauchly's Test of Sphericity 。 如果P<,不符合 Huynh-Feldt 条件,说明重复测量数据之间存在相关性,不可按单因素方差分析方法处理,需要进行多变量方差分析。以多元检验结果为准。 统计分析教程.(高级篇)张文彤P41 如果P> ,符合Huynh-Feldt 条件,说明重复测量数据之间不存在相关性,可按单因素方差分析方法处理。 统计分析教程.(高级篇)张文彤P40 Table 2 Mauchly's Test of Sphericity Within Subjects Effect Mauchly's W Approx. Chi-Square df Sig. Epsilon a Greenhouse-G eisser Huynh-Feldt Lower-b ound Time 5 .000

SPSS数据案例分析

SPSS数据案例分析 目录 .手机APP广告点击意愿的模型构建 (2) 1.1构建研究模型 (2) 1.2研究变量及定义 (2) 1.3研究假设 (3) 1.4变量操作化定义 (3) 1.5问卷设计 (3) .实证研究 (5) 2.1基础数据分析 (5) 2.2频数分布及相关统计量 (5) 2.3相关分析 (7) 2.4回归分析 (8) 2.5假设检验 (10)

.手机APP广告点击意愿的模型构建 1.1构建研究模型 我们知道效用期望、努力期望、社会影响对行为意愿会产生一定的影响,在模型中的性别、年龄、经验与自愿性等四个控制变量,通常都是作为控制变量来观察他们对采用因素与使用意向之间的关系的影响。因此,目前手机APP广告的使用人群年龄相对比较年轻,而且年龄特征分布高度集中,年龄在30岁以下的人群占到70%以上,因此本研究考虑性别了这一变量,同时根据手机APP广告用户的特性,加入了手机流量作为控制变量,去观察它们对外部变量与点击意愿之间的关系是否有显著影响。 在本研究中,主要把调节变量和控制变量作为两个不同的研究变量,对于调节变量感知风险来说,它是直接影响了感知风险与手机APP广告点击意愿二者 的关系;而控制变量性别、手机流量这些变量是对广告效用期望、APP效用期望和社会影响与点击意愿直接的关系是否有显著影响。最后,本文根据手机APP 广告的特点对UTAUT模型进行扩展,构建了手机APP广告点击意愿的影响因素研究模型。 1.2研究变量及定义

1.3研究假设 ⑴广告效用期望、APP效用期望、社会影响与手机APP点击意向的关系H1:用户 的广告效用期望与点击手机APP广告意愿正相关。 H2:用户的APP效用期望与点击手机APP广告意愿正相关 H3:社会影响与手机APP广告点击意愿正相关 (2)感知风险与点击手机APP广告意愿的关系 H4:感知风险与手机APP广告点击意愿负相关 H5:性别,手机流量对手机APP广告点击意愿没有显著影响 1.4变量操作化定义 广告效用期望:广告对我了解某品牌来说很有用 APP效用期望:使用APP能够让我了解到多方面的信息社会影响:身边的人都在使用手机APP广告,所以我也要使用感知风险:在点击手机APP广告时,我担心我的个人隐私安全得不到保护感知隐私安全重要性:确保点击手机APP广告是安全的,对我来说是很重要的 使用意向:我愿意把手机APP广告推荐给我周围的人 1?5问卷设计 [单选题][必答题] ][必答题] 2.广告对我了解某品牌来说很有用[单选题][必答题] 很不同意010*******很同意 4. 在点击手机APP广告时,我担心我的个人隐私安全得不到保护[单选题][必答题] 很不同意O1 1C2IL 03 04 C5很同意 5. 确保点击手机APP广告是安全的,对我来说是很重要的[单选题][必答题] 很不同意01 1C2|L 03 04 05很同意 7.您的性别是[单选题][必答题] O男 O女 6.我愿意把手机APP广告推荐给我周围的人[单选题][必答题]

spss的数据分析报告范例

s p s s的数据分析报告 范例 Document number【980KGB-6898YT-769T8CB-246UT-18GG08】

关于某地区361个人旅游情况统计分析报告 一、数据介绍: 本次分析的数据为某地区361个人旅游情况状况统计表,其中共包含七变量,分别是:年龄,为三类变量;性别,为二类变量(0代表女,1代表男);收入,为一类变量;旅游花费,为一类变量;通道,为二类变量(0代表没走通道,1代表走通道);旅游的积极性,为三类变量(0代表积极性差,1代表积极性一般,2代表积极性比较好,3代表积极性好 4代表积极性非常好);额外收入,一类变量。通过运用spss统计软件,对变量进行频数分析、描述性统计、方差分析、相关分析,以了解该地区上述方面的综合状况,并分析个变量的分布特点及相互间的关系。 二、数据分析 1、频数分析。基本的统计分析往往从频数分析开始。通过频数分地区359个人旅 游基本状况的统计数据表,在性别、旅游的积极性不同的状况下的频数分析,从而了解该地区的男女职工数量、不同积极性情况的基本分布。 统计量 积极性性别 N有效359359 缺失00 首先,对该地区的男女性别分布进行频数分析,结果如下 性别 频率百分比有效百分 比 累积百分 比 有效女198 男161 合计359 表说明,在该地区被调查的359个人中,有198名女性,161名男性,男女比例分别为%和%,该公司职工男女数量差距不大,女性略多于男性。 其次对原有数据中的旅游的积极性进行频数分析,结果如下表:

有效差171 一般79 比较好79 好24 非常好6 合计359 其次对原有数据中的积极性进行频数分析,结果如下表: 这说明,在该地区被调查的359个人中,有没走通道的占%,占绝大多数。 上表及其直方图说明,被调查的359个人中,对与旅游积极性差的组频数最高的,为171 人数的%,其次为积极性一般和比较好的,占比例都为%,积性为好的和非常好的比例比较低,分别为24人和6人,占总体的比例为%和%。 2、描述统计分析。 再通过简单的频数统计分析了解了职工在性别和受教育水平上的总体分布状况后,我们还需要对数据中的其他变量特征有更为精确的认识,这就需要通过计算基本描述统计的方法来实现。下面就对各个变量进行描述统计分析,得到它们的均值、标准差、片度峰度等数据,以进一步把我数据的集中趋势和离散趋势。

spss的数据分析案例

s p s s的数据分析案例文件排版存档编号:[UYTR-OUPT28-KBNTL98-UYNN208]

关于某公司474 名职工综合状况的统计分析报告 一、 数据介绍: 本次分析的数据为某公司474名职工状况统计表,其中共包含十一变量,分别是:id (职工编号),gender(性别),bdate(出生日期),edcu (受教育水平程度),jobcat (职务等级),salbegin (起始工资),salary (现工资),jobtime(本单位工作经历<月>),prevexp(以前工作经历<月>),minority(民族类型),age(年龄)。通过运用spss 统计软件,对变量进行频数分析、描述性统计、方差分析、相关分析、以了解该公司职工上述方面的综合状况,并分析个变量的分布特点及相互间的关系。 二、 数据分析 1、 频数分析。基本的统计分析往往从频数分析开始。通过频数分析能够了解变 量的取值状况,对把握数据的分布特征非常有用。此次分析利用了某公司474名职工基本状况的统计数据表,在gender(性别)、edcu (受教育水平程度)、不同的状况下的频数分析,从而了解该公司职工的男女职工数量、受教育状况的基本分布。 首先,对该公司的男女性别 分布进行频数分析,结果如 下: Gender

上表说明,在该公司的474名职工中,有216名女性,258名男性,男女比例分别为%和%,该公司职工男女数量差距不大,男性略多于女性。 其次对原有数据中的受教育程度进行频数分析,结果如下表: Educational Level (years)

上表及其直方图说明,被调查的474名职工中,受过12年教育的职工是该组频数最高的,为190人,占总人数的%,其次为15年,共有116人,占中人数的%。且接受过高于20年的教育的人数只有1人,比例很低。 2、描述统计分析。再通过简单的频数统计分析了解了职工在性别和受教育水平 上的总体分布状况后,我们还需要对数据中的其他变量特征有更为精确的认识,这就需要通过计算基本描述统计的方法来实现。下面就对各个变量进行描述统计分析,得到它们的均值、标准差、片度峰度等数据,以进一步把我数据的集中趋势和离散趋势。 Descriptive Ststistics

相关主题
相关文档 最新文档