第一章 spss基础知识
- 格式:docx
- 大小:1.79 MB
- 文档页数:24
第一章SPSS统计分析系统软件简介1)SPSS的几种基本运行方式:①菜单操作方式:这种方法图形用户界面友好、操作简单、形象直观,能够一步步引导用户完成对数据的描述和模型的建立。
②程序运用方式:是在Syntax编辑窗口输入程序。
也可以用任何文本编辑器中输入,也可以在相应菜单操作的对话框中,用“Paste”按钮可以把相应的操作转化为Syntax语言。
选择所有的语法命令行,单击“Run”运行程序。
或者在SPSS的语法编辑器窗口输入语法。
③ Include运行方式:在编写Syntax命令中,如果要调用其他语法文件时,除了复制粘贴现有的资源外,还可以用Include的命令。
④ Production Facility方式:Production Facility生产作业方式提供了以自动化方式运行SPSS Statistics 的功能。
2)SPSS界面提供的五个窗口:①数据编辑窗口:这个窗口主要用来处理数据和定义数据字典,它分为两个视图。
一个是用来显示数据的数据视图(数据视图用来显示数据集中的记录或个案),另外一个是变量视图(变量视图的功能是定义数据集的数据字典)。
②结果管理窗口:也称为结果视图或者结果浏览器,该窗口用于存放SPSS软件的分析结果。
分为左边目录区,是SPSS分析结果的目录;右边是内容区,显示与目录相应的内容。
③结果编辑窗口:是编辑分析结果的窗口。
选中要编辑的内容,双击或者点击右键选择“编辑内容”,选中的图形就会出现在“图表编辑器”中,可以开始编辑。
④语法编辑窗口:语法编程方式,能够完成窗口操作所能完成的所有任务,还可以完成许多窗口操作所不能完成的其他工作。
在这个窗口中,还可以调用开源软件R中的任何程序。
⑤脚本窗口:是用Sax Basic 语言编写的程序。
脚本可以使SPSS内部操作自动化,可以自定义结果格式,可以连接VB和VBA应用程序。
第二章数据文件的建立和管理1)数据管理的特点:数据编辑器的每一行数据称为一个个案,每一列数据代表个体属性,即变量。
目录一、spss软件基础 (2)1.spss的发展和特点 (2)2.spsss安装、启动与退出 (2)2.1安装: (2)2.2启动 (2)2.3退出 (3)3.spss基本操作环境 (3)3.1 spss数据编辑窗口 (3)3.2 spss数据输出窗口 (4)4.spss的三种基本使用方式 (5)4.1 完全窗口菜单方式 (5)4.2程序运行方式 (5)4.3混合运行方式 (5)二、spss数据分析的基本步骤 (5)1.数据分析的一般步骤 (5)2.spss数据分析的一般步骤 (6)三、spss数据文件的建立和管理 (6)1.spss数据文件及其特点 (6)2.spss数据的结构和定义方法 (7)2.1 变量名 (7)2.2 数据类型、宽度、列宽度 (7)2.3 变量名标签 (8)2.4 变量值标签 (9)2.5 缺失数据 (9)2.6 变量对齐格式(Align) (11)2.7 度量尺度 (11)3.spss的录入、编辑与保存 (12)3.1 spss的录入 (12)3.2 spss的编辑 (12)4.spss数据文件的合并 (15)4.1纵向合并数据 (15)4.2 横向合并数据 (21)5.读取其他格式的文件 (23)一、spss软件基础1.spss的发展和特点Spss全称Statistical Package for Social Science——社会科学统计软件,斯坦福大学三名研究生制作。
与常用的stata,SAS等统计软件相比,具有“易学易用易普及”的竞争优势。
大量成熟的统计方法,完善的数据定义操作管理,开放的数据接口以及灵活的统计表格和统计图形是spss盛久不衰的法宝。
2.spsss安装、启动与退出2.1安装:请在网盘中下载spss19.0软件,双击SPSS19crack20100825.exe就可以安装了。
(如果有异常,把两个安装包都安装上)2.2启动安装完成后,可能桌面没有快捷方式,点击,点按键盘“win”键——所有程序,找到spss程序,把快捷方式发送到桌面上。
双击如下图标,即可启动spss程序。
打开数据有两种方式:一是双击数据文件,spss数据文件以.sav结尾。
二是打开先打开spss程序,通过文件——打开——数据,选择数据文件进行打开。
2.3退出Spss退出时,一般会有三个提示,主要注意看提示会不会更改数据文件,不要点错了,造成数据文件被不小心更改,如果原始数据被更改,还是很麻烦的。
如下图:3.spss基本操作环境spss是由多个数据窗口组成的,每个窗口有各自的作用。
在实际应用中只要了解两个基本窗口即可:即数据编辑窗口和结果输出窗口。
3.1 spss数据编辑窗口如上图所示,spss数据编辑窗口是由四个部分组成。
各自有不同的功能,请自己探索。
此外注意数据编辑窗口提供了两种视图。
简单的来说,数据视图序号1,2…代表了填的一份份问卷,每个序号就是录入的一份问卷。
而变量视图就是你的问卷,序号1,2等代表着你的问卷的第1题,第2题等。
大概是这个意思,当然spss的作用不仅仅是处理问卷。
3.2 spss数据输出窗口Spss数据输出窗口有两种打开方式:第一,自动打开。
无论你打开一个数据,还是对数据进行处理,每一步都会在数据输出窗口上做相应的记录。
第二手动打开:文件——新建——输出。
数据编辑区4.spss的三种基本使用方式4.1 完全窗口菜单方式完全窗口模式指,在操作过程中所有的分析操作都通过单击菜单、按钮、输入对话框来完成的操作,是我们最常用的使用方式。
4.2程序运行方式程序运行方式指,在操作中,根据自己的分析需要,将数据分析的步骤手工编写成spss 命令程序,然后将编写的程序一次性交给计算机执行。
Spss会自动按照程序命令语句的前后顺序自动逐字句执行相应的命令,并最终给出统计分析结果。
一般运用于大规模的统计分析工作。
这个对编程有一定要求,我们不做详解。
4.3混合运行方式,指同时使用前两种方式。
二、spss数据分析的基本步骤1.数据分析的一般步骤数据分析一般经过数据收集、加工和整理数据、分析数据等三个主要阶段,在数据分析实践中,用统计学的理论指导应用是必不可少的,也是极为重要的。
明确数据分析目标。
数据分析其本质还是根据,脱离了研究目标去空谈数据分析是没有任何意义的,任何情况下都不能为了数据分析而去分析。
只有明确了数据分析的目标,才能正确的制定数据搜集的方案,如应收集那些数据,应采取怎样的方式搜集,进而为分析数据做准备。
正确收集数据。
从分析目标出发,排除干扰因素,正确收集服务于既定分析目标的数据,正确的数据对于实现数据分析目标起到关键作用。
数据的加工处理。
把握数据的总体分布特征,这是进一步分析和建模的基础。
数据的加工整理通常包括数据的缺失值处理,数据的分组,基本描述统计量的计算,基本统计图形的绘制,数据取值的转换,基本统计图形的绘制,数据的正态处理等。
明确统计方法的含义及适用范围。
入门者在学习的时候,有时候会滥用或误用统计方法,主要是由于对方法解决哪类问题,方法适用的前提,方法对数据的要求不清等原因造成的。
选择几种统计方法对数据进行探索性的反复分析也是极为重要的。
每一种统计方法都有其特点与局限。
仅仅依据一种分析方法的结果就断然做结论是不科学的。
读懂数据分析结果。
数据分析的直接结果是统计指标和参数,正确理解这些指标和参数的统计学意义是一切分析结论的基础。
而做到这些,就要正确把握统计分析的核心思想。
才外,将统计指标和统计参数与实际问题和专业知识相结合也是费城重要的。
2.spss数据分析的一般步骤spss数据的准阶段。
定义spss数据的结构、录入和修改spss数据包,即利用spss提供的功能准备spss数据文件。
spss数据的加工整理阶段。
指对数据进行预处理。
Spss数据的分析阶段。
该阶段应选择正确的方法,对数据进行分析建模、Spss分析结果的阅读和解释。
该阶段的主要任务是读懂spss输出窗口的分析结果,明确其统计含义,并集合应用背景知识做出切合实际的合理解释。
三、spss数据文件的建立和管理1.spss数据文件及其特点spss数据文件的特殊性:第一,spss数据文件的扩展名是.sav。
第二,spss数据文件是一种有结构的数据额文件。
一般文本文件仅有纯数据部分,而没有关于结构的描述。
而spss 数据由结构和内容两部分组成。
其中数据的结构记录数据类型、取值说明、数据缺失值情况等必要信息,数据的内容才是哪些需要分析的具体数据。
建立spss数据文件的步骤:第一,描述spss数据的结构;第二,录入编辑spss数据。
spss数据的基本组织方式:第一,原始数据的组织方式。
如果待分析的数据是一些原始的调查问卷数据,或者是一些基本的统计指标,那么这些数据就是以原始数据的组织形式组织。
在数据编辑窗口数据视图中,一行称之为一个个案,一列称之为一个变量,每个变量有一个名字,叫做变量名,它是访问和分析spss每个变量的唯一标志。
第二,频数数据的组织方式。
如果分析的数据不是原始的调查问卷,而是经过分组汇总后的汇总数据,那么这些数据就应以频数数据的组织方式组织。
在频数数据的组织方式中,数据编辑窗口的一行为变量的一个分组(或多个变量交叉分组下的一个分组)、所有行囊括了该变量的所有分组情况(或多个变量交叉下的所有分组情况)。
数据编辑窗口的一列仍然为一个变量,代表某个问题(或某个方面)及频数。
例如:下表研究职称与年龄关系时搜集这个数据就是分组汇总后的数据。
其中职称的取值是1-4,年龄的取值是1-3。
这样的数据如何组织在spss中呢,如下图:2.spss数据的结构和定义方法Spss数据的结构是对spss每列变量及其相关属性的描述,主要包括变量名、类型、宽度、列宽度、变量名标签、缺失值,度量尺度等信息。
其中有一些是必须定义的,有些可以省略。
2.1 变量名变量名是变量分析和访问的唯一标志。
在定义spss数据结构时应首先给出每列变量的变量名。
变量名命名规则(没必要说了,因为新版spss对中文支持更好,支持的字符也更多,基本上没有太多的限制,所以建议大家用最新的中文版,老版本限制比较多)。
此外注意:①变量名不区分英文大小写②变量名不能与spss内部具有特殊含义的保留字同名,如ALL,BY,AND,NOT,OR等③spss有默认的变量名,以VAR开头,后面补足五位数字,如VAR00001,VAR00002等依次增加。
2.2 数据类型、宽度、列宽度数据类型是每个变量取值的类型。
Spss中有三种:①数值型②字符型③日期型。
宽度指变量可现实的最大字符位数,列宽度指数据编辑窗口每列的字符位数。
通常列宽度和宽度位数是一致的。
列宽指管理数据视图中的列宽,在变量类型是数据格式时显示数据的人眼看到的位数。
宽度管理数据视图中其它变量类型(非数值变量)如时间美元,字符时的显示符位数。
数据类型是指每个变量取值的类型。
SPSS中有三种基本数据类型:数值型、字符型和日期型。
数值型数值型是SPSS最常用的数据类型,通常由阿拉伯数字和其它特殊符号等组成。
其中的标准型(numeric)是SPSS默认的数据类型,默认的显示宽度为8位,包括正负符号位、小数点和小数位在内,小数位默认为2位。
如果数据的实际宽度大于8位,spss将自动按照科学计数法显示,数据的显示并不影响数据的存储,也不影响数据的计算。
(1)标准型(Numeric)(2)科学记数法型(Scientific Notation)示例:120=1.2E+02,0.005=5.0E-03。
其中E表示以10为底,+02表示正的2次方。
一般用来表示特别大或者特别小的数字。
Spss会自动对输入的标准型数值转换为科学计数法型。
(3)逗号型(Comma):如1,234.56。
从个位起每3位用一个逗号隔开。
选择逗号型数值是,在实际输入时不需要再去添加逗号,spss会自动填充。
(4)圆点型(Dot)如1.234,56。
其他同上。
(5)美元符号型(Dollar)用来表示货币数据。
(6)用户自定义型(Custom Currency):“编辑——选项——货币”,可以自定义。
字符型(String)字符型也是SPSS较常用的数据类型,由一个字符串组成。
如职工号码、姓名、地址等变量都可以定义为字符型数据。
字符型数据的默认显示宽度为8个字符,不能够进行算术运算,并区分大小写字母。
字符型数据在SPSS命令处理过程中应用一对双引号括起来,但在输入数据时不应输入双引号,否则双引号将会作为字符型数据的一部分日期型(Date)日期型数据用来表示日期或者时间,如生日、成立日期等变量可以定义为日期型数据。
显示格式:dd-mmm-yyyy;mm/dd/yyyy。
上述编辑窗口如下图:2.3 变量名标签变量名标签是对变量名含义的进一步解释说明,它可以增强变量名的可视性和统计分析结果的可读性。