当前位置:文档之家› spss基础知识第二章

spss基础知识第二章

第二章SPSS数据文件的

建立和管理

第一节数据文件的特点和结构第二节数据的录入和保存

第三节数据的编辑

第一节数据文件的特点和结构

?数据文件的特点

?数据文件的结构

数据文件的特点

?数据文件包括

●文件结构

?对每个变量及相关属性的描述

?包括:变量名、变量类型、变量宽度、变量名

标签、变量值标签、变量列格式、变量缺失值、

变量度量方法等

●数据

?一列数据被称为一个变量(variable)

?一行数据被称为一条个案(case)

?建立SPSS数据文件的步骤

●定义SPSS数据文件结构

输入分析数据

数据文件的结构

?名称

?类型、宽度和小数?标签

?值

?缺失值

?列和对齐

?度量标准

名称

?概念

●是变量存取的唯一标志

●在定义数据文件结构时应首先给出每列变量

的变量名

●规则

●实际中

?变量名最好与其代表的数据含义相对应

类型、宽度和小数

?数值型

●数值型数据由0-9的阿拉伯数字和其他特殊符

号,如:美元符号、逗号、圆点组成

●表示方法

?数值

?逗号

?点

?科学计数法

?美元

●数据的显示不影响真正数据的存储和计算

类型、宽度和小数(续)?字符型

●由一个字符串组成

●默认显示宽度为8个字符位

●不能进行算术运算,区分大小写

?日期型

●用来表示日期或时间

●显示格式较多

标签

?概念

●是对变量名含义的进一步解释说明

●可增强变量名的可视性和分析结果的可读性

?规则

●可以用中文

●总长度可达120个字符

●可省略定义,但最好给出

?概念

●对变量值含义的解释说明信息

●明确了数据的含义,增强了最后统计分析结

果的可读性

●对于顺序水准和名义水准的变量必不可少

?规则

●可用中文

●可省略定义,但对顺序水准和名义水准变量

最好给出

缺失值

?缺失值的产生

●数据中出现明显错误和不合理的数据

●有些数据项的数据漏填了

?缺失值的处理

●用户自定义缺失值

●系统缺失值

?用一个圆点表示

?一般出现在数值型变量中

?字符变量中的空格或空不是系统缺失值

列和对齐

?变量的列宽度

●默认值是各变量类型所默认的显示宽度

●随变量显示宽度的改变而自动改变

●某些情况下需要对其进行修改

?数据的对齐方式

●方式

?左对齐、右对齐、中间对齐

●一般

?字符型变量默认左对齐显示

?数值型变量默认右对齐显示

度量标准

?定距度量:度量

●连续型数据和离散型数据

●默认的度量方法

?非定距度量

●非定距数据

?顺序数据:序号

?分类数据:名义

SPSS数据文件结构

SPSS数据文件结构(虚线中的内容可以省略)

名称类型

标签

标签值

缺失值列和对齐度量标准

第二节数据的录入与保存

?录入数据的一般方法

?录入带有变量值标签的数据?SPSS数据文件的保存

录入数据的一般方法

?录入

●在SPSS数据编辑窗口中以表格方式进行录入

●数据编辑窗口中的黑色框子框住的单元为当

期数据单元

?表示用户正在对该单元录入数据或正在修改该单

元中的数据

?方式

●逐行录入

?录入完一个数据后,按Tab键

●逐列录入

?录入完一个数据后,按Enter键

录入带有变量值标签的数据?步骤

●打开显示变量值标签的开关

?视图→值标签

●确定当前数据单元

●录入相应的变量值后,在数据单元中

显示的是其所对应的变量值标签

SPSS 数据文件的保存

?数据保存格式

●SPSS数据文件格式

●Excel工作表格式文件

●Dbase数据库文件格式文件

●文本格式文件

?特点

保存格式优点缺点

SPSS数据文件格式可被SPSS软件直接读

取;保存了变量值数

据及变量的其他属性

无法直接被其

他软件读取

Excel工作表格式、Dbase数据库文件格数据可被相应的软件

直接读取

仅保存了变量

值数据

第三节数据的编辑

?SPSS数据定位

?插入和删除一个个案

?插入和删除一个变量

?数据单元中数据的移动、复制和删除

SPSS数据定位

?概念

●确定数据编辑窗口中的哪个单元为当前数据

单元

?方式

●人工定位

?通过肉眼人工浏览数据,确定当前数据单元

?适用于数据量较少的情况

●自动定位

?计算机按照用户给定的条件自动寻找满足条件的

第一个数据单元,并设置它为当前数据单元

插入和删除一个个案

?插入一个个案

●将当前数据单元确定在一个个案数据的任何

变量列上

●菜单选项:编辑→插入个案

?自动在当前数据单元所在行之前插入一个空白行

●可在空白行上逐个录入变量值数据

?删除一个个案

●选择将被删除的个案数据行

●单击鼠标右键,从弹出菜单中选择Cut选项

?待删除的个案被删除

其后数据自动依次往前提

spss基础知识

1.定义变量 (1)Name:定义变量名 变量名必须以字母或字符@开头,其它字符可以是任何字母、数字或_、@、#、$等 符号。变量名总长度不能超过8 个字符(即4 个汉字)。 (2)Type:定义变量类型 SPSS 的主要变量类型有:Numeric(标准数值型)、Comma(带逗号的数值型)、Dot (圆点作小数点的数值型)、Scientific Notation(科学记数法)、Date(日期型)、Dollar (带美元符号的数值型)、Custom Currency(自定义型)、String(字符型)。单击Type 相应单元中的按钮,选择合适的变量类型并单击OK。 (3)Width:变量长度 设置数值变量的长度,当变量为日期型时无效。 (4)Decimal:变量小数点位数 设置数值变量的小数点位数,当变量为日期型时无效。 (5)Label:变量标签 变量标签是对变量名的进一步描述,变量只能由不超过8 个字符组成,8 个字符经 常不足以表示变量的含义。而变量标签可长达120 个字符,变量标签对大小写敏感,显 示时与输入值完全一样,需要时可用变量标签对变量名的含义加以解释。 (6)Value:变量值标签 值标签是对变量的每一个可能取值的进一步描述。 (7)Missing:缺失值的定义方式 SPSS 有两类缺失值:系统缺失值和用户缺失值。在数据长方形中任何空的数字单 元都被认为系统缺失值,用点号(?)表示。SPSS 可以指定那些由于特殊原因造成的 信息缺失值,然后将它们标为用户缺失值,统计过程识别这种标识,带有缺失值的观测 被特殊处理。默认值为None。单击Value 相应单元中的按钮,可改变缺失值定义方式。(8)Column:变量的显示宽度 输入变量的显示宽度,默认为8。 (9)Align:变量显示的对齐方式 选择变量值显示时的对齐方式:Left(左对齐)、Right(右对齐)、Center(居中 对齐)。 (10)Scale:变量的测量尺度 根据变量测量精度不同,可把变量由低到高分为四种尺度:定类变量、定序变量、 定距变量和定比变量。 1)定类变量 定类变量由称为名义(nominal)变量。这是一种测量精度最低、最粗略的基于“质” 因素的变量,它的取值只代表观测对象的不同类别,例如“性别”变量、“职业”变量 等都是定类变量。定类变量的取值称为定类数据或名义数据。定类数据的共同特点是用 不多的名称来加以表达,并由被研究变量每一组出现的次数及其总计数所组成,这种数 据是枚举性的,即由计数一一而得。唯一适合于定类数据的数学关系是“等价关系”。 因而,在定类数据中,同一组内各单位是等价的,同时若更换各不同组的符号并不会改 变数据原有的基本信息。因此,最常用来综合定类数据的统计量是频数、比率或百分比等。 2)定序变量 定序变量由称为有序(ordinal)变量、顺序变量,它的取值大小能够表示观测对 象的某种顺序关系(等级、方位或大小等),也是基于“质”因素的变量。例如:“最高

SPSS教程中文完整版

SPSS统计与分析 统计要与大量的数据打交道,涉及繁杂的计算和图表绘制。现代的数据分析工作如果离开统计软件几乎是无法正常开展。在准确理解和掌握了各种统计方法原理之后,再来掌握几种统计分析软件的实际操作,是十分必要的。 常见的统计软件有 SAS,SPSS,MINITAB,EXCEL 等。这些统计软件的功能和作用大同小异,各自有所侧重。其中的 SAS 和 SPSS 是目前在大型企业、各类院校以及科研机构中较为流行的两种统计软件。特别是 SPSS,其界面友好、功能强大、易学、易用,包含了几乎全部尖端的统计分析方法,具备完善的数据定义、操作管理和开放的数据接口以及灵活而美观的统计图表制作。SPSS 在各类院校以及科研机构中更为流行。 SPSS(Statistical Product and Service Solutions,意为统计产品与服务解决方案)。自 20 世纪 60 年代 SPSS 诞生以来,为适应各种操作系统平台的要求经历了多次版本更新,各种版本的 SPSS for Windows 大同小异,在本试验课程中我们选择 PASW Statistics 作为统计分析应用试验活动的工具。 1. SPSS 的运行模式 SPSS 主要有三种运行模式: (1)批处理模式 这种模式把已编写好的程序(语句程序)存为一个文件,提交给[开始]菜单上[SPSS for Windows]→[Production Mode Facility]程序运行。 (2)完全窗口菜单运行模式 这种模式通过选择窗口菜单和对话框完成各种操作。用户无须学会编程,简单易用。 (3)程序运行模式

这种模式是在语句(Syntax)窗口中直接运行编写好的程序或者在脚本(script)窗口中运行脚本程序的一种运行方式。这种模式要求掌握 SPSS 的语句或脚本语言。本试验指导手册为初学者提供入门试验教程,采用“完全窗口菜单运行模式”。 2. SPSS 的启动 (1)在 windows[开始]→[程序]→[PASW],在它的次级菜单中单击“SPSS for Windows”即可启动 SPSS 软件,进入 SPSS for Windows 对话框,如图,图所示。 图 SPSS 启动

spss教程第二章均值比较检验与方差分析要点

第二章均值比较检验与方差分析 在经济社会问题的研究过程中,常常需要比较现象之间的某些指标有无显著差异,特别当考察的样本容量n比较大时,由随机变量的中心极限定理知,样本均值近似地服从正态分布。所以,均值的比较检验主要研究关于正态总体的均值有关的假设是否成立的问题。 ◆本章主要内容: 1、单个总体均值的 t 检验(One-Sample T Test); 2、两个独立总体样本均值的 t 检验(Independent-Sample T Test); 3、两个有联系总体均值均值的 t 检验(Paired-Sample T Test); 4、单因素方差分析(One-Way ANOVA); 5、双因素方差分析(General Linear Model Univariate)。 ◆假设条件:研究的数据服从正态分布或近似地服从正态分布。 在Analyze菜单中,均值比较检验可以从菜单Compare Means,和General Linear Model得出。如图2.1所示。 图2.1 均值的比较菜单选择项 §2.1 单个总体的t 检验(One-Sample T Test)分析 单个总体的 t 检验分析也称为单一样本的 t 检验分析,也就是检验单个变量的均值是否与假定的均数之间存在差异。如将单个变量的样本均值与假定的常数相比较,通过检验得出预先的假设是否正确的结论。

例1:根据2002年我国不同行业的工资水平(数据库SY-2),检验国有企业的职工平均年工资收入是否等于10000元,假设数据近似地服从正态分布。 首先建立假设:H0:国有企业工资为10000元; H1:国有企业职工工资不等于10000元 打开数据库SY-2,检验过程的操作按照下列步骤: 1、单击Analyze →Compare Means →One-Sample T Test,打开One-Sample T Test 主对话框,如图2.2所示。 图2.2 一个样本的t检验的主对话框 2、从左边框中选中需要检验的变量(国有单位)进入检验框中。 3、在Test Value框中键入原假设的均值数10000。 4、单击Options按钮,得到Options对话框(如图2.3),选项分别是置信度(默认项是95%)和缺失值的处理方式。选择后默认值后返回主对话框。 图2.3 一个样本t检验的Options对话框 5、单击OK,得输出结果。如表2.1所示。 表2.1(a).数据的基本统计描述 One-Sample Statistics

SPSS第二章第二节教案

教案 教师姓名朱兆军课程名称统计分析与SPSS的 应用 班级10会计与统计 授课日期2012年3月1日第3周1 课时 2 课型新授课章节名称第二章SPSS数据文件的建立和管理 教学目的1. 明确SPSS数据的基本组织方式和数据行列的含义; 2. 掌握应从哪些方面描述SPSS数据文件的结构特征; 3. 熟练掌握建立SPSS数据文件以及管理SPSS数据的基本操作; 4. 熟练掌握在SPSS中读取Excel工作表数据的基本操作,了解读取文本和数据库数据的基本方法。 教学重点1.SPSS数据的录入 2.SPSS数据的保存 教学难点SPSS数据的录入 补充、删 节、更新 无教具多媒体 课外作业预习下一课 课后体会

授课主要内容 第二节SPSS数据录入和保存 一、SPSS数据的录入和编辑 1、SPSS数据的录入 2、SPSS数据的编辑 (1).SPSS数据的定位 (2)插入和删除一条个案 (3)插入和删除一个变量 (4)数据的移动、复制和删除 二、SPSS数据的保存 格式主要有:SPSS文件格式;Excel文件格式;dbf文件格式;文本文件格式 将数据保存为SPSS数据文件或其他格式的数据文件的基本操作是: File+Save,对于新的:提示文件名和类型;对于旧的,覆盖原来的,不再提问; File+Save As,另存一个数据文件,也有格式(类型)问题; Variable按钮允许用户指定保存哪些变量,不保存哪些变量,变量名前画叉的变量将被保存到磁盘中。 将数据保存为Excel文件格式时,Write variables names to spreadsheet选项呈可用状态,它的作用是指定是否将SPSS变量名写入Excel工作表的第一行上。

spss基本知识点

spss基本知识点 【篇一:spss基本知识点】 结论不同麻醉诱导方法存在组间差别;患者的收缩压在不同的诱导 方法下不同诱导时相变化的趋势不同,其中 a 组不同诱导时相收缩 压较为稳定。第八章非参数检验(nonparametrictests 菜单)参 数检验:?? 通过样本的参数来检验总体参数的方法是参数检验。如:通过样本的均值、方差来检验总体的数学期望与总体方差提出的假 设是否为真.?? 参数检验对总体的分布有一定的要求,比如正态性和 方差齐性非参数检验:?? 对总体分布情况未知时,无法用参数检验 方法?? 非参数检验通过样本的分布对总体的分布进行检验非参数检 验所要处理的问题:?? 两个总体分布未知,它们是否相同(用两组 样本来检验)?? (由一组样本)猜出总体的分布(假设),然后用 另一组样本去检验它是否正确注:两种分布是否相同,一般包含了 参数(均值、方差等)是否相同的问题。如果两个总体的分布函数 形式相同,而参数不同,也被视为概率分布不同 nonparametrictest 菜单(1) nonparametrictest 菜单(2) 卡方检验 chi‐square?? 适用于拟合优度检验,即检验单变量的分布与理论 分布是否一致?? 实例 1:贫困调查.sav 中身体状况变量的数据分 布是否符合以往的经验:?? 完全不能自理 5%?? 基本不能自理10%?? 能自理无劳动能力 20%?? 部分丧失劳动能力 25%?? 身体 健康 40% ?? 1.weightcasesby:death?? 2.analyze‐nonparametrictest‐chisquare 二项分布检验 binomial ?? 二项分布的变量将总体分为两类(如医学中的生与死),二项分布的检验是通过样本中这两类的频率来检验总体中这两类的 概率是否为给定的值 ?? binomial 过程可检验二项分类变量是个来 自概率为 p 的二项分布例 1:一般来说,新生儿染色体异常率为1%,某医院观察了 400 名新生儿,只发现一例异常,请问该地新生 儿异常率是否低于一般水平?数据文件见 6.2sav 1.weight cases by:num 2.analyze-nonparametric test-binomial 例 2:某地 某一时期内出生 40 名婴儿,其中女性 12 名(定 sex=0),男性 28名(定 sex=1)。问这个地方出生婴儿的性别比例与通常的男女 性比例(总体概率约为 0.5)是否不同? ?? 按出生顺序输入数 据, ?? 数据文件见 6.3.sav 1- sample k-s 过程 ?? 对连续性资料 的分布情况加以考察。这是一种拟合优度性检验,研究的是样本观

spss基础知识

1. 定义变量 (1)Name定义变量名 变量名必须以字母或字符 @开头,其它字符可以是任何字母、数字或_、@、 #、$等 符号。变量名总长度不能超过 8 个字符(即 4 个汉字)。 (2)Type:定义变量类型 SPSS 的主要变量类型有: Numeric (标准数值型)、 Comm(a 带逗号的数值型)、 Dot (圆点作小数点的数值型)、Scientific Notation (科学记数法)、Date (日期型)、Dollar (带美元符号的数值型)、 Custom Currency (自定义型)、 String (字符型)。单击 Type 相应单元中的按钮,选择合适的变量类型并单击OK。 (3)Width :变量长度设置数值变量的长度,当变量为日期型时无效。 ( 4) Decimal :变量小数点位数设置数值变量的小数点位数,当变量为日期型时无效。 ( 5) Label :变量标签变量标签是对变量名的进一步描述,变量只能由不超过 8 个字符组成, 8 个字符经常不足以表示变量的含义。而变量标签可长达 120 个字符,变量标签对大小写敏感,显示时与输入值完全一样,需要时可用变量标签对变量名的含义加以解释。 ( 6) Value :变量值标签 值标签是对变量的每一个可能取值的进一步描述。 (7)Missing :缺失值的定义方式 SPSS 有两类缺失值:系统缺失值和用户缺失值。在数据长方形中任何空的数字单元都被认为系统缺失值,用点号(? )表示。 SPSS 可以指定那些由于特殊原因造成的信息缺失值,然后将它们标为用户缺失值,统计过程识别这种标识,带有缺失值的观测被特殊处理。默认值为 None。单击Value相 应单元中的按钮,可改变缺失值定义方式。 (8)Column:变量的显示宽度输入变量的显示宽度,默认为 8。 (9)Align :变量显示的对齐方式 选择变量值显示时的对齐方式: Left (左对齐)、 Right (右对齐)、 Center (居中对齐)。(10)Scale :变量的测量尺度根据变量测量精度不同,可把变量由低到高分为四种尺度:定类变量、定序变量、定距变量和定比变量。 1 )定类变量 定类变量由称为名义( nominal )变量。这是一种测量精度最低、最粗略的基于“质”因素的变 量,它的取值只代表观测对象的不同类别,例如“性别”变量、“职业”变量等都是定类变量。定类变量的取值称为定类数据或名义数据。定类数据的共同特点是用不多的名称来加以表达,并由被研究变量每一组出现的次数及其总计数所组成,这种数据是枚举性的,即由计数一一而得。唯一适合于定类数据的数学关系是“等价关系”。 因而,在定类数据中,同一组内各单位是等价的,同时若更换各不同组的符号并不会改变数据原有的基本信息。因此,最常用来综合定类数据的统计量是频数、比率或百分比等。 2)定序变量定序变量由称为有序( ordinal )变量、顺序变量,它的取值大小能够表示观测对象 的某种顺序关系(等级、方位或大小等),也是基于“质”因素的变量。例如:“最高 学历”变量的取值是: 1-小学及以下、 2-初中、 3-高中、中专、技校、 4-大学专科、 5-大 学本科、 6-研究生以上。由小到大的取值能够代表学历由低到高。定序变量的取值称为定序数据或有序数据。适合于定序数据的数学关系是“大于(>)”和“小于( <) 关系。在定序数据中,同一组内各单位是等价的,相邻组之间的单位是不等价的,它们存在“大于”或“小于”的关系。而且进行保序变换(或称单调变换),不改变数据原有的基本信息即等级顺序。最适合用于综合定序数据取值的集中趋势的统计量是中位数。 3)定距变量

SPSS操作步骤汇总

S P S S操作步骤汇总 Company Document number:WUUT-WUUY-WBBGB-BWYTT-1982GT

SPSS学习 第一章数据文件的建立 数据编码 Type:Numeric:数值型 string:字符串型 Missing: Measure:scale定量变量 nominal定性变量 根据已有的变量建立新变量 1、对于数据进行重新编码 Transform—recode into different variables—选择input variable output variable –定义新变量的名称—change—开始定义新旧变量—continue 2、通过SPSS函数建立新变量 Transform—compute variable –从function group中选择公式范围下面选择具体的公式—if 中设置要改变—continue—OK(可以对变量进行各种计算) 第二章清除数据与基本统计分析 1、对不合理的数据检查并清理 检查:analysis-description statistic-frequencies—选入要检查的数据—OK 结果:频数统计表—看是否有错误—missing system 清理: 1.对系统缺失值的清理

Data—select case—if condition is satisfied—if—function group(missing)--下面选 (missing)--continue—output(delete unselected cases)--OK—对num为哪一位的进行修改 2.对sex=3的清理(直接就清除了) Data—select case—if condition is satisfied—if—sex调入再输入=3—continue-- output(delete unselected cases)--OK—对num为哪一位的进行修改 2. 对相关变量间逻辑性检查和清理 Data—select case—if condition is satisfied—if—输入表达式(前后逻辑不相符合的表达式)-- continue-- output(delete unselected cases)--OK—对num为哪一位的进行修改 3.统计描述 正态分布统计描述 1、正态性检验:Analysis—nonparametric tests—legacy dialogs—1-sample K-S—one-sample Kolomogorov Smirnov test –normal—ok/ 2、统计描述:Analysis—descriptives--time选入—options—ok 3、按照男女统计描述:data—split file –compare group –sex调入—ok Analysis-descriptive statistic – descriptive—time 调入—options选择—OK非正态分布资料统计描述 1、正态性检验nonparametric 2、Analysis—descriptive statistics—frequencies 选入-- statistics选择—OK 第三章T检验

spss统计入门基础

Spss基础入门 1. 个案排序:对数据视图中的某个个案进行排序,具体排序规则可以点进去选择 2. 变量排序:对变量视图中某个变量进行排序,具体规则可以点进去选择 3. 转置:行列互转 4. 合并文件:有两种文件的合并,添加个案可以实现两个文件的纵向合并,添加变量可以两个文件的横向合并 5. 重构:实现把一个表格的若干个变量变为同一个变量等进行表格的合适转换 6. 汇总:对数据按照类别进行汇总,比如三个班级的学生成绩表格,可以按照班级把学生成绩的平均值等等汇总到另外一个表格,该表格就会显示比如按班级显示各个班级的成绩平均值等 7. 拆分文件:实现输出图形表格的合理拆分,比如一个公司有8个部门,现要求分男女比较各个部门的人员工资情况,理论上我们用选择个案(见下条),逐个选择男女与部门需要操作2*8次,由此画出2*8张图表。利用拆分文件,这个时候可以选择 比较组或者按组来组织输出,然后分组依据就是部门与性别,在利用下面会讲到的数据描述就可以实现预期效果。 8. 选择个案:实现选择表格中符合条件的个案然后对其进行相应操作,点击进去后会有各种选择方式,比如如果满足什么条件才选择,随机选择百分之多少等等 一.转换 1. 重新编码为不同变量:可以把原来的变量或者变量的范围重新定义为新的变量,比如现有一个班级的学生成绩,要求分心50-70分,70-90分90-100分的同学所占比例,平均值等,现在就可以利用重新编码为不同变量,把上述范围重新编码为新的变量(名字可以自己任意选取),具体操作点击进去之后比较清楚。 2. 计算变量:实现对原来变量的重新计算从而产生新的变量,比如对原来变量进行乘以10操作产生新的变量等等,产生的变量名都是可以自己选择的 一.分析 1.描述统计:实现对表格中变量的各种类型的描述统计

spss基础知识

1.定义变量 (1) Name:定义变量名 变量名必须以字母或字符 @开头,其它字符可以是任何字母、数字或 _、 @、 #、 $等符 号。变量名总长度不能超过 8 个字符(即 4 个汉字)。 (2) Type:定义变量类型 SPSS 的主要变量类型有:Numeric (标准数值型)、Comma(带逗号的数值型)、Dot (圆点作小数点的数值型)、Scientific Notation (科学记数法)、Date(日期型)、Dollar (带美元符号的数值型)、Custom Currency (自定义型)、String (字符型)。单击Type 相应单元中的按钮,选择合适的变量类型并单击OK。 (3) Width :变量长度 设置数值变量的长度,当变量为日期型时无效。 (4) Decimal :变量小数点位数 设置数值变量的小数点位数,当变量为日期型时无效。 (5) Label :变量标签 变量标签是对变量名的进一步描述,变量只能由不超过8 个字符组成, 8 个字符经 常不足以表示变量的含义。而变量标签可长达120 个字符,变量标签对大小写敏感,显 示时与输入值完全一样,需要时可用变量标签对变量名的含义加以解释。 (6) Value :变量值标签 值标签是对变量的每一个可能取值的进一步描述。 (7) Missing :缺失值的定义方式 SPSS 有两类缺失值:系统缺失值和用户缺失值。在数据长方形中任何空的数字单 元都被认为系统缺失值,用点号(?)表示。SPSS可以指定那些由于特殊原因造成的 信息缺失值,然后将它们标为用户缺失值,统计过程识别这种标识,带有缺失值的观测 被特殊处理。默认值为None。单击 Value相应单元中的按钮,可改变缺失值定义方式。 (8) Column:变量的显示宽度 输入变量的显示宽度,默认为 8。 (9) Align :变量显示的对齐方式 选择变量值显示时的对齐方式: Left (左对齐)、 Right (右对齐)、 Center (居中对齐)。(10) Scale :变量的测量尺度 根据变量测量精度不同,可把变量由低到高分为四种尺度:定类变量、定序变量、 定距变量和定比变量。 1)定类变量 定类变量由称为名义( nominal )变量。这是一种测量精度最低、最粗略的基于“质”因 素的变量,它的取值只代表观测对象的不同类别,例如“性别”变量、“职业”变量等都 是定类变量。定类变量的取值称为定类数据或名义数据。定类数据的共同特点是用不多的 名称来加以表达,并由被研究变量每一组出现的次数及其总计数所组成,这种数据是枚举 性的,即由计数一一而得。唯一适合于定类数据的数学关系是“等价关系”。因而,在定 类数据中,同一组内各单位是等价的,同时若更换各不同组的符号并不会改变数据原有的 基本信息。因此,最常用来综合定类数据的统计量是频数、比率或百分比等。 2)定序变量 定序变量由称为有序(ordinal)变量、顺序变量,它的取值大小能够表示观测对 象的某种顺序关系(等级、方位或大小等),也是基于“质”因素的变量。例如:“最高

SPSS编程操作入门知识讲解

S P S S编程操作入门

第四章 SPSS编程操作入门 4.1程序编辑窗口操作入门 一、进入程序编辑窗口界面 ①创建一个新程序 File——new——syntax ②打开一个旧程序 File——open——syntax 程序文件的扩展名为*.sps 注:syntax窗口的菜单和SPSS窗口的菜单功能基本一致,区别在于RUN菜单。 RUN ALL——运行全部程序 RUN SELECTION——运行所选择的部分程序 二、熟用Paste 按钮 在SPSS所有菜单对话框中均有Paste功能,在所有对话框选择完毕后,不选择 OK,而使用Paste,则程序编辑窗口会自动生成程序。 此功能使得SPSS编程操作变得简单易行,只需要对生成的程序适当加以修改即可。 示例:运用Paste创建一个程序文件。以xuelin.sav.为例,产生P50页的程序语句,并保存在桌面上备用。

该程序文件可以保存,当下次做相同的分析时,无需重新进行复杂的菜单选择,直接在原有程序文件上进行适当的修改,运行即可。 三、编程进行对话框无法完成的工作 示例1:见书 示例2:怎么产生连续自然数1~200 Input program. Loop #i=1 to 200. Compute x=#i. end case. End loop. End file. End input program. Execute. 4.2结构化语句简介 一、分支语句(条件语句) ①IF语句 SPSS程序格式: IF逻辑表达式目标表达式 逻辑表达式用于给出判断条件。

目标比达式表示如果满足逻辑表达式后该如何操作。 注:编程基本小知识: ①每句命令完成后,以点号结束,否则程序不被执行。 ②全部命令编辑完成后,以Execute.结束,否则程序不被执行. ③学会使用help——command syntax reference自学编程。 示例1:打开案例数据brain1.sav,要求将年龄小于20,性别为1(男)的病人归为第一组(group=1). GET FILE='F:\chenghongli\spss\数据集\brain1.sav'. if age<20 & sex=1( 逻辑表达式) group=1.(目标表达式)Execute. 示例2:打开案例数据brain1.sav,要求将年龄小于等于40岁的女性病人归为组2. GET FILE='F:\chenghongli\spss\数据集\brain1.sav'. if age le 40 group=2. execute. 练习1:将血小板大于等于100的列为组1 练习2:打开brain1.sav,创造一个新的字符型变量sex1,当sex 取值为1时,sex1取值为f, 当sex取值为2时,sex1取值为m. GET

SPSS操作步骤汇总

第一章数据文件的建立 数据编码 Type:Numeric:数值型string:字符串型 Missing: Measure:scale定量变量nominal定性变量 根据已有的变量建立新变量 1、对于数据进行重新编码 Transform—recode into different variables—选择input variable output variable –定义新变量的名称—change—开始定义新旧变量—continue 2、通过SPSS函数建立新变量 Transform—compute variable –从function group中选择公式范围下面选择具体的公式—if中设置要改变—continue—OK(可以对变量进行各种计算) 第二章清除数据与基本统计分析 1、对不合理的数据检查并清理 检查:analysis-description statistic-frequencies—选入要检查的数据—OK 结果:频数统计表—看是否有错误—missing system 清理: 1.对系统缺失值的清理 Data—select case—if condition is satisfied—if—function group(missing)--下面选(missing)--continue—output(delete unselected cases)--OK—对num为哪一位的进行修改 2.对sex=3的清理(直接就清除了) Data—select case—if condition is satisfied—if—sex调入再输入=3—continue-- output (delete unselected cases)--OK—对num为哪一位的进行修改 2. 对相关变量间逻辑性检查和清理 Data—select case—if condition is satisfied—if—输入表达式(前后逻辑不相符合的表达式)-- continue-- output(delete unselected cases)--OK—对num为哪一位的进行修改

SPSS基础分析

SPSS基础分析……给大家讲一下……不会SPSS的伤不起!!!……来源:谢彬的日志 大家现在都要写论文的数据分析了……很多同学都一点不会……所以把我知道的跟大家分享一下……下面以PASW18.0为例,也就是SPSS18.0…………什么?不是18.0,好吧……差不多的,凑合着看吧……要不去装个……= =……下面图片看不清的请右键查看图片…… 首先,要把问卷中的答案都输进SPSS中,强烈建议直接在SPSS中输入,不要在EXCEL中输入,再导入SPSS,这样可能会出问题……在输数据之前先要到变量视图中定义变量……如下图 所有类型都是数值,宽度默认,小数点看个人喜好,标签自定,其他默认……除了值…… 讲讲值的设定…… 点一下有三点的蓝色小框框……会跳出一个对话框,如果你的变量是性别,学历,那么就如下图

如果是五点维度的量表,那么就是

记住,每一题都是一个变量,可以取名Q1,Q2……设定好所有问卷上有的变量之后,就可以到数据视图中输入数据啦……如下图 都输完后……还有要做的就是计算你的每个维度的平均得分……如果你的问卷Q1-Q8是一个维度,那么就把Q1-Q8的得分加起来除以题目数8……那么得到的维度1分数会显示在数据视图中的最后……具体操作如下…… 转换——计算变量

点确定,就会在数据视图的最后一列出现计算后的变量……如果你的满意度有3个维度,那么就要计算3个维度,外加满意度这个总维度,满意度=3个维度的平均分=满意度量表的所有题目的平均分…………把你所有的维度变量都计算好之后就可以分析数据啦…… 1.描述性统计

将你要统计的变量都放到变量栏中,直接点确定……

SPSS基本功能及操作

统计分析模型 (1)信度分析文献[558] 操作步骤:分析—度量—可靠性分析(R)—移动变量到项目(I)框内—统计量—描述性(项+度量+如果。)—项之间(相关性)—继续—确定 信度系数界限值:0.60—0.65认为不可信;0.65—0.70认为是最小可接受值:0.70~0.80认为相当好;0.80—0.90就是非常好。因此,—份信度系数好的量表或问卷最好在0.80以上,0.70—0.80之间还算是可以接受的范围;分量表最好在0.70以上:0.60—0.70之间可以接受。若分量表的内部一致性系数在0.60以下或者总量表的信度系数在0.80以下,应该考虑重新修订量表或增删题目。 删除任何题项后的Cronbach’s α系数也无显著提高。可见核心知识性员工激励组合量表的内部一致性高,信度较好。信度分析说明该问卷的整体结构设计具有较高的可信度。由此可以认为,该问卷具有较好的内在信度,依此调查得到的数据是可信的,基于该问卷进行的数据统计分析结果也是比较可靠的。

从工作满意度与员工参与的相关分析结果中可以看出,工作满意度的6个维度均与员工参与有相关关系,且都为正向相关,显著性水平均达到0.05的显著性水平,可证明薪酬激励量表具有较高的收敛效度,可以进行后续研究,他们之间的相关性也可以说明本文的研究具有一定的意义。 对比上面相关系数表,项间相关性矩阵中相关系数判别标准:》=0.1(强相关)

(3)频数分析 P66 文献[558] 操作步骤:分析—描述统计—(123)频率(F)—移动变量到变量(V)框内—显示频率表格√—统计量—分布(偏度+峰度)—继续—确定 频率也称频数,就是一个变量在各个变量值上取值的个案数。SPSS中的频数分析过程可以方便地产生详细的频数分布表,即对数据按组进行归类整理,形成各变量的不同水平的频数分布表和常用的图形,以便对各变量的数据特征和观测量分布状况有一个概括的认识。描述总体分布形态的统计量主要有偏度和峰度两种。偏度(Skewness)是描述取值分布形态对称性的统计量,由Pearson在1895年提出。偏度由样本的3阶中心矩与样本方差的3/2次方的比值而得,偏度的绝对值越大,表示数据分布的偏斜程度越高。来自正态总体的样本偏度近似为0。偏度系数有两种测量方式,分别为皮尔逊偏度系数1和皮尔逊偏度系数2。偏度系数等于0的时候属于正态分布;偏度系数大于0的时候是右偏分布,表明较低的值占多数;偏度系数小于0的时候为左偏分布,表明较高的值占多数。峰度(Kutosis)是描述变量取值分布形态扁平程度的统计量,由Pearson 在1905年提出。峰度等于0的时候表示数据分布的扁平程度适中,即正态分布;峰度大于0的时候表示数据呈扁平分布;峰度小于0表明数据呈尖峰分布。

相关主题
文本预览
相关文档 最新文档