当前位置:文档之家› spss数据编辑

spss数据编辑

spss数据编辑
spss数据编辑

1 建立数据文件

SPSS所处理的数据文件有两种来源:一是SPSS环境下建立的数据文件;二是调用其它软件建立的数据文件。

1 在SPSS数据编辑窗口建立数据文件

当用户启动SPSS后,系统首先显示一个提示窗口,询问用户要SPSS做什么时,把鼠标移至“Type in data”项上单击左键选中,然后单击“OK”按钮;或者该窗口中单击“Cancel”按钮进入SPSS数据编辑窗屏幕,如图所示。

图进入SPSS数据编辑器

(1) 数据编辑(SPSS Data Editor)界面介绍

窗口名显示栏:在窗口的顶部,显示窗口名称和编辑的数据文件名,没有文件名时显示为“Untitled-SPPS Data Editor”。

窗口控制按钮:在窗口的顶部的右上角,第一个按钮是窗口最小化,第二个按钮是窗口最大化,第三个按钮是关闭窗口。

SPSS主菜单:在窗口显示的第二行上,有:File文档,Edit编辑,View显视,Data数据,Transform转换,Analyze分析,Graphs 图形,Utilities公用项,Windows视窗。

图 SPSS窗口界面

常用工具按钮:在窗口显示的第三行上,有:打开文档,保存文档,打印,对话检索,取消当前操作,重做操作,转到图形窗口,指向记录,指定变量操作,查找,在当前记录的上方插入新的空白记录,在当前变量的左边插入新的空白变量,切分文件,设置权重单元,标记单元,显示价值标签。

数据单元格信息显示栏:在编辑显示区的上方,左边显示单元格和变量名(单元格:变量名),右边显示单元里的内容。

编辑显示区:在窗口的中部,最左边列显示单元序列号,最上边一行显示变量名称,缺省为“Var”。

编辑区选择栏:在编辑显示区下方,Data View 在编辑显示区中显示编辑数据,Variable View在编辑显示区中显示编辑数据变量信息。

状态显示栏:在窗口的底部,左边显示执行的系统命令,右边显示窗口状态。

(2) 数据文件格式

数据文件格式以每一行为一个记录,或称观察单位(Cases),每一列为一个变量(Variable)。由于SPSS不同的统计分析过程需要不同的数据类型,因此,在学习使用SPSS软件作统计分析时要注意这个问题。

现在,我们通过一个例子来学习数据的输入操作。

例:马尾松腮扁叶蜂在林间表土层的水平分布调查数据

(3) 定义变量

建立数据文件的第一步是定义变量。在数据编辑窗口左下角激活(Variable View)变量定义窗口,如下图

在数据窗口中,用户定义数据变量的名称、数据类型、宽度、小数位和标记等信息。

变量名称

输入字符(汉字和英文)作为变量的名称,本例为,样地1,样地2,样地3。如不输入名称,系统依次默认为“var00001”、“var00002”、“var00003” …。

变量应遵循下列原则:

?在SPSS10.0中限制为8个字符长度(4个汉字);在SPSS12.0中没有限制。

?首字符必须是字母或汉字,不能以下划线“_”或圆点“,”结尾。

?变量不能有空格或某些特殊符号,如“!?*”等。

?变量名不能与SPSS的关键字相同,即不能用ALL、AND、BY、EQ、GT、LE等。

变量的数据类型

当鼠标指针移至单元格,单击后该单元格的右边就会显示一个“…”按钮,单击该按钮就会显示一个数据类型设置窗口,如下图所示。

可供选择的数据类型有:

?Numeric标准数值型,系统默认。例如: 12345.67

?Comma逗号数值型。例如: 12,345.67 千分位用逗号

?Dot圆点数值型。例如: 12.345,67 千分位用圆点

?Scientific notal科学记数法。例如: 1.2E+04

?Dat日期型,有27种形式。例如: mm/dd/yyyy

?Dollar美元型。例如:$12345.67

?Custom currency自定义型。例如:12345.67

?String字符型。例如:12345.67

width指定数据字符占据的总个数(包括小数点和小数位)。

Decimal 指定小数位。

根据本例的要求,变量定义如图所示。

变量标签(Label):有的时候变量名不能正确反映变量含义,有必要给它贴上标签以便识别。这个时候,就在变量定义的标签栏里输入你的注释。

变量值标签(Values):变量值标签是用来帮助解释某些变量,特别是分类变量的数值含义。例如,有一个数值变量,0表

示女性,1表示男性。此时,为了便于识别这些数值,我们是用变量值标签。

在下图的第一个Value栏输入数值,在第二个Value栏输入数值标签。当两个输入栏输入内容后,Add按钮激活,点击它就定义了变量值标签。如本例,定义了0=女和1=男。需要修改和删除,使用Change和Remove按钮。

缺失值(Missing):缺失值是统计分析时,对数据中缺少数据的一种统计识别值。缺失值定义窗口如下图。

No missing values 没有定义缺失值,用系统默认值圆点“.”表示。

Discrete missing values 可以定义3个缺失值,例如,第一格输入“0”,表示凡为0的数据是缺失值。

Range plus one optional discrete missing value 定义取值区间为缺失值。例如,Low:为1,High:为5,Discrete value:为10,表示1至5之间的数据及数值10视为缺失值。

数据列的显示宽度(Columns): 显示数据的列宽,默认8个字符。

对齐方式(Align): 有左中右3种数据显示方式。

度量类型(Measure): 按度量精度将变量分为定量变量(Scale)、等级变量(Orsinal)和定性变量(Nominal)。该选项仅用于统计绘图时坐标轴变量的区分以及决策树模块的变量定义。定量变量,如虫口数、死亡率等;等级变量,如防治效果的好、不好等;定性变量,如害虫抗药性发生,低抗,中抗和高抗。

(4) 输入数据

变量定义完成后,在编辑区选择栏里单击“Data View”卡片,编辑显示区显示为数据编辑。在编辑区中,把与变量名相对应的数据输入到单元格里区,如下图所示。

数据输入后的数据编辑窗口

2 打开数据文件

2 调用已建立的数据文件

SPSS可以调用SPSS(*.sav),Excel(*.xls),dBASE(*.dbf),ASCII(*.dat,*.txt)等数据文件。

2.1 调用SPSS数据文件(*.sav)

从菜单选择File-Open-Data命令,在弹出的打开文件对话中指定数据文件的路径,文件名框内显示的是SPSS数据文件是系统默认的文件类型“*.sav”,点击所选文件,单击“打开”按钮,或双击所选文件。这样就把该数据文件调入数据编辑窗口中。

2.2 调用ASCII数据文件(文本文件,*.dat, *.txt)

文本文件(ASCII)格式是我们经常使用的一种文件格式,也是许多软件都具有的数据交换格式。文本文件分变量固定字符宽度与使用分隔符分开变量格式(‘,’、‘;’)和制表(‘Tab’)两种形式,下面我们用例子来说明其操作。

1) 定字符宽度格式文本文件的输入

我们使用Windows“记事本”创建一个显示如下格式的TEXT1.TXT的文件。

0 7 15.56 7 15.56

1 3 6.67 10 22.22

2 8 17.78 18 40.00

3 7 15.56 25 55.56

4 7 15.56 32 71.11

5 4 8.89 3

6 80.00

6 2 4.44 38 84.44

7 3 6.67 41 91.11

8 3 6.67 44 97.78

该数据文件有5个变量,9个记录。使用这种格式使用变量名称注意宽度不能超过对应的变量数据的宽度,否则会发生一些变量名称不对的错误。

该数据文件保存在配套光盘中(\SPSS\DATA\TEXT1.TXT)。

操作过程:

(1). 在主菜单中点击“File-Open-Data”命令。

(2). 出现打开文件操作窗口,在“查找范围”栏指定文本文件“TEXT1.TXT”保存的文件夹;在“文件类型”栏里,单击该输入框或者右边的下拉按钮(三角形按钮),在下拉选项里选中“Text (*.txt)”,然后在文件列表框里选中“Text1.txt”文件,再单击“打开”按钮,如下图所示。

(3). 出现数据引导对话窗口,一共有6个对话窗口。

① 第一个对话窗口的设置

Does your text file match a predefined format(该文本文件是否与以前定义过的格式匹配?)

○Yes选择此项,则“Browse..”按钮被激活,可以将以前定义的文件调出。

⊙No不使用保存过的匹配文件,系统默认。

然后点击“下一步”按钮,出现文本输入向导的第二个对话窗口。

②第二个对话窗的设置(设置变量的分隔方式)

图变量格式和变量名设置

How are your variables arranged(变量间分隔方式?):

○Delimited: 变量间用特殊符号分隔,系统默认;

⊙ Fixed width:变量间为固定列宽度,本例选中该项。

Are variable names included at top your file (文件顶端是否含变量名?)○ Yes:文件中第1行为变量;

⊙ NO:文件中没有变量名,系统自动给变量命名。本例选中该项。

然后点击“下一步”按钮,出现文本输入向导的第三个对话窗口。

③第三个对话窗口的设置(设置纪录读取方式)

The first case of data begins on which:指定第一数据从那行开始,本例选1。How many lines represent a case 多少行为一个记录?本例选择1。

How many cases do you want to import (读入多少记录?)

⊙All of the cases:全部记录。系统默认,本例选中该项;

○The first 1000 cases:开始的1000个记录;

○A random percentage of the cases (approximately): 随机选择一定百分比。然后,点击“下一步”按钮。

④ 在第四个对话窗口的设置(修改变量分割)

可以在窗口的数据显示(Data preview)栏里,用鼠标抓住变量分隔竖线,调整竖线位置来符合变量取值宽度。有如下三种操作:

(1)修改变量字符宽度,用鼠标抓住分割线拖移;

(2)插入一条分割线,在插入位置点击鼠标左键;

(3)删除一条分割线,用鼠标抓住分割线拖移数据窗口。

调整完成后,点击“下一步”按钮。

⑤在第五个窗口定义变量属性

Specifications for variable(s) selected the data preview(设置在数据显示栏选中变量的属性):

Variable name: v1 重新定义变量名称。

Data: Numeric 重新定义变量的数据类型。

在窗口中,先在数据显示栏(Data preview)指定需要定义的变量,然后才在“Variable name”和“Data”栏输入变量名和数据类型。

完成后,点击“下一步”按钮。

⑥ 第六个对话窗口的设置

Would you like to save this file format for future(是否将文件格式存盘)

○ Yes选此项,“Save as ..”按钮激活,单击按钮后,将文件另存到指定的路径。在有相同格式文本文件时调用

它来设置。

⊙ No 不保存

Would you like to paste the syntax(是否存为程序语句文件?)

○ Yes选中此项,则将上述过程保存为程序文件。

⊙ No不保存为程序语句文件,系统默认。

设置完成后,在窗口的数据显示框里观察数据读取情况,如果读出的数据不对,可以点击“上一步”按钮,回到前面的对话窗口里进行修正设置。数据显示正确后,点击“下一

步”按钮。最后单击“完成”按钮,文本数据就输入到数据编辑窗里,完成了数据的转换过

程。

2) 分隔符格式文本文件的输入

我们使用Windows“记事本”创建一个显示如下格式的TEXT2.TXT的文件。

组中值,样本数,比例,累计次数,累计比例

0,7,5.56,7,15.56

1,3,6.67,10,22.22

2,8,7.78,18,40.00

3,7,5.56,25,55.56

4,7,5.56,32,71.11

5,4,8.89,36,80.00

6,2,4.44,38,84.44

7,3,6.67,41,91.11

8,3,6.67,44,97.78

该数据文件保存在配套光盘中(\SPSS\DATA\TEXT2.TXT)。

操作过程:

(1) 在主菜单中点击“File-Open-Data”命令,出现打开文件操作窗口。

(2) 在“查找范围”栏指定文本文件“TEXT2.TXT”保存的文件夹;在“文件类型”栏里,单击该输入框或者右边的下拉按钮(三角形按钮),在下拉选项里选中“Text (*.txt)”,然后在文件列表框里选中“Text2.txt”文件,再单击“打开”按钮。

(3) 出现数据引导对话窗口。

① 第一个对话窗口的设置

Does your text file match a predefined format(该文本文件是否与以前定义过的格式匹配?)○ Yes选择此项,则“Browse..”按钮被激活,可以将以前定义的文件调出。

⊙ No不使用预先保存匹配的文本格式文件。

然后点击“下一步”按钮,出现文本输入向导的第二个对话窗口。

②第二个对话窗的设置

How are your variables arranged(变量间分隔方式?):

⊙Delimited: 变量间用特殊符号分隔,本例选中该项。

○Fixed width:变量间为固定列宽度。

Are variable names included at top your file (文件顶端是否含变量名?)⊙Yes:文件中第1行为变量,本例选中该项。

○NO:文件中没有变量名,系统自动给变量命名。

然后点击“下一步”按钮,出现文本输入向导的第三个对话窗口。

③第三个对话窗口的设置

The first case of data begins on which: 2 指定数据从哪一行开始,本例从第2行开始。

How are your cases represented如何表达记录,有两种选择:

⊙Each line represents a:每个记录占一行,本例选中该项;

○A specific number of variables represents:多少个变量代表1个记录。

How many cases do you want to import读入多少记录?

⊙All of the cases:全部记录。系统默认,本例选中该项;

○The first 1000 cases: 开始的1000个记录;

○A random percentage of the cases (approximately): 随机选择一定百分比。

然后,点击下一步按钮。

④ 第四个对话窗口的设置

Which delimiters appear between variables:变量间的分隔符号

□Tab: 制表符□Space: 空格Comma: 逗号,本例选中此项□Semicolon: 分号□Other: 自定义,将符号填入后面框里

What is the text qualifier? (字符串文本是用什么字符限制的?)⊙ None 没有限制符,系统默认。

○ Single quote? 单引号。

○ Double quote? 双引号。

○ Other 其它字符。

⑤第五个对话窗口的设置

Specifications for variable(s) selected the data preview(设置在数据显示栏选中变量的属性):

?Variable name:?? 重新定义变量名称。

?Data:? 重新定义变量的数据类型。

?Original Name 原来的变量名称

观察数据读取情况,重新设置变量名和变量的数据类型。

⑥第六个对话窗口的设置

Spss数据处理方法

Spss数据处理方法 1.打开软件,新建文件,双击变量一栏,出现一个表格,在名称一栏中依次填写指标名称 (只能是字母),输入后其他栏自动显示,小数点可调整到3,其他可不变;同时要输入组别名称 2.输完后在视图中点数据,就会出现数据栏,在相应的指标名称下输入数据,在组别名称 下输入样本标记,每组样本用同一个数字表示。 3.输完后点窗口上面的分析下拉菜单中的比较均衡,其中有单因素方差分析,出现对话框, 因变量中输入指标名称,因子中输入组的名称。 4.对话框中有选项,对比,两两比较,选项中描述性和两两比较中的LSD必选,其他的 项目也可以选,选完后确定就可以了。 LSD最小显著性差别S-N-K waller-duncan dunnett Tukey检验scheffe多重比较 Bonferroni邦弗伦尼统计量 Using repeated-measures single factor analysis of variance and Bonferroni statistical tests (P < 0. 05), intervertebral motion redistribution of each construct was compared with the intact. 使用重复测量变异的单因子分析和Bonferroni统计学测试,我们将每个结构的椎间盘运动再分布与完整运动进行了比较。 levene Tukey HSD Dunnett T3 bonferroni Using repeated-measures single factor analysis of variance and Bonferroni statistical tests (P < 0. 05), intervertebral motion redistribution of each construct was compared with the intact. 使用重复测量变异的单因子分析和Bonferroni统计学测试,我们将每个结构的椎间盘运动再分布与完整运动进行了比较。 LSD:最小显著性差异 ?Scheffe: (四)雪費法(Scheffe)事後檢定:經單因子變異數分析之後,如果F值達到顯著水準,再以雪費法(Scheffe)進行事後比較以瞭解真正存有差異組別之基于20个网页 - 搜索相关网页 ?雪费 本研究结果显示研究对象在籍贯的不同其牙医医疗服务利用有显著差异(P=0.046),且经雪费(Scheffe)的事后检定显示外省人在牙医医疗服务利用高于本省闽南,在其他的研究中未有此发现,研究者于是进一步的去了解,发现本研究对象中... 基于13个网页 - 搜索相关网页 ?以雪費 分析檢定;若P值小於0.05達到顯著水準,再以雪費(Scheffe)進行事後檢定,比較其差異,以下將一一進行分析。 基于12个网页 - 搜索相关网页 ?雪費法 (四)雪費法(Scheffe)事後檢定:經單因子變異數分析之後,如果F值達到顯著水準,再以雪費法(Scheffe)進行事後比較以瞭解真正存有差異組別之基于12个网页 - 搜索相关网页 -Scheffe Method:事后比较 ?事后比较

spss复习整理讲课教案

一、单项选择题:(本大题小题,1 分/每小题,共分) 1.SPSS 的数据文件后缀名是: (A) .sav 2. 对数据的各种统计处理,SPSS是在下面哪一个选项中进行: (A) 数据编辑窗口; 3. 在SPSS中,下面哪一个不是SPSS的运行方式 (A) 输入运行方式; 4. 下面哪一个选项不属于SPSS的数据分析步骤: (D)数据扩展; 5. 在SPSS中,下面哪一个选项不属于对变量(列)的描述: (B) 变量名称大小; 6. 在SPSS的定义中,下面哪一个变量名的定义是错误的: (D)A_BFG_ ;首字符应以英文字母开头,后面可以跟除了!、?、*之外的字母或数字。下划线、圆点不能为变量名的最后一个字符。SPSS允许用汉字作为变量名。 7. 在SPSS的定义中,下面哪一个变量名的定义是错误的: (A)AND ;SPSS有默认的变量名,以字母"VAR开头,后面补足5位数字,如VAR00001 VAR00012等。变量名不能与SPSS内部特有的具有特定含义的保留字同名,如ALL、BY、AND、NOT、OR等。 8. 在SPSS数据文件中,下面那一项不属于数据的结构: (D)数据值; 9. 在SPSS数据文件中,下面那一项属于数据的内容: (D)数据值; 10. 通常来说,发放了900份问卷,可直接得到的有效问卷有800份,贝U SPSS所建立的相关数据文件中的行数为 (D)800; 11. 下面那一项不属于SPSS的基本变量类型: (D)整数型; 12. 当在SPSS数据文件中输入变量为“职工姓名”,则应选择的变量类型是: (B) 字符串型; 13. 当在SPSS数据文件中输入变量为“职工工资数”,则应选择的变量类型是: (A) 数值型; 13. 当在SPSS数据文件中输入变量为“公司成立日期”,则应选择的变量类型是: (C) 日期型; 14. 在SPSS的数据结构中,下面那一项不是“缺失数据”的定义: (D) 数据不是科学计数法; 15. 统计学依据变量的计量尺度将变量分为三类,以下哪一类不属于这三类: (D)科学计数类型; 16. 在统计学中,变量“身高”属于计量尺度中的: (A) 数值型变量;身高(定距)、优良中差(定序)、性别(定类) 17. 在统计学中,将变量“年龄”分为“老年”、“中年”、“青年”三个取值,分别用1、2、3 表示,则变量“年龄”属于计量尺度中的: (B) 定序型变量; 18. 在统计学中,将变量“性别”分为“男”、“女”、两个取值,分别用1、2表示,则变量 “性别”属于计量尺度中的: (C) 定类型变量; 19. 下面哪一个选项不能被SPSS系统正常打开: (C) 文本文件格式; 20. 下面哪一个选项不能被SPSS系统正常打开: (D) .exe ; 21. 在SPSS数据编辑窗口中,需要定义变量的数据结构,以下哪一项不属于变量的数据结构: (D) 变量值;

spss数据处理结构分析

公司的行政人员认为自己与市场部的人员和研发部的人员差异太大;公司总经理则认 为行政人员的综合技能、教育背景与市场部人员和研发部人员也存在明显差异,行政 人员如何通过统计方法证实自己的结论?请构造相关数据,选择合适的统计方法进行 统计验证,并对统计结果进行分析和说明 (1)本例中职工按行政人员、市场人员、研发人员依次设为 合技能、教育背景和工资四个变量,采用单因素方差分析。 (2)SPSS 分析过程: 1、进入SPSS10.0,打开相关数据文件,选择“分析 均值检验 单因素方差分析”, 弹出单因素方差分析对话框,选择变量“职位”使其进入因子( F )框中,选择变量 “综合技能、教育背景、工资”使其进入因变量列表( D )框中。 I I L 対比紗… 两心做 凹?, Boatctrap(fl). ?定]岸陽曰]单? [取消J 、帮切J 2、单击两两比较按钮,选中假定方差齐性框中的 LSD (最小显著差法),同时选中 Equal 未假定方差齐性框中的 Tamhane 'T2。 趟羊吕秦AHOVA;两比较 | S | 佃疋性 1( L5D L) □ S-N-KO) Wall IF -Dune an □ 口出钾 1 . Sid^k 1 T ukey s-b f 豔跌別:最后一牛旧 丁 □ R-E-G-WF(RJ 匚 Hachboro s GT 2(H ) i_ R -E -G 川 a? Cdtorir!l?j) '鼻2 j c J' Oj > [着制 | ■] i — EWi — ■ fc" J ■■ r — 1 未供定方垄冇 1( T 创in 凸 T2(M) Dumcti'; T3O) Game3 Howsll Ai i Durnftit i CflJ) 盘眷tt 衣平Q : 0.05 | (W ]皿洁、劭耽| 3、单击选项按钮,选中描述性和方差同质性检验,其他使用系统默认设置 1、2、3,因此有职位、综 因干;F : 5麵

spss数据分析报告怎么写

spss数据分析报告怎么写 今天乔布简历小编就和大家一起来看看spss数据分析报告怎么写。 关键词:spss数据分析报告怎么写 我们用一个例子来分析spss数据分析报告的写法——以某公司474名职工的综合状况为例进行分析。 一、数据介绍 本次分析的数据是某公司474名职工的状况统计表,其中有11个变量,分别是:职工编号、性别、出生日期、受教育水平程度、职务等级、起始工资、现工资、本单位工作经历、以前工作经历、民族类型、年龄。我们通过使用spss统计软件,对变量分别进行频数分析、描述性统计、方差分析,还有相关分析,来了解该公司职工上述方面的综合状况,并分析个别变量的分布特点和相互之间的关系。 二、数据分析 1、频数分析。我们通过频数分析可以了解变量的取值情况,对把握数据的分布特征非常重要。此次分析利用了某公司474名职工基本状况的统计数据表,在性别、受教育水平程度不同的状况下的频数分析,从而了解该公司职工的男女职工数量、受教育状况的基本分布。 首先,对该公司的男女性别分布进行频数分析,其次对原有数据中的受教育程度进行频数分析,并分别以表格的形式呈现出来。 2、描述统计分析。再通过简单的频数统计分析了解了职工在性别和受教育水平上的总体分布状况后,我们还需要对数据中的其他变量特征有更为精确的认识,这就需要通过计算基本描述统计的方法来实现。下面就对各个变量进行描述统计分析,得到它们的均值、标准差、片度峰度等数据,以进一步把我数据的集中趋势和离散趋势。 3、Exploratory data analysis。 (1)交叉分析。 在实际分析中,除了了解单个变量的分布特征,还要分析多个变量不同取值下的分布,掌握多个变量的联合分布特征,进而分析变量之间的相互影响和关系。就本数据而言,需要了解现工资与性别、年龄、受教育水平、起始工资、本单位工作经历、以前工作经历、职务等级的交叉分析。 (2)单因素方差分析。 我们把受教育水平和起始工资作为控制变量,现工资为观测变量,通过单因素方差分析方法研究受教育水平和起始工资对现工资的影响进行分析。

spss复习资料整理

第一章 1.SPSS是软件英文名称的首字母缩写,其最初为Statistical Package for the Social Sciences的缩写,即“社会科学统计软件包”。 2.SPSS系统运行管理方式(SPSS的几种基本运行方式)有: (1)完全窗口菜单运行方式 (2)程序运行管理方式 (3)混合运行管理方式 3.SPSS的界面提供的五个窗口:数据编辑窗口、结果管理窗口、结果编辑窗口、语法编辑窗口、脚本窗口。 第二章 1.SPSS的文件类型:语法文件(*.sps)、数据文件(*.sav)、结果输出文件(*.spv)。 2.SPSS数据编辑器的每一行数据称为一个个案(Case),每一个数据代表个体的属性,即变量(V ariable)。 3.SPSS变量名的命名规则: 1)必须以英文字母开头,其他部分可以含有字母、数字、下划线(即“-”); 2)变量名尽量避免和SPSS已有的关键字重复,例如sum、compute、anova等; 3)SPSS13及以后版本支持变量名最长为64Byte,即变量名最长为64个英文字符,或者32个中文字符; 4)SPSS变量名不区分大小写,即SPSS认为Name、name、nAme这三个变量名没有区别。 4.变量度量类型:定量(个数、高度、温度等)、定序(“十分重要”、“重要”、“一般”、“不重要”)、定类(名字、地址、电话等)。 5.列和宽度的区别: 变量宽度:对字符型变量,该数值决定了你能输入的字符串的长度; 列:设定该变量数据视图中列的宽度。 7.默认的缺失值类型:数值型类型(.)、字符串类型(空格)。 8.数据文件的合并包括:纵向合并和横向合并(合并个案和合并变量),合并变量包括一对一合并和一对多合并。 9.SPSS用“(*)”表示变量来自于当前活动数据文件中的变量,而用“(+)”表示将要和当前数据文件进行合并的数据文件中的变量。 10.在合并数据文件之前,所有需要合并的数据文件必须预先按照关键变量进行升序排列。否则,合并文件程序将失败。 11.(选择题)一对一合并变量时,两个文件都要提供个案;一对多合并时,活动的和非活动的文件都可以作为关键字。 课后练习题: 6.下列可以作为SPSS变量名的是 A).PRENTS12 B).1Name C).NOT TRUE D).@result 7.SPSS中可以设置工作目录,具体设置可以按照以下菜单: A).【选项】→【设置】 B).【编辑】→【选项】→【设置】 C).【编辑】→【选项】→【文件位置】

实验二--SPSS数据录入与编辑

实验二--SPSS数据录入与编辑

实验二 SPSS数据录入与编辑 一、实验目的 通过本次实验,要求掌握SPSS的基本运行程序,熟悉基本的编码方法、了解如何录入数据和建立数据文件,掌握基本的数据文件编辑与修改方法。 二、实验性质 必修,基础层次 三、主要仪器及试材 计算机及SPSS软件 四、实验内容 1.录入数据 2.保存数据文件 3.编辑数据文件 五、实验学时 2学时(可根据实际情况调整学时) 六、实验方法与步骤 1.开机 2.找到SPSS的快捷按纽或在程序中找到SPSS,打开SPSS 3.认识SPSS数据编辑窗 4.按要求录入数据 5.联系基本的数据修改编辑方法 6.保存数据文件 7.关闭SPSS,关机。 七、实验注意事项 1.实验中不轻易改动SPSS的参数设置,以免引起系统运行问题。 2.遇到各种难以处理的问题,请询问指导教师。

3.为保证计算机的安全,上机过程中非经指导教师和实验室管理人员 同意,禁止使用移动存储器。 4.每次上机,个人应按规定要求使用同一计算机,如因故障需更换, 应报指导教师或实验室管理人员同意。 5.上机时间,禁止使用计算机从事与课程无关的工作。 八、上机作业 一、定义变量 1.试录入以下数据文件,并按要求进行变量定义。 学号姓名性 别生日身高 (cm) 体重 (kg) 英语(总 分100 分) 数学(总 分100 分) 生活费 ($代表 人民币) 200201 刘一迪男1982.01.12 156.42 47.54 75 79 345.00 200202 许兆辉男1982.06.05 155.73 37.83 78 76 435.00 200203 王鸿屿男1982.05.17 144.6 38.66 65 88 643.50 200204 江飞男1982.08.31 161.5 41.68 79 82 235.50 200205 袁翼鹏男1982.09.17 161.3 43.36 82 77 867.00 200206 段燕女1982.12.21 158 47.35 81 74 200207 安剑萍女1982.10.18 161.5 47.44 77 69 1233.00 200208 赵冬莉女1982.07.06 162.76 47.87 67 73 767.80 200209 叶敏女1982.06.01 164.3 33.85 64 77 553.90 200210 毛云华女1982.09.12 144 33.84 70 80 343.00 200211 孙世伟男1981.10.13 157.9 49.23 84 85 453.80 200212 杨维清男1981.12.6 176.1 54.54 85 80 843.00 200213 欧阳已 祥 男1981.11.21 168.55 50.67 79 79 657.40 200214 贺以礼男1981.09.28 164.5 44.56 75 80 1863.90 200215 张放男1981.12.08 153 58.87 76 69 462.20 200216 陆晓蓝女1981.10.07 164.7 44.14 80 83 476.80 200217 吴挽君女1981.09.09 160.5 53.34 79 82 200218 李利女1981.09.14 147 36.46 75 97 452.80 200219 韩琴女1981.10.15 153.2 30.17 90 75 244.70 200220 黄捷蕾女1981.12.02 157.9 40.45 71 80 253.00 1)对性别(Sex)设值标签“男=0;女=1”。 2)正确设定变量类型。其中学号设为数值型;日期型统一用“mm/dd/yyyy“型号;生活费用货币型。 3)变量值宽统一为10,身高与体重、生活费的小数位2,其余为0。

SPSS数据录入与编辑

实验二 SPSS数据录入与编辑 一、实验目的 通过本次实验,要求掌握SPSS的基本运行程序,熟悉基本的编码方法、了解如何录入数据和建立数据文件,掌握基本的数据文件编辑与修改方法。 二、实验性质 必修,基础层次 三、主要仪器及试材 计算机及SPSS软件 四、实验内容 1.录入数据 2.保存数据文件 3.编辑数据文件 五、实验学时 2学时(可根据实际情况调整学时) 六、实验方法与步骤 1.开机 2.找到SPSS的快捷按纽或在程序中找到SPSS,打开SPSS 3.认识SPSS数据编辑窗 4.按要求录入数据 5.联系基本的数据修改编辑方法 6.保存数据文件 7.关闭SPSS,关机。 七、实验注意事项 1.实验中不轻易改动SPSS的参数设置,以免引起系统运行问题。 2.遇到各种难以处理的问题,请询问指导教师。

3.为保证计算机的安全,上机过程中非经指导教师和实验室管理人员 同意,禁止使用移动存储器。 4.每次上机,个人应按规定要求使用同一计算机,如因故障需更换, 应报指导教师或实验室管理人员同意。 5.上机时间,禁止使用计算机从事与课程无关的工作。 八、上机作业 一、定义变量 1. 试录入以下数据文件,并按要求进行变量定义。 1)对性别(Sex)设值标签“男=0;女=1”。 2)正确设定变量类型。其中学号设为数值型;日期型统一用“mm/dd/yyyy“型号;生活费用货币型。 3)变量值宽统一为10,身高与体重、生活费的小数位2,其余为0。

2.试录入以下数据文件,保存为“数据1.sav”。

实验三统计图的制作与编辑 一、实验目的 通过本次实验,了解如何制作与编辑各种图形。 二、实验性质 必修,基础层次 三、主要仪器及试材 计算机及SPSS软件 四、实验内容 1.条形图的绘制与编辑 2.直方图的绘制与编辑 3.饼图的绘制与编辑 五、实验学时 2学时 六、实验方法与步骤 1.开机; 2.找到SPSS的快捷按纽或在程序中找到SPSS,打开SPSS; 3.按要求完成上机作业; 4. 关闭SPSS,关机。 七、实验注意事项 1.实验中不轻易改动SPSS的参数设置,以免引起系统运行问题。 2.遇到各种难以处理的问题,请询问指导教师。 3.为保证计算机的安全,上机过程中非经指导教师和实验室管理人员同意,禁止使用移动存储器。 4.每次上机,个人应按规定要求使用同一计算机,如因故障需更换,应报指导教师或实验室管理人员同意。

SPSS数据处理与分析【模板】

图1 本研究假设概念模型图 4研究方法 4.1被试 本研究采用方便取样法选取东莞市和中山市多所普通公办初级中学1102名学生为被试。其中,男生552人,女生550人;初一年级719人,初二年级348人;被试的平均年龄为13.17岁,标准差为0.69,年龄范围介于12-16岁。

5 结果与分析 5.1 各个变量的平均数、标准差和相关系数 表1呈现了本研究所涉及的主要变量的平均数、标准差和相关矩阵。结果发现:(1)亲子关系与网络成瘾显著正相关,这表明亲子关系是青少年网络成瘾的风险性因素,亲子关系越多,青少年的网络成瘾症状越强。(2)抑郁与网络成瘾显著正相关,这表明抑郁是青少年网络成瘾的风险性因素,抑郁越多,青少年的网络成瘾行为越多。(3)亲子关系与抑郁显著正相关,而师生关系与网络成瘾相关不显著。这些研究发现为进一步检验抑郁的中介效应以及师生关系的调节效应提供了支持。 表1 各变量的平均数、标准差和相关系数 变量 1 2 3 4 5 6 Mean 5.2.师生关系在亲子关系对青少年网络成瘾直接效应的调节作用 本研究采用Hayes(2013)提出的PROCESS for SPSS的Model 1进行调节效应检验。以往研究指出性别、年龄、学业成绩、冲动性等是导致青少年网络成瘾的重要影响因素(补充参考文献),因此,本研究将上述变量作为控制变量纳入到回归方程。在数据处理之前,依据温忠麟, 张雷和侯杰泰(2006)的建议,本研究对对所有连续变量均进行了中心化处理。 如表2所示,研究发现,亲子关系可显著正向预测网络成瘾(b = 0.24,SE = 0.03, t = 8.67, p < 0.01),然而,师生关系(b = 0.03,SE = 0.03, t = 1.21, p > 0.05)、亲子

SPSS多选题的数据录入方法

SPSS问卷分析之编码录入及描述统计详解 问卷调查的方法用得很广泛,第一步面临的就是问卷编码问题,有很多外专业的同学都在问这个问题,现在通过举例的方法详细讲解如下,以方便第一次接触SPSS的同学也能做简单的分析。后面还有分析时的操作步骤,以及比较适用的深入统计分析方法的简单介绍。自己写的,错误之处请指正. 调查分析问卷回收,在经过核实和清理后就要用SPSS做数据分析,首先的第一步就是把问题编码录入。 SPSS的问卷分析中一份问卷是一个案,首先要根据问卷问题的不同定义变量。定义变量值得注意的两点:一区分变量的度量,Measure的值,其中Scale是定量、Ordinal是定序、Nominal是指定类;二注意定义不同的数据类型Type 各色各样的问卷题目的类型大致可以分为单选、多选、排序、开放题目四种类型,他们的变量的定义和处理的方法各有不同,我们详细举例介绍如下: 1 单选题:答案只能有一个选项 例一当前贵组织机构是否设有面向组织的职业生涯规划系统? A有 B 正在开创 C 没有D曾经有过但已中断 编码:只定义一个变量,Value值1、2、3、4分别代表A、B、C、D 四个选项。 录入:录入选项对应值,如选C则录入3 2 多选题:答案可以有多个选项,其中又有项数不定多选和项数定多选。 (1)方法一(二分法): 例二贵处的职业生涯规划系统工作涵盖哪些组群?画钩时请把所有提示考虑在内。 A月薪员工B日薪员工C钟点工 编码:把每一个相应选项定义为一个变量,每一个变量Value值均如下定义:“0” 未选,“1” 选。

录入:被调查者选了的选项录入1、没选录入0,如选择被调查者选AC,则三个变量分别录入为1、0、1。 (2)方法二: 例三你认为开展保持党员先进性教育活动的最重要的目标是那三项: 1()2 ()3() A、提高党员素质 B、加强基层组织 C、坚持发扬** D、激发创业热情 E、服务人民群众 F、促进各项工作 编码:定义三个变量分别代表题目中的1、2、3三个括号,三个变量Value值均同样的以对应的选项定义,即:“1” A,“2” B,“3” C,“4” D,“5” E,“6” F 录入:录入的数值1、2、3、4、5、6分别代表选项ABCDEF,相应录入到每个括号对应的变量下。如被调查者三个括号分别选ACF,则在三个变量下分别录入1、3、6。 注:能用方法二编码的多选题也能用方法编码,但是项数不定的多选只能用二分法,即方法一是多选题一般处理方法。 3 排序题:对选项重要性进行排序 例四您购买商品时在①品牌②流行③质量④实用⑤价格中对它们的关注程度先后顺序是(请填代号重新排列)第一位第二位第三位第四位第五位 编码:定义五个变量,分别可以代表第一位第五位,每个变量的Value都做如下定义:“1” 品牌,“2” 流行,“3” 质量,“4” 实用,“5” 价格 录入:录入的数字1、2、3、4、5分别代表五个选项,如被调查者把质量排在第一位则在代表第一位的变量下输入“3“。 4 选择排序题: 例五把例三中的问题改为“你认为开展保持党员先进性教育活动的最重的目标是那三项,并按重要性从高到低排序”,选项不变。 编码:以ABCDEF6个选项分别对应定义6个变量,每个变量的Value都做同样的如下定义:“1” 未选,“2” 排第一,“3” 排第二,“4” 排第三。

SPSS所处理的数据文件有两种来源

SPSS所处理的数据文件有两种来源:一是SPSS环境下建立的数据文件;二是调用其它软件建立的数据文件。 1 在SPSS数据编辑窗口建立数据文件 当用户启动SPSS后,系统首先显示一个提示窗口,询问用户要SPSS做什么时,把鼠标移至“Type in data”项上单击左键选中,然后单击“OK”按钮;或者该窗口中单击“Cancel”按钮进入SPSS数据编辑窗屏幕,如图所示。 图进入SPSS数据编辑器 (1) 数据编辑(SPSS Data Editor)界面介绍 窗口名显示栏:在窗口的顶部,显示窗口名称和编辑的数据文件名,没有文件名时显示为“Untitled-SPPS Data Editor”。 窗口控制按钮:在窗口的顶部的右上角,第一个按钮是窗口最小化,第二个按钮是窗口最大化,第三个按钮是关闭窗口。SPSS主菜单:在窗口显示的第二行上,有:File文档,Edit编辑,View显视,Data数据,Transform转换,Analyze分析,Graphs 图形,Utilities公用项,Windows视窗。

图 SPSS窗口界面 常用工具按钮:在窗口显示的第三行上,有:打开文档,保存文档,打印,对话检索,取消当前操作,重做操作,转到图形窗口,指向记录,指定变量操作,查找,在当前记录的上方插入新的空白记录,在当前变量的左边插入新的空白变量,切分文件,设置权重单元,标记单元,显示价值标签。 数据单元格信息显示栏:在编辑显示区的上方,左边显示单元格和变量名(单元格:变量名),右边显示单元里的内容。 编辑显示区:在窗口的中部,最左边列显示单元序列号,最上边一行显示变量名称,缺省为“Var”。 编辑区选择栏:在编辑显示区下方,Data View 在编辑显示区中显示编辑数据,Variable View在编辑显示区中显示编辑数据变量信息。 状态显示栏:在窗口的底部,左边显示执行的系统命令,右边显示窗口状态。 (2) 数据文件格式 数据文件格式以每一行为一个记录,或称观察单位(Cases),每一列为一个变量(Variable)。由于SPSS不同的统计分

SPSS数据初步整理须知

SPSS数据初步整理须知 对于问卷收集到的调查数据或通过其它方法,如眼动仪、脑电仪以及生理记录仪等获得的数据,在进入SPSS分析前最好对数据进行预处理,其作用:防止错误数据导致不恰当的推论。本次主要谈谈问卷数据在分析前的一些预处理工作。 数据预处理的步骤: 1. 对所有数据源的质量进行初步审核。 1.1 剔除无效答卷。如是问卷数据,可以查看被调查者的回答是否呈现某种规律,或者回答者不符合我们调查的人群,或者存在大量题目漏答现象。 1.2 检查是否有明显错误回答。如是否按指导语进行回答,基本信息是否有误。是否有明显的回答矛盾等等。 2. 对数据进行编码。 编码主要有事前编码和事后编码,事前编码主要针对封闭式问卷,而事后编码则主要是针对开放式问题。 编码有三个工作:第一是定义数据的变量名,第二定义变量名标签,即这个变量代表什么意思。第三定义变量值及值标签。即变量的取值,以及这个取值的含义。如变量名为sex,其变量标签为“性别”,其变量的取值为“1”或“2”,分别表示“男”和“女”(变量值标签)。 2 2.1 单选题的编码。第一定义变量名,一般用题目序号,如第6题,则变量名为Q6,其变量名标签一般用问题。而变量的取值则为单选题的选项。有几个选项就有几个变量值,而值的标签则是选项的内容。 2.2 多选题的编码。每一个选项就得作为一个新变量。如第7题是多选题,有五个选项,可多选三项。则五道选项分别定义变量名为Q71,……Q75,每个变量名的标签即这五道选项的内容。而变量值及标签为“0”或“1”,0表示未选,1表示选中。 2.3 排序题的编码。有两种方法:其一跟多选题类似。如第7题要求对所选的三个选项进行排序。变量名及标签同上。而变量值除了“0”(表示未选)外,还有“1”“2”“3”分别表示排序第一,排序第二,排序第三。其二根据要求选择三项进行排序,则只需要定义三个变量,Q71,Q72,Q73,变量名标签则表示排序第一,排序第二,排序第三。变量值为五道选项的序号,而变量值标签则分别是五道选项的内容。 2.4 开放题的编码。首先应将开放题中受试所填写的选项进行分类汇总。初次归类尽量归细一点。再做统计分析时如果觉得分类太细可以再次进行归大类。

spss缺失值处理

spss数据录入时缺失值怎么处理 录入的时候可以直接省略不录入 分析的时候也一般剔除这样的样本。但也有替换的方法,一般有: 均值替换法(mean imputation),即用其他个案中该变量观测值的平均数对缺失的数据进行替换,但这种方法会产生有偏估计,所以并不被推崇。 个别替换法(single imputation)通常也被叫做回归替换法(regression imputation),在该个案的其他变量值都是通过回归估计得到的情况下,这种 方法用缺失数据的条件期望值对它进行替换。这虽然是一个无偏估计,但是却倾向于低估标准差和其他未知性质的测量值,而且这一问题会随着缺失信息的增多而变得更加严重。 多重替代法(multiple imputation)(Rubin, 1977) 。 ?它从相似情况中或根据后来在可观测的数据上得到的缺省数据的分布情况给每个缺省数据赋予一个模拟值。结合这种方法,研究者可以比较容易地,在不舍弃任何数据的情况下对缺失数据的未知性质进行推断(Little and Rubin,1987; ubin,1987, 1996)。 (一)个案剔除法(Listwise Deletion) 最常见、最简单的处理缺失数据的方法是用个案剔除法(listwise deletion),也是很多统计软件(如SPSS和SAS)默认的缺失值处理方法。在这种方法中如果任何一个变量含有缺失数据的话,就把相对应的个案从分析中剔除。如果缺失值所占比例比较小的话,这一方法十分有效。至于具体多大的缺失比例算是“小”比例,专家们意见也存在较大的差距。有学者认为应在5%以下,也有学者认为20%以下即可。然而,这种方法却有很大的局限性。它是以减少样本量来换取信息的完备,会造成资源的大量浪费,丢弃了大量隐藏在这些对象中的信息。在样本量较小的情况下,删除少量对象就足以严重影响到数据的客观性和结果的正确性。因此,当缺失数据所占比例较大,特别是当缺数据非随机分布时,这种方法可能导致数据发生偏离,从而得出错误的结论。 (二)均值替换法(Mean Imputation) 在变量十分重要而所缺失的数据量又较为庞大的时候,个案剔除法就遇到了困难,因为许多有用的数据也同时被剔除。围绕着这一问题,研究者尝试了各种各样的办法。其中的一个方法是均值替换法(mean imputation)。我们将变量的属性分为数值型和非数值型来分别进行处理。如果缺失值是数值型的,就根据该变量在其他所有对象的取值的平均值来填充该缺失的变量值;如果缺失值是非数值型的,就根据统计学中的众数原理,用该变量在其他所有对象的取值次数最多的值来补齐该缺失的变量值。但这种方法会产生有偏估计,所以并不被推崇。均值替换法也是一种简便、快速的缺失数据处理方法。使用均值替换法插补缺失数据,对该变量的均值估计不会产生影响。但这种方法是建立在完全随机缺失(MCAR)的假设之上的,而且会造成变量的方差和标准差变小。 (三)热卡填充法(Hotdecking)

手把手教你怎么用SPSS分析数据

使用SPSS软件进行数据分析 文档通过自己论证属实。 【例子】以全国31个省市的8项经济指标为例,进行主成分分析。 第一步:录入或调入数据(图1)。 图1 原始数据(未经标准化) 第二步:打开“因子分析”对话框。 沿着主菜单的“Analyze→Data Reduction→Factor ”的路径(图2)打开因子分析选项框(图3)。

图2 打开因子分析对话框的路径 图3 因子分析选项框 第三步:选项设置。 首先,在源变量框中选中需要进行分析的变量,点击右边的箭头符号,将需要的变量调入变量(Variables)栏中(图3)。在本例中,全部8个变量都要用上,故全部调入(图4)。因无特殊需要,故不必理会“Value ”栏。下面逐项设置。 图4 将变量移到变量栏以后 ⒈设置Descriptives选项。 单击Descriptives按钮(图4),弹出Descriptives对话框(图5)。

图5 描述选项框 在Statistics 栏中选中Univariate descriptives 复选项,则输出结果中将会给出原始数据的抽样均值、方差和样本数目(这一栏结果可供检验参考);选中Initial solution 复选项,则会给出主成分载荷的公因子方差(这一栏数据分析时有用)。 在Correlation Matrix 栏中,选中Coefficients 复选项,则会给出原始变量的相关系数矩阵(分析时可参考);选中Determinant 复选项,则会给出相关系数矩阵的行列式,如果希望在Excel 中对某些计算过程进行了解,可选此项,否则用途不大。其它复选项一般不用,但在特殊情况下可以用到(本例不选)。 设置完成以后,单击Continue 按钮完成设置(图5)。 ⒉ 设置Extraction 选项。 打开Extraction 对话框(图6)。因子提取方法主要有7种,在Method 栏中可以看到,系统默认的提取方法是主成分(∏ρινχιπαλ χομπονεντσ),因此对此栏不作变动,就是认可了主成分分析方法。 在Analyze 栏中,选中Correlation matirx 复选项,则因子分析基于数据的相关系数矩阵进行分析;如果选中Covariance matrix 复选项,则因子分析基于数据的协方差矩阵进行分析。对于主成分分析而言,由于数据标准化了,这两个结果没有分别,因此任选其一即可。 在Display 栏中,选中Unrotated factor solution (非旋转因子解)复选项,则在分析结果中给出未经旋转的因子提取结果。对于主成分分析而言,这一项选择与否都一样;对于旋转因子分析,选择此项,可将旋转前后的结果同时给出,以便对比。 选中Scree Plot (“山麓”图),则在分析结果中给出特征根按大小分布的折线图(形如山麓截面,故得名),以便我们直观地判定因子的提取数量是否准确。 在Extract 栏中,有两种方法可以决定提取主成分(因子)的数目。一是根据特征根(Eigenvalues )的数值,系统默认的是1=c λ。我们知道,在主成分分析中,主成分得分的方差就是对应的特征根数值。如果默认1=c λ,则所有方差大于等于1的主成分将被保留,其余舍弃。如果觉得最后选取的主成分数量不足,可以将c λ值降低,例如取9.0=c λ;如果认为最后的提取的主成分数量偏多,则可以提高c λ值,例如取 1.1=c λ。主成分数目是否合适,要在进行一轮分析以后才能肯定。因此,特征根数值 的设定,要在反复试验以后才能决定。一般而言,在初次分析时,最好降低特征根的临

调查问卷的SPSS的基本处理方法

调查问卷的SPSS的基本处理方法(Z)SPSS是常用的数理统计软件之一,也可以用于调查问卷的统计分析,一下就调查问卷的一些基本分析处理方法做一些简单的描写。另外,虽然SPSS也有图表功能,但个人认为不是很好用,建议还是将统计分析的数据导到EXCEL中再作图表。 频度分析 频度就是某个选项出现的次数,一般用来描述单选项。 问卷设计实例: 企业经营规模为(年销售额:人民币): □>30亿□5~30亿□0.5~5亿□<0.5亿 数据记录要点: 单列记录,第几项选中记录数值几,例如选中“0.5~5亿”则记录3。 SPSS基本操作方法: 导入数据; Analyze……Descriptive statistics……Freq uencies 选入该列数据,“OK”。 多项频次分析 用来描述多选项目的频次。 问卷设计实例: 贵公司产品的主要竞争力表现在(多选): □外观□功能□质量□个性化□价格(成本)□交货期□其它 数据记录要点: 多列记录,有几个选项记几列,选中记为1,未选中记为0。例如如果选中了外观和质量,则多列的记录为1,0,1,0,0,0,0。 SPSS基本操作方法: 导入数据; Analyze……Multiple Response……Define Sets 选入该问题的多列数据,给新的集合变量取名(在Name那里填一个名字,例如“竞争力”),在Dichotomies Counted value中输入1,“Add”。 Analyze……Multiple Response……Frequencies 选人自定义的集合变量,“OK”。 交叉频次分析

用来描述变量之间的关联性,比如分析不同销售额企业的产品竞争力的关联关系(这两项之间不一定有关系,可以用logistic分析验证一下)。 问卷设计实例: 参见上面的两项。 数据记录要点: 参见上面两项。 SPSS基本操作方法(单选对单选,单选对多选,单选对多选在操作上略有不同): 导入数据;如果有多选项需要按2的方法定义集合变量。 如果是单选对单选 Analyze……Descriptive statistics……Crosstabs 否则: Analyze……Multiple Response……Crosstabs 将两变量分别选入行和列中(多选项是选人集合变量,如果是单选对多选还要设置单选项的最大最小值),“OK” 描述分析 一般用来描述单变量的描述统计量,这些述统计量有平均值、算术和、标准差,最大值、最小值、方差、范围和平均数标准误等。问卷中用得不是特别多。 问卷设计实例(一般是开放性问题): 贵企业三维CAD已经应用了年。 数据记录要点: 单列记录,直接记录所填数据。 SPSS基本操作方法: 导入数据; Analyze……Descriptive statistics……Descriptives 选入该列数据,“Options…”,在其中选择需要的统计项目,问卷常用的项目有Mean(平均值)、Minimum( 最小值)、Maximum(最大值)等,“Continue”, “OK”。

常用SPSS数据处理方法

常用SPSS数据处理方法,你都会吗? 数据编辑处理是在统计和分析数据时,第一步要做的。尤其是当面对大量数据时,数据处理是一个重要的过程,可以达到提高处理效率及精度的目的。 为配合进行更好的分析,研究过程过可能涉及到以下数据处理工作: 1、定义变量名 2、制定数据标签 3、数据编码 4、计算变量 5、无效样本处理 6、特殊值处理等 定义变量 定义变量,就是给每个指标起名字。每个变量都需要有对应的变量名,以便得到更规范的表格呈现和操作体验,spssau中通过“标题修改”定义变量名,一般用于以下情况: ●上传数据后,对不规范标题修改 ●完成数据编码后,进行标题修改 ●完成生成变量后,进行标题修改 ●有多余无意义的标题,进行删除标题(一次只能删除一个标题)

数据标签 除了标题名需要定义,数据标签也是一个重要的属性。数据标签用于标识数据中的数字代表的意义,对数据的含义进行解释说明,比如用1表示男,用2表示女。数据标签仅影响表格展示,完全不影响分析结果。 数据编码 量表问卷中经常会使用到反向计分,反项题得到数据在分析以前,要先进行重新编码。

数据编码通常除了用于处理反项题,还会用于数据组合。 比如1代表高中,2代表大专,3代表本科,4代表硕士,5代表博士。希望组合成三组分别是:本科以下,本科,硕士及以上.则可处理为:1->1,2->1,3->2,4->3,5->3,最终数字1代表本科以下,2代表本科,3代表硕士及以上 无效样本 在数据分析之前,首先需要进行数据查看,包括数据中是否有异常值,无效样本等。如果有无效样本则需要进行处理,然后再进行分析。另外如果数据中有异常值也需要进行处理后再进行分析。无效样本会干扰分析研究,扭曲数据结论等,因而在分析前先对无效样本进行标识显示尤其必要。 如果数据来源为问卷,则很可能出现无效样本,因为填写问卷的样本是否真实填写无从判定;如果数据库下载或者使用二手数据等,也可能出现大量缺失数据等无效样本。

调查问卷数据SPSS分析中—多项选择问题处理方法

SPSS多项选择问题处理方法 多项选择题是定量问卷调查中常见的封闭式选择题,这种选择题的出现可以在确定的范围内更多的考察被调研对象的看法。在针对消费者的调研中,这种选择题多是出现在针对品牌知名度,包括提示前知名度、第一提及率,提示后知名度的分析中。 ?常见的分析方法 一般的研究分析手段主要应用包括EXCEL与SPSS在内的频次分析,然后再将在不同数据字段同一类选项数据进行加总,然后再以被调研对象的总体数量为基数,二者相除来得到多项选择题中各选项在总体中的占有率,这种各选项占有率的加总大于1。 例如某类产品品牌知名度调查中,关于该类产品您能想起哪些品牌? 01 品牌A 02品牌B 03品牌C 04品牌D 05品牌E 06品牌F 07其它品牌_____ 该问题在数据字段设计时最少要设计10个字段以供数据录入与分析。按上面的数据分析方法,先在这10个字段中进行分别的频次计算,然后进行加总再除以总基数,得到该选项的总体占有比率。以A选项为例: (01字段中A的占有率+02字段中A的占有率+ …… +06字段中A的占有率)/被调对象总数=A的占有率以此类推分别计算出其它品牌的占有率,频次计算次数与分类加和计算次数比较繁杂,其工作量在被选项较少时还算省事,但当被选项数量在十几个、二十几个甚至三十几个时,该分析方法则极大降低了分析人员的工作效率。 ?高效率数据分析方法 运用SPSS重组再分析的数据方法将极大提高数据分析效率并降低人为计算失误。 在SPSS数据库中运用 “Multiple Response”对多组数据进行组合再定义,这样会针对每个单一选择题定义出一个新的字段组,在新字段组中对变量区间进行定义,再针对新字段组进行频次分析。当完成单一字段设置后,可运用程序段对其它多项选择题进行再利用分析,这样可以大大提高多项选择题数据分析效率。 分析程序例举: ************** MULT RESPONSE GROUPS=$tsh '新字段组名称' (var00018 var00019 var00020 var00021 var00022 var00013 var00014 var00015 var00016 var00017 (1,111))

SPSS数据处理过程

《基于西北物流企业对物流组织网络化程度与企业顾客产出水平分 析》之样本数据处理报告 (数据来源: "物流组织网络化程度"、“服务质量”、“顾客满意度”、“顾客忠诚度”的指标变量采用随机数生成int(rand()*6+1)“物流服务成本”随机数生成方式为int(rand()*9+1),设定结果为上市公司25个,115个为未上市公司) 一、数据定量化 本人构造的模型,其中潜变量主要有五个:物流组织网络化程度、物流服务成本、服务质量、顾客满意度与顾客忠诚度。指标变量有15个,其中作为潜变量的指标14个,还有一个是“上市情况”主要是衡量公司规模情况。由于该指标为定类变量,需要进行虚拟化,虚拟化采用if语句进行转化形成“上市情况虚拟”变量,最终产生对检验有用的变量是15个。说明哪些变量需要转化为定量变量,以及转化后产生了那几个变量 二、缺失值及奇异值处理 由于数据是由随机数产生故缺失值,没有发现(处理缺失值的方法打算采用均值替代法,因 为在处理奇异值时,我采用的方法是将X不在()范围内的删除,然后全部用均 值替代)。通过分析---描述统计------探索,将所有变量导入因变量列表(版本与实验室不同),最终形成箱形图,

奇异值判定表2-1 “物流组织网络化程度4”与“物流组织网络化程度2”中数据“6”超过上限,所以应该删去。 文字描述、箱形图,处理办法,产生的新的变量 三、测量的信度、效度、共同方法偏差 1.信度分析: 步骤:分析-----度量------可靠性分析,将处理过缺失值的新数据中“物流组织网络化程度1~4”放入项目中,确定后生成数据Cronbach系数α1;同理可处理“服务质量1~3”、“顾客满意 克朗巴哈系数表3-1.1 由于各潜变量的信度都是很好的,所以整个测量的信度是可接受的。 2.效度分析: 步骤:分析---降维----因子分析,将处理过缺失值的新数据中“物流组织网络化程度1~4”放入“变量”中,确定后生成数据,形成各个因子载荷;同理可处理“服务质量1~3”、“顾客 值 因子载荷表3-2.1 由于物流组织网络化程度4的因子载荷较小,所以不能充分反应潜变量。从spss中删除“物流组织网络话程度4”题项。重新操作“物流组织网络化1~3”的因子载荷,整理得到下表 值 因子载荷表3-2.2

相关主题
相关文档 最新文档