当前位置:文档之家› 多选题与排序题的SPSS处理

多选题与排序题的SPSS处理

多选题与排序题的SPSS处理
多选题与排序题的SPSS处理

多选题与排序题的SPSS处理

————————————————————————————————作者:————————————————————————————————日期:

?

多选题和排序题的SPSS处理

在问卷设计中,常见的题型包括单选题、多选题、排序题和问答题。其中单选题是最常见的题型,实践中可通过频数统计, 箱型图及各种高级统计方法对其进行分析,流行的统计软件SPSS 中也包含多个用于处理单选题的模块。问答题作为主观题,通常不进行编码和统计分析,只作为定性研究来处理。多选题和排序题是两种常见的题型,多选题的优势是它可以广泛的搜集被访者的态度信息,探索不同人群的态度组合,为进一步编制或修订量表提供依据。排序题可以同时测查被访者对多个选项的态度倾向。SPSS中虽然有处理多选题的模块“Multiple Response”,但是其功能相对简单,只能对多选题进行一般的频数统计和

列联表分析。有些学者对多选题的数据编码提出了改进方法,提高了数据录入转换的效率,但是对多选题如何进行分析处理研究得不够深入。以下内容将讨论多选题和排序题的分类,以及如何在SPSS 中实现它们的编码和分析过程。

一、多选题的处理方法

多选题可分为不定项多选题和定项多选题,它们有不同的编码和处理方式。

1.不定项多选题

这是最常见的多选题方式, 即一道题目有多个选项,每个选项都可以勾选或者不选。

例1:你在选购电子产品时,会考虑以下哪些因素:

A价格 B 性能C质量D保修 E 外观F品牌

编码:对于这种题型,通常的采用“0-1”编码进行处理,即为每个选项单独设立一个变量,本例可设定a1_1,a1_2 到a1_6 共6 个变量,它们代表从A、B 到F共6个备选选项。如果被试的选择为ABD,则在a1_1,a1_2和a1_4中输入1,其他变量输入0。其他学者也提出了用某些函数或编程方法快速实现数据的录入,但最终都要转换为“0-1”编码的形式。

分析:完成编码后,使用SPSS中的Analyse———MultipleResponse 命令, 再通过Define Sets 来将多个选项合并定义为一个多选题,如例1 中可将6 个变量共同定义为$a1。然后选择Analyse———Multiple Response———Frequencies可对多选题进行频数统计,选择Analyse———MultipleResponse———Crosstables 可进行交叉列联表分析。

2.定项多择题

与不定多选择题相比,唯一区别是固定了要选出的答案个数。

例2:你认为在选购电子产品时,最重要的3 个影响因素是什么?

1(A) 2(B) 3(D)

A 价格B性能 C 质量D保修E外观 F 品牌

编码:将题目中的3 个括号定义为3个变量,如a2n1,a2n2 和a2n3,他们代表最终选出的3 个答案。6 个备选项也要重新编码,如1、2、3、4、5、6 分别代表A、B、C、D、E、F。如果被试的选择为ABD,则在a2n1, a2n2 和a2n3分别输入1、2和4。图1 显示的是7 个被试答题后的编码情况。

图1 定项多选题案例数据

分析:完成编码后,使用SPSS 中的Analyse———MultipleResponse 命令,再通过Def ine Sets 将a2n1,a2n2 和a2n3共同定义为$a2,在编码方式(Variable are coded as)中选择分类编码(Categories),类别从1 到5。然后选择Analyse———Multiple Response———Frequencies 可对多选题进行频数统计。结果如图2 所示:

图2 定项多选题案例处理结果

小结:例1所用的处理方法,其思路是先定选项,后记次数;例2 的处理方法,其思路是先定次序,后填选项。前者是多选题通用的处理方式,包括不定项多选题、定项多选题,甚至一些不常用的限定条件的多选题(如规定答案不能超过3项)等;后者是针对定项选择题的一种特殊的分析方法,具有简便高效的特点,但是通常不适用于其他题型。

二、排序题的处理方法

1.排序题要求将若干选项按照一定的标准依次排列,可测查被试群体的态度倾向

例3:下列是选购电子产品时需要考虑的若干因素,请按照重要性对他们进行排序。

A 价格

B 性能

C 质量

D 保修E外观 F 品牌

(③) (⑤) (①) (②) (④) (⑥)

编码:将题目中的6个选项定义为6 个变量, 如a3_1,a3_2 到a3_6, 它们代表从A、B 到F 共6 个备选选项。如果某个被试在题中括号内填写的结果为“3,5,1,2,4,6”,即他认为从重要到不重要的次序是:质量、外观、价格、性能、保修、品牌。那么在编码处理时,应将3、5、1、2、4、6依次填入a3_1,a3_2 到a3_6 的6 个变量中。

首先根据各个次序的重要性(权重)对数据进行二次编码,例如次序1、2、3、4、5、6的重要性依次是10、7、5、2、1,0, 则选择SPSS 中的Transform———Recode into Same

Variables 命令,将所有变量选入Variables 对话框,点击Ole and New values,

将1 填入旧数值,将10 填入新数值,表示排名第一的选项具有10个单位的重要性,准备对“1-10”这一组编码的转换。然后单击Add 健继续对余下的“2-7”、“3-5”、“4-2”、“5-1”、“6-0”五组编码进行输入,单击Continue———Ok可一并完成各组的转换过程。

图3 排序题案例数据

经过二次编码后,选择Date———Transpose 命令,对全部数据进行行列转换。再选择Transform———ComputeVariables 命令,定义新变量Sum=sum(Var001 t o Var007),

即可求出各个备选选项的重要性排序。结果如图4 所示:

图4 排序题计算结果

结果显示:各选项的重要性排序为:BACDEF。

2.选择排序题

这种题型结合了多选题和排序题的优点,先从若干备选选项中提取出若干个最重要的选项,然后再进行排序。与多选题相比,在答案中增加了顺序信息,因此内容更丰富。

例4:你认为在选购电子产品时,最重要的3 个影响因素是什么?请选出并按重要性对它们进行排序:

A 价格B性能C 质量

D 保修E外观F品牌

第1 位(C)第2位(D) 第3 位(A)

编码:与例3 的方式很相似,但由于未被选择的题项无法参加排序,因此对它们要进行一些处理。将题目中的6 个选项定义为6个变量,如a4_1,a4_2 到a4_6,它们代表从A、B 到F共6 个备选选项。如果某个被试的排序的结果为C、D、A,即依次选出的最重要3 个因素是:质量、保修、价格。那么在编码处理时,应将3、0、1、2、0、0 依次填入a3_1,a3_2 到a3_6 的6 个变量中。也就是说:对于被选中并排序的选项,在它对应的变量里面填它的次序;对

于未被选中的选项,在它对应的变量里面填0。实际上,本例中答案选择的结果可表示为

另一种更直观的形式,它类似于例3 的样子。

例4:你认为在选购电子产品时,最重要的3 个影响因素是什么?请选出并按重要性对它们进行排序:

A 价格

B 性能

C 质量

D 保修

E 外观

F 品牌

(③)( )(①) (②)()()

分析:方法与例3相同,只是未被选中的选项将不参与二次编码,因为在排序重要性计算中,它们的权重为0。

排序题和选择排序题分析思路基本相同:先定选项,后定次序,最后通过编码将次序转化为权重。

在社会调查问卷设计过程中,经常会遇到对相似状况或者原因的排序问题,而这方面问题的处理相对困难也一直是这类题型不能广泛运用的重要原因。但是,毋庸置疑,这类题型的应用无论对相似社会现象的分析,还是对原因的分析,抑或对市场调查中的满意度研究分析都非常重要。

一、问题的提出

假定消费者在购买电视的时候,经常会考虑很多因素,比如:价格、质量、品牌、样式、颜色、型号、功能等,假如有90%的消费者对“价格”敏感,50%的消费者要考虑质量,我们会不会得出这样的结论:消费者在购买彩电的过程中,价格因素重于质量因素呢?不一定,因为我们并不知道人们“先”考虑什么,也不知道人们在价格和质量之间考虑的权重大小,更无法将所有因素对比在同一个平面维度上,因为有几个因素,就说明人们在考虑同一个问题的时候有多少维空间。就象在对比顺位的题型中,假定消费者甲认为价格比质量重要,品牌比价格重要,我们不能直接运用形式逻辑的规则得出:品牌比质量重要一样。因为每两个因素的对比都是在一个独立的语义空间下的,跨语义空间的对比在社会生活中没有绝对的含义,只有相对的含义,这就是为什么形式逻辑的推理在社会生活中不能随便运用的原因。

从理论上讲,排序题就是将不同语义空间下的概念放置于一个对比空间中进行的分析。有些学者认为对各个因素分别进行重要性的评价,就可以将人们考虑问题的顺序排列出来。我认为这种思路是错误的。比如我们设计的题型是:

例1:如下购买彩电的因素,您认为它们的重要程度是:

很重要比较重要一般不太重要不重要

价格1 2 3 4 5

质量 1 23 4 5

品牌 1 23 4 5 样式 1 2 3 4 5

颜色 1 2 3 4 5

型号123 4 5

功能 1 2 3 4 5 在这种设计的基础上得到的数据,不能直接进行顺序排列,因为这是在七个语义空间下进行的,概念之间的对比没有任何实际意义,同一个人可以将几个概念同时列为“很重要”,我们不能断定其对比意义,用平均人的概念对整体答案取均值更无法产生顺序。因为由部分(个人)可以推及总体(整体),但是产生的整体却无法再还原为部分的时候增加内容(顺序)。顺序只是在同一语境下才能产生出来。不能用整体指标的扩展来推断部分的意义顺序,即不能用没有个体顺序意义的问题结果来推断个体的行为顺序。也就是说,假定上述问题调查结

果的均值分别为:

价格1.2、质量1.3、品牌1.25、样式3.1、颜色2.9、型号1.57、功能1.6。

我们不能得到人们在购买彩电时考虑的因素的顺序是:价格、品牌、质量、型号、功能、颜色、样式。如果这样就会得到错误的结论。

二、顺序问题的设计

在“关于问卷的题型设计”一文中,笔者总结了六种与顺序有关的题型,在实际应用过程中,“排序题”和“重要程度顺位排序”两种题型最重要,也对顺序问题最有效。还是应用上面的例子,排序题的设计是:

例2:如下因素,在购买彩电时,您认为:

(1)价格(2)质量(3)品牌(4)样式(5)颜色(6)型号(7)功能

A最重要的因素是:( )

B第二重要的因素是:()

C第三重要的因素是:()

应用重要程度顺位排序方法进行的设计是:

例3:如下因素,在购买彩电时,您认为:

(1)价格(2)质量(3)品牌(4)样式(5)颜色(6)型号(7)功能

A最重要的因素是:()

B比较重要的因素是:( )()(限选两项)

C不太重要的因素是:()( )(限选两项)

D最不重要的因素是:( )

这两种设计在方法上都是在个体同一个语义空间下收集的资料,在对个体调查的过程中,让个体考虑了顺序的问题,因此得到的资料在整体化(统计分析)后,可以推断个体考虑的总顺序,具有“整体”还原“部分”行为顺序的性质。

三、顺序问题的分析方法

有关顺序问题的分析方法在原理上非常简单,就是采用加权的方法进行分析,对于排序题,权重已经基本达成共识,就是对最重要的因素取“3”作为权重,第二重要的取“2”作为权重,第三重要的取“1”作为权重。如上例,假定人们认为价格最重要的比例为25%,认为第二重要的为20%,认为第三重要的为10%,那么价格因素的重要程度及顺序指数为:(25%*3+20%*2+10%*1)/(3+2+1)

这个顺序指数的取值范围在三项排序中介于0-0.5之间,五项排序介于0-0.33之间。

由于人们在分析问题时不习惯于对0-0.5之间的数值进行分析,同时又由于在此类顺序问题中不可能将同一个答案同时放在多个顺序中(对于一个被访者来将,不能将价格同时放在第一、第二、第三重要三个变量或者两个变量上),所以可以用最大权重值作为分母,这就使得顺序指数介于0-1之间了。所以,笔者推荐这种加权方式。如上例,价格因素的顺序指数就可以变为:

(25%*3+20%*2+10%*1)/3

对于重要程度顺位排序题的处理,由于这种题型一直以来受到技术分析困难的困扰,所以没有一个对权重的共识。经过多年对此类问题处理的经验,我认为对最重要的因素取“2”,对比较重要的因素取“1”,对不太重要的因素取“-1”,对最不重要的因素取“-2”,这个权重系列简单、明确。还是如上例,假定人们认为价格最重要的比例为25%,认为比较重要的为20%,认为不太重要的为10%,最不重要的为5%,那么价格因素的重要程度及顺序指数为:

25%*2+20%*1-10%*2-5%*1

这个顺序指数的取值范围由于不存在分母,所以这个指数的取值范围介于“-2”-“2”

之间,以“0”为中间值。

四、顺序问题分析的困难和在SPSS等统计软件下的处理方法

顺序问题的分析在原理上很简单,但是由于无论排序题,还是重要程度顺位填空题都是依据最后计算出来的比例再进行加工处理的,一般情况下在原始数据文件中都不能计算,所以在实际应用过程中,有些人只能计算总体的顺序,而不可能计算各种人群的顺序,比如:不同年龄的、不同性别、不同职业、不同收入的顺序等。更有一些人只依据最重要的因素进行交互分析,从而损失了许多信息。

通过两年的研究,找到了一种在统计软件的原始数据状态进行直接处理的方法,其主要思想就是通过多重数据转换来生成新变量。

这种转换的方法首先就是要理解“0”、“1”编码的性质,如果变量是通过“0”、“1”编码进行的录入,那么这个变量的均值乘以100就是人们选择“1”答案的比例。

同时我们还要理解,一个变量值只有“2”和“0”两个答案时,其均值等于2乘以同样排列“0”“1”变量的均值,同理,“3”“0”、“4”“0”、“5”“0”变量等都具有同样性质。

所以,在对顺序问题进行转换时,首先要将变量转换成“0”“1”变量。如“例2”的设计,假定10个样本的答案分别是:

V1V2 V3(原始变量名)

2 51(原始答案数值)

3 4 7(原始答案数值)

2 65(原始答案数值)

7 6 2(原始答案数值)

5 2 3(原始答案数值)

1 3 5(原始答案数值)

345(原始答案数值)

1 64(原始答案数值)

5 1 6(原始答案数值)

6 57(原始答案数值)

第一步:用RECODE命令将上述答案转换成“0”“1”变量,即:

recode v1v2 v3(1=1)(else=0) intov101 v102v103.

由价格因素而转换成的三变量,分别代表价格第一重要,第二重要,第三重要的“0”“1”变量;

recode v1v2v3 (2=1)(else=0)into v201 v202 v203.

由质量因素而转换成的三变量,分别代表质量第一重要,第二重要,第三重要的“0”“1”变量;

recode v1v2v3 (3=1) (else=0) intov301 v302 v303.

由品牌因素而转换成的三变量,分别代表品牌第一重要,第二重要,第三重要的“0”“1”变量;

recodev1v2v3 (4=1)(else=0) into v401 v402 v403.

由样式因素而转换成的三变量,分别代表样式第一重要,第二重要,第三重要的“0”“1”变量;

recodev1 v2 v3 (5=1) (else=0) into v501v502 v503.

由颜色因素而转换成的三变量,分别代表颜色第一重要,第二重要,第三重要的“0”“1”变量;

recodev1v2v3 (6=1) (else=0)into v601v602v603.

由型号因素而转换成的三变量,分别代表型号第一重要,第二重要,第三重要的“0”“1”

变量;

recode v1v2v3 (7=1)(else=0)into v701 v702 v703.

由功能因素而转换成的三变量,分别代表功能第一重要,第二重要,第三重要的“0”“1”变量;

第二步:用COMPUTE命令创造每个因素的顺序变量。以价格为例:

COMPUREV价格=(V101*3+V102*2+V103*1)/3.

这个变量的答案有四个:

“0”代表认为价格不是前三个重要因素;

“3/3”代表样本认为价格第一重要;

“2/3”代表样本认为价格第二重要;

“1/3”代表样本认为价格第三重要;

由于同一个因素不能同时存在于V101、V102、V103变量中,所以,上述公式也可以写成:

V价格=V101*3/3+V102*2/3+V103*1/3

其均值可以写成:

E(V价格)=E(V101)*3/3+E(V102)*2/3+E(V103*1/3)

=(E(V101)*3+E(V102)*2+E(V103*1))/3

由于E(V101)=P101(V101变量值为“1”的比例,即被访者认为此因素第一重要的比例。同理V102、V103)

所以:

E(V价格)=(P101*3+P102*2+P103*1)/3

也就是说,新合成的价格因素的顺序变量的均值就是价格因素的顺序指数。然后我们用COMPARE MEAN命令可以计算交互的顺序结果。

对重要程度顺位填空题题型的处理方法,我们可以运用同样的思路,只是在限制性多选题(例3的B、C两题)多一个层次,用COUNT命令就可以了,这里不再累述。

spss_期末试题库

一、单项选择题(共112小题) 1、SPSS的安装类型有()D.以上都是 2、数据编辑窗口的主要功能有() D.A和B 3、()文件格式是SPSS独有的,一般无法通过Word,Excel等其他软件打开。A.sav 4、()是SPSS为用户提供的基本运行方式。D.以上都是 5、()是SPSS中有可用的基本数据类型 D.以上都是 6、spss数据文件的扩展名是( ) D..sav 7、数据编辑窗口中的一行称为一个()B.个案 8、变量的起名规则一般:变量名的字符个数不多于()C. 8 9、统计学依据数据的计量尺度将数据划分为三大类,它不包括() A. 定值型数据 10、在横向合并数据文件时,两个数据文件都必须事先按关键变量值() A.升序排序 11、SPSS算术表达式中,字符型()应该用引号引起来。A 常量 12、复合条件表达式又称逻辑表达式,在逻辑运算中,下列()运算最优先。 A.NOT 13、数据选取的方法中,()是按符合条件的数据进行选取。A 按指定条件选取 14、通过()可以达到将数据编辑窗口中的技术数据还原为原始数据的目的. B 加权处理 15、SPSS的()就是将数据编辑窗口中数据的行列互换 A 数据转置 16、SPSS软件是20世纪60年代末,由()大学的三位研究生最早研制开发的。B、斯坦福大学 17、SPSS中进行参数检验应选择()主窗口菜单。D、分析 18、SPSS中进行输出结果的保存应选择()主窗口菜单。A、视图 19、SPSS中进行数据的排序应选择()主窗口菜单。C、数据 20、SPSS中绘制散点图应选择()主窗口菜单。C、图形 21、SPSS中生成新变量应选择()主窗口菜单。A、转换 22、SPSS中聚类分析应选择()主窗口菜单。D、分析 23、()的功能是定义SPSS数据的结构、录入编辑和管理待分析的数据。 A.数据编辑窗口 24、()的功能是显示管理SPSS统计分析结果、报表及图形。 B.结果输出窗口 25、Spss输出结果保存时的文件扩展名是()B..spv 26、()是访问和分析Spss变量的唯一标识。B.变量名

【精品】(最新)多选题数据的SPSS多重对应分析操作方法

多选题数据的SPSS多重对应分析操作方法 出处:江苏通灵翠钻有限公司发布日期:2008年04月17日10:18 多选题又称多重应答(Multiple Response),即针对同一个问题被访者可能回答出多个有效的答案,它是市场调查研究中十分常见的数据形式。对多选题数据的分析除了使用SPSS 中的“Multiple Response”命令进行频数分析和交叉分析之外,还可以使用“Data Reduction”命令中的“Optimal Scaling”(最优尺度分析)进行多重对应分析,用以挖掘该数据与其他若干个变量之间的相互关系。 一、多选题数据在SPSS中的录入方式 SPSS软件中对于多选题答案的标准纪录方式有两种:(1)多重二分法(Multiple dichotomy method)即把本道多选题的每个候选答案均看作一个变量Variable来定义,0代表没有被选中,1代表被选中。(2)多重分类法(Multiple category method)即根据被访者可能提供的答案数量来设置相应个数的变量Variable(假设被访者最多只能选择n个不同答案,则在SPSS中设置n个变量用以录入本道多选题数据)。 实际操作中我们基本都会采用第二种数据录入方式,因为大多数被访者只会选择相对少数几个候选答案作为自己所提交的答案,如果我们采用第一种录入方式就显得繁琐,输入数据时也容易出错,尤其是当样本量增大时,不利于提高工作效率。 二、案例介绍 某次市场调研项目中向被访者收集以下数据,A1题为多选题,把上述数据以第二种方式录入进SPSS软件中,其中设置a101、a102、a103三个变量用来录入多选题A1,并定义好相应的变量值标签(Values)如图1。 三、多选题两种数据录入格式的转换 由于只有第一种数据录入方式才是符合统计分析原则的数据排列格式,能够直接进行后续的

spss统计分析报告期末考精彩试题

《统计分析软件》试(题)卷 班级xxx班xxx 学号xxx 说明:1.本试卷分析结果写在每个题目下面(即所留空白处); 2.考试时间为100分钟; 3.每个试题20分。 一、(20分)已经给出某个班的学生基本情况及其学习成绩的两个SPSS数据文件,学生成绩一.sav;学生成绩二.sav。要求: (1)将所给的两个SPSS数据文件“学生成绩一.sav”与“学生成绩二.sav”合并,并保存为“成绩.sav.” (2)对所建立的数据文件“成绩.sav”进行以下处理: 1)按照性别求出男、女数学成绩的各种统计量(包括平均成绩、标准差等)。 2)计算每个学生的总成绩、并按照总成绩的大小进行排序 3)把数学成绩分成优、良、中三个等级,规则为优(X≥85),良(75≤X≤84),中(X≤74),并对优良中的人数进行统计。

分析: (2) 描述统计量 性别N 极小值极大值均值标准差 男数学 4 77.00 85.00 82.2500 3.77492 有效的N (列表状态) 4 女数学16 67.00 90.00 78.5000 7.09930 有效的N (列表状态)16

注:成绩优良表示栏位sxcj 优为1 良为2 中为3 由表统计得,成绩为优的同学有4人,占总人数的20%;良的同学有12人,占总人数的60%;中的同学有4人,占总人数的40%。 二、(20分)为了解笔记本电脑的市场情况,针对笔记本电脑的3种品牌,进行了满意度调查,随机访问了30位消费者,让他们选出自己满意的品牌,调查结果见下表,其中变量“职业”的取值中,1表示文秘人员,2表示管理人员,3表示工程师,4表示其他人;3个品牌变量的取值中,1表示选择,0表示未选数据见Excel 数据文件“调查.exe”。根据所给数据完成以下问题 (1)将所给数据的Excel文件导入到SPSS中,要求SPSS数据文件写出数据结构(包括变量名,变量类型,变量值标签等)命,并保存为:“调查. Sav”。 (2)试利用多选项分析,利用频数分析来分析消费者对不同品牌电脑的满意度状况;分析不同职业消费者对笔记本品牌满意度状况。

spss多选题录入与分析

spss多选题录入与分析1 -----不限定选择项的录入及分析 2011-03-12 20:57 在市场调查和社会学调查等问卷设计过程中,通常会设计各种多选题,甚至排序而这些多选题或排序题又是必不可少的,因此就需要对各种多选题、排序题进行录入和入和分析为例,来讨论下多选题和排序题的录入及分析。 1多选题的录入和分析 分析时,由于var001-var005是一个多选题的答案,因此需要先进行多重响应设计,

如下所示 或者在“分析”---“表”----“多响应集”中,如下所示 两者弹出的窗口相差不大,我们以第一种“定义变量集”来进行,点击之后,弹出 在“设置定义”对话框会列出所有的需要设置的变量,其中包括多选题的变量,将移入右边“集合中的变量”,然后下方的“将变量编码为”“二分法”,计数值输入“1的频率,然后名称中输入该多选题的题目名称之后,“添加”到“多响应集”,点击定义好之后,再点击“多重响应”,可以看到,多出两个菜单选项,如下所示

spss数据处理结构分析

公司的行政人员认为自己与市场部的人员和研发部的人员差异太大;公司总经理则认 为行政人员的综合技能、教育背景与市场部人员和研发部人员也存在明显差异,行政 人员如何通过统计方法证实自己的结论?请构造相关数据,选择合适的统计方法进行 统计验证,并对统计结果进行分析和说明 (1)本例中职工按行政人员、市场人员、研发人员依次设为 合技能、教育背景和工资四个变量,采用单因素方差分析。 (2)SPSS 分析过程: 1、进入SPSS10.0,打开相关数据文件,选择“分析 均值检验 单因素方差分析”, 弹出单因素方差分析对话框,选择变量“职位”使其进入因子( F )框中,选择变量 “综合技能、教育背景、工资”使其进入因变量列表( D )框中。 I I L 対比紗… 两心做 凹?, Boatctrap(fl). ?定]岸陽曰]单? [取消J 、帮切J 2、单击两两比较按钮,选中假定方差齐性框中的 LSD (最小显著差法),同时选中 Equal 未假定方差齐性框中的 Tamhane 'T2。 趟羊吕秦AHOVA;两比较 | S | 佃疋性 1( L5D L) □ S-N-KO) Wall IF -Dune an □ 口出钾 1 . Sid^k 1 T ukey s-b f 豔跌別:最后一牛旧 丁 □ R-E-G-WF(RJ 匚 Hachboro s GT 2(H ) i_ R -E -G 川 a? Cdtorir!l?j) '鼻2 j c J' Oj > [着制 | ■] i — EWi — ■ fc" J ■■ r — 1 未供定方垄冇 1( T 创in 凸 T2(M) Dumcti'; T3O) Game3 Howsll Ai i Durnftit i CflJ) 盘眷tt 衣平Q : 0.05 | (W ]皿洁、劭耽| 3、单击选项按钮,选中描述性和方差同质性检验,其他使用系统默认设置 1、2、3,因此有职位、综 因干;F : 5麵

spss统计分析期末考试题

《统计分析软件》试(题)卷 班级 xxx班姓名 xxx 学号 xxx 说明:1.本试卷分析结果写在每个题目下面(即所留空白处); 2.考试时间为100分钟; 3.每个试题20分。 一、(20分)已经给出某个班的学生基本情况及其学习成绩的两个SPSS数据文件,学生成绩一.sav;学生成绩二.sav。要求: (1)将所给的两个SPSS数据文件“学生成绩一.sav”与“学生成绩二.sav”合并,并保存为“成绩.sav.” (2)对所建立的数据文件“成绩.sav”进行以下处理: 1)按照性别求出男、女数学成绩的各种统计量(包括平均成绩、标准差等)。 2)计算每个学生的总成绩、并按照总成绩的大小进行排序 3)把数学成绩分成优、良、中三个等级,规则为优(X≥85),良(75≤X ≤84),中(X≤74),并对优良中的人数进行统计。

分析: 描述统计量 性别N极小值极大值均值标准差 男数学477.0085.0082.2500 3.77492有效的 N (列表状态)4 女数学1667.0090.0078.50007.09930有效的 N (列表状态)16

注:成绩优良表示栏位sxcj 优为1 良为2 中为3 由表统计得,成绩为优的同学有4人,占总人数的20%;良的同学有12人,占总人数的60%;中的同学有4人,占总人数的40%。 二、(20分)为了解笔记本电脑的市场情况,针对笔记本电脑的3种品牌,进行了满意度调查,随机访问了30位消费者,让他们选出自己满意的品牌,调查结果见下表,其中变量“职业”的取值中,1表示文秘人员,2表示管理人员,3表示工程师,4表示其他人;3个品牌变量的取值中,1表示选择,0表示未选数据见Excel数据文件“调查.exe”。根据所给数据完成以下问题 (1)将所给数据的Excel文件导入到SPSS中,要求SPSS数据文件写出数据结构(包括变量名,变量类型,变量值标签等)命,并保存为:“调查. Sav”。 (2)试利用多选项分析,利用频数分析来分析消费者对不同品牌电脑的满意度状况;分析不同职业消费者对笔记本品牌满意度状况。 分析:

spss多选题的录入及分析

spss多选题录入与分析1 不限定选择项的录入及分析 在市场调查和社会学调查等问卷设计过程中,通常会设计各种多选题,甚至排序题,来进行信息的搜集,而这些多选题或排序题又是必不可少的,因此就需要对各种多选题、排序题进行录入和分析,在这里以spss的录入和分析为例,来讨论下多选题和排序题的录入及分析。 1多选题的录入和分析 多选题一般有三种情况,一种是任选几项,不限定选择项数;一种是限定最多选择几项,比如最多选择三项等;第三种也是是限定选择的项数,但与排序相结合,比如依次选择三项,最重要,其次重要,第三重要。 第一种情况:不限定选择项数时。 二分类方式的编码为0和1,即将每一个选项拆分为一个独立变量,如果选中的则录入1,没有选择的则录入为0.有多少个选项则拆分出多少个变量来,因此选项异常多的情况下此种方法有点麻烦。 例如下表所示:假设var001-var005是一个多选题的选项,共五项,让被访者任选,不限定,录入方式如下表,1表示被访者选中,0表示被访者未选的。

分析时,由于var001-var005是一个多选题的答案,因此需要先进行多重响应设计,在“分析”—“多重响应”如下所示 或者在“分析”---“表”----“多响应集”中,如下所示 两者弹出的窗口相差不大,我们以第一种“定义变量集”来进行,点击之后,弹出窗口如下

spss 期末题库

课程名称:《SPSS分析方法与应用》 课程号: 2007422 一、单项选择题(共112小题) 1、试题编号:1000110,答案:RetEncryption(D)。 SPSS的安装类型有() A. 典型安装 B.压缩安装 C.用户自定义安装 D.以上都是 2、试题编号:1000310,答案:RetEncryption(D)。 数据编辑窗口的主要功能有() A.定义SPSS数据的结构 B.录入编辑和管理待分析的数据 C.结果输出 和B 3、试题编号:1000410,答案:RetEncryption(A)。 ()文件格式是SPSS独有的,一般无法通过Word,Excel等其他软件打开。 4、试题编号:1000510,答案:RetEncryption(D)。 ()是SPSS为用户提供的基本运行方式。 A.完全窗口菜单方式 B.程序运行方式 C.混合运行方式 D.以上都是 5、试题编号:1000810,答案:RetEncryption(D)。 ()是SPSS中有可用的基本数据类型 A.数值型 B.字符型 C.日期型 D.以上都是 6、试题编号:1000910,答案:RetEncryption(D)。 spss数据文件的扩展名是( ) A..htm B..xls C..dat D..sav 7、试题编号:1001010,答案:RetEncryption(B)。 数据编辑窗口中的一行称为一个() A.变量 B.个案 C.属性 D.元组 8、试题编号:1001110,答案:RetEncryption(C)。

变量的起名规则一般:变量名的字符个数不多于() A. 6 B. 7 C. 8 D. 9 9、试题编号:1001210,答案:RetEncryption(A)。 统计学依据数据的计量尺度将数据划分为三大类,它不包括() A. 定值型数据 B.定距型数据 C.定序型数据 D.定类型数据 10、试题编号:1001310,答案:RetEncryption(A)。 在横向合并数据文件时,两个数据文件都必须事先按关键变量值() A.升序排序 B.降序排序 C.不排序 D.可升可降 11、试题编号:1001810,答案:RetEncryption(A)。 SPSS算术表达式中,字符型()应该用引号引起来。 A 常量 B变量 C算术运算符 D函数 12、试题编号:1001910,答案:RetEncryption(A)。 复合条件表达式又称逻辑表达式,在逻辑运算中,下列()运算最优先。 B AND C OR D都不是 13、试题编号:1002010,答案:RetEncryption(A)。 数据选取的方法中,()是按符合条件的数据进行选取。 A 按指定条件选取 B 随即选取 C选取某一区域内样本 D过滤变量选取 14、试题编号:1002110,答案:RetEncryption(B)。 通过()可以达到将数据编辑窗口中的技术数据还原为原始数据的目的。 A 数据转置 B 加权处理 C 数据才分 D以上都是 15、试题编号:1002210,答案:RetEncryption(A)。 SPSS的()就是将数据编辑窗口中数据的行列互换 A 数据转置 B 加权处理 C 数据才分 D以上不都是 16、试题编号:1002310,答案:RetEncryption(B)。 SPSS软件是20世纪60年代末,由()大学的三位研究生最早研制开发的。 A、哈佛大学 B、斯坦福大学 C、波士顿大学 D、剑桥大学 17、试题编号:1002710,答案:RetEncryption(D)。 SPSS中进行参数检验应选择()主窗口菜单。 A、视图 B、编辑 C、文件 D、分析 18、试题编号:1002810,答案:RetEncryption(A)。 SPSS中进行输出结果的保存应选择()主窗口菜单。 A、视图 B、编辑 C、文件 D、分析 19、试题编号:1002910,答案:RetEncryption(C)。 SPSS中进行数据的排序应选择()主窗口菜单。 A、视图 B、编辑 C、数据 D、分析

使用SPSS软件对多项选择题作卡方检验的方法

市场研究200510■■市场调研中经常遇到多项选择题的统计问题。本文选择如下例子,说明传统的统计方法,并提出卡方检验的方法。您挑选Mp3时考虑的因素有哪些(多选):(1)价格;(2)款式;(3)品牌;(4)购买 地点;(5)购场的环境与氛围;(6)个人情绪;(7)其他。 一直以来,这类题目使用SPSS软件的MultipleResponse进行统计分析,具体方法如下: 第一步:打开MultipleResponse对话框的DefineSets。第二步:将待设置的多项选择题变量(SetDefinition)选入变量设置框(VariablesinSet)。 第三步:根据输入变量的编码方式选择读码方式(VariablesAreCodedAs…)。本例子采用直接输入法(详见《市场研究》2005年5期拙作),分列读取后在类别变量的Range中填入“1-7” 。第四步:设置新变量名为“偏好”之后点击Add、Close即完成设置。 变量设置完成后,就可以作多项选择题的列联表分析了。本例 选择不同性别学生的消费偏好。打开MultipleResponse对话框中的Crosstabs,将性别点击进入Column框,并设置其Range为“1-2”,其中1表示男生,2表示女生;将MultipleResponse框中的“$偏好”点击进入Rows框。其他使用默认设置后点击“OK”即可。结果如下: 本例只选择了15份样本,其中男生7人,女生8人。表格中的数据表明,选择价格的男生有6人,女生有6人,共计12人次;选择款式的男生有5人,女生有7人,共计12人次,其他以此类推。 此后,建立新的数据文件,设置两个变量,变量名分别为“性别”与“偏好”。按照表1的数据,以此输入的数据,其中,性别中的1表示男生,2表示女生;偏好中的1表示价格,2表示款式,3表示品牌,4表示购买地点,5表示购场环境,6表示个人情绪,如下: 使用 SPSS 软 件对多项选择题作卡方检验的方法 "华中农业大学曾祥明任佳慧 表1多项选择题的一般结果(%baseoncase) Count 价格款式品牌 购买地点购场环境个人情绪 ColumnTotal 男 6571017(46.7%) 女 6763208(53.3%) RowTotal12(80.0%)12(80.0%)13(86.7%)4(26.7%)2(13.3%)1(6.7%)15(100.0) Percentsandtotalsbasedonrespondents;15validcases;0miss-ingcases 理论与方法 ! "

《spss统计软件》练习题库及答案

华中师范大学网络教育学院 《SPSS统计软件》练习题库及答案(本科) 一、选择题(选择类) (A)1、在数据中插入变量的操作要用到的菜单是: A Insert Variable; B Insert Case; C Go to Case; D Weight Cases (C)2、在原有变量上通过一定的计算产生新变量的操作所用到的菜单是: A Sort Cases; B Select Cases; C Compute; D Categorize Variables — (C)3、Transpose菜单的功能是: A 对数据进行分类汇总; B 对数据进行加权处理; C 对数据进行行列转置; D 按某变量分割数据 (A)4、用One-Way ANOVA进行大、中、小城市16岁男性青年平均身高的比较,结果给出sig.=,说明: A. 按照显著性水平,拒绝H0,说明三种城市的平均身高有差别; B. 三种城市身高没有差别的可能性是; C. 三种城市身高有差别的可能性是; 、 D. 说明城市不是身高的一个影响因素 (B)5、下面的例子可以用Paired-Samples T Test过程进行分析的是:A 家庭主妇和女大学生对同种商品喜好的差异; B 服用某种药物前后病情的改变情况; C 服用药物和没有服用药物的病人身体状况的差异; D性别和年龄对雇员薪水的影响 二、填空题(填空类) 6、Merge Files菜单用于合并数据库有两种情况:如果两数据库变量相同,是_观测对象__的合并;如果不同,则是_变量__的合并。 7、用于对计数资料和有序分类资料进行统计描述和简单的统计推断,在分析时可以产生二维或多维列联表,在统计推断时能进行卡方检验的菜单是_ Crosstabs __。 % 8、One-Samples T Test过程用于进行样本所在总体均数___与__已知总体均数_的比较。 三、名词解释(问答类) 9、Repeated Measures:重复测量的方差分析,指的是一个因变量被重复测量好几次,从而同一个个体的几次观察结果间存在相关,这样就不满足普通分析的要求,需要用重复测量的方差分析模型来解决。 10、Chi-Square test:卡方检验,它是非参数检验的一种方法,来检验变量的几个取值所占百分比是否和我们期望的比例没有统计学差异。比如我们在人群中抽取了一个样本,可以用该方法来分析四种血型所占的比例是否相同(都是25%),或者是否符合我们所给出的一个比例(如分别为10%、30%、40%和20%)。 四、简答题(问答类) 11、用SPSS对数据进行分析的基本流程是什么 答:(1)、将数据输入SPSS,并保存; { (2)、进行必要的预分析(分布图、均数标准差等的描述等),以确定应采用的检验方法; (3)、按题目要求进行统计分析; (4)、保存和导出分析结果。 12、对数据进行方差分析时,Univariate菜单和Multivariate菜单最大的区别是什么 答:当因变量只有一个时,使用Univariate菜单,当因变量不止一个时,使用Multivariate菜单。 13、简述SPSS打开其它格式数据的几种方法 答:(1)、直接打开:选择菜单File==>Open==>Data或直接单击快捷工具栏上的打开按钮; (2)、使用数据库查询打开:选择菜单File==>Open Database==>New Query,根据向导打开数据; (3)、使用文本向导读入文本文件:选择菜单File==>Read Text Data ) 14、指定数据按某个变量进行排序需要用到哪个菜单

SPSS多选题的数据录入方法

SPSS问卷分析之编码录入及描述统计详解 问卷调查的方法用得很广泛,第一步面临的就是问卷编码问题,有很多外专业的同学都在问这个问题,现在通过举例的方法详细讲解如下,以方便第一次接触SPSS的同学也能做简单的分析。后面还有分析时的操作步骤,以及比较适用的深入统计分析方法的简单介绍。自己写的,错误之处请指正. 调查分析问卷回收,在经过核实和清理后就要用SPSS做数据分析,首先的第一步就是把问题编码录入。 SPSS的问卷分析中一份问卷是一个案,首先要根据问卷问题的不同定义变量。定义变量值得注意的两点:一区分变量的度量,Measure的值,其中Scale是定量、Ordinal是定序、Nominal是指定类;二注意定义不同的数据类型Type 各色各样的问卷题目的类型大致可以分为单选、多选、排序、开放题目四种类型,他们的变量的定义和处理的方法各有不同,我们详细举例介绍如下: 1 单选题:答案只能有一个选项 例一当前贵组织机构是否设有面向组织的职业生涯规划系统? A有 B 正在开创 C 没有D曾经有过但已中断 编码:只定义一个变量,Value值1、2、3、4分别代表A、B、C、D 四个选项。 录入:录入选项对应值,如选C则录入3 2 多选题:答案可以有多个选项,其中又有项数不定多选和项数定多选。 (1)方法一(二分法): 例二贵处的职业生涯规划系统工作涵盖哪些组群?画钩时请把所有提示考虑在内。 A月薪员工B日薪员工C钟点工 编码:把每一个相应选项定义为一个变量,每一个变量Value值均如下定义:“0” 未选,“1” 选。

录入:被调查者选了的选项录入1、没选录入0,如选择被调查者选AC,则三个变量分别录入为1、0、1。 (2)方法二: 例三你认为开展保持党员先进性教育活动的最重要的目标是那三项: 1()2 ()3() A、提高党员素质 B、加强基层组织 C、坚持发扬** D、激发创业热情 E、服务人民群众 F、促进各项工作 编码:定义三个变量分别代表题目中的1、2、3三个括号,三个变量Value值均同样的以对应的选项定义,即:“1” A,“2” B,“3” C,“4” D,“5” E,“6” F 录入:录入的数值1、2、3、4、5、6分别代表选项ABCDEF,相应录入到每个括号对应的变量下。如被调查者三个括号分别选ACF,则在三个变量下分别录入1、3、6。 注:能用方法二编码的多选题也能用方法编码,但是项数不定的多选只能用二分法,即方法一是多选题一般处理方法。 3 排序题:对选项重要性进行排序 例四您购买商品时在①品牌②流行③质量④实用⑤价格中对它们的关注程度先后顺序是(请填代号重新排列)第一位第二位第三位第四位第五位 编码:定义五个变量,分别可以代表第一位第五位,每个变量的Value都做如下定义:“1” 品牌,“2” 流行,“3” 质量,“4” 实用,“5” 价格 录入:录入的数字1、2、3、4、5分别代表五个选项,如被调查者把质量排在第一位则在代表第一位的变量下输入“3“。 4 选择排序题: 例五把例三中的问题改为“你认为开展保持党员先进性教育活动的最重的目标是那三项,并按重要性从高到低排序”,选项不变。 编码:以ABCDEF6个选项分别对应定义6个变量,每个变量的Value都做同样的如下定义:“1” 未选,“2” 排第一,“3” 排第二,“4” 排第三。

Spss数据处理方法

Spss数据处理方法 1.打开软件,新建文件,双击变量一栏,出现一个表格,在名称一栏中依次填写指标名称 (只能是字母),输入后其他栏自动显示,小数点可调整到3,其他可不变;同时要输入组别名称 2.输完后在视图中点数据,就会出现数据栏,在相应的指标名称下输入数据,在组别名称 下输入样本标记,每组样本用同一个数字表示。 3.输完后点窗口上面的分析下拉菜单中的比较均衡,其中有单因素方差分析,出现对话框, 因变量中输入指标名称,因子中输入组的名称。 4.对话框中有选项,对比,两两比较,选项中描述性和两两比较中的LSD必选,其他的 项目也可以选,选完后确定就可以了。 LSD最小显著性差别S-N-K waller-duncan dunnett Tukey检验scheffe多重比较 Bonferroni邦弗伦尼统计量 Using repeated-measures single factor analysis of variance and Bonferroni statistical tests (P < 0. 05), intervertebral motion redistribution of each construct was compared with the intact. 使用重复测量变异的单因子分析和Bonferroni统计学测试,我们将每个结构的椎间盘运动再分布与完整运动进行了比较。 levene Tukey HSD Dunnett T3 bonferroni Using repeated-measures single factor analysis of variance and Bonferroni statistical tests (P < 0. 05), intervertebral motion redistribution of each construct was compared with the intact. 使用重复测量变异的单因子分析和Bonferroni统计学测试,我们将每个结构的椎间盘运动再分布与完整运动进行了比较。 LSD:最小显著性差异 ?Scheffe: (四)雪費法(Scheffe)事後檢定:經單因子變異數分析之後,如果F值達到顯著水準,再以雪費法(Scheffe)進行事後比較以瞭解真正存有差異組別之基于20个网页 - 搜索相关网页 ?雪费 本研究结果显示研究对象在籍贯的不同其牙医医疗服务利用有显著差异(P=0.046),且经雪费(Scheffe)的事后检定显示外省人在牙医医疗服务利用高于本省闽南,在其他的研究中未有此发现,研究者于是进一步的去了解,发现本研究对象中... 基于13个网页 - 搜索相关网页 ?以雪費 分析檢定;若P值小於0.05達到顯著水準,再以雪費(Scheffe)進行事後檢定,比較其差異,以下將一一進行分析。 基于12个网页 - 搜索相关网页 ?雪費法 (四)雪費法(Scheffe)事後檢定:經單因子變異數分析之後,如果F值達到顯著水準,再以雪費法(Scheffe)進行事後比較以瞭解真正存有差異組別之基于12个网页 - 搜索相关网页 -Scheffe Method:事后比较 ?事后比较

调查问卷数据SPSS分析中—多项选择问题处理方法

SPSS多项选择问题处理方法 多项选择题是定量问卷调查中常见的封闭式选择题,这种选择题的出现可以在确定的范围内更多的考察被调研对象的看法。在针对消费者的调研中,这种选择题多是出现在针对品牌知名度,包括提示前知名度、第一提及率,提示后知名度的分析中。 ?常见的分析方法 一般的研究分析手段主要应用包括EXCEL与SPSS在内的频次分析,然后再将在不同数据字段同一类选项数据进行加总,然后再以被调研对象的总体数量为基数,二者相除来得到多项选择题中各选项在总体中的占有率,这种各选项占有率的加总大于1。 例如某类产品品牌知名度调查中,关于该类产品您能想起哪些品牌? 01 品牌A 02品牌B 03品牌C 04品牌D 05品牌E 06品牌F 07其它品牌_____ 该问题在数据字段设计时最少要设计10个字段以供数据录入与分析。按上面的数据分析方法,先在这10个字段中进行分别的频次计算,然后进行加总再除以总基数,得到该选项的总体占有比率。以A选项为例: (01字段中A的占有率+02字段中A的占有率+ …… +06字段中A的占有率)/被调对象总数=A的占有率以此类推分别计算出其它品牌的占有率,频次计算次数与分类加和计算次数比较繁杂,其工作量在被选项较少时还算省事,但当被选项数量在十几个、二十几个甚至三十几个时,该分析方法则极大降低了分析人员的工作效率。 ?高效率数据分析方法 运用SPSS重组再分析的数据方法将极大提高数据分析效率并降低人为计算失误。 在SPSS数据库中运用 “Multiple Response”对多组数据进行组合再定义,这样会针对每个单一选择题定义出一个新的字段组,在新字段组中对变量区间进行定义,再针对新字段组进行频次分析。当完成单一字段设置后,可运用程序段对其它多项选择题进行再利用分析,这样可以大大提高多项选择题数据分析效率。 分析程序例举: ************** MULT RESPONSE GROUPS=$tsh '新字段组名称' (var00018 var00019 var00020 var00021 var00022 var00013 var00014 var00015 var00016 var00017 (1,111))

SPSS期末考试整理

●一。变量的赋值 1.乘方(**),例如二的三次方:2**3 2.不同规则的赋值:转换→计算变量(如果),每一个规则的赋值都要重新进行此步骤(但注意每一遍的变量名都不变,并且他都会问你要不要替换成新的变量,你选是就行了) 3.不同规则的赋值:(1)转换→重新编码为不同变量:输入变量,输出变量,要点击“变化量”才可保存输出变量→新值和旧值:值(直接选取取值)、范围(最大到最小的范围,包含端点值),点击“添加”成功保存新值和旧值→所有不同取值规则都完成后点击继续、确定,则在变量视图多出一个新变量(2)若不想包含端点值,可以采取小数的方式变换,eg. 899.9(小数位比该变量属性的小数位多一位就行了) (3)这种要先把BMI按照男女分开,然后再分组的,可以在对话框中点击“如果”选项进行设置,并且要分别对男女进行上述操作(一共做两遍)。 二。离散化 1可视离散化:转换→可视分箱,分割点:所以想生成几组,就定义几个分割点;填写第一个分割点的时候就必须填写最小值;一定要选中上端点排除。 三。排序 1.转换→自动重新编码:不分组,从头到尾排序 2.转换→个案排秩(1)多层次数据:基于A变量对B变量进行排序。(例如,基于职称对收入进行排序,就是不同职称各自组内排工资的高低)(2)设置秩1;绑定值 四。时间序列:转换→变动值 五。查找与计数:转换→对个案内的值计数(查找“基本工资800-900女职工”,生成新变量,满足这个条件的标为1,不符合这个标准的标为0,男职工标为缺失。范围:包含上限下限) ●六。数据→个案排序:把变量顺序完全按照你想要的标准排序,所有的变量顺序都会改变 七。拆分文件:要分男女进行数据统计:数据→拆分文件→比较组/按组输出,分组依据。不分男女进行数据统计:数据→拆分文件→分析所有个案 八。选择个案(例如只选择三年级的变量进行分析):数据→选择个案→如果条件满足:如果;随机个案样本;基于时间或个案范围;使用过滤变量(例如要把身高为缺失值和值为0的剔除)→输出:过滤(不符合条件的数据会画上“/”,原始数据并未删除);将选定个案复制到新数据集(形成一个新的SPSS数据文件,原始数据并未删除);删除未选定的个案(删除原始数据,不建议使用)→之后在分析的时候就只会分析三年级的变量。不想只分析三年及,记得重新做这一步。 九。加权个案:数据→加权个案(例。100分的有5人)。不想加权了,记得重新做这一步。 十。分类汇总(1)例如算不同年级的人的身高的均值、方差…(只能计算函数)(2)数据→汇总,分界变量(分类标准变量),变量摘要(计算变量),函数:选择计算变量函数,变量名称与标签:定义新生成变量的名称与标签 ●十一。长宽数据的转换 1.长数据变宽数据:索引变量消失变成score的尾缀 (1)数据→重组(重构)→个案重组为变量,标识变量,索引变量,电脑会自动帮你选出是xx xx要重构(不同疗程值不同的变量)。选完上述这些之后就一直点下一步&完成&立即重构&确定即可 (2)注意:当有多个变量需要重构时要自己决定“新变量组的顺序”。(A1A2B1B2;A1B1A2B2) 2.宽数据变长数据:score的尾缀消失变成索引变量 (1)数据→重组(重构)→变量重组为个案,个案组标识:使用选定变量,固定变量(手动选择,电脑不会自动帮你选出了),要转置的变量即值不固定的要重构的变量(手动选择,电脑不会自动帮你选出了)。选完上述这些之后就一直点击下一步&完成&立即重构数据&确定就行了 (2)当有多个变量需要重构时,这块的操作要特别注意:○1首先在“变量组数目”中选择“多个”○2然后在“选择变量”里要对于不同的“目标变量”分别定义“要转置的变量”(在本题中,即对于kidid目标变量定义一遍要转置的变量;对于age目标变量在定义一遍要转置的变量。其中,这两个要转置的变量必须是完全不同的)。但只需要定义一次“个案组标识”&“固定变量”(固定变量是相对于kidid & age都固定的那些变量;而不是说在对kidid进行转置的时候,age就是固定变量了;因此,固定变量只用定义一次且固定变量可以为空)。并且,你要特别注意,“个案组标识”里选择的变量& n个“要转置的变量”里选择的变量&“固定变量”里选择的变量都必须是完全不相同的。

spss统计分析期末考试题

《统计分析软件》试(题)卷 班级xxx班姓名xxx 学号xxx 题号一二三四五六总成绩成绩 说明:1.本试卷分析结果写在每个题目下面(即所留空白处); 2.考试时间为100分钟; 3.每个试题20分。 一、(20分)已经给出某个班的学生基本情况及其学习成绩的两个SPSS数据文件,学生成绩一.sav;学生成绩二.sav。要求: (1)将所给的两个SPSS数据文件“学生成绩一.sav”与“学生成绩二.sav”合并,并保存为“成绩.sav.” (2)对所建立的数据文件“成绩.sav”进行以下处理: 1)按照性别求出男、女数学成绩的各种统计量(包括平均成绩、标准差等)。 2)计算每个学生的总成绩、并按照总成绩的大小进行排序 3)把数学成绩分成优、良、中三个等级,规则为优(X≥85),良(75≤X ≤84),中(X≤74),并对优良中的人数进行统计。

分析: (2) 描述统计量 性别N 极小值极大值均值标准差 男数学 4 77.00 85.00 82.2500 3.77492 有效的N (列表状态) 4 女数学16 67.00 90.00 78.5000 7.09930 有效的N (列表状态)16

注:成绩优良表示栏位sxcj 优为1 良为2 中为3 由表统计得,成绩为优的同学有4人,占总人数的20%;良的同学有12人,占总人数的60%;中的同学有4人,占总人数的40%。 二、(20分)为了解笔记本电脑的市场情况,针对笔记本电脑的3种品牌,进行了满意度调查,随机访问了30位消费者,让他们选出自己满意的品牌,调查结果见下表,其中变量“职业”的取值中,1表示文秘人员,2表示管理人员,3表示工程师,4表示其他人;3个品牌变量的取值中,1表示选择,0表示未选数据见Excel数据文件“调查.exe”。根据所给数据完成以下问题 (1)将所给数据的Excel文件导入到SPSS中,要求SPSS数据文件写出数据结构(包括变量名,变量类型,变量值标签等)命,并保存为:“调查. Sav”。 (2)试利用多选项分析,利用频数分析来分析消费者对不同品牌电脑的满意度状况;分析不同职业消费者对笔记本品牌满意度状况。 分析:

SPSS知识学习系列17.交叉表与多选题

17. 交叉表与多选题 (一)基本理论 分类变量包括无序分类变量、有序分类变量、多选题变量集。 对于分类变量的描述统计,主要是对分类变量各水平值分别进行频数和比例计算,再进步计算所需的一些相对频数指标。 一、单分类变量的统计描述 1. 频数分布 分类变量的分析,首先要了解:各类别的样本数(频数),以及占总样本量的百分比;对有序分类变量,还需要了解:累积频数、累积百分比。 2. 集中/离散趋势 观察原始频数,或者使用众数。对于分类变量,集中/离散趋势是一体的。 3. 相对频数指标 (1)比(Riatio) 两个有关指标之比A/B, 用来反映相对的大小关系,例如,月销售额/销售人数; (2)构成比 用于描述事物内部各构成部分所占的比重,例如,百分比、累积百分比;

(3)率(Rate) 率是具有时间概念或速度、强度意义的指标,表示某个时期内某事件发生的频率或强度,例如速率、频率、费率、发病率等。 二、多分类变量的联合描述 列联表。例如,r×c二维列联表: (1)共n个样本; (2)按两种属性A、B,属性A有r个水平值:A1, …, A r; 属性B有c个水平值:B1, …, B c. 属性A=A i,属性B=B j的样本数为n ij. (3)n i. = “属性A=A i”的合计数,n.j = “属性B=B j”的合计数。 注:多分类变量对应高维列联表。 三、多选题的统计描述 多选题是调查问卷的常见题型,因为多选题是回答同一个大问题,所以不能割裂开来单独分析,需要做汇总处理。 1. 应答人数(Count) 选择各题项的人数,原始频数;

2. 应答人数百分比 选择该项的人数占总人数的百分比,可以反映该选项在人群中的受欢迎程度; 3. 应答人次(Response) 选择各选项的总人次,1个受访者选择2个选项,即2人次; 4. 应答次数百分比 在做出的所有选择中,选择该项的人次占总人次数的比例。 (二)SPSS实现 有某调查问卷的数据文件(部分): 变量属性:

spss期末考试上机复习题含答案

理工学院2017—2018学年第1学期 《spss软件应用》上机操作题库 1.随机抽取100人,按男女不同性别分类,将学生成绩分为中等以上及中等以下两类,结果 如下表。问男女生在学业成绩上有无显著差异? 中等以上中等以下 男 女 性别* 学业成绩交叉制表 计数 学业成绩 中等以上中等以下 合计 性别男23 17 40 女38 22 60 合计61 39 100

根据皮尔逊卡方检验,p=0.558〉0.05 所以男生女生在学业成绩上无显著性差异。 2.为了研究两种教学方法的效果。选择了6对智商、年龄、阅读能力、家庭条件都相同的儿童进行了实验。结果(测试分数)如下。问:能否认为新教学方法优于原教学方法(采用非参数检验)? 序号 新教学方法 原教学方法 1 2 3 4 5 6 83 69 87 93 78 59 78 65 88 91 72 59

答:由威尔逊非参数检验分析可知p=0.08〉0.05,所以不能认为新教学方法显著优于原教学方法。 3.下面的表格记录了某公司采用新、旧两种培训前后的工作能力评分增加情况,分析目的是比较这两种培训方法的效果有无差异。考虑到加盟公司时间可能也是影响因素,将加盟时间按月进行了记录。 方法加盟时间分数方法加盟时间分数 旧方法 1.5 9 新方法 2 12 旧方法 2.5 10.5 新方法 4.5 14 旧方法 5.5 13 新方法7 16 旧方法 1 8 新方法0.5 9 旧方法 4 11 新方法 4.5 12 旧方法 5 9.5 新方法 4.5 10 旧方法 3.5 10 新方法 2 10 旧方法 4 12 新方法 5 14 旧方法 4.5 12.5 新方法 6 16 (1)分不同的培训方法计算加盟时间、评分增加量的平均数。 (2)分析两种培训方式的效果是否有差异? 所以新方法的加盟时间平均数为4 分数增加量的平均数为12.5556

相关主题
文本预览
相关文档 最新文档