spss之多重响应 多选题录入及交叉分析。【精选】
- 格式:ppt
- 大小:1.60 MB
- 文档页数:38
SPSS中多选题(复选题)的录入及统计分析多选题,就是说一个题目可以有多个答案。
在录入的时候有两种选择。
我们举例说明:Q1 你经常使用的搜索引擎是哪几个?1 百度2 Google3 雅虎4 其他假设有5个被访者,分别选择了A 1B 1,2C 1,2,3D 2,3E 1,4一数据录入有两种录入法,分别是二分法和分类法。
1 二分法,数据结构如下二分法的特点是,题目有几个选项,SPSS数据文件中就有相应的几个变量以之对应。
选项选中为1,不选中为0(也可以自己定义)。
2 分类法,数据结构如下分类法的话,就是把选项序号依次输入到SPSS里面就可以了。
变量个数等于同时选中的选项个数的最大值。
如果是把数据先录入到txt中的话,那么一定要注意题目之间的分隔符和选项直接的分隔符不能选一样的。
比如,题目之间用TAB或逗号分开,选项之间用|分开。
二多选题定义SPSS中处理多选题,其实有两个模块。
一个是在菜单 Analyze -- Multiple Response 中,这个地方定义的多选题是临时的,如果你关闭SPSS后再打开,多选题还得重新定义。
除非你使用Syntax,否则不推荐。
另一个就是在 Data -- Define Multiple Respones Sets 中(也可以在 Analyze -- Tables -- Multiple Respones Sets 中打开,其实是一样的),推荐用这种方法定义。
1 二分法:1)在菜单中打开定义多选题的对话框,然后把同一道题目的几个变量选中,点击向右的三角形将它们移动到 "Variables in Set" 这个框中2)在Variable Coding里选中 Dichotomies,即二分法3)在Category Label Source里选 "Variable Labels"4)Set Name:填入多选题编号,Set Label:填入多选题的题干(或其他你觉得合适的标签)5)点击Add2 分类法:1)在菜单中打开定义多选题的对话框,然后把同一道题目的几个变量选中,点击向右的三角形将它们移动到 "Variables in Set" 这个框中2)在Variable Coding里选中 Categories,即分类法3)Set Name:填入多选题编号,Set Label:填入多选题的题干(或其他你觉得合适的标签)4)点击Add定义完以后,就会生成以$号开头的多选变量集了。
多选题数据的SPSS多重对应分析操作方法出处:江苏通灵翠钻有限公司发布日期:2008年04月17日10:18 多选题又称多重应答(Multiple Response),即针对同一个问题被访者可能回答出多个有效的答案,它是市场调查研究中十分常见的数据形式。
对多选题数据的分析除了使用SPSS 中的“Multiple Response”命令进行频数分析和交叉分析之外,还可以使用“Data Reduction”命令中的“Optimal Scaling”(最优尺度分析)进行多重对应分析,用以挖掘该数据与其他若干个变量之间的相互关系。
一、多选题数据在SPSS中的录入方式SPSS软件中对于多选题答案的标准纪录方式有两种:(1)多重二分法(Multiple dichotomy method)即把本道多选题的每个候选答案均看作一个变量Variable来定义,0代表没有被选中,1代表被选中。
(2)多重分类法(Multiple category method)即根据被访者可能提供的答案数量来设置相应个数的变量Variable(假设被访者最多只能选择n个不同答案,则在SPSS中设置n个变量用以录入本道多选题数据)。
实际操作中我们基本都会采用第二种数据录入方式,因为大多数被访者只会选择相对少数几个候选答案作为自己所提交的答案,如果我们采用第一种录入方式就显得繁琐,输入数据时也容易出错,尤其是当样本量增大时,不利于提高工作效率。
二、案例介绍某次市场调研项目中向被访者收集以下数据,A1题为多选题,把上述数据以第二种方式录入进SPSS软件中,其中设置a101、a102、a103三个变量用来录入多选题A1,并定义好相应的变量值标签(Values)如图1。
三、多选题两种数据录入格式的转换由于只有第一种数据录入方式才是符合统计分析原则的数据排列格式,能够直接进行后续的统计推断,而第二种录入方式只是一种简化纪录方式,需要转化为前者。
其转化方法操作如下:选择菜单File→New→Syntax,在弹出的Syntax对话框中输入相应的命令,其中新变量“a”代表被访者是否选择了“A牌”这个选项(1代表选择,0代表未选择)这样通过上述数据转换,我们就把a101、a102、a103三个旧变量(以第二种录入方式)的数据转化成了a、b、c、d、e 5个新变量(以第一种数据录入方式)的数据,并定义好新的变量值标签(Values),如图2。
131多重响应分析 第 7 章是同行的N 除以有效的总客户个数得到的比例。
7.4 多重响应变量集的交叉表分析对多重响应变量集做交叉表分析,就是为代表多选题答案的变量集生成二维交叉表。
只有在成功定义了多重响应变量集后,才能进行对变量集的交叉表分析,所以本节接着7.2节的例子来说明如何做多选题的交叉表。
多重响应变量交叉表分析的实例1.问题和数据描述本节接着第7.2节的例子进行分析,所用数据的格式如图7-1所示。
前面已经定义了多重响应变量集services ,下面就来做关于变量集services 的交叉表分析。
2.交叉表过程的参数设置依次单击菜单“分析→多重响应→交叉表...”,执行多重响应变量集的交叉表分析功能,其主设置界面如图7-5所示。
(1)分析变量设置。
在图7-5左下侧的“多响应集”列表中单击选中“$services ”变量集,单击从上至下第一个按钮,将其指定为行变量;在左上侧的变量列表单击选中“custcat ”变量,单击从上至下第二个按钮,将其指定为列变量。
● 左上侧的变量列表显示了当前数据集中的可用变量。
● 左下侧的“多响应集”列表显示了当前定义的所有多重响应变量集。
● “行”列表用于选入输出表格的行变量。
● “列”列表用于选入输出表格的列变量。
● “层”列表用于选入输出表格的分层变量,对分层变量的每个取值(或取值组合),将输出一个相应行列变量的二维交叉表。
普通变量、多重响应变量集都可以作为行变量、列变量、分层变量中的任意一个。
选中“列”列表中的“custcat ”变量,单击底部的“定义范围”按钮,弹出如图7-6所示的取值定义对话框,在“最小值”、“最大”后分别输入“1”、“4”,单击“继续”按钮返回主界面。
选入“行”、“列”和“层”列表框的普通变量,还必须为其设置取值范围,但不能设置变量集的取值范围。
取值范围的定义在图7-6所示的对话框中进行:“最小值”、“最大”输入框分别用于指定要在输出表中显示的变量取值的最小值和最大值。
SPSS中多项选择题的处理日期:2010-01-15 | 分类:研讨-报告-圆桌版权声明:转载时请以超链接形式标明文章原始出处和作者信息及本声明/logs/56376033.htmlSPSS中多项选择题的处理前几天受同学之托,继续琢磨SPSS中关于多项选择题的统计处理方法。
(一)多项选择题变量的定义方式:主要有两种:一种二分法编码,一种是分类法编码。
1.所谓二分编码,即对该多项选择题下的每一个选项分别看作不同的变量,用“1”表示被调查者选择了该项,用“0”表示未选择该项。
2.所谓分类法编码,首先应该估计该问题最多被选择的可能性,并给每一种选择建立一个新的变量。
从最终要分析的结果来看,两种定义方式具有相同的功能。
例如:以下哪类商品更容易引起您购物的冲动性?[多选题]A食品包括零食 B电子产品 C学习用品书籍等D生活用品E服装F饰品、化妆品其中一位被调查者选择A、C、E、F(二)编码与录入:1.使用二分编码情况如下:定义6个变量,变量名分别为food、electronic product、school suppli es、vital commodity、clothes、decoration,值标签分别定义为0=“未选”,1=“选中”。
以上被调查者的数据录入为:1 0 1 0 1 1 。
2.使用分类法编码如下:因为最多情况下,被调查者会选择6种选项,因此,仍需建立6个新变量,分别定义为shopping1、shopping2、shopping3、sh opping4、shopping5、shopping6,每一变量下的值标签定义为:1=“A”,2=“B”,3=“C”,4=“D”,5=“E”,6=“F”,9=“未选或缺省”。
以上被调查者的数据录入为:1 9 3 9 5 6 。
(三)定义多重响应:所有有效数据录入完毕后就可以进行统计分析了,在此我使用SPSS17.0进行统计数据的描述与分析。
比较困惑的一点是该版本的SPSS17.0中不能使用工具栏中的“数据”下的“定义多重响应集”,此处定义的集在多重响应频率和交叉表中不可用。
SPSS中多选题(复选题)的录入及统计分析多选题,就是说一个题目可以有多个答案。
在录入的时候有两种选择。
我们举例说明:Q1 你经常使用的搜索引擎是哪几个?1 百度2 Google3 雅虎4 其他假设有5个被访者,分别选择了A 1B 1,2C 1,2,3D 2,3E 1,4一数据录入有两种录入法,分别是二分法和分类法。
1 二分法,数据结构如下二分法的特点是,题目有几个选项,SPSS数据文件中就有相应的几个变量以之对应。
选项选中为1,不选中为0(也可以自己定义)。
2 分类法,数据结构如下分类法的话,就是把选项序号依次输入到SPSS里面就可以了。
变量个数等于同时选中的选项个数的最大值。
如果是把数据先录入到txt中的话,那么一定要注意题目之间的分隔符和选项直接的分隔符不能选一样的。
比如,题目之间用TAB或逗号分开,选项之间用|分开。
二多选题定义SPSS中处理多选题,其实有两个模块。
一个是在菜单 Analyze -- Multiple Response 中,这个地方定义的多选题是临时的,如果你关闭SPSS后再打开,多选题还得重新定义。
除非你使用Syntax,否则不推荐。
另一个就是在 Data -- Define Multiple Respones Sets 中(也可以在 Analyze -- Tables -- Multiple Respones Sets 中打开,其实是一样的),推荐用这种方法定义。
1 二分法:1)在菜单中打开定义多选题的对话框,然后把同一道题目的几个变量选中,点击向右的三角形将它们移动到 "Variables in Set" 这个框中2)在Variable Coding里选中 Dichotomies,即二分法3)在Category Label Source里选 "Variable Labels"4)Set Name:填入多选题编号,Set Label:填入多选题的题干(或其他你觉得合适的标签)5)点击Add2 分类法:1)在菜单中打开定义多选题的对话框,然后把同一道题目的几个变量选中,点击向右的三角形将它们移动到 "Variables in Set" 这个框中2)在Variable Coding里选中 Categories,即分类法3)Set Name:填入多选题编号,Set Label:填入多选题的题干(或其他你觉得合适的标签)4)点击Add定义完以后,就会生成以$号开头的多选变量集了。
多重响应分析多重响应分析又称多重应答分析或者多选题应答分析。
在我看来该分析仅仅只是相当于一个summary。
仅仅是一个频率的统计性描述。
例1.已知一个“辅食添加”的多重二分法记录(45个个案)数据文件mulres1.sav,其中area(地区):1-北京,2-广州;sex(性别):1-男,2-女;辅食添加:x1(蛋)、x2(肉类)、x3(豆类)、x4(面食)、x5(水果)与x6(其他),试建立多重响应数据集。
数据格式如下Analyze---->Multiple response--->define variable set进行多重响应集的定义,必须先定义才能进行后续的分析;否则Multiple response 下面的Frequency 以及Cross table就是灰色的,因为没有可用的多重响应集可用;在进入定义界面后如下,集合中的变量即时响应变量,选入右边框中,本题中响应变量均是0-1值,所以本例采用计数值(count value)值为1;如果不设置的话,右边的添加项就是灰色的;无法继续进行;如果响应值不是0—1这样的二值数据,而是1到5这样的情况,则选用下面的类别,并输入范围值。
定义多重响应集的名称和lable,单击添加生成多重响应即food;至此定义好了一个名称为food 的多重响应集合。
Analyze ---->Multiple response--->frequency 进行多重响应频率分析将定义好的多重响应集food添加到右边的表格中来分析;缺失值用来处理又却是数据的情形,本例不存在缺失值;Analyze ---->Multiple response--->cross table进行多重响应的交叉表分析将area添加到行row,将food 添加到列column;点击选项(options)选择要现实的百分比,以及百分比计算的基础是个案还是响应。
个案:采访调查了45名人员,无缺失值。
17. 交叉表与多选题(一)基本理论分类变量包括无序分类变量、有序分类变量、多选题变量集。
对于分类变量的描述统计,主要是对分类变量各水平值分别进行频数和比例计算,再进步计算所需的一些相对频数指标。
一、单分类变量的统计描述1. 频数分布分类变量的分析,首先要了解:各类别的样本数(频数),以及占总样本量的百分比;对有序分类变量,还需要了解:累积频数、累积百分比。
2. 集中/离散趋势观察原始频数,或者使用众数。
对于分类变量,集中/离散趋势是一体的。
3. 相对频数指标(1)比(Riatio)两个有关指标之比A/B, 用来反映相对的大小关系,例如,月销售额/销售人数;(2)构成比用于描述事物内部各构成部分所占的比重,例如,百分比、累积百分比;(3)率(Rate)率是具有时间概念或速度、强度意义的指标,表示某个时期内某事件发生的频率或强度,例如速率、频率、费率、发病率等。
二、多分类变量的联合描述列联表。
例如,r×c二维列联表:(1)共n个样本;(2)按两种属性A、B,属性A有r个水平值:A1, …, A r; 属性B有c个水平值:B1, …, B c. 属性A=A i,属性B=B j的样本数为n ij.(3)n i. = “属性A=A i”的合计数,n.j = “属性B=B j”的合计数。
注:多分类变量对应高维列联表。
三、多选题的统计描述多选题是调查问卷的常见题型,因为多选题是回答同一个大问题,所以不能割裂开来单独分析,需要做汇总处理。
1. 应答人数(Count)选择各题项的人数,原始频数;2. 应答人数百分比选择该项的人数占总人数的百分比,可以反映该选项在人群中的受欢迎程度;3. 应答人次(Response)选择各选项的总人次,1个受访者选择2个选项,即2人次;4. 应答次数百分比在做出的所有选择中,选择该项的人次占总人次数的比例。
(二)SPSS实现有某调查问卷的数据文件(部分):变量属性:一、单分类变量的描述——频率变量“s4”表示学历:问题1:描述受访者的学历分布情况【分析】——【描述统计】——【频率】,将“学历”选入【变量】框,点【确定】得到S4. 学历频率百分比有效百分比累积百分比有效初中/技校或以下 154 13.4 13.4 13.4 高中/中专 313 27.3 27.3 40.7 大专33128.928.969.6本科 292 25.5 25.5 95.0 硕士或以上 57 5.0 5.0 100.0合计1147100.0100.0注:详细操作见第15篇《频率图表》。
SPSS-多重响应-频率和交叉表案例分析(问卷调查分析)2011-09-29 16:35马上要国庆了,公司待遇不错,一口气放10天假,真是太高兴了,已经买了飞机票,飞机票贵的一滚,来回居然要2000多,伤不起啊!!在10.1休假前,希望跟大家讨论一下SPSS-多重响应--频率和交叉表分析,希望大家能够多提点提点在云南电信网上营业厅做了一个关于“客户不使用电信3g业务的原因有哪些的问卷调查,问题所示:这份问卷调查总更有35人参与,样本容量偏少,其中1:选择 A :3G资费过高的有 14人2:选择 B: 网络覆盖率低,信号不稳定的 15人3:选择 C:买手机太麻烦的 15人4:选择 D: 换手机号麻烦 15人5:选择 E: 3G功能用处不大 9人6:选择F: 朋友使用后,觉得不好 10人第一步:我们将 A , B, C , D , E ,F,六个答案选项分别做为一个单独的变量,分别赋值为“0”和“1”,0代表没有被选中,“1”代表被选中,这个就是所谓的“二分法”在SPSS中进行数据编码后,如下所示:点击“分析-多重响应---定义变量集---进入如下所示页面:根据如上图所示,填写变量集名称,标签,以及在”二分法” 计算值选项中填入“1”再点击”添加“ 添加成后,点击”关闭“按钮再点击”分析-多重响应--频率分析----分析结果如下所示:上图结果很直观,结果,我就不分析了百分比=N/总计 =14/78=17.9%个案百分比=N/参与人数(有效人数)=14/33=42.4% 下面来进行“交叉表”分析,如下所示:从上图可知:多重响应交叉表中有“行,列,层”三个选框1:我们将“变量集" 移入”行“列表框内,将”客户类型“移入”列框内,层选框可以不选,有需要时再选,层选项框是用来分层进行统计分析的(我进行了分层,如上图所示)比如:我想计算每一个答案有多少被选中,有多少没有选中,可以采用分层,分为“选中”和“未选中”两个层次“客户类型”是指来进行“问卷调查”人的分类,分为“3g老客户”“3g一般客户” "很少用3g客户“”不用3g客户“等类型,点击“选项”进入如下所示页面:点击确定,可以得到如下结果:因为我们上图选中的“列”所以,计算的是列单元格百分比,也进行了分层处理,分为“没有选中”和“选中”两个层次。