最新spss之多重响应-多选题录入及交叉分析。
- 格式:ppt
- 大小:1.65 MB
- 文档页数:39
SPSS中多选题(复选题)的录入及统计分析多选题,就是说一个题目可以有多个答案。
在录入的时候有两种选择。
我们举例说明:Q1 你经常使用的搜索引擎是哪几个?1 百度2 Google3 雅虎4 其他假设有5个被访者,分别选择了A 1B 1,2C 1,2,3D 2,3E 1,4一数据录入有两种录入法,分别是二分法和分类法。
1 二分法,数据结构如下二分法的特点是,题目有几个选项,SPSS数据文件中就有相应的几个变量以之对应。
选项选中为1,不选中为0(也可以自己定义)。
2 分类法,数据结构如下分类法的话,就是把选项序号依次输入到SPSS里面就可以了。
变量个数等于同时选中的选项个数的最大值。
如果是把数据先录入到txt中的话,那么一定要注意题目之间的分隔符和选项直接的分隔符不能选一样的。
比如,题目之间用TAB或逗号分开,选项之间用|分开。
二多选题定义SPSS中处理多选题,其实有两个模块。
一个是在菜单 Analyze -- Multiple Response 中,这个地方定义的多选题是临时的,如果你关闭SPSS后再打开,多选题还得重新定义。
除非你使用Syntax,否则不推荐。
另一个就是在 Data -- Define Multiple Respones Sets 中(也可以在 Analyze -- Tabl es -- Multiple Respones Sets 中打开,其实是一样的),推荐用这种方法定义。
1 二分法:1)在菜单中打开定义多选题的对话框,然后把同一道题目的几个变量选中,点击向右的三角形将它们移动到 "Variables in Set" 这个框中2)在Variable Coding里选中 Dichotomies,即二分法3)在Category Label Source里选 "Variable Labels"4)Set Name:填入多选题编号,Set Label:填入多选题的题干(或其他你觉得合适的标签)5)点击Add2 分类法:1)在菜单中打开定义多选题的对话框,然后把同一道题目的几个变量选中,点击向右的三角形将它们移动到 "Variables in Set" 这个框中2)在Variable Coding里选中 Categories,即分类法3)Set Name:填入多选题编号,Set Label:填入多选题的题干(或其他你觉得合适的标签)4)点击Add定义完以后,就会生成以$号开头的多选变量集了。
131多重响应分析 第 7 章是同行的N 除以有效的总客户个数得到的比例。
7.4 多重响应变量集的交叉表分析对多重响应变量集做交叉表分析,就是为代表多选题答案的变量集生成二维交叉表。
只有在成功定义了多重响应变量集后,才能进行对变量集的交叉表分析,所以本节接着7.2节的例子来说明如何做多选题的交叉表。
多重响应变量交叉表分析的实例1.问题和数据描述本节接着第7.2节的例子进行分析,所用数据的格式如图7-1所示。
前面已经定义了多重响应变量集services ,下面就来做关于变量集services 的交叉表分析。
2.交叉表过程的参数设置依次单击菜单“分析→多重响应→交叉表...”,执行多重响应变量集的交叉表分析功能,其主设置界面如图7-5所示。
(1)分析变量设置。
在图7-5左下侧的“多响应集”列表中单击选中“$services ”变量集,单击从上至下第一个按钮,将其指定为行变量;在左上侧的变量列表单击选中“custcat ”变量,单击从上至下第二个按钮,将其指定为列变量。
● 左上侧的变量列表显示了当前数据集中的可用变量。
● 左下侧的“多响应集”列表显示了当前定义的所有多重响应变量集。
● “行”列表用于选入输出表格的行变量。
● “列”列表用于选入输出表格的列变量。
● “层”列表用于选入输出表格的分层变量,对分层变量的每个取值(或取值组合),将输出一个相应行列变量的二维交叉表。
普通变量、多重响应变量集都可以作为行变量、列变量、分层变量中的任意一个。
选中“列”列表中的“custcat ”变量,单击底部的“定义范围”按钮,弹出如图7-6所示的取值定义对话框,在“最小值”、“最大”后分别输入“1”、“4”,单击“继续”按钮返回主界面。
选入“行”、“列”和“层”列表框的普通变量,还必须为其设置取值范围,但不能设置变量集的取值范围。
取值范围的定义在图7-6所示的对话框中进行:“最小值”、“最大”输入框分别用于指定要在输出表中显示的变量取值的最小值和最大值。
多重响应分析多重响应分析又称多重应答分析或者多选题应答分析。
在我看来该分析仅仅只是相当于一个summary。
仅仅是一个频率的统计性描述。
例1.已知一个“辅食添加”的多重二分法记录(45个个案)数据文件mulres1.sav,其中area(地区):1-北京,2-广州;sex(性别):1-男,2-女;辅食添加:x1(蛋)、x2(肉类)、x3(豆类)、x4(面食)、x5(水果)与x6(其他),试建立多重响应数据集。
数据格式如下Analyze---->Multiple response--->define variable set进行多重响应集的定义,必须先定义才能进行后续的分析;否则Multiple response 下面的Frequency 以及Cross table就是灰色的,因为没有可用的多重响应集可用;在进入定义界面后如下,集合中的变量即时响应变量,选入右边框中,本题中响应变量均是0-1值,所以本例采用计数值(count value)值为1;如果不设置的话,右边的添加项就是灰色的;无法继续进行;如果响应值不是0—1这样的二值数据,而是1到5这样的情况,则选用下面的类别,并输入范围值。
定义多重响应集的名称和lable,单击添加生成多重响应即food;至此定义好了一个名称为food 的多重响应集合。
Analyze ---->Multiple response--->frequency 进行多重响应频率分析将定义好的多重响应集food添加到右边的表格中来分析;缺失值用来处理又却是数据的情形,本例不存在缺失值;Analyze ---->Multiple response--->cross table进行多重响应的交叉表分析将area添加到行row,将food 添加到列column;点击选项(options)选择要现实的百分比,以及百分比计算的基础是个案还是响应。
个案:采访调查了45名人员,无缺失值。
SPSS-多重响应-频率和交叉表案例分析(问卷调查分析)2011-09-29 16:35马上要国庆了,公司待遇不错,一口气放10天假,真是太高兴了,已经买了飞机票,飞机票贵的一滚,来回居然要2000多,伤不起啊!!在10.1休假前,希望跟大家讨论一下SPSS-多重响应--频率和交叉表分析,希望大家能够多提点提点在云南电信网上营业厅做了一个关于“客户不使用电信3g业务的原因有哪些的问卷调查,问题所示:这份问卷调查总更有35人参与,样本容量偏少,其中1:选择 A :3G资费过高的有 14人2:选择 B: 网络覆盖率低,信号不稳定的 15人3:选择 C:买手机太麻烦的 15人4:选择 D: 换手机号麻烦 15人5:选择 E: 3G功能用处不大 9人6:选择F: 朋友使用后,觉得不好 10人第一步:我们将 A , B, C , D , E ,F,六个答案选项分别做为一个单独的变量,分别赋值为“0”和“1”,0代表没有被选中,“1”代表被选中,这个就是所谓的“二分法”在SPSS中进行数据编码后,如下所示:点击“分析-多重响应---定义变量集---进入如下所示页面:根据如上图所示,填写变量集名称,标签,以及在”二分法” 计算值选项中填入“1”再点击”添加“ 添加成后,点击”关闭“按钮再点击”分析-多重响应--频率分析----分析结果如下所示:上图结果很直观,结果,我就不分析了百分比=N/总计 =14/78=17.9%个案百分比=N/参与人数(有效人数)=14/33=42.4% 下面来进行“交叉表”分析,如下所示:从上图可知:多重响应交叉表中有“行,列,层”三个选框1:我们将“变量集" 移入”行“列表框内,将”客户类型“移入”列框内,层选框可以不选,有需要时再选,层选项框是用来分层进行统计分析的(我进行了分层,如上图所示)比如:我想计算每一个答案有多少被选中,有多少没有选中,可以采用分层,分为“选中”和“未选中”两个层次“客户类型”是指来进行“问卷调查”人的分类,分为“3g老客户”“3g一般客户” "很少用3g客户“”不用3g客户“等类型,点击“选项”进入如下所示页面:点击确定,可以得到如下结果:因为我们上图选中的“列”所以,计算的是列单元格百分比,也进行了分层处理,分为“没有选中”和“选中”两个层次。
SPSS多项选择问题处理方法 多项选择题是定量问卷调查中常见的封闭式选择题,这种选择题的出现可以在确定的范围内更多的考察被调研对象的看法。
在针对消费者的调研中,这种选择题多是出现在针对品牌知名度,包括提示前知名度、第一提及率,提示后知名度的分析中。
î常见的分析方法一般的研究分析手段主要应用包括EXCEL与SPSS在内的频次分析,然后再将在不同数据字段同一类选项数据进行加总,然后再以被调研对象的总体数量为基数,二者相除来得到多项选择题中各选项在总体中的占有率,这种各选项占有率的加总大于1。
例如某类产品品牌知名度调查中,关于该类产品您能想起哪些品牌?01 品牌A 02品牌B 03品牌C 04品牌D 05品牌E 06品牌F 07其它品牌_____该问题在数据字段设计时最少要设计10个字段以供数据录入与分析。
按上面的数据分析方法,先在这10个字段中进行分别的频次计算,然后进行加总再除以总基数,得到该选项的总体占有比率。
以A选项为例:(01字段中A的占有率+02字段中A的占有率+ …… +06字段中A的占有率)/被调对象总数=A的占有率以此类推分别计算出其它品牌的占有率,频次计算次数与分类加和计算次数比较繁杂,其工作量在被选项较少时还算省事,但当被选项数量在十几个、二十几个甚至三十几个时,该分析方法则极大降低了分析人员的工作效率。
î高效率数据分析方法运用SPSS重组再分析的数据方法将极大提高数据分析效率并降低人为计算失误。
在SPSS数据库中运用 “Multiple Response”对多组数据进行组合再定义,这样会针对每个单一选择题定义出一个新的字段组,在新字段组中对变量区间进行定义,再针对新字段组进行频次分析。
当完成单一字段设置后,可运用程序段对其它多项选择题进行再利用分析,这样可以大大提高多项选择题数据分析效率。
分析程序例举:**************MULT RESPONSEGROUPS=$tsh '新字段组名称' (var00018 var00019 var00020 var00021var00022 var00013 var00014 var00015 var00016 var00017 (1,111))/FREQUENCIES=$tsh .*************多重应答数据深度分析方法及其SPSS操作多重应答数据深度分析方法及其SPSS操作出处:零点研究咨询集团 发布日期:2007年06月21日 15:39多重应答(Multiple Response),又称多选题,是市场调查研究中十分常见的数据形式。
多重响应SPSSAU系统中多重响应可以研究单选题(X)和多选题(Y)之间有关系情况。
如果不放置单选题(X),仅放置多选题(Y),则时直接对多选题进行统计。
多重响应时涉及两个术语名词,分别是响应率和普及率。
●响应率分析多选题(Y)各选项的相对选择比例情况;比如共100个样本,平均每个样本选择3项,则总共100个样本共选择了300个选项。
如果某某个选项有60个人选择,则时响应率为60/300=20%●普及率分析多选题(Y)各选项的选择普及情况;比如共100个样本,某个选项有60个人选择,则时普及率为60/100=60%●响应率和普及率的区别在于被除数不一样。
响应率加和一定为100%,普及率加和通常会高于100%●绝大多数情况下是对普及率进行分析,如果想深入分析,则可以对响应率也进行分析;分析结果如下(SPSSAU同时会生成饼图/圆环图/柱形图/条形图/拆线图等):交叉汇总表项性别(%)汇总(N=177)男(N=149)女(N=28)多选题选项1 92(61.7)20(71.4)112(63.3)多选题选项2 107(71.8)17(60.7)124(70.1)多选题选项3 85(57.0)18(64.3)103(58.2)多选题选项4 68(45.6)11(39.3)79(44.6)多重响应表格项响应普及率(N=177)N 响应率多选题选项1 112 26.8% 63.3%多选题选项2 124 29.7% 70.1%多选题选项3 103 24.6% 58.2%多选题选项4 79 18.9% 44.6%汇总418 100% 236.2%SPSSAU操作如下:(正常情况下,1代表选中,SPSSAU也默认设置1代表选中。
如果数字‘0’代表选项被选中,可设置“计数值”为2)。
多重响应分析多重响应分析又称多重应答分析或者多选题应答分析。
在我看来该分析仅仅只是相当于一个summary。
仅仅是一个频率的统计性描述。
例1.已知一个“辅食添加”的多重二分法记录(45个个案)数据文件mulres1.sav,其中area(地区):1-北京,2-广州;sex(性别):1-男,2-女;辅食添加:x1(蛋)、x2(肉类)、x3(豆类)、x4(面食)、x5(水果)与x6(其他),试建立多重响应数据集。
数据格式如下Analyze---->Multiple response--->define variable set进行多重响应集的定义,必须先定义才能进行后续的分析;否则Multiple response下面的Frequency 以及Cross table就是灰色的,因为没有可用的多重响应集可用;在进入定义界面后如下,集合中的变量即时响应变量,选入右边框中,本题中响应变量均是0-1值,所以本例采用计数值(count value)值为1;如果不设置的话,右边的添加项就是灰色的;无法继续进行;如果响应值不是0—1这样的二值数据,而是1到5这样的情况,则选用下面的类别,并输入范围值。
定义多重响应集的名称和lable,单击添加生成多重响应即food;至此定义好了一个名称为food 的多重响应集合。
Analyze ---->Multiple response--->frequency 进行多重响应频率分析将定义好的多重响应集food添加到右边的表格中来分析;缺失值用来处理又却是数据的情形,本例不存在缺失值;Analyze ---->Multiple response--->cross table进行多重响应的交叉表分析将area添加到行row,将food 添加到列column;点击选项(options)选择要现实的百分比,以及百分比计算的基础是个案还是响应。
个案:采访调查了45名人员,无缺失值。
SPSS问卷分析之编码录入及描述统计详解问卷调查的方法用得很广泛,第一步面临的就是问卷编码问题,有很多外专业的同学都在问这个问题,现在通过举例的方法详细讲解如下,以方便第一次接触SPSS的同学也能做简单的分析。
后面还有分析时的操作步骤,以及比较适用的深入统计分析方法的简单介绍。
自己写的,错误之处请指正.调查分析问卷回收,在经过核实和清理后就要用SPSS做数据分析,首先的第一步就是把问题编码录入。
SPSS的问卷分析中一份问卷是一个案,首先要根据问卷问题的不同定义变量。
定义变量值得注意的两点:一区分变量的度量,Measure的值,其中Scale是定量、Ordinal是定序、Nominal是指定类;二注意定义不同的数据类型Type 各色各样的问卷题目的类型大致可以分为单选、多选、排序、开放题目四种类型,他们的变量的定义和处理的方法各有不同,我们详细举例介绍如下:1 单选题:答案只能有一个选项例一当前贵组织机构是否设有面向组织的职业生涯规划系统?A有 B 正在开创 C 没有 D曾经有过但已中断编码:只定义一个变量,Value值1、2、3、4分别代表A、B、C、D 四个选项。
录入:录入选项对应值,如选C则录入32 多选题:答案可以有多个选项,其中又有项数不定多选和项数定多选。
(1)方法一(二分法):例二贵处的职业生涯规划系统工作涵盖哪些组群?画钩时请把所有提示考虑在内。
A月薪员工 B日薪员工 C钟点工编码:把每一个相应选项定义为一个变量,每一个变量Value值均如下定义:“0” 未选,“1” 选。
录入:被调查者选了的选项录入1、没选录入0,如选择被调查者选AC,则三个变量分别录入为1、0、1。
(2)方法二:例三你认为开展保持党员先进性教育活动的最重要的目标是那三项:1()2 ()3()A、提高党员素质B、加强基层组织C、坚持发扬**D、激发创业热情E、服务人民群众F、促进各项工作编码:定义三个变量分别代表题目中的1、2、3三个括号,三个变量Value值均同样的以对应的选项定义,即:“1” A,“2” B,“3” C,“4” D,“5” E,“6” F录入:录入的数值1、2、3、4、5、6分别代表选项ABCDEF,相应录入到每个括号对应的变量下。
SPSS分析:多重响应分析⼀、定义多重响应集(分析-多重响应-定义变量集)定义多重响应集过程将基本变量分组为多⼆分集和多类别集,您可以获得这些集的频率表和交叉制表。
可以定义多达20个的多重响应集。
每个集必须有⼀个唯⼀的名称。
要删除⼀个集,请在多重响应集列表中将其突出显⽰,然后单击删除。
要更改⼀个集,请在列表中将其突出显⽰,修改任意集定义特征,然后单击更改。
可以将基本变量编码为⼆分或分类变量。
要使⽤⼆分变量,请选择⼆分来创建多⼆分集。
对“已计算的值”值输⼊⼀个整数值。
每个⾄少出现过⼀个计数值的变量成为多重⼆分集的⼀个类别。
选择类别来创建与成分变量有相同值范围的多类别集。
输⼊多类别集的类别范围的最⼩和最⼤整数值。
该过程会将所有成分变量包含范围内的每个不同整数相加求和。
空类别不进⾏制表。
⼆、多重响应频率(分析-多重响应-频率)1、多重响应频率过程⽣成多重响应集的频率表。
必须先定义⼀个或多个响应集:对于多⼆分集,显⽰在输出中的类别名称来⾃为组中的基本变量定义的变量标签。
如果没有定义变量标签,就将变量名称⽤作标签。
对于多类别集,类别标签来⾃组中的第⼀个变量的值标签。
如果第⼀个变量缺失的类别存在于组中的其他变量中,请为缺失的类别定义⼀个值标签。
2、缺失值。
按逐个表的⽅式排除带缺失值的个案。
或者,你可以选择以下两个⽅式中的⼀个或全部:2.1、排除⼆分中的个案列表情况。
从多⼆分集的制表中排除具有任何变量的缺失值的个案。
该项仅应⽤于定义为⼆分变量的多重响应集。
缺省的情况下,如果多⼆分集中的某个个案的成分变量没有⼀个包含计数的值,就认为该个案缺失。
只要⾄少⼀个变量包含计数值,那么即使个案中有⼀些(但不是全部)变量的值缺失,这些个案也包括在组的制表中。
2.2、排除类别内的个案列表情况。
从多类别集的制表中排除具有任何变量的缺失值的个案。
这仅应⽤于定义为类别集的多重响应集。
缺省的情况下,对于多类别集,仅当某个个案的成分没有⼀个包含定义范围内的有效值时,才认为该个案缺失。
spss多选题录入与分析1不限定选择项的录入及分析在市场调查和社会学调查等问卷设计过程中,通常会设计各种多选题,甚至排序题,来进行信息的搜集,而这些多选题或排序题又是必不可少的,因此就需要对各种多选题、排序题进行录入和分析,在这里以spss的录入和分析为例,来讨论下多选题和排序题的录入及分析。
1多选题的录入和分析<xml:namespace prefix = o ns ="urn:schemas-microsoft-com:office:office" />多选题一般有三种情况,一种是任选几项,不限定选择项数;一种是限定最多选择几项,比如最多选择三项等;第三种也是是限定选择的项数,但与排序相结合,比如依次选择三项,最重要,其次重要,第三重要。
第一种情况:不限定选择项数时。
二分类方式的编码为0和1,即将每一个选项拆分为一个独立变量,如果选中的则录入1,没有选择的则录入为0.有多少个选项则拆分出多少个变量来,因此选项异常多的情况下此种方法有点麻烦。
例如下表所示:假设var001-var005是一个多选题的选项,共五项,让被访者任选,不限定,录入方式如下表,1表示被访者选中,0表示被访者未选的。
<xml:namespace prefix = v ns = "urn:schemas-microsoft-com:vml" /> [分析时,由于var001-var005是一个多选题的答案,因此需要先进行多重响应设计,在“分析”—“多重响应”如下所示或者在“分析”---“表”----“多响应集”中,如下所示两者弹出的窗口相差不大,我们以第一种“定义变量集”来进行,点击之后,弹出窗口如下在“设置定义”对话框会列出所有的需要设置的变量,其中包括多选题的变量,将涉及多选题的5个变量全部移入右边“集合中的变量”,然后下方的“将变量编码为”“二分法”,计数值输入“1”,意思是统计变量值为1的频率,然后名称中输入该多选题的题目名称之后,“添加”到“多响应集”,点击关闭。
17. 穿插表与多项选择题〔一〕根本理论分类变量包括无序分类变量、有序分类变量、多项选择题变量集。
对于分类变量的描述统计,主要是对分类变量各水平值分别进展频数和比例计算,再进步计算所需的一些相对频数指标。
一、单分类变量的统计描述1. 频数分布分类变量的分析,首先要了解:各类别的样本数〔频数〕,以及占总样本量的百分比;对有序分类变量,还需要了解:累积频数、累积百分比。
2. 集中/离散趋势观察原始频数,或者使用众数。
对于分类变量,集中/离散趋势是一体的。
3. 相对频数指标〔1〕比〔Riatio〕两个有关指标之比A/B, 用来反映相对的大小关系,例如,月销售额/销售人数;〔2〕构成比用于描述事物内部各构成局部所占的比重,例如,百分比、累积百分比;〔3〕率〔Rate〕率是具有时间概念或速度、强度意义的指标,表示某个时期内某事件发生的频率或强度,例如速率、频率、费率、发病率等。
二、多分类变量的联合描述列联表。
例如,r×c二维列联表:〔1〕共n个样本;〔2〕按两种属性A、B,属性A有r个水平值:A1, …, A r; 属性B 有c个水平值:B1, …, B c. 属性A=A i,属性B=B j的样本数为n ij.〔3〕n i. = “属性A=A i〞的合计数,n.j = “属性B=B j〞的合计数。
注:多分类变量对应高维列联表。
三、多项选择题的统计描述多项选择题是调查问卷的常见题型,因为多项选择题是答复同一个大问题,所以不能割裂开来单独分析,需要做汇总处理。
1. 应答人数〔Count〕选择各题项的人数,原始频数;2. 应答人数百分比选择该项的人数占总人数的百分比,可以反映该选项在人群中的受欢送程度;3. 应答人次〔Response〕选择各选项的总人次,1个受访者选择2个选项,即2人次;4. 应答次数百分比在做出的所有选择中,选择该项的人次占总人次数的比例。
〔二〕SPSS实现有某调查问卷的数据文件〔局部〕:变量属性:一、单分类变量的描述——频率变量“s4〞表示学历:问题1:描述受访者的学历分布情况【分析】——【描述统计】——【频率】,将“学历〞选入【变量】框,点【确定】得到S4. 学历频率百分比有效百分比累积百分比有效初中/技校或以下154 高中/中专313 大专331 本科292 硕士或以上57 合计1147注:详细操作见第15篇?频率图表?。
多选题数据的SPSS多重对应分析操作方法
陈治
【期刊名称】《市场研究》
【年(卷),期】2008(000)003
【摘要】多选题又称多重应答(Multiple Response),即针对同一个问题被访者可能回答出多个有效的答案,它是市场调查研究中十分常见的数据形式。
对多选题数据的分析除了使用SPSS中的“Multiple Response”命令进行频数分析和交叉分析之外,还可以使用“Data Reduction”命令中的“Optimal Scaling”(最优尺度分析)进行多重对应分析,用以挖掘该数据与其他若干个变量之间的相互关系。
【总页数】3页(P39-41)
【作者】陈治
【作者单位】江苏通灵翠钻有限公司
【正文语种】中文
【中图分类】F7
【相关文献】
1.EpiData和SPSS在调查问卷多选题处理中的联合应用 [J], 刘跃平;徐含青;黄庆;府伟灵
2.在SPSS中实现多选题数据录入、转换的新方法 [J], 陶维东;陶晓丽;谢超香;孙晓青
3.多选题数据深度分析及其在SPSS中的实现 [J], 王春枝;王娟
4.问卷调查中的嵌套多选题数据如何录入SPSS [J], 金敏
5.多选题的统计分析及其SPSS实现 [J], 董寒青
因版权原因,仅展示原文概要,查看原文内容请购买。