调研问卷中多选题的分析方法探讨
- 格式:docx
- 大小:1.83 MB
- 文档页数:17
用户调研中的焦点小组讨论技巧与分析方法及访谈技巧与问卷设计方法及数据分析与应用在用户调研过程中,焦点小组讨论、访谈技巧和问卷设计以及数据分析与应用是至关重要的。
本文将针对这些方面进行深入探讨。
一、焦点小组讨论技巧与分析方法焦点小组讨论是一种集体讨论的方式,旨在深入了解用户观点和需求。
以下是几个焦点小组讨论技巧和分析方法的介绍:1. 制定明确的讨论目的:在组织焦点小组讨论之前,确保明确讨论的目的和研究问题。
这样有助于引导讨论,确保讨论的准确性和有效性。
2. 选择合适的参与者:根据目标用户群体,选择具有代表性的参与者。
确保参与者具备丰富的经验和见解,以促进讨论的质量和深度。
3. 建立良好的氛围:为焦点小组讨论创造良好的氛围是至关重要的。
组织者应确保参与者感到自由和舒适,鼓励他们积极参与讨论。
4. 引导讨论:焦点小组讨论需要有一个合适的引导者,帮助引导讨论,防止讨论偏离主题。
引导者需要注意听取每个参与者的观点,并适时提问和激发讨论。
5. 分析讨论结果:在讨论结束后,对讨论结果进行仔细分析。
整理出参与者提供的有关观点、意见和需求,并进行分类和总结。
这样能够为后续的产品改进和决策提供有价值的参考。
二、访谈技巧与问卷设计方法除了焦点小组讨论,访谈技巧和问卷设计也是用户调研中常用的方法。
以下是一些访谈技巧和问卷设计的方法和原则:1. 访谈技巧:a) 提前准备:在进行访谈之前,准备一个清晰的访谈指南,包括所需的问题和访谈的流程。
这样可以确保访谈的连贯性和准确性。
b) 开放性问题:在访谈中使用开放性问题,鼓励被访者提供详细和具体的观点和意见。
这有助于获得深入了解用户需求的信息。
c) 注意倾听:在访谈过程中,重要的是倾听被访者的观点和需求,并尽量避免干扰或主观解读。
这有助于获得准确的访谈结果。
2. 问卷设计方法:a) 目标明确:在设计问卷之前,明确研究的目标和所要获得的信息。
这样可以有针对性地设计问题,并使得问卷更具可操作性和有效性。
市场调研专业市场调查实践中的问卷设计与数据分析方法心得市场调研在现代商业运作中起着至关重要的作用。
一个成功的市场调研项目离不开科学合理的问卷设计以及准确有效的数据分析方法。
经过实践探索和总结,我积累了一些关于问卷设计和数据分析的心得体会,现在分享给大家。
一、问卷设计在市场调查中,问卷设计是整个调查过程的基础。
合理的问卷设计可以确保数据的可靠性和有效性。
下面是我在问卷设计中的几点心得体会。
1.明确调研目的在进行市场调查前,我们首先需要明确调研目的。
只有明确了调研目的,才能有针对性地设计问卷,从而获得准确的数据。
同时,在问卷设计中,我们要注意问卷内容的全面性和精确性,确保能够全面准确地了解受访者的需求和看法。
2.清晰明了的问题表达问卷设计的问题表达要清晰明了,避免使用模糊的词汇和复杂的句子结构。
问题应该简洁明了,容易理解和回答。
对于特定行业或专业领域的问卷设计,我们应避免使用过多的行业术语,以免影响受访者的回答质量。
3.合理的题型选择在问卷设计中,合理的题型选择对于获得准确的数据至关重要。
不同的调查目的和调查对象适合不同的题型。
例如,如果要了解受访者的态度和看法,可以选择开放性题目,让受访者自由表达;如果要获取具体的信息或数据,可以选择封闭性题目,提供选项供受访者选择。
此外,还可以使用量表题,来衡量受访者的观点、态度或满意度等。
4.合理的题目顺序题目的顺序也是问卷设计中需要关注的问题。
通常建议将重要的问题放在前面,以吸引受访者的注意力。
同时,对于敏感或个人隐私问题,可以将其放在问卷的末尾,避免影响受访者对其他问题的回答。
二、数据分析方法问卷调查完成后,我们需要对收集到的数据进行分析,提取有用信息,为进一步的决策提供依据。
下面是我在数据分析方法方面的一些心得体会。
1.数据清洗和整理在进行数据分析前,首先要对数据进行清洗和整理。
这包括检查数据的完整性、一致性和准确性。
对于缺失的数据,可以采用合理的填补方法,如均值填补、多重插补等。
二、多选题和排序题的分析与处理在录入多选题时,每个选项各占一列。
比如,某多选题包含A、B、C、D四个选项,客户选择A就会显示“1”,不选就是“0”。
因此,在录入多选题和排序题时,SPSS或Excel 的列宽会明显宽于单选题,因为每道单选题只有一列,而多选题和排序题则包含多列。
多选题和排序题的分类,如图22所示。
图22 多选题和排序题分类1.不定项多选题的处理方式例如,为子女选择学校时的考虑因素,备选项包括口碑、风格、升学率和交通四个方面,该题目是一道不定项选择和排序题。
编码处理在处理不定项多选题时,通常采用“0-1”编码进行处理,即为每个选项单独设立一个变量,本例可设定a1m1、a1m2、a1m3、a1m4四个变量,分别代表口碑、风格、升学率、交通四个备选项。
定义数据集在SPSS的“分析”模块中,找到多重响应,里面有一个“定义变量级”,通过这一操作就能够将不定项多选的四个备选项重新编码,用二分法将其定义成二元值,选择该项定义为“1”,不选默认为“0”。
然后将这道多选题定义一个新的变量级,重命名为“学校选择”并添加进去,这时系统会在多重响应前添加“$”符号,然后关闭该项。
频率分析随后开始进行分析,进入SPSS的“分析”—“多重响应”,里面提供了频率分析和交叉表分析两种方法。
首先进行频率分析,将多重响应集选进去,然后确定即可。
在输出的结果中可以看到,最右侧的个案百分比表示总共选择的次数,得出的商业结论是:父母在帮孩子选择学校时,第一位考虑的因素是口碑,占比67.5%;第二位考虑的因素是升学率,占比65%;之后是领导风格和交通因素。
这一结论与现实情况比较吻合。
交叉表分析交叉表分析,进入“分析”—“多重响应”—“交叉表”,将父母与孩子的关系选入行中,将多重响应集放入列中,然后选择“确定”,这时就有行、列、总计三行数据,交叉表就完成了。
该交叉表显示的结果与频率分析的结果相同,家长优先考虑的因素依次为占比67.5%的口碑,占比65%的升学率以及领导风格和交通因素。
数据分析与统计软件一、问卷的设计(一)问卷中的题目设计分为单选题和多选题,其中单选题的设计一般采用李克特(Likert)五点量表法。
(二)问卷分析的步骤:拟编预试问卷—预试—整理问卷与编号—项目分析—因素分析—信度分析—再测信度1.项目分析目的:利用t检验方法对预试问卷中的题目进行筛选。
步骤:P41-42(吴)2.因素分析(效度分析、维度分析)(1)探索性因素分析目的:利用因子分析方法(主成分)对预试问卷的效度进行分析。
(2)验证性因素分析目的:利用因子分析方法(主成分)对预试问卷的效度进行验证。
3.信度分析目的:利用信度分析方法对预试问卷调查所得数据的可信性进行分析。
4.再测信度目的:利用相关分析方法对预试问卷的前后两次调查所得数据的可信性进行分析。
二、问卷数据的分析1.多重响应分析:Analyze→Multiple Response作用:分析多项选择题,包括多项选择题题集的定义及频数分析。
特别:列联表分析:Analyze→Descriptive Statistics →Crosstabs 作用:分析属性变量间是否相互独立。
2.均值检验(t-检验)3.方差分析4.协方差分析5.相关分析6.回归分析(路径分析)7.聚类分析多重响应分析多重响应分析也称为多(复)选题分析。
在量化研究中,除了单选题、李克特量表外,常见的回答发生即是复选题。
所谓复选题即是题目的可选答案不止一个,答案的选项可以多重选择或者题项可勾选其中多个选项。
下面是一份问卷(其中部分):1.您的性别:□男□女2.您对数学学习的兴趣:□非常感兴趣□一般□无兴趣3.您平时喜欢的文学作品:(1)□外国的(2)□中国的(3)□古代的(4)□近代的(5)□现代的4.您平时喜欢的体育项目:(1)□爬山(2)□游水(3)□跑步(4)□打篮球其中1、2题为单选题,3、4题为多(复)选题。
下面介绍与单、多选题有关的软件处理方法。
一、变量的编码方法1.对单选题一个题目用一个变量即可。
多选题的6种分析技巧在进行问卷研究时,很多时候都会使用到多选题,多选题很容易理解,而且很多场合时都需要使用多选题进行数据收集。
但当进行分析时会遇见一种尴尬,即只能做最简单的频数,计算个数或者计算下简单的百分比,使得分析比较简单,更谈不上‘高大上’。
今天小编便详细讲解下多选题的‘高大上’分析方法,以及分析的后台原理,并且借助SPSSAU分析平台进行讲述具体如何操作。
计算百分比,普及率和响应率,帕累托图这三种方法都是通过百分比计算,通过不同的展现形式进行分析,相对使用较多。
如果是想使用统计检验的方法进行分析差异性,那么就需要使用CochranQ检验、卡方检验法。
同时还有一种高级的多元统计方法叫对应分析也可以针对多选题进行分析。
接下来咱们结合案例慢慢讲述。
案例当前有一项研究电子商务网购平台的偏好数据,并且想分析学历与网购平台的偏好差异性情况。
总共收集200个样本,数据如下图所示(图中仅列出10个样本数据)。
多选题的数据格式相对较为特殊,1个选项就会占用一列,并且使用数字1表示选择了该项,数字0表示没有选择该项。
本次网购平台偏好这个多选题共有7个选项,因此数据中有7列。
除此之外还有一个学历单选题,单独占一列数据。
学历中的数字,数字1代表本科以下,数字2代表本科,数字3代表硕士,数字4代表博士。
需要特别注意地,多选题的数据格式一定并且只能是这样,一个选项为一列,并且使用数字1表示选择,数字0表示没有选择。
在了解完多选题的数据格式后,接着利用SPSSAU平台进行上述六种分析技巧的说明。
1.计算百分比很容易的想到,通过百分比方式了解研究群体对于网购平台的偏好,是一种很自然的做法。
当前有200个样本,比如有98个选择了拼多多,那么选择比例就是98/200=49%,类似其它6项也一样,这种计算百分比的方法最为简单,使用也最多,而这种百分比在专业上称作‘普及率’。
具体SPSSAU的操作如下图:上图展示了各项的选择比例,‘天猫’的占比最高为49%,即说明网购平台中天猫的使用率最高,其次是‘京东’,占比是40.5%。
多选题研究方法
多选题研究方法是一种常用的调查研究方法,它可以通过问卷调查、在线调查等方式收集数据。
多选题通常包括多个选项,被调查者可以选择一个或多个选项作为回答。
在进行多选题研究时,需要注意以下几点:
1. 选项设计:选项应该涵盖所有可能的答案,并且应该清晰明了,不应出现模糊或歧义的选项。
2. 选项数量:选项数量要适中,太少会导致信息不全面,太多会让被调查者感到困扰。
3. 选项排列:选项应该按照逻辑顺序排列,不应该出现无序或混乱的情况。
4. 问题设计:问题需要简洁明了,不应该出现复杂的问题或双重否定等。
5. 数据分析:在收集数据后,需要对数据进行分析,可以使用统计学方法对数据进行筛选、分类、归纳和分析。
多选题研究方法在社会科学、医学、市场研究等领域广泛应用,它可以帮助研究者了解被调查者的态度、行为和需求,为决策提供有价值的参考。
- 1 -。
问卷多选题如何分析?展开全文在进行问卷研究时,为了更全面地了解研究内容与研究对象,经常会在问卷中加入多选题。
但就目前来看多数人在分析多选题时,方法仅限于频数分析,这容易使问卷中很多有价值的信息得不到深入的分析与研究。
那么,该怎么做,才能让多选题真正发挥其价值呢?01. 多选题的录入俗话说得好,“工欲善其事,必先利其器”。
分析问题之前,首先要保证录入格式的正确、录入的数据无误,这样分析得出的结果才真实可靠。
当然,如果是直接从问卷星/问卷网这类的问卷平台上直接下载的问卷,直接分析就可以,不用再担心有额外的录入工作。
如果是手动录入问卷,录入步骤具体参照下图:例:(多选题)“您通过从哪些途径了解高校的信息?”1. 父母或亲友2. 已毕业学长/学姐3. 网络4. 学校老师5. 同级同学或朋友6. 咨询机构(1)上图中一行代表一份问卷(被试或样本),ID是编号列,防止录入出错以便进行检查(2)2~7列为多选题的六个备选项,有几个选项就需要录入几列,选择录入为1,不选择录入为0(3)整理好表格后就可以上传到SPSSAU平台开始进行分析02. 多选题的分析多选题一般从两个方面分析:一是分析单个多选题选项的分布情况,二是与其他变量做交叉分析。
SPSSAU共提供多选、单多、多单和多多分析,四种分析方法,下面来具体说明如何操作分析:(1)多选题选项间差异此方法用于分析一个多选题不同选项之间的差异情况。
分析时需要将一个多选题的所有选项一起放入分析框里。
操作步骤为:点击问卷研究>多选题,放入选项,点击“开始多选题分析”。
SPSSAU-多选题一个多选题分析输出结果:(非真实数据)普及率柱状图响应率饼图分析结果:(1)第一步,分析响应率情况响应率用于对比各个选项的相对选择比例情况。
如25.9%=53/205,即通过父母与亲友了解学校信息的占总选择次数的比例,响应率加起来为100%。
(2)第二步,分析普及率普及率即该选项人数占总人数的百分比,如70.7%=53/75,即选择了“父母与亲友”这一选项的人数占总人数的比例,普及率加和通常会高于100%。
问卷调查的常用统计分析方法问卷调查的方法用得很广泛,对于没有接触过spss的人第一步面临的就是问卷编码问题,有很多外专业的同学都在问这个问题,现在通过举例的方法详细讲解如下,以方便第一次接触SPSS 的同学也能做简单的分析。
后面还有分析时的操作步骤,以及比较适用的深入统计分析方法的简单介绍。
调查分析问卷回收,在经过核实和清理后就要用SPSS做数据分析,首先的第一步就是把问题编码录入。
SPSS的问卷分析中一份问卷是一个案,首先要根据问卷问题的不同定义变量。
定义变量值得注意的两点:一区分变量的度量,Measure的值,其中Scale是定量、Ordinal是定序、Nominal 是指定类;二注意定义不同的数据类型Type各色各样的问卷题目的类型大致可以分为单选、多选、排序、开放题目四种类型,他们的变量的定义和处理的方法各有不同,我们详细举例介绍如下:问卷调查的方法用得很广泛,对于没有接触过spss的人第一步面临的就是问卷编码问题,有很多外专业的同学都在问这个问题,现在通过举例的方法详细讲解如下,以方便第一次接触SPSS的同学也能做简单的分析。
后面还有分析时的操作步骤,以及比较适用的深入统计分析方法的简单介绍。
自己写的,错误之处请指正,调查分析问卷回收,在经过核实和清理后就要用SPSS做数据分析,首先的第一步就是把问题编码录入。
SPSS的问卷分析中一份问卷是一个案,首先要根据问卷问题的不同定义变量。
定义变量值得注意的两点:一区分变量的度量,Measure的值,其中Scale是定量、Ordinal是定序、Nominal 是指定类;二注意定义不同的数据类型Type各色各样的问卷题目的类型大致可以分为单选、多选、排序、开放题目四种类型,他们的变量的定义和处理的方法各有不同,我们详细举例介绍如下:1 、单选题:答案只能有一个选项例一当前贵组织机构是否设有面向组织的职业生涯规划系统?A有 B 正在开创C没有D曾经有过但已中断编码:只定义一个变量,Value值1、2、3、4分别代表A、B、C、D 四个选项。
问卷调查多选题处理方法在问卷调查中经常涉及到多选题,对多选题的处理显得非常关键,本部分主要介绍多选题的常用处理方式。
例,关于学生关于爱情观的调查。
我们有如下的变量Age:学生的年龄;Location:学生家庭住址; 1 '家在城市' 2 '家在农村'Vf:父亲职业;“1”'工人,“2”农民,“3”教师“4”干部,“5”'医生等“ 6”无正式工作;Vm:母亲职业:“1”工人,“2”农民,“3”教师“4”干部,“5”'医生等“ 6”无正式工作;like1:业余爱好之一like2:业余爱好之二like3:业余爱好之三“1”听戏看电影“2”看小说读报1“3”唱歌跳舞“4”交朋友“5”下棋打牌“6”打球“7”其它Bz:最先择偶标准Sex:学生性别;“1”男生“2”女生ZY:择业途径:“1”靠父母“2”靠亲朋“3”学校推荐“4”自荐“5”其他XD:兄弟姐妹QJ:全家人口YINC1:父母月收入YINC2:全家月收入PAY1:月伙食费PAY2:月娱乐费PAY3:月购书费ZO1:择偶标准1:“1”相貌“2”文化水准“3”气质风度“4”志同道合“5”人品“6”家庭条件“7”本人收入“8”其他2ZO2:择偶标准2ZO3:择偶标准3WILL:毕业打算。
“1”深造“2”任教“3”科研单位“4”到国企“5”去公司“6”去乡镇企业“7”其他。
多选题基本编码方法有如下两种。
1. 二分类法:当所设计的多选题选择项不多的情况下,通常采用二分类法对多选题进行编码。
基本方式是,多选题有多少个选择项就设计多少个变量,每个变量的取值非0即1。
如:确诊高血压后,您按医生的建议采取了哪些非药物控制措施?31、调整饮食2、做适量运动3、保持情绪稳定4、其他措施分析:此处四个选项,则spss应相应设计四个变量,可计为x1(方法1),x2(方法2),x3(方法3),x4(方法4),若选择了其中某项,则该变量的取值为1,否则为0。
调研问卷中多选题的分析方法探讨引子使用调研问卷的定量研究中,为了更全面地了解研究内容、更广泛地收集信息,经常会用到多选题,但由于多选题多指向性的特点,除了频数表和交叉表(只能与单选题做交叉),较少用到其他的分析方法,损失了很多有用的信息。
其实,如果调研时能善用多选题,并在分析时选取适当的方法,就能够充分利用多选题包含的信息,得到更有价值的结论。
本篇主要探讨带有分类性质的多选题,如何进行深入分析,得出分类相关的结论,也可以对各类别进行排序。
带有分类性质的多选题一般而言,在设置多选题时,并没有想到分类,只是想了解各种情况的排序情况。
其实,某些多选题,已经隐含了分类的信息,透过这种潜在的分类信息,能够更深入地了解用户的内在想法、心理特征,甚至推测他们的行为习惯,与其他行为题目相互照应。
带有分类价值的多选题一般具备以下几个特征:1、题干本身包含分类的含义,如最常遇到的障碍、最亟待解决的问题、最需要的功能、最常用的工具等,或直接询问:哪些服务最适合划分为一类。
2、选项涵盖内容较分散,如果选项都是集中某一个细节层面,那就没有分类的必要;只有当选项内容包含多个方面的细节点,且每个方面不止一个细节点,才有分类的必要。
此时的方面、细节需根据业务辩证地看,主要取决于选项是否有分类的意义。
3、选项一般超过10个,选项太少没有分类的必要,只有超过一定数量,分类才有价值,分类的目的是为了通过细节概括出看问题的维度,更深入地解读用户心理或行为。
4、限选,这不是必须的,主要根据经验判断,用户在做选择时,是否会倾向于全选,跟题干的问法有关。
无法做出准确判断,且需要对选项做出优先级排序时,通常采用限选的方式,可以根据研究目的,限定全部选项数量的一半,或1/3。
5、数据为0/1格式,即每个选项一个变量,选中为1,未选中为0,多选题转换成此种格式,宜于做深入分析。
当有了带有分类价值的多选题,就可以采用下文介绍的方法进行深入分析。
本文中的例子是半年前做过的一次定量调研,带有分类价值的多选题,主要考察:淘宝卖家在经营店铺时,最需要的功能。
聚类分析首先,采用谱系聚类(Hierarchical cluster)的分析方法,为了使得变量的分类趋于均匀,选择Ward’s法,二分类变量(Binary)欧式平方距离(Squared Euclidean distance)测距方法,查看相应的统计量(略),并结合业务,找出分类数。
谱系聚类的树状图查看分类结果比较清楚,也比较方便,建议多用。
综合分析可知,本例的卖家功能划分五类或七类比较合适,但个别分类不易解释,且出现单个类别中只有一个功能,后续应用的价值有限。
因子分析聚类分析结果不理想,也可以采用因子分析的方法。
经多次尝试,17个变量中去掉“直通车关键字检索”,单独成为一类。
剩余变量利用主成分分析法(Principal components),方差最大正交旋转(Varimax)进行运算,得到KMO 值为0.545,Bartlett 球形检验的值为1041.324(df=120)达到显著,表明可以做因子分析。
最终萃取出7个公因子,累积方差贡献率为55.1%(详见下表),解释效果尚可。
结合业务来看,这些分类能够很好地被解释,从而反映出卖家的心理特征和需求方向。
注:由于本例是多选题,并非量表打分题,且侧重考查的不是变量间的建构效度,仅借用了因子分析的方法进行分类,因此KMO检验和累积方差贡献率的具体值,并没有真正的因子分析那么重要,但必须要查看,甚至需要做信度检验,也要查看重构的相关矩阵残差值,做到心中有数,知其然也要知其所以然。
本例中,重构的相关矩阵中,有超过半数残差值大于0.05,如果按照真正的因子分析模型来判断,拟合效果并不好。
相关分析还有一种简单易行的方法,就是相关分析。
经统计学家研究表明,0/1变量同样适用于皮尔逊相关系数(Pearson Correlation)。
本例将17个功能做相关分析,得到简化的相关矩阵如下表:根据研究目的,此表只需看正向、且相关非常显著的选项即可,但17*17个表格中127个有关联,如何做深入分析呢?根据选项间的关系强弱、是否显著等,可以画出图形,如此,就可以清晰地看出各选项之间的关系,进行分类。
本例中,此种方式的分类结果(如下图),易于解释,且分类数量恰当,便于后续应用。
三种方法所得结果的对比以上提到的三种方法,所得结果如下表:可以看出,聚类分析的结果容易出现不易解释的分类,因子分析的结果划分得更细化,相关分析的结果可以根据需要,在一定范围内进行调节,得出适当的分类数量。
不同的案例,应该多尝试不同方法,即便相关分析的结果最可靠,其他方法的结果也能起到补充的作用,以获得更加有价值的研究结论。
进一步的应用得到合理的分类后,还可以结合选项的频率,给每一个类别赋值,得到类别的优先级排序。
如果最终选定了因子分析的分类结果,单个类别中每个选项的权重可以由因子载荷计算而来;当然,也可以跟聚类分析、相关分析的结果一样,采用算数平均、或加权平均的方法,计算每个类别的平均值。
小结综上所述,带有分类性质的多选题,分析的流程如下:1、确定是否有带有分类价值的变量;2、尝试多种方法进行分析,找出最合理的分类;3、利用加权平均,或其他方法,计算每个类别的比例,进行排序。
;4、使用关键变量(如星级、注册时长等)对样本总体分群,查看各细分群体在多选题分类上的差异,深入分析。
带有求和性质的多选题问卷调研中,常会通过多选题考察用户在某个方面的多样性、或意识、能力等,此时,选项求和所得总分能够反映用户在这个方面的综合情况,也是一种分析问题的方法。
其实,带有求和性质的题目,多半是由量表题转换而来,而量表题涉及到N级量表,相当于每个项目(选项)都是一个题目,为了节约用户的填答成本,常用多选题代替。
当然,量表题的相关选项求和,更能反映用户在某一方面的综合水平,此不赘述。
带有求和性质的多选题一般具备以下几个特征:1、题目本身具有求和的价值,如卖家常用的第三方服务工具(考察工具应用的多样性)、卖家日常采用的安全保护措施(考察预防意识)、用户常用的网络功能(考察网络使用能力)等,这类题目的选项求和所得总分,对于综合分析问题有一定的参考价值。
2、选项涵盖的内容较全面,选项应该尽量包含考察方面的主要细节点,如果考察的方面,范围相对较窄,最好能够穷尽主要细节点;如果考察的方面,范围相对较广,最好能由浅入深、或同级区隔,分成若干层面,逐个选取主要细节点。
3、选项一般超过5个,选项太少没有求和的必要,只有超过一定数量,求和才有价值,求和的目的是为了通过归纳的方式,从总体认知的角度,概括地解读用户的行为或心理。
4、通常不限选,如果限选,求和后,总分值差距不大,不易找出样本在考察方面的差异,很难达到综合评估的目的。
5、数据为0/1格式,即每个选项一个变量,选中为1,未选中为0,多选题转换成此种格式,宜于做深入分析。
当有了带有求和性质的多选题,就可以采用下文介绍的方法进行深入分析。
本文中两个网络问卷调研的例子,分别是上个季度做的《卖家安全需求调研》,研究模型中用一道多选题,考察了卖家安全保护措施的意识;四年前写毕业论文《生活形态与即时通讯使用的关联性研究》时,基础题目中用一道多选题,考察了网民对网络的使用能力。
直接求和直接求和的方法非常简单,由于多选题选项的数据是0/1格式,直接加和后,即可表示在考察方面,样本的总得分,反映综合水平。
卖家安全保护措施意识的案例,稍微复杂一些,因为选项含有互斥关系,各选项的频率如下表:求和时,不能直接相加,需要简单处理一下,因为“没有什么预防或应急措施”与其他答案互斥,有两种处理方法:1、将“没有什么预防或应急措施”的答案0/1做反向处理(recode处理:0变1、1变0),之后所有选项加和,若总分为0,则表示“安全预防意识”为0,若总分大于0,则表示采取了一定的措施,反映了安全预防意识的程度;2、根据情况计算总分,若“没有什么预防或应急措施”被选中,则选项加和变量直接为0;若“没有什么预防或应急措施”未被选中,则剩余选项加和求得总分。
此时,选项加和的结果与方法1相同。
本例中,卖家总体的安全预防意识平均值为2,结合总分的分布图也可以看出,卖家的安全预防意识并不强,手段比较单一,风险较高。
跟其他变量交叉分析后,也可以分析出各细分群体,在安全预防意识方面的差异。
直接求和,除了需要注意选项间的互斥情况,最重要的是要判断,各选项对于考察方面,是否处于同等级别,近似平等。
用案例来说,就是每个选项中的措施代表安全预防意识的程度相近,而并非某个措施的难度特别大,或非常不易达成。
如果各选项对于考察方面,并非处于同等级别,不能近似平等,那么就需要采用其他的求和方法。
加权求和考察网民对网络的使用能力,如果直接询问被访者,“网络使用能力达到什么水平?”,可能不易得到可靠的数据,可以间接地采用多选题的方式,请被访者选出懂得如何操作的网络应用,选项应该包含初、中、高级的网络应用,以便全面评估。
由于初、中、高级的网络应用之间,级别不同等,不能近似平等,也就不能直接求和,简单相加会造成很大误差,不能如实反映网络使用能力。
因此,先对选项进行信度检验,然后通过加权法,对需要能力较高的网络应用给予比较大的权数,能力要求不太高的网络应用给予较小的权数。
如此,得到的加权后总分越高,表示网络使用能力越高。
在实践中经常采用的加权方法是,将直接测量值x(得分或比例等)转化为标准正态得分Z,再转化为加权值W,即可求得描述综合水平的测量值X。
本例中,网络能力多选题的Cronbach’s Alpha信度检验,得到Alpha=0.841,达到较高水平;然后将各项的样本比例P转化成标准正态得分Z,由Z的相对大小来决定加权数W,即可计算出每个样本的网络使用能力。
分析可知,样本的网络使用能力均值为27.9,标准差为12.96。
计算过程如下表:利用总分进行分组求和得到总分后,可以对样本进行分组,一般会找出高分组和低分组,对比高低分组在其他关键变量的情况,也是一种分析问题的视角。
对总分进行分组通常有两种方法:1、高分组的下限可以是(均值+1个标准差);低分组的上限可以是(均值−1个标准差),一般这种方法求得的高低分组的样本量,均不一定会达到样本总量的1/4,需根据研究目的判断是否合适。
研究小众产品时,可用此方法。
2、另一种方法,是将总分升序排列,从上往下,在样本总量27%的位置记录样本得分,作为低分组的上限临界值;从下往上,在样本总量27%的位置记录样本得分,作为高分组的下限临界值。
这种方法得到的高低分组的样本量,能满足大部分研究的需要。
研究大众产品时,可用此方法。
小结综上所述,带有求和性质的多选题,分析的流程如下:1、确定多选题的选项求和后,总分是否存在解读价值、应用价值;2、根据选项的特点,选取适当的求和方法:直接求和、加权求和;3、使用关键变量(如星级、注册时长等)对样本总体分群,查看各细分群体在多选题总分上的差异,深入分析;或利用总分对样本进行分组,重点分析高低分组在其他变量上的表现。