SPSS第七章第1题作业讲解
- 格式:doc
- 大小:37.50 KB
- 文档页数:2
第7章多选项分析在前面第4章我们已经接触了问卷调查,在问卷调查的问题中,有这样一类特殊的问题,它允许被调查者选择不止一个选项,这种问题被称为多选项问题。
多选项问题是问卷调查中一项比较特别的技术,甚至在许多问卷中是必不可少的组成部分,它对于了解被调查者的对某个问题的次要选择或者平行选择有非常重要的作用。
例如:我们看下面的问题:在这个问题中,被调查者去超市可能有一个主要原因,比如4. 质量好,但是可能不止一个原因,比如除了 4. 质量好以外,2. 价格便宜也是一个原因,此时调查次要原因对于调查来说也是重要的;甚至有时被调查者自己都不确定在这些原因中究竟哪个是最重要的原因,此时这些原因就成为平行原因,应该把这些原因尽可能多的调查到。
允许消费者选填多个选项是一种不错的选择,此时就可以将问题设置成多选项问题,便于我们更全面了解被调查者的情况。
多选项问题在调查时便于我们了解全面的信息,但是如何在分析时将这些信息挖掘出来呢?利用传统的频数分析和描述统计对信息的挖掘是不完全的。
假如我们针对上面的问题,由于可以有三个选择,我们对应设置3个问题,对三个问题分别统计。
此时问题来了,不是每个被访者都选择三个问题,这将导致第2、3问题出现一些缺省数据,影响分析;另外,如果一个问题一个问题分析,也缺乏从整体上了解这个问题全貌的角度,对信息的提取是不充分的。
有没有一种能同时克服这两个缺点的方法呢?回答是肯定的,那就是SPSS多选项分析。
仔细研究多选项分析的备选答案,我们发现有些题的备选答案是有顺序的,例如:对多个品牌的了解就需要按照熟悉程度进行排序;而有些题的备选答案是没有顺序的,例如,上面举例的问题备选答案就是无序的。
对这两类多选项问题进行分析时要注意各自特点,采取不同的编码处理。
对应多选项问题,通常采用的方法都是:第一步、将多选项问题分解;第二步、由于多选项问题多是分类变量,即名义尺度变量,因此利用前面讲过频数分析和列联表分析可以得到分析结果。
一、问题分析:题目要求判断各裁判的相似性,故采用个案之间的相似性测量和不相似性测量分析。
二、操作步骤:Analyze -->Correlate -->Distances -->Measures-->Continue-->OK 三、结果分析:⏹个案之间的相似性分析结果表格1:个案之间的相似性根据相似性判断,数据越大,相似性越好,观察数据得知:1)裁判员1-7和裁判员8的结果较不太一致,裁判员1-7之间的结果类似。
2)其中4号和2号最接近。
7和8的相似性最差。
⏹个案之间的不相似性分析结果表格2:个案之间的不相似性根据不相似性判断,数据越小,即欧氏距离越小,相似性越好,观察数据得知:1)裁判员1-7和裁判员8的结果较不太一致,其中4号和2号欧氏距离最小。
2)裁判员1,3,5,6,7之间的欧氏距离差不多。
7和8的欧氏距离最大。
◆裁判员1-7和裁判员8的结果较不太一致。
◆其中4号和2号最接近。
7和8的相似性最差。
习题7-5一、问题分析:题目要求判断不同产业与国名总收入之间的相关关系,故采用个案之间的偏相关分析。
二、操作步骤:Analyze -->Correlate -->Partial -->Option-->Continue-->OK三、结果分析:⏹各产业与国民收入之间的Pearson简单相关系数表格3:各产业与国民收入之间的Pearson简单相关系数观察数据得知:1)v3(第三产业)和v4(国民总收入)的Pearson简单相关系数最大为0.934,两者为正相关关系,相伴概率为0.000。
2)v1(第一产业) 和v4(国民总收入)的Pearson简单相关系数最小为0.329,相伴概率为0.088,大于显著性水平,说明两者之间不存在显著的线性相关关系。
⏹剔除其他产业变量影响条件下,各产业与国民收入之间的相关性表格4:各产业与国民收入之间的相关性观察数据得知:1)剔除其他产业的影响后,v3(第三产业)和v4(国民总收入)的相关系数最大为0.868,相伴概率为0.000。
《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第7章SPSS的非参数检验1、为分析不同年龄段人群对某商品满意程度的异同,进行随机调查收集到以下数据:满意程度年龄段青年中年老年很不满意126 297 156不满意306 498 349满意88 61 75很满意27 17 44请选择恰当的非参数检验方法,以恰当形式组织上述数据,分析不同年龄段人群对该商品满意程度的分布状况是否一致。
卡方检验步骤:(1)数据→加权个案→对“人数”加权→确定(2)分析→描述统计→交叉表格→行:满意度;列:年龄→Statistics→如图选择→确定满意程度 * 年龄交叉表计数年龄总计青年中年老年满意程度很不满意126 297 156 579 不满意306 498 349 1153满意88 61 75 224很满意27 17 44 88 总计547 873 624 2044卡方检验值自由度渐近显著性(双向)皮尔逊卡方66.990a 6 .000似然比(L) 68.150 6 .000线性关联.008 1 .930McNemar-Bowker 检验. . .b有效个案数2044a. 0 个单元格 (0.0%) 具有的预期计数少于 5。
最小预期计数为 23.55。
b. 仅为 PxP 表格计算(其中 P 必须大于 1)。
因概率P值小于显著性水平(0.05),拒绝原假设,不同年龄度对该商品满意程度不一致。
2、利用第2章第7题数据,选择恰当的非参数检验方法,分析本次存款金额的总体分布与正态分布是否存在显著差异。
分析→非参数检验→旧对话框→1-样本-K—S…→选择相关项:本次存款金额[A5] →确定结果如下:单样本 Kolmogorov-Smirnov 检验本次存款金额数字282正态参数a,b平均值4738.09标准偏差10945.569最极端差分绝对.333正.292负-.333检验统计.333渐近显著性(双尾).000ca. 检验分布是正态分布。
满意程度青年中年老年合计比率
很不满意126 297 156 579 0.283268 不满意306 498 349 1153 0.56409
满意88 61 75 224 0.109589 很满意27 17 44 88 0.043053
合计547 873 624 2044 1
要分析不同年龄段人群对该商品满意程度的分布状况是否一致?
在全部2044个样本中,对该商品满意程度的分布状况:很不满意的个案有579个,占总数的28.3268%;不满意的个案有1153个,占总数的56.409%;满意的个案有224个,占总数的10.96%;很满意的个案有88个,占总数的4.305%。
从逻辑上讲,如果各种不同年龄段人群对该商品满意程度的分布状况是一致的话,那么,不论青年、中年、老年不同年龄段人群对该商品满意程度的分布都应是很不满意占
28.3268%;不满意占56.409%;满意的占10.96%;很满意的占4.305%。
一、原假设Ho:青年人群对该商品满意程度的分布是很不满意占28.3268%;不满意占56.409%;满意的占10.96%;很满意的占4.305%。
如果显著性水平 =0.05,由于概率P值小于0.05,故拒绝原假设Ho。
二、原假设Ho:中年人群对该商品满意程度的分布是很不满意占28.3268%;不满意占56.409%;满意的占10.96%;很满意的占4.305%。
如果显著性水平α=0.05,由于概率P值小于0.05,故拒绝原假设Ho。
三、原假设Ho:老年人群对该商品满意程度的分布是很不满意占28.3268%;不满意占56.409%;满意的占10.96%;很满意的占4.305%。
如果显著性水平α=0.05,由于概率P值小于0.05,故拒绝原假设Ho。
不同年龄段人群对该商品满意程度的分布状况是不一致。