第4章 SPSS基本统计分析(课后练习参考)
- 格式:doc
- 大小:239.50 KB
- 文档页数:4
《统计分析与SPSS的应用》课后练习答案在学习《统计分析与 SPSS 的应用》这门课程后,通过课后练习能够帮助我们更好地掌握所学知识,并将其应用到实际的数据分析中。
以下是针对部分课后练习的答案及解析。
一、选择题1、在 SPSS 中,用于描述数据集中变量分布特征的统计量是()A 均值B 标准差C 中位数D 众数答案:ABCD解析:均值、标准差、中位数和众数都是描述数据分布特征的常用统计量。
均值反映了数据的集中趋势;标准差反映了数据的离散程度;中位数是将数据排序后位于中间位置的数值;众数则是数据集中出现次数最多的数值。
2、进行独立样本 t 检验时,需要满足的前提条件是()A 样本来自正态分布总体B 两样本方差相等C 两样本相互独立D 以上都是答案:D解析:独立样本 t 检验要求样本来自正态分布总体、两样本方差相等以及两样本相互独立。
只有在这些条件满足的情况下,t 检验的结果才是可靠的。
3、以下哪种方法适用于多组数据的比较()A 单因素方差分析B 配对样本 t 检验C 相关分析D 回归分析答案:A解析:单因素方差分析用于比较三个或三个以上组别的数据是否存在显著差异。
配对样本 t 检验适用于配对数据的比较;相关分析用于研究变量之间的线性关系;回归分析用于建立变量之间的预测模型。
二、简答题1、请简述 SPSS 中数据录入的基本步骤。
答:SPSS 中数据录入的基本步骤如下:(1)打开 SPSS 软件,选择“新建数据文件”。
(2)在变量视图中定义变量的名称、类型、宽度、小数位数等属性。
(3)切换到数据视图,按照定义好的变量逐行录入数据。
(4)录入完成后,保存数据文件。
2、解释相关分析和回归分析的区别。
答:相关分析主要用于研究两个或多个变量之间的线性关系程度和方向,但它并不确定变量之间的因果关系。
相关分析的结果通常用相关系数来表示,如皮尔逊相关系数。
回归分析则不仅可以确定变量之间的关系,还可以建立数学模型来预测因变量的值。
WORD 格式整理《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第 4 章 SPSS基本统计分析1、利用第2章第7题数据采用SPSS频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘制条形图。
分析——描述统计——频率,选择“常住地”,“职业”和“年龄”到变量中,然后,图表——条形图——图表值(频率)——继续,勾选显示频率表格,点击确定。
Statistics户口所在职业年龄地Valid282282282NMissing000户口所在地Frequency Percent Valid CumulativePercent Percent中心城市20070.970.970.9 Valid 边远郊区8229.129.1100.0Total282100.0100.0职业Frequency Percent Valid CumulativePercent Percent 国家机关248.58.58.5商业服务业5419.119.127.7文教卫生18 6.4 6.434.0公交建筑业15 5.3 5.339.4Valid 经营性公司18 6.4 6.445.7学校15 5.3 5.351.1一般农户3512.412.463.5种粮棉专业4 1.4 1.464.9户WORD 格式整理种果菜专业10 3.5 3.568.4户工商运专业3412.112.180.5户退役人员17 6.0 6.086.5金融机构3512.412.498.9现役军人3 1.1 1.1100.0Total282100.0100.0年龄Frequency Percent Valid CumulativePercent Percent20 岁以下4 1.4 1.4 1.420~35 岁14651.851.853.2 Valid 35~50 岁9132.332.385.550 岁以上4114.514.5100.0Total282100.0100.0分析:本次调查的有效样本为282 份。
《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第4章SPSS基本统计分析1、利用第2章第7题数据采用SPSS频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘制条形图。
分析一一描述统计一一频率,选择“常住地” ,“职业”和“年龄”到变量中,然后,图表一一条形图一一图表值(频率)一一继续,勾选显示频率表格,点击确定。
种果菜专业户工商运专业户退役人员金融机构现役军人Total103417353282年龄|Freque ncy Perce nt ValidPerce ntCumulativePerce nt 20岁以下420~35 岁146Valid 35~50 岁9150岁以上41Total282■■-■I T d ItlSi祷分析:本次调查的有效样本为282份。
常住地的分布状况是:在中心城市的人最多,有200人,而在边远郊区只有82人;职业的分布状况是:在商业服务业的人最多,其次是一般农户和金融机构;年龄方面:在35-50岁的人最多。
由于变量中无缺失数据,因此频数分布表中的百分比相同。
2、利用第2章第7题数据,从数据的集中趋势、离散程度以及分布形状等角度,分析被调查者本次存款金额的基本特征,并与标准正态分布曲线进行对比。
进一步,对不同常住地储户存款金额的基本特征进行对比分析。
分析一一描述统计一一描述,选择存款金额到变量中。
点击选项,勾选均值、标准差、方差、最小值、最大值、范围、偏度、峰度、按变量列表,点击继续一一确定。
分析:由表中可以看出,有效样本为282份,存(取)款金额的均值是,标准差为,峰度系数为,偏度系数为。
与标准正态分布曲线进行对比,由峰度系数可以看出,此表的存款金额的数据分布比标准正态分布更陡峭;由偏度系数可以看出,此表的存款金额的数据为右偏分布,表明此表的存款金额均值对平均水平的测度偏大。
分析:由表中可以看出,中心城市有200人,边远郊区为82人。
两部分样本存取款金额均呈右偏尖峰分布,且边远郊区更明显。
第4章 SPSS基本统计分析(课后练习参考)1、利用习题二第6题数据,采用SPSS数据筛选功能将数据分成两份文件。
其中,第一份数据文件存储常住地是“沿海或中心繁华城市”且本次存款金额在1000至5000之间的调查数据;第二份数据文件是按照简单随机抽样所选取的70%的样本数据。
第一份文件:选取数据数据——选择个案——如果条件满足——存款>=1000&存款<5000&常住地=沿海或中心繁华城市。
第二份文件:选取数据数据——选择个案——随机个案样本——输入70。
2、利用习题二第6题数据,将其按常住地(升序)、收入水平(升序)、存款金额(降序)进行多重排序。
排序数据——排序个案——把常住地、收入水平、存款金额作为排序依据分别设置排列顺序。
3、利用习题二第4题的完整数据,对每个学生计算得优课程数和得良课程数,并按得优课程数的降序排序。
计算转换——对个案内的值计数输入目标变量及目标标签,把所有课程选取到数字变量,定义值——设分数的区间,之后再排序。
4、利用习题二第4题的完整数据,计算每个学生课程的平均分以及标准差。
同时,计算男生和女生各科成绩的平均分。
方法一:利用描述性统计,数据——转置学号放在名称变量,全部课程放在变量框中,确定后,完成转置。
分析——描述统计——描述,将所有学生变量全选到变量框中,点击选项——勾选均值、标准差。
先拆分数据——拆分文件按性别拆分,分析——描述统计——描述,全部课程放在变量框中,选项——均值。
方法二:利用变量计算,转换——计算变量分别输入目标变量名称及标签——均值用函数mean完成平均分的计算,标准差用函数SD完成标准差的计算。
数据——分类汇总——性别作为分组变量、全部课程作为变量摘要、(创建只包含汇总变量的新数据集并命名)——确定5、利用习题二第6题数据,大致浏览存款金额的数据分布状况,并选择恰当的组限和组距进行组距分组。
根据存款金额排序,观察其最大值与最小值,算出组数和组距。
...《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第4章SPSS基本统计分析1、利用第2 章第7 题数据采用SPSS频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘制条形图。
分析——描述统计——频率,选择“常住地”,“职业”和“年龄”到变量中,然后,图表——条形图——图表值(频率)——继续,勾选显示频率表格,点击确定。
Statistics户口所在职业年龄地282 282 282 Valid NMissing户口所在地FrequencyPercentValid CumulativePercentPercent70.9 200 70.9 70.9 中心城市100.082 29.1 29.1 Valid边远郊区100.0Total100.0282职业FrequencyPercentValid CumulativePercentPercent8.5 8.5 国家机关8.5 2427.7 19.1 商业服务业54 19.134.0 18 6.4 6.4 文教卫生39.4 公交建筑业15 5.3 5.3 45.7 6.4 经营性公司Valid18 6.451.1 15 5.3 5.3 学校63.5 12.4 35 12.4 一般农户棉种粮专业64.9 1.44 1.4 户......种果菜专业10 3.5 3.5 68.4 户工商运专业80.5 12.1 34 12.1 户退役人员86.5 17 6.0 6.0金融机构98.9 35 12.4 12.4现役军人3 1.1 1.1 100.0Total282100.0100.0年龄FrequencyPercentValid CumulativePercentPercent1.4 4 1.4 20 岁以下1.453.2 51.8 20~35 岁146 51.885.5 32.3 91 35~50 Valid岁32.3100.014.5 41 岁以上50 14.5100.0Total 282 100.0......分析:本次调查的有效样本为282份。
第三章
1、利用习题二第6题数据,采用SPSS数据筛选功能将数据分成两份文件。
其中,第一份数据文件存储常住地是“沿海或中心繁华城市”且本次存款金额在1000至5000之间的调查数据;第二份数据文件是按照简单随机抽样所选取的70%的样本数据。
第一份文件:选取数据数据——选择个案——如果条件满足——存款>=1000&存款<5000&常住地=沿海或中心繁华城市。
第二份文件:选取数据数据——选择个案——随机个案样本——输入70。
2、利用习题二第6题数据,将其按常住地(升序)、收入水平(升序)、存款金额(降序)进行多重排序。
排序数据——排序个案——把常住地、收入水平、存款金额作为排序依据分别设置排列顺序。
3、利用习题二第4题的完整数据,对每个学生计算得优课程数和得良课程数,并按得优课程数的降序排序。
计算转换——对个案内的值计数输入目标变量及目标标签,把所有课程选取到数字变量,定义值——设分数的区间,之后再排序。
4、利用习题二第4题的完整数据,计算每个学生课程的平均分以及标准差。
同时,计算男生和女生各科成绩的平均分。
方法一:利用描述性统计,数据——转置学号放在名称变量,全部课程放在变量框中,确定后,完成转置。
分析——描述统计——描述,将所有学生变量全选到变量框中,点击选项——勾选均值、标准差。
先拆分数据——拆分文件按性别拆分,分析——描述统计——描述,全部课程放在变量框中,选项——均值。
方法二:利用变量计算,转换——计算变量分别输入目标变量名称及标签——均值用函数mean完成平均分的计算,标准差用函数SD完成标准差的计算。
数据——分类汇总——性别作为分组变量、全部课程作为变量摘要、(创建只包含汇总变量的新数据集并命名)——确定
5、利用习题二第6题数据,大致浏览存款金额的数据分布状况,并选择恰当的组限和组距进行组距分组。
根据存款金额排序,观察其最大值与最小值,算出组数和组距。
转换——重新编码为其他变量——将存款金额作为输出变量——定义输出变量的名称及标签——设定旧值和新值.
6、在习题二第6题数据中,如果认为调查中“今年的收入比去年增加”且“预计未来一两年收入仍会增加”的人是对自己收入比较满意和乐观的人,请利用SPSS的计数和数据筛选功能找到这些人。
转换——对个案的值计数——设定目标变量及标签——将“今年的收入比去年增加”和“预计未来一两年收入仍会增加”两个变量选中——定义值。
7、对习题二第5题数据,选择恰当的加权变量进行加权处理进而还原为原始数据为后续分析做准备。
数据——加权个案——点击加权个案——将人数作为频率变量——确定。
第四章
SPSS基本统计分析
1、利用习题二第6题数据采用SPSS频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘制条形图。
分析——描述统计——频率,选择“常住地”,“职业”和“年龄”到变量中,然后,图表——条形图——图表值(频率)——继续,勾选显示频率表格,点击确定。
2、利用习题二第6题数据,从数据的集中趋势、离散程度以及分布形状等角度,分析被调查者本次存款金额的基本特征,并与标准正态分布曲线进行对比。
进一步,对不同常住地储户存款金额的基本特征进行对比分析。
分析——描述统计——描述,选择存款金额到变量中。
点击选项,勾选均值、标准差、方差、最小值、最大值、范围、偏度、峰度、按变量列表,点击继续——确定。
3、利用习题二第6题数据,如果假设存款金额服从正态分布,能否利用本章所讲解的功能,找到存款金额“与众不同”的样本,并说明理由。
分析——描述统计——描述,选择存款金额到变量中。
对“将标准化得分另存为变量”打上勾,然后对数据编辑窗口中的最后一列变量标准化Z变量进行排序,并观察,找到它的绝对值大于3的都是“与众不同”的样本。
理由:标
准化值反映的是样本值与样本均值的差是几个标准差单位。
如果标准化值等于0,则表示该样本值等于样本均值;如果标准化值大于0,则表示该样本值大于样本均值;如果标准化值小于0,则表示该样本值小于样本均值。
如果标准化值的绝对值大于3,则可认为是异常值。
4、简述SPSS的“Sort”功能与“Split”功能的不同。
“Sort”功能即排序功能,“Split”功能即拆分功能,数据拆分与数据排序很相似,但也有一个重要的不同点,即数据拆分不仅是按指定变量对数据进行简单排序,更重要的是根据指定变量对数据进行分组,它将为以后所进行的分组统计分析提供便利。
5、利用习题二第6题数据,结合被调查者的常住地或职业或年龄状况,分析储户的收入分布特征。
分析——描述统计——交叉表,选择常住地、职业、年龄到行中,选择收入水平到列中,勾选“显示复式条形图”。
点击单元格——选择观测值、期望、行、列、合计。
点击统计量——选择卡方。
点击继续。
确定。
6、三代同堂的家庭中,婆婆与儿媳妇关系紧张的现象并不少见,为了了解住房条件对婆媳关系的影响,对600户家庭进行了调查并进行了列联分析,如下表:
1)补充表中第一行和第四行空缺的计算结果。
差
一般
好Count
577860195Expected Count 48.7568.2578195% within婆媳关系29.23%40.00%30.77%100.00%% within住房条件38.00%
37.14%
25.00%
32.50%
Count
458763195Expected Count
48.7568.2578195% within婆媳关系23.08%44.62%32.31%100.00%% within住房条件30.00%
41.43%
26.25%
32.50%
Count
4845117210Expected Count 52.573.584210% within婆媳关系22.86%21.43%55.71%100.00%% within住房条件32.00%
21.43%
48.75%
35.00%
Count
150210240600Expected Count
150210240600% within婆媳关系25.00%35.00%40.00%100.00%% within住房条件
100.00%
100.00%
100.00%
100.00%
婆媳关系*住房条件Crosstabulation
婆媳关系Total
紧张
一般
和睦
住房条件Total
2) 写出卡方检验的统计量并说明其构造基本原理。
∑-=e
e f f f X 2
02
)( 3) 婆媳关系与住房条件有无联系?
判断婆媳关系与住房条件有无关系:因为P 值为0.000,小于显著性水平0.01,属于高度显著,拒绝原假设,所以婆媳关系与住房条件有关系。
7、 利用习题二第5题资料,分析两种减肥产品所产生的效果分布是否一致。
分析——描述统计——交叉表,选择“产品类型”到行,选择“体重变化”到列。
点击统计量——勾选卡方。
点击单元格——选择观察值、期望值、行、列、总计。
点击继续,确定。
8、下面第一幅图是某班同学对班级体活动满意度调查的部分数据。
其中,t4_1、t4_2、t4_3是分别为你最满意的一次活动、你比较满意的一次活动和你认为最不满意一次活动。
为分析哪次集体活动受到了同学们的广泛认可和满意,根据所获得的数据,可在SPSS 中进行多选项分析。
请问:上面第二幅图所示的窗口是做什么用的?针对上述问题应在该窗口中进行怎样的操作。
答:第二幅图所示的窗口是定义多重响应集用的,根据题目,t4_1、t4_2、t4_3是分别为你最满意的一次活动、你比较满意的一次活动和你认为最不满意一次活动,显示出该问题最多不超过三项,而第一幅图中t4_1、t4_2、t4_3三个变量的备选答案则多于三项,故应选择采用分类法进行多选项分析处理。
9、说明第2章第6题资料中的多选项问题是按照哪种拆分方式拆分的。
利用多选项分析被调查者本次存款的最主要目的是什么。
答:第2章第6题资料的多选项问题是按照分类法拆分的。
目的是为了把多选项问题的分析转化为对多个问题的分析,即对多个SPSS变量的分析。