SPSS操作实验作业1(附答案)
- 格式:doc
- 大小:372.00 KB
- 文档页数:7
spss实践题分析及答案SPSS实践题习题1分析此班级不同性别的学⽣的物理和数学成绩的均值、最⾼分和最低分。
Report性别数学物理男⽣Mean 80.0769 74.5385N 13 13Std. Deviation 5.75125 5.17390Minimum 72.00 69.00Maximum 95.00 87.00⼥⽣Mean 80.7692 76.1538N 13 13Std. Deviation 8.91772 8.32512Minimum 70.00 65.00Maximum 99.00 91.00Total Mean 80.4231 75.3462N 26 26Std. Deviation 7.36029 6.84072Minimum 70.00 65.00Maximum 99.00 91.00结论:男⽣数学成绩最⾼分: 95 最低分: 72 平均分: 80.08物理成绩最⾼分: 87 最低分: 69 平均分: 74.54⼥⽣数学成绩最⾼分: 99 最低分: 70 平均分: 80.77 物理成绩最⾼分: 91 最低分: 65 平均分: 76.15 习题2分析此班级的数学成绩是否和全国平均成绩85存在显著差异。
One-Sample StatisticsNMean Std. Deviation Std. Error Mean数学2680.42317.360291.44347结论:由分析可知相伴概率为0.004,⼩于显著性⽔平0.05,因此拒绝零假设,即此班级数学成绩和全国平均⽔平85分有显著性差异习题3分析市2⽉份的平均⽓温在90年代前后有⽆明显变化。
Group Statistics分组 NMean Std. Deviation Std. Error Mean⼆⽉份⽓温0 11 -4.527273 1.2034043.3628400 118-3.2000001.3006786.3065729结论:由分析可知, ⽅差相同检验相伴概率为0.322,⼤于显著性⽔平0.05,因此接受零假设,90年代前后2⽉份温度⽅差相同。
1.数据文件的建立。
打开SPSS,在数据编辑器的变量视图中,输入变量的属性特征,如Name,Width,Decinmal等。
以习题一为例,输入为下:返回数据编辑库,数据视图,直接录入数据。
习题一的数据表如下:点击Save,输入文件名将文件保存。
2.数据的整理数据编辑窗口的Date可提供数据整理功能。
其主要功能包括定义和编辑变量、观测量的命令,变量数据变换的命令,观测量数据整理的命令。
以习题一为例,将上图中的数据进行整理,以GDP值为参照,升序排列。
数据整理后的数据表为:整理后的数据,可以直观看出GDP值的排列。
3、频数分析。
以习题一为例(1).单击“分析→描述统计→频率”(2)打开“频率”对话框,选择GDP为变量(3)单击“统计量”按钮,打开“统计量”对话框.选择中值及中位数。
得到如下结果:(4)单击“分析→描述统计→探索”,打开“探索”对话框,选择GDP(亿元),输出为统计量。
结果如下:4、探索分析以习题2为例子:(1)单击“分析→统计描述→频率”,打开“频率”对话框,选择“身高”变量。
(2)选择统计量,分别选择百分数,均值,标准差,单击图标。
的如下结果:(3)单击“分析→统计描述→探索”,选择相应变量变量,单击“绘制”,选择如下图表,的如下结果:从上述图标可以看出,除了个别极端点以外,数据都围绕直线上下波动,可以看出,该组数据,在因子水平下符合正态分布。
4.交叉列联表分析:以习题3,原假设是吸烟与患病无关备择假设是吸烟与患病有关操作如下:单击“分析→统计描述→交叉表”,打开“交叉表”对话框,选择相应变量变量,单击精确,并选择“统计量”按钮,选择“卡方”作为统计量检验,然后单击“单元格”按钮,选择“观测值”和“期望值”进行计数。
得出分析结果如下:分析得出卡方值为7.469,,自由度是1,P值为0.004<0.05拒绝原假设,故有大于95%的把握认为吸烟和换慢性气管炎有关。
习题4:原假设是性别与安全性能的偏好无关备择假设是性别与安全性能的偏好有关操作如下:单击“分析→统计描述→交叉表”,打开“交叉表”对话框,选择相应行列变量然后选择“统计量”按钮,以“卡方”作为统计量检验.单击“单元格”按钮,选择“观测值”和“期望值”进行计数单击“确定”,得出分析结果如下:分析得出卡方值为19自由度是4,P值为0.001<0.05拒绝原假设,故有99.9%的把握认为性别与安全性能的偏好有关5实验作业补充。
SPSS统计软件上机练习题(第一部分)1.10名15岁中学生身高体重数据如下:表110名15岁中学生身高体重数据编号12345678910性别男男男男男女女女女女身高(cm)166.0169.0170.0165.1172.0159.4161.3158.0158.6169.0体重(kg)57.058.551.058.055.044.745.444.342.851.5体重指数(BMI)=体重(kg)/身高(m)2,即体重(kg)除以身高(m)的平方。
请利用SPSS计算男生和女生体重指数的均数、标准差值。
2.将126例十二指肠球部溃疡病人随机分为两组。
甲药组治疗62人,54人有效;乙药组治疗64人,44人有效。
请用SPSS分析两种药物的治疗效果有无差别?3.某医师研究物理疗法、药物疗法和外用膏药三种疗法治疗周围性面神经麻痹的疗效,资料见表3。
请用SPSS试比较三种疗法的有效率有无差别?如有差别,哪些组间有差异?表3三种疗法治疗周围性面神经麻痹的疗效分组治疗例数有效例数有效率(%)物理疗法20619996.6药物疗法18216490.1外用膏药14411881.94.某医师在研究血管紧张素I转化酶(ACE)基因I/D多态与Ⅱ型糖尿病肾病(DN)的关系时,将249例Ⅱ型糖尿病患者按有无糖尿病肾病分为两组,资料见表4。
请用SPSS比较两组Ⅱ型糖尿病患者的ACE基因型分布有无差别?表4DN组与无DN组2型糖尿病患者ACE基因型分布的比较组别DD ID II合计DN组42(37.8)48(43.3)21(18.9)111无DN组30(21.7)72(52.2)36(26.1)138合计72(28.9)120(48.2)57(22.9)2495.测得某地5801人的ABO血型和MN血型结果如表5,请用SPSS比较两种血型系统之间是否有关联?如果有关联,关联强度多大?表5测得某地5801人的血型结果ABO血型MN血型合计M N MNO4314909021823A3884108001598B4955879502032AB137********合计14511666268458016.某研究者欲研究年龄与冠状动脉粥样硬化等级之间的关系,将278例尸解资料整理成表6,问年龄与冠状动脉粥样硬化等级之间是否存在线性变化趋势?表6年龄与冠状动脉硬化的关系年龄(岁) (X)冠状动脉硬化等级(y)—++++++合计20~7022429830~2724936340~162313759≥50920151458合计122894126278(1)选用SPSS过程:Weight cases;Analyze→Descriptive Statistics→Crosstabs。
SPSS操作实验 (作业1)作为华夏儿女都曾为有着五千年的文化历史而骄傲过,作为时代青年都曾为中国所饱受的欺压而愤慨过,因为我们多是炎黄子孙。
然而,当代大学生对华夏文明究竟知道多少呢某研究机构对大学电气、管理、电信、外语、人文几个学院的同学进行了调查,各个学院发放问卷数参照各个学院的人数比例,总共发放问卷250余份,回收有效问卷228份。
调查问卷设置了调查大学生对传统文化了解程度的题目,如“佛教的来源是什么”、“儒家的思想核心是什么”、“《清明上河图》的作者是谁”等。
调查问卷给出了每位调查者对传统文化了解程度的总得分,同时也列出了被调查者的性别、专业、年级等数据信息。
请利用这些资料,分析以下问题。
问题一:分析大学生对中国传统文化的了解程度得分,并按了解程度对得分进行合理的分类。
问题二:研究获得文化来源对大学生了解传统文化的程度是否存在影响。
要求:直接导出查看器文件为.doc后打印(导出后不得修改)对分析结果进行说明,另附(手写、打印均可)。
于作业布置后,1周内上交本次作业计入期末成绩答案问题一操作过程1.打开数据文件作业。
同时单击数据浏览窗口的【变量视图】按钮,检查各个变量的数据结构定义是否合理,是否需要修改调整。
2.选择菜单栏中的【分析】→【描述统计】→【频率】命令,弹出【频率】对话框。
在此对话框左侧的候选变量列表框中选择“X9”变量,将其添加至【变量】列表框中,表示它是进行频数分析的变量。
3.单击【统计量】按钮,在弹出的对话框的【割点相等组】文本框中键入数字“5”,输出第20%、40%、60%和80%百分位数,即将数据按照题目要求分为等间隔的五类。
接着,勾选【标准差】、【均值】等选项,表示输出了解程度得分的描述性统计量。
再单击【继续】按钮,返回【频率】对话框。
4.单击【图表】按钮,勾选【直方图】和【显示正态曲线】复选框,即直方图中附带正态曲线。
再单击【继续】按钮,返回【频率】对话框。
最后,单击【确定】按钮,操作完成。
SPSS实验上机题实验1 数据文件建立与管理某航空公司38名职员性别和工资情况的调查数据,如下表所示,试在SPSS中进行如下操作:(1)定义变量,将gender定义为字符型变量,salary定义为数值型变量,在数据窗口录入数据,并保存数据文件,将其命名为“data1_1.sav”。
(2)打开文件data1_1.sav,练习增加一个个案,删除一个个案,增加一个变量、删除一个变量,以及个案和变量的复制、粘贴操作。
(3)将数据文件按性别分组;将数据文件按工资进行组距分组。
(4)查找工资大于40000美元的职工。
(5)按工资进行升序和降序排列,比较升序和降序排列结果有什么不同。
(6)练习数据的分类汇总操作,要求按照性别分类汇总样本的总数。
(7)练习数据选取操作,要求随机选取70%的数据。
(8)当工资大于40000美元时,职工的奖金是工资的20%;当工资小于40000美元时,职工的奖金是工资的10%,假设实际收入=工资+奖金,计算所有职工的实际收入,并将结果添加到income变量中。
实验2 数据特征的描述统计分析1.下表是一电脑公司某年连续120天的销售量数据(单位:台)。
试对其进行频数分析,计算均值、中位数、众数、四分位数,标准差、最大值、最小值、全距,偏度、峰度系数;画出直方图、茎叶图、箱线图;解释结果并说明其分布特征。
234159187155158172163183182177156165 143198141167203194196225177189203165 187160214168188173176178184209175210161152149211206196196234185189196172 150161178168171174160153186190172207 228162223170208165197179186175213176 153163218180192175197144178191201181 166196179171210233174179187173202182 154164215233168175198188237194205195 1742261801722111902001721871891881952.下表是某班同学月生活费资料,试对其进行描述分析,并对结果作出说明。
广东金融学院实验报告课程名称:③由表报告可知,这三个行业平均收入最高:“科学研究、技术服务地质勘察业”的平均收入为8294.9983:“卫生、社会保障和社会福利业”的平均收入为5989.8982;“水利、环境和公共设施管理业”的平均收入为5076.2500。
报告总收入行业N 均值农林牧渔业24 4304.2083采矿业12 1658.3333制造业969 3554.4152电力、燃气及水的生产供应业120 4123.0724建筑业145 2759.1807交通运输、仓储和邮政业196 3222.4676信息传输、计算机服务和软件业123 3332.5672批发和零售业480 3202.4359住宿和餐饮业120 2772.3000金融业329 4350.7240房地产业82 2888.2317租赁和商务服务业87 2765.6685科学研究、技术服务地质勘察业12 8294.9983水利、环境和公共设施管理业36 5076.2500居民服务和其他服务业317 2447.8026教育368 4514.8723卫生、社会保障和社会福利业147 5989.8982文化、体育和娱乐业132 4300.9326公共管理和社会组织512 4427.6971无就职行业1356 2022.2584总计5567 3315.89423. ①由表描述量统计可知:筛选除去无收入者,对总收入进行标准化处理,其均值为0,标准差为1。
描述统计量N 均值标准差Zscore: 总收入5567 0.0000000 1.00000000有效的 N (列表状态)5567②由表异常值可知:异常值的比重是1.9%异常值频率百分比有效百分比累积百分比有效.00 105 1.9 1.9 1.91.00 5462 98.1 98.1 100.0合计5567 100.0 100.0(二)第二题:1. ①由表购买保险情况可知,商业保险、养老保险和医疗保险都买的人的比例是5.8%;一种保险都没买的人的比例是44.4%。
参考答案1、一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。
(1) 这一研究的总体是什么?(2) “消费者在网上购物的原因”是分类变量、顺序变量还是数值型变量?研究者所关心的参数是什么?(3) “消费者每月在网上购物的平均花费是200元”是参数还是统计量?(4) 研究者所使用的主要是描述统计方法还是推断统计方法?答:(1)总体是“所有网上购物的消费者”;(2)分类变量;所有网上购物的消费者的月平均花费和网上购物的主要原因;(3)统计量;(4)推断统计方法。
2、解:年份 经济增长率 年份 经济增长率1992 9.40 2002 8.821993 1.24 2003 7.041994 3.15 2004 3.351995 9.55 2005 4.281996 3.24 2006 1.591997 1.85 2007 10.971998 1.67 2008 4.121999 5.93 2009 5.952000 4.04 2010 2.732001 4.93从上图中可以看出,从1992-2010年,该地区的经济增长率上下波动幅度较大。
虽说经济每年都在增长,但增长速度不够稳定。
总体来看,呈现循环波动的特点,但周期不固定。
3、因每人抽取样本不同,结果会有差异,但分析的方法和图表选择应差不多。
(1)分析“上月收入”的分布特征,并绘制合适图表。
Excel:接收区域 频率1300以下 51300-1700 191700-2000 452000-2300 392300-2700 482700-3000 143000-4100 8SPSS:新上月工资频率 百分比 有效百分比 累积百分比1300.00 5 2.8 2.8 2.8 有效1700.00 19 10.7 10.7 13.52000.00 45 25.3 25.3 38.82300.00 39 21.9 21.9 60.72700.00 48 27.0 27.0 87.63000.00 14 7.9 7.9 95.53300.00 8 4.5 4.5 100.0合计 178 100.0 100.0观察样本的数据,发现上月工资在800-4100之间分布,将工资进行分组,绘制出上图。
实验题1.解:(1)将数据录入SPSS软件中。
(2)点击分析→回归→线性,得回归系数表:由表可知,线性回归方程为:y=0.379x+17.2192.解:(a)将数据录入SPSS软件中, 点击分析→回归→线性,得回归系数表:Y为保单推销数,X为保单推销经历(年数)由图可知,拟合回归方程y=3.364x+51.165( b ) 回归系数为0.410,与0相异,小于0.05(在5%的显著水平),即相应系数显著大于0(c)一个有10年推销经历的保单推销员的销售额为y=3.364×10+51.165=84.8053.解:(a)将数据录入SPSS软件中, 点击分析→回归→线性,得回归系数表:点击分析→相关→双变量,得到:点击图形→旧对话框→散点、点状→确定,即可得到散点图:Y为能力测验分数,X为完成任务时间由表可知,线性回归方程为:Y=-11.959x+125.267(b) 由散点图可看出,这两个变量呈负相关关系。
(c) 由表可知,两个变量的相关系数为—0.930>0.5,又0.865显著异于0,t统计量的显著性概率p为0.000<0.05,说明两个变量在0.05水平上呈显著性差异。
4.解:(1)将数据录入SPSS软件中。
(2)点击分析→回归→线性,得回归系数表:Y 为儿子身高,x 为父亲身高由表可知,经验回归方程y=0.465x+35.977 5.解:(1)将数据录入SPSS 软件中。
(2)点击转换→计算变量→线性→目标变量t=1/x;(3)点击分析→回归→线性→因变量y →自变量t,得回归系数表:Y 为销售额,X 为流通费用率由表可知,选用曲线xba y +=做曲线回归,得回归方程为y=9.707/x -1.2116.解:(1)将数据录入SPSS 软件中, 点击分析→回归→线性,y 为因变量,x 为自变量。
得到回归分析表:y 为上年专利数,x1为上三年R&D 投入,x2为高级工程师数由表可知,“上年专利数”对“上三年R&D 投入”和“高级工程师数”的线性回归方程为: y=0.008x1+0.615x2+7.040由表可得,估计标准误差为3.65724。
SPSS操作练习(t检验)要求:1、用SPSS进行统计分析;2、分析说明使用某一统计处理方法的依据;3、将统计结果正确地在论文中进行表达并进行结果分析。
----------------------------------------------------------------------------------1.计算下列两个玉米品种10个果穗长度(cm)的平均值、标准差和变异系数,并解释两个玉米品种的果穗长度有无差异。
【变异系数C·V=(标准偏差SD/平均值MN)×100%】玉米24号:19,21,20,20,18,19,22,21,21,19金皇后玉米:16,21,24,15,26,18,20,19,22,19解:(1)选择分析方法:被比较的玉米24号、金皇后玉米是两个品种的玉米,试验中彼此独立、无配对关系。
先用SPSS对数据是否服从正态分布进行Kolmogorov-Smirnov 检验,得到,玉米24号的p=0.869>0.05,金皇后玉米的p=0.99>0.05,说明两个样本均服从正态分布(来自正态总体),因此选择独立样本t检验进行数据分析。
经Levene方差齐性检验,得P=0.028<0.05,表明方差不齐,因此选择t检验的结果,使用方差不齐时的计算结果。
(2)结果:为比较玉米24号、金皇后两个品种果穗长度的差异,分别随机选定10株进行测定,结果见表1。
表1 玉米24号与金皇后玉米果穗长度的差异性比较(X±SD)品种样品数/株果穗长度/cm 变异系数/% P值(双侧)24号玉米10 20±1.25 6.241.00金皇后玉米10 20±3.40 17.00(3)分析与结论:从表1可以看出,果穗的长度,玉米24号为20±1.25cm,C·V 是6.00%,金皇后为20±3.40cm,C·V为17.00%,虽然两个品种玉米的果穗长度平均值一样,但是,与玉米24号比较,金皇后玉米的标准差、变异系数都较大,表明金皇后玉米果穗长度的变异程度大。
SPSS操作实验 (作业1)
作为华夏儿女都曾为有着五千年的文化历史而骄傲过,作为时代青年都曾为中国所饱受的欺压而愤慨过,因为我们多是炎黄子孙。
然而,当代大学生对华夏文明究竟知道多少呢
某研究机构对大学电气、管理、电信、外语、人文几个学院的同学进行了调查,各个学院发放问卷数参照各个学院的人数比例,总共发放问卷250余份,回收有效问卷228份。
调查问卷设置了调查大学生对传统文化了解程度的题目,如“佛教的来源是什么”、“儒家的思想核心是什么”、“《清明上河图》的作者是谁”等。
调查问卷给出了每位调查者对传统文化了解程度的总得分,同时也列出了被调查者的性别、专业、年级等数据信息。
请利用这些资料,分析以下问题。
问题一:分析大学生对中国传统文化的了解程度得分,并按了解程度对得分进行合理的分类。
问题二:研究获得文化来源对大学生了解传统文化的程度是否存在影响。
要求:
直接导出查看器文件为.doc后打印(导出后不得修改)
对分析结果进行说明,另附(手写、打印均可)。
于作业布置后,1周内上交
本次作业计入期末成绩
答案
问题一
操作过程
1.打开数据文件作业。
同时单击数据浏览窗口的【变量视图】按钮,检查各个
变量的数据结构定义是否合理,是否需要修改调整。
2.选择菜单栏中的【分析】→【描述统计】→【频率】命令,弹出【频率】对
话框。
在此对话框左侧的候选变量列表框中选择“X9”变量,将其添加至【变量】列表框中,表示它是进行频数分析的变量。
3.单击【统计量】按钮,在弹出的对话框的【割点相等组】文本框中键入数字
“5”,输出第20%、40%、60%和80%百分位数,即将数据按照题目要求分为等间隔的五类。
接着,勾选【标准差】、【均值】等选项,表示输出了解程度得分的描述性统计量。
再单击【继续】按钮,返回【频率】对话框。
4.单击【图表】按钮,勾选【直方图】和【显示正态曲线】复选框,即直方图
中附带正态曲线。
再单击【继续】按钮,返回【频率】对话框。
最后,单击【确定】按钮,操作完成。
5.在得到第20%、40%、60%和80%百分位数后,接着以它们为断点对得分数
据进行分类,因此可以利用SPSS中的【编码】功能来实现。
打开SPSS软件,在菜单栏中选择【文件】→【转换】→【重新编码为不同变量】命令,弹出【重新编码为不同变量】对话框。
6.在左侧的候选变量列表框中选择“X9”变量进入【输入变量->输出变量】列
表框,同时在【输出变量】复选框中填写输出赋值变量名称“等级”。
同时单击【更改】按钮进行赋值转换。
单击【旧值和新值】按钮,弹出重编码规则设置对话框。
接着按照等级转换赋值规则进行变量的重新赋值工作。
设置完成后,单击【继续】按钮返回主对话框最后,单击【确定】按钮,操作完成。
此时,原数据文件新增加了“天数”变量。
问题二
对于问题二,大学生获取传统文化来源主要是从学校、家庭或自学等。
因此本问题主要要分析不同学习途径对大学生传统文化了解程度是否存在显着性影响。
由于文化来源途径和了解程度等级都是定性数据,因此可以考虑采用列联表分析中的行、列变量相关程度检验。
1.选择菜单栏中的【分析】→【描述统计】→【交叉表】命令,弹出【交叉表】
对话框。
2.单击【统计量】按钮,在弹出的对话框的【交叉表:统计量】中,勾选卡方,
这是利用卡方检验来检验学习途径和了解程度得分等级两者之间的独立性。
再单击【继续】按钮,返回【交叉表】对话框,单击【确定】按钮完成操作。
结果分析
问题一
(1)描述性统计量表
下表是被调查者对中国传统文化了解程度得分的描述性统计量
输出表,其中包括了均值、中位数、方差等基本统计量。
可以看到,大学生对传统中国文化了解程度得分均值等于分,标准差为,偏度为,峰度为等。
(2)直方图
SPSS输出结果也包括直方图。
从图形特征看,数据呈稍微左偏分布。
根据附带的正态分布曲线可见了解程度得分近似服从正态分布N,,说明大学生对中国传统文化的了解程度差异较大。
问题二
(1)来源途径与了解程度等级的列联表
下表是来源途径与了解程度等级的列联表,表中数据列出了处于不同了解程度等级及来源途径的学生人数。
可以看到,以“学校教育”为主要来源途径的学生大多数对传统中国文化了解程度位于“很不了解”和“不太了解”的等级,而采用“自学”方式来获取传统文化的学生对其了解程度都比较高,多数学生都“比较了解”或“很了解”传统文化。
(2)独立性检验
上面的列联表只是从数值大小的角度说明了不同来源途径的学生对传统中国文化了解程度差异很大,但究竟这种级别有无显着性差异,还是要借助于卡方检验。
下表是“来源途径”对“了解程度等级”有无显着性影响的卡方检验结果。
卡方检验的零假设是不同来源途径对传统文化了解程度没有显着性差异。
系统默认显着性水平为,由于卡方检验概率P值都小于,则拒绝零假设,认为来源途径对学生了解中国传统文化程度有显着性差异。
这表示应努力激发学生对传统文化的兴趣,只有建立在兴趣爱好的基础上,学生即使花费自己的工作学习时间,也会自学中国传统文化,提高自身的文化修养水平。
卡方检验
值df渐进Sig. (双侧)
Pearson 卡方8.011
似然比8.009
线性和线性组合1.000
有效案例中的N228
a. 0 单元格(.0%) 的期望计数少于5。
最小期望计数为。