当前位置:文档之家› 利用统计软件SPSS进行试卷质量分析

利用统计软件SPSS进行试卷质量分析

利用统计软件SPSS进行试卷质量分析
利用统计软件SPSS进行试卷质量分析

分类号:密级:

学校代码: 10638 学号:

硕士学科论文利用统计软件Spss进行试卷质量分析

姓名敬晓萍

指导教师冯长焕教授

培养单位数学与信息学院

学科专业教育统计与测评

研究方向数学教育

学位类别教育硕士

年级 2010级

西华师范大学学位评定委员会

四川·南充

利用统计软件Spss 进行试卷质量分析

摘 要

试卷分析是教学工作中的重要组成部分,同时也是每个教师必须完成的工作。通过对试卷进行分析,可以反馈学生学习结果和教师教学效果,帮助教师发现教学活动中的薄弱环节,提高教学质量。课程期末考试的试题应该如何命题,怎样组卷?如何把握一份试卷的整体难度和分量,使考试成绩及其成绩的分布符合正态,防止平均成绩的大起大落,避免不及格率的过高过低,以适应大众教育的需要等,这对稳定学校正常的教学秩序,保证学生正常的学习心态和情绪,直至就业应聘是否顺利等都会产生直接的影响。本文利用统计软件Spss 对试卷分析的各项指标进行了定量分析,介绍了操作方法,以便为广大教师进行试卷分析提供一种模式参考,从而科学地进行试卷质量分析,提高教学质量和效率。

关键字:成绩统计;试卷分析;难度;区分度;信度

考试是教育评价的有效办法,随着高职高专技能教学改革的深入开展,对教学评价的要求越来越客观,对教学结果的分析越来越依赖于统计理论和方法。本文的目的是借助统计学软件Spss ,介绍对试卷质量定量分析的方法。

一、考试试卷的统计分析[1]

(一)试卷难度的分析

所谓难度是指考试中试题或者试卷的难易程度,是考试题目对学生知识和能力水平适合程度的指标。

1.难度的计算

以往教师在考试中对试题难度的测定大部分是凭感觉。这种方法本身比较模糊,对有经验的教师也并不是非常有效。根据难度的概念,得到如下公式:

若第i 题全部答对,则d i =0;若第i 题全部答错,则d i =1;当d i =0.5,说明

此题难度适中。

试卷难度:

试卷难度的测定建立在试题难度的基础上,以试题难度为变量,以试题满分值为权数的加权算数平均数:

一般而言,试卷都是以100分为满分,于是:

对于学校的常规考试,目的在于测量个体差异。当d=0或d=0.5时,即试题全部答对或答错,该题便无法提供个体差异的信息。而只有当d=0.5时,题目才能做最大程度的区分度。但在实际工作中要使每题难度均达到0.5有一定的困难。

因此,一般要求试卷平均难度为0.5左右,各试题的难度控制在0.5±02之间。

2.难度的比较

按以上公式计算的试题及试卷难度,只能看出不同试题或不同试卷的难易程度,但却不能分析题目或试卷之间的相对难度。如某试卷中,第一,第二,第三题的难度分别是0.3,0.4,0.5。从难度数据中可以看出,第一题相对较容易,第三题较难。但第二题与第一题的难度差和第三题与第二题的难度差是否相等?这却不一定。原因是不同试题的难度位于不同的等距量表,因而不具有可比性。为解决试题及试卷之间难度的相互对比,需要将以上公式计算的难度,通过正态分布表,转化为标准分。如:d=0.3,z= -1.88;d=0.4,z= -1.75;d=0.5,z= 0。显然,第二题与第一题的难度差为0.13,第三题与第二题的难度差为1.75,难度差并不相等。

(二)试卷区分度的分析

区分度也叫鉴别力,就是通过一次考试将不同程度,不同能力的学生区分开来的重要指标。比如一道题目,水平高、能力好的同学都答对,而水平低、能力差的同学都答错,那么这道题就有好的区分度。

计算公式:

1.试题的区分度:

式中:H i 为班级中高分组同学第i 题的平均成绩;L i 为班级中低分组同学第i

题的平均成绩。(一般而言,高分组与低分组的同学人数是以班级同学人数10%-15%确定)

当高分组平均成绩与低分组平均成绩差距较大时,G i 较大,这时对试题的区

分度评价就比较好。

2.试卷区分度

区分度的评价标准:

(三)常用指标简介[2]

平均值:反映一组数据的总体情况。

方差:反映一组数据的波动大小。

峰度:用来描述某变量所有取值分布形态趋势程度的统计量,是与正态分布相比较的量。峰度为0表示其数据与正态分布的趋势程度相同;峰度大于0表示比正态分布更加陡峭;峰度小于0表示比正态分布更加平坦。

偏度:用来描述数据的对称性的统计量。偏度大于0表示正偏差数值较大;偏度小于0表示负偏差数值较大。而偏度的绝对值越大表示分布形态的偏差程度越大。

二、具体操作步骤[3]

1.原始数据录入

下面我们以我校数学与信息学院《统计分析》期末考试试卷为例来说明各个指标的实现方法。

1.1试卷结构

本试卷(满分100分)有两个部分组成:客观性试题与主观性试题,其中客观性试题共40分,占40%,主观性试题共60分,占60%。具体情况见下表。

分值分布图

注:q1是填空题、q2是选择题、q3是判断题、q4是简答题、q5是问答题、q6是计算题。

1.2数据定义

图1 变量定义窗口

图2 试卷质量分析数据窗口

在SPSS软件中,点击Variable View标签,在Name标题下定义:学号、题号、总成绩、平时成绩,其中总成绩定义为total,平时成绩定义为daily,然后在相应的标签名中进行注释。在Type标题下定义各个项目的类型,其中学号定义为String类型、题号和平时成绩定义为Numeric类型,其余选项使用默认即可。如图1所示。

1.3数据录入

点击Data View标签,将47份试卷按照各部分得分情况和他们的总成绩、平

时成绩输入到相应的表格中。如图2所示。

2.基本描述性统计分析

主要包括参加考试的学生总数、缺考人数、每个部分的最高分、最低分、极差、平均分、标准偏差(方差)等。

在试卷质量分析数据中,运行菜单:Analyze→Descriptive Statistics→Descriptives,把除平时成绩外的所有变量加入到Variables中,点击Options选项对话框,选中Mean、Minimum、Maximum、Range、Std.deviation、Variance。点击Continue,再点击OK。运行后得到结果如下表所示。

描述性统计分析表

3.难度分析

试题难度是指测验题目的难易程度,难度系数一般用字母P表示,且0≤P≤1。对是非题和论文型的题目,我们可以统一为P=M/W(M:全体学生某题的平均得分;W:某题规定的最高得分)。对于选择题我们先计算得出难度系数P,然后再根据公式cp=(kp-1)/(k-1)(k为选项个数)算出矫正难度系数cp。(单项选择题学生可能随机猜测,此公式能排除这种影响)试题难度系数与试题实际难易程度正好相反,越大表示能够正确解答该题的学生越多试题越容易,而越小则试题越难。一般认为,难度适中更能客观地反映出学生的学习效果情况,多数试题应分布在0.3~0.7之间,选拔性测试为0.5左右为宜,通常期末考试为目标参照性考试,可适当偏高,全卷平均难度以0.7左右为宜,0.6~0.8为正常。

根据上表,很容易得到各个部分的难度系数,如下所示。

各个部分的难度系数

注:q2的难度系数为矫正难度系数

4.区分度分析

对于客观题来说,使用等级相关分析,在此使用斯皮尔曼(Spearman)等级相关分析。对于主观题来说,样本数为47,大于30,可以看成非等间距测度的连续变量,在此采用皮尔逊(Pearson)相关分析对试题进行分析。

具体操作如下:Analyze→Correlate→Bivariate。在弹出对话框中选择各个客观题题号变量和总成绩进入Variables,然后在Correlation Coefficients中单击Spearman,完成后即可得到客观题的区分度。主观题的区分度分析方法同上,只需选择主观题和总成绩进入,然后选择Pearson即可。得到每个部分的区分度,见下图:

各个部分的区分度

三、分析结果

(1)基本描述统计数据上来看,学生总数为47人,无人缺考,学生的的卷

面总成绩平均分为82.83分,最高分为99分,最低分为59分,分数极差为40分,标准差为10.538,标准差比较大,说明学生个体间存在较大的差异,主要影响因素是他们入学时学历结构、上课听讲、作业完成、课后复习等。对一部分后进学生,在今后的教学过程中应当充分关注,努力调动他们的学习积极性,经常鼓励

他们,从而达到提高学习成绩的目的。(2)从难度上来看,第二题(0.983)、第

三题(0.996)难度系数过大,说明此题出的太容易,建议此题不宜进入题库,在修改后参加下一轮的遴选。(3)从区分度上来看,除了第二题、第三题区分度较低,其余都比较好,基本达到了考试要求。

四、成绩考试的信度分析[4]

“考试信度对于任何一种有效考试来说都是必不可少的,只有信度高的考试才能使教师对学生的评价客观、可靠,考试成绩才能正确地反映被试者的程度”。

[5]教育测量学、教育统计学在理论上为考试的科学化和现代化奠定了基础,使得考试分析数量化,而SPSS统计软件又使广大教师使用计算机进行学业成绩考试信度的定量分析成为可能。

(一)考试分数的信度系数

衡量一次考试的可靠性指标叫做信度,表明信度大小的量叫做信度系数。虽然教育测量和统计书上介绍计算考试分数的信度系数有多种方法,但因为学科或学业成绩考试具有一般不进行前测和复测的特点,且试题多含有主观题,因而Cronbach’s α系数是最适合学科考试的信度分析。因为Cronbach’s α系数不仅适合主观题,也可以用于多项选择题等客观试题。

下面我们以我校外语学院语音考试题考试题为例介绍用Spss进行信度分析的步骤。

1.Cronbach’s Alpha系数的计算步骤

步骤1:选择信度分析程序。在数据编辑窗口中单击Analyze打开下拉菜单,选择Reliability Analysis……程序,进入信度分析主对话框。

步骤2:选择要进行分析的原始变量。在信度分析主对话框中选择第1-5题共五个变量,单击右向箭头将其移入Items方框中。在Model的下拉菜单中选择Alpha 模型,即表示希望获得Cronbach’s Alpha系数。在信度分析主对话框点击Statistics按钮,进入定义信度分析统计量对话框。

步骤3:在定义信度分析统计量对话框Descriptives for 中勾选Scale ifitem deleted复选项,表示要求在输出结果中显示删除各个项目之后的系数变化情况。然后点击Continue按钮,回到信度分析主对话框,并点击OK提交系统运行,出现运行结果。

2.信度系数输出结果及说明

按照上述参数设置,Spss软件在输出信息观察窗口输出一个表格(表1)。该表报告了“语音听力考试成绩”各题的信度分析结果。表首为分析方法,意为选择了Alpha模型。表中的第1栏为变量,是语音听力考试的五道大题。第二栏为删除该项目后试题的平均值。第三栏为删除该项目后试题的方差。第四栏为该项目与试题总分的相关系数,相关系数较低的项目往往是有问题的试题。例如表中第5题与试题的相关系数仅为.2854,说明该题应该修改或删除。

最后一栏为删除其中某个项目后考试题的Alpha系数变化情况,该栏在检验信度差的试题方面很有用。如果删除某一道试题后的Alpha系数比试题的信度系数大,则可考虑将该题删除。本例中删除第5题后,信度系数将由原来的.7491提高到.7819,由此我们可以从提高信度系数的角度,确认该题应该修改或删除。

Cronbach’s Ahlha系数介0-1之间,系数越高,说明试题的内在一致性越强,测试的结果越可靠。通常自编考试的Cronbach’s Ahlha系数“要求0.60-0.80之间,而标准化考试则要求在0.90以上”。[6]本例的信度系数为.7491,因此我们可以得出信度较好的结论。

二、考试分数的正态分布检验

李筱菊认为考试“分数拉开距离,它们的分布才可能正态。分数分布正态,说明它反映了人的能力分布实况,说明考试有信度。”[7]因此,我们除了使用信度系数还可使用考试成绩正态分布的数据及分布图来测量和检验信度。

考试分数是否服从正态分布,可以用曲线图来观察,也可以计算偏态值和峰值的方法来确定。

1.正态分布图表的制作方法

步骤1:在Spss数据编辑视窗,点击Analyze命令,Descriptive Statistics 在下拉菜单中选择Frequencies…,打开频数直方图编辑对话框。

步骤2:在频数分析主对话框中左边变量列表中选择第1-5题和总分共六个变量,点击向右箭头将其移入Variable::(变量)下白方框中,然后点击Statistics …按钮,进入频数分析数据编辑子对话框。选择Display normal curve,表示同时显示正态分布曲线。

步骤3:在频数分析数据编辑子对话框中Distribution.中选择Skewness和Kurtosis,表示要求计算正态值与峰值。点击Continue返回频数分析主对话框,单击Options…按钮,进入图形选项对话框。

步骤4:在频数分析图形选项子对话框中Chart Type下选择Histograms(单选项,表示要求输出直方图,并选择With normal curve复选项,表示要求输出的直方图带正态分布曲线。点击Continue按钮返回到主对话框,单击Ok按钮提交系统运用。

2.正态分布图及解释

按上述参数设置,Spss共在输出信息观察窗口输出6幅图形与7个表格(其中6个表格是6个变量的频数分布表)。我们只以其中一幅图形和描述统计表格为例介绍报告结果的含义及解释。

考试分数是否服从正态分布,可以通过带正态分布曲线直方图来观察。直方图是以长方形面积表示频数分布的一种图形,它的长度和宽度均有意义,而且由于数据值具有连续性,所以各长方形须相连排列。图中的顶点是平均成绩。直方图中的曲线称分布曲线。正态分布曲线是中间高、两边低且左右对称的曲线。曲线的最高峰,即频数最多处,是曲线的中间位置。这一位置的分数正好是分数的平均值。由于带正态分布曲线的次数直方图具有以上特点,所以可以直观地确定分数分布是否服从正态分布。

3.正态分布表及结果解释

表2是该考试五道大题和总分共六个变量的偏态值和峰值描述统计表。表中第一行为变量名;第二行N Valid为参加考试的有效学生人数;第三行为缺考人数(Missing);第四行为偏态值(Skewness);第五行是峰值(Kurtosis)。

偏态值和峰值为0时表示完全正态,偏态值的正、负表示正、负偏态。峰值的正负表示峰的“高瘦”(分数集中)和“矮平”(分数分散)。

偏态值如表2第三行所示,本例中单词听写、短文听写和听对话简答三题的偏态值均为负数,是负偏态,表示这三题分数分布偏向了右边,也就是偏向了高分,得分高于平均分的人数超过50%。而听句子简答、短文听力理解和总分三个变量的偏态值均为正数,即正偏态,表示分数分布偏向了左边,也就是偏向了低分,得分低于平均分的人数超过了50%。

峰值如表2第四行所示,本例中单词听写、听对话简答和总分的峰值为正数。表示峰比理想正态分布的峰高尖,也就是分数过分集中在中分段。而短文听写、听句子简答和短文听力理解三个变量的峰值为负数。表示这三个变量的峰比理想正态分布峰矮平,也就是分数过分散开。

表2 偏态值及峰值描述统计表

“一般说一个考试偏态值和峰值能控制在±1之内,便算其分数基本符合正态分布”。[8]因此,我们可以得出结论:语音听力部分考试的五道大题和总分基本符合正态分布,这份试题总体信度较好。

综上所述,本文为不太熟悉数理统计的广大教师介绍了用Spss软件计算Cronbach’s Alpha系数和正态分布检验学业成绩考试信度的方法,从而使我们可以较好地测量出考试成绩是否正确反映了学生的学习程度,考试对教学的评价是否可靠。再用信度检验数据查找出影响信度的试题、修改提高试题质量,这对发挥考试评价教学的作用和改进教学效果、提高教学质量无疑是很有好处的。

参考文献:

[1]楼裕胜.学生成绩的统计分析[D].杭州:浙江金融职业学院,2007.

[2]李良.巧用Excel和SPSS软件分析考试成绩[J].金华职业技术学院学报.2008年4月.第8卷第2期.

[3]王雪、邓振伟、陈玲、田七.SPSS软件在试卷质量分析中的应用[N].读与写杂志.2009年3月.第6卷第3期.

[4] 秦志强、贾真真.学业成绩考试的信度分析[J].教育理论与实践.2006年第26卷第7期.第4-6页.

[5]邹申,杨任明.简明英语测试教程[M].北京:高等教育出版社,2000.

[6]宋兆鸿,刘世表,张才美,张国华,张颂增,彭成奖等.现代教育测量[M].北京:教育科学出版社,1986.

[7][8]李筱菊.语言测试科学与艺术[M].长沙:湖南教育出版社,1997.

spss统计分析报告期末考精彩试题

《统计分析软件》试(题)卷 班级xxx班xxx 学号xxx 说明:1.本试卷分析结果写在每个题目下面(即所留空白处); 2.考试时间为100分钟; 3.每个试题20分。 一、(20分)已经给出某个班的学生基本情况及其学习成绩的两个SPSS数据文件,学生成绩一.sav;学生成绩二.sav。要求: (1)将所给的两个SPSS数据文件“学生成绩一.sav”与“学生成绩二.sav”合并,并保存为“成绩.sav.” (2)对所建立的数据文件“成绩.sav”进行以下处理: 1)按照性别求出男、女数学成绩的各种统计量(包括平均成绩、标准差等)。 2)计算每个学生的总成绩、并按照总成绩的大小进行排序 3)把数学成绩分成优、良、中三个等级,规则为优(X≥85),良(75≤X≤84),中(X≤74),并对优良中的人数进行统计。

分析: (2) 描述统计量 性别N 极小值极大值均值标准差 男数学 4 77.00 85.00 82.2500 3.77492 有效的N (列表状态) 4 女数学16 67.00 90.00 78.5000 7.09930 有效的N (列表状态)16

注:成绩优良表示栏位sxcj 优为1 良为2 中为3 由表统计得,成绩为优的同学有4人,占总人数的20%;良的同学有12人,占总人数的60%;中的同学有4人,占总人数的40%。 二、(20分)为了解笔记本电脑的市场情况,针对笔记本电脑的3种品牌,进行了满意度调查,随机访问了30位消费者,让他们选出自己满意的品牌,调查结果见下表,其中变量“职业”的取值中,1表示文秘人员,2表示管理人员,3表示工程师,4表示其他人;3个品牌变量的取值中,1表示选择,0表示未选数据见Excel 数据文件“调查.exe”。根据所给数据完成以下问题 (1)将所给数据的Excel文件导入到SPSS中,要求SPSS数据文件写出数据结构(包括变量名,变量类型,变量值标签等)命,并保存为:“调查. Sav”。 (2)试利用多选项分析,利用频数分析来分析消费者对不同品牌电脑的满意度状况;分析不同职业消费者对笔记本品牌满意度状况。

教育统计学与SPSS课后作业答案祥解题目

教育统计学课后作业 一、P118 1 题目:10位大一学生平均每周所花的学习时间与他们的期末考试成绩见表6-17.试问: (1)学习时间与考试成绩之间是否相关? (2)比较两组数据谁的差异程度大一些? (3)比较学生2与学生9的期末考试测验成绩。 表6-17 学习时间与期末考试成绩 1 2 3 4 5 6 7 8 9 10 学习时间考试成绩40 58 43 73 18 56 10 47 25 58 33 54 27 45 17 32 30 68 47 69 解题步骤: (1)第一步:定义变量:“xuexishijian”、“xuexichengji”后,输入数据.如下图: 1

第二步:单击选择“分析(Analyze)”中的“相关(Correlate)”中的“双变量(Bivariate Correlations)”, 将上图中的“xuexishijian”和“xuexichengji”添加到右边变量框中,如下图: 第三步:点击“确定“后,输出结果如下图: 第四步:分析结果

3 由上图可知:学习时间与学习成绩之间的pearson 相关系数为0.714,p (双侧)为0.20。自由度 df=10-2=8时,查“皮尔逊积差相关系数显著临界值表”知:r 0.05= 0.623 ; r 0.01=0.765。 因为0.765 > 0.714 >0.623,所以在0.05水平上学习时间和学习成绩是相关显著的。 (2)SPSS 软件分析结果如下图: 由上图可知:学习时间标准差和平均值为:S 1=12.037 ?X 1= 29.00 ;学习时间标准差和平均值为:S 2=12.437?X 2=56.00 根据差异系数公式可知: 学习时间差异系数为:%100?=X S CV S =12.037/29.00×100%=41.51% 学习成绩差异系数为:%100?= X S CV S =12.437/56.00×100%=22.27% 有上述结果可知学习时间差异程度大于学习成绩差异程度。 (4) 把学生2和学生9的期末考试成绩转化成标准分数: Z 2=(X -?X) /S= (73—56)/12.437=1.367 Z 9=(X-?X)/S=(68—56)/12.437=0.965 由上计算可知:学生2期末考试测验成绩优于学生9的期末考试测验成绩。 二、P119 2 题目:某班数学的平均成绩为90,标准差10;化学的平均分为85,标准差为8;物理的平均分为79,标准差为15.某生这三科成绩分别为95,80,80.试问 (1) 该生在哪一学科上突出一些? (2) 该班三科成绩的差异度如何?有无学习分化现象? (3) 该生的学期分数是多少? (4) 三科的总平均和总标准差是多少? 解题步骤:

spss统计分析期末考试题

《统计分析软件》试(题)卷 班级 xxx班姓名 xxx 学号 xxx 说明:1.本试卷分析结果写在每个题目下面(即所留空白处); 2.考试时间为100分钟; 3.每个试题20分。 一、(20分)已经给出某个班的学生基本情况及其学习成绩的两个SPSS数据文件,学生成绩一.sav;学生成绩二.sav。要求: (1)将所给的两个SPSS数据文件“学生成绩一.sav”与“学生成绩二.sav”合并,并保存为“成绩.sav.” (2)对所建立的数据文件“成绩.sav”进行以下处理: 1)按照性别求出男、女数学成绩的各种统计量(包括平均成绩、标准差等)。 2)计算每个学生的总成绩、并按照总成绩的大小进行排序 3)把数学成绩分成优、良、中三个等级,规则为优(X≥85),良(75≤X ≤84),中(X≤74),并对优良中的人数进行统计。

分析: 描述统计量 性别N极小值极大值均值标准差 男数学477.0085.0082.2500 3.77492有效的 N (列表状态)4 女数学1667.0090.0078.50007.09930有效的 N (列表状态)16

注:成绩优良表示栏位sxcj 优为1 良为2 中为3 由表统计得,成绩为优的同学有4人,占总人数的20%;良的同学有12人,占总人数的60%;中的同学有4人,占总人数的40%。 二、(20分)为了解笔记本电脑的市场情况,针对笔记本电脑的3种品牌,进行了满意度调查,随机访问了30位消费者,让他们选出自己满意的品牌,调查结果见下表,其中变量“职业”的取值中,1表示文秘人员,2表示管理人员,3表示工程师,4表示其他人;3个品牌变量的取值中,1表示选择,0表示未选数据见Excel数据文件“调查.exe”。根据所给数据完成以下问题 (1)将所给数据的Excel文件导入到SPSS中,要求SPSS数据文件写出数据结构(包括变量名,变量类型,变量值标签等)命,并保存为:“调查. Sav”。 (2)试利用多选项分析,利用频数分析来分析消费者对不同品牌电脑的满意度状况;分析不同职业消费者对笔记本品牌满意度状况。 分析:

统计分析软件SPSS详细教程

10.11统计分析软件&SPSS建立数据 目录 10.11统计分析软件&SPSS建立数据 (1) 10.25数据加工作图 (1) 11. 08绘图解答&描述性分析: (3) 2.描述性统计分析: (4) 四格表卡方检验:(检验某个连续变量的分布是否与某种理论分布一致,如是否符合正态分布) (7) 第七章非参数检验 (10) 1.单样本的非参数检验 (11) (1)卡方检验 (11) (2)二项分布检验 (12) 2.两独立样本的非参数检验 (13) 3.多独立样本的非参数检验 (16) 4.两相关样本的非参数检验 (16) 5.多相关样本的非参数检验 (18) 第五章均值检验与T检验 (20) 1.Means过程(均值检验)( (20) 4. 单样本T检验 (21) 5. 两独立样本T检验 (22) 6.两配对样本T检验 (23) 第六章方差分析 (25) 单因素方差分析: (25) 多因素方差分析: (29) 10.25数据加工作图 1.Excel中随机取值:=randbetween(55,99) 2.SPSS中新建数据,一列40个,正态分布随机数:先在40那里随便输入一个数表示选择40个可用的,然后按一下操作步骤: 3.排序:个案排秩

4.数据选取:数据-选择个案-如果条件满足: 计算新变量: 5.频次分析:分析-统计描述-频率

还原:个案-全部 6.加权: 还原 7.画图: 11. 08绘图解答&描述性分析:1.课后题:长条图

2.描述性统计分析: (1)频数分析:

(2)描述性分析: 描述性统计分析没有图形功能,也不能生成频数表,但描述性分析可以将原始数据转换成标准化得分,并以变量形式存入数据文件中,以便后续分析时应用。 操作: 分析—描述性分析:然后对结果进行筛选,去掉异常值,就得到标准化的数据: 任何形态的数据经过Z标准化处理之后就会是正态分布的<—错误!标准化是等比例缩放的,不会改变数据的原始分布状态, (3)探索分析:(检验是否是正态分布:茎叶图、箱图) 实例:

spss作业15-17

CHAPTER 15 西北研究院蔡嘉驰131246 15.4 (i) What we choose is part of u t. Then gMIN t and u t are correlated, which causes OLS to be biased and inconsistent. (ii) I think it is uncorrelate because gGDP t controls for the overall performance of the U.S. economy. (iii) The change of U.S. minimum may someway change the state minimum and vice versa. If the state minimum is always the U.S. minimum, then gMIN t is exogenous in this equation and we would just use OLS. 15.7 (i) Because students that would do better anyway are also more likely to attend a choice school. (ii) Since u1 does not contain income, random assignment of grants within income class means that grant designation is not correlated with unobservables such as student ability, motivation, and family support. (iii) The reduced form is choice= π0 + π1faminc + π2grant + v2, and we need π2≠ 0. (iv) The reduced form for score is just a linear function of the exogenous variables: score= α0 + α1faminc + α2grant + v1. This equation allows us to directly estimate the effect of increasing the grant amount on the test score, holding family income fixed.So it is useful. C15.1 (i) The regression of log(wage) on sibs gives

spss 期末题库

课程名称:《SPSS分析方法与应用》 课程号: 2007422 一、单项选择题(共112小题) 1、试题编号:1000110,答案:RetEncryption(D)。 SPSS的安装类型有() A. 典型安装 B.压缩安装 C.用户自定义安装 D.以上都是 2、试题编号:1000310,答案:RetEncryption(D)。 数据编辑窗口的主要功能有() A.定义SPSS数据的结构 B.录入编辑和管理待分析的数据 C.结果输出 和B 3、试题编号:1000410,答案:RetEncryption(A)。 ()文件格式是SPSS独有的,一般无法通过Word,Excel等其他软件打开。 4、试题编号:1000510,答案:RetEncryption(D)。 ()是SPSS为用户提供的基本运行方式。 A.完全窗口菜单方式 B.程序运行方式 C.混合运行方式 D.以上都是 5、试题编号:1000810,答案:RetEncryption(D)。 ()是SPSS中有可用的基本数据类型 A.数值型 B.字符型 C.日期型 D.以上都是 6、试题编号:1000910,答案:RetEncryption(D)。 spss数据文件的扩展名是( ) A..htm B..xls C..dat D..sav 7、试题编号:1001010,答案:RetEncryption(B)。 数据编辑窗口中的一行称为一个() A.变量 B.个案 C.属性 D.元组 8、试题编号:1001110,答案:RetEncryption(C)。

变量的起名规则一般:变量名的字符个数不多于() A. 6 B. 7 C. 8 D. 9 9、试题编号:1001210,答案:RetEncryption(A)。 统计学依据数据的计量尺度将数据划分为三大类,它不包括() A. 定值型数据 B.定距型数据 C.定序型数据 D.定类型数据 10、试题编号:1001310,答案:RetEncryption(A)。 在横向合并数据文件时,两个数据文件都必须事先按关键变量值() A.升序排序 B.降序排序 C.不排序 D.可升可降 11、试题编号:1001810,答案:RetEncryption(A)。 SPSS算术表达式中,字符型()应该用引号引起来。 A 常量 B变量 C算术运算符 D函数 12、试题编号:1001910,答案:RetEncryption(A)。 复合条件表达式又称逻辑表达式,在逻辑运算中,下列()运算最优先。 B AND C OR D都不是 13、试题编号:1002010,答案:RetEncryption(A)。 数据选取的方法中,()是按符合条件的数据进行选取。 A 按指定条件选取 B 随即选取 C选取某一区域内样本 D过滤变量选取 14、试题编号:1002110,答案:RetEncryption(B)。 通过()可以达到将数据编辑窗口中的技术数据还原为原始数据的目的。 A 数据转置 B 加权处理 C 数据才分 D以上都是 15、试题编号:1002210,答案:RetEncryption(A)。 SPSS的()就是将数据编辑窗口中数据的行列互换 A 数据转置 B 加权处理 C 数据才分 D以上不都是 16、试题编号:1002310,答案:RetEncryption(B)。 SPSS软件是20世纪60年代末,由()大学的三位研究生最早研制开发的。 A、哈佛大学 B、斯坦福大学 C、波士顿大学 D、剑桥大学 17、试题编号:1002710,答案:RetEncryption(D)。 SPSS中进行参数检验应选择()主窗口菜单。 A、视图 B、编辑 C、文件 D、分析 18、试题编号:1002810,答案:RetEncryption(A)。 SPSS中进行输出结果的保存应选择()主窗口菜单。 A、视图 B、编辑 C、文件 D、分析 19、试题编号:1002910,答案:RetEncryption(C)。 SPSS中进行数据的排序应选择()主窗口菜单。 A、视图 B、编辑 C、数据 D、分析

《spss统计软件》练习题库及答案

华中师范大学网络教育学院 《SPSS统计软件》练习题库及答案(本科) 一、选择题(选择类) (A)1、在数据中插入变量的操作要用到的菜单是: A Insert Variable; B Insert Case; C Go to Case; D Weight Cases (C)2、在原有变量上通过一定的计算产生新变量的操作所用到的菜单是: A Sort Cases; B Select Cases; C Compute; D Categorize Variables — (C)3、Transpose菜单的功能是: A 对数据进行分类汇总; B 对数据进行加权处理; C 对数据进行行列转置; D 按某变量分割数据 (A)4、用One-Way ANOVA进行大、中、小城市16岁男性青年平均身高的比较,结果给出sig.=,说明: A. 按照显著性水平,拒绝H0,说明三种城市的平均身高有差别; B. 三种城市身高没有差别的可能性是; C. 三种城市身高有差别的可能性是; 、 D. 说明城市不是身高的一个影响因素 (B)5、下面的例子可以用Paired-Samples T Test过程进行分析的是:A 家庭主妇和女大学生对同种商品喜好的差异; B 服用某种药物前后病情的改变情况; C 服用药物和没有服用药物的病人身体状况的差异; D性别和年龄对雇员薪水的影响 二、填空题(填空类) 6、Merge Files菜单用于合并数据库有两种情况:如果两数据库变量相同,是_观测对象__的合并;如果不同,则是_变量__的合并。 7、用于对计数资料和有序分类资料进行统计描述和简单的统计推断,在分析时可以产生二维或多维列联表,在统计推断时能进行卡方检验的菜单是_ Crosstabs __。 % 8、One-Samples T Test过程用于进行样本所在总体均数___与__已知总体均数_的比较。 三、名词解释(问答类) 9、Repeated Measures:重复测量的方差分析,指的是一个因变量被重复测量好几次,从而同一个个体的几次观察结果间存在相关,这样就不满足普通分析的要求,需要用重复测量的方差分析模型来解决。 10、Chi-Square test:卡方检验,它是非参数检验的一种方法,来检验变量的几个取值所占百分比是否和我们期望的比例没有统计学差异。比如我们在人群中抽取了一个样本,可以用该方法来分析四种血型所占的比例是否相同(都是25%),或者是否符合我们所给出的一个比例(如分别为10%、30%、40%和20%)。 四、简答题(问答类) 11、用SPSS对数据进行分析的基本流程是什么 答:(1)、将数据输入SPSS,并保存; { (2)、进行必要的预分析(分布图、均数标准差等的描述等),以确定应采用的检验方法; (3)、按题目要求进行统计分析; (4)、保存和导出分析结果。 12、对数据进行方差分析时,Univariate菜单和Multivariate菜单最大的区别是什么 答:当因变量只有一个时,使用Univariate菜单,当因变量不止一个时,使用Multivariate菜单。 13、简述SPSS打开其它格式数据的几种方法 答:(1)、直接打开:选择菜单File==>Open==>Data或直接单击快捷工具栏上的打开按钮; (2)、使用数据库查询打开:选择菜单File==>Open Database==>New Query,根据向导打开数据; (3)、使用文本向导读入文本文件:选择菜单File==>Read Text Data ) 14、指定数据按某个变量进行排序需要用到哪个菜单

spss期末大数据分析报告

SPSS在教育研究中的应用某大学学生对本校的满意度调查 学院:教育学院 专业:课程与教学论 学号:201411000156 姓名:李平 2014年12月13日

目录 一、研究问题的提出 (3) 二、研究内容与方法 (3) (一) 研究内容 (3) (二) 研究方法 (3) 三、调查对象及人数 (4) 四、问卷分析 (5) (一)回收情况 (5) (二)信度分析 (5) 五、数据统计与分析 (6) (一)数据输入 (6) (二)数据分析 (7) 1.描述统计 (7) (1)多选题描述统计 (7) (2)单选题描述统计 (9) 2.推断统计 (12) (1)独立样本T检验 (12) (2)单一样本T检验 (15) (3)单因素方差分析 (17) (4) X2检验 (21) 3.相关分析 (22) (1)变量间相关分析 (22) (2)维度间相关分析 (23) 六、结论 (27) 七、附录 (28)

一、研究问题的提出 学生的学校生活和成长密切相关。我们通过对他们的大学生活满意度的调查结果向有关部门提出建议,并希望能引起学校对这一系列问题的关注,最终希望大学生对其大学的满意度有所提升,大学生是一个庞大的群体,特别是近几年,随着高校的扩招,我国越来越多人能够上大学。上大学是很多人的梦想,他们都憧憬着大学校园的生活,然而当他们进了大学后才发现大学生活并非所想的美好,取而代之的却是对校园生活的不满,大学生是十分宝贵的人才资源,他们对校园生活的体验和感受,与他们的更好的学习。 二、研究内容与方法 (一)研究内容 了解学生对于学校的师资水平、环境、日常管理等各方面的满意度。 (二)研究方法 1.问卷编制 本研究采用自编问卷,问卷共由两部分组成:基本情况部分包括被调查者的性别、年级等,问卷主体部分包括师资水平、学校环境、日常管理三大维度,细分为12个三级指标(见表2-1),问卷采用五点制计分法,即“非常满意”、“满意”、“一般”、“不满意”、“非常不满意”,分别赋值5分、4分、3分、2分、1分。 表2-1 某大学学生对本校的满意度测评指标体系 一 级指标 二级指标(潜在变量)三级指标(观测变量) 对自己师资水平对教师教学方法、对教师工作态 度、对教师人品修养、对师资配备 学校的意学校环境对学习环境、对就餐环境、对居住 环境、对校园绿化环境 满度指数日常管理对专业课时安排、对收费标准、对 奖、助学金制度、对学校治安

SPSS操作实验作业1(附答案)

SPSS操作实验 (作业1) 作为华夏儿女都曾为有着五千年的文化历史而骄傲过,作为时代青年都曾为中国所饱受的欺压而愤慨过,因为我们多是炎黄子孙。然而,当代大学生对华夏文明究竟知道多少呢 某研究机构对大学电气、管理、电信、外语、人文几个学院的同学进行了调查,各个学院发放问卷数参照各个学院的人数比例,总共发放问卷250余份,回收有效问卷228份。调查问卷设置了调查大学生对传统文化了解程度的题目,如“佛教的来源是什么”、“儒家的思想核心是什么”、“《清明上河图》的作者是谁”等。调查问卷给出了每位调查者对传统文化了解程度的总得分,同时也列出了被调查者的性别、专业、年级等数据信息。请利用这些资料,分析以下问题。 问题一:分析大学生对中国传统文化的了解程度得分,并按了解程度对得分进行合理的分类。 问题二:研究获得文化来源对大学生了解传统文化的程度是否存在影响。 要求: 直接导出查看器文件为.doc后打印(导出后不得修改) 对分析结果进行说明,另附(手写、打印均可)。 于作业布置后,1周内上交 本次作业计入期末成绩

答案 问题一 操作过程 1.打开数据文件作业。同时单击数据浏览窗口的【变量视图】按钮,检查各个 变量的数据结构定义是否合理,是否需要修改调整。 2.选择菜单栏中的【分析】→【描述统计】→【频率】命令,弹出【频率】对 话框。在此对话框左侧的候选变量列表框中选择“X9”变量,将其添加至【变量】列表框中,表示它是进行频数分析的变量。 3.单击【统计量】按钮,在弹出的对话框的【割点相等组】文本框中键入数字 “5”,输出第20%、40%、60%和80%百分位数,即将数据按照题目要求分为等间隔的五类。接着,勾选【标准差】、【均值】等选项,表示输出了解程度得分的描述性统计量。再单击【继续】按钮,返回【频率】对话框。

SPSS期末考试整理

●一。变量的赋值 1.乘方(**),例如二的三次方:2**3 2.不同规则的赋值:转换→计算变量(如果),每一个规则的赋值都要重新进行此步骤(但注意每一遍的变量名都不变,并且他都会问你要不要替换成新的变量,你选是就行了) 3.不同规则的赋值:(1)转换→重新编码为不同变量:输入变量,输出变量,要点击“变化量”才可保存输出变量→新值和旧值:值(直接选取取值)、范围(最大到最小的范围,包含端点值),点击“添加”成功保存新值和旧值→所有不同取值规则都完成后点击继续、确定,则在变量视图多出一个新变量(2)若不想包含端点值,可以采取小数的方式变换,eg. 899.9(小数位比该变量属性的小数位多一位就行了) (3)这种要先把BMI按照男女分开,然后再分组的,可以在对话框中点击“如果”选项进行设置,并且要分别对男女进行上述操作(一共做两遍)。 二。离散化 1可视离散化:转换→可视分箱,分割点:所以想生成几组,就定义几个分割点;填写第一个分割点的时候就必须填写最小值;一定要选中上端点排除。 三。排序 1.转换→自动重新编码:不分组,从头到尾排序 2.转换→个案排秩(1)多层次数据:基于A变量对B变量进行排序。(例如,基于职称对收入进行排序,就是不同职称各自组内排工资的高低)(2)设置秩1;绑定值 四。时间序列:转换→变动值 五。查找与计数:转换→对个案内的值计数(查找“基本工资800-900女职工”,生成新变量,满足这个条件的标为1,不符合这个标准的标为0,男职工标为缺失。范围:包含上限下限) ●六。数据→个案排序:把变量顺序完全按照你想要的标准排序,所有的变量顺序都会改变 七。拆分文件:要分男女进行数据统计:数据→拆分文件→比较组/按组输出,分组依据。不分男女进行数据统计:数据→拆分文件→分析所有个案 八。选择个案(例如只选择三年级的变量进行分析):数据→选择个案→如果条件满足:如果;随机个案样本;基于时间或个案范围;使用过滤变量(例如要把身高为缺失值和值为0的剔除)→输出:过滤(不符合条件的数据会画上“/”,原始数据并未删除);将选定个案复制到新数据集(形成一个新的SPSS数据文件,原始数据并未删除);删除未选定的个案(删除原始数据,不建议使用)→之后在分析的时候就只会分析三年级的变量。不想只分析三年及,记得重新做这一步。 九。加权个案:数据→加权个案(例。100分的有5人)。不想加权了,记得重新做这一步。 十。分类汇总(1)例如算不同年级的人的身高的均值、方差…(只能计算函数)(2)数据→汇总,分界变量(分类标准变量),变量摘要(计算变量),函数:选择计算变量函数,变量名称与标签:定义新生成变量的名称与标签 ●十一。长宽数据的转换 1.长数据变宽数据:索引变量消失变成score的尾缀 (1)数据→重组(重构)→个案重组为变量,标识变量,索引变量,电脑会自动帮你选出是xx xx要重构(不同疗程值不同的变量)。选完上述这些之后就一直点下一步&完成&立即重构&确定即可 (2)注意:当有多个变量需要重构时要自己决定“新变量组的顺序”。(A1A2B1B2;A1B1A2B2) 2.宽数据变长数据:score的尾缀消失变成索引变量 (1)数据→重组(重构)→变量重组为个案,个案组标识:使用选定变量,固定变量(手动选择,电脑不会自动帮你选出了),要转置的变量即值不固定的要重构的变量(手动选择,电脑不会自动帮你选出了)。选完上述这些之后就一直点击下一步&完成&立即重构数据&确定就行了 (2)当有多个变量需要重构时,这块的操作要特别注意:○1首先在“变量组数目”中选择“多个”○2然后在“选择变量”里要对于不同的“目标变量”分别定义“要转置的变量”(在本题中,即对于kidid目标变量定义一遍要转置的变量;对于age目标变量在定义一遍要转置的变量。其中,这两个要转置的变量必须是完全不同的)。但只需要定义一次“个案组标识”&“固定变量”(固定变量是相对于kidid & age都固定的那些变量;而不是说在对kidid进行转置的时候,age就是固定变量了;因此,固定变量只用定义一次且固定变量可以为空)。并且,你要特别注意,“个案组标识”里选择的变量& n个“要转置的变量”里选择的变量&“固定变量”里选择的变量都必须是完全不相同的。

spss期末作业

吉林财经大学 《SPSS统计软件分析》作业(2010——2011学年第一学期) 学院信息学院 专业班级电子商务0806班 学生姓名王瑞霞 学号1403080616

1、对未分组资料频数分析 从中国统计局中获得从11月21日至30日国内50个城市主要食品平均价格变动情况,以该数据为例为例,进行频数分析。 首先输入数据: 选择Analyze中Descriptive Statistics——Frequencies,打开Frequencies对话框;将需处理的变量键入变量框中

单击Statistics…按钮统计量子对话框12指标,选中所需要计算的指标: 单击Charts …按钮,选择需绘制的统计图: 单击OK按钮开始运行,运行结果为:

从上图中可以看出数据中缺失值为0,花生油的平均价格104.84是最高的,而巴氏牛奶的平均价格1.81最低,全部食品平均价格的平均数为16.5327,标准差为22.4668,各种食品的平均价格差距较大。

条形图、饼形图以及直方图是用不同的图形表示方法来说明数据的指标,其实质是一样的,从图中可以看出平均价格在0—22元之间的食品是最多的,20—40元之间的食品数次之,接下来是40—60元之间的食品,不存在平均价格在60—100之间的食品。 2、以食品平均价格为依据对数据进行分组并对分组后的数据进行频数分析: Transform —Recode—Into same V ariables ,将要分组的变量放入Numeric 栏中,单击Old and new V alues分组:

分组结果如下图所示: 回到数据编辑窗,定义变量的V alue labels : 再对食品平均价格进行频数分析,分析结果如下截图所示

spss统计分析期末考试题

《统计分析软件》试(题)卷 班级xxx班姓名xxx 学号xxx 题号一二三四五六总成绩成绩 说明:1.本试卷分析结果写在每个题目下面(即所留空白处); 2.考试时间为100分钟; 3.每个试题20分。 一、(20分)已经给出某个班的学生基本情况及其学习成绩的两个SPSS数据文件,学生成绩一.sav;学生成绩二.sav。要求: (1)将所给的两个SPSS数据文件“学生成绩一.sav”与“学生成绩二.sav”合并,并保存为“成绩.sav.” (2)对所建立的数据文件“成绩.sav”进行以下处理: 1)按照性别求出男、女数学成绩的各种统计量(包括平均成绩、标准差等)。 2)计算每个学生的总成绩、并按照总成绩的大小进行排序 3)把数学成绩分成优、良、中三个等级,规则为优(X≥85),良(75≤X ≤84),中(X≤74),并对优良中的人数进行统计。

分析: (2) 描述统计量 性别N 极小值极大值均值标准差 男数学 4 77.00 85.00 82.2500 3.77492 有效的N (列表状态) 4 女数学16 67.00 90.00 78.5000 7.09930 有效的N (列表状态)16

注:成绩优良表示栏位sxcj 优为1 良为2 中为3 由表统计得,成绩为优的同学有4人,占总人数的20%;良的同学有12人,占总人数的60%;中的同学有4人,占总人数的40%。 二、(20分)为了解笔记本电脑的市场情况,针对笔记本电脑的3种品牌,进行了满意度调查,随机访问了30位消费者,让他们选出自己满意的品牌,调查结果见下表,其中变量“职业”的取值中,1表示文秘人员,2表示管理人员,3表示工程师,4表示其他人;3个品牌变量的取值中,1表示选择,0表示未选数据见Excel数据文件“调查.exe”。根据所给数据完成以下问题 (1)将所给数据的Excel文件导入到SPSS中,要求SPSS数据文件写出数据结构(包括变量名,变量类型,变量值标签等)命,并保存为:“调查. Sav”。 (2)试利用多选项分析,利用频数分析来分析消费者对不同品牌电脑的满意度状况;分析不同职业消费者对笔记本品牌满意度状况。 分析:

SPSS调查报告 - 期末作业

---------------------------------------------装--------------------------------- --------- 订 -----------------------------------------线---------------------------------------- 班级 姓名 学号 - 广 东 财 经 大 学 答 题 纸(格式二) 课程 数据处理技术与SPSS 20 15 -20 16 学年第 1 学期 成绩 评阅人 评语: ========================================== (题目)关于本部学生对收费代课现象支持度的调查报告 (正文) 一、调查背景 如今,大学生逃课现象屡见不鲜,随之衍生了“收费代课”的现象。据了解,在全国近百所高校中,存在“收费代课”现象的高校居然有一半之多。当“收费代课”现象衍变成了一种行业,成为有领导、有组织、有规模、有纪律的机构,不仅仅应当引起社会的关注,更应引起校方对教育方式的深刻反思。“有偿代课”作为一种不正常的校园现象,有其存在的社会土壤,其原因有多方面,值得让人对当前大学教育深思。在“收费代课”现象蔚然成风之时,我们学校的学生们也加入了这支大队伍。对于这样的一种收费代课的行为,同学们褒贬不一,每个人都有自己的看法。然而,这种行为经常在我们的身边发生着,无疑应该引起我们的关注,并引发我们的深思,形成一定的判别能力与认知能力。

二、调查目的 我们希望通过本次调查了解广东财经大学本部学生选择收费代课的原因,以及对本专业学习、实习实践的认知程度,是否支持放弃学习去实习或者做自己的事情,是否支持收费代课。同时,我们也希望通过这份调查报告揭露出的一些情况,一方面,帮助学生更好地权衡学习与实习的利弊,更加理性地对待收费代课的行为,做出对自己正确合适的选择;另一方面,引起学校对这种收费代课现象的重视,给学校提一些建议,希望学校采取一些措施改善这种不良校风。 三、调查方法 从可行性角度出发,本次调查采用非概率随机抽样的街头拦截法,集中对象为本部大三大四的同学,以自愿形式对本部同学分发调查问卷,总共发出80份问卷,回收80份,有效问卷80份。收集问卷之后,利用spss软件进行数据整理与分析,最后把结论整理成调查报告。调查报告中采用的数据分析方法主要有:频数分析、多选项分析、交叉列联表行列变量间关系的分析、单因素方差分析等。 四、描述统计 1、对样本性别作频数分析 从上表可以看出,这次填写问卷的女生较多,占了样本的66.3%,这与我们学校男女比例不均衡有很大的关系,样本的男女比例不相等,也可以较好地接近学校的实际情况,有利于我们得到更为准确的结论。 2、对样本年级作频数分析 从上表可知,参加问卷调查的大三大四学生比例明显比较高,这与一开始我们预期相符,样本中大三大四学生所占比例较多,有利于我们得到更为有针对性的结论。

SPSS期末大作业-完整版

第1题:基本统计分析1 分析:本题要求随机选取80%的样本,因而需要选用随机抽样的方法,在此选择随机抽样中的近似抽样方法进行抽样。其基本操作步骤如下:数据→选择个案→随机个案样本→大约(A)80 所有个案的%。 1、基本思路: (1)由于存款金额为定距型变量,直接采用频数分析不利于对其分布形态的把握,因而采用数据分组,先对数据进行分组再编制频数分布表。此处分为少于500元,500~2000元,2000~3500元,3500~5000元,5000元以上五组。分组后进行频数分析并绘制带正态曲线的直方图。 (2)进行数据拆分,并分别计算不同年龄段储户的一次存取款金额的四分位数,并通过四分位数比较其分布上的差异。 操作步骤: (1)数据分组:【转换→重新编码为不同变量】,然后选择存取款金额到【数字变量→输出变量(V)】框中。在【名称(N)】中输入“存取款金额1”,单击【更改(H)】按钮;单击【旧值和新值】按钮进行分组区间定义。 存取款金额1 频率百分比有效百分比累积百分比 有效1.00 82 34.6 34.6 34.6 2.00 76 32.1 32.1 66.7 3.00 10 4.2 4.2 70.9 4.00 22 9.3 9.3 80.2 5.00 47 19.8 19.8 100.0 合计237 100.0 100.0 (2)【分析→描述统计→频率】;选择“存款金额分组”变量到【变量(V)】框中;单击【图标(C)】按钮,选择【直方图】和【在直方图上显示正态曲线】;选中【显示频率表格】,确定。

(3)【数据→拆分文件】,选择“年龄”变量到【分组方式】框中,选中【比较组】和【按分组变量排序文件】,确定;【分析→描述统计→频率】,选择“存款金额”到【变量】框中,单击【统计量】按钮,选择【四分位数】→继续→确定。 统计量 存(取)款金额 20岁以下 N 有效 1 缺失 0 百分位数 25 50.00 50 50.00 75 50.00 20~35岁 N 有效 131 缺失 0 百分位数 25 500.00 50 1000.00 75 5000.00 35~50岁 N 有效 73 缺失 0 百分位数 25 500.00 50 1000.00 75 4500.00 50岁以上 N 有效 32 缺失 0 百分位数 25 525.00 50 1000.00 75 2000.00 结果及结果描述: 频数分布表表明,有一半以上的人的一次存取款金额少于2000元,且有34.6%的人的存取款金额少于500元,19.8%的人的存取款金额多于5000元,下图为相应的带正态曲线的直方图。

spss统计软件期末课程考试题

《SPSS统计软件》课程作业 要求:数据计算题要求注明选用的统计分析模块和输出结果;并解释结果的意义。完成后将作业电子稿发送至 1. 某单位对100名女生测定血清总蛋白含量,数据如下: 计算样本均值、中位数、方差、标准差、最大值、最小值、极差、偏度和峰度,并给出均值的置信水平为95%的置信区间。 解: 描述 统计量标准误 血清总蛋白含量均值.39389 均值的95% 置信区间下限 上限 5% 修整均值 中值 方差

标准差 极小值 极大值 范围 四分位距 偏度.054.241 峰度.037.478 样本均值为:;中位数为:;方差为:;标准差为:;最大值为:;最小值为:;极差为:;偏度为:;峰度为:;均值的置信水平为95%的置信区间为:【,】。 2. 绘出习题1所给数据的直方图、盒形图和QQ图,并判断该数据是否服从正态分布。解:

正态性检验 Kolmogorov-Smirnov a Shapiro-Wilk 统计量 df Sig. 统计量 df Sig. 血清总蛋白含量 .073 100 .200* .990 100 .671 a. Lilliefors 显着水平修正 *. 这是真实显着水平的下限。 表中显示了正态性检验结果,包括统计量、自由度及显着性水平,以K-S 方法的自由度sig.=,明显大于,故应接受原假设,认为数据服从正态分布。 3. 正常男子血小板计数均值为9 22510/L , 今测得20名男性油漆工作者的血小板计数值(单位:9 10/L )如下: 220 188 162 230 145 160 238 188 247 113 126 245 164 231 256 183 190 158 224 175 问油漆工人的血小板计数与正常成年男子有无异常

SPSS数据分析报告

SPSS期末报告 关于员工受教育程度对其工资水平的影响 统计分析报告 课程名称:SPSS统计分析方法 姓名:汤重阳 学号:1402030108 所在专业:人力资源管理 所在班级:三班

目录 一、数据样本描述 (1) 二、要解决的问题描述 (1) 1 数据管理与软件入门部分 (1) 1.1 分类汇总 (1) 1.2 个案排秩 (1) 1.3 连续变量变分组变量 (1) 2 统计描述与统计图表部分 (1) 2.1 频数分析 (1) 2.2 描述统计分析 (1) 3 假设检验方法部分 (1) 3.1 分布类型检验 (2) 3.1.1 正态分布 (2) 3.1.2 二项分布 (2) 3.1.3 游程检验 (2) 3.2 单因素方差分析 (2) 3.3 卡方检验 (2) 3.4 相关与线性回归的分析方法 (2) 3.4.1 相关分析(双变量相关分析&偏相关分析) (2) 3.4.2 线性回归模型 (2) 4 高级阶段方法部分 (2) 三、具体步骤描述 (3) 1 数据管理与软件入门部分 (3) 1.1 分类汇总 (3) 1.2 个案排秩 (4) 1.3 连续变量变分组变量 (4) 2 统计描述与统计图表部分 (5) 2.1 频数分析 (5) 2.2 描述统计分析 (7) 3 假设检验方法部分 (8) 3.1 分布类型检验 (8) 3.1.1 正态分布 (8) 3.1.2 二项分布 (10) 3.1.3 游程检验 (10) 3.2 单因素方差分析 (12) 3.3 卡方检验 (13) 3.4 相关与线性回归的分析方法 (14) 3.4.1 相关分析 (14) 3.4.2 线性回归模型 (15) 4 高级阶段方法部分 (17) 4.1 信度 (18) 4.2 效度 (18)

SPSS数理统计软件与应用作业

《统计软件及应用》课程论文

我国区域农业经济聚类分析 一、提出问题 农业是通过培育动植物生产食品及工业原料的产业,是支撑国民经济建设与发展的基础产品。农业问题的本质及其重大意义。农业是国之根本,它的发展关系到其他两大产业的繁荣与否。与此同时,面对复杂多变的国内国际政治、经济环境,中国在农业方面的基础地位日渐薄弱。然而,在强劲的GDP增速背后,农民的收入水平却提高不够。由于受自然、经济等因素的影响,农业发展具有很强的区域性。不同地区农业发展水平发展方式很是不同。对区域农业进行聚类分析对针对性的制定区域农业发展战略政策有很强的指导性。 二、数据收集 为了对我国区域农业经济进行聚类分析,这里选择与区域农业发展相关的11个评价指标,它们分别代表农业发展的总量方面,水利设施、除涝面积方面,家庭土地经营方面。具体而言,总量方面包括地区生产总值x1(亿元),农业生产总值x2(亿元);水利设施、除涝面积方面包括水库数x3 座),水库总容量x4(亿立方米),除涝面积x5(千公顷),水土流失治理面积x6(百万元)四项;家庭土地经营方面包括经营耕地面积x7(亩/人),经营山地面积x8(亩/人),园地面积x9(亩/人)、牧草地面积x10(亩/人)、养殖水面面积x11(亩/人)五项。 这些指标中国统计年鉴上取得,其原始数据如表1 。 表1 房地产业发展水平的原始数据 地区x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 北京14113. 58 124.36 82 93.8716 149.77 542.8 0.5335 0.061 0.140 6 0.053 9 天津9224.4 6 145.58 28 26.21342 9 377.22 46.43 1.4862 0.006 5 0.024 8 0.037 河北20394. 26 2562.8 1 1066 161.3647 2 1648.6 4 6290.31 1.981 0.118 1 0.079 4 山西9200.8 6 554.48 733 57.53152 6 89.13 5352.495 2.4314 0.034 8 0.200 7 0.0079 内蒙古11672 1095.2 8 497 167.891 277 10897.47 9.6537 0.232 2 0.021 9 126.75 57 辽宁18457. 27 1631.0 8 951 359.2693 6 985.25 3 6333.716 3.4984 0.197 4 0.084 7 0.039 6 吉林8667.5 8 1050.1 5 1643 320.3943 17 1021.4 3586.565 7.7491 0.135 7 0.020 1 黑龙江10368. 6 1302.9 913 178.7056 3334.9 4690.5 11.678 1 0.009 5 0.005 3 0.0217 上海17165. 98 114.15 55.35 0.2826 0.046 5 0.052 9 江苏41425. 48 2540.1 910 189.1796 59 2802.5 06 1052.269 1 1.1232 0.008 9 0.017 8 0.142 8 浙江27722. 31 1360.5 6 4217 398.0666 96 496.71 2431.64 0.6027 0.425 5 0.152 3 0.059 安徽12359. 33 1729.0 2 4819 326.5100 56 2269.0 5 2136.082 1.8662 0.336 7 0.048 1 0.107 2 福建14737. 12 1363.6 7 3225 185.3876 2 129.58 3 1470.802 6 0.8831 1.235 9 0.290 3 0.089 3 江西9451.2 6 1206.9 8 9809 293.7193 72 375.71 5 4514.041 62 1.6078 1.047 9 0.064 7 0.049 2 山东39169. 92 3588.2 8 6291 227.6167 92 2651.8 4651.521 1.5554 0.042 7 0.101 7 0.014 2 河南23092. 36 3258.0 9 2352 402.2094 67 1958.9 7 4428.695 1.68 0.023 8 0.034 0.007 5 湖北15967. 61 2147 5848 992.1486 1219.1 71 4666.472 1.6932 0.668 8 0.053 4 0.127 5 湖南16037. 96 2325.5 1209 2 402.29 3 486.3 4 2898.99 5 1.2504 0.531 2 0.074 4 0.0259 0.056 7 广东46013. 06 2286.9 8 7437 429.0038 88 514.49 1378.454 0.6475 0.308 8 0.117 2 0.069 7 广西9569.8 5 1675.0 6 4367 378.4462 97 209.57 2 1873.769 3 1.4335 0.641 1 0.142 9 0.0331 0.022 2 海南2064.5 539.83 996 100.0175 17.513 32.726 1.2842 0.818 7 0.577 3 0.024 5 重庆7925.5 8 685.38 2840 74.06409 3 2312.33 1.1854 0.343 9 0.066 1 0.005 0.019 2 四川17185. 48 2482.8 9 6759 214.9343 93.98 6329.638 1.0835 0.264 5 0.048 2 0.025 8

相关主题
文本预览
相关文档 最新文档