SPSS复习知识点及题目
- 格式:doc
- 大小:156.00 KB
- 文档页数:5
第一章1.SPSS是软件英文名称的首字母缩写,其最初为Statistical Package for the Social Sciences的缩写,即“社会科学统计软件包”。
2.SPSS系统运行管理方式(SPSS的几种基本运行方式)有:(1)完全窗口菜单运行方式(2)程序运行管理方式(3)混合运行管理方式3.SPSS的界面提供的五个窗口:数据编辑窗口、结果管理窗口、结果编辑窗口、语法编辑窗口、脚本窗口。
第二章1.SPSS的文件类型:语法文件(*.sps)、数据文件(*.sav)、结果输出文件(*.spv)。
2.SPSS数据编辑器的每一行数据称为一个个案(Case),每一个数据代表个体的属性,即变量(Variable)。
3.SPSS变量名的命名规则:1)必须以英文字母开头,其他部分可以含有字母、数字、下划线(即“-”);2)变量名尽量避免和SPSS已有的关键字重复,例如sum、compute、anova等;3)SPSS13及以后版本支持变量名最长为64Byte,即变量名最长为64个英文字符,或者32个中文字符;4)SPSS变量名不区分大小写,即SPSS认为Name、name、nAme这三个变量名没有区别。
4.变量度量类型:定量(个数、高度、温度等)、定序(“十分重要”、“重要”、“一般”、“不重要”)、定类(名字、地址、电话等)。
5.列和宽度的区别:变量宽度:对字符型变量,该数值决定了你能输入的字符串的长度;列:设定该变量数据视图中列的宽度。
8.数据文件的合并包括:纵向合并和横向合并(合并个案和合并变量),合并变量包括一对一合并和一对多合并。
9.SPSS用“(*)”表示变量来自于当前活动数据文件中的变量,而用“(+)”表示将要和当前数据文件进行合并的数据文件中的变量。
10.在合并数据文件之前,所有需要合并的数据文件必须预先按照关键变量进行升序排列。
否则,合并文件程序将失败。
11.(选择题)一对一合并变量时,两个文件都要提供个案;一对多合并时,活动的和非活动的文件都可以作为关键字。
spss期末复习题SPSS期末复习题SPSS(Statistical Package for the Social Sciences)是一款广泛应用于社会科学研究的统计分析软件。
在统计学课程中,学生通常需要学习和掌握SPSS的基本操作和分析技巧。
为了帮助大家复习和巩固所学知识,本文将提供一些SPSS期末复习题,希望能够对大家的学习有所帮助。
1. 描述统计a) 什么是描述统计?它在SPSS中有哪些常用的应用?b) 如何使用SPSS计算变量的均值、中位数、众数、标准差和方差?c) 如何使用SPSS制作频数分布表和直方图?2. 参数检验a) 什么是参数检验?它在SPSS中有哪些常用的应用?b) 如何使用SPSS进行t检验、方差分析和相关分析?c) 如何解读SPSS输出结果中的显著性水平和置信区间?3. 非参数检验a) 什么是非参数检验?它在SPSS中有哪些常用的应用?b) 如何使用SPSS进行Wilcoxon符号秩检验、Mann-Whitney U检验和Kruskal-Wallis H检验?c) 非参数检验与参数检验相比,有哪些优点和限制?4. 回归分析a) 什么是回归分析?它在SPSS中有哪些常用的应用?b) 如何使用SPSS进行简单线性回归和多元线性回归分析?c) 如何解读SPSS输出结果中的回归系数、R方和调整R方?5. 因子分析a) 什么是因子分析?它在SPSS中有哪些常用的应用?b) 如何使用SPSS进行主成分分析和验证性因子分析?c) 如何解读SPSS输出结果中的因子载荷、共同度和特殊因子方差?6. 聚类分析a) 什么是聚类分析?它在SPSS中有哪些常用的应用?b) 如何使用SPSS进行层次聚类和K均值聚类分析?c) 如何解读SPSS输出结果中的聚类图和聚类中心?以上仅是SPSS期末复习题的一部分,希望能够帮助大家回顾和巩固所学知识。
在实际操作SPSS时,建议大家多加练习和实践,通过分析真实数据来提高自己的技能。
SPSS练习题1.某种生产浴皂过程的设计规格为每批平均生产120块肥皂。
超过或低于这个标准都是不合理的。
有10批产品组成的样本中,每批生产的产品数据如下,假定总体服从正态分布。
108 118 120 122 119 113 124 122 120 123显著性水平为α=0.05,检验该样本结果能否表示该生产过程运作正常?解:这是一个单样本的T检验过程,设总体生产的产品数量平均值为μ,提出原假设H0=120。
Analyze→Compare Means→One-Sample T Test命令。
One-Sample Test结果显示,t统计量值为-0.705,相应的双尾显著性概率为0.498>0.05,因此没有理由拒绝原假设。
故认为据此样本数据推断总体,结果表示该生产过程运作正常。
2.公路损失数据研究机构的伤害和碰撞损失实验报告根据事故后的保险索赔数字对轿车型号进行评分,接近100的指数得分被认为是平均水平,较低的得分意味着更好、更安全的轿车型号。
下表所示数据是20款中型轿车和20型小型轿车的得分。
分析要点:(1)分别作出中型和小型轿车的五数概括(2)画出箱线图,并说明以上的汇总里关于中型轿车和小型轿车安全性的比较结果(3)进一步使用独立样本T检验比较中型轿车和小型轿车安全性解:(1)所谓的五数是指:最小值、25%下四分位数、50%的中位数、75%上四分位数和最大值。
首先对数据文件进行拆分,即按车型进行分组。
Data→Split File→Organize output by groups;Analyze→Descriptive Statistics→Frequencies,在Statistics对话框中选中Percentile Values栏目下的Quartiles复选框,并选中Dispersion栏目下的Minimum和Maximum两项,在Frequencies对话框中,单击OK按钮。
Statistics(a)小型a 车型= 小型Statistics(a)中型a ³µÐÍ = ÖÐÐÍ从结果可以看出:小型轿车得分的最小值73,25%的下四分位数为100.5,中位数为108.5,75%的上四分位数为121.5,最大值为140。
《SPSS原理与运用》练习题数据对应关系:06-均值检验;07-方差分析;08-相关分析;09-回归分析;10-非参数检验;17-作图1、以data06-03为例,分析身高大于等于155cm的与身高小于155cm的两组男生的体重和肺活量均值是否有显著性。
分析:一个因素有2个水平用独立样本t检验,此题即身高因素有155以上和以下2个水平,因此用独立样本t检验(analyze->compare means->independent-samples T test)。
报告:一、体重①m+s:>=155cm 时, m= 40.838kg; s= 5.117;<155cm 时, m= 34.133kg;s= 3.816;②方差齐性检验结果:P=0.198>0.05,说明方差齐性。
③t=4.056; p=0.001< 0.01,说明身高大于等于155cm 的与身高小于155cm的两组男生的体重有极显著性差异。
二、肺活量①m+s: >=155cm 时,m=2.404; s=0.402;<155cm 时, m=2.016;s=0.423;②方差齐性检验结果:P=0.961>0.05,说明方差齐性。
③t=2.512; p=0.018 < 0.05,说明说明身高大于等于155cm的与身高小于155cm的两组男生的体重有显著性差异。
2、以data06-04为例,判断体育疗法对降低血压是否有效。
分析:比较前后2种情况有无显著差异,用配对样本t检验,(analyze->compare means-> paired-samples T test).报告:①m+s 治疗前舒展压:m=119.50; s=10.069;治疗后舒展压:m=102.50; s=11.118;②相关系数correlation=0.599; p=0.067>0.05,说明体育疗法与降低血压相关。
spss大学考试题及答案一、选择题(每题2分,共20分)1. 在SPSS中,以下哪项不是数据视图(Data View)中的数据属性?A. 数字B. 日期C. 图片D. 标签答案:C2. SPSS中,用于描述性统计分析的命令是:A. AnalyzeB. TransformC. GraphD. File答案:A3. 在SPSS中,要进行t检验,应该选择以下哪个菜单?A. Analyze > Compare MeansB. Analyze > RegressionC. Analyze > Descriptive StatisticsD. Analyze > Nonparametric Tests答案:A4. 在SPSS中,如果需要计算一个变量的总和,应该使用以下哪个功能?A. ComputeB. AggregateC. AlgebraicD. Recode答案:B5. 在SPSS中,以下哪个命令用于因子分析?A. FactorB. ClusterC. Reliability AnalysisD. Canonical Correlation答案:A6. 要在SPSS中创建一个频率分布表,应该选择以下哪个命令?A. Analyze > Descriptive Statistics > FrequenciesB. Analyze > Descriptive Statistics > DescriptivesC. Analyze > Descriptive Statistics > ExploreD. Analyze > Descriptive Statistics > Crosstabs答案:A7. 在SPSS中,如果需要对数据进行排序,应该使用以下哪个命令?A. Sort CasesB. Rank CasesC. Order CasesD. Arrange Cases答案:A8. 在SPSS中,要进行卡方检验,应该选择以下哪个菜单?A. Analyze > Descriptive Statistics > CrosstabsB. Analyze > Compare Means > Independent-Samples T TestC. Analyze > Nonparametric Tests > Chi-SquareD. Analyze > Regression > Binary Logistic答案:C9. 在SPSS中,以下哪项不是数据录入时的变量属性?A. 变量类型B. 变量标签C. 缺失值D. 数据格式答案:D10. 在SPSS中,要进行相关性分析,应该选择以下哪个命令?A. Analyze > CorrelationB. Analyze > RegressionC. Analyze > FactorD. Analyze > Cluster答案:A二、简答题(每题5分,共30分)1. 描述SPSS中的数据录入过程。
一、单项选择题:(本大题小题,1分/每小题,共分)1.SPSS的数据文件后缀名是:(A).sav2.对数据的各种统计处理,SPSS是在下面哪一个选项中进行:(A)数据编辑窗口;3.在SPSS中,下面哪一个不是SPSS的运行方式(A)输入运行方式;4.下面哪一个选项不属于SPSS的数据分析步骤:(D)数据扩展;5.在SPSS中,下面哪一个选项不属于对变量(列)的描述:(B)变量名称大小;6.在SPSS的定义中,下面哪一个变量名的定义是错误的:(D)A_BFG_;首字符应以英文字母开头,后面可以跟除了!、?、*之外的字母或数字。
下划线、圆点不能为变量名的最后一个字符。
SPSS允许用汉字作为变量名。
7.在SPSS的定义中,下面哪一个变量名的定义是错误的:(A)AND;SPSS有默认的变量名,以字母“VAR”开头,后面补足5位数字,如VAR00001,VAR00012等。
变量名不能与SPSS内部特有的具有特定含义的保留字同名,如ALL、BY 、 AND 、 NOT 、 OR等。
8.在SPSS数据文件中,下面那一项不属于数据的结构:(D)数据值;9.在SPSS数据文件中,下面那一项属于数据的内容:(D)数据值;10. 通常来说,发放了900份问卷,可直接得到的有效问卷有800份,则SPSS所建立的相关数据文件中的行数为(D)800;11.下面那一项不属于SPSS的基本变量类型:(D)整数型;12.当在SPSS数据文件中输入变量为“职工姓名”,则应选择的变量类型是:(B)字符串型;13.当在SPSS数据文件中输入变量为“职工工资数”,则应选择的变量类型是:(A)数值型;13.当在SPSS数据文件中输入变量为“公司成立日期”,则应选择的变量类型是:(C)日期型;14.在SPSS的数据结构中,下面那一项不是“缺失数据”的定义:(D)数据不是科学计数法;15.统计学依据变量的计量尺度将变量分为三类,以下哪一类不属于这三类:(D)科学计数类型;16.在统计学中,变量“身高”属于计量尺度中的:(A)数值型变量;身高(定距)、优良中差(定序)、性别(定类)17.在统计学中,将变量“年龄”分为“老年”、“中年”、“青年”三个取值,分别用1、2、3表示,则变量“年龄”属于计量尺度中的:(B)定序型变量;18.在统计学中,将变量“性别”分为“男”、“女”、两个取值,分别用1、2表示,则变量“性别”属于计量尺度中的:(C)定类型变量;19.下面哪一个选项不能被SPSS系统正常打开:(C)文本文件格式;20. 下面哪一个选项不能被SPSS系统正常打开:(D).exe;21.在SPSS数据编辑窗口中,需要定义变量的数据结构,以下哪一项不属于变量的数据结构:(D)变量值;22. 在SPSS数据结构中,下面哪一项不属于数据类型:(D)数值标签型;23.下面哪一个选项不是SPSS中定义的基本描述统计量:(D)回归函数;24.下面哪一个选项不是SPSS中定义的基本描述统计量:D)因子;25.下面那一项刻画了随机变量分布形态的对称性:(D)偏度系数;26.下面那一项刻画了随机变量分布形态陡缓程度:(D)峰度系数;27.对于SPSS来说,下面那一项不包括在变量的频数分布内容中:(D)均值;(频数、百分比、有效百分比、累计百分比)27.对于SPSS来说,下面那一项不包括在变量的频数分布内容中:(C)标准差;28.在SPSS中,下面那一项不是频数分析中常用的统计图形:(D)分类图;29.在SPSS中,当需要对变量进行频数分析时,需要选择下面那一项菜单:(C)分析;30.在进行数据的统计分析之前,一般需要完成数据的预处理,以下哪一项不属于数据的预处理内容:(B)峰度和偏度处理;31.在SPSS中,当我需要对原有某个变量的数据进行取对数运算时,应选取下面那一项进行处理:(A)变量计算;32.在SPSS中,下面那一项不属于数据分组的目的:(D)有利于进行因子分析;33.对于SPSS中的组距分组,下面那一项是正确的说法:(A)分组数与数据本身特点和数据个数有关;34.对于SPSS来说,能够快捷找到变量数据的最大值和最小值的数据预处理方法是:(A)排序;35.对于SPSS来说,能够快捷找到变量数据的异常值的数据预处理方法是:(A)排序;36.在学生的一张数据表中,有平时分数、实验分数和卷面分数,如使用SPSS计算最终得分,则需要使用SPSS预处理中的:(C)变量计算;37.在SPSS中,以下哪个选项可以完成如下功能:由收集的整体数据中抽取出年龄大于30的数据:(A)数据选取;38.下面哪一个选项不是对数据的基本统计分析:(D)实现变量的排序与合并;39.在SPSS中,当变量是数值型时,则频数分析所用图形为:(A)直方图;40.在SPSS中,当需要选取出满足某一个条件的所有个案,则使用下面的那一项:(A)个案选择;41.在SPSS中,均值的计算适合下面那一项:(A)定距型;42.现有一批数据为(0,1,2,-2,3,-3,4),则这批数据的极差为:(A)7;43.以下图是某随机变量的概率密度,请问其峰度是:(B)小于零;右偏大于0;左偏小于0;偏度为0表示对称。
SPSS复习题一、简答题:1.SPSS的运行方式有几种?分别是什么?各自的特点是什么?答:SPSS的运行方式有三种,分别是完全窗口菜单运行方式、程序运行方式、混合运行方式。
完全窗口菜单运行方式的特点:所有分析操作过程都是通过菜单和按钮及对话框方式进行的.是经常使用的一种运行方式,适用于一般分析和SPSS的初学者。
程序运行方式的特点:手工编写SPSS命令程序;一次性提交计算机运行;适用于大规模的分析工作和熟练的SPSS 程序员。
混合运行方式的特点:在使用菜单的同时编辑SPSS程序,是完全窗口菜单方式和程序运行方式的综合。
2.SPSS中数据视图所对应的表格和一般的电子处理软件有什么区别?答:和一般电子表格处理软件相比,SPSS的“Data View”窗口还有以下一些特性:(1)一个列对应一个变量,即每一列代表一个变量(Variable)或一个被观测量的特征;(2)行是观测,即每一行代表一个个体、一个观测、一个样品,在SPSS中称为事件(Case);(3)单元包含值,即每个单元包括一个观测中的单个变量值;(4)数据文件是一张长方形的二维表。
3.SPSS有哪两个主要窗口?它们的功能和特点各是什么?答:数据编辑窗口,功能:定义SPSS数据的结构、数据文件的录入、编辑、管理等基本操作的窗口;特点:SPSS运行过程中自动打开;SPSS中各统计分析功能都是针对该窗口中的数据进行的;窗口中的数据文件以.sav存于磁盘上;两个视图:数据视图和变量视图。
输出窗口,功能:SPSS统计分析报表及图形的输出的窗口;特点:在进行第一次分析时自动打开,也可手工打开;输出窗口可以关闭,窗口内容以.spv存于磁盘上;两个视图:目录视图和内容视图。
4.SPSS的数据加工和管理功能主要集中在哪些菜单中?统计绘图和分析功能主要集中在哪些菜单中?答案:SPSS的数据加工和管理功能主要集中在编辑菜单、数据菜单、转换菜单。
统计绘图和分析功能主要集中在统计绘图和分析功能主要集中在分析菜单和图形菜单。
spss期末复习题库SPSS期末复习题库一、选择题1. SPSS是一款由哪个公司开发的统计分析软件?A. IBMB. MicrosoftC. OracleD. Google2. 在SPSS中,数据视图(Data View)是用来做什么的?A. 进行数据的输入和编辑B. 进行数据的统计分析C. 制作图表D. 编写脚本3. SPSS中,以下哪个命令用于描述性统计分析?A. FREQUENCIESB. DESCRIPTIVESC. CROSSTABSD. T-TEST4. 在SPSS中,要进行线性回归分析,应该使用哪个命令?A. REGRESSIONB. CORRC. FACTORD. CLUSTER5. SPSS中,数据文件的默认扩展名是什么?A. .txtB. .csvC. .savD. .xls二、填空题6. 在SPSS中,数据集可以存储为______格式,以便于后续分析。
7. SPSS的输出视图(Output View)用于显示______和图表。
8. 使用SPSS进行因子分析时,通常需要使用______命令。
9. 在SPSS中,要进行方差分析,可以使用______命令。
10. SPSS的图形用户界面(GUI)允许用户通过______来执行命令。
三、简答题11. 简述SPSS中数据清洗的基本步骤。
12. 解释SPSS中变量类型的区别,并给出至少两种类型的示例。
13. 描述如何使用SPSS进行假设检验,并给出一个具体的例子。
14. 解释在SPSS中进行聚类分析的一般过程。
15. 讨论在SPSS中进行数据可视化的重要性及其应用场景。
四、应用题16. 假设你有一个包含学生考试成绩的数据集,请描述如何使用SPSS 来计算平均分和标准差。
17. 给出一个实际案例,说明如何使用SPSS进行相关性分析。
18. 描述如何利用SPSS进行多变量回归分析,并解释其在实际研究中的应用。
19. 假设你要分析不同性别的学生在数学和语文成绩上的差异,请说明如何使用SPSS进行独立样本T检验。
spss考试题及答案1. 单选题:在SPSS中,以下哪个选项不是数据清洗的步骤?A. 缺失值处理B. 异常值检测C. 数据转换D. 数据备份答案:D2. 多选题:在SPSS中进行描述性统计分析时,可以输出哪些统计量?A. 均值B. 中位数C. 众数D. 标准差E. 方差答案:A, B, C, D, E3. 判断题:在SPSS中,使用“描述统计”功能可以计算出数据的峰度。
对错答案:错4. 填空题:在SPSS中,进行相关性分析时,可以使用_________菜单下的“相关性”选项。
答案:分析5. 简答题:请简述SPSS中因子分析的步骤。
答案:因子分析的步骤包括:a. 确定分析变量b. 进行KMO和Bartlett的球形度检验c. 选择提取方法(如主成分分析或因子分析)d. 确定因子数量e. 进行因子旋转(如需要)f. 解释因子6. 案例分析题:某研究者收集了一组数据,想要使用SPSS进行方差分析。
请描述方差分析的一般步骤。
答案:方差分析的一般步骤如下:a. 确定研究假设b. 选择合适的方差分析类型(如单因素方差分析或多因素方差分析)c. 输入数据并设置因子和因变量d. 进行方差分析e. 检查方差齐性f. 进行后续多重比较(如果需要)g. 解释结果7. 操作题:使用SPSS进行回归分析,并解释回归系数的意义。
答案:进行回归分析的步骤包括:a. 选择分析菜单下的回归选项b. 选择线性回归c. 设置因变量和自变量d. 运行回归分析e. 查看输出结果f. 解释回归系数,即自变量每变化一个单位,因变量预期的变化量以上即为SPSS考试题及答案的排版及格式。
spss复习题答案一、选择题1. 在SPSS中,数据文件的扩展名是什么?A. .txtB. .csvC. .savD. .xls答案:C2. 如何在SPSS中创建一个新的数据文件?A. 通过“文件”菜单选择“新建”B. 通过“文件”菜单选择“打开”C. 通过“数据”菜单选择“新建数据集”D. 通过“编辑”菜单选择“新建数据集”答案:A3. 在SPSS中,如何对数据进行排序?A. 通过“数据”菜单选择“排序案例”B. 通过“转换”菜单选择“排序案例”C. 通过“分析”菜单选择“排序案例”D. 通过“窗口”菜单选择“排序案例”答案:A4. 若想在SPSS中计算变量的平均值,应使用哪个命令?A. DESCRIPTIVESB. FREQUENCIESC. CROSSTABSD. MEANS答案:D5. 在SPSS中,如何对数据进行分组?A. 通过“数据”菜单选择“分组变量”B. 通过“转换”菜单选择“分组变量”C. 通过“分析”菜单选择“分组变量”D. 通过“窗口”菜单选择“分组变量”答案:B二、填空题1. 在SPSS中,数据文件的基本单位是________,它包含了一系列的变量和观测值。
答案:变量2. 使用SPSS进行数据分析时,数据的输入和编辑是通过________视图完成的。
答案:数据编辑3. 在SPSS中,可以通过________功能来对数据进行清洗,以确保数据的准确性和完整性。
答案:数据清洗4. 在进行假设检验时,SPSS提供了多种统计方法,其中用于比较两个独立样本均值差异的统计方法是________检验。
答案:独立样本T检验5. 在SPSS中,可以通过________功能来创建新的变量,以便于进行更复杂的数据分析。
答案:变量计算三、简答题1. 描述在SPSS中如何进行数据的导入和导出。
答案:在SPSS中,可以通过“文件”菜单选择“导入”来导入数据,支持多种格式如文本文件、Excel文件等。
数据导出则可以通过“文件”菜单选择“导出”来实现,可以选择导出为文本文件、Excel文件等多种格式。
教育统计与测量(SPSS)复习第一章:概述1.什么是信息?简单地讲,通过信息,可以告诉我们某件事情,可以使我们增加一定的知识。
英语中的信息是“information”,表示信息可以让受者产生某种形式的变化,这种变化可以让受者从认识上的不完全、不理解、不确定变为完全、理解和确定。
信息论的奠基者香农将信息定义为熵的减少,即信息可以消除人们对事物认识的不确定性,并将消除不确定程度的多少作为信息量的量度。
信息的价值因人而异。
所谓有用的信息,因人而异。
是否是信息,不是由传者,而是由受者所决定。
2.教育信息数量化的特点表示教育信息的数量与各种物理测量的数量有着明显的不同,在教育信息的统计处理中,应根据教育信息数量化的方法、特点不同,决定对这种信息进行统计处理的具体方法。
这是进行教育信息处理的重要关键。
3.教育信息数量化的尺度(1)名义尺度(nominal scale) :名义尺度的数值仅具符号的意义。
名义尺度的数字多用于表示不同的数别,它为教育信息的表示,存贮带来了很大的方便。
(2)序数尺度(ordinal scale) :序数尺度的数字多用于表示某些现象的排列顺序,可比较其大小,但不能进行四则运算,所以对这类数字的数值群的处理较多。
(3)距离尺度(interval scale,equal unit scale):距离尺度又称间隔尺度,是指数值间的距离(间隔),具有加法性。
距离尺度要求具有等价的单位,但不要求确定的零点位置。
对距离尺度的数字可以计算算术平均值、计算标准差,求相关系数等各种统计处理。
(4)比例尺度(ratio scale) :比例尺度是一种具有绝对零度的距离尺度值。
表示身长、体重的数值是比例尺度值。
对比例尺度的数字可进行各种统计处理。
4.数据的类型(1)定类数据(也称名义级数据),是数据的最低级。
(性别、编号)(2)定序数据(也称序次级数据),是数据的中间级。
(名次、优秀良好及格、有顺序的)(3)定距数据(也称间距级数据),是具有一定单位的实际测量值。
(可以比较距离,可以进行平均值、标准差等运算,但不能进行加减乘除)(4)定比数据(也称比率数据),是数据的最高等级。
(测验成绩、身高、体重等,可以进行各种处理)5.描述统计对已获得的数据进行整理、概括,显现其分布特征的统计方法,称为描述统计。
其目的在于将大量零散的、杂乱无序的数字资料进行整理、归纳、减缩、概括,使事物的全貌及其分布特征清晰、明确地显现出来。
例如描述学业考试中全校或班级的考试状况(平均成绩)、描述学生的升学率、及格率或优秀率等。
6.推断统计根据样本所提供的信息,运用概率的理论进行分析、论证,在一定可靠程度上对总体分布特征进行估计、推测,这种统计方法称为推断统计。
其目的在于根据已知的情况,在一定概率意义上估计、推断未知的情况。
例如随机抽取某校若干名学生的考试成绩,推断该校学生成绩与全市该类学生考试成绩的差异性。
7.教育统计中几个基本概念(1)随机现象与随机变量随机现象是一种不确定性现象。
如考试、心理测验等。
存在随机误差。
我们把具有变化规律的表示随机现象各种结果的变量称为随机变量。
如学生的身高、体重、性别、智商、成绩等等。
随机变量具有离散性、变异性与规律性等特点。
(2)总体和个体总体:所研究对象的全体称为总体(或母体)。
个体:组成总体的元素称为个体。
在一个总体中,若个体的数目是有限的,则该总体称为有限总体;若个体的数目是无限的,则该总体称为无限总体。
(3)样本:样本是从总体中抽取的作为观察对象的一部分个体。
样本中包含的个体数目称为样本的容量,一般用n表示。
样本中个体数目大于30一般称为大样本,等于或小于30称为小样本。
(4)样本上的数字特征是统计量。
也就是说,根据实得的数据所计算出的能够描述这组数据各种特征的数量是统计量。
(5)总体上的各种数字特征是参数。
也即反映总体上各种特征的数量参数。
在进行统计推断时,就是根据样本统计量来推断总体相应的参数。
8.常用统计量(1)集中量数:代表一组数据典型水平或集中趋势的量。
常用的集中量有算术平均数、中位数(首先将数据依其取值大小排列成序,然后找出位于中间的那个数,就是中位数。
有两种情况:1.数据个数是奇数的情况。
则取序列为第(N+1)/2的那个数为中位数。
2.数据个数是偶数的情况。
则取序列为第N/2与第(N/2)+1个这两个数据的均数为中位数)、众数(出现频数最多的数)等。
(2)差异量数:代表一组数据离散程度、变异程度的量。
常用的差异量指标有全距(一组数中最大值与最小值之差)、四分位距、百分位距、平均差、方差、标准差(标准差的值越大,表明这组数据的离散程度越大,即数据越参差不齐,分布范围越广)、差异系数等。
区别:集中量数是指量尺上的一个点,差异量数是量尺上的一段距离(离中趋势)9.相关系数相关系数:用于描述两个或多个变量间关联程度的量。
两变量之间相关密切程度的数字指标[-1,1]。
方向:正相关(正的话);负相关(负的话);零相关0相关程度:完全正相关1;完全负相关-1;零相关10.教育统计的常见问题类型及统计方法(1)对采集数据的一般性统计,如频数、频率、均值、方差等;(基本统计分析描述统计中的)(2)两个总体之间某类特征数据的差异显著性;(定性数据:卡方检验;定量数据:正态分布的用T检验,非正态分布的用非参数检验。
)(3)多个总体之间某类特征数据的差异显著性;(定性数据:卡方检验;定量数据:正态分布的用方差分析,非正态分布的用非参数检验。
)(4)一个或多个因素对结果影响的显著性;(正态分布:方差分析;非正态分布:非参数检验)(5)两个特征变量数据的相关性大小;(定性数据:卡方检验;定量数据:相关分析)(6)某变量是否服从特定分布;(非参数检验)(7)如何将多个研究对象进行分类;(聚类分析)(8)如何将多个指标描述的对象简化成少量指标描述;(因子分析与主成分分析)(9)如何将多个不同量纲指标描述的研究对象进行综合排序。
(因子分析和主成分分析)11.T检验与方差分析有哪些相同于不同的地方?相同:都是对组间的差异性进行检验。
前提都是:正态性,方差齐次性,独立性不同:T检验用于比较两组数据之间的差异,T检验属于均值分析,它是用来检验两类母体均值是否相等。
均值分析是来考察不同样本之间是否存在差异,而方差分析用于比较多组数据之间的差异,评估不同样本之间的差异是否由某个因素起主要作用。
T检验假设:H0: μ0=μ1 H1: μ0≠μ1;方差分析假设:假设:H0: μ0=μ1=……H1: μ0,μ1,……不全相等。
12.SPSS主界面有两个:一个是数据编辑窗口(数据视图和变量视图),另一个是SPSS输出窗口。
13.变量:变量名是变量的名称,由用户自己来命名,对每一个数据项确立一个变量名;变量类型有数值型、日期型、字符串型等8种类型;变量长度是指设置变量的长度,但当变量为日期型时无效;变量标签是对变量名的进一步描述,变量名不能超过8个字符,但变量标签可以长达120个字符,且可以显示大小写,需要时可以用变量标签对变量名的含义加以解释;变量值标签是对变量的每一个可能取值的进一步描述,当变量是定类或定序变量时非常有用,比如对于文化程度为高中、专科、本科可以用1、2、3来分别代表这3个层次;缺失值用于缺失值的定义,缺失值有系统缺失值和用户缺失值两类;显示宽度表示输入变量的显示宽度,默认为8;对齐方式包括左对齐、中间对齐和右对齐;变量的测试尺度按测量精度可分为定类变量、定序变量和定距变量。
第二章:相关分析1.积差相关分析当两个变量都是正态连续变量,而且两者之间呈线性关系时,表示这两个变量间的相关称为积差相关,积差相关又称积矩相关,也称皮尔逊相关。
如都呈正态分布的且以百分制表示的语文与数学成绩之间的相关关系可用积差相关来表示它们的变化关系。
2.等级相关分析等级相关是指以等级次序排列或以等级次序表示的变量之间的相关。
主要包括斯皮尔曼二列等级相关和肯德尔和谐系数多列等级相关。
⏹斯皮尔曼等级相关当两个变量值以等级次序排列或以等级次序表示时,两个相应总体并不一定呈正态分布,样本容量也不一定大于30,表示这两变量之间的相关,称为等级相关。
根据某种标准对某项成绩所评定的等级,或按某种指标的优劣程度所排列的名次等,均属于等级次序性分数。
⏹肯德尔和谐系数当多个(两个以上)变量值以等级次序排列或以等级次序表示,描述这几个变量之间的一致性程度(即相关)的量,称为肯德尔和谐系数。
它常用来表示几个评定者对同一组学生学习成绩等级评定的一致性程度,或同一个评定者对同一组学生的学习成绩用等级先后评定多次之间的一致性程度。
3.二列相关分析质与量的相关是指一个变量为质,另一个变量为量,这两个变量之间的相关。
如智商、学科分数、身高、体重是表现为量的变量,男与女、优与劣、及格与不及格等是表现为质的变量。
质与量的相关主要包括二列相关、点二列相关、多系列相关。
⏹二列相关当两个变量都是正态连续变量,其中一个变量被人为地划分成二分变量。
如及格与不及格、好与差、通过与没通过等。
样本n>80。
第三章:参数估计与假设检验(单样本T检验、独立样本T检验、配对样本T检验、单因素方差分析)P109—116显著性水平,是指估计总体参数落在某一区间时,可能犯错误的概率。
一般取0.05或0.01。
0.95的置信区间是指总体参数落在该区间之内,估计正确的概率为95%,而出现错误的概率为5%。
在假设检验中,还指拒绝虚无假设时可能出现的犯错误的概率水平。
%时出现说明连这么小的概率都出现,这个问题是存在的。
第四章:方差分析1.方差分析的三条假设⏹总体分布的正态性。
方差分析与Z检验和T检验一样,也要求样本必须来自正态分布的总体。
⏹各个实验组的方差齐性。
方差分析要求各总体的方差或标准差相同。
因此,方差分析前需对各样本的方差做一致性检验,称方差齐性检验,只有满足了方差齐性的条件才可做方差分析。
⏹变异具有加可性。
方差分析是将事物的总变异分解为各个不同变异来源,分解后的各部分变异是相互独立,相加后又构成总变异。
2.如何方差分析的表第五章:项目分析1.项目分析的目的:求出问卷个别题项的临界比率值—CR值,了解题目的分辨度,将未达显著水准的题项删除。
2.项目分析的基本步骤:(1)量表题项的反向计分(量表中如无反向题,此步骤可以省略,但是只要有反向题就要进行反向计分)。
(2)求出量表的总分。
(3)量表总分高低排列。
(4)找出高低分组上下27%处的分数。
(5)依临界分数将观察值在量表中之得分分成高低二组。
(6)以独立样本T检验二组在每个题项的差异。
(高分组与低分组)(7)将T检验结果未达显著性的题项删除。
(差异大的,说明题目有意义,差异小的,说明题目意义不大)第六章:因素分析1.因素分析的目的⏹通过寻找或确定几个较少的“假想”因子来反映多个观测变量中蕴含的大部分信息,从而浓缩或化简观测数据。