2.特征量---集中量数与差异量数
- 格式:ppt
- 大小:170.00 KB
- 文档页数:24
第一章绪论1.描述统计(descriptive statistics)主要研究如何将实验或调查得到的大量数据进行图表整理或简缩成有代表性的数字(即统计量数),使其能客观、全面地反映这组数据的全貌,将其所提供的信息充分显现出来,为进一步统计分析和推论提供可能。
2.描述统计只限于对试验样本所得观测数据的统计分析,不考察其总体的特性。
3.推论统计(inferential statistics)是以描述统计为基础,从而解决由局部到全体的推论问题,即通过对一组统计量的计算分析,推论该组数据所代表的总体特性。
4.变量(variables):一个可以取不同数值的物体属性/事件。
5.事前无法预期结果的变量——随机变量6.观测值(原始取值):事后测定的某一结果。
7.概念理解:[涉及“实验”] 自变量(及其各水平)& 因变量(及相应的反应指标);[涉及“调查”,粗略对应于] 属性变量& 反应变量8.计数资料(count data):计算个数的数据,(如人口数,学校数,男女数等)9.计量资料(measurement data):借助于一定的测量工具或一定的测量标准而获得的数据(如分数,身高,体重,IQ)10.称名数据(nominal data):只区分属性或类别上的不同,只可计数,不能排序(性别,学科,职业)11.等级/顺序数据(ordinal data):可排序,但无相等单位,不能加减。
(等级评定,受教育程度,职称)12.等距数据(interval data):具有相等单位,无绝对零的数据,能加减不能乘除。
13.比率数据(ratio data):既表明量的大小,又具有相等单位,可以加减乘除,具有绝对零点。
14.称名数据和顺序数据合称为离散数据。
15.等距数据和比率数据合称为连续数据。
16.离散数据(discrete data)又称为不连续数据,这类数据在任何两个数据点之间所取的数据的个数是有限的。
17.连续数据(continuous data)指任意两个数据点之间都可以细分出无限多个大小不同的数值。
目 录第一部分 考研真题精选一、单项选择题二、多项选择题三、简答题四、综合题第二部分 章节题库第1章 绪 论第2章 统计图表第3章 集中量数第4章 差异量数第5章 相关关系第6章 概率分布第7章 参数估计第8章 假设检验第9章 方差分析第10章 χ2检验第11章 非参数检验第12章 线性回归第13章 多变量统计分析简介第14章 抽样原理及方法第一部分 考研真题精选一、单项选择题1已知某小学一年级学生的体重平均数21kg,标准差3.2kg,身高平均数120cm,标准差6.0cm,则下列关于体重和身高离散程度的说法正确的是( )。
[统考2019研]A.体重离散程度更大B.身高离散程度更大C.两者离散程度一样D.两者无法比较【答案】A【解析】计算体重和身高的变异系数,CV体重=(3.2/21)×100%=15.2%,CV身高=(6/120)×100%=5%。
由此可知体重离散程度更大。
2已知某正态总体的标准差为16,现从中随机抽取一个n=100的样本,样本标准差为16,则样本平均数分布的标准误为( )。
[统考2019研]A.0.16B.1.6C.4D.25【答案】B【解析】总体正态,且方差已知,则样本平均数的分布为正态分布,标准误SE=σ/sqr(n)=16/10=1.6。
3如果学生参加压力量表测试的分数服从正态分布,平均数为5,标准差为2,那么分数处在5和9之间的学生百分比约为( )。
[统考2019研]A.34%B.48%C.50%D.68%【答案】B【解析】计算原始分数为5的标准分数Z1=0,原始分数为9的标准分数Z2=2,已知±1.96包含95%的个体,则可估计p(0<Z<2)=0.48。
4对样本平均数进行双尾假设检验,在α=0.10水平上拒绝了虚无假设。
如果用相同数据计算总体均值的置信区间,下列描述正确的是( )。
[统考2019研]A.置信区间不能覆盖总体均值B.置信区间覆盖总体均值为10%C.置信区间覆盖总体均值为90%D.置信区间覆盖总体均值为0.9%【答案】C【解析】置信度即置信区间覆盖总体均值的概率,题干说明置信度为1-α=0.90。
第二章常用统计参数第二章常用统计参数用参数来描述一组变量的分布特征,便于我们对数据分布状况进行更好的代表性的描述,也有利于我们更好地了解数据的特点。
常见的统计参数包括三类:集中量数、差异量数、地位量数(相对量数X相关量数。
描述统计的指标通常有五类。
第一类集中量数:用于表示数据的集中趋势,是评定一组数据是否有代表性的综合指标,比如平均数、中数、众数等。
概述[不背]第二类差异量数:用于表示数据的离散趋势,是说明一组数据分散程度的指标,比如方差、标准差、差异系数等。
第三类地位量数:是反映个体观测数据在团体中所处位置的量数,比如百分位数、百分等级和标准分数等。
第四类相关量数:用于表示数据间的相互关系,是说明数据间关联程度的指标,比如积差相关、肯德尔和谐系数、①相关等。
第五类:是反映数据的分布形状,比如偏态量和峰度等(不作介绍I第一节集中量数(一)集中量数的定义(种类、作用)[湖南12名]描述数据集中趋势的统计量数称为集中量数。
集中量数能反映大量数据向某一点集中的情况。
常用的集中量数包括算术平均数、加权平均数、几何平均数、中数、众数等等,它们的作用都是用于度量次数分布的集中趋势。
(二)算术平均数(平均数、均数)(一级)简述算术平均数的定义和优缺点。
(1)平均数的含义算术平均数可简称为平均数或均数,符号可记为M。
算术平均数即数据总和除以数据个数,即所有观察值的总和与总频数之比。
只有在为了与其他几种集中.数洞区别时,如几何平均数、调和平均数、加权平均数,才全称为算术平均数。
如果平均数是由变量计算的,就用相应的变量表示,如又匕算术平均数是用以度量连续变量次数分布集中趋势及位置的最常用的集中量数,在一组数据中如果没有极端值, 平均数就是集中趋势中最有代表性的数字指标,是真值的最佳估计值。
(2)平均数的优缺点简述算术平均数的使用特点[含优缺点]算术平均数优点①反应灵敏。
观测数据中任1可一个数值或大或小的变化,甚至细微的变化,在计算平均数时,都能反映出来。
考研真题和强化习题详解第一章绪论一、单选题1 .三位研究者评价人们对四种速食面品牌的喜好程度。
研究者甲让评定者先挑出最喜欢的品牌,然后挑出剩下三种品牌中最喜欢的,最后再挑出剩下两种品牌中比较喜欢的。
研究者乙让评定者将四种品牌分别给予l~5 的等级评定,( l 表示非常不喜欢,5 表示非常喜欢),研究者丙只是让评定者挑出自己最喜欢的品牌。
研究者甲、乙、丙所使用的数据类型分别是:( )A .类目型―顺序型―计数型B .顺序型―等距型―类目型C .顺序型―等距型―顺序型D .顺序型―等比型―计数型2 .调查了n =200 个不同年龄组的被试对手表显示的偏好程度,如下:该题自变量与因变量的数据类型分别是:( )A .类目型―顺序型B .计数型―等比型C .顺序型―等距型D .顺序型―命名型3 .157.5 这个数的上限是()。
A . 157 . 75B . 157 . 65C . 157 . 55D . 158 . 54 .随机现象的数量化表示称为()。
A .自变量B .随机变量C .因变量D .相关变量5 .实验或研究对象的全体被称之为()。
A .总体B .样本点C .个体D .元素6 .下列数据中,哪个数据是顺序变量?( )A .父亲的月工资为1300 元B .小明的语文成绩为80 分C .小强100 米跑得第2 名D .小红某项技能测试得5 分7、比较时只能进行加减运算而不能使用乘除运算的数据是【】。
A .称名数据B .顺序数据C .等距数据D .比率数据参考答案:1 . B 2 . D 3 . C 4 . B 5 . A 6 . C 7.C二、概念题1.描述统计(吉林大学2002 研)答:描述统计指研究如何整理心理教育科学实验或调查的数据,描述一组数据的全貌,表达一件事物的性质的统计方法。
比如整理实验或调查来的大量数据,找出这些数据分布的特征,计算集中趋势、离中趋势或相关系数等,将大量数据简缩,找出其中所传递的信息。
绪论一、教育统计1.统计:到达对总体的量的认识。
教育统计:从总体上把握与认识教育领域各种现象的量的取值,为教育工作、管理和开展效劳。
是数理统计和教育学、心理学交叉的产物。
2.教育统计的主要内容:描述统计——概括和表达统计调查所获得的数据。
推断统计——利用样本数据资料,根据数理统计理论,对总体的数量特征与关系作出推论判断,即进行统计估计和统计假设检验。
是教育统计的核心内容。
二、教育测量1.就是对考察研究的教育对象,按一定规那么在某种性质的是量尺上指定值。
2.测量量尺:以下四种量尺的量化水平由低到高。
名义量尺上的数只有类别标志。
顺利量尺上的数有优劣、大小、先后之别,如学业成绩。
等距量尺上的数单位相等,零点任意指定,如温度计指数比率量尺等单位且有零点,如测身高、体重。
3.教育测量由三个根本要素:①工具:学业成绩——考试卷心理测量——心理测验〔口头的、文字的、器具〕②程序:施测和评分的步骤与操作,与所测对象的性质与测量工具的适应,严格控制误差。
③参照系——用来解释结果的意义,转化成某种量尺上的值。
4.教育测量的特点①间接性。
教育测量所测的主要对象,是爱教育者的心理特性,如学业成绩、智力水平、人格特点等,潜存于主体内部,不能直接观察,只能设置一定情境,施以特定刺激,引发行为样本,然后才能按一定规那么在某种性质上指定值,间接推论其内部心理特质的实有状态和水平。
测验,特指标准化测验的测量,所谓标准化是指测量工具、施测与评分程序、解释分数的参照系标准化。
标准化考试,对学业成绩进行的标准化测验量表:标准化测验中的测量工具与解释分数的常模,合称为量表。
心理量表就是指心理测量工具与常模的结合。
②要抽样进行。
5.教育测量的主要内容:一是测量工具编制、施测与评分程序确立,常模与标准建立的一般理论和方法,包括工程分析、测验质量检验的具体理论与技术。
二是各种类型的教育与心理测验的具体编制和使用,包括学业成绩测验、智力测验、人格测验等。
思想政治课教学测量与评价专题二课后作业 :数据特征量的计算1. 填空题1) 数据的种类有_集中量数 __,_差异量数2) 集中量数反映了一组数据的__趋势、集中位置或者最具代表性的数值___________.3) 差异量数反映了一组数据的_分散程度____________.2. 计算题1) 计算下列数据的平均数,中数及众数7,8,9,9,10,11,12,14解:平均数为(7+8+9+9+10+11+12+14)/8=10中位数是(9+10)/2=9.5众数是92) 某校五年级实验班平均数学成绩为84分,标准差为16分,普通班平均数学成绩为80.5分,标准差为13.8分,问哪个班数学成绩差异较大.解:实验班的成绩差异较大。
3) 某中学初一,一班40名学生期末外语平均为84分,初二二班38名学生期末外语平均分为87.5.求全年级两个班期末外语平均分. 解:844087.53885.74038⨯+⨯=+ 4) 求下列数据的极差,平均差和标准差.14,10,12,21,15,17,20,24解:极差R=24-14=10平均数为(14+10+12+21+15+17+20+24)/8=1338平均差:11331331331331331331331331410122115172024888888888M D ⎡⎤∙=⨯-+-+-+-+-+-+-+-⎢⎥⎣⎦ =318标准差:18S ==1.583. 简答题1) 何为差异系数?它的主要作用是什么?答:差异系数也称相对差异量,它从相对以上来衡量一组数据的分散程度,而受其计量单位,水平值影响的差异量称为绝对差异量。
差异系数用于不同单位的两组数据比较差异大小。
2)三种集中量数有何共性?有何区别,试对它们加以比较答:共性:三种集中量的共性是反映了一组数据的集中位置,指出了一组数据中有典型意义的数。
区别:平均数应用广泛,他考虑到了每一个数据,并且便于用公式表示,缺点是当数据极端出现较大或者较小数时,作为衡量技术趋势的亮度会受到较大影响。
一、数据类型1、称名数据(类别变量):用数字表示个体在属性上的特征或类别上的不同的变量,如性别(0,1)、学校类型、门牌号,一般为整数。
2、顺序变量:用数字表示个体在某个有序状态中所处的位置、层次或水平的变量。
该类型 数据不具有相等单位即第一名和第二名之间的身高差数值不等于第二名与第 三名之间的身高差,因此不能进行加减乘除运算,如考试排名、工资级别、 奖牌榜等。
3、等距数据:取值具有“距离”特征的变量。
即有相等单位也能进行加减运算,但是没有 绝对零,如温度。
4、比率数据:即表明量的大小,也有测量单位,同时还具有绝对零点的变量,如身高、体 重、面积、反应时等,可进行加、减、乘、除运算。
二、地位量数、集中量数、差异量数的概念与分类:1、地位量数:表明研究对象某一属性的数量化指标—原始变量在其所处分布中地位的量数, 称为地位量数。
包括百分位分数、百分等级分数、标准分数、T 分数、Z 分数。
2、集中量数:用来描述一组数据集中趋势的统计量数。
包括算术平均数、几何平均数、加权平均数、调和平均数、中数和众数。
3、差异量数亦称为离中量数,表示数据分散程度的统计量,反映的是各变量值远离其中心值的程度。
包括全距、平均差、方差、标准差、差异系数。
三、集中量数各自的特点(优缺点)1、算术平均数的优缺点:优点:①反应灵敏 ②计算严密 ③计算简单 ④简明易解 ⑤可作进一步演算 ⑥较少受抽样影响缺点: ①易受极端数据的影响 ②不能有模糊不清的数据 ③不能用不同质的数据 2、中数的优缺点:优点:计算简单、不受极端数据的影响缺点: ①误差较大 ②受抽样变动影响较大,不如平均数稳定 ③反应不灵敏 ④难以作进一步的代数运算 3、众数的优缺点:优点:概念简单明了,容易理解缺点:①不稳定,受分组和样本变动的影响 ②反应不够灵敏③只是一个估计值 ④不能作进一步代数运算=和≠()()()()11222222--=--=-=-=∑∑∑∑n X X S n X X S NX N X i i i i 样本方差和样本标准差总体方差和总体标准差μσμσ四、平均数与标准差的性质1、算术平均数的性质①一组数据的每一个数与平均数的差(离均差)的总和等于零;②一组数据的每一个数加上常数c ,其平均数为原来的平均数加常数c ; ③一组数据的每一个数乘以常数c ,其平均数为原来的平均数乘常数c ; ④一组数据的每一个数乘以常数c ,再加上一个常数d 其平均数为原来的平均数乘常数c 再 加上常数d ;2、标准差的性质:①每个观测值都加一个相同的常数C 后,计算得到的标准差等于原标准差②每个观测值都乘以一个相同的常数C 后,计算得到的标准差等于原标准差乘以这个常数 ③每一个观测值都乘以一个相同的常数C (C ≠0),再加上一个常数d 所得的标准差等于原标准差乘以一个常数方差和标准差是表示一组数据离散程度的最好指标。
第3章 集中量数与差异量数3.1 复习笔记一、集中量数集中量数又称集中趋势,是体现一组数据一般水平的统计量。
它能反映频数分布中大量数据向某一点集中的情况。
(一)算术平均数1.含义算术平均数(mean )是最常用的,也是最容易理解的一个集中量数指标。
算术平均数是所有观察值的总和与总频数之商,也简称为平均数、均值或者均数。
可以用μ来表示;如果想表示变量X 的平均数,可以表示为X 。
2.计算公式假设X 1,X 2,…,X N 代表各次观测值,N 为观察的总频数,则其算术平均数为:123N X +X +X ++X =Nμ⋅⋅⋅ 记作: N 11=N i i X μ=∑ 其中,∑表示连加,1N i =∑表示从1i =到i N =的所有观测值i X 的总和。
3.性质(1)数据中如果每一个数据都加上一个常数C ,则算术平均数也需要加上C ,即∑=+=+ni C X C X n 1)(1 (2)数据中如果每一个数据都乘以一个常数C ,则算数平均数也需要乘以C ,即∑=⋅=⋅n i C X C X n 1)(1 (二)中数中数(median )又称为中位数,它将数据分为数目相等的两半,其中一半的值比它小,另外一半的值比它大,等价于百分位数是50的那个数。
如果将所有数据按照大小顺序进行排列,那么中数正好位于正中间。
中数用M d 表示。
对于一个分布而言,中数将其分为大小相同的两个组。
对于没有经过处理的原始数据,需要先将所有数据按照大小顺序排成一个数列。
以下三种情况,中数有各自不同的求法。
1.数列的总个数为奇数假设数列共包含有n 个数(n 为奇数),如果处于数列中间的数跟相邻的值都不相等,则第21+n 个数就是这n 个值的中数。
2.数列的总个数为偶数如果n 是偶数,那么数列之中没有一个相应的值将该数列分成相等的两半,则取位于中间的两个数(第2n 和第12+n 个值)的平均数作为中数。
3.分布的中间有相等的数如果按照大小顺序排列好之后,位于数列中间的数与其相邻的数有相等的情况,则要进行一定的处理。
教学测量与评价名词解释教学测量与评价名词解释1. 测量:根据一定的法则使用量具对事物的特征进行定量描述的过程2. 教学测量:根据一定的法则使用量具对教师教与学生学的过程进行定量描述的过程3. 常模参照测验:以常模作为评价测验分数之标准的测验4. 标准参照测验:按照具体的行为标准水平对被试的测验结果作出直接解释的测验5. 项目分析:指对特定受测者在个别测验项目上所做反应的统计特征的计算和检验6. 难度:被试完成测验项目任务所遇到的困难程度7. 区分度:测验项目对所测量的心理特征的区分能力8. 误差:测量过程中由那些与测量目的无关的变化因素所产生的一种不准确(效度)或不一定(信度)的测量效应9. 真分数:把反映被试某种心理特质真正水平的那个数值10. 标准化:指测量的编制、实施、记分以及测量分数的解释程序的一致性11. 常模:常模团体的分数分布12. 信度:测量结果的可靠性、一致性、可信性、稳定性的程度13. 复本信度:用水平测验A、B对同一组被试在最短时间内施测两次所得结果的一致性14. 效度:实际测出的心理特质与所要测量的心理特质的程度15. 构想效度:测验实际测到所要测量的理论结构或特质的程度16. 效标:衡量一个测验是否有效的外在标准,它是独立于测验并可以从实践中直接获得我们所感兴趣的行为17. 导出分数:针对原始分数进行统计处理后获得的分数18. 内容效度:测验实际测到的内容与所要测量的内容之间的吻合程度19. 导出分数:针对原始分数进行统计处理后获得的分数20. 百分等级分数:在常模团体中低于该分数的人数百分比21. 标准分数:以平均数为参照点,标准差为单位表示的分数22. T量表:<量表:能够使事物的特征数量化的数字的连续体(T量表没找到)>23.比率智商:智力年龄与实际年龄的比率24.心理年龄:被试智力发展水平的年龄25.形成性评价:通过观察、活动记录、测验、问卷调查和咨询等形式对学生的学习进展进行持续评价教育测量与评价名词解释(上)(转)2017-04-09 15:32 | #2楼1、统计:就是“统而计之”对所考察事物的量的取值在其出现的全部范围内作总体的把握,全局性的认识。