第三章集中量数和差异量数
- 格式:ppt
- 大小:543.50 KB
- 文档页数:67
考研真题和强化习题详解第一章绪论一、单选题1 .三位研究者评价人们对四种速食面品牌的喜好程度。
研究者甲让评定者先挑出最喜欢的品牌,然后挑出剩下三种品牌中最喜欢的,最后再挑出剩下两种品牌中比较喜欢的。
研究者乙让评定者将四种品牌分别给予 l~5 的等级评定, ( l 表示非常不喜欢, 5 表示非常喜欢),研究者丙只是让评定者挑出自己最喜欢的品牌。
研究者甲、乙、丙所使用的数据类型分别是: ( )A .类目型―顺序型―计数型B .顺序型―等距型―类目型C .顺序型―等距型―顺序型D .顺序型―等比型―计数型2 .调查了n =200 个不同年龄组的被试对手表显示的偏好程度,如下:该题自变量与因变量的数据类型分别是: ( )A .类目型―顺序型B .计数型―等比型C .顺序型―等距型D .顺序型―命名型3 .这个数的上限是()。
A . 157 . 75B . 157 . 65C . 157 . 55D . 158 . 54 .随机现象的数量化表示称为()。
A .自变量B .随机变量C .因变量D .相关变量5 .实验或研究对象的全体被称之为()。
A .总体B .样本点C .个体D .元素6 .下列数据中,哪个数据是顺序变量? ( )A .父亲的月工资为 1300 元B .小明的语文成绩为 80 分C .小强 100 米跑得第 2 名D .小红某项技能测试得 5 分7、比较时只能进行加减运算而不能使用乘除运算的数据是【】。
A .称名数据B .顺序数据C .等距数据D .比率数据参考答案: 1 . B 2 . D 3 . C 4 . B 5 . A 6 . C二、概念题1.描述统计(吉林大学 2002 研)答:描述统计指研究如何整理心理教育科学实验或调查的数据,描述一组数据的全貌,表达一件事物的性质的统计方法。
比如整理实验或调查来的大量数据,找出这些数据分布的特征,计算集中趋势、离中趋势或相关系数等,将大量数据简缩,找出其中所传递的信息。
完整版)统计学名词解释统计学名词解释第一章绪论在统计学上,随机变量指的是取值之间不能预料到的变量。
总体,又称母全体或全域,是指具有某种特征的一类事物的全体。
构成总体的每个基本单元称为个体。
从总体中抽取的一部分个体称为样本。
次数指的是某一事件在某一类别中出现的数目,又称为频数。
频率,又称相对次数,指某一事件发生的次数被总的事件数目除,即某一数据出现的次数被这一组数据总个数去除。
概率指某一事物或某一情在某一总体中出现的比率。
一旦确定了某个值,就称这个值为某一变量的观测值。
参数,又称为总体参数,是描述一个总体情况的统计指标。
样本的那些特征值叫做统计量,又称特征值。
第二章统计图表统计表是由纵横交叉的线条绘制,并将数据按照一定的要求整理、归类、排列、填写在内的一种表格形式。
一般由表号、名称、标目、数字、表注组成。
统计图一般采用直角坐标系,通常横轴表示事物的组别或自变量x,称为分类轴。
纵轴表示事物出现的次数或因变量,称为数值轴。
一般由图号及图题、图目、图尺、图形、图例、图组成。
简单次数分布表适合数据个数和分布范围比较小的时候用,它是依据每一个分数值在一列数据中出现的次数或总计数资料编制成的统计表。
而分组次数分布表适合数据个数和分布范围比较大的时候用。
数据量很大时,应该把所有的数据先划分在若干区间,然后将数据按其数值大小划归到相应区域的组别内,分别统计各个组别中包括的数据个数,再用列表的形式呈现出来。
分组次数分布表的编制步骤包括求全距、定组距和组数、列出分组组距、登记次数和计算次数。
相对次数分布表用频数比率或百分数来表示次数,而累加次数分布表则把各组的次数由下而上或由上而下加在一起。
最后一组的累加次数等于总次数。
双列次数分布表用同一个表表示有联系的两列变量的次数分布。
而不等距次数分布表则适用于像工资级别和年龄分组这样的不等距数据。
需要注意的是,归组效应是分组次数分布表的缺点之一,因为原始数据不见了,从而依据这样的统计表算出的平均值会与用原始数据算出的值有出入,出现误差。
第3章 集中量数与差异量数3.1 复习笔记一、集中量数集中量数又称集中趋势,是体现一组数据一般水平的统计量。
它能反映频数分布中大量数据向某一点集中的情况。
(一)算术平均数1.含义算术平均数(mean )是最常用的,也是最容易理解的一个集中量数指标。
算术平均数是所有观察值的总和与总频数之商,也简称为平均数、均值或者均数。
可以用μ来表示;如果想表示变量X 的平均数,可以表示为X 。
2.计算公式假设X 1,X 2,…,X N 代表各次观测值,N 为观察的总频数,则其算术平均数为:123N X +X +X ++X =Nμ⋅⋅⋅ 记作: N 11=N i i X μ=∑ 其中,∑表示连加,1N i =∑表示从1i =到i N =的所有观测值i X 的总和。
3.性质(1)数据中如果每一个数据都加上一个常数C ,则算术平均数也需要加上C ,即∑=+=+ni C X C X n 1)(1 (2)数据中如果每一个数据都乘以一个常数C ,则算数平均数也需要乘以C ,即∑=⋅=⋅n i C X C X n 1)(1 (二)中数中数(median )又称为中位数,它将数据分为数目相等的两半,其中一半的值比它小,另外一半的值比它大,等价于百分位数是50的那个数。
如果将所有数据按照大小顺序进行排列,那么中数正好位于正中间。
中数用M d 表示。
对于一个分布而言,中数将其分为大小相同的两个组。
对于没有经过处理的原始数据,需要先将所有数据按照大小顺序排成一个数列。
以下三种情况,中数有各自不同的求法。
1.数列的总个数为奇数假设数列共包含有n 个数(n 为奇数),如果处于数列中间的数跟相邻的值都不相等,则第21+n 个数就是这n 个值的中数。
2.数列的总个数为偶数如果n 是偶数,那么数列之中没有一个相应的值将该数列分成相等的两半,则取位于中间的两个数(第2n 和第12+n 个值)的平均数作为中数。
3.分布的中间有相等的数如果按照大小顺序排列好之后,位于数列中间的数与其相邻的数有相等的情况,则要进行一定的处理。
集中量数和差异量数一、数据的集中量数:要描述存在于组别之间的普遍差异的方法,就是要找出典型的或平均水平的数据代表。
二、集中趋势定义:反映频数分布中大量数据向某一点集中的情况,描述这种特点的统计量称为集中量数。
1.测度集中趋势就是寻找数据水平的代表值或中心值2.确定集中趋势并没有统一的、标准化的方法。
因为没有一种测量集中趋势的代表性数值可以适用于所有情况。
集中趋势的一般性目的是找出单一的最具有代表性的数值。
3. 低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测量数据;三、集中量数包括:1.算术平均数Mean:集中趋势的测度值之一;最常用的测度值;一组数据的均衡点所在【天平】;易受极端值的影响;用于数值型数据,不能用于定类数据和定序数据。
算术平均数是“真值”的最佳估计值优点a)反应灵敏。
观测数据中任何一个数值或大或小的变化,甚至细微的变化,在计算平均数时,都能反应出来;b)计算严密。
计算平均数有确定的公式,不管何人在何种场合,只要是同一组观测数据,计算的平均数都相同;c)计算简单。
计算过程知识应用简单的四则运算;d)简明易解。
平均数概念简单明了,较少数学抽象容易理解;e)适合于进一步用代数方法演算。
在求解其他统计特征值,如离均差、方差、标准差的计算时,都要应用平均数;f)较少受抽样变动的影响。
观测样本的大小或个体的变化,对计算平均数影响很小。
在来自同一总体逐个样本的集中量数中,平均数的波动同样小于其他量数的波动,因此它总是最可靠、最正确的量数。
缺点1.易受极端数据的影响;2.因为计算平均数是需要每一个数据都加入计算。
在次数分布中只要有一个数据含糊不清,都无法计算平均数。
在这种情况下,一般采用中数作为该组数据的代表值,描述其集中趋势计算和应用算术平均数的原则•同质性原则:算术平均数只能用于表示同类数据的集中趋势。
•平均数与个体数值相结合的原则:在解释个体特征时,既要看平均数,也要结合个体的数据。
1应用算术平均数表示集中趋势要注意什么问题?(1) 数据必须同质同质指使用同一观测手段,采用相同的观测标准,能反映某一问题同一方面特质的数据。
因为不同质的数据观测手段、测量标准不一致。
(2) 平均数与个体数据相结合在作出结论时,把总体的平均水平与个体数据结合起来会能更加说明问题。
(3) 将平均数与标准差和方差结合平均数只是反映数据的集中趋势,而标准差和方差能够反映数据差异趋势,将二者结合起来才能全面准确的反映总体数据的分布特征。
(4)当出现极端数据或模糊数据时,用中数或众数表示数据的集中趋势会更好。
2.中数、众数、几何平均数、调和平均数各适合哪些资料?中数适用于:一组观测数据中出现极端数据时;一组数据的两端有模糊数据出现;需要快速估计一组数据的代表值时。
众数适用于:当一组数据出现不同质的情况或分布中出现极端数据时;数据分布中出现双众数时。
几何平均数主要适用于:一组数据中有少量数据偏大或偏小,数据分布呈偏态分布;数据按一定的比例关系变化。
调和平均数主要用于描述学习速度方面的问题。
3对于下列数据,使用何种集中量数表示集中趋势更好?并计算其值(1)4 5 6 6 7 29中数或众数(2)3 4 5 5 7 5平均数,其值为5(3)2 3 5 6 7 8 9平均数40/74.求下列次数分布的平均数、中数127.36157654*626*578*5216*4715724*4234*3721*3216*2711*229*177*12=+++++++++++=∑n fx X c =5.求下列四个年级的总平均成绩6.求平均联想速度平均联想速度为3.9个 7平均增加率是多少?估计10年后毕业人数有多少1120×1.1110=3180平均增长率为11%,10后毕业人数为3180人• 四• 1.度量离中趋势的差异量数有哪些?为什么要度量离中趋势?• (1)有全距、四分位差、百分位差、平均差、标准差和方差等。
研究:集中量数、差异量数、地位量数集中量数、差异量数、地位量数三种数据特征值的含义及包括的主要内容⼀、集中量数从次数分布表上可以看出,分布在各组的次数有多有少,但⼤部分数据趋向于中间的某⼀点。
这种向某点集中的趋向叫做集中趋势。
代表集中趋势的量数叫做集中量数。
集中量数⼜称代表值,它有两种功⽤。
(1)第⼀,可以⽤来描述和代表研究对象的⼀般⽔平,并为进⼀步统计分析打下基础。
(2)第⼆,⽤它与同质的另⼀研究对象作⽐较。
例如,就⼀个班来说,它是全班分数的代表,可以⽤它来代表这⼀班学⽣的程度和⽔平,并能⽤它与别的同类班作⽐较。
集中量数主要有:算术平均数、中数、众数、加数平均数和⼏何平均数等。
其中教育科学研究结果的处理中应⽤最多的是算术平均数。
⼆、差异量数差异量数是表⽰⼀组数据的差异情况或离散程度的量数,它反映数据分布的离中趋势。
集中量数的代表性如何,是要由差异量数来表明的。
(1)差异量数愈⼤,集中量数的代表性愈⼩;差异量数愈⼩,则集中量数的代表性愈⼤。
(2)差异量数⼀般包括:全距、平均差、四分差、标准差和⽅差。
其申以标准差和⽅差最为常⽤。
三、地位量数前⾯介绍的集中量数和差异量数都是描述样本或总体的整体特征的量数;⽽地位量数则是描述单个数据在样本或总体中的位置的,也称相对位置量数。
常⽤的地位量数主要有百分等级和标准分数。
(1)百分等级百分等级是指某观测值以下的个数与观测值总个数之⽐的百分数。
⽤符号P表⽰。
百分等级具有意义明确,容易理解,计算简便等优点,但是它只是⼀个顺序变量,不能进⾏代数运算,这给进⼀步分析⼯作带来困难。
(2)标准分数为解决百分等级不能进⾏代数运算的困难,有⼀种更为常⽤的地位量数,就是标准分数,⼜叫“基分数”或“Z分数”。
原⽂链接为https:///tiku/10609489.html补充:标准分数的计算⽅法:Z=(样本值-平均值)/标准差区别:分⼦为1的分数称为单位分数。