第四章 差异量数
- 格式:ppt
- 大小:1.85 MB
- 文档页数:60
第四章 差异量教学目的:1.理解全距、四分位距、百分位距、平均差、方差、标准差和差异系数等概念;2.掌握各种差异量指标的计算方法。
数据的分布特征不仅有集中趋势,还有离中趋势。
以动态的眼光,从不同的角度看,数据是向中间变动的,也是向两端变动的。
两组数据可能平均水平相同,但两组数据的分布特征并不完全相同。
【如】:比较下列两组数据 A 组:88、82、73、76、81 B 组:92、86、70、72、80两组平均数,80==B A X X 但R A =88-73=15,R B=92-70=22。
即A 组较集中,B 组较分散。
因此,我们描述一组数据的分布特征,既要描述其集中趋势,也要描述其离中趋势。
差异量:表示一组数据的离中趋势或变异程度的量称为差异量。
常用的差异量指标有全距、四分位距、百分位距、平均差、方差、标准差和差异系数。
第一节全距、四分位距、百分位距一、全距全距:是一组数距中最大值与最小值之差。
优点:意义明确,计算方便。
缺点:反应不灵敏,易受极端值影响。
二、四分位距(一)四分位距的的概念四分位距:是指一组按大小顺序排列的数据中间部位50%个频数距离的一半。
)(1.4213Q Q QD -=QD :表示四分位距; Q 3:表示第三四分位数;Q 1:表示第一四分位数。
所以:四分位距的公式又为:22575P P QD -=(二)四分位数的计算方法 1、原始数据计算法(1)将数据由小到大进行排列; (2)分别求出三位四分位数(点); (3)代入公式计算。
【例如】:有以下16个数据25、22、29、12、40、15、14、39、37、31、33、19、17、20、35、30,其中四分位距的计算方法如下:(1)先将原始数据从小到大排列好;12、14、15、17、*19、20、22、25、*29、30、31、33、*35、37、39、40Q 1=18 Md =27 Q 3=34(2)求出Q 1、Md 、Q 3;(3)将Q 1、Md 、Q 3的得数代入公式(4.1)。
第一节 全距、百分位差、四分位差、平均差一、全距全距是一列数据中最大数与最小数的差距,又称极差,用符号Rg (Range )表示,其公式为min max X X Rg -=全距是说明数据离散程度最简单的统计量。
全距的局限:该统计量只依据分布中的两个极端值,未利用到分布的大部分信息。
它不能反映观察值的整个变异度,样本的例数越多,全距越大,不够稳定。
二、百分位差百分位差表示某两个百分位数之间差异程度的指标。
常用的百分位差如793P P -,1090P P -。
百分位数是指量尺上的一个点,在此点以下,包括数据分布中全部数据个数的一定百分比,符号为Pp 。
其计算公式为:例4-1:用下面的次数分布表计算该分布的百分位差P 90- P 10。
组别f d 65~ 1 157 60~ 4 156 55~ 6 152 50~ 8 146 45~ 16 138 40~ 24 122 35~ 34 98 30~ 21 64 25~ 16 43 20~ 11 27 15~9 16 20~7 7 ∑100—解:先计算P 90 和P 10第1步:确定P 百分位数对应的位置, ,ifF N pL P bb p ⨯-⨯+=1003.14110090157=⨯7.1510010157=⨯第2步:确定百分位数所在的分组区间,P 90在“50~”这组,P 10在“15~”这组第3步:确定公式中的符号,5.49=b L ,5.14=b L ,138=b F ,7=b F ,5=i ,8=f ,9=f第4步:代入公式计算P 90 ,P 10第5步:计算P 90-P 1023.3233.1956.511090=-=-P P答:该分布的百分位差P 90-P 10是32.23。
百分等级:任意分数在整个分数分布中所处的百分位置,百分等级是一种相对位置量数。
计算公式为:三、四分位差四分位差是百分位差的特例,用于分析75P (3Q )与25P (1Q )之差的一半,即213Q Q Q -=四、平均差(一)概念及计算公式平均差是一组数内各个数据之间与平均数的绝对离差的平均数。