第四章 差异量数
- 格式:ppt
- 大小:711.00 KB
- 文档页数:70
第四章 差异量教学目的:1.理解全距、四分位距、百分位距、平均差、方差、标准差和差异系数等概念;2.掌握各种差异量指标的计算方法。
数据的分布特征不仅有集中趋势,还有离中趋势。
以动态的眼光,从不同的角度看,数据是向中间变动的,也是向两端变动的。
两组数据可能平均水平相同,但两组数据的分布特征并不完全相同。
【如】:比较下列两组数据 A 组:88、82、73、76、81 B 组:92、86、70、72、80两组平均数,80==B A X X 但R A =88-73=15,R B=92-70=22。
即A 组较集中,B 组较分散。
因此,我们描述一组数据的分布特征,既要描述其集中趋势,也要描述其离中趋势。
差异量:表示一组数据的离中趋势或变异程度的量称为差异量。
常用的差异量指标有全距、四分位距、百分位距、平均差、方差、标准差和差异系数。
第一节全距、四分位距、百分位距一、全距全距:是一组数距中最大值与最小值之差。
优点:意义明确,计算方便。
缺点:反应不灵敏,易受极端值影响。
二、四分位距(一)四分位距的的概念四分位距:是指一组按大小顺序排列的数据中间部位50%个频数距离的一半。
)(1.4213Q Q QD -=QD :表示四分位距; Q 3:表示第三四分位数;Q 1:表示第一四分位数。
所以:四分位距的公式又为:22575P P QD -=(二)四分位数的计算方法 1、原始数据计算法(1)将数据由小到大进行排列; (2)分别求出三位四分位数(点); (3)代入公式计算。
【例如】:有以下16个数据25、22、29、12、40、15、14、39、37、31、33、19、17、20、35、30,其中四分位距的计算方法如下:(1)先将原始数据从小到大排列好;12、14、15、17、*19、20、22、25、*29、30、31、33、*35、37、39、40Q 1=18 Md =27 Q 3=34(2)求出Q 1、Md 、Q 3;(3)将Q 1、Md 、Q 3的得数代入公式(4.1)。
【课程讲义】第四章差异量数【教学目标】明确差异量数是描述数据离中趋势的一种量数,它与集中量数一起描述数据的全貌;明确标准差是所有差异量数中代表性最好的;掌握各种差异量数的概念、性质、计算方法、适用条件。
【学习方法】了解、理解、计算与应用。
【重点难点】差异量数的概念及适用条件;各种差异量数的计算方法;标准分数及百分等级的概念、适用条件及计算方法。
【讲义内容】前一章讨论的集中量数反映的是一组数据的集中趋势,代表一组数据的一般水平。
但是客观事物总是千差万别的,一组数据中不是所有的数值都与一般水平相等,而是有的高些,有的低些,彼此参差不齐。
描述一组数据波动情况的量数成为差异量数。
差异量数常用来衡量集中量数的代表性程度。
差异量数越大,则集中量数的代表性越小;差异量数越小,则集中量数的代表性越大。
差异量数分为:绝对差异量数和相对差异量数绝对差异量数:标准差,方差,四分差;相对差异量数:差异系数另外,本章还讲到相对地位量数:标准分数,百分等级。
第一节标准差一、标准差的概念及适用条件(一)概念标准差是一组数据中每个数据与其算术平均数之差的平方和,除以总的数据个数,再求算术平方根。
标准差的计算公式为:n XS2)(X-∑=(4.1)X为算术平均数,n为数据的个数。
(二)适用条件1.与算术平均数配合使用,与算术平均数的适用条件相同。
即一组数据的一般水平适合用算术平均数描述时,其离散程度宜用标准差描述;2.计算其他统计量时,如差异系数,标准分数,相关系数等,需要用到标准差;3.在推论统计中,尤其是进行方差分析时,常用方差表示数据的离散程度。
二.标准差的计算方法(一)未分组资料标准差的计算方法1.基本公式法用标准差的定义n XS2)(X-∑=,计算标准差。
例1 某校四年级举行数学竞赛,一班、二班分别派九名选手参加,成绩如下表。
试比较两个班的成绩。
4-1 四年级一班九名学生竞赛成绩统计表4-2 四年级二班九名学生竞赛成绩统计表解:先求年级一班的平均数和标准差。
第一节 全距、百分位差、四分位差、平均差一、全距全距是一列数据中最大数与最小数的差距,又称极差,用符号Rg (Range )表示,其公式为min max X X Rg -=全距是说明数据离散程度最简单的统计量。
全距的局限:该统计量只依据分布中的两个极端值,未利用到分布的大部分信息。
它不能反映观察值的整个变异度,样本的例数越多,全距越大,不够稳定。
二、百分位差百分位差表示某两个百分位数之间差异程度的指标。
常用的百分位差如793P P -,1090P P -。
百分位数是指量尺上的一个点,在此点以下,包括数据分布中全部数据个数的一定百分比,符号为Pp 。
其计算公式为:例4-1:用下面的次数分布表计算该分布的百分位差P 90- P 10。
组别f d 65~ 1 157 60~ 4 156 55~ 6 152 50~ 8 146 45~ 16 138 40~ 24 122 35~ 34 98 30~ 21 64 25~ 16 43 20~ 11 27 15~9 16 20~7 7 ∑100—解:先计算P 90 和P 10第1步:确定P 百分位数对应的位置, ,ifF N pL P bb p ⨯-⨯+=1003.14110090157=⨯7.1510010157=⨯第2步:确定百分位数所在的分组区间,P 90在“50~”这组,P 10在“15~”这组第3步:确定公式中的符号,5.49=b L ,5.14=b L ,138=b F ,7=b F ,5=i ,8=f ,9=f第4步:代入公式计算P 90 ,P 10第5步:计算P 90-P 1023.3233.1956.511090=-=-P P答:该分布的百分位差P 90-P 10是32.23。
百分等级:任意分数在整个分数分布中所处的百分位置,百分等级是一种相对位置量数。
计算公式为:三、四分位差四分位差是百分位差的特例,用于分析75P (3Q )与25P (1Q )之差的一半,即213Q Q Q -=四、平均差(一)概念及计算公式平均差是一组数内各个数据之间与平均数的绝对离差的平均数。