数据的离散程度
- 格式:doc
- 大小:1.18 MB
- 文档页数:4
《数据的离散程度》典例分析我们知道要描述一组数据的离散程度,则要选用极差、方差与标准差.极差可以反映一组数据变化的范围的大小,方差和标准差则能反映一组数据的偏离平均值的情况.请看几例.一、极差一组数据的最大数据与最小数据的差,叫做这组数据的极差.极差能反映一组数据的变化范围.例1在珠穆朗玛峰周围2千米的范围内,还有较著名的洛子峰(海拔8516米)、卓穷峰(海拔7589米)、马卡鲁峰(海拔8463米)、章子峰(海拔7543米)、努子峰(海拔7855米)、和普莫里峰(海拔7145米)六座山峰,则这六座山峰海拔高度的极差为米.解析:本题给出了六座山峰的海拔高度,要计算这些山峰的海拔高度的极差,可找到海拔最高的山峰,其海拔高度为8516米,海拔最低的山峰,其海拔高度为7145米,所以上这六座山峰的极差为8516-7145=1371(米).二、方差一组数据中每个数据与平均数差的平方的平均数,叫做这组数据的方差.方差反映一组数据的波动大小,方差越大,数据的波动越大,方差越小数据的波动越小.例2 甲、乙、丙三台包装机同时分装质量为400克的茶叶.从它们各自分装的茶叶中分别随机抽取了10盒,测得它们的实际质量的方差如下表所示:根据表中数据,可以认为三台包装机中, 包装机包装的茶叶质量最稳定.解析:本题主要考查方差的应用,由于甲、乙、丙三台包装机同时分装质量为400克的茶叶,说明它们的平均数相同,要说明哪一台包装机包装的茶叶质量最稳定,就要找实际质量的方差最小的一台,从表中可知乙的最小,所以乙包装机包装的茶叶的质量最稳定.例3小芳通过计算甲、乙丙、丁四组数据的方差后,发现有三组数据的方差相同,请你通过观察或计算,找出方差不同的一组数据( )甲:102 103 105 107 108乙 2 3 4 7 8丙 4 9 25 49 64丁 2102 2103 2105 2107 2108解析:本题主要考查对方差的理解及计算.方差只是反映一组数据波动的大小,而与平均数值的大小没有关系,通过计算可甲、乙、丙、丁四组数据的平均数不同,但甲、乙、丁的方差是一样的,不同的是丙.【评注】在计算方差时,如果数据较大,可以借助计算器或简便的方法解决.三、标准差标准差就是方差的算术平方根.标准差也是刻画一组数据离散程度的量. 例4已知一组数据为:82,84,85,89,80,94,76.则这组数据的标准差(精确到)为 ( )(A ) (B ) (C ) (D )解析:本题主要考查标准差的计算方法.要计算标准差,首先要计算平均数,然后计算方差,最后方差的算术平方根.7284)9954013(7185=-+-++--+=x , 9219.29])728476()728482[(71222≈-++-= S 所以S≈,选(A).【评注】由于本题的数据较大,可借助计算器计算.四、极差、方差综合应用例5在某旅游景区上山的一条小路上,有一些断断续续的台阶.图1是其中的甲、乙段台阶路的示意图.请你用所学过的有关统计知识(平均数、中位数、方差和极差)回答下列问题:(1)两段台阶路有哪些相同点和不同点(2)哪段台阶路走起来更舒服为什么(3)为方便游客行走,需要重新整修上山的小路.对于这两段台阶路,在台阶数不变的情况下,请你提出合图1中的数字表示每一级台阶的高度(单位:cm).并且数15,16,16,14,14,15的方差223S =甲,数据11,15,18, 17,10,19的方差 235.3S =乙理的整修建议.图1解析: 本题是一道和平均数、中位数、方差和极差有关的综合型说理问题.可以通过比较平均数、中位数、方差和极差等来说理.(1)因为15)151414161615(61=+++++=甲x 15)191017181511(61=+++++=乙x . 所以相同点:两段台阶路高度的平均数相同.不同点:两段台阶路高度的中位数、方差和极差均不相同.(2)甲路段走起来更舒服一些,因为它的台阶高度的方差小.(3)每个台阶高度均为15cm (原平均数),使得方差为0.【评注】学习平均数、中位数、方差和极差等知识,利用这些知识解决实际问题是考试中的热点,要注意这种类型题的训练.。
如何衡量数据的离散程度 Revised by Jack on December 14,2020如何衡量数据的离散程度我们通常使用均值、中位数、众数等统计量来反映数据的集中趋势,但这些统计量无法完全反应数据的特征,即使均值相等的数据集也存在无限种分布的可能,所以需要结合数据的离散程度。
常用的可以反映数据离散程度的统计量如下:极差(Range)极差也叫全距,指数据集中的最大值与最小值之差:极差计算比较简单,能从一定程度上反映的数据集的离散情况,但因为最大值和最小值都取的是极端,而没有考虑中间其他数据项,因此往往会受异常点的影响不能真实反映数据的离散情况。
四分位距(interquartile range,IQR)我们通常使用箱形图来表现一个数据集的分布特征:一般中间矩形箱的上下两边分别为数据集的上四分位数(75%,Q3)和下四分位数(25%,Q1),中间的横线代表数据集的中位数(50%,Media,Q2),四分位距是使用Q3减去Q1计算得到:如果将数据集升序排列,即处于数据集3/4位置的数值减去1/4位置的数值。
四分位距规避了数据集中存在异常大或者异常小的数值影响极差对离散程度的判断,但四分位距还是单纯的两个数值相减,并没有考虑其他数值的情况,所以也无法比较完整地表现数据集的整体离散情况。
方差(Variance)方差使用均值作为参照系,考虑了数据集中所有数值相对均值的偏离情况,并使用平方的方式进行求和取平均,避免正负数的相互抵消:方差是最常用的衡量数据离散情况的统计量。
标准差(Standard Deviation)方差得到的数值偏差均值取平方后的算术平均数,为了能够得到一个跟数据集中的数值同样数量级的统计量,于是就有了标准差,标准差就是对方差取开方后得到的:基于均值和标准差就可以大致明确数据集的中心及数值在中心周围的波动情况,也可以计算正态总体的置信区间等统计量。
平均差(Mean Deviation)方差用取平方的方式消除数值偏差的正负,平均差用绝对值的方式消除偏差的正负性。
如何衡量数据的离散程度我们通常使用均值、中位数、众数等统计量来反映数据的集中趋势,但这些统计量无法完全反应数据的特征,即使均值相等的数据集也存在无限种分布的可能,所以需要结合数据的离散程度。
常用的可以反映数据离散程度的统计量如下:极差(Range)极差也叫全距,指数据集中的最大值与最小值之差:极差计算比较简单,能从一定程度上反映的数据集的离散情况,但因为最大值和最小值都取的是极端,而没有考虑中间其他数据项,因此往往会受异常点的影响不能真实反映数据的离散情况。
四分位距(interquartile range,IQR)我们通常使用箱形图来表现一个数据集的分布特征:一般中间矩形箱的上下两边分别为数据集的上四分位数(75%,Q3)和下四分位数(25%,Q1),中间的横线代表数据集的中位数(50%,Media,Q2),四分位距是使用Q3减去Q1计算得到:如果将数据集升序排列,即处于数据集3/4位置的数值减去1/4位置的数值。
四分位距规避了数据集中存在异常大或者异常小的数值影响极差对离散程度的判断,但四分位距还是单纯的两个数值相减,并没有考虑其他数值的情况,所以也无法比较完整地表现数据集的整体离散情况。
方差(Variance)方差使用均值作为参照系,考虑了数据集中所有数值相对均值的偏离情况,并使用平方的方式进行求和取平均,避免正负数的相互抵消:方差是最常用的衡量数据离散情况的统计量。
标准差(S tandard Deviation)方差得到的数值偏差均值取平方后的算术平均数,为了能够得到一个跟数据集中的数值同样数量级的统计量,于是就有了标准差,标准差就是对方差取开方后得到的:基于均值和标准差就可以大致明确数据集的中心及数值在中心周围的波动情况,也可以计算正态总体的置信区间等统计量。
平均差(Mean Deviation)方差用取平方的方式消除数值偏差的正负,平均差用绝对值的方式消除偏差的正负性。
平均差可以用均值作为参考系,也可以用中位数,这里使用均值:平均差相对标准差而言,更不易受极端值的影响,因为标准差是通过方差的平方计算而来的,但是平均差用的是绝对值,其实是一个逻辑判断的过程而并非直接计算的过程,所以标准差的计算过程更加简单直接。
《数据的离散程度》数据的分析数据的离散程度是指数据变量之间的差异程度。
离散程度越大,数据之间的差异越大,反之亦然。
在数据分析中,了解和评估数据的离散程度对于了解和解释数据的分布特点和趋势非常重要。
数据的离散程度可以通过多种统计指标和图表来描述和分析。
下面将介绍几种常用的方法。
1. 平均差距(Mean deviation)平均差距是数据离散程度的简单度量方法之一、它计算每个数据点与均值之间的差距,并求取这些差距的平均值。
平均差距越大,数据离散程度越大。
2. 方差(Variance)方差是数据离散程度的常用度量方法之一、它计算每个数据点与均值之间的差距的平方,并求取这些差距平方的平均值。
方差越大,数据离散程度越大。
3. 标准差(Standard deviation)标准差是方差的平方根。
它可以快速度量数据的离散程度,并且易于解释。
标准差越大,数据离散程度越大。
4. 四分位间距(Interquartile range)四分位间距是数据的分布特征的度量方法之一、它测量了数据中25%和75%之间数据点的差距。
四分位间距越大,数据离散程度越大。
5. 离群值检测(Outlier detection)离群值是与其他数据点显著不同的异常值。
通过检测和处理离群值,可以更准确地评估数据的离散程度。
6.统计图表直方图和箱线图是用于可视化数据离散程度的常用图表。
直方图将数据分布在一系列柱状图中,可以清晰地显示数据的离散性。
箱线图显示了数据的分布范围、中位数和四分位间距,可以直观地了解数据的离散程度。
了解数据的离散程度可以帮助我们更好地分析和解释数据,从而做出有意义的决策。
不同的离散程度描述方法可以结合使用,以便全面地评估数据的离散程度。
在实际应用中,我们需要根据具体问题和数据类型选择合适的离散程度度量方法,并结合其他统计分析方法进行综合分析。
数据的集中趋势离散程度数据的集中趋势是指数据分布的中心位置,可以通过测量数据的均值、中位数和众数来描述。
数据的离散程度是指数据集中趋势的分散程度,可以通过测量数据的范围、方差和标准差来描述。
首先,数据的集中趋势可以通过均值来衡量。
均值是将所有数据加总后除以数据的个数得到的平均值。
它将数据集中在一个中心位置,可以反映数据的整体水平。
然而,均值容易受到极值的影响,因此需要结合其他指标综合考虑。
中位数是将数据按照大小排序后位于中间位置的值,可以将数据集合分为两部分。
中位数不受极值的影响,适用于有极值存在的情况。
中位数能反映数据的中间位置,相对稳定。
众数是在数据集中出现频率最高的值。
众数可以反映数据的最常见取值,适用于描述离散数据。
其次,数据的离散程度可以通过范围来衡量。
范围是最大值减去最小值,它反映了数据集的变化幅度。
范围简单直观,但不稳定,容易受到极值的影响。
方差是每个数据与均值差的平方的平均数,可以描述数据集与均值的偏离程度。
方差越大,数据越分散;方差越小,数据越集中。
方差让我们能够了解数据集内部的差异。
标准差是方差的平方根,它与均值具有相同的量纲,能更直观地反映数据的离散程度。
标准差比方差更常用,因为它的单位与原始数据相同,易于理解。
数据的集中趋势和离散程度是相互关联的,它们一起能够提供一个完整的数据描述。
例如,在比较两组数据的差异时,可以通过比较均值和标准差来判断其集中趋势和离散程度。
总体而言,数据的集中趋势和离散程度是统计分析中常用的指标,能够提供重要的数据特征,帮助我们理解数据的分布情况,从而进行决策和预测。
在实际应用中,我们需要根据具体情况选择合适的指标,并结合其他分析方法来综合评价数据的集中趋势和离散程度。
4.4数据的离散程度一、教与学目标: 1、通过实例,知道描述一组数据的分布时,除关心它的集中趋势外,还需分析数据的波动大小。
2、了解数据离散程度的意义。
二、教与学重点难点:重点:了解一组数据离散程度的意义及其在现实生活中的应用价值。
难点:一组数据离散程度在现实生活中的应用价值。
三、教与学方法:探究与自学教学法四、教与学过程:(一)、情境导入:1、什么是平均数?众数?中位数?如何计算?(二)、探究新知:1、问题导读:预习课本P130—P132,完成下列题目。
(小组之内交流)(1)对于一组数据,仅仅了解数据的___________是不够的,还需要了解这些数据的_____________和______________的差异程度。
(2)在实际生活中,我们除了关心数据的集中趋势(即_______________)外,还要关注数据的__________________,即一组数据的___________________2、精讲点拨:例1:班主任要从甲、乙两名跳远运动员中挑选一人参加校运动会比赛.在最近的10次选拔赛中,他们的成绩如下(单位:cm ): 甲 586 596 610 598 612 597 604 600 612 601乙 613 618 580 574 618 593 585 590 598624(1)他们的平均成绩分别是多少?(2)甲、乙两名运动员这10次比赛成绩的中位数、众数分别是多少?(3)怎样评价这两名运动员的运动成绩?(4)历届比赛表明,成绩达到5.96m 就有可能夺冠,你认为为了夺冠应选择谁参加这项比赛?如果历届比赛成绩表明,成绩达到6.10m 就能打破记录,那么你认为为了打破记录应选择谁参加这项比赛?(三)、学以致用:1、巩固新知: (1)、代表一组数据的集中趋势的数据有____________________。
(2)、常用离散程度来描述一组数据的_________和________________。
【本讲教育信息】一、教学内容:数据的离散程度1. 理解方差、标准差和极差的概念以及它们表示的意义.2. 会计算极差和方差、标准差,并会用它们表示数据的离散程度.二、知识要点:1. 方差的定义和计算(1)设是n个数据x1、x2、…、x n的平均数,各个数据与平均数之差的平方和的平均数,叫做这组数据的方差. 通常用“s2”表示,从上面的计算方差的式子可以看出:当数据分布比较分散(即数据在平均数附近波动较大)时,各个数据与平均数的差的平方和较大,方差就较大;当数据分布比较集中时,各个数据与平均数的差的平方和较小,方差就较小. 因此,方差越大,数据的波动越大;方差越小,数据的波动越小.2. 极差的计算和应用一组数据的最大值与最小值的差叫做这组数据的极差.极差是刻画数据离散程度的一个统计量. 生活中,我们经常用到极差,例如用温差来描述气温的变化情况;用公司员工的最高薪水与最低收入的差反映员工待遇的差别;用一个班学生身高的最大值与最小值的差看学生的发育情况;用一个机床生产的零件的尺寸差别看机床的好坏;用射击的最好环数与最差环数的差看运动员成绩的稳定性等.3. 极差反映数据的波动范围,它只用到数据的两个极端值,没有利用数据的全部信息,因此在数学上常用方差刻画数据的离散程度.三、重点难点:本讲重点是理解极差与方差的概念和它们表示的意义. 难点是会计算极差和方差,并会用它们表示数据的离散程度.【典型例题】例1.计算数据3、4、5、6、7的极差、方差和标准差(精确到0.01).分析:本题考查极差、方差和标准差的定义和计算方法.解:7-3=4,这组数据的极差为4.这组数据的标准差是1.41.例2.八年级下学期期末统一考试后,甲乙两班的数学成绩(单位:分)的统计情况如下表所示:从成绩的波动情况看__________学生的成绩波动更大.分析:乙班的方差大于甲班的方差. 所以乙班的学生成绩波动更大.解:乙班评析:方差是反映数据离散程度的统计量. 方差越大,波动越大.例3. 今年5月16日我市普降大雨,基本解除了农田旱情. 以下是各县(市、区)的降水A. 29.4,29.4,2.5B. 29.4,29.4,7.1C. 27,29.4,7D. 28.8,28,2.5分析:把表格中的7个数据按由小到大的顺序排列:27,28,28.8,29.4,29.4,31.9,34.1. 中位数是29.4,众数是29.4,极差是34.1-27=7.1.解:B例4.对10盆同一品种的花施用甲、乙两种保花肥,把10盆花分成两组,每组5盆,其(1)10盆花的花期最多相差几天?(2)施用哪种保花肥,使得花的平均花期较长?(3)施用哪种保花肥效果比较可靠?分析:10盆花的花期的极差就是花期最多与最少相差的天数;花的平均花期就是分别求出甲、乙两组数据的平均数;而看哪种保花肥效果可靠,就是比较它们的方差.解:(1)28-22=6(天).(2)由平均数计算公式可得:(3)由方差计算公式可得:s2甲=5.2,s2乙=2.8.因为乙的方差小于甲的方差,所以施用乙种保花肥效果比较可靠.评析:波动越小,效果越可靠.例 5. 在某旅游景区上山的一条小路上,有一些断断续续的台阶. 如图所示是甲、乙两段台阶路的示意图(长度单位:厘米).请你用所学过的有关统计知识(平均数、中位数、方差和极差)回答下列问题: (1)两段台阶路有哪些相同点和不同点? (2)哪段台阶路走起来更舒服?为什么?(3)为方便游客行走,需要重新整修上山的小路. 对于这两段台阶路,在台阶数不变的情况下,请你提出合理的整修建议.151414161615151910171811甲路段乙路段分析:本题主要考查运用所学的统计知识分析问题和解决实际问题的能力.∴相同点是:两段台阶路台阶高度的平均数相同.不同点是:两段台阶路台阶高度的中位数、方差和极差均不相同. (2)甲路段走起来更舒服一些,因为它的台阶高度的方差小. (3)每个台阶高度均为15cm (原平均数),使得方差为0.评析:用平均数、中位数、方差和极差的知识分析、比较,并作出合理的判断和决策.例6. 张明、王成两位同学上学年10次数学单元自我检测的成绩(成绩均为整数,且个位数为0). 如图所示.102030405060708090012345678910102030405060708090012345678910张明同学自测序号自测成绩(分)自测成绩(分)自测序号王成同学利用图中提供的信息,解答下列问题. (1(2)如果将90分以上(含90分)的成绩视为优秀,则优秀率高的同学是__________; (3)根据图表信息,请你对这两位同学各提一条不超过20个字的学习建议.分析:这是一道统计计算题,从图中获取有关信息,计算表中所需补充的统计量,同时会从图中把握识别优生的标准,并对两同学提出合理化建议.解:(1)根据样本平均数、方差公式、中位数、众数的定义,不难从图中提供的各次测试成绩求出张明同学的平均成绩为80分,方差为60,王成同学的平均成绩也为80分,中位数为85,众数为90.(2)若将90分以上(含90分)的成绩视为优秀,则10次单元自我检测成绩中,张明同学仅有3次成绩达到优秀,而王成同学有5次成绩达到优秀,因此,优秀率高的同学应是王成.(3)尽管王成同学的优秀率高,但他的成绩不稳定(方差大),而张明同学虽然优秀率比不上王成同学,但他的考试成绩相对稳定. 根据两位同学10次检测的成绩看,发现他们各有所长,也各有所短. 因此,如何切合实际、准确地为他们今后的学习提出合理化的学习建议显得尤为重要,下面给出一条仅供参考:王成同学的学习要持之以恒,保持稳定;张明同学的学习还需加一把劲,提高优秀率.评析:本题综合了平均数、方差、中位数、众数的知识,能够结合统计结果对问题作出判断.【方法总结】1. 用方差、标准差和极差来描述数据的离散程度时,极差计算方便,但只与数据的最大值和最小值有关,而方差可以较全面地反映数据的离散程度. 方差和标准差多用于描述某项技术的稳定性、重复测量的精确程度、特殊人群身高的整齐程度等.2. 在全面描述数据的特征时,要综合考虑数据的平均数和方差. 当两组数据的平均数相等或接近时,可用方差比较它们的稳定性.【模拟试题】(答题时间:60分钟)一. 选择题1. 体育课上,八年级(1)班两个组各10人参加立定跳远,要判断哪一组成绩比较整齐,通常需要知道这两个组立定跳远成绩的()A. 众数B. 平均数C. 中位数D. 方差*2. 一组数据-1,0,3,5,x的极差是7,那么x的值可能有()A. 1个B. 2个C. 4个D. 6个3. 一台机床在十天内生产的产品中,每天出现的次品个数依次为(单位:个)0,2,0,2,3,0,2,3,1,2. 那么,这十天中次品个数的()A. 平均数是2B. 众数是3C. 中位数是1.5D. 方差是1.254. 下列各组数据中,标准差是的是()A. 101、98、102、100、99B. 101、101、102、102、100C. 100、100、100、98、98D. 103、101、99、97、955. 两个同学参加一次考试,两人各科的平均分数相同,但标准差不同,下列说法正确的是()A. 平均分数相同说明两个同学各科成绩一样B. 标准差较大的同学各科成绩比较稳定C. 标准差较大的同学成绩好D. 标准差较小的同学成绩之间差异较小6. 国家统计局发布的统计公报显示:2001年到2005年,我国GDP增长率分别为8.3%,9.1%,10.0%,10.1%,9.9%. 经济学家评论说:这五年的年度GDP增长率之间相当平稳. 从统计学的角度看,“增长率之间相当平稳”说明这组数据的_______比较小. ()A. 中位数B. 方差C. 平均数D. 众数*7. 样本数据3,6,a,4,2的平均数是5,则这个样本的方差是()**8. 甲、乙两班举行电脑汉字输入速度比赛,参加学生每分钟输入汉字的个数经统计计算后填入下表:某同学根据上表分析得出如下结论:①甲、乙两班学生成绩的平均水平相同;②乙班优秀的人数多于甲班优秀的人数(每分钟输入汉字数≥150个为优秀);③甲班的成绩的波动情况比乙班的成绩的波动大. 上述结论正确的是( )A. ①②③B. ①②C. ①③D. ②③二. 填空题1. 一组数据2,6,x ,10,8的平均数是6,则这组数据的方差是__________.2. 小明和小红练习射击,第一轮10枪打完后两人的成绩如图所示,一般新手的成绩不太稳定,小明和小红二人有一人是新手,估计小明和小红两人中新手是__________.2468103. 现有甲、乙两支球队,每支球队队员身高数据的平均数均为1.70米,方差分别为2s 甲=0.28、2s 乙=0.36,则身高较整齐的球队是__________队(填“甲”或“乙”).4. 2007年1月,在吉林省举行了第六届亚洲冬季运动会. 我国在各届亚冬会上获得金牌数如图所示,那么这六届获得金牌数的极差是__________枚.2468101214161820第一届第二届第三届第四届第五届第六届**5. 若8个数据的平方和是20,方差是2,则平均数是__________.三. 解答题1. 有甲、乙两个新品种的水稻,在进行杂交配系时要比较出产量较高、稳定性较好的一种,种植后各抽取5kg )(1)哪一种品种平均单产较高?(2)哪一种品种稳定性较好?(3)据统计,应选哪一种品种做杂交配系?**2. 一次科技知识竞赛,两组学生成绩统计如下:分数50 60 70 80 90 100人数甲组 2 5 10 13 14 6 乙组 4 4 16 2 12 12已经算得两个组的人均分数是80分,请根据你学过的统计知识,进一步判断这两个组这次竞赛中成绩谁优谁次,并说明理由.**3.3月4月5月6月7月8月吐鲁番葡萄(吨) 4 8 5 8 10 13哈密大枣(吨)8 7 9 7 10 7 (1平均数方差吐鲁番葡萄8 9哈密大枣(2)补全折线统计图.(3)请你从以下两个不同的方面对这两种水果在去年3月份至8月份的销售情况进行分析:①根据平均数和方差分析;②根据折线图上两种水果销售量的趋势分析.【试题答案】一. 选择题1. D2. B3. D4. A5. D6. B7. A8. A二. 填空题三. 解答题1. (1)甲的平均单产是51kg,乙的平均单产是51kg,两品种平均单产一样高(2)甲的方差是2,乙的方差是3.6,所以甲品种稳定性好(3)选甲品种.2. (1)由于甲组、乙组学生的成绩平均分相同,从这个角度看,分不出谁优谁次.(2)甲组成绩的众数为90分,乙组成绩的众数为70分,从成绩的众数比较,甲组的成绩好些.(3)计算得甲组方差是172,乙组方差是256,所以甲组的成绩比乙组的成绩稳定.(4)甲组、乙组学生的成绩的中位数、平均数都是80分,其中甲组成绩在80分以上的有33人,乙组成绩在80分以上的有26人,从这一角度上讲,甲组的成绩总体较好.(5)从成绩统计表看,甲组成绩不低于90分的有20人,乙组成绩不低于90分的有24人,且得满分的人数为甲组6人,乙组12人,从高分段的人数看,乙组的成绩较好.(2)如图所示:(3)①由于平均数相同,s大枣2<s葡萄2,所以大枣的销售情况相对比较稳定. ②从图上看,葡萄的月销售量呈上升趋势. (答案不惟一,合理均可得分)。
6.4 数据的离散程度
1.了解极差的意义,掌握极差的计算方法;
2.理解方差、标准差的意义,会用样本方差、标准差估计总体的方差、标准差.(重点、难点)
一、情境导入
从图中我们可以算出甲、乙两人射中的环数都是70环,但教练还是选择乙运动员参赛.
问题1:从数学角度,你知道为什么教练员选乙运动员参赛吗?
问题2:你在现实生活中遇到过类似情况吗?
二、合作探究
探究点一:极差
欢欢写了一组数据:9.5,9,8.5,8,7.5,这组数据的极差是( )
A .0.5
B .8.5
C .2.5
D .2
解析:这组数据的最大值是9.5,最小值是7.5,因此这组数据的极差是:9.5-7.5=
2.故选D.
方法总结:要计算一组数据的极差,找出最大值与最小值是关键.
探究点二:方差、标准差 【类型一】 方差和标准差的计算
求数据7,6,8,8,5,9,7,7,6,7的方差和标准差.
解析:一组数据的方差计算有两个常用的简化公式:(1)s 2=1n
[(x 21+x 22+…+x 2n )-nx 2];(2)s 2=1n
[(x 1′2+x 2′2+…+x n ′2)-nx ′2],其中x 1′=x 1-a ,x 2′=x 2-a ,…,x n ′=x n -a ,a 是
接近原数据平均数的一个常数,x′是x1′,x2′,…,x n′的平均数.
解:方法一:因为x=1
10(7×4+6×2+8×2+5+9)=7,所以s2=
1
10
[(7-7)2+(6-7)2
+(8-7)2+(8-7)2+(5-7)2+(9-7)2+(7-7)2+(7-7)2+(6-7)2+(7-7)2]=1.2.
所以标准差s=30 5
.
方法二:同方法一,所以s2=1
10
[(72+62+82+82+52+92+72+72+62+72)-10×72]=
1.2,标准差s=30
5
.
方法三:将各数据减7,得新数据:0,-1,1,1,-2,2,0,0,-1,0.而x′=0,
所以s2=1
10
[02+(-1)2+12+12+(-2)2+22+02+02+(-1)2+02-10×02]=1.2.所以标准
差s=30 5
.
方法总结:计算一组数据的方差和标准差的步骤:先计算该组数据的平均数(或需加减的数值),然后按方差(或标准差)的计算公式计算.
【类型二】方差和标准差的应用
在一次女子排球比赛中,甲、乙两队参赛选手的年龄(单位:岁)如下:甲队:26,25,28,28,24,28,26,28,27,29;
乙队:28,27,25,28,27,26,28,27,27,26.
(1)两队参赛选手的平均年龄分别是多少?
(2)利用标准差比较说明两队参赛选手年龄波动的情况.
解析:先求出两队参赛选手年龄的平均值,再由标准差的定义求出s甲与s乙,最后比较大小并作出判断.
解:(1)x甲=1
10
×(26+25+28+28+24+28+26+28+27+29)=26.9(岁),
x乙=1
10
×(28+27+25+28+27+26+28+27+27+26)=26.9(岁).
(2)s2甲=
1
10
×[(26-26.9)2+(25-26.9)2+…+(29-26.9)2]=2.29,
s2乙=1
10
×[(28-26.9)2+(27-26.9)2+…+(26-26.9)2]=0.89.
所以s甲= 2.29≈1.51,
s乙=0.89≈0.94,
因为s甲>s乙,
所以甲队参赛选手年龄波动比乙队大.
方法总结:求标准差时,应先求出方差,然后取其算术平方根.标准差越大(小)其数据
波动越大(小).
【类型三】 统计量的综合应用
甲、乙两支篮球队在集训期内进行了五场比赛,将比赛成绩进行统计后,绘制成图(a)、(b)所示的统计图.
(1)在图(b)中画出折线表示乙队在集训期内这五场比赛成绩的变化情况.
(2)已知甲队五场比赛成绩的平均分x 甲=90分,请你计算乙队五场比赛成绩的平均分x 乙.
(3)就这五场比赛,分别计算两队成绩的方差.
(4)如果从甲、乙两队中选派一支球队参加篮球锦标赛,你认为选派哪支球队参赛更能取得好成绩?
解析:第(4)题可根据第(1)(2)(3)题的结果,从平均分、折线的走势、获胜场数和方差四个方面分别进行简要分析.
解:(1)如图所示.
(2)x 乙=15
(110+90+83+87+80)=90(分).
(3)甲队成绩的方差s 2甲=15[(80-90)2+(86-90)2+(95-90)2+(91-90)2+(98-90)2]=41.2;乙队成绩的方差s 2乙=15
[(110-90)2+(90-90)2+(83-90)2+(87-90)2+(80-90)2]=111.6.
(4)从平均分看,两队的平均分相同,实力大体相当;从折线的走势看,甲队比赛成绩呈上升趋势,而乙队比赛成绩呈下降趋势;从获胜场数看,甲队胜三场,乙队胜两场,甲队成绩较好;从方差看,甲队比赛成绩比乙队比赛成绩波动小,甲队成绩较稳定.综上所述,选派甲队参赛更能取得好成绩.
方法总结:本题是反映数据集中程度与离散程度的综合题.从图形中得到两队的成绩,然后从平均数、方差的角度来考虑,在平均数相同的情况下,方差越小的越稳定.
三、板书设计
数据的离散程度⎩⎪⎨⎪⎧极差:一组数据中最大数据与最小数据的差
方差:各个数据与平均数差的平方的平均数 s 2=1n
[(x 1-x )2+(x 2-x )2+…+(x n -x )2]标准差:方差的算术平方根 公式:s =s 2
经历表示数据离散程度的几个量的探索过程,通过实例体会用样本估计总体的统计思想,培养学生的数学应用能力.通过小组合作,培养学生的合作意识;通过解决实际问题,让学生体会数学与生活的密切联系.。