第10章 数据的离散程度
- 格式:doc
- 大小:54.00 KB
- 文档页数:2
数据的集中趋势和离散程度【知识点1】正确理解平均数、众数和中位数的概念一、平均数:平均数是反映一组数据的平均水平的特征数,反映一组数据的集中趋势.平均数的大小与一组数据里的每一个数据都有关系,任何一个数据的变化都会引起平均数的变化.例1:有四个数每次取三个数,算出它们的平均数再加上另一个数,用这种方法计算了四次,分别得到以下四个数:86, 92, 100, 106, 那么原4个数的平均数是________ .例2:有几位同学参加语文考试,赵峰的得分如果再提高13分,他们的平均分就到达90分,如果赵峰的得分降低5分,他们的平均分就只得87分,那么这些同学共有________人.例3:有5个数,其平均数为138,按从小到大排列,从小端开始前3个数的平均数为127,从大端开始顺次取出3个数,其平均数为148,那么第三个数是_______ .例4:某5个数的平均值为60,假设把其中一个数改为80,平均值为70,这个数是________ .例10:某人沿一条长为12千米的路上山,又从原路返回,上山的速度是2千米/小时,下山的速度是6千米/小时。
那么,他在上山和下山的全过程当中的平均速度是多少千米每小时?例11:假设不选择教材中的引入问题,也可以替换成更贴近学生学习生活中的实例,下举一例可供借鉴参考。
求该校初二年级在这次数学考试中的平均成绩?二、众数:在一组数据中出现次数最多的数据叫做这一组数据的众数.一组数据中的众数有时不唯一.众数着眼于对各数出现的次数的考察,这就告诉我们在求一组数据的众数时,既不需要排列,又不需要计算,只要能找出样本中出现次数最多的那一个〔或几个〕数据就可以了.当一组数据中有数据屡次重复出现时,它的众数也就是我们所要关心的一种集中趋势.注:众数是数据中出现次数最多的数据,是一组数据中的原数据,而不是相应的次数.众数有可能不唯一,注意不要遗漏.例12:在一次数学测验中,甲、乙、丙、丁四位同学的分数分别是90、x 、90、70,假设这四个同学得分的众数与平均数恰好相等,那么他们得分的中位数是【 】A 、100 B 、90 C 、80 D 、70 例13:当5个整数从小到大排列,其中位数是4,如果这组数据的唯一众数是6,那么5个整数可能的最大的和是【 】A 、21 B 、22 C 、23 D 、24例14:10名工人,某天生产同一零件,生产到达件数是:15,17,14,10,15,19,17,16,14,12,那么这一组数据的众数是【 】A 、15 B 、17 15 C 、14 D 、17 15 14 例15:〔1〕计算这9双鞋尺码的平均数、中位数和众数.〔2〕哪一个指标是鞋厂最感兴趣的指标?哪一个指标是鞋厂最不感兴趣的?三、中位数:是将一组数据按大小顺序排列后,处在最中间的一个数〔或处在最中间的两个数的平均数〕.一组数据中的中位数是唯一的. 注:求中位数要先把数据按大小顺序排列,可以从小到大,也可以从大到小.如果数据个数n 为奇数时,第21+n 个数据为中位数;如果数据个数n 为偶数时,第2n 、12+n 个数据的平均数为中位数.例16:李大伯承包了一个果园,种植了100棵樱桃树,今年已进入收获期.收获时,从中任选并采摘了10棵树的樱桃,分别称得每据调查,市场上今年樱桃的批发价格为每千克15元.用所学的统计知识估计今年此果园樱桃的总产量与按批发价格销售樱桃所得的总收入分别约为【 】A .200千克,3000元B .1900千克,28500元C . 2000千克,30000元D .1850千克,27750元〔1〕该班学生每周做家务劳动的平均时间是多少小时?〔2〕这组数据的中位数、众数分别是多少?〔3〕请你根据〔1〕、〔2〕的结果,用一句话谈谈自己的感受.【知识点2】极差、方差和标准差极差、方差和标准差都是用来研究一组数据的离散程度的,反映一组数据的波动范围或波动大小的量.一、极差一组数据中最大值与最小值的差叫做这组数据的极差,即极差=最大值-最小值.极差能够反映数据的变化范围,实际生活中我们经常用到极差.如一支足球队队员中的最大年龄与最小年龄的差,一个公司成员中最高收入与最低收入的差等都是极差的例子.极差是最简单的一种度量数据波动情况的量,它受极端值的影响较大.二、方差方差是反映一组数据的整体波动大小的特征的量.它是指一组数据中各个数据与这组数据的平均数的差的平方的平均数,它反映的是一组数据偏离平均值的情况.方差越大,数据的波动越大方差越小数据的波动越小. 求一组数据的方差可以简记先求平均,再求差,然后平方,最后求平均数.一组数据x 1、x 2、x 3、…、x n 的平均数为x ,那么该组数据方差的计算公式为:])()()[(1222212x x x x x x nS n -++-+-= . 例18:数据0、1、2、3、x 的平均数是2,那么这组数据的极差和标准差分别是【 】A 4,2B 4,2C 2,10D 4,10三、标准差在计算方差的过程中,可以看出方差的数量单位与原数据的单位不一致,在实际的应用时常常将求出的方差再开平方,此时得到量为这组数据的标准差.即标准差=方差. 例19:数据90,91,92,93的标准差是【 】〔A 〕 2 〔B 〕54 〔C 〕54 〔D 〕52✪注意:极差、方差、标准差的关系方差和标准差都是用来描述一组数据波动情况的量,常用来比拟两组数据的波动大小.两组数据中极差大的那一组并不一定方差也大.在实际问题中有时用到标准差,是因为标准差的单位和原数据的单位一致,且能缓解方差过大或过小的现象.例20:从甲、乙两种玉米苗中各抽10株,分别测得它们的株高如下:〔单位:cm 〕甲: 21 42 39 14 19 22 37 41 40 25乙: 27 16 40 41 16 44 40 40 27 44(1)根据以上数据分别求甲、乙两种玉米的极差、方差和标准差.(2)哪种玉米的苗长得高些;(3)哪种玉米的苗长得齐.例21:市体校准备挑选一名跳高运发动参加全市中学生运动会,对跳高运动队的甲、乙两名运发动进行了8次选拔比赛.他们的成绩〔单位:m 〕如下:甲:1.70 1.65 1.68 1.69 1.72 1.73 1.68 1.67乙:1.60 1.73 1.72 1.61 1.62 1.71 1.70 1.75(1)甲、乙两名运发动的跳高平均成绩分别是多少?(2)哪位运发动的成绩更为稳定?(3)假设预测,跳过1.65m 就很可能获得冠军,该校为了获得冠军,可能选哪位运发动参赛?假设预测跳过1.70m 才能得冠军呢?。
6.4 数据的离散程度第一环节:情境引入内容:为了提高农副产品的国际竞争力,一些行业协会对农副产品的规格进行了划分,某外贸公司要出口一批规格为75g的鸡腿.现有2个厂家提供货源,它们的价格相同,鸡腿的品质也相近。
质检员分别从甲、乙两厂的产品中抽样调查了20只鸡腿,它们的质量(单位:g)如下:甲厂:75 74 74 76 73 76 75 77 77 7474 75 75 76 73 76 73 78 77 72乙厂:75 78 72 77 74 75 73 79 72 7580 71 76 77 73 78 71 76 73 75把这些数据表示成下图:质量/g甲厂乙厂(1)你能从图中估计出甲、乙两厂被抽取鸡腿的平均质量是多少?(2)求甲、乙两厂被抽取鸡腿的平均质量,并在图中画出表示平均质量的直线。
(3)从甲厂抽取的这20只鸡腿质量的最大值是多少?最小值又是多少?它们相差几克?从乙厂抽取的这20只鸡腿质量的最大值又是多少?最小值呢?它们相差几克?(4)如果只考虑鸡腿的规格,你认为外贸公司应购买哪家公司的鸡腿?说明你的理由。
在学生讨论交流的的基础上,教师结合实例给出极差的概念:极差是指一组数据中最大数据与最小数据的差。
它是刻画数据离散程度的一个统计量。
目的:通过一个实际问题情境,让学生感受仅有平均水平是很难对所有事物进行分析,从而顺利引入研究数据的其它量度:极差。
注意事项:当一组数据的平均数与中位数相近时,学生在原有的知识与遇到问题情境产生知识碰撞时,才能较好地理解概念。
第二环节:合作探究内容1: 如果丙厂也参与了竞争,从该厂抽样调查了20只鸡腿,它们的质量数据如下图:78质量/g(1)丙厂这20只鸡腿质量的平均数和极差分别是多少?(2)如何刻画丙厂这20只鸡腿的质量与其平均数的差距?分别求出甲、丙两厂的20只鸡腿质量与其相应平均数的差距。
(3)在甲、丙两厂中,你认为哪个厂的鸡腿质量更符合要求?为什么? 数学上,数据的离散程度还可以用方差或标准差刻画。
统计学中标识数据离散程度的指标
统计学中标识数据离散程度的指标主要有以下几种:
方差:方差是衡量数据离散程度的重要指标,其计算方法为将每个数据与平均数的差值的平方加总,再除以样本数。
方差越大,数据的离散程度越大。
标准差:标准差是方差的算术平方根,它衡量的是数据偏离平均数的程度,标准差越大,数据的离散程度越大。
变异系数:变异系数是标准差与平均数之比,它可以用来比较两组或多组数据的离散程度。
变异系数越大,数据的离散程度越大。
四分位距:四分位距是将数据分为四个等份的指标,分别为最小值、第一四分位数、中位数、第三四分位数和最大值。
第三四分位数减去第一四分位数就是四分位距,它可以反映数据的分布情况和离散程度。
极差:极差是最大值减去最小值,它可以直观地反映数据的范围和离散程度。
这些指标可以用来描述数据的分布情况和离散程度,可以在数据分析和统计推断中起到重要作用。
不同的指标适用于不同类型的数据和分布情况,需要根据实际情况选择合适的指标进行分析。
衡量离散程度的特征摘要:1.离散程度的概念2.衡量离散程度的常见指标3.离散程度指标的应用4.总结正文:一、离散程度的概念离散程度是指数据在分布上的分散程度,是用来衡量数据波动大小的一个统计指标。
在数据分析中,离散程度对于了解数据的分布特征和变异程度具有重要意义。
通常情况下,离散程度越大,说明数据的波动性越大,数据越分散;离散程度越小,说明数据的波动性越小,数据越集中。
二、衡量离散程度的常见指标1.异众比率:用于测度分类数据的离散程度,衡量众数对一组数据的代表程度。
2.四分位差:用于测量顺序数据的离散程度,衡量中位数对一组数据的代表程度。
3.方差和标准差:用于测度数据离散程度的最常用测度值,衡量均值对一组数据的代表程度。
4.离散系数:离散系数又称变异系数,是统计学当中的常用统计指标,主要用于比较不同水平的变量数列的离散程度。
离散系数指标有:全距(极差)系数、平均差系数、方差系数和标准差系数等。
常用的是标准差系数,用cv(coefficient,of,variance) 表示。
三、离散程度指标的应用离散程度指标在统计分析中可以用来说明集中趋势指标的代表性如何,还可以在统计推断时用来计算误差的大小。
此外,离散程度指标还可以用来说明事物在发展变化过程中的均衡性、节奏性和稳定性等问题。
例如,在描述两组数据时,第一组是19,20,21,第二组是15,20,25。
通过计算可得,第一组数据的全距为2,第二组数据的全距为10。
因此,可以判断第二组数据的离散程度更大。
四、总结总之,离散程度指标是衡量数据离散程度的重要工具,它可以帮助我们了解数据的分布特征和变异程度。
在实际应用中,我们需要根据不同的数据类型和分析目的选择合适的离散程度指标进行分析。
数据的集中趋势与离散程度统计学中,描述和衡量数据分布特征的两个重要方面是集中趋势和离散程度。
集中趋势指的是数据集中在哪个数值附近,而离散程度描述了数据的分散程度。
在本文中,我将详细介绍集中趋势和离散程度的定义、常用的衡量指标和如何应用。
一、集中趋势集中趋势是指数据集中在哪个数值处的趋势或位置,常用的衡量指标包括均值、中位数和众数。
1. 均值均值是数据集所有观测值的算术平均数。
它是最常用的衡量集中趋势的指标。
计算均值的方法是将所有观测值相加,再除以观测值的个数。
均值受极端值的影响较大。
2. 中位数中位数是将数据集按照大小排序后,位于中间位置的观测值。
如果数据集的个数是奇数,则中位数就是排序后位于中间的观测值;如果数据集的个数是偶数,则中位数是中间两个观测值的平均数。
中位数对极端值不敏感,更能反映数据的典型情况。
3. 众数众数是数据集中出现频率最高的观测值。
一个数据集可能存在一个众数,也可能存在多个众数,或者没有众数。
众数主要用于描述离散型数据。
二、离散程度离散程度是描述数据分散程度的指标,常用的衡量指标包括极差、方差和标准差。
1. 极差极差是数据集中最大观测值和最小观测值之间的差值。
极差越大,表示数据的离散程度越大;极差越小,表示数据的离散程度越小。
极差对极端值非常敏感。
2. 方差方差是数据集观测值与均值之差的平方的平均值。
方差衡量了数据与其均值之间的离散程度,数值越大表示数据的离散程度越大,反之亦然。
方差对极端值非常敏感。
3. 标准差标准差是方差的平方根,用于衡量数据集的离散程度。
标准差具有与原始数据相同的度量单位,比方差更容易解释和理解。
标准差越大,表示数据的离散程度越大,反之亦然。
三、应用集中趋势和离散程度的概念和指标在各个领域具有广泛的应用。
在金融领域,通过分析股票价格的均值和离散程度,可以评估股票的风险和收益。
在市场调研中,通过分析产品价格的中位数和标准差,可以了解市场需求和产品价值的稳定性。
6.4.1 数据的离散程度【学习目标】1.经历表示数据离散程度的几个量度的探索过程;2.了解刻画数据离散程度的三个量度——极差、方差、标准差;3.能借助计算器求出相应的数值,并在具体问题情境中加以应用;4.通过实例体会用样本估计总体的思想。
过程与方法:经历表示数据离散程度的几个量度的探索过程,通过实例体会用样本估计总体的统计思想,培养学生的数学应用能力。
一、复述回顾:(二人小组完成)1.我们研究过刻画数据的“平均水平”的统计量有哪些?分别是怎样刻画数据的“平均水平”的?2.求平均数有哪几种方法?二、设问导读:阅读课本P149-151完成下列问题:1.甲、乙两厂被抽取鸡腿的平均质量分别是x甲=_____,x乙=______,甲厂抽取的这20只鸡腿质量的最大值是_____,最小值是______,极差为_____克, 乙厂抽取的这20只鸡腿质量的最大值是_____,最小值是______,极差为_____克. 如果只考虑鸡腿的规格,外贸公司应购买____厂的鸡腿,因为___厂鸡腿规格比较_____,在______左右摆动幅度较___.2.如果两组数据的平均值一样,这种情况下,人们除了关心数据的“平均值”即“_______”外,人们往往还关注数据的________,即相对于“________”的_________.从上图也能很直观地观察出:甲厂相对于“平均水平”的偏离程度比乙厂相对于“平均水平”的偏离程度____.3. 甲、丙厂20只鸡腿的质量与其平均数的差的和都为____,由此可知不能用各数据与平均数的差的和来衡量这组数据的_______.这种情况下,可以用各个数据与平均数之___的____的______来刻画,即方差.4. 描述一组数据的波动大小的量不止一种,最常用的_____、_____、_______;标准差就是_____的_____平方根. 一般而言,一组数据的极差、方差或标准差越小,这组数据就越_____.5.阅读P150例题,并仿照例题格式完成做一做:(1)丙厂20只鸡腿的平均质量x丙=___,方差S2丙=___.(2)∵___________,___________∴_____厂的产品更符合规格.6.使用计算器计算一组数据的标准差与方差的大体步骤是;进入_______状态,输入_____,按键就可得出_______.再______即可求出_______.利用器可求s甲2=______ s丙2=________.根据计算的结果,____厂的产品更符合要求.三、自学检测:1.一组数据:473、865、368、774、539、474的极差是 .2.下列几个常见统计量中能够反映一组数据波动范围的是()A.平均数B.中位数C.众数D.极差3.为了判断甲、乙两个小组学生英语口语测验成绩哪一组比较整齐,通常需要知道两组成绩的()A.平均数B.方差C.众数D.中位数4.甲、乙两名学生在相同的条件下各射靶10次,命中的环数如下:甲:7、8、6、8、6、5、9、10、7、4乙:9、5、7、8、7、6、8、6、7、7经过计算,两人射击环数的平均数相同,但S2甲S2乙,所以确定去参加比赛。
离散程度的概念离散程度(dispersion)是指一组数据中各个数据值之间的分散程度或波动程度,用于了解数据分布的形状以及其中的变异程度。
离散程度是统计学中一个重要的概念,它能够提供有关数据集中程度的信息,从而帮助我们更好地理解数据。
在现实生活中,离散程度在很多领域和实际问题中都具有重要的应用,例如金融领域的风险评估、市场波动性的分析,以及工程领域中对测量数据的分析等。
离散程度有很多不同的度量方法,下面将详细介绍几种常见的离散程度度量方法。
1.极差(range):极差是指数据集中最大值与最小值之间的差值。
极差可以很容易地计算出来,并且能够提供数据集中的最大范围。
然而,它只考虑了最大和最小值,忽略了其他值的分布情况。
因此,在考虑整体分布情况时,极差的分析能力较弱。
2.平均绝对差(mean absolute deviation):平均绝对差是指数据集中各个数据值与平均值之间的差值的绝对值的平均。
平均绝对差能够考虑数据集中所有值的偏离程度,因此对数据的分散程度有更好的反映。
然而,平均绝对差受到极端值(outliers)的影响较大,容易受到异常值的扰动。
3.方差(variance):方差是指数据集中各个数据值与平均值之间的差值的平方的平均。
方差是离散程度度量中最常用的方法之一。
方差能够较好地反映数据集的分散程度,且在统计推断中有很重要的应用。
但是方差的单位是平方,无法与原始数据具有直接可比性。
4.标准差(standard deviation):标准差是方差的平方根。
标准差是离散程度度量中最常用的方法之一,它能够提供与原始数据具有直接可比性的度量。
标准差在正态分布和抽样理论中有很重要的应用。
5.百分位数(percentile):百分位数是指将数据按大小排序后,处于某个位置的数据值。
例如,第25百分位数是指将数据按大小排序后,在从小到大的顺序下,位于中间位置的数据值。
百分位数能够提供数据集的分布位置信息,例如中位数(50%百分位数)能够提供数据集的中间位置信息。
数据的集中趋势与离散程度数据在现代社会中扮演着重要的角色,它们不仅可以揭示事物的本质和规律,还可以为决策提供支持。
在数据分析中,我们经常会关注数据的集中趋势和离散程度,这些指标能够帮助我们更好地理解数据的特征和分布。
本文将探讨数据的集中趋势和离散程度,并介绍一些常用的统计量和方法。
一、集中趋势集中趋势是描述数据分布中心位置的指标,它能够反映数据的平均水平。
常见的集中趋势统计量有均值、中位数和众数。
均值是数据的算术平均值,它是将所有数据相加后再除以数据个数得到的结果。
均值能够反映数据的总体水平,但受极端值的影响较大。
例如,一个班级的学生年龄平均值是15岁,但如果班级中有一个20岁的学生,那么平均值就会被拉高。
因此,在计算均值时需要注意数据的分布情况。
中位数是将数据按大小顺序排列后,位于中间位置的数值。
中位数能够较好地反映数据的中心位置,不受极端值的影响。
例如,一个班级的学生年龄中位数是14岁,即有一半学生的年龄小于等于14岁,另一半学生的年龄大于等于14岁。
众数是数据中出现次数最多的数值。
众数能够反映数据中的典型值,但可能存在多个众数或无众数的情况。
例如,一个班级的学生身高众数是160cm,即身高为160cm的学生最多。
二、离散程度离散程度是描述数据分布的分散程度的指标,它能够反映数据的波动情况。
常见的离散程度统计量有范围、方差和标准差。
范围是数据的最大值与最小值之间的差异。
范围能够简单地反映数据的离散程度,但容易受极端值的影响。
例如,一个班级的学生成绩范围是60分到100分,范围为40分,但如果有一个学生得了0分或者满分150分,范围就会变得不够准确。
方差是数据与均值之间差异的平方的平均值。
方差能够较好地反映数据的离散程度,但计算过程较为繁琐。
方差越大,数据的离散程度越高。
例如,一个班级的学生成绩方差为100,说明学生成绩波动较大。
标准差是方差的平方根,它与方差具有相同的度量单位。
标准差能够在方差的基础上更好地理解数据的离散程度。
第10章数据的离散程度
一、选择题(每题3分,共30分)
1、数据2,3,3,5,7的极差为()
A、2
B、3
C、4
D、5
2、在统计中,样本的标准差可以反映这组数据的()
A、平均状态
B、分布规律
C、离散程度
D、数值大小
3、下列说法正确的是()
A、方差反映的是一组数据的波动大小,方差的值一定是正数
B、已知一组数据的方差计算公式为s2=1/5(x12+x22+x32+x42+x52-20),则这组数据的平均数为2
C、数据1,2,2,3,3,4的众数是2
D、一组数据x1,x2,x3,……x n,都减去a值的平均数为m,方差为n,则这组数据的平均数为a+m,方差为n
4、老师对小明本学期的5次数学测试成绩进行统计分析,判断小明的数学成绩是否稳定,老师需要知道小明这5次数学成绩的()
A、平均数
B、方差
C、众数
D、频数
5、样本方差的作用是()
A、样本数据的多少
B、样本数据的平均水平
C、样本数据在各个范围中所占比例大小
D、样本数据的波动程度
6、已知样本:1,2,-3,-2,3,0,-1,那么样本数据的标准差为()
A、0
B、√2
C、2
D、4
20次,3人的测试成绩如下表:
甲、乙、丙三名运动员测试成绩最稳定的是
()A、甲B、乙C、丙
D、3人成绩稳定情况相同
8、为了判断甲、乙两个小组的学生英语测试成绩哪一组比较整齐,通常要知道两组成绩的()A、平均数B、众数C、方差D、中位数
9、若一组数据1,2,3,x的极差是6,则x的值是()
A、7
B、8
C、9
D、7或-3
10、一组数据1,2,3,4,5的方差是
A、1
B、2
C、3
D、4
二、填空。
(每题3分,共24分)
1、样本-2,-1,0,3,5的平均数是,极差是,方差是,标准差是。
2、某体委准备从甲、乙两名射击运动员中选拔1人参加全运会,每人各打靶5次,打中环数分别如下,甲:7,8,9,8,8;乙:5,10,6,9,10,那么应该选运动员参加全运会。
3、一组数据35,35,36,36,37,38,38,38,39,40的极差是。
4、5名同学目测同一本教科书的宽度时,产生的误差如下(单位:cm):2,-2,-1,1,0,则这组数据的极差为cm。
5、某学校篮球队五名队员的年龄分别为17,15,17,16,15,其方差为0.8,则三年后这五名运动员年龄的方差为。
6、已知一组数据1,2,0,-1,x,1的平均数是1,则这组数据的极差为。
7、一组数据2,6,x
,10,8的平均数是6,则这组数据的方差是。
8、甲、乙、丙三台包装机同时分装质量为400g的茶叶,从它们各自分装的茶叶中分别随机抽取了10盒,得到它们的实际质量的方差如下表所示,根据表中的数据,可以认为三台包装机中,包装机包装的茶叶质量最稳定。
三、解答题。
(
1、某农场种植甲、乙两种水稻,在连续6年中各年的平均亩产量如下(单位:千
3、已知数据6,7,10,13,14,的方差为10,你不用计算。
(1)你能说出数据306,307,310,313,314的方差吗?
(2)能说出数据12,14,20,26,28的方差吗?
4、小明和小华假期到工厂体验生活,加工直径为100mm的零件,为了检验他们加工的产品质量,从中各抽出6件进行测量,测得数据如下(单位:mm):
小明:99,100,98,100,100,103
小华:99,100,102,99,100,100
(1)分别计算小明和小华这6件产品的极差、平均数和方差
(2)根据你的计算结果,说明他们俩人水加工的零件更符合要求。