高一数学必修三 ——标准差与方差共17页
- 格式:ppt
- 大小:2.91 MB
- 文档页数:17
6.3.2方差与标准差平均数向我们提供了样本数据的重要信息,但是,平均数有时也会使我们作出对总体的片面判断,某地区的统计报表显示,此地区的年平均家庭收入是10万元,给人的印象是这个地区的家庭收入普遍较高.但是,如果这个平均数是从200户贫困家庭和20户极富有的家庭收入计算出来的,那么,它就既不能代表贫困户家庭的年收入,也不能代表极富有家庭的年收入.因为这个平均数掩盖了一些极端的情况,而这些极端情况显然是不能忽视的.因此,只有平均数还难以概括样本数据的实际状态.案例探究甲、乙两班学生各50人,其语文平均成绩都是80分,但甲班最高成绩98分,最低42分,而乙班最高成绩86分,最低60分.初步看出,两班语文成绩是不一样的,甲班学生的语文成绩个别差异程度大、水平参差不齐;而乙班学生的语文成绩差异程度小,语文水平整齐度大些.如果你是老师,你应当如何对这两个班的成绩作出评价呢?分析:我们把一组数据的最大值与最小值的差称为极差,由数据可知甲班的极差较大,数据点较分散,乙班的极差较小,数据点分布较集中,这说明乙班成绩比甲班稳定,运用极差对两组数据进行比较,操作简单方便,但如果两组数据的集中程度差异不大时,就不容易得出结论.我们还可以考虑每一个学生的成绩与平均成绩的离差,离差越小,稳定性就越高.结合上节有关离差的讨论,可用每个同学的成绩与平均成绩的差的平方和表示.由于两组数据的容量可能不同,因此应将上述平方和除以数据的个数,我们把由此所得的值称为这组数据的方差(variance).因为方差与原始数据的单位不同,且平方后可能夸大了离差的程度,我们将方差开方后的值称为这组数据的标准差(standard deviation).标准差也可以刻画数据的稳定程度.一般地,设一组数据x1,x2,…,x n,其平均数为x,则称S2=∑=-niix xn12) (1为这个样本的方差,其算术平方根S=n xx ni i∑=-12)((*)为样本的标准差,分别简称样本方差、样本标准差.根据上述方差计算公式可算出甲、乙两个班样本的方差,从而比较哪个班成绩好些.计算标准差时,首先要计算数据的平均数x,接着要计算各数据与平均数之间的离差平方,即(x i-x)2,最后由公式(*)计算标准差S.例如,4名儿童的身高分别是110厘米,100厘米,120厘米和150厘米,若求4名儿童身高数据的标准差时,其基本步骤如下:(1)求平均数:x=4150 120100110+++=120(厘米)(2)求离差平方和:∑(x i -x )2=(110―120)2+(100―120)2+(120―120)2+(150―120)2 =100+400+0+900=1 400(平方厘米) (3)求标准差S :S=41400=350= 18.71(厘米) 这样,我们大体可认为,这4名儿童身高差异程度,从平均角度来看,约相差18.71厘米.自党导引1.天气预报说今天最高气温7 ℃,最低气温-2 ℃,则今天气温的极差为多少? 答案:9℃2.据统计,某小区居民中年龄最大的为89岁,年纪最小的为1岁,那么小区人口年龄的极差为多少? 答案:88岁3.你认为下面几种说法中正确的是( ) A .一组数据的平均值总是正数 B .一组数据的方差有可能是负数C .用一组数据中的每个数分别减去平均值,再将得到的差相加,和一定为零D .一组数据的标准差一定比方差小 答案:C4.我们可以用一组数据中的最大值减去最小值所得的差来反映这组数据的变化范围.用这种方法得到的差称为极差.5.方差实际上是一种表示一组数据的离散程度的量,我们可以用“先平均,再求差,然后平方,最后再平均”的方法得到.6.标准差与方差有什么关系?这二者与原数据在单位上有什么关系?答案:标准差是方差的算术平方根,标准差与原数据具有相同的单位,方差的单位是原单位的平方.7.反映数据离散程度的指标是什么?在一次数学测试中,甲、乙两班的平均成绩相同,甲班成绩的方差为42,乙班成绩的方差为35,这样的结果说明两个班的数学学习状况各有什么特点?答案:反映数据离散程度的指标是方差和标准差.甲班的方差大于乙班的方差,说明甲班的学生成绩较分散,优生和成绩差的学生较多.而乙班的学生成绩较集中,优生和成绩差的学生较少.8.观察下面的折线图,回答问题:(1)a组数据的极差较大.(2)a组数据的方差较大.9.比较下面两幅频数分布图中的数据,哪组的平均值较大?哪组的标准差较大?答案:b组的平均值较大,a组的标准差较大.10.观察下面的几组图,分别指出各组中哪一组的标准差较大,并说说为什么. (1)(2)(3)答案:(1)标准差相同,因为虽然数据排列不同,但其实是相同的两组数据;(2)b组的标准差较大,因为a组有一些数距离平均值较近;(3)b组的标准差较大,因为b组中每个数据都是a组中的两倍,因此标准差也是它的两倍.疑难剖析【例1】某校团委举办了英语口语竞赛.甲、乙两个团小组成绩如下:甲组:76908486818786乙组:82848589809476(1)分别求出甲、乙两个团小组的平均分、标准差(精确到0.01);(2)说明哪个团小组成绩比较稳定?思路分析:由于所给数据较整,用定义公式求x及S.再由所学统计知识即可作此判断.解:(1)∵7868781868490761++++++=x=84.29,7769480898584822++++++=x =84.29,,233.47)86()87()81()86()84()90()76(212121212121211≈-+-+-+-+-+-+-=x x x x x x x S,47.57)67()94()08()98()85()84()82(222222222222222≈-+-+-+-+-+-+-=x x x x x x x S(2)∵S 1<S 2,∴甲小组的成绩比较稳定.思维启示:方差的概念是本单元的一个重点,也是本章的重点和难点,中考命题常常涉及到方差的概念比较抽象,理解有一定的困难,因此在复习时要多接触一些实例,以加深理解计算方差的公式.【例2】 某校从甲、乙两名优秀选手中选1名选手参加全市中学生田径百米比赛,该校预先对这两名选手测试了8次,测试成绩如下表:根据测试成绩,请你运用所学过的统计知识作出判断,派哪一位选手参加比赛更好?为什么?思路分析:首先计算甲、乙两选手的成绩的平均数,然后看每位同学成绩的方差 ,利用方差比较两位同学成绩的稳定性.解:设甲的平均数是x 1,乙的平均数是x 2,甲的方差是S 甲2,乙的方差是S 乙2,则由题意可求得:x 1=82.124.125.121.135.12132.121.12+++++++=12.5;x 2=85.123.128.122.12138.124.1212+++++++=12.5;S 甲2=[(12.1-12.5)2+(12.2-12.5)2+(13-12.5)2+(12.5-12.5)2+(13.1-12.5)2+(12.5-12.5)2+(12.4-12.5)2+(12.2-12.5)2]=0.12 S 乙2=[(12-12.5)2+(12.4-12.5)2+(12.8-12.5)2+(13-12.5)2+(12.2-12.5)2+(12.8-12.5)2+(12.3-12.5)2+(12.5-12.5)2]=0.10.∵S 甲2>S 乙2,∴虽然甲乙两人的平均成绩相同,但乙的成绩较稳定,应选乙选手参加比赛.思维启示:在显示数据离散程度(波动大小)的一类数中,方差是刻画总体或样本波动大小的一个重要特征数据,其定义是用各偏差的平方的平均数建立起来的,对于一组数据,除需了解它们的平均水平外,还常常需要了解它们的波动大小(即偏离平均数的大小).对于两组可比的数据,平均数只能反映它们的集中趋势,而比较它们的波动大小,就要通过计算标准差或方差的大小来确定.还应注意,只有当两组数据的平均数相等或比较接近时,方差或标准差才能反映数据波动大小的实际情况——方差或标准差越大(小),波动也越大(小).【例3】 为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换,已知某校使用的100只日光灯在必须更换掉前的使用天数如下表:(1)试估计这种日光灯的平均使用寿命;(2)若定期更换,可选择多长时间统一更换合适?思路分析:总体的平均数与标准差往往是很难求,甚至是不可能求的,通常的做法就是用样本的平均数与标准差去估计总体的平均数与标准差,只要样本的代表性好,这种做法就是合理的. 解:(1)各组中值分别为165,195,225,255,285,315,345,375,由此可算得平均数约为10025285202551822511195165⨯+⨯+⨯+⨯++1002375734516315⨯+⨯+⨯=267.9≈268(天).(3)将组中值对于此平均数求方差:⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡-⨯+-⨯+-⨯+-⨯+-⨯+-⨯+-⨯+-⨯⨯22222222)268375(2)268345(7)268315(16)268285(25)268225(20)268225(18)268195(11)268165(11001=2 128.60(天2) 故标准差为60.1282≈46(天).答:估计这种日光灯的平均使用寿命约为268天,故可在222天到314天左右统一更换较合适.思维启示:(1)在刻画样本数据的分散程度上,方差与标准差是一样的,但在解决实际问题时,一般多采用标准差.(2)平均数和标准差是工业生产中检测产品 质量的重要指标,当样本的平均数或标准差超过了规定界限的时候,说明这批产品的质量可能距生产要求有较大的偏离,应该进行检查,找出原因,从而及时解决问题.在Excel 中,可分别用函数“V ARP ( )”和“STDEVP ( )”计算方差和标准差.也可用计算器,在“统计”模式下输入数据,按“SHIFT SVAR 2”键,得标准差,再按x 2键即为方差.拓展迁移【拓展点1】标准差的取值范围是什么?标准差为0的样本数据有什么特点?答案:非负,标准差为0意味着所有的样本数据都相等.【拓展点2】甲乙两人同时生产内径为25.4mm的一种零件,为了对两人的生产质量进行评比,从他们生产的零件中各抽取20件,量得其内径尺寸如下(单位mm):甲25.4625.3225.4525.3925.36 25.3425.4225.4525.3825.4225.3925.4325.3925.4025.44 25.40 25.4225.3525.4125.39乙25.4025.4325.4425.4825.4825.4725.4925.4925.3625.3425.3325.4325.4325.3225.47 25.3125.3225.3225.3225.48从生产的零件内径的尺寸看,谁生产的质量较高?思考:两个总体的平均数与标准差知不知道?25.40 mm是不是它们的平均数?答案:每一个工人生产的所有零件的内径尺寸组成一个总体.由于零件的生产标准已经给出(内径25.40mm),生产质量可以从总体的平均数与标准差两个角度来衡量.总体的平均数与内径标准尺寸25.40 mm的差异大时质量低,差异小时质量高,当总体的平均数与标准尺寸很接近时,总体的标准差小时质量高,标准差大时质量低.这样,比较两人的生产质量,只要比较他们所生产的零件尺寸所组成的两个总体的平均数与标准差的大小即可.但是,这两个总体的平均数与标准差都是不知道的,根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样本数据,然后比较这两个样本的平均数、标准差,以此作为两个总体之间差异的估计值.∵x甲=25.400 5, x乙=25.405 5,S甲≈0.037,S乙≈0.068,∴S甲<S乙.因此,甲生产的质量较高.。