人教版宁夏石嘴山市平罗中学高中数学第二章2用样本的数字特征估计总体的数字特征第二课时(共15张PPT
- 格式:pptx
- 大小:968.15 KB
- 文档页数:16
.2.2.2 用样本的数字特征估计总体的数字特征(二)【明目标、知重点】1.理解样本数据标准差的意义,会计算样本平均数和标准差.2.体会用样本估计总体的思想,会用样本的基本数字特征(平均数、标准差)估计总体的基本数字特征. 【填要点、记疑点】 1.标准差标准差是样本数据到平均数的一种平均距离,一般用s 表示.s = 1n[x 1-x2+x 2-x2+…+x n -x2].2.方差标准差的平方s 2叫做方差.s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2](x n 是样本数据,n 是样本容量,x 是样本平均数). 【探要点、究所然】 探究点一 标准差问题 平均数向我们提供了样本数据的重要信息,但是平均数有时也会使我们作出对总体的片面判断,因为这个平均数掩盖了一些极端的情况,而这些极端情况显然是不能忽视的.因此,只有平均数还难以概括样本数据的实际状态.如:有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下: 甲:7 8 7 9 5 4 9 10 7 4 乙:9 5 7 8 7 6 8 6 7 7如果你是教练,你应当如何对这次射击作出评价? 思考1 甲、乙两人本次射击的平均成绩分别为多少环?答 经计算得:x 甲=110(7+8+7+9+5+4+9+10+7+4)=7,同理可得x 乙=7.思考2 观察下图中两人成绩的频率分布条形图,你能说明其水平差异在哪里吗?答直观上看,还是有差异的.如:甲成绩比较分散,乙成绩相对集中.思考3 对于甲乙的射击成绩除了画出频率分布条形图比较外,还有没有其它方法来说明两组数据的分散程度?答还经常用甲乙的极差与平均数一起比较说明数据的分散程度.甲的环数极差=10-4=6,乙的环数极差=9-5=4.它们在一定程度上表明了样本数据的分散程度,与平均数一起,可以给我们许多关于样本数据的信息.显然,极差对极端值非常敏感,注意到这一点,我们可以得到一种“去掉一个最高分,去掉一个最低分”的统计策略.思考4 如何用数字去刻画这种分散程度呢?答考察样本数据的分散程度的大小,最常用的统计量是标准差.标准差是样本数据到平均数的一种平均距离,一般用s表示 .思考5 所谓“平均距离”,其含义如何理解?答假设样本数据是x1,x2,…,x n,x表示这组数据的平均数.x i到x的距离是|x i-x |(i =1,2,…,n ).于是,样本数据是x 1,x 2,…,x n 到x 的“平均距离”是 S =|x 1-x |+|x 2-x |+…+|x n -x |n.由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差:s =1n[x 1-x2+x 2-x2+…+x n -x2].思考6 标准差的取值范围如何?若s =0表示怎样的意义?答 从标准差的定义可以看出,标准差s ≥0,当s =0时,意味着所有的样本数据等于样本平均数. 探究点二 方差思考1 方差的概念是怎样定义的?答 人们有时用标准差的平方s 2—方差来代替标准差,作为测量样本数据分散程度的工具,方差:s 2=1n·[(x 1-x )2+(x 2-x )2+…+(x n -x )2].思考2 对于一个容量为2的样本:x 1,x 2(x 1<x 2),它们的平均数和标准差如果分别用x 和a 表示,那么x 和a 分别等于什么?答 x =12(x 1+x 2),a =12(x 2-x 1).思考3 在数轴上,x 和a 有什么几何意义?由此说明标准差的大小对数据的离散程度有何影响?答 x 和a 的几何意义如下图所示.说明了标准差越大离散程度越大,数据较分散;标准差越小离散程度越小,数据较集中在平均数周围.思考 4 现实中的总体所包含的个体数往往是很多的,总体的平均数与标准差是不知道的.如何求得总体的平均数和标准差呢?答通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差.这与前面用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.例1 求出问题中的甲乙两运动员射击成绩的标准差,并说明他们的成绩谁比较稳定?解x甲=110(7+8+7+9+5+4+9+10+7+4)=7,同理可得x乙=7.根据标准差的公式,s甲=110[7-72+8-72+…+4-72]=2;同理可得s乙≈1.095.所以s甲>s乙.因此说明甲的成绩离散程度大,乙的成绩离散程度小.由此可以估计,乙比甲的射击成绩稳定.反思与感悟标准差能够衡量样本数据的稳定性,标准差越大,数据的离散程度就越大,也就越不稳定.标准差越小,数据的离散程度就越小,也就越稳定.跟踪训练1如图所示是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________. 答案 6.8解析 从茎叶图中求出运动员在5次比赛中的分数,结合方差公式求解.依题意知,运动员在5次比赛中的分数依次为8,9,10,13,15,其平均数为8+9+10+13+155=11.由方差公式得s 2=15[(8-11)2+(9-11)2+(10-11)2+(13-11)2+(15-11)2]=15(9+4+1+4+16)=6.8. 探究点三 标准差及方差的应用例2 画出下列四组样本数据的条形图,说明它们的异同点.(1)5,5,5,5,5,5,5,5,5; (2)4,4,4,5,5,5,6,6,6; (3)3,3,4,4,5,6,6,7,7; (4)2,2,2,2,5,8,8,8,8.解 四组样本数据的条形图如下:四组数据的平均数都是5.0,标准差分别是:0.00,0.82,1.49,2.83.它们有相同的平均数,但它们有不同的标准差,说明数据的分散程度是不一样的.反思与感悟比较两组数据的异同点,一般情况是从平均数及标准差这两个方面考虑.跟踪训练2 从甲、乙两种玉米中各抽10株,分别测得它们的株高如下:甲:25、41、40、37、22、14、19、39、21、42;乙:27、16、44、27、44、16、40、40、16、40;(1)哪种玉米的苗长得高?(2)哪种玉米的苗长得齐?解(1)x甲=110(25+41+40+37+22+14+19+39+21+42)=30,x乙=110(27+16+44+27+44+16+40+40+16+40)=31,x甲<x乙.即乙种玉米的苗长得高.(2)由方差公式得:s2甲=110[(25-30)2+(41-30)2+…+(42-30)2]=104.2,同理s2乙=128.8,∴s2甲<s2乙.即甲种玉米的苗长得齐.答乙种玉米苗长得高,甲种玉米苗长得齐.例3 甲、乙两人同时生产内径为25.40 mm的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm):甲25.46 25.32 25.45 25.39 25.3625.34 25.42 25.45 25.38 25.4225.39 25.43 25.39 25.40 25.4425.40 25.42 25.35 25.41 25.39乙25.40 25.43 25.44 25.48 25.4825.47 25.49 25.49 25.36 25.3425.33 25.43 25.43 25.32 25.4725.31 25.32 25.32 25.32 25.48从生产的零件内径的尺寸看,谁生产的质量较高?(结果保留小数点后3位)解用计算器计算可得x甲≈25.401,x乙≈25.406;s甲≈0.037,s乙≈0.068.从样本平均数看,甲生产的零件内径比乙的更接近内径标准(25.40mm),差异很小;从样本标准差看,由于s甲<s乙,因此甲生产的零件内径尺寸比乙的稳定程度高得多.于是,可以作出判断,甲生产的零件的质量比乙的高一些.反思与感悟从上述例子我们可以看到,尽管总体是同一个,但由于样本不同,相应的样本频率分布与平均数、标准差等都会发生改变,这就会影响到我们对总体情况的估计.如果样本的代表性差,那么对总体所作出的估计就会产生偏差;样本没有代表性时,对总体作出错误估计的可能性就非常大.跟踪训练3 甲、乙两种水稻试验品种连续5年的平均单位面积产量如下(单位:t/hm2),试根据这组数据估计哪一种水稻品种的产量比较稳定.解[(9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]÷5=0.02. 乙品种的样本平均数也为10,样本方差为[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]÷5=0.244. 因为0.244>0.02,所以,由这组数据可以认为甲种水稻的产量比较稳定. 【当堂测、查疑缺】1.下列说法正确的是( )A .在两组数据中,平均值较大的一组方差较大B .平均数反映数据的集中趋势,方差则反映数据离平均值的波动大小C .方差的求法是求出各个数据与平均值的差的平方后再求和D .在记录两个人射击环数的两组数据中,方差大的表示射击水平高 答案 B解析 A 中平均值和方差是数据的两个特征,不存在这种关系;C 中求和后还需取平均数;D 中方差越大,射击越不平稳,水平越低.2.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示: 则7个剩余分数的方差为( )A.1169B.367C .36D.677答案 B 解析 由题意知87+94+90+91+90+90+x +917=91,解得x =4.所以s 2=17[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2] =17(16+9+1+0+1+9+0) =367. 3.已知一组数据x 1,x 2,x 3,x 4,x 5的平均数是x =2,方差是13,那么另一组数据3x 1-2,3x 2-2,3x 3-2,3x 4-2,3x 5-2的平均数和方差分别为 ( )A .2,13B .2,1C .4,13D .4,3答案 D解析 因为x =2,s 2=13;所以X =3x -2=4,S 2=9s 2=3,故选D.4.某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4.则:(1)平均命中环数为________; (2)命中环数的标准差为________. 答案 (1)7 (2)2解析 (1)x =110(7+8+7+9+5+4+9+10+7+4)=7010=7.(2)s 2=110[(7-7)2+(8-7)2+(7-7)2+(9-7)2+(5-7)2+(4-7)2+(9-7)2+(10-7)2+(7-7)2+(4-7)2]=4, ∴命中环数标准差为2. 【呈重点、现规律】1.标准差的平方s 2称为方差,有时用方差代替标准差测量样本数据的离散程度.方差与标准差的测量效果是一致的,在实际应用中一般多采用标准差.2.现实中的总体所包含的个体数往往很多,总体的平均数与标准差是未知的,我们通常用样本的平均数和标准差去估计总体的平均数与标准差,但要求样本有较好的代表性.3.在抽样过程中,抽取的样本是具有随机性的,因此样本的数字特征也有随机性.用样本的数字特征估计总体的数字特征,是一种统计思想,没有唯一答案.。
数学人教B 必修3第二章2.2.2 用样本的数字特征估计总体的数字特征1.通过随机抽样,会用样本平均数估计总体平均数,会用样本标准差估计总体标准差. 2.掌握几个数据的标准差及方差的计算方法,理解数据标准差的意义和作用.1.众数、中位数、平均数(1)在一组数据中,出现____最多的数据叫做这组数据的众数. 即:众数是在样本数据中,频率分布______所对应的样本数据.(2)将一组数据按大小依次排列,把处在____位置的一个数据(或____两个数据的平均数)叫做这组数据的中位数.(3)如果有n 个数x 1,x 2,x 3,…,x n ,那么x =____________________,叫做这n 个数的平均数.中所有个体的平均数叫做总体平均数. 中所有个体的平均数叫做样本平均数.【做一做1】10名工人某天生产同一零件,生产的件数分别是15,17,14,10,15,17,17,16,14,12.设平均数为a ,中位数为b ,众数为c ,则有( ).A .a <b <cB .a >b >cC .a <c <bD .c >a >b 2.样本方差、样本标准差数据的离散程度可以用____、____或______来描述.我们知道,样本方差描述了一组数据围绕______波动的大小.一般地,设样本的元素为x 1,x 2,…,x n ,样本的平均数为x ,定义s 2=(x 1-x )2+(x 2-x )2+…+(x n -x )2n,s =(x 1-x )2+(x 2-x )2+…+(x n -x )2n .其中s 2表示________,s 表示__________.因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差.【做一做2-1】样本101,98,102,100,99的标准差为( ). A . 2 B .0 C .1 D .2【做一做2-2】若k 1,k 2,…,k 6的方差为3,则2(k 1-3),2(k 2-3),…,2(k 6-3)的方差为__________.1.平均数、中位数、众数的区别与联系剖析:平均数在度量一组数据的集中化趋势的统计量中是应用最广泛的.计算平均数时全部数据都参加运算,因此,用它来反映一组数据的集中化趋势的代表性比较好.但是它也有缺点,主要的问题是平均数是根据一组数据中的全部数据来计算的,会受到数据中那些没有代表性的极端值的影响.因此,有时在计算平均数时,先剔除个别缺乏代表性的特殊值,所得到的结果可能会更具有代表性.中位数主要受一组数据中的中间位置上的数值的影响,用中位数来反映一组数据中各数据大小的一般水平并不很精确.但中位数计算简单,与平均数相比,中位数不受数据中两端异常的特殊值的影响.从这个意义出发,它可以作为数据平均指标的代表值.众数并没有通常意义上的“平均”的含义.但众数在数据中出现的次数最多,说明该数值在数据中最具有代表性.众数不会受到数据中极端值的影响,但并不是每一组数据都是具有众数的.对于分组数据而言,众数常常依赖于分组的情况,分组数改变时,众数可能就有较大的变化,稳定性较差.同时众数也可能是不唯一的.2.方差、极差和标准差的特点剖析:方差、极差和标准差是从不同角度描述一组数据的离散趋势的.它们各自的特点及应用如下:虽然极差没有充分利用数据,不能提供更确切的信息,但由于只涉及两个数据,计算非常简便,所以极差在实际现场检查时经常利用,但极差没有考虑各中间值.方差充分利用了所得到的数据,提供了更确切的信息.在统计中,方差能够较好地区别出不同组数据的分散情况或程度,但方差的单位是原始观测数据的单位的平方.而标准差能够和方差一样区分数据的分散情况,且其单位与原始观测数据的单位相同.(1)当标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性.(2)数据组x1,x2,…,x n的平均数为x,方差为s2,标准差为s,则数据组ax1+b,ax2+b,…,ax n+b(a,b为常数)的平均数为a x+b,方差为a2s2,标准差为as.题型一用众数、中位数、平均数估计总体(1)指出这个问题中的众数、中位数、平均数.(2)这个问题中,平均数能客观地反映该工厂的工资水平吗?为什么?分析:本题着眼于众数、中位数、平均数各自的特点,以及适用对象.反思:平均数受数据中的极端值的影响较大,降低了对总体估计的可靠性,这时平均数反而不如众数、中位数更客观.题型二用方差或标准差估计总体【例2】某化肥厂甲、乙两个车间包装化肥,在自动包装传送带上每隔30分钟抽取一袋称其重量,分别记录抽查数据如下(单位:kg):甲:102 101 99 98 103 98 99 乙:110 115 90 85 75 115 110估计甲、乙两车间所包装化肥每袋的重量,并说明哪个车间的技术好.分析:根据公式计算得平均数和方差,分析甲、乙两车间每袋重量的集中趋势和离散程度.反思:对于常用的平均数、方差、标准差的公式要能够熟练记忆,不能记错公式,造成计算上的失误,使得统计的结果失去真实的意义.另外,应用求得的标准差的结论时,要特别注意标准差较大,数据的离散程度较大;标准差较小,数据的离散程度较小.题型三 样本数字特征的应用【例3】画出下列四组数据的频率分布条形图,并说明它们的异同点. (1)5,5,5,5,5,5,5,5,5; (2)4,4,4,5,5,5,6,6,6; (3)3,3,4,4,5,6,6,7,7; (4)2,2,2,2,5,8,8,8,8.分析:比较四组数据的异同可从它们的平均数、标准差这些数字特征入手,分析它们的集中趋势或离散程度.反思:频率分布条形图可以将我们所要求的平均数、众数、中位数、标准差等数据一一用图形直观显示出来,帮助我们获取有用的信息,特别是在对两组数据间进行比较时,应用非常方便.题型四 易错辨析【例4】若10个正整数的平方和是208,平均数是4,则这组数据的方差为多少?将这组数据同时减去3,则新数据的平均数为多少?方差为多少?错解:s 2=110(x 21+x 22+…+x 210-10x )=16.8,这组数据都减去3后,平均数为4-3=1,方差为16.8-9=7.8.错因分析:对平均数、方差的公式不清楚,致使计算结果不正确.1能反映一组数据的离散程度的是( ). A .频数 B .平均数 C .标准差 D .极差2已知某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图如下,则( ).A .甲的中位数为21,乙的众数为26B .甲的众数为21,乙的中位数为25C .甲的中位数为21,乙的众数为31D .甲的众数为21,乙的中位数为313甲、乙两名同学在五次考试中数学成绩统计用茎叶图表示如下,则下列说法正确的是( ).A .甲的平均成绩比乙的平均成绩高B .甲的平均成绩比乙的平均成绩低C .甲成绩的方差比乙成绩的方差大D .甲成绩的方差比乙成绩的方差小4已知一个样本数据是1,3,2,5,x ,它的平均数是3,则这个样本的标准差是__________. 5一组数据的每一个数据都减去80,得一组新数据.若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是______、______.答案: 基础知识·梳理1.(1)次数 最大值 (2)中间 中间 (3)1n(x 1+x 2+…+x n ) 总体 样本 【做一做1】 A 众数c =17,中位数b =15,平均数a =110×(10+12+14×2+15×2+16+17×3)=14.7,所以a <b <c .2.极差 方差 标准差 平均数 样本方差 样本标准差【做一做2-1】 A 样本平均数x =15×(101+98+102+100+99)=100,方差s 2=15×[(101-100)2+(98-100)2+(102-100)2+(100-100)2+(99-100)2]=2,∴s = 2.【做一做2-2】 12 设k 1,k 2,…,k 6的平均数为k , 则16[(k 1-k )2+(k 2-k )2+…+(k 6-k )2]=3, 而2(k 1-3),2(k 2-3),…,2(k 6-3)的平均数为2(k -3),则所求方差为16[4(k 1-k )2+4(k 2-k )2+…+4(k 6-k )2]=4×3=12.典型例题·领悟【例1】 解:(1)由表格可知:众数为200,中位数为220,平均数为(2 200+250×6+220×5+200×10+100)÷23=300(元/周).(2)虽然平均数为300元/周,但从表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该厂的工资水平.【例2】 解:x 甲=17×(102+101+99+98+103+98+99)=100.x 乙=17×(110+115+90+85+75+115+110)=100.s 2甲=17×(4+1+1+4+9+4+1)=247, s 2乙=17×(102+152+102+152+252+152+102)=1 6007>s 2甲, ∵x 甲=x 乙=100,∴两车间所包装化肥每袋重量平均数都是100 kg.∵s 2甲<s 2乙,∴s 甲<s 乙,∴甲车间包装化肥的技术好.【例3】 解:四组数据的频率分布条形图如图所示.四组数据的平均数都是5,标准差分别是0.00,0.82,1.49,2.83.虽然它们有相同的平均数,但是它们的标准差不同,说明数据的离散程度是不一样的.【例4】 正解:由方差公式s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],展开整理可得s 2=1n[(x 21+x 22+…+x 2n )-n (x )2], 这里由题设n =10,x 21+x 22+…+x 210=208,x =4,所以s 2=110(208-10×42)=4.8.一组数据同时减去a 后,平均数为x -a ,方差不变,所以都减去3后,平均数为1,方差为4.8. 随堂练习·巩固1.C 本题考查数据的基本特征量以及它们的含义,因为标准差反映数据的波动大小及离散程度,所以应选C.2.C3.C 由图可知甲的五次成绩分别为99,98,105,118,115,则可得甲的五次成绩的平均数为107,方差为66.8;乙的五次成绩分别为95,106,108,112,114,则可得乙的平均成绩为107,方差为44.4.2 由15(1+3+2+5+x )=3,解得x =4,因为s 2=15[(1-3)2+(3-3)2+(2-3)2+(5-3)2+(4-3)2]=2,所以标准差s = 2.5.81.2 4.4 设这组数据为x 1,x 2,…,x n ,都减去80后,新数据为x 1′,x 2′,…,x n ′,则x 1′+x 2′+…+x n ′n =1.2.所以x 1+x 2+…+x n n =x 1′+x 2′+…+x n ′+80nn=1.2+80=81.2,又方差是刻画数据离散程度的量,故各数据减(或加)上同一个数后,方差的大小不变.。