江苏省高二数学苏教版必修3教学案:第2章03总体特征数的估计
- 格式:doc
- 大小:73.50 KB
- 文档页数:6
2019-2020年高中数学2.3《总体特征数的估计》教案苏教版必修3学习要求1. 知道平均数是对调查数据的一种简明的描述,它表示变量一切可能值的算术平均值,从而实现对总体可靠度的估计,学习时仔细体会它的实际意义。
2. 熟练掌握平均数的计算公式。
【课堂互动】自学评价案例 某校高一(1)班同学在老师的布置下,用单摆进行测试,以检验重力加速度.全班同学两人一组,在相同的条件下进行测试,得到下列实验数据(单位:m/s 2):9.62 9.54 9.78 9.94 10.01 9.66 9.88 9.68 10.32 9.76 9.45 9.99 9.81 9.56 9.78 9.72 9.93 9.94 9.65 9.79 9.42 9.68 9.70 9.84 9.90 怎样利用这些数据对重力加速度进行估计? 【分析】我们常用算术平均数(其中(=1,2,…,n) 为n 个实验数据)作为重力加速度的“最理想”的近似值.它的依据是什么?处理实验数据的原则是使这个近似值与实验数据之间的离差最小. 设这个近似值为,那么它与n 个实验值(=1,2,…,n)的离差分别为,,…,.由于上述离差有正有负,故不宜直接相加.可以考虑将各个离差的绝对值相加,研究||+||+…+||取最小值时的值.但由于含绝对值,运算不太方便,所以考虑离差的平方和,即()2+()2+…+()2,当此和最小时,对应的的值作为近似值,因为 ()2+()2+…+()2=22221212)(2n n a a a x a a a nx +⋅⋅⋅++++⋅⋅⋅++-,所以当时离差的平方和最小,故可用作为表示这个物理量的理想近似值,称其为这n 个数据,,…,的平均数或均值,一般记为 .用计算器操作,验证:求得重力加速度的最佳近似值为 m/s 2. 【小结】1. 个实数的和简记为2.已知个实数,则称为这个数据的平均数(average)或均值(mean)3.若取值为的频率分别为,则其平均数为【精典范例】例1 某校高一年级的甲、乙两个班级(均为50人)的语文测试成绩如下(总分:150),试确定这次考试中,哪个班的语文成绩更好一些。
第三课时 2.3.2 用样本的数字特征估计总体数字特征(一)教学要求:正确理解样本数据分布直方图的意义和作用,从样本频率分布直方图中提取基本的数字特征(如众数、中位数、平均数),并做出合理的解释. 会用样本的基本数字特征估计总体的基本数字特征,形成对数据处理过程进行初步评价的意识.教学重点:从样本频率分布直方图中提取基本的数字特征(如众数、中位数、平均数). 教学难点:对比初中所学众数、中位数、平均数的概念.教学过程:一、复习准备:1. 提问:作样本频率分布直方图的基本步骤是怎样的?2. 讨论:如何通过样本的频率分布直方图分析出一些规律?(给出一个图,试着分析)3. 已知数据:10,11,12,12,13,13,13,14,15,根据初中所学的知识,试求中位数、众数、平均数.复习:初中学习的中位数、众数、平均数概念?(样本众数:样本观测值中出现次数最多的数;样本中位数:将一组数据从按大小依次排列,处在最中间的一个数据;平均数.)讨论:如何通过样本的数字特征来了解总体的数字特征?引入:这节课学习如何通过频率分布直方图分析数字特征(中位数、众数、平均数).二、讲授新课:1、教学众数、中位数、平均数的估计:①讨论:结合教材月平均用水量的频率分布直方图,如何估计众数?(注意哪段范围的数最多)②估计众数:频率分布直方图面积最大的方条的横轴中点数字. (最高矩形的中点)③思考:从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t,翻回到课本第56页看看原来抽样的数据,有没有2.25 这个数值呢?根据众数的定义,2.25怎么会是众数呢?为什么?(结论:这是因为样本数据的频率分布直方图把原始的一些数据给遗失的原因,而2.25是由样本数据的频率分布直方图得来的,所以存在一些偏差。
)④讨论:结合教材月平均用水量的频率分布直方图,如何估计中位数?(注意中位数分离标准)⑤估计中位数:中位数把频率分布直方图分成左右两边面积相等.原因:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数。
2.3 总体特征数的估计1.众数一组数据中重复出现次数最多的数称为这组数的众数. 2.中位数把一组数据按从小到大的顺序排列,把处于中间位置的那个数称为这组数据的中位数.当数据个数为奇数时,中位数是按从小到大的顺序排列的中间的那个数.当数据个数为偶数时,中位数是按从小到大的顺序排列的最中间两个数的平均数.3.平均数(1)若给定一组数据a 1,a 2,…,a n ,则称a =1n ∑i =1n a i =a 1+a 2+…+a n n为这n 个数据的平均数或均值.(2)若一组数据中取值为a 1,a 2,…,a n 的频率分别为p 1,p 2,…,p n ,则其平均数为a 1p 1+a 2p 2+…+a n p n .4.方差与标准差一般地,设样本数据分别是x 1,x 2,…,x n ,样本的平均数为x ,则称s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n-x )2]为这个样本的方差,其算术平方根s =分别简称样本方差、样本标准差. 5.极差一组数据的最大值与最小值的差称为极差.1.下面是高一(8)班十位同学的数学测试成绩:82,91,73,84,98,99, 101,118,98,110,则该组数据的中位数是________.98 [将这组数据从小到大排列为73,82,84,91,98,98,99, 101,110,118,则最中间的两个数为98,98,故中位数为98.]2.在一段时间里,一个学生记录了其中10天他每天完成家庭作业所需要的时间(单位:分钟),结果如下:80,70,70,70,60,60,80,60,60,70.在这段时间里,该学生平均每天完成家庭作业所需时间是________分钟. 68 [平均每天所需时间为80×2+70×4+60×410=68.]3.某老师从星期一到星期五收到的信息数分别为10,6,8,5,6,则该组数据的方差s 2=________.3.2 [5个数据的平均数x =10+6+8+5+65=7.所以s 2=15[(10-7)2+(6-7)2+(8-7)2+(5-7)2+(6-7)2]=3.2.]4.已知一个样本中的数据为1,2,3,4,5,则该样本的标准差为________. 2 [平均数x =15(1+2+3+4+5)=3,所以s =15[(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2] = 2.]178,178,182,182,178,180,178,180,181,180,181,180,180,182.则这个球队的队员平均身高是________cm(精确到1 cm).(2)有容量为100的样本,数据分组及各组的频数、频率如下:[12.5,14.5),6,0.06;[14.5,16.5),16,0.16;[16.5,18.5),18,0.18;[18.5,20.5),22,0.22;[20.5,22.5),20,0.20;[22.5,24.5),10,0.10;[24.5,26.5],8,0.08.则该样本数据的平均数为________.(1)180 (2)19.42 [(1)法一:利用平均数的定义计算: 平均身高x =114(178+178+182+182+178+180+178+180+181+180+181+180+180+182)=114×2 520=180(cm).法二:利用加权平均数公式计算: 平均身高x =114(178×4+182×3+180×5+181×2)=114×2 520=180(cm). 法三:利用新数据法进行计算:取a =180,将各数据同时减去180,得到一组新数据: -2,-2,2,2,-2,0,-2,0,1,0,1,0,0,2. 这组新数据的平均数为x ′=114(-2×4+2×3+0×5+1×2)=0,所以平均身高x =a +x ′=180+0=180(cm).(2)利用频率平均数公式计算:样本数据平均数x =13.5×0.06+15.5×0.16+17.5×0.18+19.5×0.22+21.5×0.20+23.5×0.10+25.5×0.08=19.42.]1.一般情况下,要计算一组数据的平均数,可使用平均数公式x =1n(x 1+x 2+…+x n )来计算.2.如果x 1,x 2,…,x n 的平均数为x ,那么mx 1+a ,mx 2+a ,…,mx n +a 的平均数是m x +A .当数据较大,且大部分数据在某一常数左右波动时,本例中“法三”可以减少运算量,故此法比较简便.3.一般地,如果在n 个数中,x 1出现的频数为f 1,x 2出现的频数为f 2,…,x k 出现的频数为f k (其中f 1+f 2+…+f k =n ),那么x =1n(x 1f 1+x 2f 2+…+x k f k )=1n i =1kx i f i 叫做这n 个数的频数平均数,也称加权平均数,其中f 1,f 2,…,f k 叫做权.4.一般地,若取值为x1,x2,…,x n的频率分别为p1,p2,…,p n,那么其平均数为x=x1p1+x2p2+…+x n p n.如本例(2)中求平均数方法.提醒:当条件给出某几个范围内的数据的频率或频数时,可用组中值求平均数.1.某商场买来一车苹果,从中随机抽取了10个苹果,其重量(单位:克)分别为150,152,153,149,148,146,151,150,152,147,由此估计这车苹果单个重量的平均值是________.149.8克[平均数为x=150+152+153+149+148+146+151+150+152+14710=149.8(克).]2.将一组数据同时减去3.1,得到一组新数据,若原数据的平均数为x,则新数据的平均数是________.x-3.1 [设原来数据为a1,a2,…,a n,则a1+a2+…+a n=n x,从而新数据的平均数为(a1-3.1)+(a2-3.1)+…+(a n-3.1)n=n x-3.1nn=x-3.1.](1)极差;(2)方差;(3)标准差.[解] (1)该组数据中最大值为9,最小值为5,故该组数据的极差为9-5=4.(2)求方差可以有三种方法:法一:因为x=110(7×4+6×2+8×2+5+9)=7,所以s2=110×[(7-7)2+(6-7)2+…+(7-7)2]=1.2,法二:同“法一”,求得x=7,所以s2=110[(72+62+82+…+72)-10×72]=1.2,法三:将各数据减去7,得一组新数据:0,-1,1,1,-2,2,0,0,-1,0,则x′=0,所以x =x ′+7=7.所以s 2=110[02+(-1)2+12+…+02]-10×02=1.2.(3)由(2)知,标准差s =s 2= 1.2=305.1.极差是数据的最大值与最小值的差,它反映了一组数据变化的最大幅度,它对一组数据中的极端值非常敏感.2.方差的计算(1)s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2];(2)s 2=1n (x 21+x 22+…+x 2n -n x 2); (3)s 2=1n(x 21+x 22+…+x 2n )-x 2. 3.方差的性质(1)数据x 1,x 2,…,x n 与数据x 1+a ,x 2+a ,…,x n +a 的方差相等.(2)若数据x 1,x 2,…,x n 的方差为s 2,则数据ax 1+b ,ax 2+b ,…,ax n +b 的方差为a 2s 2(a ,b ∈R ).(3)标准差、方差的范围为[0,+∞). 4.标准差的计算方差的算术平方根即标准差,要求标准差先求出方差,再开方取其算术平方根即可. 提醒:方差、标准差的单位不一致要注意区别.3.若一组样本数据2,3,7,8,a 的平均数为5,则该组数据的标准差s =________. 1305 [由平均数为5,得a =5×5-(2+3+7+8)=5,则s 2=15(32+22+22+32+02)=265,s =265=1305.] 4.已知样本x 1,x 2,x 3,x 4,x 5的方差为3,则样本4x 1+1,4x 2+1,4x 3+1,4x 4+1,4x 5+1的标准差是________.4 3 [根据方差的性质知4x 1+1,4x 2+1,4x 3+1,4x 4+1,4x 5+1的方差为42×3=48.所以其标准差为48=4 3.]8次选拔比赛,他们的成绩(单位:m)如下:甲:1.70,1.65,1.68,1.69,1.72,1.73,1.68,1.67; 乙:1.60,1.73,1.72,1.61,1.62,1.71,1.70,1.75.经预测,成绩超过1.65 m 就很有可能获得冠军,该校为了获取冠军,可能选哪位选手参赛?若预测成绩超过了1.70 m 方可获得冠军呢?思路点拨:[解] 甲的平均成绩和方差:x 甲=18×(1.70+1.65+…+1.67)=1.69,s 2甲=18×[(1.70-1.69)2+(1.65-1.69)2+…+(1.67-1.69)2]=0.000 6.乙的平均成绩和方差:x 乙=18×(1.60+1.73+…+1.75)=1.68,s 2乙=18×[(1.60-1.68)2+(1.73-1.68)2+…+(1.75-1.68)2]=0.003 15.显然,甲的平均成绩高于乙的平均成绩,而且甲的方差小于乙的方差,说明甲的成绩比乙稳定,由于甲的平均成绩高于乙,且成绩稳定,所以若成绩超过1.65 m 就很可能获得冠军,应派甲参赛.在这8次选拔比赛中乙有5次成绩在1.70 m 以上,虽然乙的平均成绩不如甲,成绩的稳定性也不如甲,但当成绩超过1.70 m 方可获得冠军时,应派乙参加比赛.在实际问题中,仅靠平均数不能完全反映问题,还要研究其偏离平均值的离散程度(方差或标准差),方差(标准差)越大,说明取值分散性越大,方差(标准差)越小,说明取值分散性越小,取值比较集中、稳定.5.假定以下数据是甲、乙两个供货商的交货天数: 甲:10,9,10,10,11,11,9,11,10,10; 乙:8,10,14,7,10,11,10,8,15,12.根据以上数据估计两个供货商的交货情况:哪个供货商交货时间短一些?哪个供货商是比较具有一致性与可靠性的供货商?思路点拨:先分别计算出甲、乙两组数据的平均数及方差,再作判断.[解] x甲=110(10+9+…+10)=10.1,s2甲=110(102+92+…+102)-10.12=0.49;x乙=110(8+10+…+12)=10.5,s2乙=110(82+102+…+122)-10.52=6.05>s2甲.从交货天数的平均值来看,甲供货商的交货时间短一些;从方差来看,甲供货商的交货时间较稳定.因此甲供货商是比较具有一致性与可靠性的供货商.6.从甲、乙两种玉米中各抽10株,分别测得它们的株高如下(单位:cm):甲:25,41,40,37,22,14,19,39,21,42;乙:27,16,44,27,44,16,40,40,16,40.问:(1)哪种玉米的苗长得高?(2)哪种玉米的苗长得齐?思路点拨:看哪种玉米的苗长得高,只要比较甲、乙两种玉米的平均高度即可;要比较哪种玉米的苗长得齐,只要看两种玉米高的方差即可,因为方差是体现一组数据波动大小的特征数.[解] (1)x甲=110(25+41+40+37+22+14+19+39+21+42)=30(cm),x乙=110(27+16+44+27+44+16+40+40+16+40)=31(cm),因为x甲<x乙.故乙种玉米苗长得高.(2)s2甲=110[(25-30)2+(41-30)2+(40-30)2+(37-30)2+(22-30)2+(14-30)2+(19-30)2+(39-30)2+(21-30)2+(42-30)2]=104.2(cm2).s2乙=110[(27-31)2+(16-31)2+(44-31)2+(27-31)2+(44-31)2+(16-31)2+(40-31)2+(40-31)2+(16-31)2+(40-31)2]=128.8(cm2).因为s2甲<s2乙,所以甲种玉米的苗长得齐.1.本节课的重点是会求样本的众数、中位数、平均数、标准差、方差,难点是理解用样本的数字特征来估计总体数字特征的方法.2.本节课要掌握以下几类问题(1)当平均数大于中位数时,说明数据中存在较大的极端值;反之,说明数据中存在较小的极端值.(2)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.1.已知1,2,3,4,x 1,x 2,x 3的平均数是8,那么x 1+x 2+x 3的值是( ) A .56 B .48 C .46 D .24C [由条件知,1+2+3+4+x 1+x 2+x 3=8×7, 所以x 1+x 2+x 3=46.]2.某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4. 则:(1)平均命中环数为________; (2)命中环数的标准差为________. (1)7 (2)2 [(1)x =110(7+8+7+9+5+4+9+10+7+4)=7. (2)s 2=110[(7-7)2+(8-7)2+(7-7)2+(9-7)2+(5-7)2+(4-7)2+(9-7)2+(10-7)2+(7-7)2+(4-7)2]=4,所以s =s 2=4=2.]3.已知一个样本为1,3,2,5,x ,它的平均数是3,则这个样本的标准差是________. 2 [x =1+3+2+5+x5=3,∴x =4. 由方差公式有:s 2=15[(1-3)2+(3-3)2+(2-3)2+(5-3)2+(4-3)2]=2,∴s = 2.]4.有两位射击运动员在一起射击,测试中各射靶10次,每次命中的环数如下: 甲:8,7,9,7,5,4,10,9,7,4; 乙:5,9,8,7,7,6,6,8,7,7.如果这是一次选拔性考核,应当选择谁?思路点拨:平均数反映总体的平均水平,而方差反映了总体的稳定程度,我们可用平均数与方差从不同的方面估计总体.[解] x 甲=110(8+7+9+7+5+4+10+9+7+4)=7,x 乙=110(5+9+8+7+7+6+6+8+7+7)=7.s2甲=110[(8-7)2+(7-7)2+(9-7)2+(7-7)2+(5-7)2+(4-7)2+(10-7)2+(9-7)2+(7-7)2+(4-7)2]=4.s2乙=110[(5-7)2+(9-7)2+(8-7)2+(7-7)2+(7-7)2+(6-7)2+(6-7)2+(8-7)2+(7-7)2+(7-7)2]=1.2.由x甲=x乙知两个射击运动员的平均成绩是一样的.由s2甲>s2乙知,甲的成绩不如乙的成绩稳定.综合考虑,应选择乙.。
2.3整体特点数的预计名师导航三点分析在初中我们知道,整体均匀数 ( 又称为整体希望值 ) 描绘了一个整体的均匀水平,因为对好多整体来说,它的均匀数不易求得,常用简单求得的样本均匀数:x 1 ( x1x2x n ) 对它进行预计,并且常用两个样本均匀数的大小去近似地比较n相应的两个整体均匀数的大小.一、均匀数1.均匀数定义12n 1 n1若给定一组数据 x,x,, x,则称 x x i(i=1,2,3,, n) 为这组数据 x ,n i 1x2,, x n的均匀数 ( 或均值 ). 往常用样本均匀数来预计整体均匀数. 当所给数据中没有重复n1数据时,我们一般用此公式来求这组数据的均匀数. 这里x i+ +x ). 均匀数反(x +x12ni 1n映了一组数据的集中趋向,我们常用一组数据的均匀数来权衡这组数据的水平.当一组数据中的重复数据过多时,若用上边公式求这组数据的均匀数,其过程就会显得比较复杂和冗长,为了简化计算过程,我们引入下边这类计算均匀数的方法:一般地,若取值为 x1,x2,,x n的频次分别为p1,p2,,p n,则其均匀数为x1p1+x2p2+ +x n p n.这一公式本质上就是公式a1a2an的一个变形,它主要用于含有重复数据的数据组n求均匀数 .除此以外,当所给数据在某一常数 a 的上下颠簸时,我们也可利用公式: x x a , 其中 x 1(x 1′ +x2′ + +x n′ ) ,x1′ =x1-a,x 2′ =x2-a,x 3′ =x3-a ,, x n′ =x n-a ;常数 a 通n常取靠近于这组数据的均匀数较“整”的数.比如 : 求数据70,71, 72,73 的均匀数时,我们能够先求出0, 1, 2,3 的均匀数,然后将此均匀数加上70 即得该组数据的均匀数 .2.均匀数的性质(1)若给定一组数据x1,x2,, x n的均匀数为x ,则ax1,ax2,,ax n的均匀数为a x ;(2)若给定一组数据x, x,, x的均匀数为x ,则ax +b,ax+b,, ax +b 的均匀12n12n数为 a x +b;二、极差、方差与标准差在初中我们知道,极差、方差和标准差是描绘一个样本和整体的颠簸大小的特点数.1.极差的定义一组数据的最大值和最小值的差叫极差. 极差也能够对两组数据的集中程度进行对照,且比较简单 . 但两组数据的集中程度差别不大时,利用它就不易得出结论了. 并且它只利用了数据中的最大值和最小值,对极值过于敏感 . 但因为只波及到了两个数据,便于获取 . 所以极差在本质中也常常用到 .比如 : 数据 :25,41,37,22,14,19,39,21,42,40中的最大值为 42,最小值为14,它的极差为 42-14=28 .2 .方差的定义在一组数据x ,x, ,xn 中,各数据与它们的均匀数x 的差的平方的均匀数,叫做这组12数据的方差,记作2,即若给定一组数据x, x,, x221 n( x i x)2.s,则 s = s12nn i 1为了更好地比较两组数据的集中程度, 我们能够利用这两组数据的方差对两组数据进行比较 . 方差较大的数据颠簸较大;方差较小的数据颠簸较小. 当所给的数占有单位时,所求得的均匀数与原数据的单位同样,不要漏写单位. 方差的单位为所给数据单位的平方.3.方差的性质(1)若给定一组数据 x1, x2,, x n,方差为 s2,则 ax1, ax2,, ax n的方差为 a2s2;(2)若给定一组数据12n212n+b 的方差为x, x,, x ,方差为s,则 ax +b,ax+b,, ax22特别地,当 a=1 时,则有 x +b, x +b,, x+b 的方差为2a s ,s ,这说明将一组数据的每一12n个数据都减去同样的一个常数,其方差是不变的,即不影响这组数据的颠簸性;(3)方差刻画了数据相关于均值的均匀偏离程度. 关于不一样的数据集,当失散程度越大时,方差越大;(4)方差的单位是原始丈量数据单位的平方,对数据中的极值较为敏感.4.标准差刻画数据失散程度的胸怀,其理想形式应知足以下三条原则:(1)应充足利用所获取的数据,以便供给更切实的信息;(2)仅用一个数值来刻画数据的失散程度;(3)关于不一样的数据,当失散程度大时,该数值也大.我们上边提到的极差明显不知足第一条原则,因为它只利用了数据中最大和最小的两个值. 方差固然知足上边的三条原则,但是它有限制性 : 方差的单位是原始数据单位的平方,而刻画失散程度的一种理想胸怀应与原始观察数据拥有同样的单位. 解决这一限制性的方法就是取方差的算术平方根. 方差的算术平方根称作标准差,记作s,即s 1 n(x i x) 2标n i1准差的单位与原始丈量数据单位同样,能够减弱极值的影响.问题研究问题 1: 甲、乙两台机床同时生产直径为40 ㎜的部件 . 为了查验产品的质量,从两台机床生产的产品中各抽取10 件进行了丈量,结果以下:甲/mm40.039. 840.140.239. 940.040.239. 8 40.239. 8乙/mm40.040.039. 940.039. 940.140.139. 9能用几种方法比较这两台机床的性能?研究 : 经简单计算能够得出 : 甲、乙两台机床生产的这10 件产品的直径的均匀数都为40mm.所以,不可以从均匀数这一角度来比较这两台机床的性能, 即不可以从数据的均匀水平上来比较,只好从数据的失散程度长进行比较. 要从数据的失散程度长进行比较, 常有的方法有以下几种 :方法一 : 利用初中所学的折线统计图. 由折线统计图我们能够直观地表示出这两组数据的失散程度,甲机床生产的产品颠簸幅度比乙大. 所以,乙机床的性能好于甲 .方法二 : 利用这两组数据的极差进行比较. 甲:40.2-39.8=0.04 ;乙:40.1-39 .9=0.02 .显然,乙组数据的极差小于甲组数据的极差. 所以,乙机床的性能好于甲 .方法三 : 利用这两组数据的方差或标准差进行比较. 由方差和标准差的计算公式不难得出甲的方差为 s 甲2=0.026(mm2) ,标准差为 s 甲 =0.161(mm) ;乙的方差为 s 乙2=0.006(mm2) ,标准差为 s 乙=0.077(mm). 由上可知 : 无论是方差仍是标准差甲的均比乙的大,这就说明乙机床生产的产品要更标准些 . 所以,乙机床的性能好于甲 .问题 2: 某校拟派一名跳高运动员参加一项校际竞赛,对甲、乙两名跳高运动员进行了 8次选拔竞赛,他们的成绩( 单位 :m) 以下 :甲 :1.70,1.65,1.68,1.69,1.72,1.73,1.68,1.67;乙 :1.60,1.73,1.72,1.61,1.62,1.71,1.70,1.75.经展望,跳高 1.65m就很可能获取冠军. 该校为了获取冠军,可能选哪位选手参赛?若展望跳高 1.70 m 方可获取冠军呢?研究 : 参加竞赛的选手的成绩得突出,且成绩稳固 , 这就需要比较这两名选手的均匀成绩和成绩的方差 .甲的均匀成绩和方差以下 :x 甲1(1.70+1.65+1.68+1.69+1.72+1.73+1.68+1.67)=1.69, 8s21[ (1.70-1.69)22-1.69)2.甲 =+(1.65-1.69)+ +(1.67] =0.000 6 8乙的均匀成绩和方差以下 :x 乙1(1.60+1.73+1.72+1.61+1.62+1.71+1.70+1.75)=1.68, 8s乙2= 1[ (1.60-1.68)2+(1.73-1.68)2+ +(1.75-1.68)2] =0.003 15.8明显,甲的均匀成绩好于乙的均匀成绩,并且甲的方差小于乙的方差,说明甲的成绩比乙稳固 . 因为甲的均匀成绩高于乙,且成绩稳固,所以若跳高 1.65m 就很可能获取冠军 , 应派甲参赛 . 在这 8 次选拔赛中乙有 5 次成绩在 1.70 m以上,固然乙的均匀成绩不如甲,成绩的稳固性也不如甲,若跳高 1.70m 方可获取冠军时,应派乙参加竞赛.精题精讲例 1.在昨年的足球甲 A 联赛上,一队每场竞赛均匀失球数是 1.5 ,整年竞赛失球个数的标准差为 1.1 ;二队每场竞赛均匀失球数为 2.1 ,整年竞赛失球个数的标准差为0.4 .你以为以下说法中哪一种是正确的?(1)均匀说来一队比二队技术好;(2)二队比一队技术水平更稳固;(3)一队有时表现很差,有时表现又特别好;(4)二队极少不失球 .思路分析本题主要考察对均匀数和标准差的观点的理解. 均匀数反应了一组数据的均匀水平,而方差则反应了一组数据的颠簸性的大小 . 一队每场竞赛均匀失球数比二队每场竞赛均匀失球 数少, 说明一队的技术比二队的技术好; 一队整年竞赛失球个数的标准差较大,说明一队的表现时好时坏, 起伏较大;二队的均匀失球数多,整年竞赛失球个数的标准差很小,说明二队的表现较稳固,常常失球.答案 :(1)(2)(3)(4)都正确 .例 2.下边是某一个工厂全部工作人员在某个月的薪资,总经理6 000 元,技术工人甲900元,技术工作人员乙 800 元,杂工 640 元,服务员甲 700 元,服务员乙 640 元,会计 820元.(1) 计算全部工作人员的均匀薪资 . (2) 去掉总经理后,再计算均匀薪资 .(3)在 (1) 和 (2) 中两种均匀薪资哪一种能代表一般工人的收入水平,为何?思路分析计算均匀薪资是用薪资总数除以领薪资的人数即可.1 (6 000+900+800+640+700+640+820)=1答 案 :(1) 所 有 工 作 人 员 平 均 工 资 为 x500( 元 ).7(2) 去掉总经理后均匀薪资为 x1(900+800+640+700+640+820)=750( 元 ).(3)6750 元 . 因为除掉总经理能代表一般工人的收入水平的是去掉总经理后的均匀薪资 以外,工作人员的薪资均在900 元以下,所以不可以以 1 500 元来代表员工的均匀薪资水平 .绿色通道一般地,在一组数据中,均匀数、众数、中位数能够反应该组数据的集中趋向和均匀水平,但有时需要去掉极端值( 极大值或极小值 ), 这样计算均匀数则更能反应均匀水平,这就是有些竞赛活动中常常会去掉一个最大值和一个最小值再去计算均匀成绩的原由 .例 3.甲、乙两工人同时加工一种圆柱部件,在他们所加工的部件中各抽取 10 个进行直径检测,测得数据以下 ( 单位 :mm):甲 :19.9 , 19.7 , 19.8 ,20.0 , 19.9 , 20.2 , 20.1 , 20.3 , 20.2 , 20.1 ;乙 :20.0 , 20.2 , 19.8 ,19.9 , 19.7 , 20.2 , 20.1 , 19.7 , 20.2 , 20.4 .(1) 分别计算上边两个样本的均匀数和方差;(2)若部件规定直径为 20.0 ±0.5(mm),依据两个样本的均匀数和方差,说明谁加工的部件的质量较稳固 .思路分析利用均匀数和方差的计算公式进行计算,再比较谁的部件的质量较稳固 . 因为方差能说明一组数据颠簸性的大小, 则可经过比较这两个样本的方差的大小来比较两人加工部件的稳定性 .答案 :(1) x 甲 =20.02 , x 乙 =20.02,21 n( x i x) 222.利用 s =, 可得 s 甲 =0.033 6,s乙=0.041 6 n i 1∵s甲 2<s乙 2,∴甲工人加工部件的质量比较稳固.绿色通道比较两人加工部件的质量的稳固性,这里经过均匀数比较不出来,需要使用方差来比较,方差越大说明颠簸性较大,质量越不稳固. 一般地,方差和标准差往常用来反应一组数据的颠簸大小 . 在统计中,样本的方差和标准差往常用来预计整体数据的颠簸大小.例 4.从 2001 年 2 月 21 日 0 时起,中国电信履行新的电话收费标准,此中当地网营业区内通话费是 : 前 3min 为 0.2 元 ( 不足 3min 的按 3min 计算 ) ,此后每分钟加收0.1 元 ( 不足 1min 的按 1min 计算 ). 某礼拜天,一位学生检查了A、 B、 C、D、 E 五位同学某天打当地网营业区内电话的通话时间状况,原始数据如表1.表 1A B C D E第一次通话时间3min3min 45s3min 55s3min 20s6min第二次通话时间04min3min 40s4min 40s0第三次通话时间005min2min0表 2时间段频数累计频数0<t ≤33<t ≤44<t ≤55<t ≤6(1)问 D 同学这日的通话费是多少?(2) 设通话时间为 t min ,试依据表 1 填写频数 ( 落在某一时间段上的通话次数 ) 散布表(表 2).(3)调整前履行的原电话收费标准是 : 每 3 min 为 0.2 元 ( 不足 3 min 的按 3 min 计算 ).问: 这五位同学这日的本质均匀通话费与用原电话收费标准算出的均匀通话费对比,是增加了,仍是减少了?若增加,多多少?若减少,少多少?思路分析在解答本题时 , 要仔细分析题中所给的条件 , 分清不一样的时间段的话费状况 , 再进一步联合所学的数学知识 , 这样就不难求出结果 .答案 :(1)0.2+0.1+0.2+2×0.1+0.2=0.9(元) ,∴D同学这日通话费是0.9 元.(2)表 2时间段频数累计频数0<t ≤323<t ≤454<t ≤525<t ≤61 (3)设这五位同学这日的本质均匀通话费为x 元,按原电话收费标准算出的均匀通话费为x元,则 x =1(2 ×0.2+5 ×0.3+2 ×0.4+0.5)=0.64,x =15(2 ×0.2+8 ×0.4)=0.72 ,5x- x =0.72-0.64=0.08(元).∴这五位同学这日的本质均匀通话费比按原电话标准算出的均匀通话费减少了0.08元.绿色通道统计的学习重在应用,要学会从本质生活之中抽取数据,办理数据,解决本质问题. 本题中关于收费方式的正确理解是解决问题的重点.。
2。
3 总体特征数的估计1.众数一组数据中重复出现次数最多的数称为这组数的众数. 2.中位数把一组数据按从小到大的顺序排列,把处于中间位置的那个数称为这组数据的中位数.当数据个数为奇数时,中位数是按从小到大的顺序排列的中间的那个数.当数据个数为偶数时,中位数是按从小到大的顺序排列的最中间两个数的平均数.3.平均数(1)若给定一组数据a 1,a2,…,a n,则称a =错误!错误!i =错误!未定义书签。
为这n 个数据的平均数或均值.(2)若一组数据中取值为a 1,a 2,…,a n 的频率分别为p1,p 2,…,p n ,则其平均数为a 1p 1+a2p 2+…+a np n .4.方差与标准差一般地,设样本数据分别是x1,x2,…,x n ,样本的平均数为错误!未定义书签。
,则称s 2=错误!未定义书签。
[(x 1-错误!未定义书签。
)2+(x 2-错误!)2+…+(x n-错误!未定义书签。
)2]为这个样本的方差,其算术平方根s=错误!未定义书签。
为样本的标准差,分别简称样本方差、样本标准差.5.极差一组数据的最大值与最小值的差称为极差.1.下面是高一(8)班十位同学的数学测试成绩:82,91,73,84,98,99, 101,118,98,110,则该组数据的中位数是________.98[将这组数据从小到大排列为73,82,84,91,98,98,99,101,110,118,则最中间的两个数为98,98,故中位数为98。
]2.在一段时间里,一个学生记录了其中10天他每天完成家庭作业所需要的时间(单位:分钟),结果如下:80,70,70,70,60,60,80,60,60,70.在这段时间里,该学生平均每天完成家庭作业所需时间是________分钟.68 [平均每天所需时间为错误!未定义书签。
=68.]3.某老师从星期一到星期五收到的信息数分别为10,6,8,5,6,则该组数据的方差s2=________.3.2[5个数据的平均数错误!未定义书签。
2.3.1 平均数及其估计[新知初探]1.平均数的概念一组数据的总和除以数据的个数所得的商就是这组数据的平均数(或均值),一般记为:a =a 1+a 2+…+a nn.[点睛](1)平均数反映了一组数据的集中趋势,它是一组数据的“重心”,是度量一组数据波动大小的基准.(2)用样本平均数可估计总体平均数.(3)用平均数可以比较两组数据的总体情况,如成绩、产量等. 2.平均数的计算(1)定义法:已知x 1,x 2,x 3,…,x n 为某样本的n 个数据,则这n 个数据的平均数为x =x 1+x 2+x 3+…+x nn.(2)利用平均数性质:如果x 1,x 2,…,x n 的平均数为x ,那么mx 1+a ,mx 2+a ,…,mx n +a 的平均数是m x +a .(3)加减常数法:数据x 1,x 2,…,x n 都比较大或比较小,且x 1,x 2,…,x n 在固定常数a 附近波动,将原数据变化为x 1±a ,x 2±a ,…,x n ±a ,新数据的平均数为x ′,则所求原数据的平均数为x ′±a .(4)加权平均数法:样本中,数据x 1有m 1个,x 2有m 2个,…,x k 有m k 个,则x =m 1x 1+m 2x 2+…+m k x km 1+m 2+…+m k.(5)频率法:一般地,若取值为x 1,x 2,…,x n 的频率分别为p 1,p 2,…,p n ,则其平均数x =p 1x 1+p 2x 2+…+p n x n .(6)组中值法:若样本为n 组连续型数据,则样本的平均数=组中值与对应频率之积的和.[小试身手]1.(江苏高考)已知一组数据4,6,5,8,7,6,那么这组数据的平均数为________. 解析:x =4+6+5+8+7+66=6.答案:62.若数据x 1,x 2,x 3,…,x n 的平均数为2,则数据2x 1-1,2x 2-1,2x 3-1,…,2x n -1的平均数为________.答案:33.数据2,2,-4,-4,-4,3,3,3,3的平均数为________. 答案:49[典例] (1)某班45名同学的年龄(单位:岁)如下: 14 15 14 16 15 17 16 15 16 16 15 15 17 13 14 15 16 16 15 14 15 15 14 15 16 17 16 15 15 15 16 15 13 16 15 15 17 14 15 16 16 15 14 15 15, 求全班的平均年龄.(2)从高三年级中抽出50名学生参加数学竞赛,由成绩得到如图所示的频率分布直方图.试利用频率分布直方图估计高三年级学生的平均成绩. [解] (1)法一:利用平均数的公式计算.x =145×(14+15+…+15)=145×684=15.2(岁).法二:利用平均数的简化公式计算. 取a =15,将已知各数减去15,得-1 0 -1 1 0 2 1 0 1 1 0 0 2 -2平均数的计算-1 0 1 1 0 -1 0 0 -1 0 1 2 1 0 0 0 1 0 -2 1 0 0 2 -1 0 1 1 0 -1 0 0x′=145×(-1+0+…+0)=145×9=0.2(岁).x=x′+a=0.2+15=15.2(岁).法三:利用加权平均数公式计算.x=145×(13×2+14×7+15×20+16×12+17×4)=145×684=15.2(岁).即全班的平均年龄是15.2岁.(2)样本平均数是频率分布直方图的“重心”,即所有数据的平均数,取每个小矩形底边的中点值乘以每个小矩形的面积再求和即可.故平均成绩为45×(0.004×10)+55×(0.006×10)+65×(0.02×10)+75×(0.03×10)+85×(0.024×10)+95×(0.016×10)=76.2.[活学活用]1.某医院的急诊中心的记录表明以往到这个中心就诊的病人需等待的时间的分布如下:则到这个中心就诊的病人平均需要等待的时间估计为________.解析:x=2.5×0.2+7.5×0.4+12.5×0.25+17.5×0.1+22.5×0.05=9.5.答案:9.52.某班进行一次考核,满分5分,3分(包括3分)以上为合格,得1分,2分,3分,4分,5分的人数占该班人数的比例分别为5%,10%,35%,40%和10%,试求该班的平均得分.解:由于本题没有给出该班同学的人数,故无法用定义法求解.而题中给出了相应分数及所占比例,故可用频率平均数公式计算.x =1×0.05+2×0.10+3×0.35+4×0.40+5×0.10=3.4,故该班的平均分数为3.4分.[典例] 若x 1,x 2,…,x n 的平均数为x ,数据y 1,y 2,…,y n 的平均数为y ,求下列几组数据的平均数.(1)2x 1,2x 2,…,2x n ;(2)kx 1+a ,kx 2+a ,…,kx n +a ; (3)x 1+y 1,x 2+y 2,…,x n +y n .[解] 据题意x =1n(x 1+x 2+x 3+…+x n ),y =1n(y 1+y 2+…+y n ),设第一组数据平均数为z ,第二组数据平均数为甲,第三组数据平均数为乙. (1)z =1n (2x 1+2x 2+…+2x n )=2·1n(x 1+x 2+…+x n )=2x ,(2)甲=1n[(kx 1+a )+(kx 2+a )+…+(kx n +a )]=1n[k (x 1+x 2+…+x n )+na ]=k ·1n(x 1+x 2+…+x n )+a =k x +a .(3)乙=1n[(x 1+y 1)+(x 2+y 2)+…+(x n +y n )]=1n [(x 1+x 2+…+x n )+(y 1+y 2+…+y n )]=1n(x 1+x 2+…+x n )+1n(y 1+y 2+…+y n )=x +y .平均数的性质[活学活用]已知数据x 1,x 2,…,x n 的平均数为12,数据y 1,y 2,y 3,…,y n 的平均数为2,则数据2x 1+3,2x 2+3,…,2x n +3的平均数为________,数据ax 1+by 1,ax 2+by 2,…,ax n +by n 的平均数为________.答案:4 12a +2b层级一 学业水平达标1.已知1,2,3,4,a ,b ,c 的平均数是8,则a +b +c =________. 解析:据题意17(1+2+3+4+a +b +c )=8,∴a +b +c =46. 答案:462.已知2,4,2x,4y 四个数的平均数是5,而5,7,4x,6y 四个数的平均数是9,则xy 的值是________.解析:据题意⎩⎪⎨⎪⎧14+4+2x +4y =5,14+7+4x +6y =9,解之得⎩⎪⎨⎪⎧x =3,y =2.∴xy =6. 答案:63.在一次知识竞赛中,抽取40名选手,成绩分布如下:则选手的平均成绩是________.解析:x =140(6×2+7×5+8×7+9×11+10×15)=8.8.答案:8.81. 一位同学种了甲、乙两种树苗各1株,分别观察了9次、10次后,得到树苗高度的数据的茎叶图如图(单位:厘米).则甲种树苗高度平均为________;乙种树苗的高度平均为________;甲、乙两种树苗高度平均为________.解析:根据茎叶图可得,观察甲树苗9次得到的树苗高度分别为:14,20,21,23,24,30,32,33,37;观察乙树苗10次得到的树苗高度分别为:10,11,14,24,26,30,44,46,46,47,易得甲树苗高度平均为2349=26,乙树苗高度平均为29810=29.8,甲、乙两种树苗高度平均为119(234+298)=28.答案:26 29.8 285.50名同学参加数学竞赛,成绩的分组及各组的频数如下:(单位:分)[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.列出样本的频率分布表并求这50名同学的平均分.解:频率分布表如下:法一:总成绩约为45×2+55×3+65×10+75×15+85×12+95×8=3 810(分),故50名同学的数学平均分约为3 810÷50=76.2(分).法二:求组中值与对应频率之积的和.45×0.04+55×0.06+65×0.2+75×0.3+85×0.24+95×0.16=76.2(分).层级二应试能力达标1.某同学使用计算器求30个数据的平均数时,错将其中一个数据105输入为15,那么由此求出的平均数与实际平均数的差是________.答案:-32.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是________.答案:91.5,91.53.一个企业,30%的员工年收入为1万元,65%的员工年收入为3万元,5%的员工年收入为11万元,则这个企业员工的年平均收入是________万元,年收入的中位数是________万元.解析:年平均收入为1×0.3+3×0.65+11×0.05=2.8,中位数为3. 答案:2.8 34.已知x 是x 1,x 2,…,x 100的平均数,a 是x 1,x 2,…,x 40的平均数,b 是x 41,x 42,…,x 100的平均数,则下列各式正确的是________.(填序号)①x =40a +60b 100;②x =60a +40b100;③x =a +b ;④x =a +b2.答案:①5.已知数据x 1,x 2,…,x 8的平均数为6,则数据2x 1-6,2x 2-6,…,2x 8-6的平均数为________. 答案:66.已知样本数据x 1,x 2,…,x n 的平均数为h ,y 1,y 2,…,y m 的平均数为k ,则把两组数据合并成一组以后,这组样本的平均数为____________.答案:nh +mk n +m7.一个高中研究性学习小组对本地区2014年至2016年快餐公司发展情况进行了调查,制成了该地区快餐公司个数情况的条形图和快餐公司盒饭年销售量的平均数情况条形图(如图),根据图中提供的信息可以得出这三年中该地区每年平均销售盒饭________万盒.解析:2014年:30×1.0=30(万),2015年:45×2.0=90(万),2016年:90×1.5=135(万),x =13(30+90+135)=85(万).答案:858.某餐厅共有7名员工,所有员工的工资情况如下表:解答下列问题:(1)餐厅所有员工的平均工资是________.(2)所有员工工资的中位数是________.(3)用平均数还是用中位数描述该餐厅员工工资的一般水平比较恰当?________.(4)去掉经理的工资后,其他员工的平均工资是________,是否也能反映该餐厅员工工资的一般水平?________.(填“能”或“不能”)解析:(1)平均工资为(3 000+700+500+450+360+340+320)÷7=810.(2)由表格可知中位数为450.(3)用中位数描述该餐厅员工工资的一般水平比较恰当.(4)去掉经理的工资后,其他员工的平均工资为(700+500+450+360+340+320)÷6=445.平均工资能反映该餐厅员工工资的一般水平.答案:(1)810 (2)450 (3)中位数(4)445 能9.为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A 药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.52.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4服用B药的20位患者日平均增加的睡眠时间:3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.41.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?(2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?解:(1)设A 药观测数据的平均数为x ,B 药观测数据的平均数为y . 由观测结果可得x =120×(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3,y =120×(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6.由以上计算结果可得x >y ,因此可看出A 药的疗效更好. (2)由观测结果可绘制如下茎叶图:以上茎叶图可以看出,A 药疗效的试验结果有710的叶集中在茎2,3上,而B 药疗效的试验结果有710的叶集中在茎0,1上,由此可看出A 药的疗效更好.10.有一组数据:x 1,x 2,…,x n (x 1<x 2<…<x n )的算术平均数为10,若去掉其中最大的一个,余下数据的算术平均数为9;若去掉其中最小的一个,余下数据的算术平均数为11.(1)求出第一个数x 1关于n 的表达式及第n 个数x n 关于n 的表达式;(2)若x 1,x 2,…,x n 都是正整数,试求第n 个数x n 的最大值,并举出满足题目要求且x n 取到最大值的一组数据.解:(1)依条件得⎩⎪⎨⎪⎧x 1+x 2+…+x n =10n , ①x 1+x 2+…+x n -1=n -, ②x 2+x 3+…+x n =n -, ③由①-②得x n =n +9.又由①-③得x 1=11-n .(2)由于x 1是正整数,故x 1=11-n ≥1⇒1≤n ≤10,故x n =n +9≤19.当n =10时,x 1=1,x 10=19,x 2+x 3+…+x 9=80,此时,x 2=6,x 3=7,x 4=8,x 5=9,x 6=11,x 7=12,x 8=13,x 9=14.。
总体特征数的估计教学目标:1、理解为什么能用样本数据的平均值估计总体的水平。
初步了解如何动用数学知识和方法进行统计研究,提高统计的准确性利税学。
感受统计不仅是列表、画图的低层次的工作,而且是一门具有高度科学性的理论与实际相结合的学科。
2、掌握从实际问题中提取数据,利用样本数据计算其平均值,并对总体水平作出估计的方法。
3、通过对数据的分析与估计,培养学生的理性思维能力。
教学重点:利用平均数和组中值对样本数据进行分析和估计。
教学难点:最小二乘法的思维过程的理解。
教学过程:课堂引入:在2.2节中,我们通过列频率分布表、画频率分布直方图、条形图、折线图、密度曲线和茎叶图来对数据从分布规律角度进行分析和估计,发现数据的规律。
从本节起,我们利用上节的相同背景问题,从不同的角度提取数量规律进行分析和估计。
我们从天气预报中常见的“月平均气温”、“年平均气温”等概念,对某季篮球联赛中队员得分情况统计,也常利用“平均得分”,成绩统计中,也利用“平均分”等,都涉及到“平均数”的概念。
初中我们曾经学过众数、中位数、平均数等各种数字特征,这些数字都能为我们提供关于样本数据的特征信息。
学生思考:在频率直方图中,众数是指最高矩形的中点的横坐标,中位数是指样本数据中累积频率为0.5时所对应的样本数据值,平均数是指样本数据的算术平均数。
定义:能反映总体某种特征的量称为总体特征数思考:怎样通过抽样的方法,用样本的特征数估计总体的特征数呢?新课讲授§2.3.1平均数及其估计课本P50页引例:我们可以计算7月25日至8月10日平均气温为34.02度,8月8日至8月24日的平均气温为30.02度。
学生自学、讨论课本引例,教师引导,适当提示分析最小二乘法的思维过程。
注意以下两点:(1)n 个实数a1,a2,a3,……,an 的和简记为∑=ni ia1;(2)n a a a a n+++=......21称为这n 个实数a1,a2,a3,……,an 的平均数或均值。
2.3 .1均匀数及其预计事例研究抽查了地域内100 名年纪为17.5~18岁的男为了认识某地域高三学生的身体发育状况,生的体重状况 , 结果以下(单位:kg )56.569.56561.564.566.56464.57658.57273. 556677057.565.56871756268.562. 56659.563. 564.567.57368557266.574636055.57064.5586470.55762. 5656971. 573625876716663.55659.563.5657074.568.56455.572. 566.5687657.56071.55769.57464.55961. 5676863. 5585965.562. 569.57264.575.568.5646265.558.567.570.5656666.5706359.5依据上述数据我们能够画出样本的频次散布直方图, 并对相应的整体散布作出预计 .因为图中各小长方形的面积等于相应各组的频次,这个图形的面积反应了数据落在各个小组的频次的大小. 在获取了样本的频次后,就能够对相应的整体状况作出预计. 比如从这些样本数据的频次散布直方图能够看出,体重在(64.5 , 66.5 ) kg 的学生比体重为其余值的学生数多,但他并无告诉我们多多少.试问:如何将各个样本数据汇总为一个数值,并使它成为样本数据的“中心点”?可否用一个数值来描绘样本数据的失散程度?初中我们以前学过众数、中位数、均匀数等各样数字特色. 应当说,这些数字都能够为我们供给对于样本数据的特色信息.我们常用算术均匀数1 n a i (此中 a i (i=1,2, ,n )为 n 个实验数据)作为体重的最n i 1理想的近似值,它的依照是什么呢?办理实验数据的原则是使这个近似值与实验数据之间的离差最小,设这个近似值为x ,那么它与 n 个实验值 a i (i=1,2,,n )的离差分别为x - a 1, x - a 2, x - a 3, ,x - a n . 因为上述离差有正有负,故不宜直接相加. 能够考虑将各个离差的绝对值相加,研究|x-a |+|x-a 2|+ +|x -a | 取最小值时 x 的值 . 但因为含有绝对值,运算不太方便,所以,考1n虑离差的平方和,即( x - a 1)2+( x - a 2) 2+ +( x - a n ) 2,当此和最小时,对应的x 的值作为近似值 . 因为( x - a 1)2+( x - a 2) 2+ +( x - a n ) 2= nx 2-2( a 1+ a 2+ + a n ) x+a 1 2+a 2 2+ +a n 2,所以当 x=(a 1a 2a n )时离差的平方和最小, 故可用( a 1a 2a n )作为表nn示体重的理想近似值, 称其为这 n 个数据 a 1,a 2, ,a n 的均匀数 ( average )或均值 ( mean ),一般记为 x =(a 1a 2a n ) .n这样,我们能够用计算器求得,该地域内100 名年纪为 17.5 ~ 18 岁的男生的体重的最佳近似值为 x = 65.5 ( kg ) .这样我们就获取了样本均匀数的求解方法:样本数据的算术均匀数,即 x =( x 1x 2x n ).nExcel 中函数“ AVERAGE ( )”可直接用于计算给定数据的均匀数 . 如求 12,12.4,12.8,13, 12. 2, 12. 8, 12. 3, 12. 5, 12. 5 的均匀数,可直接把它们输到工作表中 A1∶J1地区后, 在某空白单元格中输入“= AVERAGE (A1∶H1) ”即可, 即得它们的均匀数为 12.5(以以下图) .自学导引1 .在频次散布直方图中,众数是指最高矩形的中点的横坐标,中位数是指样本数据中 积累频次为 0.5 时所对应的样本数据值,均匀数是指样本数据的算术均匀数.2 .以下数字特色必定是数据组中数据的是()A .众数B .中位数C .标准差D.均匀数答案: A3 .数据:1, 1, 3, 3 的众数和中位数分别是()A .1或 3,2B.3,2C .1或 3,1或3D.3,3答案: A4.频次散布直方图的重心是()A.众数B.中位数C.标准差D.均匀数答案: D疑难分析【例 1】某校高一年级的甲、乙两个班级(均为50 人)的语文测试成绩以下:(总分:150)甲班: 112861068410010598102941078711294949990 1209895119 1081009611511110495108111105 104107119 107931029811211299 92102938494941009084114乙班: 11695109961069810899110103 9498105101115 10411210111396 10810011098107 8710810610397107106 111121 97107114122101107 107111114 10610410495111 111110试确立此次考试中,哪个班的语文成绩更好些.思路分析:我们可用一组数据的均匀数权衡这组数据的水平,所以,分别求得甲、乙两个班级的均匀分即可 .分析:用科学计算器或计算机分别求得甲班的均匀分为101.1,乙班的均匀分为105.4 ,故此次考试乙班成绩要好于甲班 .【例 2】某教师出了一份共 3 道题的测试卷,每题 1 分,全班得3分、2分、1分和 0分的学生所占比率分别为0.3 、 0.5 、 0.1和 0.1.(1)若全班共 10 人,则均匀分是多少?(2)若全班共 20 人,则均匀分是多少?(3)若该班人数未知,能求出该班的均匀分吗?思路分析:上述所占比率就是各数据的频次.解:由题意,均匀分= 3×0.3 +2×0.5 +1×0.1 = 2.答:全班的均匀分为 2 分.思想启迪:各数据频次确准时,均匀数不受样本容量的影响.【例 3】某工厂人员及薪资组成以下表:人员经理管理人员高级技工工人学徒共计周薪资 2 200250220200100人数16510123共计 2 200 1 500 1 100 2 000100 6 900(1)指出这个问题中周薪资的众数、中位数、均匀数;(2)这个问题中,均匀数能客观地反应当工厂的薪资水平吗?为何?思路分析:依据众数、中位数、均匀数各自的特色,选择适合的数据反应当厂的薪资水平.分析:由表格可知:众数=200,∵23 的中间地点众数是 12,∴中位数= 220.均匀数 =( 2 200+1 500+1 100+2 000+100)÷ 23=300.固然均匀数为300 元 / 周,但由表格中所列出的数据可见,只有经理在均匀数以上,其余的人都在均匀数以下,故用均匀数不可以客观真切地反应当工厂的薪资水平.这时平思想启迪:均匀数受数据中的极端值的影响较大,阻碍了对整体预计的靠谱性,均数反而不如众数、中位数更能反应客观状况.拓展迁徙【拓展点1】过去的招生统计数据显示,某大学录取的重生高考总分的中位数基本上稳固在 550 分 . 你的一位校友在今年的高考取得了520 分,你是立刻劝止他报考这所大学,仍是先查阅一下这所大学招生的其余信息?解说一下你的选择.提示:应当查阅一下这所大学的其余招生信息,比如均匀信息、最低录取分数线信息等,只管该校友的分数位于中位数之下,而中位数自己其实不可以供给更多录取分数散布的信息. 在已知最低录取分数线的状况下,很简单作出判断;在已知均匀数的状况下,假如均匀数小于中位数好多,则说明最低录取分数线较低,能够介绍该校友报考这所大学,不然还要获取其他的信息(如标准差的信息)来作出判断.【拓展点2】在一次人材招聘会上,有一家企业的招聘员告诉你,“我们企业的收入水平很高”,“昨年,在50 名员工中,最高年收入达到了100 万,他们年收入的均匀数是3.5 万” . 假如你希望获取年薪 2.5 万元,( 1)你能否能够判断自己能够成为此企业的一名高收入者?( 2)假如招聘员持续告诉你 , “员工收入的变化范围是从0.5 万到 100 万”,这个信息能否足以使你作出自己能否受聘的决定?为何?( 3)假如招聘员持续给你供给了以下信息,员工收入的中间0.5 (即去掉最少的0.25和最多的0.25 后所剩下的)的变化范围是 1 万到 3 万,你又该如何使用这条信息来作出是否受聘的决定?( 4)你能预计出收入的中位数是多少吗?为何均值比预计出的中位数高好多?答案:( 1)不可以,因为均匀收入和最高收入相差太多,说明高收入的员工只占很少量.此刻已经知道至罕有一个人的收入为x50=100万元,那么其余员工的收入之和为49x i=3.5× 50-100=75 (万元),每人均匀只有 1.53万元.假如再有几个收入特别高者,i 1那么初进企业的员工的薪资会更低.( 2)企业的员工的收入将会很低.( 3)能够确立有0.75 的员工薪资在 1 万元以上,此中 0.25 的员工薪资在 3 万元以上 .(4)收入的中位数大概是 2 万元 . 因为有年收入 100 万这个极端值的影响,使得年均匀收入比中位数高很多 .。
平均数及其估计教学目标(1)理解为什么能用样本数据的平均值估计总体的水平;(2)初步了解如何运用数学知识和方法进行统计研究,提高统计的准确性和科学性;(3)掌握从实际问题中提取数据,利用样本数据计算其平均值,并对总体水平作出估计的方法.教学重点掌握从实际问题中提取数据,利用样本数据计算其平均值,并对总体水平作出估计的 方法.教学难点能应用相关知识解决简单的实际问题.教学过程一、问题情境1.情境:某校高一(1)班同学在老师的布置下,用单摆进行测试,以检查重力加速度.全班同学两人一组,在相同条件下进行测试,得到下列实验数据(单位:2/s m )9.62 9.54 9.78 9.94 10.01 9.66 9.88 9.68 10.329.76 9.45 9.99 9.81 9.56 9.78 9.72 9.93 9.949.65 9.79 9.42 9.68 9.70 9.84 9.902.问题:怎样利用这些数据对重力加速度进行估计?二、学生活动 我们常用算术平均数∑=ni i a n 11(其中),2,1(n i a i ,⋯=为n 个实验数据)作为重力加速度的“最理想”的近似值,它的依据是什么呢?处理实验数据的原则是使这个近似值与实验数据之间的离差最小.设这个近似值为x ,那么它与n 个实验值),,2,1(n i a i ⋯=的离差分别为1a x -,2a x -,3a x -,…,n a x -.由于上述离差有正有负,故不宜直接相加.可以考虑离差的平方和,即22221)()()(n a x a x a x -+⋯+-+-=22221212)(2nn a a a x a a a nx ⋯+++⋯++-, 所以当na a a x n ⋯++=21时,离差的平方和最小, 故可用n a a a n ⋯++21作为表示这个物理量的理想近似值. 三、建构数学1.平均数最能代表一个样本数据的集中趋势,也就是说它与样本数据的离差最小;2.数据12,,,n a a a ⋯的平均数或均值,一般记为na a a a n ⋯++=21__; 3.若取值为12,,,n x x x ⋯的频率分别为12,,,n p p p ⋯,则其平均数为1122n n x x p x p x p =+++….四、数学运用1.例题:例1.某校高一年级的甲、乙两个班级(均为50人)的语文测试成绩如下(总分:150分),试确定这次考试中,哪个班的语文成绩更好一些.甲班112 86 106 84 100 105 98 102 94 10787 112 94 94 99 90 120 98 95 119108 100 96 115 111 104 95 108 111 105104 107 119 107 93 102 98 112 112 9992 102 93 84 94 94 100 90 84 114乙班116 95 109 96 106 98 108 99 110 10394 98 105 101 115 104 112 101 113 96108 100 110 98 107 87 108 106 103 97107 106 111 121 97 107 114 122 101 107107 111 114 106 104 104 95 111 111 110分析:我们可用一组数据的平均数衡量这组数据的集中水平,因此,分别求出甲、乙两个班的平均分即可.解:用计算器分别求出甲班的平均分为101.1, 乙班的平均分为105.4,故这次考试乙班成绩要好于甲班.分析:要确定这100名学生的平均睡眠时间,就必须计算其总睡眠时间,由于每组中的个体睡眠时间只是一个范围,可以用各组区间的组中值近似地表示.解法1:总睡眠时间约为6.25×5+6.75×17+7.25×33+7.75×37+8.25×6+8.75×2=7.39(h ) 故平均睡眠时间约为7.39h .解法2:求组中值与对应频率之积的和6.25×0.05+6.75×0.17+7.25×0.33+7.75×0.37+8.25×0.06+8.75×0.02=7.39(h )答:估计该校学生的日平均睡眠时间约为7.39h .例3.某单位年收入在10 000到15 000、15 000到20 000、20 000到25 000、25 000到30 000、30 000到35 000、35 000到40 000及40 000到50 000元之间的职工所占的比分别为10%,15%,20%,25%,15%,10%和5%,试估计该单位职工的平均年收入.分析:上述百分比就是各组的频率.解:估计该单位职工的平均年收入为12 500×10%+17 500×15%+22 500×20%+27 500×25%+32 500×15%+37 500×10%+45 000×5%=26125(元)答:估计该单位人均年收入约为26125元.2.练习:(1)第66页练习第2,3,4 ;(2) 若M 个数的平均数是X ,N 个数的平均数是Y ,则这M N +个数的平均数是 MX NY M N++;(3)如果两组数12,,,n x x x ⋯和12,,,n y y y ⋯的样本平均数分别是x 和y ,那么一组数1122,,,n n x y x x y ++⋯+的平均数是2x y + . 五、回顾小结:1.能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(平均数),会用样本的基本数字特征估计总体的基本数字特征;2.平均数对数据有“取齐”的作用,代表一组数据的平均水平;3.形成对数据处理过程进行初步评价的意识.六、课外作业:课本第69页第1、2、4、6题.。
江苏省泰兴中学高二数学讲义(59)
总体特征数的估计
【教学目标】
1、会用样本平均数估计总体期望值;
2、会用公式计算样本方差、标准差.
【重点难点】
重点:样本平均数、方差、标准差的计算
难点:用方差估计总体波动的大小
【例题分析】
例1、某校高二年级进行一次数学测试,抽取40人,算出其平均成绩为80分,为准确起见,后来又抽取50人,算出其平均成绩为83分,通过两次抽样的结果,估计这次数学测试的平均成绩.
例2、下面是某校学生日睡眠时间的频率分布表(单位:h),估计该校学生的日平均睡眠时间.
例3、某单位收入在10000到15000、15000到20000,20000到25000、25000到30000、
35000、
35000到
40000及
40000到50000之间的职工所占的比为10%,15%,20%,25%,15%,10%,5%,试估计该单位职工的平均收入.
例4、设甲、乙两名射手各打10发子弹,每发子弹击中环数如下:
甲:10,6,9,10,8,7,9,10,5,10
乙:7,7,8,10,9,8,7,9,10,9
试问哪一名射手的射击技术较好?
例5、某班40人随机平均分成两组,两组学生一次考试的成绩情况如下表:
求全班的平均分、方差、标准差.
[学后反思]
1、总体期望值即_________ .
2、样本方差2S = ;样本标准差S = . 方差和标准差是反映________________的特征数;方差越小,其总体的波动性
[巩固练习]
1、某车间一周里加工一种零件的日产量,有2天是35件,有1天是41件,有4天是37件,这周的平均日产量是
2、若M 个数的平均数是X, N 个数的平均数是Y,则这M+N 个数的平均数是
3、已知数据n x x x ,,,21 的平均数5=x ,方差42=S ,则数据
73,,73,7321+++n x x x 的平均数和标准差分别为
4、甲、乙两人在同样的条件下各射靶10次,各次命中的环数如下:甲:7,8,6,8,5,9,10,7,4,6;乙:9,5,7,8,7,6,8,6,7,7,这两人射击成绩比较稳定的是
5、一个水库成活了某种鱼5000条,从中捕捞了10条,称得它们的质量分别是(单位:斤):2.6, 2.1, 2.4, 2.5, 2.2, 2.3, 2.5, 2.8, 2.3, 2.5,估计里共有这种鱼 斤
6、已知样本数据1021,,,x x x ,其中321,,x x x 的平均数为a ,1054,,,x x x 的平均数为b ,
则样本数据的平均数为__________________.
7、车间甲、乙两班工人都加工一种轴,轴的直径要求200.5±mm ,现从两班所生产的轴中各取10件加以检验,测得数据如下:。