高中数学第二章统计2_2用样本估计总体2_2_2用样本的数字特征估计总体的数字特征教学案
- 格式:doc
- 大小:448.00 KB
- 文档页数:12
高中数学 第二章 统计 2.2.2 用样本的数字特征估计总体的数字特征预习导航 新人教B 版必修31.通过随机抽样,会用样本平均数估计总体平均数,会用样本标准差估计总体标准差.2.掌握几个数据的标准差及方差的计算方法,理解数据标准差的意义和作用.1.众数、中位数、平均数(1)在一组数据中,出现次数最多的数据叫做这组数据的众数.(2)将一组数据按大小依次排列,把处在中间位置的一个数据(或中间两个数据的平均数)叫做这组数据的中位数.(3)如果有n 个数x 1,x 2,x 3,…,x n ,那么x =1n(x 1+x 2+…+x n ),叫做这n 个数的平均数. 总体中所有个体的平均数叫做总体平均数. 样本中所有个体的平均数叫做样本平均数.【做一做1】10名工人某天生产同一零件,生产的件数分别是15,17,14,10,15,17,17,16,14,12.设平均数为a ,中位数为b ,众数为c ,则有( )A .a <b <cB .a >b >cC .a <c <bD .c >a >b解析:众数c =17,中位数b =15,平均数a =110×(10+12+14×2+15×2+16+17×3)=14.7,所以a <b <c .答案:A2.样本方差、样本标准差 数据的离散程度可以用极差、方差或标准差来描述.我们知道,样本方差描述了一组数据围绕平均数波动的大小.一般地,设样本的元素为x 1,x 2,…,x n ,样本的平均数为x ,定义s 2=1-x 2+2-x 2+…+n -x 2n , s =1-x 2+2-x2+…+n -x 2n . 其中s 2表示样本方差,s 表示样本标准差.归纳总结 因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差.【做一做2-1】 样本101,98,102,100,99的标准差为( )A . 2B .0C .1D .2解析:样本平均数x =15×(101+98+102+100+99)=100,方差s 2=15×[(101-100)2+(98-100)2+(102-100)2+(100-100)2+(99-100)2]=2, ∴s=2.答案:A【做一做2-2】 若k 1,k 2,…,k 6的方差为3,则2(k 1-3),2(k 2-3),…,2(k 6-3)的方差为__________.解析:设k 1,k 2,…,k 6的平均数为k ,则16[(k 1-k )2+(k 2-k )2+…+(k 6-k )2]=3, 而2(k 1-3),2(k 2-3),…,2(k 6-3)的平均数为2(k -3),则所求方差为16[4(k 1-k )2+4(k 2-k )2+…+4(k 6-k )2]=4×3=12.答案:12。
2.2.2 用样本的数字特征估计总体的数字特征(1)如何根据样本数据的频率分布直方图,分别估计总体的众数、中位数和平均数?(2)如何理解众数、中位数、平均数与极端数据的关系?(3)平均数向我们提供了样本数据的重要信息,平均数会使我们作出对总体的片面判断吗?(4)方差、标准差有什么区别与联系?[新知初探]1.众数、中位数、平均数的概念(1)众数:一组数据中出现次数最多的数.(2)中位数:一组数据按大小顺序排列后,处于中间位置的数.如果个数是偶数,则取中间两个数据的平均数.(3)平均数:一组数据的和除以数据个数所得到的数.2.三种数字特征的比较名称优点缺点众数①体现了样本数据的最大集中点;②容易计算①它只能表达样本数据中很少的一部分信息;②无法客观地反映总体的特征中位数①不受少数几个极端数据(即排序靠前或靠后的数据)的影响;对极端值不敏感预习课本P3~6,思考并完成以下问题3.标准差、方差的概念与计算公式 (1)标准差:标准差是样本数据到平均数的一种平均距离,一般用s 表示,s = 1n[ x 1-x 2+ x 2-x 2+…+ x n -x 2].(2)方差:标准差的平方s 2叫做方差.s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中,x n 是样本数据,n 是样本容量,x 是样本平均数. [点睛](1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.(2)标准差、方差的取值范围:[0,+∞).标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性.[小试身手]1.下列说法不正确的是( ) A .方差是标准差的平方 B .标准差的大小不会超过极差C .若一组数据的值大小相等,没有波动变化,则标准差为0D .标准差越大,表明各个样本数据在样本平均数周围越集中;标准差越小,表明各个样本数据在样本平均数周围越分散解析:选D 标准差越小,表明各个样本数据在样本平均数周围越集中;标准差越大,表明各个样本数据在样本平均数的周围越分散.2.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a ,中位数为b ,众数为c ,则有( )A .a >b >cB .b >c >aC .c >a >bD .c >b >a解析:选D 将数据从小到大排列为10,12,14,14,15,15,16,17,17,17,则平均数a =110(10+12+14×2+15×2+16+17×3)=14.7,中位数b =15,众数c =17, 显然a <b <c ,选D.3.奥运会体操比赛的计分规则为:当评委亮分后,其成绩先去掉一个最高分,去掉一个最低分,再计算剩下分数的平均值,这是因为( )A .减少计算量B .避免故障C .剔除异常值D .活跃赛场气氛解析:选C 因为在体操比赛的评分中使用的是平均分,记分过程中采用“去掉一个最高分,去掉一个最低分”的方法,就是为了防止个别裁判的人为因素给出过高或过低的分数对选手的得分造成较大的影响,从而降低误差,尽量公平.4.样本中共有五个个体,其值分别为a,0,1,2,3,若该样本的平均值为1,则样本方差为________.解析:由题意知15(a +0+1+2+3)=1,解得a =-1.所以样本方差为s 2=15[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.答案:2[典例] (单位:岁):甲群:13,13,14,15,15,15,15,16,17,17; 乙群:54,3,4,4,5,6,6,6,6,56.(1)甲群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映甲群市民的年龄特征?(2)乙群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映乙群市民的年龄特征?[解] (1)甲群市民年龄的平均数为13+13+14+15+15+15+15+16+17+1710=15(岁),中位数为15岁,众数为15岁.平均数、中位数和众数相等,因此它们都能较好地反映甲群市民的年龄特征. (2)乙群市民年龄的平均数为54+3+4+4+5+6+6+6+6+5610=15(岁),中位数为6岁,众数为6岁.由于乙群市民大多数是儿童,所以中位数和众数能较好地反映乙群市民的年龄特征,而平均数的可靠性较差.平均数、众数、中位数的计算方法平均数一般是根据公式来计算的;计算众数、中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据各自的定义计算.[活学活用](广东高考)已知样本数据x 1,x 2,…,x n 的均值x =5,则样本数据2x 1+1,2x 2+1,…,2x n +1的均值为________.解析:由条件知x =x 1+x 2+…+x n n =5,则所求均值x 0=2x 1+1+2x 2+1+…+2x n +1n=2 x 1+x 2+…+x n +nn=2x +1=2×5+1=11.答案:11标准差(方差)的计算及应用[典例] 甲:8,6,7,8,6,5,9,10,4,7; 乙:6,7,7,8,6,7,8,7,9,5.(1)分别计算以上两组数据的平均数; (2)分别求出两组数据的方差;(3)根据计算结果,估计两名战士的射击情况.若要从这两人中选一人参加射击比赛,选谁去合适?[解] (1)x 甲=110×(8+6+7+8+6+5+9+10+4+7)=7(环),x 乙=110×(6+7+7+8+6+7+8+7+9+5)=7(环).(2)由方差公式s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],得s 2甲=3,s 2乙=1.2.(3)x 甲=x 乙,说明甲、乙两战士的平均水平相当.又s2甲>s2乙,说明甲战士射击情况波动比乙大.因此,乙战士比甲战士射击情况稳定.从成绩的稳定性考虑,应选择乙参加比赛.计算标准差的5步骤(1)求出样本数据的平均数x.(2)求出每个样本数据与样本平均数的差x i-x(i=1,2,…,n).(3)求出x i-x(i=1,2,…,n)的平方值.(4)求出上一步中n个平方值的平均数,即为样本方差.(5)求出上一步中平均数的算术平方根,即为样本标准差.[活学活用]从甲、乙两种玉米的苗中各抽10株,分别测它们的株高如下:(单位:cm)甲:25 41 40 37 22 14 19 39 21 42;乙:27 16 44 27 44 16 40 40 16 40.问:(1)哪种玉米的苗长得高?(2)哪种玉米的苗长得齐?解:(1)x甲=110(25+41+40+37+22+14+19+39+21+42)=110×300=30(cm),x乙=110(27+16+44+27+44+16+40+40+16+40)=110×310=31(cm).所以x甲<x乙.即乙种玉米苗长得高.(2)s2甲=110[(25-30)2+(41-30)2+(40-30)2+(37-30)2+(22-30)2+(14-30)2+(19-30)2+(39-30)2+(21-30)2+(42-30)2]=110(25+121+100+49+64+256+121+81+81+144)=110×1 042=104.2(cm2),s2乙=110[2×(27-31)2+3×(16-31)2+2×(44-31)2+3×(40-31)2]=110×1 288=128.8(cm2).所以s2甲<s2乙.即甲种玉米苗长得齐.[典例] 某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.(1)求这次测试数学成绩的众数; (2)求这次测试数学成绩的中位数. [解] (1)由题图知众数为70+802=75.(2)由题图知,设中位数为x ,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,0.3+0.4>0.5,因此中位数位于第四个矩形内,得0.1=0.03(x -70),所以x ≈73.3.众数、中位数、平均数与频率分布直方图的关系[活学活用]为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量得到频率分布直方图如图,则(1)这20名工人中一天生产该产品数量在[55,75)的人数是________.(2)这20名工人中一天生产该产品数量的中位数为________. (3)这20名工人中一天生产该产品数量的平均数为________. 解析:(1)在[55,75)的人数为(0.040×10+0.025×10)×20=13. (2)设中位数为x ,则0.2+(x -55)×0.04=0.5,x =62.5. (3)0.2×50+0.4×60+0.25×70+0.1×80+0.05×90=64. 答案:(1)13 (2)62.5 (3)64[层级一 学业水平达标]1.甲、乙两名篮球运动员在某几场比赛中得分的茎叶图如图所示,则甲、乙两人这几场比赛得分的中位数之和是( )A .63B .64C .65D .66解析:选 A 甲、乙两人在这几场比赛中得分的中位数分别是36和27,则中位数之和是36+27=63.2.下列说法中,不正确的是( ) A .数据2,4,6,8的中位数是4,6 B .数据1,2,2,3,4,4的众数是2,4C .一组数据的平均数、众数、中位数有可能是同一个数据D .8个数据的平均数为5,另3个数据的平均数为7,则这11个数据的平均数是8×5+7×311解析:选A 数据2,4,6,8的中位数为4+62=5,显然A 是错误的,B 、C 、D 都是正确的.故选A.3.已知一组数据,现将每个数据都加上m ,则新的一组数据的平均数与原来一组数的平均数相比( )A .扩大到m 倍B .增加m 倍C .数值不变D .增加m解析:选D 设原来一组数据为x 1,x 2,…,x n ,平均数x ,那么加上m 后得到的一组新数据为x 1+m ,x 2+m ,…,x n +m ,其平均数x ′=m +x 1+x 2+…+x nn=m +x .故答案为D.4.如图是一次考试结果的统计图,根据该图可估计,这次考试的平均分数为( )A .46B .36C .56D .60解析:选A 根据题中统计图,可估计有4人成绩在[0,20)之间,其考试分数之和为4×10=40;有8人成绩在[20,40)之间,其考试分数之和为8×30=240;有10人成绩在[40,60)之间,其考试分数之和为10×50=500;有6人成绩在[60,80)之间,其考试分数之和为6×70=420;有2人成绩在[80,100)之间,其考试分数之和为2×90=180,由此可知,考生总人数为4+8+10+6+2=30,考试总成绩为40+240+500+420+180=1 380,平均数为1 38030=46.5.某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.求:(1)高一参赛学生的成绩的众数、中位数; (2)高一参赛学生的平均成绩. 解:(1)由图可知众数为65, ∵第一个小矩形的面积为0.3,∴设中位数为60+x ,则0.3+x ×0.04=0.5,得x =5, ∴中位数为60+5=65.(2)依题意,平均成绩为55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67, 故平均成绩约为67.[层级二 应试能力达标]1.如图为甲、乙两名篮球运动员每场比赛得分情况的茎叶图,则甲和乙得分的中位数的和是( )A .56分B .57分C .58分D .59分解析:选B 易得甲得分的中位数是32,乙得分的中位数是25,其和为32+25=57. 2.在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为( )A .9.4,0.484B .9.4,0.016C .9.5,0.04D .9.5,0.016解析:选D x =9.4×3+9.6+9.75=9.5,s 2=15(0.12×4+0.22)=0.016.3.如图,样本A 和B 分别取自两个不同的总体,它们的样本平均数分别为x A 和x B ,样本标准差分别为s A 和s B ,则( )A.x A >x B ,s A >s BB.x A <x B ,s A >s BC.x A >x B ,s A <s BD.x A <x B ,s A <s B解析:选B 由图易得x A <x B ,又A 波动性大,B 波动性小,所以s A >s B .4.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为m e ,众数为m 0,平均值为x ,则( )A .m e =m 0=xB .m e =m 0<xC .m e <m 0<xD .m 0<m e <x解析:选D 由题目所给的统计图可知,30个数据按大小顺序排列好后,中间两个数为5,6,故中位数为m e =5+62=5.5.又众数为m 0=5,平均值x =130(3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×2)=17930,∴m 0<m e <x .5.五个数1,2,3,4,a 的平均数是3,则a =________,这五个数的标准差是________. 解析:由1+2+3+4+a5=3,得a =5;由s 2=15[(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2]=2,得标准差s = 2.答案:526.某医院急救中心随机抽取20位病人等待急诊的时间记录如下表:用上述分组资料计算出病人平均等待时间的估计值x =________. 解析:x =120(2.5×4+7.5×8+12.5×5+17.5×2+22.5×1)=9.5.答案:9.57.某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4. 则:(1)平均命中环数为________; (2)命中环数的标准差为________.解析:(1)x =110(7+8+7+9+5+4+9+10+7+4)=7.(2)s 2=110[(7-7)2+(8-7)2+(7-7)2+(9-7)2+(5-7)2+(4-7)2+(9-7)2+(10-7)2+(7-7)2+(4-7)2]=4,所以s =2. 答案:(1)7 (2)28.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表).(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?解:(1)频率分布直方图如图所示:(2)质量指标值的样本平均数为:x=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为:s2=(80-100)2×0.06+(90-100)2×0.26+(100-100)2×0.38+(110-100)2×0.22+(120-100)2×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.9.(广东高考)某工厂36名工人的年龄数据如下表.到的年龄数据为44,列出样本的年龄数据.(2)计算(1)中样本的均值x 和方差s 2.(3)36名工人中年龄在x -s 与x +s 之间有多少人?所占的百分比是多少(精确到0.01%)?解:(1)36人分成9组,每组4人,其中第一组的工人年龄为44,所以它在组中的编号为2,所以所有样本数据的编号为4n -2(n =1,2,…,9), 其年龄数据为:44,40,36,43,36,37,44,43,37. (2)由均值公式知:x =44+40+…+379=40,由方差公式知:s 2=19[(44-40)2+(40-40)2+…+(37-40)2]=1009.(3)因为s 2=1009,s =103,所以36名工人中年龄在x -s 和x +s 之间的人数等于年龄在区间[37,43]上的人数, 即40,40,41,…,39,共23人.所以36名工人中年龄在x -s 和x +s 之间的人数所占的百分比为2336×100%≈63.89%.。
《用样本的数字特征估计总体的数字特征》教案教学目标:1、能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释。
2、会用样本的基本数字特征估计总体的基本数字特征。
3、形成对数据处理过程进行初步评价的意识。
4、在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法。
教学重难点:1.用由频率分布直方图估计总体的平均数、众数、中位数。
2.用样本平均数和标准差估计总体的平均数与标准差。
教具:多媒体 相关的教学资料教学过程:一、 导入在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕ 甲运动员﹕7,8,6,8,6,5,8,10,7,4;乙运动员﹕9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究。
——用样本的数字特征估计总体的数字特征(板书课题)。
二、 新授课(一)、众数、中位数、平均数探究:P 62(1)怎样将各个样本数据汇总为一个数值,并使它成为样本数据的“中心点”?(2)能否用一个数值来描写样本数据的离散程度?(让学生回忆初中所学的一些统计知识,思考后展开讨论)初中我们曾经学过众数,中位数,平均数等各种数字特征,众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.平均数:一组数据的算术平均数,即 应当说,这些数字都能够为我们提供关于样本数据的特征信息。
例如前面一节在调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t (最高的矩形的中点)(图略见课本第62页)它告诉我们,该市的月均用水量为2. 25t 的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少。
福建省莆田市高中数学第二章统计2.2.2 用样本的数字特征估计总体的数字特征教案新人教A版必修3编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(福建省莆田市高中数学第二章统计2.2.2 用样本的数字特征估计总体的数字特征教案新人教A版必修3)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为福建省莆田市高中数学第二章统计2.2.2 用样本的数字特征估计总体的数字特征教案新人教A版必修3的全部内容。
2.2.2用样本的数字特征估计总体的数字特征一、三维目标:1、知识与技能(1)正确理解样本数据标准差的意义和作用,学会计算数据的标准差。
(2)能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释。
(3)会用样本的基本数字特征估计总体的基本数字特征。
(4)形成对数据处理过程进行初步评价的意识.2、过程与方法在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法。
3、情感态度与价值观会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辨证地理解数学知识与现实世界的联系.二、重点与难点重点:用样本平均数和标准差估计总体的平均数与标准差。
难点:能应用相关知识解决简单的实际问题。
三、教学设想【创设情境】在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员﹕7,8,6,8,6,5,8,10,7,4;乙运动员﹕9,5,7,8,7,6,8,6,7,7。
观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究。
2.2.2 用样本的数字特征估计总体的数字特征[课时作业] [A 组 学业水平达标]1.下列说法不正确的是( ) A .方差是标准差的平方 B .标准差的大小不会超过极差C .若一组数据的值大小相等,没有波动变化,则标准差为0D .标准差越大,表明各个样本数据在样本平均数周围越集中;标准差越小,表明各个样本数据在样本平均数周围越分散解析:标准差越小,表明各个样本数据在样本平均数周围越集中;标准差越大,表明各个样本数据在样本平均数的周围越分散. 答案:D2.数学测验中,某小组14名学生分别与全班的平均分85分的差是:2,3,-3,-5,12,12,8,2,-1,4,-10,-2,5,5,这个小组的平均分是( ) A .97.2 B .87.29 C .92.32D .82.86解析:2,3,-3,-5,12,12,8,2,-1,4,-10,-2,5,5的平均数为:(2+3-3-5+12+12+8+2-1+4-10-2+5+5)÷14=167≈2.29,故这个小组的平均成绩是85+2.29=87.29(分).故选B. 答案:B3.一次数学考试后,某老师从自己所带的两个班级中各抽取5人,记录他们的考试成绩,得到如图所示的茎叶图.已知甲班5名同学成绩的平均数为81,乙班5名同学成绩的中位数为73,则x -y 的值为( ) A .2 B .-2 C .3D .-3解析:由题意得72+77+80+x +86+905=81⇒x =0,易知y =3.∴x -y =-3,故选D. 答案:D4.某品牌空调在春节期间举行促销活动,下面的茎叶图表示某专卖店记录的每天销售量的情况(单位:台),则销售量的中位数是( )A .13B .14C .15D .16解析:由茎叶图可知这些数分别为5,8,10,14,16,16,20,23,∴中位数为14+162=15,故选C.答案:C5.某项测试成绩满分为10分,现随机抽取30名学生参加测试,得分如图所示,假设得分值的中位数为m e ,平均值为x ,众数为m 0,则( )A .m e =m 0=xB .m e =m 0<xC .m e <m 0<xD .m 0<m e <x解析:由图可知m 0=5.由中位数的定义知应该是第15个数与第16个数的平均值,由图知将数据从小到大排,第15个数是5,第16个数是6, 所以m e =5+62=5.5.x =130(3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×2)≈5.97>5.5,所以m 0<m e <x ,故选D. 答案:D6.对某商店一段时间内的顾客人数进行了统计,得到了样本的茎叶图(如图所示),则该样本中的中位数为________,众数为________.解析:将样本数据按大小顺序排列,排在中间位置或中间两个数的平均数是中位数,出现次数最多的是众数,所以根据图中数据可知该样本中的中位数为45,众数为45. 答案:45 457.样本中共有五个个体,其值分别为a,0,1,2,3,若该样本的平均值为1,则样本方差为________. 解析:由题意知15(a +0+1+2+3)=1,解得a =-1.所以样本方差为s 2=15[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.答案:28.若1,2,3,4,m 这五个数的平均数为3,则这五个数的方差为________.解析:由1+2+3+4+m 5=3得m =5,所以这五个数的方差为15[(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2]=2. 答案:29.如图所示的是甲、乙两人在一次射击比赛中中靶的情况(击中靶中心的圆面为10环,靶中各数字表示该数字所在圆环被击中时所得的环数),每人射击了6次.甲射击的靶 乙射击的靶(1)请用列表法将甲、乙两人的射击成绩统计出来;(2)请用学过的统计知识,对甲、乙两人这次的射击情况进行比较.解析:(1)甲、乙两人的射击成绩统计表如下:(2)x 甲=16×(8×2+9×2+10×2)=9(环),x 乙=16×(7×1+9×3+10×2)=9(环),s 2甲=16×[(8-9)2×2+(9-9)2×2+(10-9)2×2]=23,s 2乙=16×[(7-9)2+(9-9)2×3+(10-9)2×2]=1,因为x 甲=x 乙,s 2甲<s 2乙,所以甲与乙的平均成绩相同,但甲的发挥比乙稳定.[B 组 应考能力提升]1.某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如表:A.25B.725C.35D .2解析:x 甲=7,s 2甲=15[(6-7)2+(7-7)2+(7-7)2+(8-7)2+(7-7)2]=25,x 乙=7,s 2乙=15[(6-7)2+(7-7)2+(6-7)2+(7-7)2+(9-7)2]=65,两组数据的方差中较小的一个为s 2甲,即s 2=25.故选A.答案:A2.样本中共有五个个体,其值分别为0,1,2,3,m .若该样本的平均值为1,则其方差为( )A.105 B.305C. 2D .2解析:依题意得m =5×1-(0+1+2+3)=-1,样本方差s 2=15(12+02+12+22+22)=2,即所求的样本方差为2. 答案:D3.已知甲、乙两组数据如茎叶图所示,若它们的中位数相同,平均数也相同,则图中的m ,n 的比值m n=________.解析:由茎叶图可知甲的数据为27,30+m,39,乙的数据为20+n,32,34,38.由此可知乙的中位数是33,所以甲的中位数也是33,所以m =3.由此可以得出甲的平均数为33,所以乙的平均数也是33,所以有20+n +32+34+384=33,所以n =8,所以m n =38.答案:384.农科院的专家为了了解新培育的甲、乙两种麦苗的长势情况,从甲、乙两种麦苗的试验田中各抽取6株麦苗测量麦苗的株高,数据如下(单位:cm): 甲:9,10,11,12,10,20 乙:8,14,13,10,12,21(1)在给出的方框内绘出所抽取的甲、乙两种麦苗株高的茎叶图;(2)分别计算所抽取的甲、乙两种麦苗株高的平均数与方差,并由此判断甲、乙两种麦苗的长势情况.解析:(1)茎叶图如图所示:(2)x 甲=9+10+11+12+10+206=12,x 乙=8+14+13+10+12+216=13,s 2甲=16×[(9-12)2+(10-12)2+(11-12)2+(12-12)2+(10-12)2+(20-12)2]≈13.67,s 2乙=16×[(8-13)2+(14-13)2+(13-13)2+(10-13)2+(12-13)2+(21-13)2]≈16.67.因为x 甲<x 乙,所以乙种麦苗平均株高较高,又因为s 2甲<s 2乙,所以甲种麦苗长的较为整齐. 5.某校对高二年级的男生进行体检,现将高二男生的体重(kg)数据进行整理后分成6组,并绘制部分频率分布直方图(如图所示).已知第三组[60,65)的人数为200.根据一般标准,高二男生体重超过65 kg 属于偏胖,低于55 kg 属于偏瘦,观察图中的信息,回答下列问题:(1)求体重在[60,65)内的频率,并补全频率分布直方图;(2)用分层抽样的方法从偏胖的学生中抽取6人对日常生活习惯及体育锻炼进行调查,则各组应分别抽取多少人?(3)根据频率分布直方图,估计高二男生的体重的中位数与平均数.解析:(1)体重在[60,65)内的频率=1-(0.03+0.07+0.03+0.02+0.01)×5=0.2, 则频率组距=0.25=0.04,补全的频率分布直方图如图所示.(2)设男生总人数为n ,由200n=0.2,可得n =1 000.体重超过65 kg 的总人数为(0.03+0.02+0.01)×5×1 000=300, 在[65,70)的人数为0.03×5×1 000=150,应抽取的人数为6×150300=3,在[70,75)的人数为0.02×5×1 000=100,应抽取的人数为6×100300=2,在[75,80]的人数为0.01×5×1 000=50,应抽取的人数为6×50300=1.所以在[65,70),[70,75),[75,80]三段应抽取的人数分别为3,2,1. (3)中位数为60 kg ,平均数为(52.5×0.03+57.5×0.07+62.5×0.04+67.5×0.03+72.5×0.02+77.5×0.01)×5=61.75(kg).。
2.2.2 用样本的数字特征估计总体的数字特征(1)如何根据样本数据的频率分布直方图,分别估计总体的众数、中位数和平均数?(2)如何理解众数、中位数、平均数与极端数据的关系?(3)平均数向我们提供了样本数据的重要信息,平均数会使我们作出对总体的片面判断吗?(4)方差、标准差有什么区别与联系?[新知初探]1.众数、中位数、平均数的概念(1)众数:一组数据中出现次数最多的数.(2)中位数:一组数据按大小顺序排列后,处于中间位置的数.如果个数是偶数,则取中间两个数据的平均数.(3)平均数:一组数据的和除以数据个数所得到的数.2.三种数字特征的比较名称优点缺点众数①体现了样本数据的最大集中点;②容易计算①它只能表达样本数据中很少的一部分信息;②无法客观地反映总体的特征中位数①不受少数几个极端数据(即排序靠前或靠后的数据)的影响;对极端值不敏感预习课本P3~6,思考并完成以下问题3.标准差、方差的概念与计算公式 (1)标准差:标准差是样本数据到平均数的一种平均距离,一般用s 表示,s = 1nx 1-x2+x 2-x2+…+x n -x2].(2)方差:标准差的平方s 2叫做方差.s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中,x n 是样本数据,n 是样本容量,x 是样本平均数. [点睛](1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.(2)标准差、方差的取值范围:[0,+∞).标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性.[小试身手]1.下列说法不正确的是( ) A .方差是标准差的平方 B .标准差的大小不会超过极差C .若一组数据的值大小相等,没有波动变化,则标准差为0D .标准差越大,表明各个样本数据在样本平均数周围越集中;标准差越小,表明各个样本数据在样本平均数周围越分散解析:选D 标准差越小,表明各个样本数据在样本平均数周围越集中;标准差越大,表明各个样本数据在样本平均数的周围越分散.2.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a ,中位数为b ,众数为c ,则有( )A .a >b >cB .b >c >aC .c >a >bD .c >b >a解析:选D 将数据从小到大排列为10,12,14,14,15,15,16,17,17,17,则平均数a =110(10+12+14×2+15×2+16+17×3)=14.7,中位数b =15,众数c =17, 显然a <b <c ,选D.3.奥运会体操比赛的计分规则为:当评委亮分后,其成绩先去掉一个最高分,去掉一个最低分,再计算剩下分数的平均值,这是因为( )A .减少计算量B .避免故障C .剔除异常值D .活跃赛场气氛解析:选C 因为在体操比赛的评分中使用的是平均分,记分过程中采用“去掉一个最高分,去掉一个最低分”的方法,就是为了防止个别裁判的人为因素给出过高或过低的分数对选手的得分造成较大的影响,从而降低误差,尽量公平.4.样本中共有五个个体,其值分别为a,0,1,2,3,若该样本的平均值为1,则样本方差为________.解析:由题意知15(a +0+1+2+3)=1,解得a =-1.所以样本方差为s 2=15[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.答案:2[典例] (单位:岁):甲群:13,13,14,15,15,15,15,16,17,17; 乙群:54,3,4,4,5,6,6,6,6,56.(1)甲群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映甲群市民的年龄特征?(2)乙群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映乙群市民的年龄特征?[解] (1)甲群市民年龄的平均数为13+13+14+15+15+15+15+16+17+1710=15(岁),中位数为15岁,众数为15岁.平均数、中位数和众数相等,因此它们都能较好地反映甲群市民的年龄特征. (2)乙群市民年龄的平均数为54+3+4+4+5+6+6+6+6+5610=15(岁),中位数为6岁,众数为6岁.由于乙群市民大多数是儿童,所以中位数和众数能较好地反映乙群市民的年龄特征,而平均数的可靠性较差.平均数、众数、中位数的计算方法平均数一般是根据公式来计算的;计算众数、中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据各自的定义计算.[活学活用](广东高考)已知样本数据x 1,x 2,…,x n 的均值x =5,则样本数据2x 1+1,2x 2+1,…,2x n +1的均值为________.解析:由条件知x =x 1+x 2+…+x n n =5,则所求均值x 0=2x 1+1+2x 2+1+…+2x n +1n=x 1+x 2+…+x n +nn=2x +1=2×5+1=11.答案:11标准差(方差)的计算及应用[典例] 甲:8,6,7,8,6,5,9,10,4,7; 乙:6,7,7,8,6,7,8,7,9,5.(1)分别计算以上两组数据的平均数; (2)分别求出两组数据的方差;(3)根据计算结果,估计两名战士的射击情况.若要从这两人中选一人参加射击比赛,选谁去合适?[解] (1)x 甲=110×(8+6+7+8+6+5+9+10+4+7)=7(环),x 乙=110×(6+7+7+8+6+7+8+7+9+5)=7(环).(2)由方差公式s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],得s 2甲=3,s 2乙=1.2.(3)x 甲=x 乙,说明甲、乙两战士的平均水平相当.又s2甲>s2乙,说明甲战士射击情况波动比乙大.因此,乙战士比甲战士射击情况稳定.从成绩的稳定性考虑,应选择乙参加比赛.计算标准差的5步骤(1)求出样本数据的平均数x.(2)求出每个样本数据与样本平均数的差x i-x(i=1,2,…,n).(3)求出x i-x(i=1,2,…,n)的平方值.(4)求出上一步中n个平方值的平均数,即为样本方差.(5)求出上一步中平均数的算术平方根,即为样本标准差.[活学活用]从甲、乙两种玉米的苗中各抽10株,分别测它们的株高如下:(单位:cm)甲:25 41 40 37 22 14 19 39 21 42;乙:27 16 44 27 44 16 40 40 16 40.问:(1)哪种玉米的苗长得高?(2)哪种玉米的苗长得齐?解:(1)x甲=110(25+41+40+37+22+14+19+39+21+42)=110×300=30(cm),x乙=110(27+16+44+27+44+16+40+40+16+40)=110×310=31(cm).所以x甲<x乙.即乙种玉米苗长得高.(2)s2甲=110[(25-30)2+(41-30)2+(40-30)2+(37-30)2+(22-30)2+(14-30)2+(19-30)2+(39-30)2+(21-30)2+(42-30)2]=110(25+121+100+49+64+256+121+81+81+144)=110×1 042=104.2(cm2),s2乙=110[2×(27-31)2+3×(16-31)2+2×(44-31)2+3×(40-31)2]=110×1 288=128.8(cm2).所以s2甲<s2乙.即甲种玉米苗长得齐.[典例] 某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.(1)求这次测试数学成绩的众数; (2)求这次测试数学成绩的中位数. [解] (1)由题图知众数为70+802=75.(2)由题图知,设中位数为x ,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,0.3+0.4>0.5,因此中位数位于第四个矩形内,得0.1=0.03(x -70),所以x ≈73.3.众数、中位数、平均数与频率分布直方图的关系[活学活用]为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量得到频率分布直方图如图,则(1)这20名工人中一天生产该产品数量在[55,75)的人数是________.(2)这20名工人中一天生产该产品数量的中位数为________. (3)这20名工人中一天生产该产品数量的平均数为________. 解析:(1)在[55,75)的人数为(0.040×10+0.025×10)×20=13. (2)设中位数为x ,则0.2+(x -55)×0.04=0.5,x =62.5. (3)0.2×50+0.4×60+0.25×70+0.1×80+0.05×90=64. 答案:(1)13 (2)62.5 (3)64[层级一 学业水平达标]1.甲、乙两名篮球运动员在某几场比赛中得分的茎叶图如图所示,则甲、乙两人这几场比赛得分的中位数之和是( )A .63B .64C .65D .66解析:选 A 甲、乙两人在这几场比赛中得分的中位数分别是36和27,则中位数之和是36+27=63.2.下列说法中,不正确的是( ) A .数据2,4,6,8的中位数是4,6 B .数据1,2,2,3,4,4的众数是2,4C .一组数据的平均数、众数、中位数有可能是同一个数据D .8个数据的平均数为5,另3个数据的平均数为7,则这11个数据的平均数是8×5+7×311解析:选A 数据2,4,6,8的中位数为4+62=5,显然A 是错误的,B 、C 、D 都是正确的.故选A.3.已知一组数据,现将每个数据都加上m ,则新的一组数据的平均数与原来一组数的平均数相比( )A .扩大到m 倍B .增加m 倍C .数值不变D .增加m解析:选D 设原来一组数据为x 1,x 2,…,x n ,平均数x ,那么加上m 后得到的一组新数据为x 1+m ,x 2+m ,…,x n +m ,其平均数x ′=m +x 1+x 2+…+x nn=m +x .故答案为D.4.如图是一次考试结果的统计图,根据该图可估计,这次考试的平均分数为( )A .46B .36C .56D .60解析:选A 根据题中统计图,可估计有4人成绩在[0,20)之间,其考试分数之和为4×10=40;有8人成绩在[20,40)之间,其考试分数之和为8×30=240;有10人成绩在[40,60)之间,其考试分数之和为10×50=500;有6人成绩在[60,80)之间,其考试分数之和为6×70=420;有2人成绩在[80,100)之间,其考试分数之和为2×90=180,由此可知,考生总人数为4+8+10+6+2=30,考试总成绩为40+240+500+420+180=1 380,平均数为1 38030=46.5.某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.求:(1)高一参赛学生的成绩的众数、中位数; (2)高一参赛学生的平均成绩. 解:(1)由图可知众数为65, ∵第一个小矩形的面积为0.3,∴设中位数为60+x ,则0.3+x ×0.04=0.5,得x =5, ∴中位数为60+5=65.(2)依题意,平均成绩为55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67, 故平均成绩约为67.[层级二 应试能力达标]1.如图为甲、乙两名篮球运动员每场比赛得分情况的茎叶图,则甲和乙得分的中位数的和是( )A .56分B .57分C .58分D .59分解析:选B 易得甲得分的中位数是32,乙得分的中位数是25,其和为32+25=57. 2.在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为( )A .9.4,0.484B .9.4,0.016C .9.5,0.04D .9.5,0.016解析:选D x =9.4×3+9.6+9.75=9.5,s 2=15(0.12×4+0.22)=0.016.3.如图,样本A 和B 分别取自两个不同的总体,它们的样本平均数分别为x A 和x B ,样本标准差分别为s A 和s B ,则( )A.x A >x B ,s A >s BB.x A <x B ,s A >s BC.x A >x B ,s A <s BD.x A <x B ,s A <s B解析:选B 由图易得x A <x B ,又A 波动性大,B 波动性小,所以s A >s B .4.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为m e ,众数为m 0,平均值为x ,则( )A .m e =m 0=xB .m e =m 0<xC .m e <m 0<xD .m 0<m e <x解析:选D 由题目所给的统计图可知,30个数据按大小顺序排列好后,中间两个数为5,6,故中位数为m e =5+62=5.5.又众数为m 0=5,平均值x =130(3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×2)=17930,∴m 0<m e <x .5.五个数1,2,3,4,a 的平均数是3,则a =________,这五个数的标准差是________. 解析:由1+2+3+4+a5=3,得a =5;由s 2=15[(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2]=2,得标准差s = 2.答案:526.某医院急救中心随机抽取20位病人等待急诊的时间记录如下表:用上述分组资料计算出病人平均等待时间的估计值x =________. 解析:x =120(2.5×4+7.5×8+12.5×5+17.5×2+22.5×1)=9.5.答案:9.57.某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4. 则:(1)平均命中环数为________; (2)命中环数的标准差为________.解析:(1)x =110(7+8+7+9+5+4+9+10+7+4)=7.(2)s 2=110[(7-7)2+(8-7)2+(7-7)2+(9-7)2+(5-7)2+(4-7)2+(9-7)2+(10-7)2+(7-7)2+(4-7)2]=4,所以s =2. 答案:(1)7 (2)28.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表).(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?解:(1)频率分布直方图如图所示:(2)质量指标值的样本平均数为:x=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为:s2=(80-100)2×0.06+(90-100)2×0.26+(100-100)2×0.38+(110-100)2×0.22+(120-100)2×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.9.(广东高考)某工厂36名工人的年龄数据如下表.到的年龄数据为44,列出样本的年龄数据.(2)计算(1)中样本的均值x 和方差s 2.(3)36名工人中年龄在x -s 与x +s 之间有多少人?所占的百分比是多少(精确到0.01%)?解:(1)36人分成9组,每组4人,其中第一组的工人年龄为44,所以它在组中的编号为2,所以所有样本数据的编号为4n -2(n =1,2,…,9), 其年龄数据为:44,40,36,43,36,37,44,43,37. (2)由均值公式知:x =44+40+…+379=40,由方差公式知:s 2=19[(44-40)2+(40-40)2+…+(37-40)2]=1009.(3)因为s 2=1009,s =103,所以36名工人中年龄在x -s 和x +s 之间的人数等于年龄在区间[37,43]上的人数, 即40,40,41,…,39,共23人.所以36名工人中年龄在x -s 和x +s 之间的人数所占的百分比为2336×100%≈63.89%.。