2018年高考一轮人教版A数学文科 第9章 第3节 用样本估计总体
- 格式:ppt
- 大小:2.31 MB
- 文档页数:35
课时作业60 用样本估计总体一、选择题1.容量为20的样本数据,分组后的频数如下表:A.0.35 B.0.45C.0.55 D.0.65解析:求得该频数为2+3+4=9,样本容量是20,所以频率为920=0.45.答案:B2.重庆市2013年各月的平均气温(℃)数据的茎叶图如图:则这组数据的中位数是( )A.19 B.20C.21.5 D.23解析:根据茎叶图可知,这组数据从小到大依次是8,9,12,15,18,20,20,23,23,28,31,32,处于正中间的两个数都是20,故中位数是20.答案:B3.如图是依据某城市年龄在20岁到45岁的居民上网情况调查而绘制的频率分布直方图,现已知年龄在[30,35)、[35,40)、[40,45]的网民人数成递减的等差数列,则年龄在[35,40)的网民出现的频率为( )A .0.04B .0.06C .0.2D .0.3解析:由题意得,年龄在[20,25)的网民出现的频率为0.01×5=0.05,[25,30)的网民出现的频率为0.07×5=0.35,又[30,35)、[35,40)、[40,45]的网民人数成递减的等差数列,则其频率也成等差数列,又[30,35]的频率为1-0.05-0.35=0.6,则年龄在[35,40)的网民出现的频率为0.2.答案:C4.从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲、乙两组数据的平均数分别为x 甲、x 乙,中位数分别为m甲,m 乙,则( )A.x 甲<x 乙,m 甲>m 乙B.x 甲<x 乙,m 甲<m 乙C.x 甲>x 乙,m 甲>m 乙D.x 甲>x 乙,m 甲<m 乙解析:由茎叶图知m 甲=22+182=20,m 乙=27+312=29,∴m 甲<m 乙;x 甲=116(41+43+30+30+38+22+25+27+10+10+14+18+18+5+6+8)=34516,x 乙=116(42+43+48+31+32+34+34+38+20+22+23+23+27+10+12+18)=45716,∴x 甲<x乙.答案:B5.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差解析:由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9,所以甲、乙的成绩的平均数均为6,A 错;甲、乙的成绩的中位数分别为6,5,B 错;甲、乙的成绩的方差分别为15×[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=2,15×[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=125,C 对;甲、乙的成绩的极差均为4,D 错. 答案:C6.某公司10位员工的月工资(单位:元)为x 1,x 2,…,x 10,其均值和方差分别为x 和s 2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( )A.x ,s 2+1002B.x +100,s 2+1002C.x ,s 2D.x +100,s 2解析:由题意,得x =x 1+x 2+…+x 1010,s 2=110[(x 1-x )2+(x 2-x )2+…+(x 10-x )2].因为下月起每位员工的月工资增加100元, 所以下月工资的均值为x 1++x 2++…+x 10+10=x 1+x 2+…+x 10+10×10010=x +100下月工资的方差为110[(x 1+100-x -100)2+(x 2+100-x -100)2+…+(x 10+100-x -100)2]=110[(x 1-x )2+(x 2-x )2+…+(x 10-x )2]=s 2,故选D.答案:D 二、填空题7.PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物,如图是根据某地某日早7点至晚8点甲、乙两个监测点统计的数据(单位:毫克/立方米)列出的茎叶图,则甲、乙两地浓度的方差较小的是________.解析:由茎叶图可知甲监测点的数据较为集中,乙监测点的数据较为分散,所以甲地的方差较小.答案:甲8.(2017·南昌一模)在一次演讲比赛中,6位评委对一名选手打分的茎叶图如图所示,若去掉一个最高分和一个最低分,得到一组数据x i (1≤i ≤4),在如图所示的程序框图中,x 是这4个数据的平均数,则输出的v 的值为________.解析:根据题意得到的数据为78,80,82,84,则x=81.该程序框图的功能是求以上数据的方差,故输出的v的值为-2+-2+-2+-2=5.4答案:5三、解答题9.为检查某工厂所生产的8万台电风扇的质量,抽查了其中20台的无故障连续使用时限(单位:小时)如下:248 256 232 243 188 268 278 266 289 312274 296 288 302 295 228 287 217 329 283(1)完成下面的频率分布表,并作出频率分布直方图;(2)估计8万台电风扇中有多少台无故障连续使用时限不低于280小时;(3)用组中值(同一组中的数据在该组区间的中点值)估计样本的平均无故障连续使用时限.解:(1)频率分布表及频率分布直方图如下所示:(2)由题意可得8×(0.30+0.10+0.05)=3.6,所以估计8万台电风扇中有3.6万台无故障连续使用时限不低于280小时.(3)由频率分布直方图可知x=190×0.05+210×0.05+230×0.10+250×0.15+270×0.20+290×0.30+310×0.10+330×0.05=269(小时),所以样本的平均无故障连续使用时限为269小时.10.(2016·北京卷)某市居民用水拟实行阶梯水价.每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费.从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:(Ⅰ)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?(Ⅱ)假设同组中的每个数据用该组区间的右端点值代替.当w=3时,估计该市居民该月的人均水费.解:(Ⅰ)由用水量的频率分布直方图知,该市居民该月用水量在区间[0.5,1],(1,1.5],(1.5,2],(2,2.5],(2.5,3]内的频率依次为0.1,0.15,0.2,0.25,0.15.所以该月用水量不超过3立方米的居民占85%,用水量不超过2立方米的居民占45%.依题意,w至少定为3.(Ⅱ)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表:12×0.15+17×0.05+22×0.05+27×0.05=10.5(元).1.如图是某位篮球运动员8场比赛得分的茎叶图,其中一个数据染上污渍用x 代替,那么这位运动员这8场比赛的得分平均数不小于得分中位数的概率为( )A.15B.310C.35D.710解析:由茎叶图可知0≤x ≤9且x ∈N ,中位数是10+7+x 2=27+x 2,这位运动员这8场比赛的得分平均数为18(7+8+7+9+x +3+1+10×4+20×2)=18(x +115),由18(x +115)≥27+x2,得3x ≤7,即x =0,1,2,所以这位运动员这8场比赛的得分平均数不小于得分中位数的概率为310,故选B.答案:B2.农场种植的甲、乙两种水稻,在面积相等的两块稻田中连续6年的平均产量如下(单位:500 g),产量比较稳定的是( )C .一样D .无法确定解析:x 甲=16×(900+920+900+850+910+920)=900,x 乙=16×(890+960+950+850+860+890)=900;s 2甲=16×(202+502+102+202)≈567;s 2乙=16×(102+602+502+502+402+102)≈1 733,因为s 2甲<s 2乙,所以甲的产量波动小,所以甲种水稻的产量比较稳定.答案:A3.为组织好市运动会,组委会征集了800名志愿者,现对他们的年龄抽样统计后,得到如图所示的频率分布直方图,但是年龄在[25,30)内的数据不慎丢失,依据此图可得:(1)年龄在[25,30)内对应小长方形的高度为________; (2)这800名志愿者中年龄在[25,35)内的人数为________.解析:(1)因为各个小长方形的面积之和为1,所以年龄在[25,30)内对应小长方形的高度为15[1-(5×0.01+5×0.07+5×0.06+5×0.02)]=0.04.(2)年龄在[25,35)内的频率为0.04×5+0.07×5=0.55,人数为0.55×800=440. 答案:(1)0.04 (2)4404.某工厂对一批产品进行了抽样检测.如图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36.(1)求样本容量及样本中净重大于或等于98克并且小于104克的产品的个数; (2)已知这批产品中每个产品的利润y (单位:元)与产品净重x (单位:克)的关系式为y =⎩⎪⎨⎪⎧3,96≤x <98,5,98≤x <104,4,104≤x ≤106,求这批产品平均每个的利润.解:(1)产品净重小于100克的频率为(0.050+0.100)×2=0.300.设样本容量为n .∵样本中产品净重小于100克的个数是36,∴36n=0.300,∴n=120.∵样本中净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.750,∴样本中净重大于或等于98克并且小于104克的产品的个数是120×0.750=90.(2)产品净重在[96,98),[98,104),[104,106]内的频率分别为0.050×2=0.100,(0.100+0.150+0.125)×2=0.750,0.075×2=0.150,∴其相应的频数分别为120×0.1=12,120×0.75=90,120×0.150=18,∴这批产品平均每个的利润为1120×(3×12+5×90+4×18)=4.65(元).。
第三节 用样本估计总体———————————————————————————————— [考纲传真] 1.了解分布的意义与作用,能根据概率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征.理解用样本估计总体的思想,会用样本估计总体的思想解决一些简单的实际问题.1.频率分布直方图 (1)频率分布表的画法:第一步:求极差,决定组数和组距,组距=极差组数;第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间; 第三步:登记频数,计算频率,列出频率分布表.(2)频率分布直方图:反映样本频率分布的直方图(如图931).图931横轴表示样本数据,纵轴表示频率组距,每个小矩形的面积表示样本落在该组内的频率.2.茎叶图统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数.3.样本的数字特征1.(思考辨析)判断下列结论的正误.(正确的打“√”,错误的打“×”) (1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( ) (2)一组数据的方差越大,说明这组数据越集中. ( )(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越高.( )(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( )[解析] (1)正确.平均数、众数与中位数都在一定程度上反映了数据的集中趋势. (2)错误.方差越大,这组数据越离散. (3)正确.小矩形的面积=组距×频率组距=频率.(4)错误.茎相同的数据,叶可不用按从小到大的顺序写,相同的数据叶要重复记录,故(4)错误.[答案] (1)√ (2)× (3)√ (4)×2.(教材改编)若某校高一年级8个班参加合唱比赛的得分如茎叶图932所示,则这组数据的中位数和平均数分别是( )图932A .91.5和91.5B .91.5和92C .91和91.5D .92和92A [这组数据由小到大排列为87,89,90,91,92,93,94,96. ∴中位数是91+922=91.5,平均数x =87+89+90+91+92+93+94+968=91.5.]3.(2017·南昌二模)如图933所示是一样本的频率分布直方图.若样本容量为100,则样本数据在[15,20)内的频数是( )图933A .50B .40C .30D .14C [因为[15,20]对应的小矩形的面积为1-0.04×5-0.1×5=0.3,所以样本落在[15,20]的频数为0.3×100=30,故选C.]4.(2016·江苏高考)已知一组数据 4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________.0.1 [5个数的平均数x =4.7+4.8+5.1+5.4+5.55=5.1,所以它们的方差s 2=15[(4.7-5.1)2+(4.8-5.1)2+(5.1-5.1)2+(5.4-5.1)2+(5.5-5.1)2]=0.1.]5.(2017·山东淄博模拟)某校女子篮球队7名运动员身高(单位:cm)分布的茎叶图如图934,已知记录的平均身高为175 cm ,但记录中有一名运动员身高的末位数字不清晰,如果把其末位数字记为x ,那么x 的值为________.图9342 [170+17×(1+2+x +4+5+10+11)=175,则17×(33+x )=5,即33+x =35,解得x =2.](1)(2015·广东高考)已知样本数据x 1,x 2,…,x n 的均值x =5,则样本数据2x 1+1,2x 2+1,…,2x n +1的均值为________.(2)某企业有甲、乙两个研发小组.为了比较他们的研发水平,现随机抽取这两个小组往年研发新产品的结果如下:(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ).其中a ,a 分别表示甲组研发成功和失败;b ,b 分别表示乙组研发成功和失败.①若某组成功研发一种新产品,则给该组记1分,否则记0分.试计算甲、乙两组研发新产品的成绩的平均数和方差.并比较甲、乙两组的研发水平;②若该企业安排甲、乙两组各自研发一种新产品,试估计恰有一组研发成功的概率. (1)11[由条件知x =x 1+x 2+…+x nn=5,则所求均值x=2x 1+1+2x 2+1+…+2x n +1n=x 1+x 2+…+x n +nn=2x +1=2×5+1=11.](2)①甲组研发新产品的成绩为 1,1,1,0,0,1,1,1,0,1,0,1,1,0,1, 其平均数为x 甲=1015=23.3分方差s 2甲=115⎣⎢⎡⎦⎥⎤⎝ ⎛⎭⎪⎫1-232×10+⎝ ⎛⎭⎪⎫0-232×5=29.乙组研发新产品的成绩为1,0,1,1,0,1,1,0,1,0,0,1,0,1,1, 其平均数为x 乙=915=35.方差s 2乙=115⎣⎢⎡⎦⎥⎤⎝ ⎛⎭⎪⎫1-352×9+⎝ ⎛⎭⎪⎫0-352×6=625.因为x 甲>x 乙,s 2甲<s 2乙, 所以甲组的研发水平优于乙组.6分 ②记E ={恰有一组研发成功}.在所抽得的15个结果中,恰有一组研发成功的结果是(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),共7个.因此事件E 发生的概率为715.用频率估计概率,即得所求概率为P (E )=715.12分[规律方法] 1.平均数反映了数据的中心,是平均水平,而方差和标准差反映的是数据围绕平均数的波动大小.进行均值与方差的计算,关键是正确运用公式.2.可以通过比较甲、乙两组样本数据的平均数和方差的差异,对甲、乙两品种做出评价或选择.[变式训练1] (2017·郑州模拟)为比较甲、乙两地某月14时的气温状况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图935所示的茎叶图.考虑以下结论:图935①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温; ③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差. 其中根据茎叶图能得到的统计结论的序号为 ( ) A .①③ B .①④ C .②③D .②④B [甲地5天的气温为:26,28,29,31,31, 其平均数为x 甲=26+28+29+31+315=29;方差为s 2甲=15[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2]=3.6;标准差为s 甲= 3.6.乙地5天的气温为:28,29,30,31,32, 其平均数为x 乙=28+29+30+31+325=30;方差为s 2乙=15[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2]=2;标准差为s 乙= 2.∴x 甲<x 乙,s 甲>s 乙.]50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.[解](1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.3分50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为66+682=67,所以该市的市民对乙部门评分的中位数的估计值是67.5分(2)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为550=0.1,850=0.16,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.8分(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.12分[规律方法] 1.茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况.2.(1)作样本的茎叶图时,先要根据数据特点确定茎、叶,再作茎叶图;作“叶”时,要做到不重不漏,一般由内向外,从小到大排列,便于数据的处理.(2)根据茎叶图中数据的数字特征进行分析判断,考查识图能力、判断推理能力和创新应用意识;解题的关键是抓住“叶”的分布特征,准确提炼信息.[变式训练2] (2017·雅礼中学质检)已知甲、乙两组数据如茎叶图936所示,若两组数据的中位数相同,平均数也相同,那么m+n=________.【导学号:31222364】图93611[∵两组数据的中位数相同,∴m =2+42=3.又∵两组数据的平均数也相同, ∴27+33+393=20+n +32+34+384,∴n =8, 因此m +n =11.]☞角度1 利用分布直方图求频率、频数(2016·山东高考)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图937所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )图937A .56B .60C .120D .140D [由直方图可知每周自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,则每周自习时间不少于22.5小时的人数为0.7×200=140.故选D.] ☞角度2 用频率分布直方图估计总体(2016·四川高考)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨).将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图938所示的频率分布直方图.图938(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(3)估计居民月均用水量的中位数.[解](1)由频率分布直方图可知,月均用水量在[0,0.5)的频率为0.08×0.5=0.04,同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,解得a=0.30.5分(2)由(1)知,该市100位居民中月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.8分(3)设中位数为x吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5,而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5,所以2≤x<2.5.10分由0.50×(x-2)=0.5-0.48,解得x=2.04.故可估计居民月均用水量的中位数为2.04吨.12分[规律方法] 1.准确理解频率分布直方图的数据特点,频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,易误认为纵轴上的数据是各组的频率.2.(1)例3-2中抓住频率分布直方图中各小长方形的面积之和为1,这是解题的关键.(2)利用样本的频率分布估计总体分布.[思想与方法]1.用样本估计总体是统计的基本思想.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.2.(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量,与每个样本数据有关,这是中位数、众数所不具有的性质.(2)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度就越大.(3)茎叶图、频率分布表和频率分布直方图都是用图表直观描述样本数据的分布规律的.[易错与防范]1.使用茎叶图时,要弄清茎叶图的数字特点,切莫混淆茎与叶的含义.2.利用频率分布直方图求众数、中位数与平均数时,应注意这三者的区分:(1)最高的矩形的中点即众数;(2)中位数左边和右边的直方图的面积是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.3.直方图与条形图不要搞混.频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.课时分层训练(五十六) 用样本估计总体A 组 基础达标 (建议用时:30分钟)一、选择题1.重庆市2016年各月的平均气温(℃)数据的茎叶图如图939,则这组数据的中位数是( )图939A .19B .20C .21.5D .23B [由茎叶图可知这组数据由小到大依次为8,9,12,15,18,20,20,23,23,28,31,32,所以中位数为20+202=20.]2.我国古代数学名著《数书九章》有“米谷粒分”题:粮仓开仓收粮,有人送来米1 534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为 ( )A .134石B .169石C .338石D .1 365石B [254粒和1 543石中夹谷的百分比含量是大致相同的,可据此估计这批米内夹谷的数量.设1 534石米内夹谷x 石,则由题意知x 1 534=28254,解得x ≈169.故这批米内夹谷约为169石.]3.某班的全体学生参加英语测试,成绩的频率分布直方图如图9310,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( )图9310A.45 B.50C.55 D.60B[由频率分布直方图,知低于60分的频率为(0.010+0.005)×20=0.3.∴该班学生人数n=150.3=50.]4.(2016·全国卷Ⅲ)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图9311中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是( )图9311A.各月的平均最低气温都在0 ℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20 ℃的月份有5个D[对于选项A,由题图易知各月的平均最低气温都在0 ℃以上,A正确;对于选项B,七月的平均最高气温点与平均最低气温点间的距离大于一月的平均最高气温点与平均最低气温点的距离,所以七月的平均温差比一月的平均温差大,B正确;对于选项C,三月和十一月的平均最高气温均为10 ℃,所以C正确;对于选项D,平均最高气温高于20 ℃的月份有七月、八月,共2个月份,故D错误.]5.若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为( )A.8 B.15C.16 D.32C [已知样本数据x 1,x 2,…,x 10的标准差为s =8,则s 2=64,数据2x 1-1,2x 2-1,…,2x 10-1的方差为22s 2=22×64,所以其标准差为22×64=2×8=16.]二、填空题6.如图9312所示的茎叶图是甲、乙两位同学在期末考试中的六科成绩,已知甲同学的平均成绩为85,乙同学的六科成绩的众数为84,则x +y =________.【导学号:31222365】图931210 [x 甲=75+82+84++x +90+936=85,x =6.又∵乙同学的成绩众数为84,∴y =4. ∴x +y =10.]7.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图9313所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm.【导学号:31222366】图931324 [底部周长在[80,90)的频率为0.015×10=0.15, 底部周长在[90,100)的频率为0.025×10=0.25,样本容量为60,所以树木的底部周长小于100 cm 的株数为(0.15+0.25)×60=24.] 8.(2017·郑州调研)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:2 [易知x 甲=90,x 乙=90.则s 2甲=15[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2]=4.s 2乙=15[(89-90)2+(90-90)2+(91-90)2+(88-90)2+(92-90)2]=2.]三、解答题9.(2017·郑州调研)某车间将10名技工平均分成甲、乙两组加工某种零件,在单位时间内每个技工加工的合格零件数的统计数据的茎叶图如图9314所示,已知两组技工在单位时间内加工的合格零件的平均数都为10.【导学号:31222367】图9314(1)求出m ,n 的值;(2)求出甲、乙两组技工在单位时间内加工的合格零件的方差s 2甲和s 2乙,并由此分析两组技工的加工水平.[解] (1)根据题意可知:x 甲=15(7+8+10+12+10+m )=10,x 乙=15(9+n +10+11+12)=10,3分∴m =3,n =8.5分(2)s 2甲=15[(7-10)2+(8-10)2+(10-10)2+(12-10)2+(13-10)2]=5.2,8分s 2乙=15[(8-10)2+(9-10)2+(10-10)2+(11-10)2+(12-10)2]=2,10分∵x 甲=x 乙,s 2甲>s 2乙,∴甲、乙两组的整体水平相当,乙组更稳定一些.12分10.(2016·北京高考)某市居民用水拟实行阶梯水价,每人月用水量中不超过w 立方米的部分按4元/立方米收费,超出w 立方米的部分按10元/立方米收费.从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:图9315(1)如果w 为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w 至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替.当w =3时,估计该市居民该月的人均水费.[解] (1)由用水量的频率分布直方图,知该市居民该月用水量在区间[0.5,1],(1,1.5],(1.5,2],(2,2.5],(2.5,3]内的频率依次为0.1,0.15,0.2,0.25,0.15.3分所以该月用水量不超过3立方米的居民占85%,用水量不超过2立方米的居民占45%. 依题意,w 至少定为3.5分(2)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表如下:根据题意,该市居民该月的人均水费估计为4×0.1+6×0.15+8×0.2+10×0.25+12×0.15+17×0.05+22×0.05+27×0.05=10.5(元).12分B 组 能力提升 (建议用时:15分钟)1.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:【导学号:31222368】图9316则7个剩余分数的方差为( ) A.1169B.367 C .36D.677B [由题意知87+94+90+91+90+90+x +917=91,解得x =4.所以s 2=17[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2]=17(16+9+1+0+1+9+0)=367.]2.(2015·湖北高考)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图9317所示.图9317(1)直方图中的a=________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.(1)3(2)6 000[(1)由0.1×1.5+0.1×2.5+0.1a+0.1×2.0+0.1×0.8+0.1×0.2=1,解得a=3.(2)区间[0.3,0.5)内的频率为0.1×1.5+0.1×2.5=0.4,故[0.5,0.9]内的频率为1-0.4=0.6.因此,消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10 000=6 000.]3.(2017·广州模拟)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图9318.图9318(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?[解](1)由(0.002+0.009 5+0.011+0.012 5+x+0.005+0.002 5)×20=1,得x =0.007 5,∴直方图中x 的值为0.007 5.4分 (2)月平均用电量的众数是220+2402=230.∵(0.002+0.009 5+0.011)×20=0.45<0.5,∴月平均用电量的中位数在[220,240)内,设中位数为a ,则(0.002+0.009 5+0.011)×20+0.012 5×(a -220)=0.5,解得a =224,即中位数为224.8分(3)月平均用电量在[220,240)的用户有0.012 5×20×100=25(户),同理可求月平均用电量为[240,260),[260,280),[280,300]的用户分别有15户、10户、5户,故抽样比为1125+15+10+5=15,∴从月平均用电量在[220,240)的用户中应抽取25×15=5(户).12分。
第三讲 用样本估计总体知识梳理·双基自测知识梳理知识点一 用样本的频率分布估计总体分布 (1)频率分布表与频率分布直方图频率分布表和频率分布直方图,是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布规律,从中可以看到整个样本数据的频率分布情况.绘制频率分布直方图的步骤为:①__求极差__;②__决定组距与组数__;③__将数据分组__;④__列频率分布表__;⑤__画频率分布直方图__.(2)频率分布折线图顺次连接频率分布直方图中__各小长方形上端的中点__,就得到频率分布折线图. (3)总体密度曲线总体密度曲线反映了总体在各个范围内取值的百分比,它能提供更加精细的信息. 知识点二 茎叶图(1)茎叶图中茎是指__中间__的一列数,叶是从茎的__旁边__生长出来的数.(2)茎叶图的优点是可以__保留__原始数据,而且可以__随时__记录,这对数据的记录和表示都能带来方便.知识点三 样本的数字特征(1)众数:一组数据中出现次数最多的数.(2)中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数.(3)平均数:x =__x 1+x 2+…+x n n __,反映了一组数据的平均水平.(4)标准差: s =__1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2]__,反映了样本数据的离散程度. (5)方差:s 2=__1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]__,反映了样本数据的离散程度.归纳拓展(1)若一组数据x i (i =1,2,…,n )的平均数为x -,方差为s 2,则数据组ax i +b (i =1,2,…,n ,a ,b 为常数)的平均数为a x -+b ,方差为a 2·s 2.(2)频率分布直方图与众数、中位数与平均数的关系 ①最高的小长方形底边中点的横坐标即是众数.②中位数左边和右边的小长方形的面积和是相等的,均为12.③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.双基自测题组一 走出误区1.判断下列结论是否正确(请在括号中打“√”或“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( √ ) (2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( × ) (3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( √ )(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( × )(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( √ ) (6)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.( × ) 题组二 走进教材2.(P 81A 组T1改编)已知某班级部分同学一次测验的成绩统计如图,则其中位数和众数分别为( B )A .95,94B .92,86C .99,86D .95,91[解析]由茎叶图可知,此组数据由小到大排列依次76,79,81,83,86,86,87,91,92,94,95,96,98,99,101,103,114,共17个,故92为中位数,出现次数最多的为众数,故众数为86,故选B .3.(P 7T1)如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民有__25__人.[解析]100×(0.5×0.5)=25(人).题组三走向高考4.(2020·新课标Ⅲ)设一组样本数据x1,x2,…,x n的方差为0.01,则数据10x1,10x2,…,10x n的方差为(C)A.0.01 B.0.1C.1 D.10[解析]∵样本数据x1,x2,…,x n的方差为0.01,∴根据任何一组数据同时扩大几倍方差将变为平方倍增长,∴数据10x1,10x2,…,10x n的方差为:100×0.01=1,故选C.5.(2020·天津)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为(B)A.10 B.18C.20 D.36[解析]直径落在区间[5.43,5.47)的频率为(6.25+5)×0.02=0.225,则被抽取的零件中,直径落在区间[5.43,5.47)内的个数为0.225×80 =18个,故选B.考点突破·互动探究考点一频率分布直方图——自主练透例1 (1)(2021·江西赣州十四县联考)中央电视台播出《中国诗词大会》火遍全国,下面是组委会在选拔赛时随机抽取的100名选手的成绩,按成绩分组,得到的频率分布表如下所示:组号分组频数频率第1组[160,165)0.100笫2组[165,170)①第3组[170,175)20②第4组[175,180)200.200第5组[180,185)100.100合计100 1.00 (ⅰ)请先求出频率分布表中①、②位置的相应数据,再完成频率分布直方图(用阴影表示).(ⅱ)为了能选拔出最优秀的选手,组委会决定在笔试成绩高的第3,4,5组中用分层抽样抽取5名选手进入第二轮面试,则第3,4,5组每组各抽取多少名选手进入第二轮面试?(ⅲ)在(ⅱ)的前提下,组委会决定在5名选手中随机抽取2名选手接受考官A面试,求第4组至少有一名选手被考官A面试的概率.(2)(2021·湖北恩施州质检)为了解人们对环保知识的认知情况,某调查机构对A地区随机选取n个居民进行了环保知识问卷调查(满分为100分),并根据问卷成绩(不低于60分记为及格)绘制成如图所示的频率分布直方图(分为[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]六组),若问卷成绩最后三组频数之和为360,则下列结论正确的是__②③④__.①n=480②问卷成绩在[70,80)内的频率为0.3③a=0.030④以样本估计总体,若对A 地区5 000人进行问卷调查,则约有1 250人不及格 [解析] (1)(ⅰ)第1组的频数为100×0.100=10, 所以①处应填的数为100-(10+20+20+10)=40, 从而第2组的频率为40100=0.400.②处应填的数为1-(0.1+0.4+0.2+0.1)=0.200. 频率分布直方图如图所示.(ⅱ)因为第3,4,5组共有50名选手,所以利用分层抽样在50名选手中抽取5名选手进入第二轮面试时,每组抽取的人数分别为:第3组:2050×5=2,第4组:2050×5=2,第5组:1050×5=1,所以第3,4,5组分别抽取2人,2人,1人进入第二轮面试. (ⅲ)(理)记“第4组至少有一名选手被考官A 面试”为事件A ,则P (A )=C 12C 13+C 22C 25=710. ⎝⎛⎭⎫或P (A )=1-P (A -)=1-C 23C 25=710(文)设第3组的2位选手为A 1,A 2,第4组的2位选手为B 1,B 2,第5组的1位选手为C 1,则从这五位选手中抽取两位选手有(A 1,A 2),(A 1,B 1),(A 1,B 2),(A 1,C 1),(A 2,B 1),(A 2,B 2),(A 2,C 1),(B 1,B 2),(B 1,C 1),(B 2,C 1),共10种情况.其中第4组的2位选手B 1,B 2,中至少有一位入选的有(A 1,B 1),(A 1,B 2),(A 2,B 1),(A 2,B 2),(B 1,B 2),(B 1,C 1),(B 2,C 1),共有7种情况,所以第4组至少有一名选手被考官A 面试的概率为710.(2)由(0.010+0.015+0.015+a+0.025+0.005)×10=1,得a=0.030,n=360=600.故①不正确,③正确;成绩在[70,80)内的频率为10a=0.3,故②10(a+0.025+0.005)正确;若对A地区5 000人进行问卷调查,则约有5 000×(0.1+0.15)=1 250人不及格,故④正确.名师点拨应用频率分布直方图时的注意事项用频率分布直方图解决相关问题时,应正确理解图表中各个量的意义,识图掌握信息是解决该类问题的关键.频率分布直方图有以下几个要点:(1)纵轴表示频率/组距;(2)频率分布直方图中各长方形高的比也就是其频率之比;(3)频率分布直方图中每一个矩形的面积是样本数据落在这个区间上的频率,所有的小矩形的面积之和等于1,即频率之和为1.〔变式训练1〕(1)(2021·安徽“皖南八校”摸底)某校高三年级有400名学生,在一次数学测试中,成绩都在[80,130](单位:分)内,其频率分布直方图如图,则这次测试数学成绩不低于100分的人数为__220__.(2)(2021·山西适应性考试)某病毒引起的肺炎的潜伏期平均为7天左右,短的约2~3天,长的约10~14天,甚至有20余天.某医疗机构对400名确诊患者的潜伏期进行统计,整理得到以下频率分布直方图.根据该直方图估计:要使90%的患者显现出明显病状,需隔离观察的天数至少是(C)A .12B .13C .14D .15[解析] (1)根据频率分布直方图知:(2a +0.04+0.03+0.02)×10=1⇒a =0.005; 计算出数学成绩不低于100分的频率为: (0.03+0.02+0.005)×10=0.55;所以这次测试数学成绩不低于100分的人数为0.55×400=220人.(2)由题可知,第一,二,三,四,五组的频率分别为0.16,0.4,0.32,0.08,0.04. 因为前三组的频率和为0.88, 故要使90%的患者显现出明显病状,则需隔离观察的天数至少是:13+0.9-0.880.02=14,故选C .考点二 茎叶图——师生共研例2 (2021·四川省乐山市调研)胡萝卜中含有大量的β-胡萝卜素,摄入人体消化器官后,可以转化为维生素A ,现从a ,b 两个品种的胡萝卜所含的β-胡萝卜素(单位mg)得到茎叶图如图所示,则下列说法不正确...的是( C ) a b 6 4 4 23 8 64 143.1 3.2 3.3 3.42 3 7 1 1 1 1 2 5 7A .x a <x bB .a 的方差大于b 的方差C .b 品种的众数为3.31D .a 品种的中位数为3.27 [解析] 由茎叶图得:b 品种所含β-胡萝卜素普遍高于a 品种, ∴x a <x b ,故A 正确;a 品种的数据波动比b 品种的数据波动大, ∴a 的方差大于b 的方差,故B 正确;b品种的众数为3.31与3.41,故C错误;a品种的数据的中位数为:3.23+3.312=3.27,故D正确.名师点拨茎叶图的绘制及应用(1)茎叶图的绘制需注意:①“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;②重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据.(2)茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等.〔变式训练2〕(2019·山东)如图所示的茎叶图记录了甲,乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x与y的值分别为(A)甲组乙组62 5x4567917y8A.3,5C.3,7 D.5,7[解析]甲组数据的中位数为65,由甲、乙两组数据的中位数相等,得y=5.又甲、乙两组数据的平均值相等,∴15×(56+65+62+74+70+x)=15×(59+61+67+65+78),∴x=3.故选A.考点三,样本数字特征——多维探究角度1样本数字特征与频率分布直方图例3 (1)如图所示是一样本的频率分布直方图,则由图形中的数据,可以估计众数与中位数分别是(B)A .12.5,12.5B .12.5,13C .13,12.5D .13,13[解析] 由频率分布直方图可知,众数为10+152=12.5,因为0.04×5=0.2,0.1×5=0.5,在频率分布直方图中,中位数左边和右边的面积相等,所以中位数在区间[10,15)内.设中位数为x ,则(x -10)×0.1=0.5-0.2,解得x =13.角度2 样本数字特征与茎叶图(2)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:⎪⎪⎪897 74 0 1 0 x 9 1则7个剩余分数的方差为__367__. [解析] 由图可知去掉的两个数是87,99,所以87+90×2+91×2+94+90+x =91×7,解得x =4,∴s 2=17[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=367.角度3 样本数字特征的计算(3)(2021·湖北武汉、襄阳、荆门、宜昌四地六校考试联盟联考)已知某7个数据的平均数为5,方差为4,现又加入一个新数据5,此时这8个数的方差s 2为( C )A .52B .3C .72D .4[解析] 设某7个数据分别为a 1,a 2,…,a 7, 则由题意得a 1+a 2+…+a 7=5×7=35, (a 1-5)2+(a 2-5)2+…+(a 7-5)2=4×7=28, 加入新数据5后的平均数x -=35+58=5,方差s 2=(a 1-5)2+(a 2-5)2+…+(a 7-5)2+(5-5)28=288=72.故选C .名师点拨平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数,中位数,众数描述其集中趋势,方差和标准差描述其波动大小.〔变式训练3〕(1)(角度1)某小区共有1 000户居民,现对他们的用电情况进行调查,得到频率分布直方图如图所示,则该小区居民用电量的中位数为__155__,平均数为__156.8__.(2)(角度2)(2021·陕西西安八校联考)在一次技能比赛中,共有12人参加,他们的得分(百分制)茎叶图如图,则他们得分的中位数和方差分别为( B )7 8 9 8 4 6 7 7 91 4 8 8 9 9A .89 54.5B .89 53.5C .87 53.5D .89 54(3)高铁、扫码支付、共享单车、网购并称中国“新四大发明”,近日对全国100个城市的共享单车和扫码支付的使用人数进行大数据分析,其中共享单车使用的人数分别为x 1,x 2,x 3,…,x 100,它们的平均数为x -,方差为s 2:其中扫码支付使用的人数分别为3x 1+2,3x 2+2,3x 3+2,…,3x 100+2,它们的平均数为x -′,方差为s ′2,则x -′,s ′2分别为( C )A .3x -+2,3s 2+2 B .3x -,3s 2 C .3x -+2,9s 2D .3x -+2,9s 2+2[解析] (1)中位数为:150+(170-150)×0.10.02×20=155.该组数据的平均数为x =0.005×20×120+0.015×20×140+0.020×20×160+0.005×20×180+0.003×20×200+0.002×20×220=156.8.(2)由题可知,中位数为:87+912=89,先求平均数:x -=78+79+84+86+87+87+91+94+98+98+99+9912=90,S 2=112[(-12)2+(-11)2+(-6)2+(-4)2+(-3)2+(-3)2+12+42+82+82+92+92]=53.5,故中位数为:89,方差为53.5,故选:B .(3)显然x -′=3x -+2,而每个数据上都加上或减去相同数不影响方差,但每个数据都乘以a ,则方差变为原方差的a 2倍,故选C .考点四,折线图——师生共研例4 (2021·河南顶级名校模拟改编)如图是某地某月1日至15日的日平均温度变化的折线图,根据该折线图,下列结论正确的是( A )A .连续三天日平均温度的方差最大的是7日,8日,9日三天B .这15天日平均温度的极差为15 ℃C .由折线图能预测16日温度要低于19 ℃D .由折线图能预测本月温度小于25 ℃的天数少于温度大于25 ℃的天数[解析] A 选项,日平均温度的方差的大小取决于日平均温度的波动的大小,7,8,9三日的日平均温度的波动最大,故日平均温度的方差最大,正确;B 选项,这15天日平均温度的极差为18 ℃,B 错;C 选项,由折线图无法预测16日温度是否低于19 ℃,故C 错误;D 选项,由折线图无法预测本月温度小于25 ℃的天数是否少于温度大于25 ℃的天数,故D 错误.故选A .名师点拨折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.〔变式训练4〕甲乙两名同学在本学期的六次考试成绩统计如图,甲乙两组数据的平均值分别为x -甲、x-乙,则下列结论正确的个数为( B )①每次考试甲的成绩都比乙的成绩高 ②甲的成绩比乙稳定 ③x -甲一定大于x -乙④甲的成绩的极差大于乙的成绩的极差 A .1 B .2 C .3D .4[解析] 第二次考试甲的成绩比乙低,①错;由图可知甲的成绩比乙的成绩波动小,②正确,④错;甲的平均成绩显然比乙的平均成绩高,③正确;故选B .名师讲坛·素养提升高考与频率分布直方图例5 (理)(2021·安徽省池州市期末)高三年级某班50名学生期中考试数学成绩的频率分布直方图如图所示,成绩分组区间为:[80,90),[90,100),[100,110),[110,120),[120,130),[130,140),[140,150].其中a ,b ,c 成等差数列且c =2a ,物理成绩统计如表.(说明:数学满分150分,物理满分100分)分组 [50,60) [60,70) [70,80) [80,90) [90,100] 频数6920105(2)根据物理成绩统计表,请估计物理成绩的中位数;(3)若数学成绩不低于140分的为“优”,物理成绩不低于90分的为“优”,已知本班中至少有一个“优”同学总数为6人,从此6人中随机抽取3人.记X 为抽到两个“优”的学生人数,求X 的分布列和期望值.(文)(2021·河南新乡模拟)甲、乙两人想参加某项竞赛,根据以往20次的测试,将样本数据分成[50,60),[60,70),[70,80),[80,90),[90,100]五组,并整理得到如下频率分布直方图:已知甲测试成绩的中位数是75.(1)求x ,y 的值,并分别求出甲、乙两人测试成绩的平均数(假设同一组中的每个数据可用该组区间中点值代替);(2)从甲、乙两人测试成绩不足60分的试卷中随机抽取3份,求恰有2份来自乙的概率. [解析] (理)(1)根据频率分布直方图得, (a +b +2c +0.024+0.020+0.004)×10 =1, 又因a +c =2b ,c =2a ,解得a =0.008,b =0.012,c =0.016, 故数学成绩的平均分x -=85×0.04+95×0.12+105×0.16+115×0.2+125×0.24 +135×0.16+145×0.08=117.8(分),(2)总人数50分,由物理成绩统计表知,中位数在成绩区间[70,80), 所以物理成绩的中位数为75分.(3)数学成绩为“优”的同学有4人,物理成绩为“优”有5人,因为至少有一个“优”的同学总数为6名同学,故两科均为“优”的人数为3人,故X 的取值为0、1、2、3.P (X =0)=C 33C 36=120,P (X =1)=C 13C 23C 36=920,P (X =2)=C 23C 13C 36=920,P (X =3)=C 33C 36=120,所以分布列为: X123P 120920920120∴期望值为E(X)=0×120+1×920+2×920+3×120=32.(文)(1)∵甲测试成绩的中位数为75,∴0.01×10+y×10+0.04×(75-70)=0.5,解得y=0.02,∴0.01×10+y×10+0.04×10+x×10+0.005×10=1,解得x=0.025.同学甲的平均分为55×0.01×10+65×0.02×10+75×0.04×10+85×0.025×10+95×0.005×10=74.5.同学乙的平均分为55×0.015×10+65×0.025×10+75×0.03×10+85×0.02×10+95×0.01×10=73.5.(2)甲测试成绩不足60分的试卷数为20×0.01×10=2,设为A,B.乙测试成绩不足60分的试卷数为20×0.015×10=3,设为a,b,c.从中抽3份的情况有(A,B,a),(A,B,b),(A,B,c),(A,a,b),(A,a,c),(A,b,c),(B,a,b),(B,a,c),(B,b,c),(a,b,c),共10种情况.满足条件的有(A,a,b),(A,a,c),(A,b,c),(B,a,b),(B,a,c),(B,b,c),共6种情况,故恰有2份来自乙的概率为610=35.名师点拨](1)通过统计图可以很清楚地表示出各部分数量同总数之间的关系.(2)准确理解频率分布直方图的数据特点是解题关键.〔变式训练5〕(2019·高考全国Ⅲ卷)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).[解析](1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05,乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.。