2015年高考数学一轮复习课时训练第2节 用样本估计总体
- 格式:doc
- 大小:1.06 MB
- 文档页数:12
第2讲用样本估计总体1.用样本的频率分布估计总体分布(1)作频率分布直方图的步骤①求极差(01最大值与02最小值的差).03组距与04组数.05分组.06频率分布表.07频率分布直方图.(2)频率分布折线图和总体密度曲线08中点,就得到频率分布折线图.09样本容量的增加,作图时10所分的组数增加,11组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.(3)茎叶图12中间的一列数,叶是从茎的13旁边生长出来的数.2.用样本的数字特征估计总体的数字特征(1)众数:一组数据中出现次数最多的数.(2)中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数.(3)平均数:x -=14x1+x2+…+xn n ,反映了一组数据的平均水平.(4)标准差:是样本数据到平均数的一种平均距离,s = 15 错误!.(5)方差:s 2=161n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2](x n 是样本数据,n 是样本容量,x -是样本平均数).1.频率分布直方图与众数、中位数与平均数的关系 (1)最高的小长方形底边中点的横坐标即是众数. (2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.2.标准差与方差的特点反映了各个样本数据聚集于样本平均数周围的程度.标准差(方差)越小,表明各个样本数据在样本平均数周围越集中;标准差(方差)越大,表明各个样本数据在样本平均数的两边越分散.3.平均数、方差的公式推广(1)若数据x 1,x 2,…,x n 的平均数为x -,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是m x -+a .(2)若数据x 1,x 2,…,x n 的方差为s 2,则: ①数据x 1+a ,x 2+a ,…,x n +a 的方差也为s 2;②数据ax 1,ax 2,…,ax n 的方差为a 2s 2.1.为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数答案 B解析因为可以用极差、方差或标准差来描述数据的离散程度,所以要评估亩产量稳定程度,应该用样本数据的极差、方差或标准差.故选B.2.(2020·云川贵百校联考)某课外小组的同学们从社会实践活动中调查了20户家庭某月的用电量,如下表所示:用电量/度120140160180200户数2358 2 则这20户家庭该月用电量的众数和中位数分别是()A.180,170 B.160,180C.160,170 D.180,160答案 A解析用电量为180度的家庭最多,有8户,故这20户家庭该月用电量的众数是180,排除B,C;将用电量按从小到大的顺序排列后,处于最中间位置的两个数是160,180,故这20户家庭该月用电量的中位数是170.故选A.3.在样本频率分布直方图中,共有9个小长方形,若中间一个小长方形的面积等于其他8个长方形的面积和的25,且样本容量为140,则中间一组的频数为()A.28 B.40 C.56 D.60 答案 B解析设中间一个小长方形的面积为x,其他8个长方形的面积和为52x,因此x+52x=1,所以x=27.所以中间一组的频数为140×27=40.故选B.4.(2019·全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是()A.中位数B.平均数C.方差D.极差答案 A解析中位数是将9个数据从小到大或从大到小排列后,处于中间位置的数据,因而去掉1个最高分和1个最低分,不变的是中位数,平均数、方差、极差均受影响.故选A.5.(2020·全国卷Ⅲ)设一组样本数据x1,x2,…,x n的方差为0.01,则数据10x1,10x2,…,10x n的方差为()A.0.01 B.0.1C.1 D.10答案 C解析因为数据ax i+b(i=1,2,…,n)的方差是数据x i(i=1,2,…,n)的方差的a2倍,所以所求数据的方差为102×0.01=1.故选C.6.对一批产品的长度(单位:毫米)进行抽样检测,样本容量为200,如图为检测结果的频率分布直方图,根据产品标准,单件产品长度在区间[25,30)的为一等品,在区间[20,25)和[30,35)的为二等品,其余均为三等品,则该样本中三等品的件数为 .答案50解析根据题中的频率分布直方图可知,三等品的频率为1-(0.0500+0.0625+0.0375)×5=0.25,因此该样本中三等品的件数为200×0.25=50.多角度探究突破考向一统计图表及应用角度1扇形图例1(2018·全国卷Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半答案 A解析设新农村建设前的收入为M,则新农村建设后的收入为2M,新农村建设前种植收入为0.6M,新农村建设后的种植收入为0.74M,所以种植收入增加了,所以A 不正确;新农村建设前其他收入为0.04M,新农村建设后其他收入为0.1M,故增加了一倍以上,所以B正确;新农村建设前,养殖收入为0.3M,新农村建设后为0.6M,增加了一倍,所以C正确;新农村建设后,养殖收入与第三产业收入的总和占经济收入的30%+28%=58%>50%,所以超过了经济收入的一半,所以D正确.故选A.角度2折线图例2(多选)(2020·海南高考调研)如图所示的折线图是2020年1月25日至2020年2月12日陕西省及西安市新冠肺炎累计确诊病例的折线图,则下列判断正确的是()A.1月31日陕西省新冠肺炎累计确诊病例中西安市占比超过了1 3B.1月25日至2月12日陕西省及西安市新冠肺炎累计确诊病例都呈递增趋势C.2月2日后到2月10日陕西省新冠肺炎累计确诊病例增加了97例D.2月8日到2月10日西安市新冠肺炎累计确诊病例的增长率大于2月6日到2月8日的增长率答案ABC解析1月31日陕西省新冠肺炎累计确诊病例共有87例,其中西安32例,所以西安市所占比例为3287>13,故A 正确;由折线图可知,1月25日到2月12日陕西省及西安市新冠肺炎累计确诊病例都呈递增趋势,故B 正确;2月2日后到2月10日陕西省新冠肺炎累计确诊病例增加了213-116=97例,故C 正确;2月8日到2月10日西安市新冠肺炎累计确诊病例增加了98-8888=544,2月6日到2月8日西安市新冠肺炎累计确诊病例增加了88-7474=737,显然737>544,故D 错误.角度3 频率分布直方图例3 (1)(2020·天津高考)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为( )A .10B .18C .20D .36答案 B解析 根据频率分布直方图可知,直径落在区间[5.43,5.47)之间的频率为(6.25+5.00)×0.02=0.225,则直径落在区间[5.43,5.47)内零件的个数为80×0.225=18.故选B.(2)(多选)(2020·临沂模拟)在某次高中学科竞赛中,4000名考生的参赛成绩统计如图所示,60分以下视为不及格,若同一组中数据用该组区间中点作代表,则下列说法中正确的有( )A.成绩在[70,80]分的考生人数最多B.不及格的考生人数为1000人C.考生竞赛成绩的平均分约为70.5分D.考生竞赛成绩的中位数为75分答案ABC解析根据频率分布直方图得,成绩出现在[70,80]的频率最大,故A正确;不及格考生数为10×(0.010+0.015)×4000=1000,故B正确;根据频率分布直方图估计考试的平均分为45×0.1+55×0.15+65×0.2+75×0.3+85×0.15+95×0.1=70.5,故C 正确;0.1+0.15+0.2=0.45<0.5,0.1+0.15+0.2+0.3=0.75>0.5,所以考生竞赛成绩的中位数为70+0.5-0.450.3×10≈71.67,故D错误.故选ABC. 常见统计图的特点(1)通过扇形统计图可以很清楚的表示出各部分数量同总数之间的关系.(2)折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.(3)准确理解频率分布直方图的数据特点①频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率,不要和条形图混淆;②频率分布直方图中各小长方形的面积之和为1,这是解题的关键,常利用频率分布直方图估计总体分布.1.(2020·葫芦岛模拟)书籍是人类的智慧结晶和进步阶梯,阅读是一个国家的文化根基和创造源泉.2014年以来,“全民阅读”连续6年被写入政府工作报告.某高中为了解学生假期自主阅读书籍类型,在全校范围内随机抽取了部分学生进行调查.学生选择的书籍大致分为以下四类:A历史类、B文学类、C科学类、D哲学类.根据调查的结果,将数据整理成如下的两幅不完整的统计图,其中a-b=10.根据上述信息,可知本次随机抽查的学生中选择A历史类的人数为()A.45 B.30C.25 D.22答案 B解析由题可知,样本容量为30-180.1=120,所以选择A历史类的人数为120-42-30-18=30.故选B.2.(2020·汕头二模)新型冠状病毒疫情发生后,口罩的需求量大增,某口罩工厂为提高生产效率,开展技术创新活动,提出两种新的生产方式,为比较两种生产方式的效率,选取80名工人,将他们随机分成两组,每组40人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.第一种生产方式40名工人完成同一生产任务所用时间(单位:min)如表:68728577838290838984 88877691799087918692 88878176959463878571 96637485929987827569 第二种生产方式40名工人完成同一生产任务所用时间(单位:min)如扇形图所示:(1)请填写第一种生产方式完成任务所用时间的频数分布表并作出频率分布直方图:生产时间[60,70)[70,80)[80,90)[90,100]频数(2)试从扇形图中估计第二种生产方式的平均数;(3)根据频率分布图和扇形图判断哪种生产方式的效率更高?并说明理由.解(1)第一种生产方式完成任务所用时间的频数分布表如下:生产时间[60,70)[70,80)[80,90)[90,100]频数481810频率分布直方图如下:(2)从扇形图中估计第二种生产方式的平均数为65×0.25+75×0.5+85×0.2+95×0.05=75.5 min.(3)从频率分布直方图中估计第一种生产方式的平均数为65×0.1+75×0.2+85×0.45+95×0.25=83.5 min,从平均数的角度发现:用第一种生产方式的工人完成生产任务所需要的时间高于80分钟;用第二种生产方式的工人完成生产任务所需要的时间低于80分钟,因此第二种生产方式的效率更高.考向二用样本估计总体例4(1)(多选)为了了解某校高一年级1600名学生的体能情况,随机抽查了部分学生,测试1分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图所示的频率分布直方图,根据统计图的数据,下列结论正确的是()A.该校高一年级学生1分钟仰卧起坐的次数的中位数为26.25次B.该校高一年级学生1分钟仰卧起坐的次数的众数为27.5次C.该校高一年级学生1分钟仰卧起坐的次数超过30次的约有320人D.该校高一年级学生1分钟仰卧起坐的次数少于20次的约有32人答案ABC解析由题图可知中位数是26.25次,众数是27.5次,1分钟仰卧起坐的次数超过30次的频率为0.2,所以估计该校高一年级学生1分钟仰卧起坐的次数超过30次的约有320人;1分钟仰卧起坐的次数少于20次的频率为0.1,所以该校高一年级学生1分钟仰卧起坐的次数少于20次的约有160人.故A,B,C正确,D错误,故选ABC.(2)(2020·香坊区校级二模)2020年初新冠病毒疫情爆发,全国范围开展了“停课不停学”的线上教学活动.哈六中数学组积极研讨网上教学策略:先采取甲、乙两套方案教学,并对分别采取两套方案教学的班级的7次线上测试成绩进行统计如图所示:①请填写如表(要求写出计算过程)平均数方差甲乙②从下列三个不同的角度对这次方案选择的结果进行分析:a.从平均数和方差相结合看(分析哪种方案的成绩更好);b.从折线图上两种方案的走势看(分析哪种方案更有潜力).解①由图象可得,x-甲=17×(109+111+113+115+117+119+121)=115,x-乙=17×(121+115+109+115+113+117+115)=115,则s2甲=17×(62+42+22+02+22+42+62)=16,s2乙=17×(62+02+62+02+22+22+02)=807≈11.43,故表格第一行:115,16;第二行:115,约为11.43.②a.因为x-甲=x-乙,s2甲>s2乙,故乙方案更好.b.由折线图可知甲走势稳定上升,故甲方案更好.众数、中位数、平均数、方差的意义及常用结论(1)平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述数据的集中趋势,方差和标准差描述数据的波动大小.(2)方差的简化计算公式:s2=1n[(x21+x2+…+x2n)-n x-2],或写成s2=1n(x21+x2+…+x2n)-x-2,即方差等于原始数据平方的平均数减去平均数的平方.3.某学校共有学生2000人,其中高一800人,高二、高三各600人,学校对学生在暑假期间每天的读书时间做了调查统计,全体学生每天的读书时间的平均数为x-=3小时,方差为s2=1.966,其中三个年级学生每天读书时间的平均数分别为x-1=2.7,x-2=3.1,x-3=3.3,又已知高一学生、高二学生每天读书时间的方差分别为s21=1,s2=2,则高三学生每天读书时间的方差s23= .答案 3解析由题意可得,1.966=8002000×[1+(2.7-3)2]+6002000×[2+(3.1-3)2]+6002000×[s23+(3.3-3)2],解得s23=3.4.(2020·南宁模拟)为了检测某种零件的一条生产线的生产过程,从生产线上随机抽取一批零件,根据其尺寸的数据得到如图所示的频率分布直方图.若尺寸落在区间(x--2s,x-+2s)之外,则认为该零件属于“不合格”的零件,其中x-,s分别为样本平均数和样本标准差,计算可得s≈15(同一组中的数据用该组区间的中点值作代表).(1)求样本平均数的大小;(2)若一个零件的尺寸是100 cm ,试判断该零件是否属于“不合格”的零件.解 (1)x -=35×10×0.005+45×10×0.010+55×10×0.015+65×10×0.030+75×10×0.020+85×10×0.015+95×10×0.005=66.5.(2)x -+2s =66.5+30=96.5,x --2s =66.5-30=36.5,100>96.5,∴该零件属于“不合格”的零件.一、单项选择题1.如图,样本A 和B 分别取自两个不同的总体,它们的样本平均数分别为x -A 和x -B ,样本标准差分别为s A 和s B ,则( )A.x -A >x -B ,s A >s BB .x -A <x -B ,s A >s B C.x -A >x -B ,s A <s BD .x -A <x -B ,s A <s B答案 B解析 由图可得样本A 的数据都在10及以下,样本B 的数据都在10及以上,所以x -A <x -B ,样本B 的数据比样本A 的数据波动幅度小,所以s A >s B ,故选B.2.在高一期中考试中,甲、乙两个班的数学成绩统计如下表: 班级 人数 平均数 方差甲20x-甲2乙30x-乙3其中x-甲=x-乙,则两个班数学成绩的方差为()A.3 B.2C.2.6 D.2.5答案 C解析由题意可知两个班的数学成绩的平均数为x-=x-甲=x-乙,则两个班数学成绩的方差为s2=2020+30[2+(x-甲-x-)2]+3020+30[3+(x-乙-x-)2]=2020+30×2+3020+30×3=2.6.3.(2020·河南省名校联考)如图给出的是某小区居民一段时间内访问网站的比例图,则下列选项中不超过21%的为()A.腾讯与百度的访问量所占比例之和B.网易与搜狗的访问量所占比例之和C.淘宝与论坛的访问量所占比例之和D.新浪与小说的访问量所占比例之和答案 B解析由于网易与搜狗的访问量所占比例之和为18%,不超过21%,故选B.4.(2020·安庆模拟)某单位统计了本单位的职工一天行走步数(单位:百步)得到如图所示的频率分布直方图,估计该单位职工一天行走步数的平均值为(同一组中的数据用该组区间的中点值为代表)()A.125 B.125.6C.124 D.126答案 B解析由频率分布直方图,估计该单位职工一天行走步数的平均值为x-=60×0.002×20+80×0.006×20+100×0.008×20+120×0.012×20+140×0.010×20+160×0.008×20+180×0.002×20+200×0.002×20=125.6.故选B.5.(2020·威海一模)恩格尔系数是食品支出总额占个人消费支出总额的比重,其数值越小说明生活富裕程度越高.统计改革开放40年来我国历年城镇和农村居民家庭恩格尔系数,绘制了如图的折线图.根据该折线图,下列结论错误的是()A.城镇居民家庭生活富裕程度不低于农村居民家庭B.随着改革开放的不断深入,城镇和农村居民家庭生活富裕程度越来越高C.1996年开始城镇和农村居民家庭恩格尔系数都低于50%D.随着城乡一体化进程的推进,城镇和农村居民家庭生活富裕程度差别越来越小答案 C解析由折线图可知,对于A,因为城镇的恩格尔系数较小,故城镇居民家庭生活富裕程度不低于农村居民,A正确;对于B,城镇和农村的恩格尔系数整体上都在下降,说明城镇和农村居民家庭生活富裕程度越来越高,B正确;对于C,1996~2000年我国农村居民家庭恩格尔系数高于50%,C错误;对于D,结合图形得到城镇和农村家庭恩格尔系数之间的差距越来越小,说明城镇和农村家庭生活富裕程度差别越来越小,D正确.故选C.6.某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是()A.各月的平均最低气温都在0 ℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20 ℃的月份有5个答案 D解析由图形可得各月的平均最低气温都在0 ℃以上,A正确;七月的平均温差约为10 ℃,而一月的平均温差约为5 ℃,故B正确;三月和十一月的平均最高气温都在10 ℃左右,基本相同,C正确;平均最高气温高于20 ℃的月份为六月、七月、八月,只有3个,D错误.7.某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布扇形图和90后从事互联网行业者岗位分布条形图,则下列结论中不一定正确的是()注:90后指1990年及以后出生,80后指1980~1989年之间出生,80前指1979年及以前出生.A.互联网行业从业人员中90后占一半以上B.互联网行业中从事技术岗位的人数超过总人数的20%C.互联网行业中从事运营岗位的人数90后比80前多D.互联网行业中从事技术岗位的人数90后比80后多答案 D解析由题图易知互联网行业从业人员90后占56%,A正确;仅90后从事技术岗位的人数占总人数的0.22176,超过20%,B正确;90后从事运营岗位的人数占总人数的0.56×0.17=0.0952>0.03,C正确;90后从事技术岗位的人数占总人数的0.22176<0.41,而题中未给出80后从事互联网行业岗位分布情况,故D不一定正确.二、多项选择题8.(2020·青岛模拟)近几年,在国家大力支持和引导下,中国遥感卫星在社会生产和生活各领域的应用范围不断扩大,中国人民用遥感卫星系统研制工作取得了显著成绩,逐步形成了气象、海洋、陆地资源和科学试验等遥感卫星系统.如图是2007~2018年中国卫星导航与位置服务产业总体产值规模(万亿)及增速(%)的统计图,则下列结论中正确的是()A.2017年中国卫星导航与位置服务产业总体产值规模达到2550亿元,较2016年增长20.40%B.若2019年中国卫星导航与位置服务产业总体产值规模保持2018年的增速,总体产值规模将达3672亿元C.2007~2018年中国卫星导航与位置服务产业总体产值规模逐年增加,但不与时间成正相关D.2007~2018年中国卫星导航与位置服务产业总体产值规模的增速中有些与时间成负相关答案ABD解析对于A,根据图中数据可知2017年中国卫星导航与位置服务产业总体产值规模达到2550亿元,较2016年增长20.40%,故A正确;对于B,2019年中国卫星导航与位置服务产业总体产值规模保持2018年的增速,即为20%,故2019年总体产值规模为3060×(1+20%)=3672(亿元),故B正确;对于C,根据正相关的定义,散点位于从左下角到右上角区域,则两个变量具有正相关关系,故C错误;对于D,根据负相关的定义,散点位于从左上角到右下角区域,则两个变量具有负相关关系,故D 正确.故选ABD.9.为了了解某校九年级1600名学生的体能情况,随机抽查了部分学生,测试1分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图所示的频率分布直方图,根据统计图的数据,下列结论正确的是()A.该校九年级学生1分钟仰卧起坐的次数的中位数为26.25次B.该校九年级学生1分钟仰卧起坐的次数的众数为27.5次C.该校九年级学生1分钟仰卧起坐的次数超过30次的人数约有320人D.该校九年级学生1分钟仰卧起坐的次数少于20次的人数约有32人答案ABC解析由题图可知中位数是26.25次,众数是27.5次,1分钟仰卧起坐的次数超过30次的频率为0.2,所以估计该校九年级学生1分钟仰卧起坐的次数超过30次的人数约有320人;1分钟仰卧起坐的次数少于20次的频率为0.1,所以该校九年级学生1分钟仰卧起坐的次数少于20次的人数约有160人.故A,B,C正确,D错误.故选ABC.10.在发生某公共卫生事件期间,我国有关机构规定:“该事件在一段时间没有发生规模群体感染的标志为连续10天,每天新增加疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,不一定符合该标志的是() A.甲地总体均值为3,中位数为4B.乙地总体均值为2,总体方差大于0C.丙地中位数为3,众数为3D.丁地总体均值为2,总体方差为3答案ABC解析由于平均数和中位数不能确定某一天的病例不超过7人,A不一定符合该标志;当总体方差大于0,不知道总体方差的具体数值,因此不能确定数据的波动大小,B不一定符合该标志;中位数和众数也不能确定某一天的病例不超过7人,C不一定符合该标志;当总体平均数是2,若有一个数据超过7,则方差就超过3,D一定符合该标志.故选ABC.三、填空题11.(2021·湖北宜昌高三月考)甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):人入选,则入选的最佳人选应是 . 答案 甲解析 因为x 甲=x 乙=9,s 2甲=15×[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=25,s 2乙=15×[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=65>s 2甲,故甲更稳定.12.已知30个数据的60%分位数是8.2,这30个数据从小到大排列后第18个数据是7.8,则第19个数据是 .答案 8.6解析 由30×60%=18,设第19个数据为x ,则7.8+x 2=8.2,解得x =8.6,即第19个数据是8.6.四、解答题13.(2019·全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A ,B 两组,每组100只,其中A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).解(1)由已知得0.70=a+0.20+0.15,故a=0.35,b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.14.我国是世界上严重缺水的国家之一,城市缺水问题较为突出.某市为了节约生活用水,计划在本市试行居民生活用水定额管理(即确定一个居民月均用水量标准,用水量不超过a的部分按照平价收费,超过a的部分按照议价收费).为了较为合理地确定出这个标准,通过抽样获得了100位居民某年的月均用水量(单位:t),制作了频率分布直方图.(1)由于某种原因频率分布直方图部分数据丢失,请在图中将其补充完整; (2)用样本估计总体,如果希望80%的居民每月的用水量不超过标准,则月均用水量的最低标准定为多少吨?并说明理由;(3)从频率分布直方图中估计该100位居民月均用水量的平均数.(同一组中的数据用该区间的中点值代表)解 (1)(2)月均用水量的最低标准应定为2.5 t .样本中月均用水量不低于2.5 t 的居民占样本总体的20%,由样本估计总体,要保证80%的居民每月的用水量不超出标准,月均用水量的最低标准应定为2.5 t.(3)这100位居民的月均用水量的平均数为0.5×⎝ ⎛⎭⎪⎪⎫14×0.10+34×0.20+54×0.30+74×0.40+94×0.60+114×0.30+134×0.10=1.875(t).。
第2讲 用样本估计总体1.若某校高一年级8个班参加合唱比赛的得分如图K15-2-1所示的茎叶图,则这组数据的中位数和平均数分别是( )图K15-2-1A .91.5和91.5B .91.5和92C .91和91.5D .92和922.学校为了调查学生在课外读物方面的支出情况,抽取了一个容量为n 的样本,其频率分布直方图如图K15-2-2,其中支出在[50,60)的同学有30人,若想在这n 人中抽取50人,则在[50,60)之间应抽取的人数为( )图K15-2-2A .10人B .15人C .25人D .30人3.在样本的频率分布直方图中,共有11个小长方形,若中间一个小矩形的面积等于其他10个小矩形的面积和的14,且样本容量为160,则中间一组的频数为( ) A .32 B .0.2C .40D .0.254.(2013年山东)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场做的9个分数的茎叶图后来有一个数据模糊,无法辨认,在图K15-2-3中以x 表示.则7个剩余分数的方差为( )图K15-2-3A.1169B.367 C .36 D.6 775.(2012届广东佛山质检)某市要对两千多名出租车司机的年龄进行调查,现从中随机抽出100名司机,已知抽到的司机年龄都在[20,45)岁之间,根据调查结果得出司机的年龄情况残缺的频率分布直方图如图K15-2-4,利用这个残缺的频率分布直方图估计该市出租车司机年龄的中位数大约是( )图K15-2-4A .31.6岁B .32.6岁C .33.6岁D .36.6岁6.(2013年广东佛山一模)课题组进行城市空气质量调查,按地域把24个城市分成甲、乙、丙三组,对应的城市个数分别为4、12、8.若用分层抽样的方法抽取6个城市,则丙组中应抽取的城市个数为____________.7.(2012年广东韶关高三调研)某班50名学生在一次百米测试中,成绩全部介于13秒与18秒之间,将测试结果分成五组:每一组[13,14);第二组[14,15),…,第五组[17,18).如图K15-2-5是按上述分组方法得到的频率分布直方图.若成绩大于或等于14秒且小于16秒认为良好,则该班在这次百米测试中成绩良好的人数等于________人.图K15-2-58.(2012年广东)由正整数组成的一组数据x1,x2,x3,x4,其平均数和中位数都是2,且标准差等于1,则这组数据为__________(从小到大排列).9.(2011年广东广州综合测试)某工厂甲、乙两个车间包装同一种产品,在自动包装传送带上每隔1小时抽一包产品,称其重量(单位:克)是否合格,分别记录抽查数据,获得重量数据的茎叶图如图K15-2-6.图K15-2-6(1) 根据样品数据,计算甲、乙两个车间产品重量的均值与方差,并说明哪个车间的产品的重量相对较稳定;(2) 若从乙车间6件样品中随机抽取2件,求所抽取的2件样品的重量之差不超过2克的概率.10.从某校高三年级800名学生中随机抽取50名测量身高,据测量,被抽取的学生的身高全部介于155 cm和195 cm之间,将测量结果按如下方式分成八组:第一组[155,160),第二组[160,165),…,第八组[190,195],图K15-2-7是按上述分组方法得到的频率分布直方图.(1)图K15-2-7(2)试估计这所学校高三年级800名学生中身高在180 cm以上(含180 cm)的人数;(3)在样本中,若第二组有1名男生,其余为女生,第七组有1名女生,其余为男生,在第二组和第七组中各选一名同学组成实验小组,问:实验小组中恰有一男一女的概率是多少?第2讲 用样本估计总体1.A 2.B 3.A4.B 解析:∵由题意知去掉一个最高分和一个最低分后,所剩数据的数据是87,90,90,91,91,94,90+x .∴这组数据的平均数是87+90+90+91+91+94+90+x 7=91,∴x =4. ∴这组数据的方差是17(16+1+1+0+0+9+9)=367. 5.C 6.2 7.278.1,1,3,3 解析:不妨设x 1≤x 2≤x 3≤x 4,x 1,x 2,x 3,x 4∈N *,依题意得x 1+x 2+x 3+x 4=8,s =14[(x 1-2)2+(x 2-2)2+(x 3-2)2+(x 4-2)2]=1, 即(x 1-2)2+(x 2-2)2+(x 3-2)2+(x 4-2)2=4,所以x 4≤3.则只能x 1=x 2=1,x 3=x 4=3,则这组数据为1,1,3,3.9.解:(1)x 甲=16(107+111+111+113+114+122)=113, x 乙=16(108+109+110+112+115+124)=113, s 2甲=16[(107-113)2+(111-113)2+(111-113)2+(113-113)2+(114-113)2+(122-113)2]=21,s 2乙=16[(108-113)2+(109-113)2+(110-113)2+(112-113)2+(115-113)2+(124-113)2]=883, ∵x 甲=x 乙,s 2甲<s 2乙 ,∴甲车间的产品的重量相对较稳定.(2)从乙车间6件样品中随机抽取两件,共有15种不同的取法:(108,109),(108,110),(108,112),(108,115),(108,124),(109,110),(109,112),(109,115),(109,124),(110,112),(110,115),(110,124),(112,115),(112,124),(115,124).设A 表示随机事件“所抽取的两件样品的重量之差不超过2克”,则A 的基本事件有4种:(108,109),(108,110),(109,110),(110,112).故所求概率为P (A )=415. 10.解:(1)由频率分布直方图得第七组频率为:1-(0.008×2+0.016×2+0.04×2+0.06)×5=0.06,∴第七组的人数为0.06×50=3.(2)800名学生中身高在180 cm 以上(含180 cm)的人数为800×0.18=144(人).(3)第二组中四人可记为a ,b ,c ,d ,其中a 为男生,b ,c ,d 为女生,第七组中三人可记为1,2,3,其中1,2为男生,所以基本事件有121b,1c,1d,2b,2c,2d,3a ,共7个,7因此实验小组中恰有一男一女的概率是12.。
2015届高考数学一轮总复习 10-2用样本估计总体基础巩固强化一、选择题1.(2013·重庆理,4)以下茎叶图记录了甲、乙两组各5名学生在一次英语听力测试中的成绩(单位:min).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x ,y 的值分别为( ) A .2,5 B .5,5 C .5,8 D .8,8[答案] C[解析] 由甲组数据中位数为15,可得x =5;而乙组数据的平均数16.8=9+15+(10+y )+18+245,可解得y =8,故选C.2.(2013·西宁模拟)已知一组数据:a 1,a 2,a 3,a 4,a 5,a 6,a 7构成公差为d 的等差数列,且这组数据的方差等于1,则公差d 等于( )A .±14B .±12C .±128D .无法求解[答案] B[解析] 这组数据的平均数为a 1+a 2+a 3+a 4+a 5+a 6+a 77=7a 47=a 4,又因为这组数据的方差等于1,所以17[(a 1-a 4)2+(a 2-a 4)2+(a 3-a 4)2+(a 4-a 4)2+(a 5-a 4)2+(a 6-a 4)2+(a 7-a 4)2]=(3d )2+(2d )2+d 2+0+d 2+(2d )2+(3d )27=4d 2=1,解得d =±12.3.已知一组正数x 1,x 2,x 3,x 4的方差为s 2=14(x 21+x 22+x 23+x 24-16),则数据x 1+2,x 2+2,x 3+2,x 4+2的平均数为( )A .2B .3[解析] 设x 1,x 2,x 3,x 4的平均值为x -,则 s 2=14[(x 1-x -)2+(x 2-x -)2+(x 3-x -)2+(x 4-x -)2]=14(x 21+x 22+x 23+x 24-4x -2), ∴4x -2=16,∴x -=2,x -=-2(舍),∴x 1+2,x 2+2,x 3+2,x 4+2的平均数为4,故选C.4.(文)(2013·辽宁理,5)某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为:[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( )A .45B .50C .55D .60 [答案] B[解析] 由频率分布直方图知,低于60分的同学所占频率为(0.005+0.01)×20=0.3,故该班的学生人数为150.3=50.故选B.(理)(2013·福建理,4)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图,已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为( )A .588B .480[解析]由频率分布直方图知40~60分的频率为(0.005+0.015)×10=0.2,故估计不少于60分的学生人数为600×(1-0.2)=480.5.为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如下图.由于不慎将部分数据丢失,但知道后5组频数和为62,设视力在4.6到4.8之间的学生数为a,最大频率为0.32,则a的值为()A.64 B.54C.48 D.27[答案] B[解析]前两组中的频数为100×(0.05+0.11)=16.∵后五组频数和为62,∴前三组为38.∴第三组为22.又最大频率为0.32,故最大频数为0.32×100=32.∴a=22+32=54,故选B.6.(文)(2013·六安一模)如图是2012年某校举办“激扬青春,勇担责任”演讲比赛上七位评委为某位选手打出的分数的茎叶图,去掉一个最高分和一个最低分后,所剩数据的中位数和平均数分别为()A.8587 B.8486C.8485 D.8586[答案] C[解析]由茎叶图知,评委为某选手打出的分数分别不79,84,84,84,86,87,93,去掉一个最高分和一个最低分后分数分别是84,84,84,86,87,所以中位数为84,平均数为15×(84+84+84+86+87)=85.(理)(2013·山东滨州一模)如图是2013年在某大学自主招生面试环节中,七位评委为某考生打出的分数的茎叶图,则去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )A.84,4.84 B .84,1.6 C .85,1.6 D .85,4[答案] C[解析] 去掉一个最高分93和一个最低分79,所剩数据的平均数x -=84+84+86+84+875=85,方差s 2=15[(84-85)2×3+(86-85)2+(87-85)2]=1.6,故选C.二、填空题7.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试.对200名学生测试所得数据作出频率分布直方图如图所示,若次数在110以上(含110次)为达标,则从图中可以看出高一学生的达标率是________.[答案] 80%[解析] 次数在110以上(含110次)的频率之和为(0.04+0.03+0.01)×10=0.8,则高一学生的达标率为0.8×100%=80%.8.(文)将容量为n 的样本中的数据分成6组,绘制频率分布直方图,若第一组至第六组数据的频率之比为2:3:4:6:4:1,且前三组数据的频数之和等于27,则n 等于________.[答案] 60[解析] 由条件知,2+3+42+3+4+6+4+1×n =27,解得n =60.(理)容量为100的样本分为10组,若前7组频率之和为0.79,而剩下三组的频数成等比数列,且其公比不为1,则剩下的三组频数最大的一组的频率是________.[答案] 0.16或0.12[解析]后三组频数和为100(1-0.79)=21,设这三组频数依次为a、ap、ap2(a、p∈N*且p>1),由题意设得,a+ap+ap2=21,∵p>1,∴1+p+p2是21的大于3的约数,∴1+p+p2=21或1+p+p2=7,得p=4或p=2.当p=4时,频数最大值为16,频率为0.16;当p=2时,频数最大值为12,频率为0.12.9.(文)(2013·湖北理,11)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示(1)直方图中x的值为________.(2)在这些用户中,用电量落在区间[100,250)内的户数为________.[答案](1)0.0044(2)70[解析]∵50×(0.0024+0.0036+0.006+x+0.0024+0.0012)=1,∴x=0.0044.用电量在区间[100,250)内的频率为50×(0.0036+0.006+0.0044)=0.7,∴户数为100×0.7=70(户).(理)(2013·北京西城一模)某年级120名学生在一次百米测试中,成绩全部介于13s与18s之间.将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率分布直方图.如果从左到右的5个小矩形的面积之比为,那么成绩在[16,18]的学生人数是________.[答案] 54[解析] 成绩在[16,18]的学生的人数所占比例为6+31+3+7+6+3=920,所以成绩在[16,18]的学生人数为120×920=54.三、解答题10.(2012·石家庄市二模)我国是世界上严重缺水的国家之一,城市缺水问题较为突出.某市为了节约生活用水,计划在本市试行居民生活用水定额管理(即确定一个居民月均用水量标准,用水量不超过a 的部分按照平价收费,超过a 的部分按照议价收费).为了较为合理地确定出这个标准,通过抽样获得了100位居民某年的月均用水量(单位:t),制作了频率分布直方图.(1)由于某种原因频率分布直方图部分数据丢失,请在图中将其补充完整;(2)用样本估计总体,如果希望80%的居民每月的用水量不超过标准,则月均用水量的最低标准定为多少吨?并说明理由;(3)从频率分布直方图中估计该100位居民月均用水量的平均数.(同一组中的数据用该区间的中点值代表)[解析] (1)(2)月均用水量的最低标准应定为2.5t.样本中月均用水量不低于2.5t 的居民有20位,占样本总体的20%,由样本估计总体,要保证80%的居民每月的用水量不超出标准,月均用水量的最低标准应定为2.5t.(3)这100位居民的月均用水量的平均数为0.5×(14×0.10+34×0.20+54×0.30+74×0.40+94×0.60+114×0.30+134×0.10)=1.875(t).能力拓展提升一、选择题11.(文)某工厂对一批产品进行了抽样检测,下图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品个数是( )A .90B .75C .60D .45 [答案] A[解析] 产品净重小于100克的频率为(0.050+0.100)×2=0.300,设样本容量为n ,则36n =0.300,所以n =120,净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.75,所以样本中净重大于或等于98克并且小于104克的产品的个数是120×0.75=90.(理)某校对高三年级的学生进行体检,现将高三男生的体重(单位:kg)数据进行整理后分成六组,并绘制频率分布直方图(如图所示).已知图中从左到右第一、第六小组的频率分别为0.16、0.07,第一、第二、第三小组的频率成等比数列,第三、第四、第五、第六小组的频率成等差数列,且第三小组的频数为100,则该校高三年级的男生总数为( )A .480B .440C .420D .400[答案] D[解析] 设第一、第二、第三小组的频率构成的等比数列公比为q ,第三、第四、第五、第六小组的频率构成的等差数列公差为d ,则由题意知即⎩⎪⎨⎪⎧0.16+0.16q +0.64q 2+6d =1,0.16q 2+3d =0.07. 消去d 得,16q 2+8q -35=0.∵q >0,∴q =54.∴第三组的频率P =0.16q 2=0.25.设男生总数为x ,则x ×25%=100,∴x =400.12.(2013·山东济南一模)某苗圃基地为了解基地内甲、乙两块地种植的同一种树苗的长势情况,从两块地各随机抽取了10株树苗,用茎叶图表示上述两组数据,对两块地抽取树苗的高度的平均数x -甲,x -乙和中位数y 甲,y 乙进行比较,下面结论正确的是( )A.x -甲>x -乙,y 甲>y 乙B.x -甲<x -乙,y 甲<y 乙 C.x -甲<x -乙,y 甲>y 乙 D.x -甲>x -乙,y 甲<y 乙 [答案] B[解析] 由茎叶图得x -甲=19+20+21+23+25+29+32+33+37+4110=28,x -乙=10+26+30+30+34+37+44+46+46+4710=35,y 甲=25+292=27,y 乙=34+372=35.5,∴x -甲<x -乙,y 甲<y 乙,故选B. 二、填空题13.(2013·福建莆田模拟)一组数据如茎叶图所示,若从中剔除2个数据,使得新数据组的平均数不变且方差最小,则剔除的2个数据的积等于________.[答案] 63[解析] 这组数据的平均数x -=3+8+12+11+13+16+217=12,由题意,剔除2个数据,平均数不变,且方差最小,则这两个数的和等于24且(x i -x -)2的和最大,所以这两个数为3与21,故剔除的2个数据的积等于3×21=63.14.(文)(2013·徐州模拟)学校为了调查学生在课外读物方面的支出情况,抽出了一个容量为n 且支出在[20,60)元的样本,其频率分布直方图如图所示,其中支出在[50,60)元的同学有30人.则n 的值为________.[答案] 100[解析] 由条件知,1-(0.01+0.024+0.036)×10=30n,∴n =100.(理)某中学为了解学生数学课程的学习情况,在3000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测这3000名学生在该次数学考试中成绩小于60分的学生数是________.[答案] 600[解析] 成绩小于60分的学生频率为:(0.002+0.006+0.012)×10=0.2 故3000名学生中成绩小于60分的学生数为:3000×0.2=600. 三、解答题15.(2013·东北三校联考)PM2.5是指悬浮在空气中的空气动力学当量直径小于或等于2.5μm 的颗粒物,也称为可入肺颗粒物,根据现行国家标准GB3095—2012,PM2.5日均值在35微克/m 3以下空气质量为一级;在35微克/m 3~75微克/m 3之间空气质量为二级;在75微克/m 3以上空气质量为超标.从某自然保护区2012年全年每天的PM2.5监测值数据中随机地抽取12天的数据作为样本,监测值如茎叶图所示(十位为茎,个位为叶):(1)求空气质量为超标的数据的平均数与方差;(2)从空气质量为二级的数据中任取2个,求这2个数据的和小于100的概率;(3)以这12天的PM2.5日均值来估计2012年的空气质量情况,估计2012年(按366天计算)中大约有多少天的空气质量达到一级或二级.[解析] (1)空气质量为超标的数据有四个:77,79,84,88, 平均数为x -=77+79+84+884=82.方差为s 2=14×[(77-82)2+(79-82)2+(84-82)2+(88-82)2]=18.5.(2)空气质量为二级的数据有五个:47,50,53,57,68,任取两个有十种可能结果:{47,50},{47,53},{47,57},{47,68},{50,53},{50,57},{50,68},{53,57},{53,68},{57,68},两个数据和小于100的结果有一种:{47,50}, 记“两个数据和小于100”为事件A ,则P (A )=110,即从空气质量为二级的数据中任取2个,这2个数据和小于100的概率为110.(3)空气质量为一级或二级的数据共8个,所以空气质量为一级或二级的频率为812=23, 366×23=244,所以,2012年的366天中空气质量达到一级或二级的天数估计为244天.16.(文)某学校为了了解学生的日平均睡眠时间(单位:h),随机选择了n 名同学进行调查.下表是这n 名同学的日睡眠时间的频率分布表.(1)求(2)统计方法中,同一组数据常用该组区间的中点值(例如区间[4,5)的中点值是4.5)作为代表.若据此计算的上述数据的平均值为6.52,求a 、b 的值,并由此估计该学校学生的日平均睡眠时间在7小时以上的概率.[解析] (1)由频率分布表可得n =60.12=50.补全数据如下表频率分布直方图如下:(2)由题意知,⎩⎪⎨⎪⎧150(6×4.5+10×5.5+a ×6.5+b ×7.5+4×8.5)=6.52,6+10+a +b +4=50. 解得a =15,b =15.设“该学校学生的日平均睡眠时间在7小时以上”为事件A , 则P (A )≈15+450=0.38答:该学校学生的日平均睡眠时间在7小时以上的概率约为0.38.(理)某校高三(1)班共有40名学生,他们每天自主学习的时间全部在180min 到330min 之间,按他们学习时间的长短分5个组统计得到如下频率分布表:(1)求分布表中s 、t (2)某兴趣小组为研究每天自主学习的时间与学习成绩的相关性,需要在这40名学生中按时间用分层抽样的方法抽取20名学生进行研究,问应抽取多少名第一组的学生?(3)已知第一组的学生中男、女生均为2人,在(2)的条件下抽取第一组的学生,求既有男生又有女生被抽中的概率.[解析] (1)s =840=0.2,t =1-0.1-s -0.3-0.25=0.15.(2)设应抽取x 名第一组的学生,则x 4=2040,得x =2.故应抽取2名第一组的学生.(3)在(2)的条件下应抽取2名第一组的学生. 记第一组中2名男生为a 1,a 2,2名女生为b 1,b 2,按时间用分层抽样的方法抽取2名第一组的学生共有6种等可能的结果,列举如下: a 1a 2,a 1b 1,a 1b 2,a 2b 1,a 2b 2,b 1b 2.其中既有男生又有女生被抽中的有a 1b 1,a 1b 2,a 2b 1,a 2b 2,共4种结果, 所以既有男生又有女生被抽中的概率为P =46=23.考纲要求1.了解频率分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题. 补充说明1.编制频率分布直方图的步骤如下:①求极差:极差是一组数据的最大值与最小值的差.②决定组距和组数:当样本容量不超过100时,常分成5~12组.组距=极差组数.③将数据分组:通常对组内数值所在区间取左闭右开区间,最后一组取闭区间,也可以将样本数据多取一位小数分组;④列频率分布表:登记频数,计算频率,列出频率分布表.将样本数据分成若干小组,每个小组内的样本个数称为频数,频数与样本容量的比值叫做这一小组的频率.频率反映数据在每组所占比例的大小.⑤绘制频率分布直方图:把横轴分成若干段,每一段对应一个组距,然后以线段为底作一矩形,它的高等于该组的频率组距,这样得出一系列的矩形,每个矩形的面积恰好是该组上的频率.这些矩形就构成了频率分布直方图.2.频率分布折线图(1)把频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图. (2)总体密度曲线如果样本容量不断增大,分组的组距不断缩小,则频率分布折线图实际上越来越接近于一条光滑曲线,这条光滑的曲线就叫总体密度曲线.3.茎叶图茎是指中间的一列数,叶是从茎的旁边生长出来的数.在样本数据较少、较为集中,且位数不多时,用茎叶图表示数据的效果较好,它较好的保留了原始数据信息,方便记录与表示,但当样本数据较多时,茎叶图就不太方便.4.方差是刻画一组数据离散程度的量,它反映一组数据围绕平均数波动的大小.方差越大,这组数据波动越大,越分散.讨论产品质量、售价高低、技术高低、产量高低、成绩高低、寿命长短等等问题,一般都是通过方差来体现.计算方差时,要依据所给数据的特点恰当选取公式以简化计算.备选习题1.从某女子跳远运动员的多次测试中,随机抽取20次成绩作为样本,按各次的成绩(单位:cm)分成五组,第一组[490,495),第二组[495,500),第三组[500,505),第四组[505,510),第五组[510,515],相应的样本频率分布直方图如图所示.(1)样本落入第三组[500,505)的频数是多少?(2)现从第二组和第五组的所有数据中任意抽取两个,分别记为m、n,求事件“|m-n|≤5”的概率.[解析](1)由频率分布直方图可知,样本落入[500,505)的频率是1-(0.01+0.02+0.04+0.03)×5=0.5,所以,样本落入[500,505)的频数是0.5×20=10.(2)第二组中有0.02×5×20=2个数据,记为a、b;第五组中有0.03×5×20=3个数据,记为A、B、C.则{m,n}的所有可能结果为{a,b},{a,A},{a,B},{a,C},{b,A},{b,B},{b,C},{A,B},{A,C},{B,C},共10种.其中使|m-n|≤5成立的有{a,b},{A,B},{A,C},{B,C},共4种.所以事件“|m-n|≤5”的概率为P=410=25.2.(2013·烟台四校联考)据悉2012年山东省高考要将体育成绩作为参考,为此,济南市为了了解今年高中毕业生的体能状况,从本市某校高中毕业班中抽取一个班进行铅球测试,成绩在8.0m(精确到0.1m)以上的为合格.把所得数据进行整理后,分成6组,并画出频率分布直方图的一部分如图所示.已知从左到右前5个小组的对应矩形的高分别为0.04,0.10,0.14,0.28,0.30,且第6小组的频数是7.(1)求这次铅球测试成绩合格的人数;(2)若由直方图来估计这组数据的中位数,指出该中位数在第几组内,并说明理由. [解析] (1)由题易知,第6小组的频率为1-(0.04+0.10+0.14+0.28+0.30)×1=0.14, ∴此次测试的总人数为70.14=50.∴这次铅球测试成绩合格的人数为(0.28×1+0.30×1+0.14×1)×50=36.(2)直方图中位数两侧的矩形面积和相等,即频率和相等,前三组的频率和为0.28,前四组的频率和为0.56,∴中位数位于第4组内.。
11.2 用样本估计总体一、选择题1.(2015·辽宁五校联考)对于一组数据x i(i=1,2,3,…,n),如果将它们改变为x i+C(i =1,2,3,…,n),其中C≠0,则下列结论正确的是()A.平均数与方差均不变B.平均数变,方差保持不变C.平均数不变,方差变D.平均数与方差均发生变化2.某校100名学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:『50,60),『60,70),『70,80),『80,90),『90,100』,则图中a的值为()A.0.006B.0.005C.0.004 5 D.0.002 53.如图是Ⅰ,Ⅱ两组各7名同学体重(单位:kg)数据的茎叶图.设Ⅰ,Ⅱ两组数据的平均数依次为x1和x2,标准差依次为s1和s2,那么()Ⅰ组Ⅱ组36781025674680123A.x1>x2,s1>s2B.x1>x2,s1<s2C.x1<x2,s1>s2D.x1<x2,s1<s24.(2015·沈阳质量检测)某大学对1 000名学生的自主招生水平测试成绩进行统计,得到样本频率分布直方图(如图),则这1 000名学生在该次自主招生水平测试中成绩不低于70分的学生数是()A.300B.400C.500D.6005.(2015·郑州第一次质量预测)PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物.如图是根据某地某日早7点到晚8点甲、乙两个PM2.5监测点统计的数据(单位:毫克/立方米)列出的茎叶图,则甲、乙两地浓度的方差较小的是()甲乙293 621 3316470.040.050.060.070.080.09123692997246A.甲B.乙C.甲、乙相等D.无法确定6.如图是依据某城市年龄在20岁到45岁的居民上网情况调查而绘制的频率分布直方图,现已知年龄在『30,35),『35,40),『40,45』的上网人数呈递减的等差数列分布,则网民年龄在『35,40)的频率为()A.0.04 B.0.06C.0.2 D.0.3二、填空题7.(2014·江苏高考)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间『80,130』上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm.8.下图茎叶图是甲、乙两人在5次综合测评中的成绩,其中一个数字被污损,则甲的平均成绩超过乙的平均成绩的概率为________.甲乙9 8 2 1 08 93 3 7 ● 99.(2015·南昌一模)在一次演讲比赛中,6位评委对一名选手打分的茎叶图如图所示,若去掉一个最高分和一个最低分,得到一组数据x i (1≤i ≤4),在如图所示的程序框图中,x 是这4个数据的平均数,则输出的v 的值为________.10.(2015·武汉调研)为组织好“市九运会”,组委会征集了800名志愿者,现对他们的年龄抽样统计后,得到如图所示的频率分布直方图,但是年龄在『25,30)内的数据不慎丢失,依据此图可得:(1)年龄在『25,30)内对应小长方形的高度为________; (2)这800名志愿者中年龄在『25,35)内的人数为________.三、解答题11.(2015·合肥质检)某电视台举办青年歌手大奖赛,有十名评委打分,已知甲、乙两名选手演唱后的得分如茎叶图所示:甲 乙6 4 387 7 5 4 299 8 71 50 1 3 6 6 8 8 9(1)从统计的角度,你认为甲与乙比较,演唱水平怎样?(2)现场有三名点评嘉宾A 、B 、C ,每位选手可以从中选两位进行指导,若选手选每位点评嘉宾的可能性相等,求甲、乙两选手选择的点评嘉宾恰有一人重复的概率.7 8 97 8 0 2 4 112.(2015·广州调研)某单位N名员工参加“社区低碳你我他”活动.他们的年龄在25岁至50岁之间.按年龄分组:第1组『25,30),第2组『30,35),第3组『35,40),第4组『40,45),第5组『45,50』,得到的频率分布直方图如图所示.下表是年龄的频率分布表.区间『25,30)『30,35)『35,40)『40,45)『45,50』人数25a b(1)求正整数a,b,N的值;(2)现要从年龄较小的第1,2,3组中用分层抽样的方法抽取6人,则年龄在第1,2,3组的人数分别是多少?(3)在(2)的条件下,从这6人中随机抽取2人参加社区宣传交流活动,求恰有1人在第3组的概率.答案1.选B 由平均数的定义,可知每个个体增加C ,则平均数也增加C ,方差不变,故选B.2.选B 由题意知,a =1-(0.02+0.03+0.04)×102×10=0.005,故选B.3.选D 由题中茎叶图可得x 1=61,x 2=62,s 1=3167,s 2=3427,故选D. 4.选D 依题意得,题中的1 000名学生在该次自主招生水平测试中成绩不低于70分的学生数是1 000×(0.035+0.015+0.010)×10=600,选D.5.选A 从茎叶图上可以观察到:甲监测点的样本数据比乙监测点的样本数据更加集中,因此甲地浓度的方差较小.6.选C 由已知得网民年龄在『20,25)的频率为0.01×5=0.05,在『25,30)的频率为0.07×5=0.35.因为年龄在『30,35),『35,40),『40,45』的上网人数呈递减的等差数列分布,所以其频率也呈递减的等差数列分布,又年龄在『30,45』的频率为1-0.05-0.35=0.6,所以年龄在『35,40)的频率为0.2.故选C.7.『解析』由频率分布直方图可得树木底部周长小于100 cm 的频率是(0.025+0.015)×10=0.4,又样本容量是60,所以频数是0.4×60=24.『答案』248.『解析』由图可知,甲的5次成绩分别是88,89,90,91,92,易知甲的平均分为90.乙的成绩分别是83,83,87,99,其中被污损的成绩为90到99中的某一个.设被污损的那次成绩为x ,由甲的平均成绩超过乙的平均成绩,得83+83+87+x +995<90.所以x <98.又x 是90到99的十个整数中的其中一个,其中有8个整数小于98,所以x <98的概率为810=45.『答案』459.『解析』根据题意得到的数据为78,80,82,84,则x =81.该程序框图的功能是求以上数据的方差,故输出的v 的值为(78-81)2+(80-81)2+(82-81)2+(84-81)24=5.『答案』510.『解析』(1)因为各个小长方形的面积之和为1,所以年龄在『25,30)内对应小长方形的高度为15『1-(5×0.01+5×0.07+5×0.06+5×0.02)』=0.04.(2)年龄在『25,35)内的频率为0.04×5+0.07×5=0.55,人数为0.55×800=440.『答案』(1)0.04 (2)44011.解:(1)由茎叶图可得:x 甲=87.5,x 乙=86.7,x 甲>x 乙,所以甲演唱水平更高一点,但甲的方差较大,即评委对甲的水平认可存在较大的差异.(2)依题意,共有9个基本事件:其中,甲、乙两选手选择的点评嘉宾恰重复一人包含6个基本事件.所以所求概率为69=23. 12.解:(1)由频率分布直方图可知,『25,30)与『30,35)两组的人数相同,所以a =25. 且b =25×0.080.02=100.总人数N =250.02×5=250.(2)因为第1,2,3组共有25+25+100=150人,利用分层抽样在150名员工中抽取6人,每组抽取的人数分别为:第1组的人数为6×25150=1,第2组的人数为6×25150=1,第3组的人数为6×100150=4,所以第1,2,3组分别抽取1人,1人,4人.(3)由(2)可设第1组的1人为A ,第2组的1人为B ,第3组的4人分别为C 1,C 2,C 3,C 4,则从6人中抽取2人的所有可能结果为:(A ,B ),(A ,C 1),(A ,C 2),(A ,C 3),(A ,C 4),(B ,C 1),(B ,C 2),(B ,C 3),(B ,C 4),(C 1,C 2),(C 1,C 3),(C 1,C 4),(C 2,C 3),(C 2,C 4),(C 3,C 4),共有15种.其中恰有1人年龄在第3组的所有结果为:(A ,C 1),(A ,C 2),(A ,C 3),(A ,C 4),(B ,C 1),(B ,C 2),(B ,C 3),(B ,C 4),共有8种.所以恰有1人年龄在第3组的概率为815.。
第2讲用样本估计总体基础巩固题组(建议用时:40分钟)一、选择题1.(2014·青岛检测)如图是一容量为100的样本的质量的频率分布直方图,样本质量均在『5,20』内,其分组为『5,10),『10,15),『15,20』,则样本质量落在『15,20』内的频数为()A.10 B.20C.30 D.40解析由题意得组距为5,故样本质量在『5,10),『10,15)内的频率分别为0.3和0.5,所以样本质量在『15,20』内的频率为1-0.3-0.5=0.2,频数为100×0.2=20,故选B.答案B2.(2015·西安检测)某班级有50名学生,其中有30名男生和20名女生,随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法中一定正确的是() A.这种抽样方法是一种分层抽样B.这种抽样方法是一种系统抽样C.这五名男生成绩的方差大于这五名女生成绩的方差D.该班级男生成绩的平均数小于该班女生成绩的平均数解析依题意,显然不能确定题中的抽样方法是属于哪种抽样,因此选项A,B均不正确;选项D,仅有5名男生,5名女生的数学成绩,而不能得出该班男生成绩的平均数小于该班女生成绩的平均数;对于C,注意到将这五个男生与女生的成绩均按由小到大排列,这五名男生的成绩相对较为分散,因此这五名男生成绩的方差大于这五名女生成绩的方差,故选C.答案C3.(2014·临沂一模)某中学高三从甲、乙两个班中各选出7名学生参加数学竞赛,他们取得的成绩(满分100分)的茎叶图如图,其中甲班学生成绩的众数是85,乙班学生成绩的中位数是83,则x+y的值为()A.7 B.8C.9 D.10解析由茎叶图可知,甲班学生成绩的众数是85,所以x=5.乙班学生成绩的中位数是83,所以y=3,所以x+y=5+3=8.答案B4.(2015·东北三省三校联考)在某次测量中得到的A样本数据如下:42,43,46,52,42,50,若B样本数据恰好是A样本数据每个都减5后所得数据,则A,B两样本的下列数字特征对应相同的是() A.平均数B.标准差C.众数D.中位数解析利用平均数、标准差、众数、中位数等统计特征数的概念求解.由B 样本数据恰好是A样本数据每个都减5后所得数据,可得平均数、众数、中位数分别是原来结果减去5,即与A样本不相同,标准差不变,故选B.答案B5.(2015·沈阳监测)某高校进行自主招生,先从报名者中筛选出400人参加笔试,再按笔试成绩择优选出100人参加面试.现随机调查了24名笔试者的成绩,如下表所示:分数段『60,65)『65,70)『70,75)『75,80)『80,85)『85,90』人数 2 3 49 5 1 A .75 B .80 C .85D .90解析 因为参加笔试的400人中择优选出100人,故每个人被择优选出的概率P =100400=14,因为随机调查24名笔试者,则估计能够参加面试的人数为24×14=6,观察表格可知,分数在『80,85)有5人,分数在『85,90)的有1人,故面试的分数线大约为80分,故选B. 答案 B 二、填空题6.(2014·甘肃诊断)如图是根据某赛季甲、乙两名篮球运动员参加11场比赛的得分情况画出的茎叶图.若甲运动员的中位数为a ,乙运动员的众数为b ,则a -b =________.解析 由茎叶图可知甲运动员的中位数为a =19,乙运动员的众数为b =11,所以a -b =8. 答案 87.样本中共有五个个体,其值分别为a ,0,1,2,3.若该样本的平均值为1,则样本方差为________.解析 由题可知样本的平均值为1,所以a +0+1+2+35=1,解得a =-1,所以样本的方差为15『(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2』=2. 答案 28.(2015·银川检测)某企业3个分厂同时生产同一种电子产品,第一、二、三分厂的产量之比为1∶2∶1,用分层抽样方法(每个分厂的产品为一层)从3个分厂生产的电子产品中共取100件作使用寿命的测试,由所得的测试结果算得从第一、二、三分厂取出的产品的使用寿命的平均值分别为980 h,1 020 h,1 032 h,则抽取的100件产品的使用寿命的平均值为________h.解析依题意,抽取的100件产品来自于第一、二、三分厂分别有25,50,25件,因此抽取的100件产品的使用寿命的平均值为1100(980×25+1 032×25+1 020×50)=1 013(h).答案 1 013三、解答题9.某校高一某班的某次数学测试成绩(满分为100分)的茎叶图和频率分布直方图都受了不同程度的破坏,但可见部分如图,据此解答下列问题:(1)求分数在『50,60』的频率及全班人数;(2)求分数在『80,90』之间的频数,并计算频率分布直方图中『80,90』间的矩形的高.解(1)分数在『50,60』的频率为0.008×10=0.08.由茎叶图知,分数在『50,60』之间的频数为2,所以全班人数为20.08=25.(2)分数在『80,90』之间的频数为25-2-7-10-2=4,频率分布直方图中『80,90』间的矩形的高为425÷10=0.016.10.(2014·北京卷)从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率;(2)求频率分布直方图中的a,b的值;(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组(只需写出结论).解(1)根据频数分布表知,100名学生中一周课外阅读时间不少于12小时的学生共有6+2+2=10(名),所以样本中的学生一周课外阅读时间少于12小时的频率是1-10100=0.9.故从该校随机选取一名学生,估计其该周课外阅读时间少于12小时的概率为0.9.(2)课外阅读时间落在组『4,6)内的有17人,频率为0.17,所以a=频率组距=0.172=0.085.课外阅读时间落在组『8,10)内的有25人,频率为0.25,所以b=频率组距=0.252=0.125.(3)样本中的100名学生该周课外阅读时间的平均数在第4组.能力提升题组(建议用时:25分钟)11.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成『0,5),『5,10),…,『30,35),『35,40』时,所作的频率分布直方图是()解析由于频率分布直方图的组距为5,排除C、D,又『0,5),『5,10)两组各一人,排除B,应选A.答案A12.(2014·益阳模拟)为了了解某校九年级1 600名学生的体能情况,随机抽查了部分学生,测试1分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图所示的频率分布直方图,根据统计图的数据,下列结论错误的是()A.该校九年级学生1分钟仰卧起坐的次数的中位数为26.25次B.该校九年级学生1分钟仰卧起坐的次数的众数为27.5次C.该校九年级学生1分钟仰卧起坐的次数超过30次的人数约有320人D.该校九年级学生1分钟仰卧起坐的次数少于20次的人数约有32人解析由题图可知中位数是26.25次,众数是27.5次,1分钟仰卧起坐的次数超过30次的频率为0.2,所以估计该校九年级学生1分钟仰卧起坐的次数超过30次的人数约有320人;1分钟仰卧起坐的次数少于20次的频率为0.1,所以该校九年级学生1分钟仰卧起坐的次数少于20次的人数约有160人.故D是错误的,选D.答案D13.在样本的频率分布直方图中,共有4个小长方形,这4个小长方形的面积由小到大构成等比数列{a n},已知a2=2a1,且样本容量为300,则小长方形面积最大的一组的频数为________.解析∵小长方形的面积由小到大构成等比数列{a n},且a2=2a1,∴样本的频率构成一个等比数列,且公比为2,,∴a1+2a1+4a1+8a1=15a1=1,∴a1=115∴小长方形面积最大的一组的频数为300×8a1=160.答案16014.为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A 药,20位患者服用B 药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h),试验的观测结果如下: 服用A 药的20位患者日平均增加的睡眠时间: 0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4 服用B 药的20位患者日平均增加的睡眠时间: 3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4 1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好? (2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?解 (1)设A 药观测数据的平均数为x -A ,B 药观测数据的平均数为x -B ,则x -A =120(0.6+1.2+2.7+1.5+2.8+1.8+2.2+2.3+3.2+3.5+2.5+2.6+1.2+2.7+1.5+2.9+3.0+3.1+2.3+2.4)=2.3.x -B =120(3.2+1.7+1.9+0.8+0.9+2.4+1.2+2.6+1.3+1.4+1.6+0.5+1.8+0.6+2.1+1.1+2.5+1.2+2.7+0.5)=1.6.则x -A >x -B ,因此A 药的疗效更好. (2)由观测结果绘制如下茎叶图:从茎叶图可以看出,A 药疗效的试验结果有710的叶集中在茎“2.”,“3.”上;B 药疗效的试验结果有710的叶集中在茎“0.”,“1.”上.由上述可看出A药的疗效更好.。
【与名师对话】2015高考数学一轮复习 9.2 用样本估计总体课时作业理(含解析)新人教A版一、选择题1.(2013·厦门市高三质检)某雷达测速区规定:凡车速大于或等于80 km/h的汽车视为“超速”,并将受到处罚.如图是某路段的一个检测点对200辆汽车的车速进行检测所得结果的频率分布直方图,则从图中可以看出被处罚的汽车大约有( )A.20辆 B.40辆 C.60辆 D.80辆解析:由图知车速大于或等于80 km/h的频率为0.1,被罚车辆大约为200×0.1=20辆,选A.答案:A2.(2013·武汉调研测试)某校100名学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100],则图中a 的值为( )A .0.006B .0.005C .0.004 5D .0.002 5解析:频率分布直方图中、各个矩形的面积和为1,所以20a +0.2+0.3+0.4=1,∴a =0.005.答案:B3.(2013·安徽亳州高三摸底联考)样本中共有五个个体,其值分别为a,2,3,4,5,若该样本的平均值为3,则样本方差为( )A.65 B.65C. 2 D .2 解析:由a +2+3+4+55=3得a =1∴方差S 2=15[(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2]=2.∴故答案为D. 答案:D4.(2013·石家庄第二次模拟)给定一组数据x 1,x 2,…,x 20,若这组数据的方差为3,则数据2x 1+3,2x 2+3,…,2x 20+3的方差为( )A .6B .9C .12D .15解析:由D (a ξ+b )=a 2D (ξ),可知2x 1+3,2x 2+3,…,2x 20+3的方差为12.故选C. 答案:C5.(2012·陕西卷)从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲乙两组数据的平均数分别为x 甲,x 乙,中位数分别为m 甲,m 乙,则( )A.x 甲<x 乙,m 甲>m 乙B.x 甲<x 乙,m 甲<m 乙C.x 甲>x 乙,m 甲>m 乙D.x 甲>x 乙,m 甲<m 乙解析:由题图可得x 甲=34516=21.562 5,m 甲=20,x 乙=45716=28.562 5,m 乙=29, 所以x 甲<x 乙,m 甲<m 乙.故选B. 答案:B6.(2012·安徽卷)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差解析:由图可得,x 甲=4+5+6+7+85=6,x 乙=3×5+6+95=6,故A 错;而甲的成绩的中位数为6,乙的成绩的中位数为5,故B 错;s 2甲=4-6 2+ 5-6 2+ 6-6 2+ 7-6 2+ 8-6 25=2,s 2乙=3× 5-6 2+ 6-6 2+ 9-625=2.4,故C 正确;甲的成绩的极差为4,乙的成绩的极差也为4,故D 错.答案:C 二、填空题7.(2013·贵州省六校第一次联考)某同学学业水平考试的9科成绩如茎叶图所示,则根据茎叶图可知该同学的平均分为________.解析:由茎叶图可知该同学的分数由个位及十位数组成,个位数的平均数与十位数的平均数之和为该同学的平均数,所以平均分为:x =1×60+4×70+3×80+1×909+3×8+2×9+2×2+1+39=670+509=80.答案:808.(2013·马鞍山第一次质检)已知总体的各个个体的值由小到大依次为3,7,a ,b,12,20,且总体的中位数为12,若要使该总体的标准差最小,则a =________.解析:总体的中位数为a +b2=12,即a +b =24,数据是从小到大排列的7≤a ≤b ≤12,∴a =b =12.答案:129.(2013·保定市高三第一次模拟)一个频率分布表(样本容量为50)不小心被损坏了一部分,只记得样本中数据在[20,60)上的频率为0.6,则估计样本在[40,50),[50,60)内的数据个数之和是________.解析:由已知样本数据在[20,60)上的频率为0.6,故在[20,60)上的数据为30,则在[40,50),[50,60)内的数据个数之和为21.答案:21三、解答题10.为征求个人所得税法修改建议,某机构对当地居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(每个分组包括左端点,不包括右端点,如第一组表示收入在[1 000,1 500)).(1)求居民月收入在[3 000,4 000)的频率; (2)根据频率分布直方图估算样本数据的中位数;(3)为了分析居民的收入与年龄、职业等方面的关系,必须按月收入再从这10 000人中用分层抽样方法抽出100人作进一步分析,则月收入在[2 500,3 000)的这段应抽多少人?解:(1)居民月收入在[3 000,4 000)的频率为(0.000 3+0.000 1)×500=0.2. (2)第一组和第二组的频率之和为(0.000 2+0.000 4)×500=0.3, 第三组的频率为0.000 5×500=0.25, 因此,可以估算样本数据的中位数为 2 000+0.5-0.30.25×500=2 400(元).(3)第四组的人数为0.000 5×500×10 000=2 500,因此月收入在[2 500,3 000)的这段应抽2 500×10010 000=25(人).11.某工厂对200个电子元件的使用寿命进行检查,按照使用寿命(单位:h),可以把这批电子元件分成第一组[100,200],第二组(200,300],第三组(300,400],第四组(400,500],第五组(500,600],第六组(600,700],由于工作中不慎将部分数据丢失,现有以下部分图表:(2)求图2中阴影部分的面积;(3)若电子元件的使用时间超过300h 为合格产品,求这批电子元件合格的概率. 解:(1)由题意可知0.1=A ·100,∴A =0.001, ∵0.1=B200,∴B =20,又C =0.1,D =30200=0.15,E =0.2×200=40,F =0.4×200=80,G =20200=0.1,∴H =10,I =10200=0.05.(2)阴影部分的面积为0.4+0.1=0.5.(3)电子元件的使用时间超过300 h 的共有40+80+20+10=150个,故这批电子元件合格的概率P =150200=34.[热点预测]12.(1)(2013·莆田质检)一组数据如茎叶图所示.若从中剔除2个数据,使得新数据组的平均数不变且方差最小,则剔除的2个数据的积等于________.(2)(2013·江门佛山两市质检)为了解一片速生林的生长情况,随机测量了其中100株树木的底部周长(单位:cm).根据所得数据画出样本的频率分布直方图(如下图),那么在这100株树木中,底部周长小于110cm 的株数是( )A .30B .60C .70D .80解析:(1)这组数据的平均数x =3+8+12+11+13+16+217=12,若剔除两个数据后平均数不变,则这两个数之和为24.若使方差最小,则这两个数应与12的差较大,所以剔除3和21,其乘积为3×21=63.(2)100×(0.1+0.2+0.4)=70. 答案:(1)63 (2)C。
第2节用样本估计总体课时训练练题感提知能【选题明细表】A组一、选择题1.(2013汕头检测)学校为了调查学生在课外读物方面的支出情况,抽出了一个容量为n的样本,其频率分布直方图如图所示,其中支出在[50,60)元的同学有30人,则n的值为( A )(A)100 (B)1000 (C)90 (D)900解析:由频率分布直方图可看出,支出在[50,60)元的同学的频率为1-(0.01+0.024+0.036)×10=0.3,∴n==100,故应选A.2.(2013广东梅州二模)为了研究一片大约一万株树木的生长情况,随机测量了其中100株树木的底部周长(单位:cm),根据所得数据画出的样本频率分布直方图如图,那么在这片树木中底部周长大于100 cm的株数大约为( C )(A)3000 (B)6000 (C)7000 (D)8000解析:底部周长大于100 cm的频率为1-(0.01+0.02)×10=0.7,则一万株树木中底部周长大于100 cm的株数大约为0.7×10000=7000.故选C.3.(2012年高考山东卷)在某次测量中得到的A样本数据如下:82,84, 84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据每个都加2后所得数据,则A,B两样本的下列数字特征对应相同的是( D ) (A)众数(B)平均数(C)中位数(D)标准差解析:由题原来众数88变为90,中位数由86变为88,平均数增加2.所以每个数与平均数的差不变,即标准差不变.故选D.4.(2013惠州市一模)甲、乙、丙、丁四人参加国际奥林匹克数学竞赛选拔赛,四人的平均成绩和方差如下表:平均成绩从这四人中选择一人参加国际奥林匹克数学竞赛,最佳人选是( C )(A)甲 (B)乙 (C)丙 (D)丁解析:乙、丙的平均成绩最好,且丙的方差小于乙的方差,即丙的发挥较稳定,故选C.5.某校甲、乙两个班级各有编号为1,2,3,4,5的五名学生进行投篮练习,每人投10次,投中的次数如表:则以上两组数据的方差中较小的一个为s2,则s2等于( A )(A)(B)(C)(D)4解析:甲班的平均数为==7,甲班的方差为==;乙班的平均数为==7,乙班的方差为==.∵>,∴s2=.故选A.6.(2013年高考重庆卷)如图所示的茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分),已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为( C )(A)2,5 (B)5,5 (C)5,8 (D)8,8解析:因为甲组数据的中位数为15,由茎叶图可得x=5,因乙组数据的平均数为16.8,则=16.8,解得y=8.故选C.二、填空题7.(2013惠州二调)甲、乙两名篮球运动员在某几场比赛得分的茎叶图如图所示,则甲、乙两人这几场比赛得分的中位数之和是.解析:由题图可知甲得分的中位数为36,乙得分的中位数为28,故和为64.8.如图是某青年歌手大奖赛上七位评委为甲、乙两名选手打出的分数的茎叶图(其中m为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a1,a2,则a1与a2的大小关系是.解析:去掉一个最高分和一个最低分后,甲选手叶上的数字之和是20,乙选手叶上的数字之和是25,故a2>a1.答案:a2>a19.(2013威海模拟)某商场调查旅游鞋的销售情况,随机抽取了部分顾客的购鞋尺寸,整理得如下频率分布直方图,其中直方图从左至右的前3个小矩形的面积之比为1∶2∶3,则购鞋尺寸在[39.5,43.5)内的顾客所占百分比为.解析:后两个小组的频率为(0.0375+0.0875)×2=0.25,所以前3个小组的频率为1-0.25=0.75,又前3个小组的面积比为1∶2∶3,即前3个小组的面积比即频率比为1∶2∶3.所以第三小组的频率为×0.75=0.375,第四小组的频率为0.0875×2=0.175,所以购鞋尺寸在[39.5,43.5)的频率为0.375+0.175=0.55=55%.10.(2013年高考湖北卷)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.(1)直方图中x的值为;(2)在这些用户中,用电量落在区间[100,250)内的户数为. 解析:(1)(0.0060+0.0036+0.0024×2+0.0012+x)×50=1,x=0.0044.(2)(0.0036+0.0060+0.0044)×50×100=70.答案:(1)0.0044 (2)70三、解答题11.(2013年高考安徽卷)为调查甲、乙两校高三年级学生某次联考数学成绩情况,用简单随机抽样,从这两校中各抽取30名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如图:(1)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);(2)设甲、乙两校高三年级学生这次联考数学平均成绩分别为,,估计-的值.解:(1)设甲校高三年级学生总人数为n,则=0.05⇒n==600,甲校样本数据人数为30,及格人数为25,所以估计甲校这次联考数学成绩及格率P==.(2)=,=,-=-==0.5.故-的估计值为0.5分.12.(2013年高考新课标全国卷Ⅰ)为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h),试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.52.5 2.6 1.2 2.7 1.5 2.93.0 3.1 2.3 2.4服用B药的20位患者日平均增加的睡眠时间:3.2 1.7 1.9 0.8 0.9 2.4 1.22.6 1.3 1.4 1.6 0.5 1.8 0.62.1 1.1 2.5 1.2 2.7 0.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?(2)根据两组数据完成茎叶图,从茎叶图看,哪种药的疗效更好?解:(1)设A药观测数据的平均数为,B药观测数据的平均数为,由观测结果可得=(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3.=(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6.由以上计算结果可得>,因此可看出A药的疗效更好.(2)由观测结果可绘制茎叶图从以上茎叶图可以看出,A药疗效的试验结果有一半的叶集中在茎2.上,而B药疗效的试验结果有的叶集中在茎0.,1.,2.上,较为分散,由此可看出A药的疗效更好.13.某校从参加高一年级期中考试的学生中随机抽出60名学生,将其物理成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如图所示的频率分布直方图,观察图形的信息,回答下列问题:(1)求分数在[70,80)内的频率,并补全这个频率分布直方图;(2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试中的平均分.解:(1)设分数在[70,80)内的频率为x,根据频率分布直方图,有(0.010+0.015×2+0.025+0.005)×10+x=1,可得x=0.3,所以频率分布直方图如图所示.(2)平均分为:x=45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=7 1(分).B组14.(2013年高考四川卷)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示.以组距为5的数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是( A )解析:法一由茎叶图知,各组频数统计如表:此表对应的频率分布直方图为选项A,故选A.法二选项C、D组距为10与题意不符,舍去,又由茎叶图知落在区间[0,5)与[5,10)上的频数相等,故频率、也分别相等,比较A、B两个选项知A正确,故选A.15.已知总体的各个体的值由小到大依次为2,3,3,7,a,b,12,13.7,18.3,20,且总体的中位数为10.5,若要使该总体的方差最小,则a,b的取值分别是, .解析:∵中位数为10.5,∴=10.5,即a+b=21.∵==10,∴s2=[(2-10)2+(3-10)2×2+(7-10)2+(a-10)2+(b-10)2+(12-10)2+ (13.7-10)2+(18.3-10)2+(20-10)2].令y=(a-10)2+(b-10)2=2a2-42a+221=2(a-)2+,当a=10.5时,y取最小值,方差s2也取最小值.∴a=10.5,b=10.5.答案:10.5 10.516.(2013年高考辽宁卷)为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为.解析:设5个班级中参加的人数分别为x1,x2,x3,x4,x5(其中x1<x2<x3<x4<x5),则由题意知=7,(x1-7)2+(x2-7)2+(x3-7)2+(x4-7)2+(x5-7)2=20,若(x5-7)2=16,则x1,x2,x3,x4与7相减平方最小值为0,1,1,4不符合,若(x5-7)2=4.则x1,x2,x3,x4与7相减的平方最大值为:4,1,1,0也不合题意,则必为0+1+1+9+9=20,由|x-7|=3可得x=10或x=4,由|x-7|=1可得x=8或x=6,由|x-7|=0,得x=7.由上可知参加的人数分别为4,6,7,8,10,故最大值为10.答案:10。