智慧测评新高考人教A版理科数学一轮总复习课时训练9.2用样本估计总体(含答案详析)
- 格式:doc
- 大小:218.50 KB
- 文档页数:7
第九章 统计9.2 用样本估计总体9.2.3 总体集中趋势的估计学习目标1. 理解样本数据基本数字特征的意义和作用,对样本数据中提取的基本数字特征(如众数、中位数、平均数)作出合理解释;2. 体会用样本估计总体的思想,会用样本的基本数字特征估计总体的基本数字特征;3. 体会样本数字特征的随机性;4. 会用样本估计总体的思想解决实际问题.随堂训练1. 一个样本的容量为60,分成5组,已知第一组、第三组的频数分别是9、10,第二、五组的频率都为15,则该样本的中位数在( ) A .第二组 B .第三组 C .第四组 D .第五组2. 对某小区100户居民的月均用水量进行统计,得到样本的频率分布直方图如图所示,则估计此样本的众数、中位数分别为( )A .2.25,2.5B .2.25,2.02C .2,2.5D .2.5,2.253. 为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为m e ,众数为m 0,平均值为x ,则( )A.m e=m0=x B.m e=m0<xC.m e<m0<x D.m0<m e<x4. 已知一组数据按从小到大排列为-1,0,4,x,6,15,且这组数据的中位数是5,那么数据的众数是________,平均数是________.5. 我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(3)估计居民月均用水量的中位数.6. 一次数学知识竞赛中,两组学生成绩如下:经计算,已知两个组的平均分都是80分,请根据所学过的统计知识,进一步判断这次竞赛中哪个组更优秀,并说明理由.答案随堂训练1. 答案:B解析:第二组的频数为60×15=12, ∵9+12=21<30,9+12+10=31>30,∴中位数在第三组.故选B.2. 答案:B解析:众数是指样本中出现频率最高的数,在频率分布直方图中通常取该组区间的中点,所以众数为2+2.52=2.25.中位数是频率为0.5的分界点,由频率分布直方图,可知前4组的频率和为(0.08+0.16+0.30+0.44)×0.5=0.49,因此中位数出现在第5组,设中位数为x ,则(x -2)×0.5=0.01,解得x =2.02.故选B.3. 答案:D解析:由题目所给的统计图可知,30个数据按大小顺序排列好后,中间两个数为5,6,故中位数为m e =5+62=5.5.又众数为m 0=5, 平均值x =3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×230=17930≈5.97, ∴m 0<m e <x .故选D.4.答案:6;5解析:∵中位数为5,∴4+x 2=5,即x =6. ∴该组数据的众数为6,平均数为-1+0+4+6+6+156=5. 5.答案:解:(1)由频率分布直方图,可知月均用水量在[0,0.5)的频率为0.08×0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5)等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a +0.5×a ,解得a =0.30.(2)由(1),100位居民月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12, 由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300000×0.12=36000.(3)设中位数为x 吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5,而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5,所以2≤x<2.5.由0.50×(x-2)=0.5-0.48,解得x=2.04.故可估计居民月均用水量的中位数为2.04吨.6.答案:解:(1)甲组成绩的众数为90分,乙组成绩的众数为70分,从成绩的众数这一角度看,甲组成绩好些.(2)甲、乙两组成绩的中位数、平均数都是80分,其中甲组成绩在80分以上(含80分)的有33人,乙组成绩在80分以上(含80分)的有26人,从这一角度看,甲组成绩总体较好.(3)从成绩统计表看,甲组成绩大于或等于90分的有20人,乙组成绩大于或等于90分的有24人,所以乙组成绩在高分段的人数多.同时,乙组满分比甲组多6人,从这一角度看,乙组成绩较好.。
2024年广东省高考数学一轮复习第9章第2讲:用样本估计总体考试要求 1.会用统计图表对总体进行估计,会求n个数据的第p百分位数.2.能用数字特征估计总体集中趋势和总体离散程度.知识梳理1.百分位数一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.2.平均数、中位数和众数(1)平均数:x=1n(x1+x2+…+x n).(2)中位数:将一组数据按从小到大或从大到小的顺序排列,处在最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时).(3)众数:一组数据中出现次数最多的数据(即频数最大值所对应的样本数据).3.方差和标准差(1)方差:s2=1n错误!(x i -x)2或1n错误!2i-x2.(2)标准差:s=错误!.4.总体(样本)方差和总体(样本)标准差(1)一般式:如果总体中所有个体的变量值分别为Y1,Y2,…,Y N,总体平均数为Y,则总体方差S2=1N错误!(Y i-Y)2.(2)加权式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Y k,其中Y i出现的频数为f i(i=1,2,…,k),则总体方差为S2=1N错误!i(Y i-Y)2.常用结论1.若x1,x2,…,x n的平均数为x,那么mx1+a,mx2+a,…,mx n+a的平均数为m x+a.2.数据x1,x2,…,x n与数据x1′=x1+a,x2′=x2+a,…,x n′=x n+a的方差相等,即数据经过平移后方差不变.3.若x1,x2,…,x n的方差为s2,那么ax1+b,ax2+b,…,ax n+b的方差为a2s2.思考辨析判断下列结论是否正确(请在括号中打“√”或“×”)(1)对一组数据来说,平均数和中位数总是非常接近.(×)(2)方差与标准差具有相同的单位.(×)(3)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变.(√)(4)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.(√)教材改编题1.若数据x1,x2,…,x9的方差为2,则数据2x1,2x2,…,2x9的方差为()A.2B.4C.6D.8答案D解析根据方差的性质可知,数据x1,x2,…,x9的方差s2=2,那么数据2x1,2x2,…,2x9的方差为22s2=8.2.某射击运动员7次的训练成绩分别为86,88,90,89,88,87,85,则这7次成绩的第80百分位数为()A.88.5B.89C.91D.89.5答案B解析7次的训练成绩从小到大排列为85,86,87,88,88,89,90,7×80%=5.6,所以第80百分位数为从小到大排列的数据中的第6个数据,即89.3.某校体育节10名旗手的身高(单位:cm)分别为175,178,176,180,179,175,176,179,180,179,则中位数为________.答案178.5解析把10名旗手的身高从小到大排列为175,175,176,176,178,179,179,179,180,180,则178+1792=178.5,所以所求中位数为178.5.题型一样本的数字特征和百分位数的估计例1(1)从某中学抽取10名同学,他们的数学成绩如下:82,85,88,90,92,92,92,96,96,98(单位:分),则这10名同学数学成绩的众数、第25百分位数分别为()A.92,85B.92,88C.95,88D.96,85答案B解析数据92出现了3次,出现的次数最多,所以众数是92;这组数据已经按照由小到大的顺序排列,计算10×25%=2.5,取第三个数,所以第25百分位数是88.延伸探究本例中,第70百分位数是多少?解10×70%=7,第70百分位数是第7项与第8项的平均数,为92+962=94.(2)(多选)(2023·哈尔滨模拟)下面是某城市某日在不同观测点对细颗粒物(PM 2.5)的观测值:396275268225168166176173188168141157若在此组数据中增加一个比现有的最大值大25的数据,下列数字特征发生改变的是()A .极差B .中位数C .众数D .平均数答案ABD解析根据题意,若在此组数据中增加一个比现有的最大值大25的数据,即最大值变为396+25=421,极差为最大值与最小值的差,要发生改变;加入数据前,中位数为12×(173+176)=174.5,加入数据后,中位数为176,发生改变;众数为数据中出现次数最多的数,不会改变;若加入数据前,平均数为x ,加入数据后,平均数为12x +42113>x,发生改变.思维升华计算一组n 个数据第p 百分位数的步骤跟踪训练1(1)某中学高一年级8名学生某次考试的数学成绩(满分150分)分别为85,90,93,99,101,103,116,130,则这8名学生数学成绩的第75百分位数为()A .102B .103C .109.5D .116答案C 解析这组数据已经按照由小到大的数据排列,8×75%=6,则这8名学生数学成绩的第75百分位数为第6个数与第7个数的平均数,即为103+1162=109.5.(2)(多选)冬季奥林匹克运动会,是世界规模最大的冬季综合性运动会.自1924年起,每四年举办一届.2022年2月在北京举办了第24届冬季奥林匹克运动会,为了宣传奥运精神,红星实验学校组织了甲、乙两个社团,利用一周的时间对外进行宣传,将每天宣传的次数绘制成如图所示的频数分布折线图,则()A .甲社团宣传次数的众数小于乙社团宣传次数的众数B .甲社团宣传次数的极差大于乙社团宣传次数的极差C .甲社团宣传次数的平均数大于乙社团宣传次数的平均数D .甲社团宣传次数的方差大于乙社团宣传次数的方差答案ABD解析观察每天宣传次数的频数分布折线图,甲社团宣传次数的众数、乙社团宣传次数的众数分别为2,3,A 正确;甲社团宣传次数的极差、乙社团宣传次数的极差分别为3,2,B 正确;甲社团宣传次数的平均数x 1=2+2+3+2+5+4+37=3,乙社团宣传次数的平均数x 2=2+2+3+4+3+3+47=3,C 不正确;甲社团宣传次数的方差s 21=17×[3×(2-3)2+2×(3-3)2+(5-3)2+(4-3)2]=87,乙社团宣传次数的方差s 22=17×[2×(2-3)2+3×(3-3)2+2×(4-3)2]=47,D 正确.题型二总体集中趋势的估计例2为了讴歌中华民族实现伟大复兴的奋斗历程,增进学生对中国共产党的热爱,某学校举办了一场党史竞赛活动,共有500名学生参加了此次竞赛活动.为了解本次竞赛活动的成绩,从中抽取了50名学生的成绩(成绩均为整数,满分为100分)进行统计,所有学生的成绩都不低于60分,将这50名学生的成绩(单位:分)进行分组,第一组[60,70),第二组[70,80),第三组[80,90),第四组[90,100],得到如图所示的频率分布直方图.(1)求图中m 的值,并估计此次竞赛活动学生成绩的中位数;(2)根据频率分布直方图,估计此次竞赛活动成绩的平均数.若对成绩不低于平均数的同学进行奖励,请估计在参赛的500名学生中有多少名学生获奖.解(1)由频率分布直方图知(0.01+m +0.04+0.02)×10=1,解得m =0.03;设此次竞赛活动学生成绩的中位数为x 0,因为数据落在[60,80)内的频率为0.4,落在[60,90)内的频率为0.8,从而可得80<x 0<90,由(x 0-80)×0.04=0.5-0.4,得x 0=82.5,所以估计此次竞赛活动学生成绩的中位数为82.5.(2)由频率分布直方图及(1)知,x =65×0.1+75×0.3+85×0.4+95×0.2=82,此次竞赛活动学生成绩不低于82的频率为0.2+90-8210×0.4=0.52,则获奖的学生有500×0.52=260(名),所以估计此次竞赛活动成绩的平均数为82,在参赛的500名学生中有260名学生获奖.思维升华频率分布直方图中的数字特征(1)众数:最高矩形的底边中点的横坐标.(2)中位数:中位数左边和右边的矩形的面积和应该相等.(3)平均数:平均数在频率分布直方图中等于各组区间的中点值与对应频率之积的和.跟踪训练2(2022·哈尔滨模拟)治理沙漠化离不开优质的树苗,现从苗圃中随机地抽测了200株树苗的高度(单位:cm),得到如图所示的频率分布直方图.(1)求直方图中a 的值及众数、中位数;(2)若树苗高度在185cm 及以上是可以移栽的合格树苗.从样本中用比例分配的分层随机抽样方法抽取20株树苗作进一步研究,不合格树苗、合格树苗分别应抽取多少株?解(1)∵(0.0015+0.0110+0.0225+0.0300+a +0.0080+0.0020)×10=1,∴a =0.0250,众数为185+1952=190,设中位数为x ,∵(0.0015+0.0110+0.0225)×10=0.35<0.5,(0.0015+0.0110+0.0225+0.0300)×10=0.65>0.5,则185<x<195,0.35+0.0300×(x-185)=0.5,∴x=190.故a=0.0250,众数为190,中位数为190.(2)由题意可知,合格树苗所占频率为(0.0300+0.0250+0.0080+0.0020)×10=0.65,不合格树苗所占频率为1-0.65=0.35,所以不合格树苗抽取20×0.35=7(株),合格树苗抽取20×0.65=13(株),故不合格树苗、合格树苗应分别抽取7株和13株.题型三总体离散程度的估计例3(2021·全国乙卷)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下.旧设备9.810.310.010.29.99.810.010.110.29.7新设备10.110.410.110.010.110.310.610.510.410.5旧设备和新设备生产产品的该项指标的样本平均数分别记为x和y,样本方差分别记为s21和s22.(1)求x,y,s21,s22;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y-x≥2s21+s2210,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).解(1)由表格中的数据易得x=110×(-0.2+0.3+0+0.2-0.1-0.2+0+0.1+0.2-0.3)+10.0=10.0,y=110×(0.1+0.4+0.1+0+0.1+0.3+0.6+0.5+0.4+0.5)+10.0=10.3,s21=110×[(9.7-10.0)2+2×(9.8-10.0)2+(9.9-10.0)2+2×(10.0-10.0)2+(10.1-10.0)2+2×(10.2-10.0)2+(10.3-10.0)2]=0.036,s22=110×[(10.0-10.3)2+3×(10.1-10.3)2+(10.3-10.3)2+2×(10.4-10.3)2+2×(10.5-10.3)2+(10.6-10.3)2]=0.04.(2)由(1)中数据可得y -x =10.3-10.0=0.3,而2s 21+s 2210=25(s 21+s 22)=0.0304,显然有y -x >2s 21+s 2210著提高.思维升华总体离散程度的估计标准差(方差)反映了数据的离散与集中、波动与稳定的程度.标准差(方差)越大,数据的离散程度越大;标准差(方差)越小,数据的离散程度越小.跟踪训练3(2022·济宁模拟)甲、乙两名学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:甲8281797895889384乙9295807583809085(1)求两位学生预赛成绩的平均数和方差;(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.解(1)x 甲=18×(82+81+79+78+95+88+93+84)=85,x 乙=18×(92+95+80+75+83+80+90+85)=85,s 2甲=18×[(82-85)2+(81-85)2+(79-85)2+(78-85)2+(95-85)2+(88-85)2+(93-85)2+(84-85)2]=35.5,s 2乙=18×[(92-85)2+(95-85)2+(80-85)2+(75-85)2+(83-85)2+(80-85)2+(90-85)2+(85-85)2]=41.(2)由(1)知x 甲=x 乙,s 2甲<s 2乙,甲的成绩较稳定,所以派甲参赛比较合适.课时精练1.为做好疫情防控工作,某校坚持落实“双测温两报告”制度,以下是某宿舍6名学生某日上午的体温记录:36.3,36.1,36.4,36.7,36.5,36.6(单位:℃),则该组数据的第80百分位数为()A .36.7B .36.6C .36.5D .36.4答案B解析将6名学生该日上午的体温记录从小到大排列为36.1,36.3,36.4,36.5,36.6,36.7,因为80%×6=4.8,所以该组数据的第80百分位数为36.6.2.(2022·南京模拟)已知一组数据x 1,x 2,x 3,x 4,x 5的平均数为2,方差为12,则另一组数据3x 1-2,3x 2-2,3x 3-2,3x 4-2,3x 5-2的平均数、方差分别为()A .2,12B .2,1C .4,32D .4,92答案D解析因为一组数据x 1,x 2,x 3,x 4,x 5的平均数为2,方差为12,所以另一组数据3x 1-2,3x 2-2,3x 3-2,3x 4-2,3x 5-2的平均数为3×2-2=4,方差为32×12=92.3.(多选)成立时间少于10年、估值超过10亿美元且未上市的企业称为独角兽企业.2022年中国新经济独角兽企业分布较广泛、覆盖居民生活的各个方面.如图为2022年中国新经济独角兽企业TOP100的行业分布图,在中国新经济独角兽企业TOP100榜单中,京、沪、粤三地的企业数量共同占比达到70%.下列说法正确的是()A .随着智能出行与共享经济观念的普及,汽车交通行业备受投资者关注B .在该TOP100榜单中独角兽企业数量的中位数是3C .在中国新经济独角兽企业TOP100榜单中,京、沪、粤三地的企业超过82家D .2022年中国新经济独角兽企业TOP100榜单中,企业服务、汽车交通、先进制造行业的企业数量共同占比超过30%答案AD解析A 选项,由图可知,汽车交通行业在独角兽企业TOP100榜单中数量较多,故A 选项正确;B 选项,数据为11,10,10,10,10,9,7,6,4,4,4,4,3,2,2,2,2,则中位数为4,故B 选项不正确;C 选项,100×70%=70<82,故C 选项不正确;D 选项,企业服务、汽车交通、先进制造行业的企业数量共同占比为11+10+10100×100%=31%>30%,故D 选项正确.4.(多选)习近平总书记强调,要坚持健康第一的教育理念,加强学校体育工作,推动青少年文化学习和体育锻炼协调发展.某学校对高一年级学生每周在校体育锻炼时长(单位:小时)进行了统计,得到如下频率分布表:分组[2,3)[3,4)[4,5)[5,6]频率0.250.300.200.25则下列关于高一年级学生每周体育锻炼时长的说法中正确的是()A .众数约为2.5B .中位数约为3.83C .平均数为3.95D .第80百分位数约为5.2答案BCD解析对于A ,根据频率分布表可得,高一年级学生每周体育锻炼时长的众数为3+42=3.5,故A 错误;对于B ,设高一年级学生每周体育锻炼时长的中位数为x ,则0.25+x -34-3×0.30=0.5,解得x ≈3.83,故B 正确;对于C ,高一年级学生每周体育锻炼时长的平均数为0.25×2.5+0.30×3.5+0.20×4.5+0.25×5.5=3.95,故C 正确;对于D ,因为0.25+0.30+0.20+0.05=0.80,所以高一年级学生每周体育锻炼时长的第80百分位数约为5+0.050.25=5.2,故D 正确.5.(多选)第24届冬奥会于2022年2月4日在国家体育场鸟巢举行了盛大开幕式.在冬奥会的志愿者选拔工作中,某高校承办了面试工作,面试成绩满分100分,现随机抽取了80名候选者的面试成绩并分为五组,绘制成如图所示的频率分布直方图,则下列说法正确的是(每组数据以区间的中点值为代表)()A.b的值为0.25B.候选者面试成绩的中位数约为69.4C.在被抽取的候选者中,成绩在区间[65,75)之间的候选者有30人D.估计候选者的面试成绩的平均数约为69.5答案BD解析对于A,由(0.005+b+0.045+0.02+0.005)×10=1,解得b=0.025,故A错误;对于B,设候选者面试成绩的中位数为x,则(0.005+0.025)×10+(x-65)×0.045=0.5,解得x≈69.4,故B正确;对于C,成绩在区间[65,75)的频率为0.045×10=0.45,故人数为80×0.45=36,故C错误;对于D,50×0.005×10+60×0.025×10+70×0.045×10+80×0.02×10+90×0.005×10=69.5,故D正确.6.(2023·云南师大附中模拟)根据气象学上的标准,连续5天的日平均气温低于10℃即为入冬,将连续5天的日平均温度的记录数据(记录数据都是自然数)作为一组样本,现有4组样本①,②,③,④,依次计算得到结果如下:①平均数x<4;②平均数x<4且极差小于或等于3;③平均数x<4且标准差s≤4;④众数等于5且极差小于或等于4.则4组样本中一定符合入冬指标的共有()A.1组B.2组C.3组D.4组答案B解析①举反例:0,0,0,4,11,其平均数x=3<4.但不符合入冬指标;②假设有数据大于或等于10,由极差小于或等于3可知,则此组数据中的最小值为10-3=7,此时数据的平均数必然大于7,与x<4矛盾,故假设错误.则此组数据全部小于10.符合入冬指标;③举反例:1,1,1,1,11,平均数x=3<4,且标准差s=4.但不符合入冬指标;④在众数等于5且极差小于等于4时,最大数不超过9.符合入冬指标.7.(2022·福州模拟)电影《长津湖》点燃了人们心中对英雄的崇敬之情,也更加显示出如今和平生活的来之不易.某影院记录了观看此片的70位观众的年龄,其中年龄位于区间[10,20)内的有10位,位于区间[20,30)内的有20位,位于区间[30,40)内的有25位,位于区间[40,50]内的有15位,则这70位观众年龄的众数的估计值为________.答案35解析由于25>20>15>10,故众数位于区间[30,40)内,所以众数的估计值为30+402=35.8.(2023·沧州模拟)已知某样本数据分别为1,2,3,a ,6,若样本平均数x =3,则样本方差s 2=________.答案145解析由题设,得x =1+2+3+a +65=3,可得a =3,所以s 2=15错误!(x i -x )2=145.9.(2023·南通模拟)某学校对高一某班的同学进行了身高(单位:cm)调查,将得到的数据进行适当分组后(除最后一组为闭区间外其余每组为左闭右开区间),画出如图所示的频率分布直方图.(1)求m 的值;(2)估计全班同学身高的中位数;(3)估计全班同学身高的平均数及方差(同一组中的数据用该组区间的中点值作代表).解(1)由频率分布直方图可得(m +0.010+0.010+0.015+0.040)×10=1,解得m =0.025.(2)设全班同学身高的中位数为x ,由题可知x ∈[165,175),得0.10+0.15+(x -165)×0.040=0.5,解得x =171.25,故估计全班同学身高的中位数为171.25.(3)估计全班同学身高的平均数为150×0.10+160×0.15+170×0.40+180×0.25+190×0.10=171,估计全班同学身高的方差为(150-171)2×0.10+(160-171)2×0.15+(170-171)2×0.40+(180-171)2×0.25+(190-171)2×0.10=119.10.对参加某次数学竞赛的1000名选手的初赛成绩(满分:100分)作统计,得到如图所示的频率分布直方图.(1)根据直方图完成以下表格;成绩[50,60)[60,70)[70,80)[80,90)[90,100]频数(2)求参赛选手初赛成绩的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)如果从参加初赛的选手中选取380人参加复赛,那么如何确定进入复赛的选手成绩?解(1)填表如下:成绩[50,60)[60,70)[70,80)[80,90)[90,100]频数50150350350100(2)平均数为55×0.05+65×0.15+75×0.35+85×0.35+95×0.1=78,方差为(55-78)2×0.05+(65-78)2×0.15+(75-78)2×0.35+(85-78)2×0.35+(95-78)2×0.1=101.(3)进入复赛的选手成绩为80+350-(380-100)350×10=82(分),所以初赛成绩为82分及以上的选手均可进入复赛.(说明:回答82分以上,或82分及以上均可).11.(2022·天津模拟)某校排球社的同学为训练动作组织了垫排球比赛,以下为根据排球社50位同学的垫球个数画的频率分布直方图,所有同学垫球数都在5~40之间.估计垫球数的样本数据的第75百分位数是()A.17.5B.18.75C.27D.28答案D解析垫球数在区间[5,25)内的人数占总数的(0.01+0.01+0.04+0.06)×5×100%=60%,垫球数在区间[5,30)内的人数占总数的(0.01+0.01+0.04+0.06+0.05)×5×100%=85%;所以第75百分位数位于区间[25,30)内,且25+5×0.75-0.60.85-0.6=28,所以估计垫球数的样本数据的第75百分位数是28.12.(2022·上海模拟)若等差数列{x n }的公差为3,则x 1,x 2,x 3,…,x 9的方差为________.答案60解析由等差数列{x n }的公差为3,可知x =x 1+x 2+…+x 99=x 1+x 92×99=x 1+x 92=x 5,所以方差s 2=19[(x 1-x 5)2+(x 2-x 5)2+…+(x 9-x 5)2]=19(16d 2+9d 2+4d 2+d 2)×2=203d 2=203×9=60.13.(多选)某学校规定,若五个工作日内学校某天有超过3个人的体温测量值高于37.5℃,则需全员进行核酸检测.该校统计了五个工作日内每天体温超过37.5℃的人数,则根据这组数据的下列信息,能断定该校不需全员进行核酸检测的是()A .中位数是1,平均数是1B .中位数是1,众数是0C .中位数是2,众数是2D .平均数是2,方差是0.8答案AD 解析对于A ,因为中位数是1,设五个工作日内每天体温超过37.5℃的人数按从小到大的顺序排列为a ,b ,1,c ,d ,因为平均数是1,所以a +b +1+c +d =5,若d =4,则a =b =c =0,与中位数是1矛盾,故A 正确;对于B ,设五个工作日内每天体温超过37.5℃的人数按从小到大的顺序排列为0,0,1,2,4,满足中位数是1,众数是0,但有一天超过3人,故B 错误;对于C ,设五个工作日内每天体温超过37.5℃的人数按从小到大的顺序排列为0,2,2,3,4,满足中位数是2,众数是2,但有一天超过3人,故C 错误;对于D ,设五个工作日内每天体温超过37.5℃的人数按从小到大的顺序排列为a ,b ,c ,d ,e ,因为平均数是2,方差是0.8,则a +b +c +d +e =10,15[(a -2)2+(b -2)2+(c -2)2+(d -2)2+(e -2)2]=0.8,即(a -2)2+(b -2)2+(c -2)2+(d -2)2+(e -2)2=4,则e≤4,若e=4,从方差角度来说a=b=c=d=2,不满足a+b+c+d+e=10,所以e<4,同理a,b,c,d均小于4,故D正确.14.(多选)已知一组数据丢失了一个大于3的数据,剩下的六个数据分别是3,3,5,3,6,11,若这组数据的平均数与众数的和是中位数的2倍,则丢失的数据可能是()A.4B.12C.18D.20答案AC解析设丢失的数据为x,则这七个数据的平均数为31+x7,众数是3,若3<x<5,则中位数为x,此时31+x7+3=2x,解得x=4;若x≥5,则中位数为5,此时31+x7+3=2×5,解得x=18.综上所述,丢失的数据可能是4或18.。
新教材高中数学第9章统计9.2用样本估计总体课时作业42总体百分位数的估计与总体集中趋势的估计新人教A 版必修第二册课时作业42 总体百分位数的估计与总体集中趋势的估计知识点一 百分位数的计算1.一次数学测试中,高一(1)班某小组12名学生的成绩分别是:58分、67分、73分、74分、76分、82分、82分、87分、90分、92分、93分、98分,则这次测试该小组12名学生成绩的75%分位数是( )A .88分B .89分C .90分D .91分 答案 D解析 因为12×75%=9,所以这组数据的75%分位数为90+922=91(分).故选D.2.某校调查某班30名同学所穿的鞋的尺码如下表所示:码号 33 34 35 36 37 人数761412则这组数据的25%A .33 B .34 C .35 D .36 答案 B解析 因为30×25%=7.5,所以这组数据的25%分位数为34.故选B. 知识点二 百分位数的实际应用3.我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x (单位:吨),一位居民的月用水量不超过x 的部分按平价收费,超出x 的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a 的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由; (3)若该市政府希望使85%的居民每月的用水量不超过标准x (单位:吨),估计x 的值,并说明理由.解 (1)由频率分布直方图知,月均用水量在[0,0.5)中的频率为0.08×0.5=0.04. 同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.由0.04+0.08+0.5×a +0.20+0.26+0.5×a +0.06+0.04+0.02=1. 解得a =0.30.(2)由(1)知,100位居民每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12. 由以上样本的频率分布,可以估计全市30万居民中月均用水量不低于3吨的人数为300000×0.12=36000.(3)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85. 而前5组的频率之和为0.04+0.08+0.15+0.20+0.26=0.73<0.85,所以2.5≤x <3,由0.3×(x -2.5) =0.85-0.73,解得x =2.9.所以,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准. 知识点三 平均数、中位数、众数的计算4.某学习小组在一次数学测验中,得100分的有1人,95分的有1人,90分的有2人,85分的有4人,80分和75分的各有1人,则该小组成绩的平均数、众数、中位数分别是( )A .85,85,85B .87,85,86C .87,85,85D .87,85,90 答案 C解析 由平均数、中位数、众数的定义可知,平均数 x -=1×100+1×95+2×90+4×85+1×80+1×751+1+2+4+1+1=87;因为得85分的有4人,所以众数是85;把成绩由大到小排列为100,95,90,90,85,85,85,85,80,75,故中位数是85.5.从高三抽出50名学生参加数学竞赛,由成绩得到如图的频率分布直方图.试利用频率分布直方图求:(1)这50名学生成绩的众数与中位数;(2)这50名学生成绩的平均数(答案精确到0.1).解(1)由众数的概念可知,众数是出现次数最多的数.在直方图中高度最高的小长方形框的中间值的横坐标即为所求,所以由频率分布直方图得众数应为75.由于中位数是所有数据中的中间值,故在频率分布直方图中体现的是中位数的左右两边频数应相等,即频率也相等,从而就是小矩形的面积和相等.因此在频率分布直方图中将频率分布直方图中所有小矩形的面积一分为二的直线所对应的成绩即为所求.∵0.004×10+0.006×10+0.02×10=0.04+0.06+0.2=0.3,∴前三个小矩形面积的和为0.3,而第四个小矩形面积为0.03×10=0.3,0.3+0.3>0.5,∴中位数应位于第四个小矩形内.设其底边为x,高为0.03,令0.03x=0.2得x≈6.7,故中位数约为70+6.7=76.7.(2)样本平均值应是所有数据的平均值,取每个小矩形底边的中点值乘以每个小矩形的面积即可.∴平均数为45×(0.004×10)+55×(0.006×10)+65×(0.02×10)+75×(0.03×10)+85×(0.021×10)+95×(0.016×10)≈73.7.知识点四平均数、中位数、众数的实际应用6.某公司销售部有销售人员15人,为了制定某种商品的月销售定额,统计了这15人某月的销售量如下:每人销售件数1800510250210150120人数11353 2(1)求这(2)假设销售部负责人把每位销售人员的月销售定额定为320件,你认为是否合理,为什么?如果不合理,请你制定一个较合理的销售定额.解 (1)平均数x -=115×(1800×1+510×1+250×3+210×5+150×3+120×2)=320,中位数为210,众数为210.(2)不合理.因为15人中有13人的销售额达不到320件,也就是说,320虽是这一组数据的平均数,但它却不能反映销售人员的一般水平.销售额定为210件合理些,这是由于210既是中位数,又是众数,是绝大部分人都能达到的销售额.易错点 运用平均数、中位数、众数作评价时考虑不周 7.一次数学知识竞赛中,两组学生成绩如下:经计算,已知两个组的平均分都是80分,请根据所学过的统计知识,进一步判断这次竞赛中哪个组更优秀,并说明理由.易错分析 对一组数据进行分析的时候,应从平均数、众数、中位数等多个角度进行判断.否则评价易出现偏差.正解 (1)甲组成绩的众数为90分,乙组成绩的众数为70分,从成绩的众数这一角度看,甲组成绩好些.(2)甲、乙两组成绩的中位数、平均数都是80分,其中甲组成绩在80分以上(含80分)的有33人,乙组成绩在80分以上(含80分)的有26人,从这一角度看,甲组成绩总体较好.(3)从成绩统计表看,甲组成绩大于或等于90分的有20人,乙组成绩大于或等于90分的有24人,所以乙组成绩在高分段的人数多.同时,乙组满分比甲组多6人,从这一角度看,乙组成绩较好.一、选择题1.下列说法错误的是( )A .一个样本的众数、中位数和平均数不可能是同一个数B .统计中,我们可以用样本平均数去估计总体平均数C .样本平均数既不可能大于也不可能小于这个样本中的所有数据D .众数、中位数和平均数从不同的角度描述了一组数据的集中趋势 答案 A解析 用样本估计总体情况时,在一组数据中,众数、中位数和平均数可能是同一个数,例如:数据10,11,11,11,11,11,12的众数、中位数和平均数都是11.2.在某次考试中,10名同学的得分如下:84,77,84,83,68,78,70,85,79,95.则这一组数据的众数、中位数和75%分位数分别为( )A .84,68,83B .84,78,83C .84,81,84D .78,81,84 答案 C解析 将所给数据按从小到大的顺序排列是68,70,77,78,79,83,84,84,85,95,显然众数为84,而本组数据共10个,中间两个数是79,83,它们的平均数为81,即中位数为81.因为10×75%=7.5,所以这一组数据的75%分位数为84.故选C.3.某单位定期对员工的专业知识、工作业绩、出勤情况三个方面进行考核(考核的满分均为100分),三个方面依次按3∶5∶2确定最后得分.小王经过考核后所得的分数依次为90分、88分、83分,那么小王的最后得分是( )A .87分B .87.5分C .87.6分D .88分答案 C解析 小王的最后得分=90×310+88×510+83×210=27+44+16.6=87.6(分).故选C.4.某班全体学生参加物理测试成绩的频率分布直方图如图所示,则估计该班物理测试成绩的平均数是( )A .70B .75C .68D .66 答案 C解析 平均数就是频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标再求和,即0.005×20×30+0.010×20×50+0.020×20×70+0.015×20×90=68.5.对某小区100户居民的月均用水量进行统计,得到样本的频率分布直方图如图所示,则估计此样本的众数、中位数分别为( )A .2.25,2.5B .2.25,2.02C .2,2.5D .2.5,2.25答案 B解析 众数是指样本中出现频率最高的数,在频率分布直方图中通常取该组区间的中点,所以众数为2+2.52=2.25.中位数是频率为0.5的分界点,由频率分布直方图,可知前4组的频率和为(0.08+0.16+0.30+0.44)×0.5=0.49,因此中位数出现在第5组,设中位数为x ,则(x -2)×0.5=0.01,解得x =2.02,故选B.二、填空题6.从甲、乙、丙三个厂家生产的同一种产品中分别抽取8件产品,对其使用寿命(单位:年)进行追踪调查的结果如下:甲:3,4,5,6,8,8,8,10; 乙:4,6,6,6,8,9,12,13; 丙:3,3,4,7,9,10,11,12.三个厂家广告中都称该产品的使用寿命是8年,请根据结果判断厂家在广告中分别运用了平均数、众数、中位数中的哪一种集中趋势的特征数.甲:________,乙:________,丙:________. 答案 众数 平均数 中位数解析 对甲分析:8出现的次数最多,故运用了众数;对乙分析:8既不是众数,也不是中位数,求平均数可得,平均数=18×(4+6+6+6+8+9+12+13)=8,故运用了平均数;对丙分析:共8个数据,最中间的是7和9,故其中位数是8,即运用了中位数. 7.近年来,某市私家车数量持续增长,2015年至2019年该市私家车数量依次为15,19,22,26,30(单位:万辆),则该组数据的中位数是________,10%分位数是________,20%分位数是________.答案 22 15 17解析 这组数据从小到大排列后,22处于最中间的位置,故这组数据的中位数是22.∵5×10%=0.5,∴该组数据的10%分位数是15,∵5×20%=1,∴该组数据的20%分位数是15+192=17.8.某校100名学生的数学测试成绩频率分布直方图如图所示,分数不低于a (a 为整数)即为优秀,如果优秀的人数为20人,则a 的估计值是________.答案 133解析 由已知可以判断a ∈[130,140),所以[(140-a )×0.015+0.01×10]×100=20.解得a ≈133.三、解答题9.为了估计某校某次数学考试的情况,现从该校参加考试的600名学生中随机抽出60名学生,其数学成绩(百分制)均在[40,100]内,将这些成绩分成六组[40,50),[50,60),…,[90,100],得到如图所示的部分频率分布直方图.(1)求抽出的60名学生中数学成绩在[70,80)内的人数;(2)若规定成绩不小于85分为优秀,则根据频率分布直方图,估计该校参加考试的学生数学成绩为优秀的人数;(3)试估计抽出的60名学生的数学成绩的中位数.解 (1)成绩在[70,80)内的频率为1-(0.005+0.010+0.020+0.035+0.005)×10=0.25,所以60名学生中数学成绩在[70,80)内的人数为60×0.25=15. (2)估计该校参加考试的学生数学成绩为优秀的人数为⎝⎛⎭⎪⎫0.0352+0.005×10×600=135.(3)抽出的60名学生中分数在[40,70)内的频率为(0.005+0.010+0.020)×10=0.35,分数在[40,80)内的频率为(0.005+0.010+0.020+0.025)×10=0.6,所以中位数落在[70,80)内,设中位数为70+x ,则0.35+0.025x =0.5.解得x =6.故中位数约为70+6=76.10.对某校高三年级学生参加社区服务的次数进行统计,随机抽取M 名学生,得到这M 名学生参加社区服务的次数,根据此数据作出频率分布表和频率分布直方图如下:分组 频数 频率 [10,15) 10 0.25[15,20) 24n [20,25) mp[25,30] 20.05 合计M1(1)求出表中M ,p 及图中a 的值;(2)若该校有高三学生240人,试估计该校高三学生参加社区服务的次数在区间[10,15)内的人数;(3)估计学生参加社区服务次数的众数、中位数及平均数.解 (1)由分组[10,15)内的频数是10,频率是0.25,知10M=0.25,所以M =40.所以10+24+m +2=40,解得m =4, 所以p =m M =440=0.1,a =2440×5=0.12. (2)估计该校高三学生参加社区服务的次数在区间[10,15)内的人数为0.25×240=60.(3)估计学生参加社区服务次数的众数是15+202=17.5.因为n =2440=0.6,所以中位数落在[15,20)内,设中位数为15+x ,则0.25+0.12x =0.5. 解得x ≈2.1.所以估计学生参加社区服务次数的中位数是15+2.1=17.1. 又12.5×0.25+17.5×0.6+22.5×0.1+27.5×0.05=17.25. 所以估计学生参加社区服务次数的平均数是17.25.。
一、选择题A .0.35B .0.45C .0.55D .0.65解析:选B.求出样本数据落在区间[10,40)中的频数,再除以样本容量得频率.求得该频数为2+3+4=9,样本容量是20,所以频率为920=0.45.2.在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的是( )A .众数B .平均数C .中位数D .标准差 解析:选D.只有标准差不变,其中众数、平均数和中位数都加2.3.有一个容量为200的样本,其频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在区间[)10,12内的频数为( )A .18B .36C .54D .72解析:选B.由0.02+0.05+0.15+0.19=0.41,∴落在区间[]2,10内的频率为0.41×2=0.82. ∴落在区间[)10,12内的频率为1-0.82=0.18.∴样本数据落在区间[)10,12内的频数为0.18×200=36.4.(2012·高考陕西卷)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )A .46,45,56B .46,45,53C .47,45,56D .45,47,53解析:选A.从茎叶图可以看出样本数据的中位数为中间两个数的平均数,即45+472=46,众数为45,极差为68-12=56,故选择A.5.如图是某学校抽取的学生体重的频率分布直方图,已知图中从左到右的前3个小组的频率之比为1∶2∶3,第2小组的频数为10,则抽取的学生人数为( )A .20B .30C .40D .50解析:选C.前3组的频率之和等于1-(0.0125+0.0375)×5=0.75,第2小组的频率是0.75×21+2+3=0.25,设样本容量为n ,则10n =0.25,即n =40.二、填空题6.在如图所示的茎叶图中,甲、乙两组数据的中位数分别是__________,__________.解析:甲组数据为:28,31,39,42,45,55,57,58,66,中位数为45.乙组数据为:29,34,35,42,46,48,53,55,67,中位数为46. 答案:45 467.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):.解析:x 甲=x 乙=9,s 2甲=15×[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=25,s 2乙=15×[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=65,s 2甲<s 2乙,故甲更稳定,故填甲. 答案:甲 8.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a =______.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为__________.解析:∵小矩形的面积等于频率,∴除[120,130)外的频率和为0.700,∴a =1-0.70010=0.030.由题意知,身高在[120,130),[130,140),[140,150]的学生分别为30人,20人,10人,∴由分层抽样可知抽样比为1860=310,∴在[140,150]中选取的学生应为3人.答案:0.030 3 三、解答题9.某学校从参加高三模拟考试的学生中随机抽取60名学生,将其数学成绩(均为整数)分成六段[90,100),[100,110),…,[140,150)后得到如下部分频率分布直方图.观察图形的信息,回答下列问题:(1)求分数在[120,130)内的频率,并补全这个频率分布直方图;(2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试的平均分.解:(1)分数在[120,130)内的频率为1-(0.1+0.15+0.15+0.25+0.05)=1-0.7=0.3,频率组距=0.310=0.03,补全后的直方图如下:(2)平均分为x =95×0.1+105×0.15+115×0.15+125×0.3+135×0.25+145×0.05=121. 10.(2012·高考安徽卷)若某产品的直径长与标准值的差的绝对值不超过1 mm 时,则视为合格品,否则视为不合格品.在近期一次产品抽样检查中,从某厂生产的此种产品中,随机抽取5000件进行检测,结果发现有50件不合格品.计算这50件不合格品的直径长与标准值的差(单位:mm)(1)(2)估计该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率;(3)现对该厂这种产品的某个批次进行检查,结果发现有20件不合格品.据此估算这批产品中的合格品的件数.解:(1)频率分布表(2)由频率分布表知,该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率约为0.50+0.20=0.70.(3)设这批产品中的合格品数为x件,依题意有505000=20x+20,解得x=5000×2050-20=1980.所以该批产品的合格品件数估计是1980件.一、选择题1.为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如图,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力在4.6到5.0之间的学生数为b,则a,b的值分别为()A.0.27,78 B.0.27,83C.2.7,78 D.2.7,83解析:选A.由频率分布直方图知,组距为0.1,4.3~4.4间的频数为100×0.1×0.1=1,4.4~4.5间的频数为100×0.1×0.3=3.又前4组的频数成等比数列,∴公比为3.根据后6组的频数成等差数列,且共有100-13=87人,且4.6~4.7间的频数最大,为1×33=27,∴a =0.27.设公差为d ,则6×27+6×52d =87,∴d =-5,从而b =4×27+4×32×(-5)=78.2.(2012·高考陕西卷)从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲、乙两组数据的平均数分别为x 甲、x 乙,中位数分别为m 甲、m 乙,则( )A.x 甲<x 乙,m 甲>m 乙B.x 甲<x 乙,m 甲<m 乙C.x 甲>x 乙,m 甲>m 乙D.x 甲 >x 乙,m 甲<m 乙解析:选B.由茎叶图可知甲数据集中在10至20之间,乙数据集中在20至40之间,明显x甲<x 乙,甲的中位数为20,乙的中位数为29,即m 甲<m 乙,所以选B.二、填空题 3.(2012·高考广东卷)由正整数组成的一组数据x 1,x 2,x 3,x 4,其平均数和中位数都是2,且标准差等于1,则这组数据为________.(从小到大排列)解析:设x 1≤x 2≤x 3≤x 4,根据已知条件得到x 1+x 2+x 3+x 4=8,且x 2+x 3=4,所以x 1+x 4=4.又因为14[(x 1-2)2+(x 2-2)2+(x 3-2)2+(x 4-2)2]=1,所以(x 1-2)2+(x 2-2)2=2.又因为x 1,x 2,x 3,x 4是正整数,所以(x 1-2)2=(x 2-2)2=1,所以x 1=1,x 2=1,x 3=3,x 4=3.答案:1,1,3,34.把容量为100的某个样本数据分为10组,并填写频率分布表,若前七组的累积频率为0.79,而剩下三组的频数成公比为大于2的整数的等比数列,则剩下三组中频数最高的一组的频数为________.解析:由已知得前七组的共有频数为0.79×100=79, 故后三组共有的频数为21,依题意a 1·(1-q 3)1-q =21,a 1(1+q +q 2)=21.∵q >2,∴1+q +q 2>7. ∴a 1=1,q =4.∴后三组中频数最高的一组的频数为16. 答案:16 三、解答题 5.(2013·日照质检)某学校为了了解学生的日平均睡眠时间(单位:h),随机选择了n 名(1)求n(2)统计方法中,同一组数据常用该组区间的中点值(例如区间[4,5)的中点值是4.5)作为代表.若据此计算的上述数据的平均值为6.52,求a ,b 的值,并由此估计该学校学生的日平均睡眠时间在7小时以上的概率.解:(1)由频率分布表可得n =60.12=50.补全数据如下表:频率分布直方图如下:(2)由题意⎩⎪⎨⎪⎧150×(6×4.5+10×5.5+a ×6.5+b ×7.5+4×8.5)=6.52,6+10+a +b +4=50, 解得a =15,b =15.设“该学校学生的日平均睡眠时间在7小时以上”为事件A ,则P (A )=P (x ≥7)=15+450=0.38,即该学校学生的日平均睡眠时间在7小时以上的概率约为0.38.。
2020高考数学(理数)复习作业本9.2用样本估计总体一、选择题1.在频率分布直方图中,小长方形的面积是()A、频率/样本容量B、组距×频率C、频率D、样本数据2.下列叙述中正确的是()A、从频率分布表可以看出样本数据对于平均数的波动大小B、频数是指落在各个小组内的数据C、每小组的频数与样本容量之比是这个小组的频率D、组数是样本平均数除以组距3.列样本频率分布表时,决定组数的正确方法是()A、任意确定B、一般分为5—12组C、由组距和组数决定D、根据经验法则,灵活掌握4.频率分布直方图中,小长方形的面积等于()A、组距B、频率C、组数D、频数5.为考察某种皮鞋的各种尺码的销售情况,以某天销售40双皮鞋为一个样本,把它按尺码分成5组,第3组的频率为0、25,第1,2,4组的频率分别为6,7,9,若第5组表示的是40—42码的皮鞋,则售出的200双皮鞋中含40—42码的皮鞋为()A、50B、40C、20D、306.根据下面给出的2004年至2013年我国二氧化硫排放量(单位:万吨)柱形图。
以下结论不正确的是( )(A)逐年比较,2008年减少二氧化硫排放量的效果最显著(B)2007年我国治理二氧化硫排放显现(C)2006年以来我国二氧化硫年排放量呈减少趋势(D)2006年以来我国二氧化硫年排放量与年份正相关7.一个容量为20 的样本数据,分组后组距与频数如下:(10,20],2;(20,30],3;(30,40],4;(40,50],4;(60,70],2。
则样本在区间(- ,50]上的频率是()A、5%B、25%C、50%D、70%8.把样本容量为20的数据分组,分组区间与频数如下:[10,20),2;[20,30),3;[30,40),4;[40,50),5;[50,60),4;[60,70],2,则在区间[10,50)上的数据的频率是( )A.0.05 B.0.25 C.0.5 D.0.79.一个容量为n的样本,分成若干组,已知某组的频数和频率分别为40,0、125,则n的值为()A、640B、320C、240D、16010.为考察某种皮鞋的各种尺码的销售情况,以某天销售40双皮鞋为一个样本,按尺码分为5组,第三组的频率为0.25,第1,2,4组的频数为6,7,9,若第5组表示的是40~42的皮鞋,则售出的200双皮鞋中含40~42的皮鞋为()双A、50B、40C、20D、3011.在10人中,有4人是学生,2人是干部,3人是工人,1人是农民,分数2/5是学生占总体的()A、频数B、概率C、频率D、累积频率12.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是( )13.某中学奥数培训班共有14人,分为两个小组,在一次阶段测试中两个小组成绩的茎叶图如图所示,其中甲组学生成绩的平均数是88,乙组学生成绩的中位数是89,则n -m 的值是________.14.某人掷一个均匀的正方体玩具(它的每个面上分别标以数字1,2,3,4,5,6),一共抛了7768次,从而统计它落地时向上的数出现的频率。
第三节用样本估计总体总体分布的估计(1)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.(2)理解样本数据标准差的意义和作用,会计算数据标准差.(3)能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.(4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.(5)会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.知识点一频率分布直方图1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差).(2)决定组距与组数.(3)将数据分组.(4)列频率分布表.(5)画频率分布直方图.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.易误提醒 (1)易把直方图与条形图混淆:两者的区别在于条形图是离散随机变量,纵坐标刻度为频数或频率,直方图是连续随机变量,连续随机变量在某一点上是没有频率的.(2)易忽视频率分布直方图中纵轴表示的应为频率组距.必记结论 由频率分布直方图进行相关计算时,需掌握下列关系式: (1)频率组距×组距=频率. (2)频数样本容量=频率,此关系式的变形为频数频率=样本容量,样本容量×频率=频数. [自测练习]1.某校100名学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100],则图中a 的值为( )A .0.006B .0.005C .0.004 5D .0.002 5解析:由题意知,a =1-(0.02+0.03+0.04)×102×10=0.005.答案:B2.在样本的频率分布直方图中,共有7个小长方形,若中间一个小长方形的面积等于其他6个小长方形的面积的和的14,且样本容量为80,则中间一组的频数为( )A .0.25B .0.5C .20D .16解析:设中间一组的频数为x ,依题意有x 80=14⎝⎛⎭⎫1-x 80,解得x =16,应选D. 答案:D知识点二 茎叶图 茎叶图的优点茎叶图的优点是可以保留原始数据,而且可以随时记录,这对数据的记录和表示都能带来方便.易误提醒 在绘制茎叶图时,易遗漏重复出现的数据,重复出现的数据要重复记录,同时不要混淆茎叶图中茎与叶的含义.[自测练习]3.(2015·惠州模拟)某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们每场比赛得分的情况用如图所示的茎叶图表示,则甲、乙两名运动员的中位数分别为( )A .19、13B .13、19C .20、18D .18、20解析:由茎叶图可知,甲的中位数为19,乙的中位数为13.故选A. 答案:A知识点三 样本的数字特征 1.众数、中位数、平均数 数字特征定义与求法优点与缺点众数一组数据中重复出现次数最多的数众数通常用于描述变量的值出现次数最多的数.但显然它对其他数据信息的忽视使得无法客观地反映总体特征中位数把一组数据按从小到大的顺序排列,处在中间位置的一个数据(或两个数据的平均数)中位数等分样本数据所占频率,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点平均数如果有n 个数据x 1,x 2,…,x n ,那么这n 个数的平均数x =x 1+x 2+…+x nn平均数与每一个样本数据有关,可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低2.标准差、方差(1)标准差:样本数据到平均数的一种平均距离,一般用s 表示,s = 1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2]. (2)方差:标准差的平方s 2s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x i (i =1,2,3,…,n )是样本数据,n 是样本容量,x 是样本平均数.易误提醒 (1)众数、中位数与平均数都是描述一组数据集中趋势的量,平均数是最重要的量.(2)平均数反映的是样本个体的平均水平,众数和中位数则反映样本中个体的“重心”.(3)实际问题中求得的平均数、众数和中位数应带上单位.必备方法 利用频率分布直方图求众数、中位数与平均数时易出错,应注意区分这三者.在频率分布直方图中:(1)最高的小长方形底边中点的横坐标是众数. (2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.[自测练习]4.对于一组数据x i (i =1,2,3,…,n ),如果将它们改变为x i +C (i =1,2,3,…,n ),其中C ≠0,则下列结论正确的是( )A .平均数与方差均不变B .平均数变,方差保持不变C .平均数不变,方差变D .平均数与方差均发生变化解析:依题意,记原数据的平均数为x ,方差为s 2,则新数据的平均数为(x 1+C )+(x 2+C )+…+(x n +C )n =x +C ,即新数据的平均数改变;新数据的方差为1n {[(x 1+C )-(x +C )]2+[(x 2+C )-(x +C )]2+…+[(x n +C )-(x +C )]2}=s 2,即新数据的方差不变,故选B.答案:B5.(2015·高考陕西卷)中位数为1 010的一组数构成等差数列,其末项为2 015,则该数列的首项为________.解析:设等差数列的首项为a 1,根据等差数列的性质可得,a 1+2 015=2×1 010,解得a 1=5.答案:5考点一频率分布直方图及应用|1.某班50位学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],则图中x的值等于()A.0.12B.0.012C.0.18 D.0.018解析:依题意,0.054×10+10x+0.01×10+0.006×10×3=1,解得x=0.018,故选D.答案:D2.某市为了节约能源,拟出台“阶梯电价”制度,即制订住户月用电量的临界值a.若某住户某月用电量不超过a度,则按平价计费;若某月用电量超过a度,则超出部分按议价计费,未超出部分按平价计费.为确定a的值,随机调查了该市100户的月用电量,工作人员已将90户的月用电量填在了下面的频率分布表中,最后10户的月用电量(单位:度)为:18,63,43,119,65,77,29,97,52,100.(2)根据已有信息,试估计全市住户的平均月用电量(同一组数据用该区间的中点值作代表);(3)若该市计划让全市75%的住户在“阶梯电价”出台前后缴纳的电费不变,试求临界值a.解:(1)(2)由题意,用每小组的中点值代表该小组的平均月用电量,则100户住户组成的样本的平均月用电量为10×0.04+30×0.12+50×0.24+70×0.30+90×0.25+110×0.05=65(度).用样本估计总体,可知全市居民的平均月用电量约为65度.(3)计算累计频率,可得下表:的总面积(频率)为0.75,故有0.7+(a-80)×0.012 5=0.75,解得a=84,由样本估计总体,可得临界值a为84.绘制频率分布直方图时需注意(1)制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确;(2)频率分布直方图的纵坐标是频率组距,而不是频率.考点二 茎叶图|1.如图所示的茎叶图是甲、乙两位同学在期末考试中的六科成绩,已知甲同学的平均成绩为85,乙同学的六科成绩的众数为84,则x ,y 的值分别为( )A .2,4B .4,4C .5,6D .6,4解析:x 甲=75+82+84+(80+x )+90+936=85,解得x =6,由图可知y =4,故选D.答案:D2.(2016·长沙一模)右面的茎叶图是某班学生在一次数学测验时的成绩:根据茎叶图,得出该班男、女生数学成绩的四个统计结论,其中错误的一项是( )A .15名女生成绩的平均分为78B .17名男生成绩的平均分为77C.女生成绩和男生成绩的中位数分别为82,80D.男生中的高分段和低分段均比女生多,相比较男生两极分化比较严重解析:对于A,15名女生成绩的平均分为115×(90+93+80+80+82+82+83+83+85+70+71+73+75+66+57)=78,A正确;对于B,17名男生成绩的平均分为117×(93+93+96+80+82+83+86+86+88+71+74+75+62+62+68+53+57)=77,故B正确;对于D,观察茎叶图,对男生、女生成绩进行比较,可知男生两极分化比较严重,D正确;对于C,根据女生和男生成绩数据分析可得,两组数据的中位数均为80,C错误,故选C.答案:C使用茎叶图时,需注意:(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;(2)重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据.考点三样本的数字特征|(2015·高考广东卷)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?[解] (1)依题意,20×(0.002+0.009 5+0.011+0.012 5+x +0.005+0.002 5)=1, 解得x =0.007 5.∴直方图中x 的值为0.007 5.(2)由图可知,最高矩形的数据组为[220,240), ∴众数为220+2402=230.∵[160,220)的频率之和为(0.002+0.009 5+0.011)×20=0.45,∴依题意,设中位数为y , ∴0.45+(y -220)×0.012 5=0.5. 解得y =224,∴中位数为224.(3)月平均用电量在[220,240)的用户在四组用户中所占比例为0.012 50.012 5+0.007 5+0.005+0.002 5=511,∴月平均用电量在[220,240)的用户中应抽取11×511=5(户).(1)平均数与方差都是重要的数字特征,是对总体的一种简明地描述,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.(2)利用方差优化比较时方差越小,效果越好.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):.解析:x 甲=x 乙=9,s 2甲=15×[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=25,s2乙=15×[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=65>s2甲,故甲更稳定.答案:甲11.概率与统计的综合问题的答题模板【典例】(12分)(2015·高考全国卷Ⅱ)某公司为了解用户对其产品的满意度,从A,B 两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.A地区用户满意度评分的频率分布直方图B地区用户满意度评分的频数分布表分的平均值及分散程度(不要求计算出具体值,给出结论即可);B地区用户满意度评分的频率分布直方图(2)根据用户满意度评分,将用户的满意度分为三个等级:[思路点拨](1)因为在频率分布直方图上,纵坐标表示的是频率与组距的比值,根据频数求出频率,进而求出频率与组距的比值,根据频率分布直方图可看出满意度评分的平均值的大小和分散程度,中间的矩形面积越高越集中,越不分散;(2)B地区可直接借助低于70分的频数10求出不满意的概率,A地区利用频率分布直方图中小矩形的面积即为频率,可求出不满意的概率,进而比较大小.[规范解答](1)如图所示.通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(6分)(2)A地区用户的满意度等级为不满意的概率大.(7分)记C A表示事件:“A地区用户的满意度等级为不满意”;C B表示事件:“B地区用户的满意度等级为不满意”.由直方图得P(C A)的估计值为(0.01+0.02+0.03)×10=0.6,(8分)P(C B)的估计值为(0.005+0.02)×10=0.25.(10分)所以A地区用户的满意度等级为不满意的概率大.(12分)[模板形成]分析图表、审核数据↓作出频率分布直方图↓由直方图数据分析相应问题↓利用直方图求概率,作出判断↓反思解题过程注意规范化A组考点能力演练1.(2016·邢台摸底)样本中共有五个个体,其值分别为0,1,2,3,m .若该样本的平均值为1,则其样本方差为( )A.105B.305C. 2 D .2解析:依题意得m =5×1-(0+1+2+3)=-1,样本方差s 2=15(12+02+12+22+22)=2,即所求的样本方差为2,选D.答案:D2.10名工人某天生产同一零件,生产的零件数分别是15,17,14,10,15,17,17,16,14,12,设其平均数为a ,中位数为b ,众数为c ,则有( )A .a >b >cB .b >c >aC .c >a >bD .c >b >a解析:依题意,这些数据由小到大依次是10,12,14,14,15,15,16,17,17,17,因此a <15,b =15,c =17,c >b >a ,选D.答案:D3.(2015·高考全国卷Ⅱ)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( )A .逐年比较,2008年减少二氧化硫排放量的效果最显著B .2007年我国治理二氧化硫排放显现成效C .2006年以来我国二氧化硫年排放量呈减少趋势D .2006年以来我国二氧化硫年排放量与年份正相关解析:根据柱形图易得选项A ,B ,C 正确,2006年以来我国二氧化硫年排放量与年份负相关,选项D 错误.故选D.答案:D4.(2015·高考山东卷)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温; ③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差. 其中根据茎叶图能得到的统计结论的编号为( ) A .①③ B .①④ C .②③D .②④解析:由题中茎叶图,知x 甲=26+28+29+31+315=29,s 甲=15[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2] =3105; x 乙=28+29+30+31+325=30,s 乙=15[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2] = 2.所以x 甲<x 乙,s 甲>s 乙,故选B. 答案:B5.(2016·内江模拟)某公司10个销售店某月销售某产品数量(单位:台)的茎叶图如下:分组成[11,20),[20,30),[30,40]时,所作的频率分布直方图是( )解析:本题考查统计.利用排除法求解.由直方图的纵坐标是频率/组距,排除C 和D ;又第一组的频率是0.2,直方图中第一组的纵坐标是0.02,排除A ,故选B.答案:B6.(2015·郑州二检)已知甲、乙两组数据如茎叶图所示,若它们的中位数相同,平均数也相同,则图中的m 、n 的比值mn =________.解析:由茎叶图可知甲的数据为27、30+m 、39,乙的数据为20+n 、32、34、38.由此可知乙的中位数是33,所以甲的中位数也是33,所以m =3.由此可以得出甲的平均数为33,所以乙的平均数也为33,所以有20+n +32+34+384=33,所以n =8,所以m n =38.答案:387.某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表:学生 1号 2号 3号 4号 5号 甲班 6 7 7 8 7 乙班67679解析:由数据表可得出乙班的数据波动性较大,则其方差较大,甲班的数据波动性较小,其方差较小,其平均值为7,方差s 2=15(1+0+0+1+0)=25.答案:258.(2015·高考湖北卷)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a =________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________. 解析:(1)0.1×1.5+0.1×2.5+0.1×a +0.1×2+0.1×0.8+0.1×0.2=1,解得a =3; (2)区间[0.5,0.9]内的频率为1-0.1×1.5-0.1×2.5=0.6,则该区间内购物者的人数为10 000×0.6=6 000.答案:(1)3 (2)6 0009.甲、乙两人参加数学竞赛培训.现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,画出茎叶图如图.(1)指出学生乙成绩的中位数;(2)现要从中选派一人参加数学竞赛,你认为应该派哪位学生参加? 解:(1)依题意知,学生乙成绩的中位数为83+852=84.(2)派甲参加比较合适,理由如下:x 甲=18(70×2+80×4+90×2+9+8+8+4+2+1+5+3)=85,x 乙=18(70×1+80×4+90×3+5+3+5+2+5)=85,s 2甲=35.5,s 2乙=41,∵x 甲=x 乙,且s 2甲<s 2乙,∴甲的成绩比较稳定.10.(2016·唐山统考)为了调查某校学生体质健康达标情况,现采用随机抽样的方法从该校抽取了m 名学生进行体育测试.根据体育测试得到了这m 名学生的各项平均成绩(满足100分),按照以下区间分为七组:[30,40),[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],并得到频率分布直方图(如图).已知测试平均成绩在区间[30,60)内有20人.(1)求m 的值及中位数n ;(2)若该校学生测试平均成绩小于n ,则学校应适当增加体育活动时间.根据以上抽样调查数据,该校是否需要增加体育活动时间?解:(1)由频率分布直方图知第1组,第2组和第3组的频率分别是0.02,0.02和0.06, 则m ×(0.02+0.02+0.06)=20,解得m =200.由直方图可知,中位数n 位于[70,80)内,则0.02+0.02+0.06+0.22+0.04(n -70)=0.5,解得n =74.5.(2)设第i (i =1,2,3,4,5,6,7)组的频率和频数分别为p i 和x i ,由图知,p 1=0.02,p 2=0.02,p 3=0.06,p 4=0.22,p 5=0.40,p 6=0.18,p 7=0.10,则由x i =200×p i ,可得x 1=4,x 2=4,x 3=12,x 4=44,x 5=80,x 6=36,x 7=20, 故该校学生测试平均成绩是x=35x1+45x2+55x3+65x4+75x5+85x6+95x7200=74<74.5,所以学校应该适当增加体育活动时间.B组高考题型专练1.(2015·高考陕西卷)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为()A.93 B.123C.137 D.167解析:由扇形统计图可得,该校女教师人数为110×70%+150×(1-60%)=137.故选C.答案:C2.(2015·高考湖南卷)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________.解析:由题意可知,这35名运动员的分组情况为,第一组(130,130,133,134,135),第二组(136,136,138,138,138),第三组(139,141,141,141,142),第四组(142,142,143,143,144),第五组(144,145,145,145,146),第六组(146,147,148,150,151),第七组(152,152,153,153,153),故成绩在区间[139,151]上的运动员恰有4组,故运动员人数为4.答案:43.(2015·高考江苏卷)已知一组数据4,6,5,8,7,6,那么这组数据的平均数为________. 解析:由平均数公式可得这组数据的平均数为4+6+5+8+7+66=6.答案:64.(2015·高考全国卷Ⅱ)某公司为了解用户对其产品的满意度,从A ,B 两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A 地区:62 73 81 92 95 85 74 64 53 76 78 86 95 66 97 78 88 82 76 89B 地区:73 83 62 51 91 46 53 73 64 82 93 48 65 81 74 56 54 76 65 79(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:记事件用户的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.解:(1)两地区用户满意度评分的茎叶图如下通过茎叶图可以看出,A地区用户满意度评分的平均值高于B地区用户满意度评分的平均值;A地区用户满意度评分比较集中,B地区用户满意度评分比较分散.(2)记C A1表示事件:“A地区用户的满意度等级为满意或非常满意”;C A2表示事件:“A地区用户的满意度等级为非常满意”;C B1表示事件:“B地区用户的满意度等级为不满意”;C B2表示事件:“B地区用户的满意度等级为满意”,则C A1与C B1独立,C A2与C B2独立,C B1与C B2互斥,C=C B1C A1∪C B2C A2. P(C)=P(C B1C A1∪C B2C A2)=P(C B1C A1)+P(C B2C A2)=P(C B1)P(C A1)+P(C B2)P(C A2).由所给数据得C A1,C A2,C B1,C B2发生的频率分别为1620,420,1020,820,故P(C A1)=1620,P(C A2)=420,P(C B1)=1020,P(C B2)=820,P(C)=1020×1620+820×420=0.48.。
《9.2 用样本估计总体》同步训练(答案在后面)一、单选题(本大题有8小题,每小题5分,共40分)1、某班级为了解学生对数学课的满意度,随机抽取了30名学生进行调查,结果显示平均满意度为85分。
以下关于用样本估计总体的说法正确的是:A. 由于样本量较小,无法准确估计总体满意度B. 样本满意度为85分,说明整个班级的学生对数学课的满意度都是85分C. 样本满意度可以作为班级总体满意度的估计值,但存在一定的误差D. 由于样本数据不具有代表性,因此无法用样本估计总体满意度2、为了估计某城市所有家庭每月的平均用水量,从该市随机抽取了100个家庭作为样本,得到这些家庭月均用水量为15立方米,标准差为3立方米。
如果以95%的置信水平构造总体均值的置信区间,那么这个区间的半宽(即误差限)大约是:A. 0.588立方米B. 0.637立方米C. 0.789立方米D. 0.945立方米3、某班级为了解学生的身高分布情况,随机抽取了50名学生进行测量。
以下关于样本估计总体的说法中,正确的是:A. 样本数量越大,估计总体的精确度越低B. 样本数量越小,估计总体的代表性越强C. 样本与总体越接近,估计总体的误差越小D. 使用样本估计总体时,样本必须是完全随机的4、从某校高一年级随机抽取了100名学生的数学成绩作为样本,已知这100名学生的平均分是75分,标准差为12分。
若用该样本估计全年级学生的数学成绩的总体平均分,则下列哪个选项最接近于该估计的95%置信区间的半宽(即误差范围)?(提示:对于大样本,95%置信水平下的Z值约为1.96)A. 2.35分B. 2.40分C. 2.45分D. 2.50分5、某班级学生身高分布如下表所示:身高区间(cm)人数150-16020160-17030170-18025180-19015若要估计该班级学生的平均身高,以下哪种方法较为合适?()A. 仅使用身高区间中间值计算平均值B. 仅使用身高区间人数计算加权平均值C. 使用身高区间中间值和对应人数计算加权平均值D. 使用身高区间人数直接计算平均值6、为了估计某市全体高一学生的身高分布,随机抽取了100名学生作为样本。
2025年高考数学一轮复习课时作业-用样本估计总体【原卷版】(时间:45分钟分值:70分)【基础落实练】1.(5分)为加强学校体育工作,推动青少年文化学习和体育锻炼协调发展.某学校对高一年级6名学生某日在校体育锻炼时长(单位:分钟)进行了统计,记录如下:45,62,51,70,66,59,则该组数据的80%分位数为()A.51B.62C.66D.642.(5分)为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.8B.12C.16D.183.(5分)已知一组数据x1,x2,x3,x4,x5的平均数为2,方差为12,则另一组数据3x1-2, 3x2-2,3x3-2,3x4-2,3x5-2的平均数、方差分别为()A.2,12B.2,1C.4,32D.4,924.(5分)某地为践行“绿水青山就是金山银山”的人与自然和谐共生的发展理念,对该地企业已处理的废水进行实时监测.下表是对A,B两家企业10天内已处理的废水的某项指标值的检测结果.下列说法正确的是()A43727398638665758178B82687137616558687794A.A企业该指标值的极差较大B.A企业该指标值的中位数较小C.B企业该指标值的平均数较大D.B企业该指标值的众数与中位数相等5.(5分)(多选题)(2024·湛江模拟)某班级体温检测员对一周内甲、乙两名同学的体温进行了统计,其结果如图所示,则下列说法正确的有()A.乙同学体温的极差为0.4B.乙同学的体温比甲同学的体温更稳定C.乙同学体温的众数为36.4,中位数与平均数相等D.甲同学体温的第70百分位数为36.56.(5分)某汽车研究院现有300名研究员,他们的学历情况如图所示,该研究院今年计划招聘一批新研究员,并决定不再招聘本科生,且使得招聘后本科生的比例下降到15%,硕士生的比例不变,则该研究院今年计划招聘的硕士生人数为________.7.(5分)(2023·厦门模拟)已知样本数据2,4,8,m的极差为10,其中m>0,则该组数据的方差为__________.8.(10分)甲、乙两名学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:甲8281797895889384乙9295807583809085(1)求两位学生预赛成绩的平均数和方差;(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.【能力提升练】9.(5分)某校排球社的同学为训练动作组织了垫排球比赛,以下为根据排球社50位同学的垫球个数画的频率分布直方图,所有同学垫球数都在5至40之间.估计垫球数的样本数据的第75百分位数是()A.17.5B.18.75C.27D.2810.(5分)(多选题)(2023·新高考Ⅰ卷)有一组样本数据x1,x2,x3,x4,x5,x6,其中x1是最小值,x6是最大值,则()A.x2,x3,x4,x5的平均数等于x1,x2,x3,x4,x5,x6的平均数B.x2,x3,x4,x5的中位数等于x1,x2,x3,x4,x5,x6的中位数C.x2,x3,x4,x5的标准差不小于x1,x2,x3,x4,x5,x6的标准差D.x2,x3,x4,x5的极差不大于x1,x2,x3,x4,x5,x6的极差11.(5分)(2024·重庆模拟)某学校为了更好地关注青少年的心理健康,对某年级的全体同学进行了一次心理健康测试,测试成绩满分为100分,其中1600名同学的测试成绩的频率分布直方图如图所示,则这1600名同学测试成绩的第65百分位数为__________.12.(10分)为了讴歌中华民族实现伟大复兴的奋斗历程,增进学生对中国共产党的热爱,某学校举办了一场党史竞赛活动,共有500名学生参加了此次竞赛活动.为了解本次竞赛活动的成绩,从中抽取了50名学生的成绩(成绩均为整数,满分为100分)进行统计,所有学生的成绩都不低于60分,将这50名学生的成绩(单位:分)进行分组,第一组[60,70),第二组[70,80),第三组[80,90),第四组[90,100],得到如图所示的频率分布直方图.(1)求图中m的值,并估计此次竞赛活动学生成绩的中位数;(2)根据频率分布直方图,估计此次竞赛活动成绩的平均数.若对成绩不低于平均数的同学进行奖励,请估计在参赛的500名学生中有多少名学生获奖.2025年高考数学一轮复习课时作业-用样本估计总体【解析版】(时间:45分钟分值:70分)【基础落实练】1.(5分)为加强学校体育工作,推动青少年文化学习和体育锻炼协调发展.某学校对高一年级6名学生某日在校体育锻炼时长(单位:分钟)进行了统计,记录如下:45,62,51,70,66,59,则该组数据的80%分位数为()A.51B.62C.66D.64【解析】选C.将6名学生该日在校体育锻炼时长记录从小到大排列为45,51,59,62,66,70,因为80%×6=4.8,所以该组数据的80%分位数为66.2.(5分)为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.8B.12C.16D.18【解析】选B.志愿者的总人数为20=50,所以第三组的人数为50×0.36=18,(0.24+0.16)×1有疗效的人数为18-6=12.3.(5分)已知一组数据x1,x2,x3,x4,x5的平均数为2,方差为12,则另一组数据3x1-2, 3x2-2,3x3-2,3x4-2,3x5-2的平均数、方差分别为()A.2,12B.2,1C.4,32D.4,92【解析】选D.因为一组数据x1,x2,x3,x4,x5的平均数为2,方差为12,所以另一组数据3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的平均数为3×2-2=4,方差为32×12=92.4.(5分)某地为践行“绿水青山就是金山银山”的人与自然和谐共生的发展理念,对该地企业已处理的废水进行实时监测.下表是对A,B两家企业10天内已处理的废水的某项指标值的检测结果.下列说法正确的是()A43727398638665758178B82687137616558687794A.A企业该指标值的极差较大B.A企业该指标值的中位数较小C.B企业该指标值的平均数较大D.B企业该指标值的众数与中位数相等【解析】选D.将A,B两家企业10天内已处理的废水的某项指标值的检测结果从小到大排列:A企业:43,63,65,72,73,75,78,81,86,98.B企业:37,58,61,65,68,68,71,77,82,94.A企业该指标值的极差为98-43=55,B企业该指标值的极差为94-37=57,A错误;A企业该指标值的中位数为73+752=74,B企业该指标值的中位数为68+682=68,B错误;A企业该指标值的平均数为43+63+65+72+73+75+78+81+86+9810=73.4,B企业该指标值的平均数为37+58+61+65+68+68+71+77+82+9410=68.1,C错误;由上可知,B企业该指标值的众数与中位数都为68,D正确.5.(5分)(多选题)(2024·湛江模拟)某班级体温检测员对一周内甲、乙两名同学的体温进行了统计,其结果如图所示,则下列说法正确的有()A.乙同学体温的极差为0.4B.乙同学的体温比甲同学的体温更稳定C.乙同学体温的众数为36.4,中位数与平均数相等D.甲同学体温的第70百分位数为36.5【解析】选BCD.选项A,乙同学体温的极差为36.5-36.3=0.2,故A错误;选项B,从题中折线图上可以看出,乙同学的体温比甲同学的体温更稳定,故B正确;选项C,乙同学的体温从低到高依次为36.3℃,36.3℃,36.4℃,36.4℃,36.4℃, 36.5℃,36.5℃,故众数为36.4,而中位数和平均数都是36.4,故C正确;选项D,甲同学的体温从低到高依次为36.2℃,36.2℃,36.4℃,36.4℃,36.5℃, 36.5℃,36.6℃,由70%×7=4.9,可知数据的第70百分位数为第5项数据36.5,故D 正确.6.(5分)某汽车研究院现有300名研究员,他们的学历情况如图所示,该研究院今年计划招聘一批新研究员,并决定不再招聘本科生,且使得招聘后本科生的比例下降到15%,硕士生的比例不变,则该研究院今年计划招聘的硕士生人数为________.【解析】根据题意,设今年计划招聘的硕士生为x人,博士生为y人,又由现有研究员300人,其中本科生有300×20%=60(人),硕士生有300×40%=120(人),=0.15,=0.4,解得 =40, =60.答案:407.(5分)(2023·厦门模拟)已知样本数据2,4,8,m的极差为10,其中m>0,则该组数据的方差为__________.【解析】由题意得m-2=10,所以m=12,所以该组数据的平均数为 =2+4+8+124=132,由方差的计算公式可知:s2=14 2-+(4-132)2+(8-132)2+12- =594.答案:5948.(10分)甲、乙两名学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:甲8281797895889384乙9295807583809085(1)求两位学生预赛成绩的平均数和方差;(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.【解析】(1)甲=18×(82+81+79+78+95+88+93+84)=85,乙=18×(92+95+80+75+83+80+90+85)=85,甲2=18×[(82-85)2+(81-85)2+(79-85)2+(78-85)2+(95-85)2+(88-85)2+(93-85)2+(84-85)2] =35.5,乙2=18×[(92-85)2+(95-85)2+(80-85)2+(75-85)2+(83-85)2+(80-85)2+(90-85)2+(85-85)2] =41.(2)由(1)知甲=乙,甲2< 乙2,甲的成绩较稳定,所以派甲参赛比较合适.【能力提升练】9.(5分)某校排球社的同学为训练动作组织了垫排球比赛,以下为根据排球社50位同学的垫球个数画的频率分布直方图,所有同学垫球数都在5至40之间.估计垫球数的样本数据的第75百分位数是()A.17.5B.18.75C.27D.28【解析】选D.垫球数在区间[5,25)内的人数占总人数的(0.01+0.01+0.04+0.06)×5×100%=60%,垫球数在区间[5,30)内的人数占总人数的(0.01+0.01+0.04+0.06+0.05)×5×100%=85%,所以第75百分位数位于区间[25,30)内,且25+5×0.75-0.60.85-0.6=28,所以估计垫球数的样本数据的第75百分位数是28.10.(5分)(多选题)(2023·新高考Ⅰ卷)有一组样本数据x1,x2,x3,x4,x5,x6,其中x1是最小值,x6是最大值,则()A.x2,x3,x4,x5的平均数等于x1,x2,x3,x4,x5,x6的平均数B.x2,x3,x4,x5的中位数等于x1,x2,x3,x4,x5,x6的中位数C.x2,x3,x4,x5的标准差不小于x1,x2,x3,x4,x5,x6的标准差D.x2,x3,x4,x5的极差不大于x1,x2,x3,x4,x5,x6的极差【解析】选BD.对于A,如1,2,2,2,3,5的平均数为2.5,而2,2,2,3的平均数为2.25,不相等,故A错误;对于B,不妨设x1≤x2≤x3≤x4≤x5≤x6,其中位数为 3+ 42,x2,x3,x4,x5的中位数为 3+ 42,所以B正确;对于C,x1,x2,x3,x4,x5,x6的波动更大,所以C错误;对于D,不妨设x1≤x2≤x3≤x4≤x5≤x6,则x5-x2≤x6-x1,故D正确.11.(5分)(2024·重庆模拟)某学校为了更好地关注青少年的心理健康,对某年级的全体同学进行了一次心理健康测试,测试成绩满分为100分,其中1600名同学的测试成绩的频率分布直方图如图所示,则这1600名同学测试成绩的第65百分位数为__________.【解析】因为(0.01+0.01+m+0.02+0.02)×10=1,所以m=0.04,又0.1+0.1+0.4=0.6, 0.1+0.1+0.4+0.2=0.8,所以第65百分位数位于第4组中,设第65百分位数为a,则0.1+0.1+0.4+(a-80)×0.02=0.65,解得a=82.5.答案:82.512.(10分)为了讴歌中华民族实现伟大复兴的奋斗历程,增进学生对中国共产党的热爱,某学校举办了一场党史竞赛活动,共有500名学生参加了此次竞赛活动.为了解本次竞赛活动的成绩,从中抽取了50名学生的成绩(成绩均为整数,满分为100分)进行统计,所有学生的成绩都不低于60分,将这50名学生的成绩(单位:分)进行分组,第一组[60,70),第二组[70,80),第三组[80,90),第四组[90,100],得到如图所示的频率分布直方图.(1)求图中m的值,并估计此次竞赛活动学生成绩的中位数;(2)根据频率分布直方图,估计此次竞赛活动成绩的平均数.若对成绩不低于平均数的同学进行奖励,请估计在参赛的500名学生中有多少名学生获奖.【解析】(1)由题中频率分布直方图知(0.01+m+0.04+0.02)×10=1,解得m=0.03;设此次竞赛活动学生成绩的中位数为x0,因为数据落在[60,80)内的频率为0.4,落在[60,90)内的频率为0.8,从而可得80<x0<90,由(x0-80)×0.04=0.5-0.4,得x0=82.5,所以估计此次竞赛活动学生成绩的中位数为82.5.(2)由题中频率分布直方图及(1)知, =65×0.1+75×0.3+85×0.4+95×0.2=82,此次竞赛活动学生成绩不低于82的频率为0.2+90-8210×0.4=0.52,则获奖的学生有500×0.52=260(名),所以估计此次竞赛活动成绩的平均数为82,在参赛的500名学生中有260名学生获奖.。
2021年高考数学一轮复习 9.2 用样本估计总体课时作业理(含解析)新人教A版一、选择题1.(xx·厦门市高三质检)某雷达测速区规定:凡车速大于或等于80 km/h 的汽车视为“超速”,并将受到处罚.如图是某路段的一个检测点对200辆汽车的车速进行检测所得结果的频率分布直方图,则从图中可以看出被处罚的汽车大约有( )A.20辆 B.40辆 C.60辆 D.80辆解析:由图知车速大于或等于80 km/h的频率为0.1,被罚车辆大约为200×0.1=20辆,选A.答案:A2.(xx·武汉调研测试)某校100名学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100],则图中a 的值为( )A .0.006B .0.005C .0.004 5D .0.002 5解析:频率分布直方图中、各个矩形的面积和为1,所以20a +0.2+0.3+0.4=1,∴a =0.005.答案:B3.(xx·安徽亳州高三摸底联考)样本中共有五个个体,其值分别为a,2,3,4,5,若该样本的平均值为3,则样本方差为( )A.65 B.65C. 2 D .2 解析:由a +2+3+4+55=3得a =1∴方差S 2=15[(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2]=2.∴故答案为D. 答案:D4.(xx·石家庄第二次模拟)给定一组数据x 1,x 2,…,x 20,若这组数据的方差为3,则数据2x 1+3,2x 2+3,…,2x 20+3的方差为( )A .6B .9C .12D .15解析:由D (aξ+b )=a 2D (ξ),可知2x 1+3,2x 2+3,…,2x 20+3的方差为12.故选C. 答案:C5.(xx·陕西卷)从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲乙两组数据的平均数分别为x甲,x乙,中位数分别为m甲,m乙,则( )A.x甲<x乙,m甲>m乙B.x甲<x乙,m甲<m乙C.x甲>x乙,m甲>m乙D.x甲>x乙,m甲<m乙解析:由题图可得x甲=34516=21.562 5,m甲=20,x乙=45716=28.562 5,m乙=29,所以x甲<x乙,m甲<m乙.故选B.答案:B6.(xx·安徽卷)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的中位数等于乙的成绩的中位数C.甲的成绩的方差小于乙的成绩的方差D.甲的成绩的极差小于乙的成绩的极差解析:由图可得,x甲=4+5+6+7+85=6,x乙=3×5+6+95=6,故A错;而甲的成绩的中位数为6,乙的成绩的中位数为5,故B 错;s 2甲=4-62+5-62+6-62+7-62+8-625=2,s 2乙=3×5-62+6-62+9-625=2.4,故C 正确;甲的成绩的极差为4,乙的成绩的极差也为4,故D 错.答案:C 二、填空题7.(xx·贵州省六校第一次联考)某同学学业水平考试的9科成绩如茎叶图所示,则根据茎叶图可知该同学的平均分为________.解析:由茎叶图可知该同学的分数由个位及十位数组成,个位数的平均数与十位数的平均数之和为该同学的平均数,所以平均分为:x =1×60+4×70+3×80+1×909+3×8+2×9+2×2+1+39=670+509=80.答案:808.(xx·马鞍山第一次质检)已知总体的各个个体的值由小到大依次为3,7,a ,b,12,20,且总体的中位数为12,若要使该总体的标准差最小,则a =________.解析:总体的中位数为a +b2=12,即a +b =24,数据是从小到大排列的7≤a ≤b ≤12,∴a =b =12.答案:129.(xx·保定市高三第一次模拟)一个频率分布表(样本容量为50)不小心被损坏了一部分,只记得样本中数据在[20,60)上的频率为0.6,则估计样本在[40,50),[50,60)内的数据个数之和是________.解析:由已知样本数据在[20,60)上的频率为0.6,故在[20,60)上的数据为30,则在[40,50),[50,60)内的数据个数之和为21.答案:21三、解答题10.为征求个人所得税法修改建议,某机构对当地居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(每个分组包括左端点,不包括右端点,如第一组表示收入在[1 000,1 500)).(1)求居民月收入在[3 000,4 000)的频率;(2)根据频率分布直方图估算样本数据的中位数;(3)为了分析居民的收入与年龄、职业等方面的关系,必须按月收入再从这10 000人中用分层抽样方法抽出100人作进一步分析,则月收入在[2 500,3 000)的这段应抽多少人?解:(1)居民月收入在[3 000,4 000)的频率为(0.000 3+0.000 1)×500=0.2.(2)第一组和第二组的频率之和为(0.000 2+0.000 4)×500=0.3,第三组的频率为0.000 5×500=0.25,因此,可以估算样本数据的中位数为2 000+0.5-0.30.25×500=2 400(元).(3)第四组的人数为0.000 5×500×10 000=2 500,因此月收入在[2 500,3 000)的这段应抽2 500×10010 000=25(人).11.某工厂对200个电子元件的使用寿命进行检查,按照使用寿命(单位:h),可以把这批电子元件分成第一组[100,200],第二组(200,300],第三组(300,400],第四组(400,500],第五组(500,600],第六组(600,700],由于工作中不慎将部分数据丢失,现有以下部分图表:分组 [100,200](200,300] (300,400](400,500](500,600] (600,700]频数 B 30EF20H 频率CD 0.20.4GI(2)求图2中阴影部分的面积;(3)若电子元件的使用时间超过300h 为合格产品,求这批电子元件合格的概率. 解:(1)由题意可知0.1=A ·100,∴A =0.001, ∵0.1=B200,∴B =20,又C =0.1,D =30200=0.15,E =0.2×200=40,F =0.4×200=80,G =20200=0.1, ∴H =10,I =10200=0.05. (2)阴影部分的面积为0.4+0.1=0.5.(3)电子元件的使用时间超过300 h 的共有40+80+20+10=150个,故这批电子元件合格的概率P =150200=34.[热点预测]12.(1)(xx·莆田质检)一组数据如茎叶图所示.若从中剔除2个数据,使得新数据组的平均数不变且方差最小,则剔除的2个数据的积等于________.(2)(xx·江门佛山两市质检)为了解一片速生林的生长情况,随机测量了其中100株树木的底部周长(单位:cm).根据所得数据画出样本的频率分布直方图(如下图),那么在这100株树木中,底部周长小于110cm的株数是( )A.30 B.60 C.70 D.80解析:(1)这组数据的平均数x=3+8+12+11+13+16+217=12,若剔除两个数据后平均数不变,则这两个数之和为24.若使方差最小,则这两个数应与12的差较大,所以剔除3和21,其乘积为3×21=63.(2)100×(0.1+0.2+0.4)=70.答案:(1)63 (2)C22856 5948 奈=21432 53B8 厸121070 524E 剎V27321 6AB9 檹?40185 9CF9 鳹n38761 9769 革23834 5D1A 崚n21879 5577 啷。
第九篇 第2节
一、选择题
1.学校为了调查学生在课外读物方面的支出情况,抽出了一个容量为n 且支出在[20,60)元的样本,其频率分布直方图如图所示,其中支出在[50,60)元的同学有30人,则n 的值为( )
A .90
B .100
C .900
D .1000
解析:支出在[50,60)元的频率为 1-0.36-0.24-0.1=0.3, 因此30
n =0.3,故n =100.故选B.
答案:B
2.(2012年高考湖北卷)容量为20的样本数据,分组后的频数如表:
A .0.35
B .0.45
C .0.55
D .0.65
解析:由表知[10,40)的频数为2+3+4=9, 所以样本数据落在区间[10,40)的频率为9
20=0.45.
故选B. 答案:B
3.(2012年高考山东卷)在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的是( )
A .众数
B .平均数
C .中位数
D .标准差
解析:由题原来众数88变为90,中位数由86变为88,平均数增加2.所以每个数与平均数的差不变,即标准差不变.故选D.
答案:D
4.(2014合肥一中质量检测)某研究机构对高三学生的记忆力x 和判断力y 进行统计分析,所得数据如表:
则y 对x A.y ^=2.3x -0.7 B.y ^
=2.3x +0.7 C.y ^=0.7x -2.3 D.y ^
=0.7x +2.3
解析:由题中表格,x =9,y =4,∑i =1
4
x i y i =158,∑i =1
4
x 2i =344,
∴b ^=158-4×9×4344-4×92
=0.7,a ^=4-0.7×9=-2.3, ∴回归直线方程为y ^
=0.7x -2.3.故选C. 答案:C
5.(2014西安模拟)某校甲、乙两个班级各有编号为1,2,3,4,5的五名学生进行投篮练习,每人投10次,投中的次数如表:
A .25
B .425
C .35
D .4
解析:甲班的平均数为x 甲=6+7+7+8+7
5=7,
甲班的方差为
s 2甲=(6-7)2+(7-7)2+(7-7)2+(8-7)2+(7-7)2
5=25
; 乙班的平均数为x 乙
=6+7+6+7+9
5
=7, 乙班的方差为
s 2乙=(6-7)2+(7-7)2+(6-7)2+(7-7)2+(9-7)2
5=65
. ∵65>25
, ∴s 2=2
5.故选A.
答案:A
6.(2013年高考重庆卷)如图所示的茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分),已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x ,y 的值分别为( )
A .2,5
B .5,5
C .5,8
D .8,8
解析:因为甲组数据的中位数为15,由茎叶图可得x =5, 因乙组数据的平均数为16.8, 则9+15+(10+y )+18+245=16.8,
解得y =8. 故选C. 答案:C 二、填空题
7.(2014青岛模拟)如图所示是某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图,则甲、乙两人比赛得分的中位数之和是________.
解析:甲比赛得分的中位数为28,乙比赛得分的中位数为36, 所以甲、乙两人比赛得分的中位数之和为28+36=64. 答案:64
8.已知总体的各个体的值由小到大依次为2,3,3,7,a ,b,12,13.7,18.3,20,且总体的中位数为10.5,若要使该总体的方差最小,则a ,b 的取值分别是________,________.
解析:∵中位数为10.5, ∴a +b 2=10.5, 即a +b =21.
∵x =2+3+3+7+a +b +12+13.7+18.3+2010
=10, ∴s 2=
1
10
[(2-10)2+(3-10)2×2+(7-10)2+(a -10)2+(b -10)2+(12-10)2+(13.7-10)2+(18.3-10)2+(20-10)2].
令y =(a -10)2+(b -10)2 =2a 2-42a +221 =2a -2122+12
,
当a =10.5时,y 取最小值,方差s 2也取最小值. ∴a =10.5,b =10.5. 答案:10.5 10.5
9.(2014威海模拟)某商场调查旅游鞋的销售情况,随机抽取了部分顾客的购鞋尺寸,整理得如下频率分布直方图,其中直方图从左至右的前3个小矩形的面积之比为1∶2∶3,则购鞋尺寸在[39.5,43.5)内的顾客所占百分比为________.
解析:后两个小组的频率为(0.0375+0.0875)×2=0.25,所以前3个小组的频率为1-0.25=0.75,
又前3个小组的面积比为1∶2∶3,
即前3个小组的面积比即频率比为1∶2∶3.
所以第三小组的频率为3
1+2+3
×0.75=0.375,第四小组的频率为0.0875×2=0.175,所以购鞋尺寸在[39.5,43.5)的频率为0.375+0.175=0.55=55%.
答案:55%
10.如图是某青年歌手大奖赛上七位评委为甲、乙两名选手打出的分数的茎叶图(其中m为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a1,a2,则a1与a2的大小关系是________.
解析:去掉一个最高分和一个最低分后,甲选手叶上的数字之和是20,乙选手叶上的数字之和是25,故a2>a1.
答案:a2>a1
三、解答题
11.(2013年高考安徽卷)为调查甲、乙两校高三年级学生某次联考数学成绩情况,用简单随机抽样,从这两校中各抽取30名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如图:
(1)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);
(2)设甲、乙两校高三年级学生这次联考数学平均成绩分别为x1,x2,估计x1-x2的值.
解:(1)设甲校高三年级学生总人数为n , 则30n =0.05⇒n =300.05
=600, 甲校样本数据人数为30,及格人数为25, 所以估计甲校这次联考数学成绩及格率P =2530=56.
(2)x 1=2084
30
, x 2=
2069
30
, x 1-x 2=208430-206930=15
30=0.5.
故x 1-x 2的估计值为0.5分.
12.(2013年高考新课标全国卷Ⅰ)为了比较两种治疗失眠症的药(分别称为A 药,B 药)的疗效,随机地选取20位患者服用A 药,20位患者服用B 药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h),试验的观测结果如下:
服用A 药的20位患者日平均增加的睡眠时间: 0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4 服用B 药的20位患者日平均增加的睡眠时间: 3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4 1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5
(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好? (2)根据两组数据完成茎叶图,从茎叶图看,哪种药的疗效更好?
解:(1)设A 药观测数据的平均数为x ,B 药观测数据的平均数为y , 由观测结果可得x =
1
20
(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3.
y =
1
20
(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+
2.4+2.5+2.6+2.7+
3.2)=1.6.
由以上计算结果可得x >y ,因此可看出A 药的疗效更好. (2)由观测结果可绘制茎叶图
从以上茎叶图可以看出,A 药疗效的试验结果有一半的叶集中在茎2.上,而B 药疗效的试验结果有19
20
的叶集中在茎0.,1.,2.上,较为分散,由此可看出A 药的疗效更好.。