【优化方案】高考文数总复习(山东专用)总复习练习:10.2用样本估计总体(含答案解析)
- 格式:doc
- 大小:201.00 KB
- 文档页数:4
第2讲 用样本估计总体1.若某校高一年级8个班参加合唱比赛的得分如图K15-2-1所示的茎叶图,则这组数据的中位数和平均数分别是( )图K15-2-1A .91.5和91.5B .91.5和92C .91和91.5D .92和922.学校为了调查学生在课外读物方面的支出情况,抽取了一个容量为n 的样本,其频率分布直方图如图K15-2-2,其中支出在[50,60)的同学有30人,若想在这n 人中抽取50人,则在[50,60)之间应抽取的人数为( )图K15-2-2A .10人B .15人C .25人D .30人3.在样本的频率分布直方图中,共有11个小长方形,若中间一个小矩形的面积等于其他10个小矩形的面积和的14,且样本容量为160,则中间一组的频数为( ) A .32 B .0.2C .40D .0.254.(2013年山东)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场做的9个分数的茎叶图后来有一个数据模糊,无法辨认,在图K15-2-3中以x 表示.则7个剩余分数的方差为( )图K15-2-3A.1169B.367 C .36 D.6 775.(2012届广东佛山质检)某市要对两千多名出租车司机的年龄进行调查,现从中随机抽出100名司机,已知抽到的司机年龄都在[20,45)岁之间,根据调查结果得出司机的年龄情况残缺的频率分布直方图如图K15-2-4,利用这个残缺的频率分布直方图估计该市出租车司机年龄的中位数大约是( )图K15-2-4A.31.6岁B.32.6岁C.33.6岁D.36.6岁6.(2013年广东佛山一模)课题组进行城市空气质量调查,按地域把24个城市分成甲、乙、丙三组,对应的城市个数分别为4、12、8.若用分层抽样的方法抽取6个城市,则丙组中应抽取的城市个数为____________.7.(2012年广东韶关高三调研)某班50名学生在一次百米测试中,成绩全部介于13秒与18秒之间,将测试结果分成五组:每一组[13,14);第二组[14,15),…,第五组[17,18).如图K15-2-5是按上述分组方法得到的频率分布直方图.若成绩大于或等于14秒且小于16秒认为良好,则该班在这次百米测试中成绩良好的人数等于________人.图K15-2-58.(2012年广东)由正整数组成的一组数据x1,x2,x3,x4,其平均数和中位数都是2,且标准差等于1,则这组数据为__________(从小到大排列).9.(2011年广东广州综合测试)某工厂甲、乙两个车间包装同一种产品,在自动包装传送带上每隔1小时抽一包产品,称其重量(单位:克)是否合格,分别记录抽查数据,获得重量数据的茎叶图如图K15-2-6.图K15-2-6(1) 根据样品数据,计算甲、乙两个车间产品重量的均值与方差,并说明哪个车间的产品的重量相对较稳定;(2) 若从乙车间6件样品中随机抽取2件,求所抽取的2件样品的重量之差不超过2克的概率.10.从某校高三年级800名学生中随机抽取50名测量身高,据测量,被抽取的学生的身高全部介于155 cm和195 cm之间,将测量结果按如下方式分成八组:第一组[155,160),第二组[160,165),…,第八组[190,195],图K15-2-7是按上述分组方法得到的频率分布直方图.(1)图K15-2-7(2)试估计这所学校高三年级800名学生中身高在180 cm以上(含180 cm)的人数;(3)在样本中,若第二组有1名男生,其余为女生,第七组有1名女生,其余为男生,在第二组和第七组中各选一名同学组成实验小组,问:实验小组中恰有一男一女的概率是多少?第2讲 用样本估计总体1.A 2.B 3.A4.B 解析:∵由题意知去掉一个最高分和一个最低分后,所剩数据的数据是87,90,90,91,91,94,90+x .∴这组数据的平均数是87+90+90+91+91+94+90+x 7=91,∴x =4. ∴这组数据的方差是17(16+1+1+0+0+9+9)=367. 5.C 6.2 7.278.1,1,3,3 解析:不妨设x 1≤x 2≤x 3≤x 4,x 1,x 2,x 3,x 4∈N *,依题意得x 1+x 2+x 3+x 4=8,s =14[(x 1-2)2+(x 2-2)2+(x 3-2)2+(x 4-2)2]=1, 即(x 1-2)2+(x 2-2)2+(x 3-2)2+(x 4-2)2=4,所以x 4≤3.则只能x 1=x 2=1,x 3=x 4=3,则这组数据为1,1,3,3.9.解:(1)x 甲=16(107+111+111+113+114+122)=113, x 乙=16(108+109+110+112+115+124)=113, s 2甲=16[(107-113)2+(111-113)2+(111-113)2+(113-113)2+(114-113)2+(122-113)2]=21,s 2乙=16[(108-113)2+(109-113)2+(110-113)2+(112-113)2+(115-113)2+(124-113)2]=883, ∵x 甲=x 乙,s 2甲<s 2乙 ,∴甲车间的产品的重量相对较稳定.(2)从乙车间6件样品中随机抽取两件,共有15种不同的取法:(108,109),(108,110),(108,112),(108,115),(108,124),(109,110),(109,112),(109,115),(109,124),(110,112),(110,115),(110,124),(112,115),(112,124),(115,124).设A 表示随机事件“所抽取的两件样品的重量之差不超过2克”,则A 的基本事件有4种:(108,109),(108,110),(109,110),(110,112).故所求概率为P (A )=415. 10.解:(1)由频率分布直方图得第七组频率为:1-(0.008×2+0.016×2+0.04×2+0.06)×5=0.06,∴第七组的人数为0.06×50=3.(2)级800名学生中身高在180 cm 以上(含180 cm)的人数为800×0.18=144(人).(3)第二组中四人可记为a ,b ,c ,d ,其中a 为男生,b ,c ,d 为女生,第七组中三人可记为1,2,3,其中1,2所以基本事件有12个.实验小组中恰有一男一女的事件有1b,1c,1d,2b,2c,2d,3a,共7个,因此实验小组中恰有一男一女的概率是712.。
2025年高考数学一轮复习课时作业-用样本估计总体【原卷版】(时间:45分钟分值:70分)【基础落实练】1.(5分)为加强学校体育工作,推动青少年文化学习和体育锻炼协调发展.某学校对高一年级6名学生某日在校体育锻炼时长(单位:分钟)进行了统计,记录如下:45,62,51,70,66,59,则该组数据的80%分位数为()A.51B.62C.66D.642.(5分)为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.8B.12C.16D.183.(5分)已知一组数据x1,x2,x3,x4,x5的平均数为2,方差为12,则另一组数据3x1-2, 3x2-2,3x3-2,3x4-2,3x5-2的平均数、方差分别为()A.2,12B.2,1C.4,32D.4,924.(5分)某地为践行“绿水青山就是金山银山”的人与自然和谐共生的发展理念,对该地企业已处理的废水进行实时监测.下表是对A,B两家企业10天内已处理的废水的某项指标值的检测结果.下列说法正确的是()A43727398638665758178B82687137616558687794A.A企业该指标值的极差较大B.A企业该指标值的中位数较小C.B企业该指标值的平均数较大D.B企业该指标值的众数与中位数相等5.(5分)(多选题)(2024·湛江模拟)某班级体温检测员对一周内甲、乙两名同学的体温进行了统计,其结果如图所示,则下列说法正确的有()A.乙同学体温的极差为0.4B.乙同学的体温比甲同学的体温更稳定C.乙同学体温的众数为36.4,中位数与平均数相等D.甲同学体温的第70百分位数为36.56.(5分)某汽车研究院现有300名研究员,他们的学历情况如图所示,该研究院今年计划招聘一批新研究员,并决定不再招聘本科生,且使得招聘后本科生的比例下降到15%,硕士生的比例不变,则该研究院今年计划招聘的硕士生人数为________.7.(5分)(2023·厦门模拟)已知样本数据2,4,8,m的极差为10,其中m>0,则该组数据的方差为__________.8.(10分)甲、乙两名学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:甲8281797895889384乙9295807583809085(1)求两位学生预赛成绩的平均数和方差;(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.【能力提升练】9.(5分)某校排球社的同学为训练动作组织了垫排球比赛,以下为根据排球社50位同学的垫球个数画的频率分布直方图,所有同学垫球数都在5至40之间.估计垫球数的样本数据的第75百分位数是()A.17.5B.18.75C.27D.2810.(5分)(多选题)(2023·新高考Ⅰ卷)有一组样本数据x1,x2,x3,x4,x5,x6,其中x1是最小值,x6是最大值,则()A.x2,x3,x4,x5的平均数等于x1,x2,x3,x4,x5,x6的平均数B.x2,x3,x4,x5的中位数等于x1,x2,x3,x4,x5,x6的中位数C.x2,x3,x4,x5的标准差不小于x1,x2,x3,x4,x5,x6的标准差D.x2,x3,x4,x5的极差不大于x1,x2,x3,x4,x5,x6的极差11.(5分)(2024·重庆模拟)某学校为了更好地关注青少年的心理健康,对某年级的全体同学进行了一次心理健康测试,测试成绩满分为100分,其中1600名同学的测试成绩的频率分布直方图如图所示,则这1600名同学测试成绩的第65百分位数为__________.12.(10分)为了讴歌中华民族实现伟大复兴的奋斗历程,增进学生对中国共产党的热爱,某学校举办了一场党史竞赛活动,共有500名学生参加了此次竞赛活动.为了解本次竞赛活动的成绩,从中抽取了50名学生的成绩(成绩均为整数,满分为100分)进行统计,所有学生的成绩都不低于60分,将这50名学生的成绩(单位:分)进行分组,第一组[60,70),第二组[70,80),第三组[80,90),第四组[90,100],得到如图所示的频率分布直方图.(1)求图中m的值,并估计此次竞赛活动学生成绩的中位数;(2)根据频率分布直方图,估计此次竞赛活动成绩的平均数.若对成绩不低于平均数的同学进行奖励,请估计在参赛的500名学生中有多少名学生获奖.2025年高考数学一轮复习课时作业-用样本估计总体【解析版】(时间:45分钟分值:70分)【基础落实练】1.(5分)为加强学校体育工作,推动青少年文化学习和体育锻炼协调发展.某学校对高一年级6名学生某日在校体育锻炼时长(单位:分钟)进行了统计,记录如下:45,62,51,70,66,59,则该组数据的80%分位数为()A.51B.62C.66D.64【解析】选C.将6名学生该日在校体育锻炼时长记录从小到大排列为45,51,59,62,66,70,因为80%×6=4.8,所以该组数据的80%分位数为66.2.(5分)为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.8B.12C.16D.18【解析】选B.志愿者的总人数为20=50,所以第三组的人数为50×0.36=18,(0.24+0.16)×1有疗效的人数为18-6=12.3.(5分)已知一组数据x1,x2,x3,x4,x5的平均数为2,方差为12,则另一组数据3x1-2, 3x2-2,3x3-2,3x4-2,3x5-2的平均数、方差分别为()A.2,12B.2,1C.4,32D.4,92【解析】选D.因为一组数据x1,x2,x3,x4,x5的平均数为2,方差为12,所以另一组数据3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的平均数为3×2-2=4,方差为32×12=92.4.(5分)某地为践行“绿水青山就是金山银山”的人与自然和谐共生的发展理念,对该地企业已处理的废水进行实时监测.下表是对A,B两家企业10天内已处理的废水的某项指标值的检测结果.下列说法正确的是()A43727398638665758178B82687137616558687794A.A企业该指标值的极差较大B.A企业该指标值的中位数较小C.B企业该指标值的平均数较大D.B企业该指标值的众数与中位数相等【解析】选D.将A,B两家企业10天内已处理的废水的某项指标值的检测结果从小到大排列:A企业:43,63,65,72,73,75,78,81,86,98.B企业:37,58,61,65,68,68,71,77,82,94.A企业该指标值的极差为98-43=55,B企业该指标值的极差为94-37=57,A错误;A企业该指标值的中位数为73+752=74,B企业该指标值的中位数为68+682=68,B错误;A企业该指标值的平均数为43+63+65+72+73+75+78+81+86+9810=73.4,B企业该指标值的平均数为37+58+61+65+68+68+71+77+82+9410=68.1,C错误;由上可知,B企业该指标值的众数与中位数都为68,D正确.5.(5分)(多选题)(2024·湛江模拟)某班级体温检测员对一周内甲、乙两名同学的体温进行了统计,其结果如图所示,则下列说法正确的有()A.乙同学体温的极差为0.4B.乙同学的体温比甲同学的体温更稳定C.乙同学体温的众数为36.4,中位数与平均数相等D.甲同学体温的第70百分位数为36.5【解析】选BCD.选项A,乙同学体温的极差为36.5-36.3=0.2,故A错误;选项B,从题中折线图上可以看出,乙同学的体温比甲同学的体温更稳定,故B正确;选项C,乙同学的体温从低到高依次为36.3℃,36.3℃,36.4℃,36.4℃,36.4℃, 36.5℃,36.5℃,故众数为36.4,而中位数和平均数都是36.4,故C正确;选项D,甲同学的体温从低到高依次为36.2℃,36.2℃,36.4℃,36.4℃,36.5℃, 36.5℃,36.6℃,由70%×7=4.9,可知数据的第70百分位数为第5项数据36.5,故D 正确.6.(5分)某汽车研究院现有300名研究员,他们的学历情况如图所示,该研究院今年计划招聘一批新研究员,并决定不再招聘本科生,且使得招聘后本科生的比例下降到15%,硕士生的比例不变,则该研究院今年计划招聘的硕士生人数为________.【解析】根据题意,设今年计划招聘的硕士生为x人,博士生为y人,又由现有研究员300人,其中本科生有300×20%=60(人),硕士生有300×40%=120(人),=0.15,=0.4,解得 =40, =60.答案:407.(5分)(2023·厦门模拟)已知样本数据2,4,8,m的极差为10,其中m>0,则该组数据的方差为__________.【解析】由题意得m-2=10,所以m=12,所以该组数据的平均数为 =2+4+8+124=132,由方差的计算公式可知:s2=14 2-+(4-132)2+(8-132)2+12- =594.答案:5948.(10分)甲、乙两名学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:甲8281797895889384乙9295807583809085(1)求两位学生预赛成绩的平均数和方差;(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.【解析】(1)甲=18×(82+81+79+78+95+88+93+84)=85,乙=18×(92+95+80+75+83+80+90+85)=85,甲2=18×[(82-85)2+(81-85)2+(79-85)2+(78-85)2+(95-85)2+(88-85)2+(93-85)2+(84-85)2] =35.5,乙2=18×[(92-85)2+(95-85)2+(80-85)2+(75-85)2+(83-85)2+(80-85)2+(90-85)2+(85-85)2] =41.(2)由(1)知甲=乙,甲2< 乙2,甲的成绩较稳定,所以派甲参赛比较合适.【能力提升练】9.(5分)某校排球社的同学为训练动作组织了垫排球比赛,以下为根据排球社50位同学的垫球个数画的频率分布直方图,所有同学垫球数都在5至40之间.估计垫球数的样本数据的第75百分位数是()A.17.5B.18.75C.27D.28【解析】选D.垫球数在区间[5,25)内的人数占总人数的(0.01+0.01+0.04+0.06)×5×100%=60%,垫球数在区间[5,30)内的人数占总人数的(0.01+0.01+0.04+0.06+0.05)×5×100%=85%,所以第75百分位数位于区间[25,30)内,且25+5×0.75-0.60.85-0.6=28,所以估计垫球数的样本数据的第75百分位数是28.10.(5分)(多选题)(2023·新高考Ⅰ卷)有一组样本数据x1,x2,x3,x4,x5,x6,其中x1是最小值,x6是最大值,则()A.x2,x3,x4,x5的平均数等于x1,x2,x3,x4,x5,x6的平均数B.x2,x3,x4,x5的中位数等于x1,x2,x3,x4,x5,x6的中位数C.x2,x3,x4,x5的标准差不小于x1,x2,x3,x4,x5,x6的标准差D.x2,x3,x4,x5的极差不大于x1,x2,x3,x4,x5,x6的极差【解析】选BD.对于A,如1,2,2,2,3,5的平均数为2.5,而2,2,2,3的平均数为2.25,不相等,故A错误;对于B,不妨设x1≤x2≤x3≤x4≤x5≤x6,其中位数为 3+ 42,x2,x3,x4,x5的中位数为 3+ 42,所以B正确;对于C,x1,x2,x3,x4,x5,x6的波动更大,所以C错误;对于D,不妨设x1≤x2≤x3≤x4≤x5≤x6,则x5-x2≤x6-x1,故D正确.11.(5分)(2024·重庆模拟)某学校为了更好地关注青少年的心理健康,对某年级的全体同学进行了一次心理健康测试,测试成绩满分为100分,其中1600名同学的测试成绩的频率分布直方图如图所示,则这1600名同学测试成绩的第65百分位数为__________.【解析】因为(0.01+0.01+m+0.02+0.02)×10=1,所以m=0.04,又0.1+0.1+0.4=0.6, 0.1+0.1+0.4+0.2=0.8,所以第65百分位数位于第4组中,设第65百分位数为a,则0.1+0.1+0.4+(a-80)×0.02=0.65,解得a=82.5.答案:82.512.(10分)为了讴歌中华民族实现伟大复兴的奋斗历程,增进学生对中国共产党的热爱,某学校举办了一场党史竞赛活动,共有500名学生参加了此次竞赛活动.为了解本次竞赛活动的成绩,从中抽取了50名学生的成绩(成绩均为整数,满分为100分)进行统计,所有学生的成绩都不低于60分,将这50名学生的成绩(单位:分)进行分组,第一组[60,70),第二组[70,80),第三组[80,90),第四组[90,100],得到如图所示的频率分布直方图.(1)求图中m的值,并估计此次竞赛活动学生成绩的中位数;(2)根据频率分布直方图,估计此次竞赛活动成绩的平均数.若对成绩不低于平均数的同学进行奖励,请估计在参赛的500名学生中有多少名学生获奖.【解析】(1)由题中频率分布直方图知(0.01+m+0.04+0.02)×10=1,解得m=0.03;设此次竞赛活动学生成绩的中位数为x0,因为数据落在[60,80)内的频率为0.4,落在[60,90)内的频率为0.8,从而可得80<x0<90,由(x0-80)×0.04=0.5-0.4,得x0=82.5,所以估计此次竞赛活动学生成绩的中位数为82.5.(2)由题中频率分布直方图及(1)知, =65×0.1+75×0.3+85×0.4+95×0.2=82,此次竞赛活动学生成绩不低于82的频率为0.2+90-8210×0.4=0.52,则获奖的学生有500×0.52=260(名),所以估计此次竞赛活动成绩的平均数为82,在参赛的500名学生中有260名学生获奖.。
第2讲用样本估计总体[考纲解读] 1.了解频率分布直方图的意义和作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,并体会它们各自的特点.(重点)2.理解样本数据标准差的意义和作用,会计算数据标准差;能从样本数据中提取基本的数字特征,并作出合理的解释.3.会用样本的频率分布估计总体分布,用样本的基本数字特征估计总体的基本数字特征.(难点)4.会用随机抽样的基本方法和样本估计总体的思想解决实际问题.[考向预测]从近三年高考情况来看,本讲是高考中的一个热点.预测2021年将会考查用样本估计总体,主要体现在利用频率分布直方图或茎叶图估计总体,利用样本数字特征估计总体.题型以客观题呈现,试题难度不大,属中、低档题型.频率分布直方图与茎叶图也可能出现于解答题中,与概率等知识综合命题.1.作频率分布直方图的步骤2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的□01中点,就得到频率分布折线图.(2)总体密度曲线:随着□02样本容量的增加,作图时所分的组数增加,□03组距减小,相应的频率折线图就会越来越接近于一条光滑曲线,即总体密度曲线.3.茎叶图(1)茎叶图的概念:统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.(2)茎叶图的优点:一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况.4.样本的数字特征 (1)众数、中位数、平均数 数字特征样本数据频率分布直方图优点与缺点众数出现次数□01最多的数据取最高的小长方形底边□02中点的横坐标 通常用于描述变量的值出现次数最多的数,但显然它对其他数据信息的忽视使得无法客观地反映总体特征中位数将数据按大小依次排列,处在最□03中间位置的一个数据(或最中间两个数据的平均数)把频率分布直方图划分左右两个面积□04相等的分界线与x 轴交点的横坐标是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点平均数样本数据的算术平均数每个小矩形的面积乘以小矩形底边中点的横坐标之□05和 平均数和每一个数据有关,可以反映样本数据全体的信息,但平均数受数据中极端值的影响较大,使平均数在估计总体时可靠性降低方差:s 2=1n [(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2],标准差: s =1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2]. (3)平均数反映了数据取值的平均水平,标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越波动;标准差、方差越小,数据的离散程度越小,越稳定.1.概念辨析(1)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.()(2)从频率分布直方图中得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.()(3)在频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间内的频率越高.()(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.()答案(1)×(2)√(3)√(4)×2.小题热身(1)(2017·全国卷Ⅰ)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数答案 B解析因为可以用极差、方差或标准差来描述数据的离散程度,所以要评估亩产量稳定程度,应该用样本数据的极差、方差或标准差.故选B.(2)若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是()A.91.5和91.5 B.91.5和92C.91和91.5 D.92和92答案 A解析由茎叶图可知,这组数据的中位数是12×(91+92)=91.5,平均数是18×(87+89+90+91+92+93+94+96)=91.5.(3)港珠澳大桥于2018年10月2日正式通车,它是中国境内一座连接香港、珠海和澳门的桥隧工程,桥隧全长55千米.桥面为双向六车道高速公路,大桥通行限速100 km/h ,现对大桥某路段上1000辆汽车的行驶速度进行抽样调查.画出频率分布直方图(如图),根据直方图估计在此路段上汽车行驶速度在区间[85,90)的车辆数和行驶速度超过90 km/h 的频率分别为( )A.300 0.25 B .300 0.35 C.60 0.25 D .60 0.35答案 B解析 由频率分布直方图,得在此路段上汽车行驶速度在区间[85,90)的频率为0.06×5=0.3,∴在此路段上汽车行驶速度在区间[85,90)的车辆数为0.3×1000=300,行驶速度超过90 km/h 的频率为(0.05+0.02)×5=0.35.故选B.(4)(2019·江苏高考)已知一组数据6,7,8,8,9,10,则该组数据的方差是________. 答案 53解析 这组数据的平均数为8,故方差为s 2=16×[(6-8)2+(7-8)2+(8-8)2+(8-8)2+(9-8)2+(10-8)2]=53.题型一 样本数字特征的计算及应用1.(2019·全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )A.中位数 B .平均数 C .方差D .极差答案 A解析 中位数是将9个数据从小到大或从大到小排列后,处于中间位置的数据,因而去掉1个最高分和1个最低分,不变的是中位数,平均数、方差、极差均受影响.故选A.2.(2019·长沙二模)高铁、扫码支付、共享单车、网购并称中国“新四大发明”,近日对全国100个城市的共享单车和扫码支付的使用人数进行大数据分析,其中共享单车使用的人数分别为x 1,x 2,x 3,…,x 100,它们的平均数为x -,方差为s 2;其中扫码支付使用的人数分别为3x 1+2,3x 2+2,3x 3+2,…,3x 100+2,它们的平均数为x -′,方差为s ′2,则x -′,s ′2分别为( )A.3x -+2,3s 2+2 B .3x -,3s 2 C.3x -+2,9s 2 D .3x -+2,9s 2+2答案 C解析 根据题意,数据x 1,x 2,…x 100的平均数为x -,方差为s 2;则x -=1100(x 1+x 2+x 3+…+x 100),s 2=1100[(x 1-x -)2+(x 2-x -)2+…+(x 100-x -)2],若3x 1+2,3x 2+2,3x 3+2,…,3x 100+2的平均数为x -′,则x -′=1100[(3x 1+2)+(3x 2+2)+…+(3x 100+2)]=3x -+2,方差s ′2=1100[(3x 1+2-3x --2)2+(3x 2+2-3x --2)2+…+(3x 100+2-3x --2)2]=9s 2.3.一组数据1,10,5,2,x,2,且2<x <5,若该数据的众数是中位数的23倍,则该数据的方差为________.答案 9解析 根据题意知,该组数据的众数是2, 则中位数是2÷23=3,把这组数据从小到大排列为1,2,2,x,5,10, 则2+x2=3,解得x =4,所以这组数据的平均数为x -=16×(1+2+2+4+5+10)=4, 方差为s 2=16×[(1-4)2+(2-4)2×2+(4-4)2+(5-4)2+(10-4)2]=9.众数、中位数、平均数、方差的意义及常用结论(1)平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.(2)方差的简化计算公式:s 2=1n [(x 21+x 22+…+x 2n)-n x -2]或写成s 2=1n (x 21+x 22+…+x 2n )-x -2,即方差等于原数据平方的平均数减去平均数的平方.(3)平均数、方差的公式推广①若数据x 1,x 2,…,x n 的平均数为x -,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是m x -+a .见举例说明2.②数据x 1,x 2,…,x n 的方差为s 2.a.数据x 1+a ,x 2+a ,…,x n +a 的方差也为s 2;b.数据ax 1,ax 2,…,ax n 的方差为a 2s 2.见举例说明2.1.(2019·六安模拟)某样本中共有5个个体,其中4个值分别为0,1,2,3,第5个值丢失,但该样本的平均值为1,则样本方差为( )A.2B.65 C. 2 D.305答案 A解析 设第5个值为x ,则由题意,得15×(0+1+2+3+x )=1,解得x =-1,所以样本方差s 2=15×[(0-1)2+(1-1)2+(2-1)2+(3-1)2+(-1-1)2]=2.2.(2019·全国卷Ⅱ)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为________.答案 0.98解析 x -=10×0.97+20×0.98+10×0.9910+20+10=0.98.则经停该站高铁列车所有车次的平均正点率的估计值为0.98.题型二 扇形图、折线图1.(2020·株洲市高三摸底)某市2019年12个月的PM2.5的平均浓度指数如图所示.由图判断,四个季度中PM2.5的平均浓度指数方差最小的是( )A.第一季度 B .第二季度 C.第三季度 D .第四季度答案 B解析 根据图中数据,知第一季度的数据是72.15,43.96,93.13;第二季度的数据是66.5,55.25,58.67;第三季度的数据是59.16,38.67,51.6;第四季度的数据是82.09,104.6,168.05;观察得出第二季度的数据波动性最小,所以第二季度的PM2.5的平均浓度指数方差最小.故选B.2.(2018·全国卷Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半答案 A解析设新农村建设前的收入为M,而新农村建设后的收入为2M,则新农村建设前种植收入为0.6M,而新农村建设后的种植收入为0.74M,所以种植收入增加了,所以A不正确;新农村建设前其他收入为0.04M,新农村建设后其他收入为0.1M,故增加了一倍以上,所以B正确;新农村建设前,养殖收入为0.3M,新农村建设后为0.6M,增加了一倍,所以C正确;新农村建设后,养殖收入与第三产业收入的总和占经济收入的30%+28%=58%>50%,所以超过了经济收入的一半,所以D正确.故选A.(1)通过扇形统计图可以很清楚的表示出各部分数量同总数之间的关系.(2)折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.(2019·东北三省四市教研联合体模拟)“科技引领,布局未来”,科技研发是企业发展的驱动力量.2007年至2018年,某企业连续12年累计研发投入达4100亿元.我们将研发投入与经营收入的比值记为研发投入占营收比.这12年间的研发投入(单位:十亿元)用如图中的条形图表示,研发投入占营收比用如图中的折线图表示.根据折线图和条形图,下列结论错误的是()A.2012年至2013年研发投入占营收比增量相比2017年至2018年增量大B.2013年至2014年研发投入数量相比2015年至2016年增量小C.该企业连续12年研发投入逐年增加D.该企业连续12年研发投入占营收比逐年增加答案 D解析由题图可知,该企业在2008年至2009年、2013年至2014年和2016年至2017年研发投入占营收比是下降的,所以D错误.故选D.题型三茎叶图及其应用1.(2019·郑州三模)某同学10次测评成绩的数据如茎叶图所示,总体的中位数为12.若要使该总体的标准差最小,则4x+2y的值是()0223 41x y 9920 1C.16 D.18答案 A解析因为总体的中位数为12,所以10+x+10+y2=12,即x+y=4,所以总体的平均数为110×(2+2+3+4+10+x+10+y+19+19+20+21)=11.4.要使总体的标准差最小,只要(10+x-11.4)2+(10+y-11.4)2最小.因为(10+x-11.4)2+(10+y-11.4)2≥2×10+x-11.4+10+y-11.422=0.72,当且仅当x=y=2时等号成立,所以4x+2y=12.故选A.2.某良种培育基地正在培育一小麦新品种A,将其与原有的一个优良品种B 进行对照试验,两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430 ,434,443,445,445,451,454.品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407 ,410,412,415,416,422,430.(1)作出数据的茎叶图;(2)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论.解(1)画出茎叶图如图所示:(2)通过观察茎叶图可以看出:①品种A的亩产平均数(或均值)比品种B高;②品种A的亩产标准差(或方差)比品种B大,故品种A的亩产稳定性较差.1.茎叶图的画法步骤第一步:将每个数据分为茎(高位)和叶(低位)两部分;第二步:将最小茎与最大茎之间的数按大小次序排成一列,写在左(右)侧;有两组数据时,写在中间;第三步:将各个数据的叶依次写在其茎的右(左)侧.茎叶图的绘制需注意:①“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;②重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据.2.茎叶图的应用茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等.1.甲、乙两位射击运动员的5次比赛成绩(单位:环)如茎叶图所示,若两位运动员平均成绩相同,则成绩较稳定(方差较小)的那位运动员成绩的方差为( )A.2 B .4 C .6 D .8答案 A解析 根据茎叶图中的数据知,甲、乙二人的平均成绩相同,即15×(87+89+90+91+93)=15×(88+89+90+91+90+x ),解得x =2,所以平均数为x -=90;根据茎叶图中的数据知甲的成绩波动性小,较为稳定(方差较小),所以甲成绩的方差为s 2=15×[(88-90)2+(89-90)2+(90-90)2+(91-90)2+(92-90)2]=2.故选A.2.如图茎叶图记录了甲、乙两组各6名学生在一次数学测试中的成绩(单位:分).已知甲组数据的众数为124,乙组数据的平均数为甲组数据的中位数,则x ,y 的值分别为( )答案 A解析 由已知,甲组数据的众数是124,则x =4,即甲组数据的中位数为124.所以16×(116+116+125+120+y +128+134)=124,解得y =5.故选A.题型四频率分布直方图角度1求频率或频数1.党的十九大报告指出:“脱贫攻坚战取得决定性进展,六千多万贫困人口稳定脱贫,贫困发生率从百分之十点二下降到百分之四以下.”2019年各地根据实际进行创新,精准、高效地完成了脱贫任务.某地区对当地3000户家庭的2019年所得年收入情况调查统计,年收入的频率分布直方图如图所示,数据(单位:千元)的分组依次为[20,40),[40,60),[60,80),[80,100],则年收入不超过6万的家庭大约为()A.900户B.600户C.300户D.150户答案 A解析由频率分布直方图得:年收入不超过6万的家庭所占频率为:(0.005+0.010)×20=0.3,∴年收入不超过6万的家庭大约为0.3×3000=900.角度2求数字特征2.某市在对两千多名出租车司机的年龄进行的调查中,从两千多名出租车司机中随机抽选100名司机,已知这100名司机的年龄都在20岁至50岁之间,且根据调查结果得出的年龄情况频率分布直方图如图所示(部分图表污损).利用这个残缺的频率分布直方图,可估计该市出租车司机年龄的中位数大约是()A.31.4岁B.32.4岁C.33.4岁D.36.4岁答案 A解析由频率分布直方图可知[20,25)的频率为0.1,[25,30)的频率为0.3,[30,35)的频率为0.35,因为0.1+0.3<0.5<0.1+0.3+0.35,所以中位数x0∈[30,35),由0.1+0.3+(x0-30)×0.07=0.5,得x0≈31.4.故选A.3.(2019·全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).解(1)由已知得0.70=a+0.20+0.15,故a=0.35,b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.1.频率分布直方图的性质(1)小长方形的面积=组距×频率组距=频率.见举例说明1.(2)各小长方形的面积之和等于1.2.频率分布直方图中的众数、中位数与平均数(1)最高的小长方形底边中点的横坐标即是众数;(2)平分频率分布直方图的面积且垂直于横轴的直线与横轴交点的横坐标是中位数;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.见举例说明3.1.(2019·湘潭三模)统计某校n名学生的某次数学同步练习成绩(满分150分),根据成绩分数分成如下6组:[90,100),[100,110),[110,120),[120,130),[130,140),[140,150],并绘制频率分布直方图如图所示,若已知不低于140分的人数为110,则n的值是()A.800 B.900C.1200 D.1000答案 D解析由频率分布直方图的性质,得10×(0.031+0.020+0.016×2+m+0.006)=1,解得m=0.011,∵不低于140分的频率为0.011×10=0.11,∴n=1100.11=1000.2.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组[75,85)[85,95)[95,105)[105,115)[115,125] 频数62638228(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?解(1)频率分布直方图如图.(2)质量指标值的样本平均数为x-=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.组基础关1.一个频数分布表(样本容量为30)不小心被损坏了一部分,只记得样本中数据在[20,60)上的频率为0.8,则估计样本在[40,60)内的数据个数为()A.14 B.15C.16 D.17答案 B解析由频数分布表可知,样本中数据在[20,40)上的频率为4+530=0.3,又因为样本数据在[20,60)上的频率为0.8,所以样本在[40,60)内的频率为0.8-0.3=0.5,数据个数为30×0.5=15.2.甲、乙、丙、丁四人参加国际奥林匹克数学竞赛选拔赛,四人的平均成绩和方差如表:甲乙丙丁平均成绩x-86898985 方差s2 2.1 3.5 2.1 5.6A.甲B.乙C.丙D.丁答案 C解析丙平均成绩高,方差s2小(稳定),故最佳人选是丙.3.(2019·全国卷Ⅲ)《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为()A.0.5 B.0.6C.0.7 D.0.8答案 C解析解法一:设调查的100位学生中阅读过《西游记》的学生人数为x,则x+80-60=90,解得x=70,所以该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为70100=0.7.故选C.解法二:用Venn图表示调查的100位学生中阅读过《西游记》和《红楼梦》的人数之间的关系如图:易知调查的100位学生中阅读过《西游记》的学生人数为70,所以该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为70100=0.7.故选C.4.(2019·钦州模拟)某仪器厂从新生产的一批零件中随机抽取40个检测,如图是根据抽样检测后零件的质量(单位:克)绘制的频率分布直方图,样本数据分8组,分别为[80,82),[82,84),[84,86),[86,88),[88,90),[90,92),[92,94),[94,96],则样本的中位数在()A.第三组B.第四组C.第五组D.第六组答案 B解析由图可得,前四组的频率为(0.0375+0.0625+0.075+0.1)×2=0.55,则其频数为40×0.55=22,且第四组的频数为40×0.1×2=8,故中位数落在第四组,所以B正确.5.如图所示,样本A和B分别取自两个不同的总体,它们的样本平均数分别为x -A 和x -B ,样本标准差分别为s A 和s B ,则( )A.x -A >x -B ,s A >s BB.x -A <x -B ,s A >s BC.x -A >x -B ,s A <s BD.x -A <x -B ,s A <s B答案 B解析 由图可知A 组的6个数为2.5,10,5,7.5,2.5,10,B 组的6个数为15,10,12.5,10,12.5,10,所以x -A =2.5+10+5+7.5+2.5+106=6.25,x -B =15+10+12.5+10+12.5+106≈11.67.显然x -A <x -B .又由图形可知,B 组的数据分布比A 均匀,变化幅度不大,故B 组数据比较稳定,方差较小,从而标准差较小,所以s A >s B ,故选B.6.(2019·合肥一模)某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布饼状图和90后从事互联网行业岗位分布条形图,则下列结论中不一定正确的是( )注:90后指1990年及以后出生,80后指1980~1989年之间出生,80前指1979年及以前出生.A.互联网行业从业人员中90后占一半以上B.互联网行业中从事技术岗位的人数超过总人数的20%C.90后从事运营岗位的人数比80前从事互联网行业的人数多D.互联网行业中90后从事技术岗位的人数比80后从事技术岗位的人数多解析 对于A ,由饼状图可知互联网行业从业人员中90后占了56%,故A 正确.对于B ,由条形图可知互联网行业中从事技术岗位的人数占总人数的比例为39.6%,故B 正确.对于C ,由两图数据可计算出整个互联网行业从事运营岗位的90后占56%×17%=9.52%,大于互联网行业中的80前总人数,故C 正确.对于D ,因为80后从事技术岗位的人数所占比例不清楚,所以互联网行业中从事技术岗位的90后人数不一定比80后的人数多,故D 错误.故选D.7.(2020·重庆名校联盟调研)在样本频率分布直方图中共有9个小矩形,若其中1个小矩形的面积等于其他8个小矩形面积和的25,且样本容量为210,则该组的频数为( )A.28 B .40 C .56 D .60答案 D解析 设该小矩形的面积为x,9个小矩形的总面积为1,则其他8个小矩形的面积和为52x ,所以x +52x =1,所以x =27,所以该组的频数为27×210=60.8.(2020·贵阳模拟)某地的中小学办学条件在政府的教育督导下,迅速得到改善.教育督导一年后,分别随机抽查了初中(用A 表示)与小学(用B 表示)各10所学校,得到相关指标的综合评价得分(百分制)的茎叶图如图所示,则从茎叶图可得出正确的信息为(80分及以上为优秀)( )①初中得分与小学得分的优秀率相同 ②初中得分与小学得分的中位数相同 ③初中得分的方差比小学得分的方差大 ④初中得分与小学得分的平均值相同A.①② B .①③ C .②④D .③④解析从茎叶图可知抽查的初中得分的优秀率为310×100%=30%,小学得分的优秀率为310×100%=30%,故①正确;初中得分的中位数为75.5,小学得分的中位数为72.5,故②不正确;从茎叶图可知初中得分比小学得分分散,所以初中得分的方差比小学得分的方差大,故③正确;初中得分的平均值为75.7,小学得分的平均值为75,故④不正确.所以正确的信息为①③,故选B.9.已知一组数据x1,x2,…,x n的方差为2,若数据ax1+b,ax2+b,…,ax n +b(a>0)的方差为8,则a的值为________.答案 2解析根据方差的性质,知a2×2=8,解得a=2.10.某学校随机抽取了部分学生,对他们每周使用手机的时间进行统计,得到如下的频率分布直方图.若从每周使用时间在[15,20),[20,25),[25,30]三组内的学生中用分层抽样的方法选取8人进行访谈,则应从使用时间在[20,25)内的学生中应选取的人数为________.答案 3解析由频率分布直方图,知5×(0.01+0.02+a+0.04+0.04+0.06)=1,解得a=0.03,即使用时间在[15,20),[20,25),[25,30]三组内的学生人数之比为4∶3∶1,则从每周使用时间在[15,20),[20,25),[25,30]三组内的学生中用分层抽样的方法选取8人进行访谈,则应从使用时间在[20,25)内的学生中应选取的人数为38×8=3.组能力关1.某校高二(1)班一次阶段考试数学成绩的茎叶图和频率分布直方图可见部分如图,根据图中的信息,可确定被抽测的人数及分数在[90,100]内的人数分别为( )A.20,2 B .24,4 C .25,2 D .25,4答案 C解析 由频率分布直方图可知,组距为10,所以[50,60)的频率为0.008×10=0.08,由茎叶图可知[50,60)的人数为2,设参加本次考试的总人数为N ,则N =20.08=25,根据频率分布直方图可知[90,100]内的人数与[50,60)的人数一样,都是2.故选C.2.(2019·葫芦岛一模)一个样本容量为10的样本数据,它们组成一个公差为2的等差数列{a n },若a 1,a 3,a 7成等比数列,则此样本的平均数和中位数分别是( )A.12,13 B .13,13 C .13,12 D .12,14答案 B解析 依题意a 23=a 1a 7,∴(a 1+4)2=a 1(a 1+6×2),解得a 1=4,所以此样本的平均数为S 1010=13,中位数为a 5+a 62=13.3.(2019·马鞍山模拟)某养猪场定购了一批仔猪,从中随机抽查了100头仔猪的体重(单位:斤),经数据处理得到如图1的频率分布直方图,其中体重最轻的14头仔猪的体重的茎叶图如图2,为了将这批仔猪分栏喂养,需计算频率分布直方图中的一些数据,其中a +b 的值为( )A.0.144B .0.152C .0.76D .0.076答案 B解析 由题意得2(c +d )×5=2×12100=0.24,∴a +b =1-0.245=0.152. 4.某车间将10名技工平均分成甲、乙两组加工某种零件,在单位时间内每个技工加工的合格零件数的统计数据的茎叶图如图所示,已知两组技工在单位时间内加工的合格零件的平均数都为10.(1)求出m ,n 的值;(2)求出甲、乙两组技工在单位时间内加工的合格零件的方差s 2甲和s 2乙,并由此分析两组技工的加工水平.解 (1)根据题意可知:x -甲=15×(7+8+10+12+10+m )=10,x -乙=15×(9+n +10+11+12)=10,所以m =3,n =8.(2)s 2甲=15×[(7-10)2+(8-10)2+(10-10)2+(12-10)2+(13-10)2]=5.2, s 2乙=15×[(8-10)2+(9-10)2+(10-10)2+(11-10)2+(12-10)2]=2,因为x -甲=x -乙,s 2甲>s 2乙,所以甲、乙两组的整体水平相当,乙组更稳定一些.组 素养关(2019·全国卷Ⅱ)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y 的频数分布表.y 的分组 企业数 [-0.20,0) 2 [0,0.20) 24 [0.20,0.40) 53 [0.40,0.60) 14 [0.60,0.80)7(1)。
2013年高考数学总复习(山东专用)第十章第2课时 用样本估计总体 随堂检测(含解析)1.(2011·高考重庆卷)从一堆苹果中任取10只,称得它们的质量如下(单位:克): 125 120 122 105 130 114 116 95 120 134则样本数据落在[114.5,124.5)内的频率为( )A .0.2B .0.3C .0.4D .0.5解析:选C.落在[114.5,124.5)内的样本数据为120,122,116,120,共4个,故所求概率为410=25=0.4. 2.一个样本a,3,5,7的平均数是b ,且a 、b 是方程x 2-5x +4=0的两根,则这个样本的方差是( )A .3B .4C .5D .6解析:选C.x 2-5x +4=0的两根是1,4.当a =1时,a,3,5,7的平均数是4.当a =4时,a,3,5,7的平均数不是1.∴a =1,b =4.则方差s 2=14×[(1-4)2+(3-4)2+(5-4)2+(7-4)2]=5. 3.某学校为了了解学生的日平均睡眠时间(单位:h),随机选择了n 名同学进行调查.下表是这n 名同学的日睡眠时间的频率分布表.序号(i ) 分组(睡眠时间) 频数(人数) 频率1 [4,5) 6 0.122 [5,6) 0.203 [6,7) a4 [7,8) b5 [8,9) 0.08(1)求n 的值;若a =20,将表中数据补全,并画出频率分布直方图;(2)统计方法中,同一组数据常用该组区间的中点值(例如区间[4,5)的中点值是4.5)作为代表.若据此计算的上述数据的平均值为6.52,求a ,b 的值,并由此估计该学校学生的日平均睡眠时间在7小时以上的概率.解:(1)由频率分布表可得n =60.12=50. 序号(i ) 分组(睡眠时间) 频数(人数) 频率1 [4,5) 6 0.122 [5,6) 10 0.203 [6,7) 20 0.404 [7,8) 10 0.205 [8,9) 4 0.08(2)由题意知⎩⎪⎨⎪⎧ 1506×4.5+10×5.5+a ×6.5+b ×7.5+4×8.5=6.52,6+10+a +b +4=50,解得a =15,b =15.设“该学校学生的日平均睡眠时间在7小时以上”为事件A ,则P (A )=15+450=0.38.即该学校学生的日平均睡眠时间在7小时以上的概率约为0.38.。
第二节用样本估计总体考试要求:结合实例,能够利用样本估计总体的集中趋势以及离散程度,掌握分层随机抽样的样本均值和样本方差.一、教材概念·结论·性质重现1.频率分布直方图(1)频率分布表的画法.第一步:求极差,极差=最大值-最小值;第二步:决定组数和组距,组距=极差;组数第三步:将数据分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第四步:登记频数,计算频率,列出频率分布表.(2)频率分布直方图:反映样本频率分布的直方图(如图).横轴表示样本数据,纵轴表示频率,每个小长方形的面积表示样本落在该组内的频率.组距1.频率分布直方图可以利用频率分布直方图估计总体的取值规律.2.频率分布直方图中的常见结论(1)众数的估计值为最高的小长方形的中点对应的横坐标.(2)平均数的估计值等于频率分布直方图中每个小长方形的面积乘小长方形底边中点的横坐(3)中位数的估计值的左边和右边的小长方形的面积和是相等的.2.中位数、众数、平均数(1)中位数:将一组数据按大小依次排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(2)众数:一组数据中出现次数最多的数据称为这组数据的众数.(3)平均数:一组数据的算术平均数即为这组数据的平均数,n个数据x1,x2,…,x n的平均数�=1�(x1+x2+…+x n).3.百分位数(1)第p百分位数的定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.(2)计算一组n个数据的第p百分位数的步骤:第1步,按从小到大排列原始数据.第2步,计算i=np%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.4.样本的数字特征如果有n个数据x1,x2,…,x n,那么平均数为�=1�(x1+x2+…+x n),标准差为s−�方差为s2=1�[(x1-�)2+(x2-�)2+…+(x n-�)2].(1)若数据x1,x2是m�+a.1.判断下列说法的正误,对的画“√”,错的画“×”.(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.(√)(2)一组数据的方差越大,说明这组数据越集中.(×)(3)在频率分布直方图中,小长方形的面积越大,表示样本数据落在该区间的频率越大.(√) 2.“幸福感指数”是指某个人主观评价他对自己目前生活状态满意程度的指标,常用区间[0,10]内的一个数来表示,该数越接近10表示满意度越高.现随机抽取10位居民,他们的幸福感指数为5,6,6,6,7,7,8,8,9,10.则这组数据的第80百分位数是()A.7.5B.8C.8.5D.9C解析:因为10×80%=8,所以数据5,6,6,6,7,7,8,8,9,10的第80百分位数是12×(8+9)=8.5.3.某工厂技术人员对三台智能机床的生产数据进行统计,发现甲车床每天生产次品数的平均数为1.4,标准差为1.08;乙车床每天生产次品数的平均数为11,标准差为0.85;丙车床每天生产次品数的平均数为1.1,标准差为0.78.由以上数据可以判断生产性能最好且较稳定的为()A.无法判断B.甲车床C.乙车床D.丙车床D 解析:因为1.1<1.4<11,0.78<0.85<1.08,所以可以判断生产性能最好且较稳定的为丙车床.4.从某网络平台推荐的影视作品中抽取400部,统计其评分数据,将所得400个评分数据分为8组:[66,70),[70,74),…,[94,98],并整理得到如下的频率分布直方图,则评分在区间[82,86)内的影视作品数量是()A.20B.40C.64D.80D 解析:由频率分布直方图知,评分在区间[82,86)内的影视作品的频率为(86-82)×0.05=0.2,故评分在区间[82,86)内的影视作品数量是400×0.2=80.5.已知样本量为200,在样本的频率分布直方图中,共有n 个小长方形.若中间一个小长方形的面积等于其余(n -1)个小长方形面积和的13,则该组的频数为________.50解析:设除中间一个小长方形外的(n -1)个小长方形面积的和为p ,则中间一个小长方形面积为13p .由题意,得p +13p =1,所以p =34,则中间一个小长方形的面积为13p =14,200×14=50,即该组的频数为50.考点1统计图表及其应用——综合性习近平总书记强调:“一个忘记来路的民族必定是没有出路的民族,一个忘记初心的政党必定是没有未来的政党.”某学校利用学习强国APP安排教职工(共120人)在线学习党史知识.其教职工年龄情况和每周在线学习时长达3小时的情况分别如图(1)和图(2)所示,则下列说法正确的是()A.该学校老年教职工在线学习党史时长达3小时的人数最多B.该学校青年教职工在线学习党史时长达3小时的人数最多C.该学校老年教职工在线学习党史时长达3小时和青年教职工在线学习党史时长达3小时的人数之和与中年教职工在线学习党史时长达3小时的人数相等D.该学校在线学习党史时长达3小时的人数占总人数的80%D解析:由图可知,该学校老年教职工在线学习党史时长达3小时的人数是120×30%×90%=32.4,中年教职工在线学习党史时长达3小时的人数是120×(1-30%-30%)×80%=38.4,青年教职工在线学习党史时长达3小时的人数是120×30%×70%=25.2.该学校在线学习党史时长达3小时的人数占总人数的比例为30%×90%+40%×80%+30%×70%=80%,故选项A、B、C错误,选项D正确.电力工业是一个国家的经济命脉,它在国民经济和人民生活中占有极其重要的地位.目前开发的电力主要是火电、水电、风电、核电、太阳能发电,其中,水电、风电、太阳能发电属于可再生能源发电.如图所示的是2022年各电力行业发电量及增幅的统计图,则下列说法错误的是()A.其中火电发电量大约占全行业发电量的71%B.在火电、水电、风电、核电、太阳能发电量中,比上一年增幅最大的是风电C.火电、水电、风电、核电、太阳能发电的发电量的极差是7.28D.以上可再生能源发电量的增幅均跑赢全行业整体增幅C解析:对于A,火电发电量大约占全行业发电量的5.28≈71%,故选项A正确;对于B,7.42由折线图可知,风电增幅为10.50%,是增幅最大的,故选项B正确;对于C,火电、水电、风电、核电、太阳能发电的发电量的极差是5.28-0.14=5.14,故选项C错误;对于D,由折线图可得,可再生能源发电量的增幅均跑赢全行业整体增幅,故选项D正确.故选C.(1)首先要准确地识图,即要明确统计图表中纵轴、横轴及折线、区域等所表示的意义,尤其注意数字变化的趋势等.1.(2022·靖远模拟)如图是我国2011-2020年载货汽车产量及增长趋势统计图.针对这10年的数据,下列说法错误的是()A.与2019年相比较,2020年我国载货汽车产量同比增速不到15%B.这10年中,载货汽车的同比增速有增有减C.这10年我国载货汽车产量的极差超过150万辆D.这10年我国载货汽车产量的中位数不超过340万辆D解析:对于A,2020年的同比增速为423.9−373.9×100%≈13.37%<15%,故A正确;373.9对于B,这10年中,载货汽车的同比增速有增有减,故B正确;对于C,由图知极差为423.9-273.5=150.4(万辆)>150(万辆),故C正确;对于D,将这10年载货汽车产量由小到大排列,得:273.5,303.5,312.9,333.8,339.9,344.1,356.7,371.7,373.9,423.9,故中位数为339.9+344.1=342(万辆),故D错误.22.(多选题)在疫情期间某企业对本企业1644名职工关于复工的态度进行调查,调查结果如图所示.下列结论成立的是()A.x=0.384B.从该企业中任取一名职工,该职工是倾向于在家办公的概率为0.178C.不到80名职工倾向于继续申请休假D.倾向于复工后在家办公或在公司办公的职工超过986名BD解析:由图表知x%=1-5.1%-17.8%-42.3%,得x=34.8,故A错误.由图表知在家办公的人员占17.8%,故B正确.由1644×5.1%=83.844>80,所以超过80名职工倾向于继续申请休假,故C错误.又1644×(17.8%+42.3%)=988.044>986,所以超过986名职工倾向于在家办公或在公司办公,D正确.综上可知,正确的结论为BD.考点2频率分布直方图——应用性一家保险公司决定对推销员实行目标管理,即给推销员确定一个具体的销售目标.确定的销售目标是否合适,直接影响到公司的经济效益.如果目标定得过高,多数推销员完不成任务,会使推销员失去信心;如果目标定得太低,将不利于挖掘推销员的工作潜力.该保险公司随机抽取50名保险推销员,统计了其2022年的月均推销额(单位:万元),将数据按照[12,14),[14,16),…,[22,24]分成6组,制成频率分布直方图如下,其中[14,16)组比[12,14)组的频数多4.(1)求频率分布直方图中a 和b 的值;(2)为调动推销员的积极性,公司设计了两种奖励方案.方案一:奖励月均推销额进入前60%的员工;方案二:奖励月均推销额达到或超过平均数(同一组中的数据用该组区间中点值为代表)的员工.你认为哪种方案更好?解:(1)由频率分布直方图的性质,得图中所有小长方形的面积之和等于1.又因为[14,16)组比[12,14)组的频数多4,所以�+�+0.04+0.1+0.12+0.14×2=1,50×�×2−50×�×2=4,解得a =0.03,b =0.07.(2)方案一,奖励月均推销额进入前60%的员工,因为样本量为50,所以能获得奖励员工人数为50×60%=30.方案二,奖励月均推销额达到或超过平均数,根据频率分布直方图,可得月均推销额的平均数为�=0.03×2×13+0.07×2×15+0.12×2×17+0.14×2×19+0.1×2×21+0.04×2×23=18.32.月均推销额低于18万的频率为2×(0.03+0.07+0.12)=0.44.因为本次抽样样本量为50名保险推销员,所以月均推销额低于18万的人数为50×0.44=22,所以月均推销额达到或超过18万的人数为28.综上所述,对比两种奖励方案,应选方案一,更多人员获得奖励.1.频率分布直方图的性质(1)小长方形的面积=组距×频率组距=频率.(2)各小长方形的面积之和等于1.(3)小长方形的高=频率组距,所有小长方形的高的和为1组距.2.要理解并记准频率分布直方图与众数、中位数、百分位数及平均数的关系.1.某校高三年级共有600名学生选修地理,某次考试地理成绩均在60~90分之间,分数统计后绘成频率分布直方图,如图所示,则成绩在[70,85)分的学生人数为()A.380B.420C.450D.480C 解析:成绩在[70,85)分的学生人数为600×5×(0.04+0.06+0.05)=450.故选C.2.从某小区随机抽取100户居民进行月用电量调查,发现其用电量都在50到350度之间,频率分布直方图如图所示,由此可估计该小区居民户月用电量的平均值大约为________度.186解析:设用电量在200到250度之间的频率为a ,则有50×(0.0024+0.0036+0.006+a +0.0024+0.0012)=1,解得a =0.0044.由频率分布直方图可知,该小区居民户月用电的平均值为:50×(75×0.0024+125×0.0036+175×0.006+225×0.0044+275×0.0024+325×0.0012)=186(度).考点3总体集中趋势的估计——综合性考向1百分位数、平均数、中位数及众数已知甲、乙两组按顺序排列的数据,甲组:27,28,37,m ,40,50;乙组:24,n ,34,43,48,52.若这两组数据的第20百分位数、第50百分数分别对应相等,则��等于()A.127B.107C.87D.67B解析:因为20%×6=1.2>1,50%×6=3,所以第20百分位数为n=28,第50百分位数为37+�2=34+432,所以m=40,所以��=4028=107.故选B.已知数据x1+1,x2+2,x3+3,x4+4,x5+5的平均数是23,则数据3x1+1,3x2+1,3x3+1,3x4+1,3x5+1的平均数是()A.61B.64C.67D.70A解析:因为数据x1+1,x2+2,x3+3,x4+4,x5+5的平均数是23,所以x1+x2+x3+x4+x5=5×23-15=100,所以(3x1+1)+(3x2+1)+(3x3+1)+(3x4+1)+(3x5+1)=3(x1+x2+x3+x4+x5)+5=305,所以数据3x1+1,3x2+1,3x3+1,3x4+1,3x5+1的平均数是3055=61.故选A.1.求平均数时要注意数据的个数,不要重计或漏计.2.求中位数时一定要先对数据按大小排序,若最中间有两个数据,则中位数是这两个数据的平均数.(多选题)某城市在创建文明城市的活动中,为了解居民对“创建文明城市”的满意程度,组织居民给活动打分(分数为整数,满分100分),从中随机抽取一个容量为100的样本,发现数据均在[40,100]内.现将这些分数分成6组并画出样本的频率分布直方图,但不小心污损了部分图形,如图所示.观察图形,则下列说法正确的是()A.频率分布直方图中第三组的频数为10人B.根据频率分布直方图估计样本的众数为75分C.根据频率分布直方图估计样本的中位数为75分D.根据频率分布直方图估计样本的平均数为75分ABC解析:分数在[60,70)内的频率为1-10×(0.005+0.020+0.030+0.025+0.010)=0.10,所以第三组[60,70)的频数为100×0.10=10(人),故A正确.因为众数的估计值是频率分布直方图中最高小长方形的中点,从图中可看出众数的估计值为75分,故B正确.因为(0.005+0.020+0.010)×10=0.35<0.5,(0.005+0.020+0.010+0.03)×10=0.65>0.5,所以中位数位于[70,80),设中位数为x,则0.35+0.03(x-70)=0.5,解得x=75,所以中位数的估计值为75,故C正确.样本平均数的估计值为45×10×0.005+55×10×0.020+65×10×0.010+75×10×0.03+85×10×0.025+95×10×0.01=73(分),故D错误.用样本估计总体是统计的基本方法:(1)最高的小长方形的中点横坐标即为众数.(2)中位数左边和右边的小长方形的面积是相等的.1.某病患者8人的潜伏期(天)分别为3,3,8,4,2,7,10,18,则它们的第50百分位数为()A.4或7B.4C.7D.5.5D解析:将3,3,8,4,2,7,10,18由小到大排列为2,3,3,4,7,8,10,18,第50百分位数即为中位数,这组数的中位数为1×(4+7)=5.5.22.某市进行了一次校际数学竞赛,共有100名同学参赛,经过评判,这100名参赛者的得分都在[40,90]之间,其得分的频率分布直方图如图,则下列结论错误的是()A.得分在[40,60)之间的共有40人B.从这100名参赛者中随机选取1人,其得分在[60,80)的概率为0.5C.这100名参赛者得分的中位数为65D.a=0.005C解析:由频率分布直方图,可得A中,得分在[40,60)之间共有[1-(0.03+0.02+0.01)×10]×100=40(人),所以A正确.B中,从100名参赛者中随机选取1人,其得分在[60,80)中的概率为(0.03+0.02)×10=0.5,所以B正确.D中,由频率分布直方图的性质,可得(a+0.035+0.030+0.020+0.010)×10=1,解得a=0.005,所以D正确.C中,前2个小长方形面积之和为0.4,前3个小长方形面积之和为0.7,所以中位数在[60,70],这100名参×10≈63.3,所以C不正确.赛者得分的中位数为60+0.5−0.40.3考点4总体离散程度的估计——基础性考向1方差与标准差的计算(2022·溧阳期末)已知数据x1,x2,…,x10的平均数为2,方差为3,那么数据2x1+1,2x2+1,…,2x10+1的平均数和方差分别为()A.2,3B.5,6C.5,12D.4,12C解析:因为数据x1,x2,…,x10的平均数为2,方差为3,所以数据2x1+1,2x2+1,…,2x10+1的平均数为2×2+1=5,方差为22×3=12.一组数据由10个数组成,将其中一个数由6改为3,另一个数由2改为5,其余数不变,得到新的10个数,则新数据的方差相比原数据的方差的减小值为()A.0.4B.0.5C.0.6D.0.7C解析:一个数由6改为3,另一个数由2改为5,故该数据的平均数�不变,设没有改变的八个数分别为x1,x2,x3,x4,x5,x6,x7,x8.因为原数据的方差�12==110x 1-�)2+(x 2-�)2+(x 3-�)2+(x 4-�)2+(x 5-�)2+(x 6-�)2+(x 7-�)2+(x 8-�)2+(6-�)2+(2-�)2],新数据的方差�22=110[(x 1-�)2+(x 2-�)2+(x 3-�)2+(x 4-�)2+(x 5-�)2+(x 6-�)2+(x 7-�)2+(x 8-�)2+(3-�)2+(5-�)2],所以�22−�12=110[(3-�)2+(5-�)2-(6-�)2-(2-�)2]=110×(-6)=-0.6,所以新数据的方差相比原数据的方差的减少值为0.6.1.方差的简化计算公式:2.方差的运算性质:如果数据x n +b 的方差仍是为了解学生的课外阅读情况,某校采用按样本量比例分配的分层随机抽样对高中三个年级的学生进行平均每周课外阅读时间(单位:小时)的调查,所得样本数据如下:年级抽样人数样本平均数样本方差高一4053.5高二30�22高三303�32已知高中三个年级学生的总样本平均数为4.1,总样本方差为3.14,则高二年级学生的样本平均数�2=________,高三年级学生的样本方差�32=________.41.5解析:由高中三个年级学生的总样本平均数为4.1,可得40×5+30·�2+30×340+30+30=4.1,解得�2=4.因为总样本方差为3.14,所以40100×3.5+5−4.12+30100×2+(4−4.1)2+30100×[�32+(3-4.1)2]=3.14,解得�32=1.5.1.设样本中不同层的平均数分别为的权重分别为(2022·肇庆模拟)在对某中学高一学生体重的调查中,采取按样本量比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男生30人,其平均数和方差分别为55和15,抽取了女生20人,其平均数和方差分别为45和20.则总样本的平均数为______,方差为________.5141解析:总样本的平均数为3030+20×55+2030+20×45=51,总样本的方差为3050×[15+(55-51)2]+2050×[20+(45-51)2]=41.课时质量评价(五十四)A 组全考点巩固练1.某市3月1日至3月10日的最低气温(单位:℃)的情况绘制的折线统计图如图所示.由图可知,这10天最低气温的第80百分位数是()A.-2B.0C.1D.2D解析:由折线图可知,这10天的最低气温按照从小到大排列为-3,-2,-1,-1,0,0,1,2,2,2.因为共有10个数据,所以10×80%=8,是整数,则这10天最低气温的第80百分位数是2+22=2.2.(2023·德州模拟)2022年第24届冬奥会在北京市和张家口市成功举办,出色的赛事组织工作赢得了国际社会的一致称赞,经济效益方面,多项收入也创下历届冬奥会新高.某机构对本届冬奥会各项主要收入进行了统计,得到的数据如图所示.已知赛事转播的收入比政府补贴和特许商品销售的收入之和多27亿元,则估计2022年冬奥会这几项收入总和约为()A.223亿元B.218亿元C.143亿元D.118亿元B 解析:设收入总和为x ,则35.4%x -(12.2%+10.8%)x =27,解得x ≈218.故选B.3.已知一组数据x 1,x 2,…,x n 的平均数为a ,标准差为s .若2x 1-1,2x 2-1,…,2x n -1的平均数与方差相等,则s 2-a 2的最大值为()A.-1B.-12C.-14D.-316C 解析:由已知条件可得,2a -1=4s 2,整理可得s 2=12a -14,又s 2≥0,所以12a -14≥0,a ≥12,所以s 2-a 2=-a 2+12a -14=-�−-316,图象开口向下,对称轴为a =14,+∞上单调递减,故当a =12时,s 2-a 2取得最大值为-14.4.为了解学生的身体状况,某校随机抽取了一批学生测量体重.经统计,这批学生的体重数据(单位:千克)全部介于45至70之间.将数据分成5组,并得到如图所示的频率分布直方图.图中a 的值为()A.0.04B.0.2C.0.03D.0.05A解:根据频率分布直方图可得,(0.01+0.02+a +0.06+0.07)×5=1,所以a =0.04.故选A.5.甲组数据为5,12,16,21,25,37,乙组数据为1,6,14,18,38,39,则甲、乙的平均数、极差及中位数相同的是()A.极差B.平均数C.中位数D.都不相同B 解析:甲的极差为37-5=32,乙的极差为39-1=38,甲的中位数为16+212=18.5,乙的中位数为14+182=16,�甲=5+12+16+21+25+376=583,�乙=1+6+14+18+38+396=583,所以甲、乙的平均数相同.故选B.6.若样本数据x 1,x 2,…,x 10标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为()A.8B.64C.32D.16D解析:设样本数据x 1,x 2,…,x 10标准差为�2,则�2=8,即方差s 2=64,数据2x 1-1,2x 2-1,…,2x 10-1的方差为s 2=22s 2=22×64=256,所以数据2x 1-1,2x 2-1,…,2x 10-1的标准差为256=16.7.某校女子篮球队7名运动员身高(单位:cm)的数据分别为171,172,17x ,174,175,180,181.已知记录的平均身高为175cm,但记录中有一名运动员身高的末位数字不清晰.如果把其末位数字记为x ,那么x 的值为________.2解析:170+17×(1+2+x +4+5+10+11)=175,17×(33+x )=5,即33+x =35,解得x=2.8.(2023·山东省实验中学模拟)第24届冬奥会于2022年在北京和张家口市联合举行,冬奥会志愿者的服务工作是冬奥会成功举办的重要保障.在冬奥会志愿者的选拔工作中,某高校承担了志愿者选拔的面试工作,面试成绩满分100分,同学们面试得分的频率分布直方图如图所示,则此次面试中得分的90%分位数是________.85解析:由题图知各组的频率为分组[40,50)[50,60)[60,70)[70,80)[80,90)[90,100]频率0.10.30.410a0.110a所以a =0.005,则第四组[70,80)的频率为0.05,前四组的频率之和为0.85,所以这次面试得分的90%分位数是在第五组内,且为80+10×0.9−0.850.95−0.85=85.9.某游乐园为了吸引游客,推出了A,B 两款不同的年票,游乐园每次进园门票原价为100元.A年票前12次进园门票每次费用为原价,从第13次起,每次费用为原价的一半,A年票不需交开卡工本费.B年票每次进园门票为原价的9.5折,B年票需交开卡工本费a元(a∈N).已知某市民每年至少去该游乐园11次,最多不超过14次.该市民多年来年进园记录如表:年进园次数11121314频率0.150.400.100.35(1)估计该市民年进园次数的众数;(2)若该市民使用A年票,求该市民在进园门票上年花费的平均数;(3)从该市民在进园门票上年花费的平均数来看,若选择A年票比选择B年票更优惠,求a 的最小值.解:(1)由频率分布表知,该市民年进园次数的频率最大是0.40,对应的次数是12,所以估计该市民进园次数的众数为12.(2)该市民使用A年票时,在进园门票上年花费的平均数为��=11×100×0.15+12×100×0.40+(12×100+50)×0.10+(12×100+100)×0.35=1225.(3)该市民使用B年票时,在进园门票上年花费的平均数为��=(11×0.15+12×0.40+13×0.10+14×0.35)×95+a=1201.75+a,因为��<��,所以1225<1201.75+a,解得a>23.25.又a∈N,所以a的最小值为24.若选择A年票比选择B年票更优惠,则a的最小值是24.B组新高考培优练10.(多选题)在某地区某传染病流行期间,为了建设指标显示疫情已受控制,以便向该地区居民显示可以过正常生活,有公共卫生专家建议的指标是“连续7天每天新增感染人数不超过5人”,根据连续7天的新增病例数计算,下列各项中,一定符合上述指标的是() A.平均数�≤3B.标准差s≤2C.平均数�≤3且极差小于或等于2D.众数等于1且极差小于或等于4CD解析:对于A选项,若平均数�≤3,不能保证每天新增病例数不超过5人,不符合题意;对于B选项,标准差反映的是数据的波动大小,例如当每天感染的人数均为10,标准差是0,显然不符合题意;对于C选项,若极差等于0或1,在�≤3的条件下,显然符合指标;若极差等于2,假设最大值为6,最小值为4,则�>3,矛盾,故每天新增感染人数不超过5,符合条件,C正确;对于D 选项,若众数等于1且极差小于或等于4,则最大值不超过5,符合指标.11.袁隆平是中国杂交水稻事业的开创者,是“当代神农”,致力于杂交水稻技术的研究、应用与推广,为人类运用科技手段战胜饥饿带来了绿色的希望和金色的收获.袁老的科研团队发现“野败”后,将其带回实验,在试验田中随机抽取了100株水稻统计每株水稻的稻穗数(单位:颗)得到如图所示的频率分布直方图(同一组中的数据用该组区间的中点值代表),则下列说法错误的是()A.a =0.01B.这100株水稻的稻穗数平均值在区间[280,300)中C.这100株水稻的稻穗数的众数是250D.这100株水稻的稻穗数的中位数在区间[240,260)中B解析:根据频率分布直方图知:组距为20,所以a =120-0.0175-0.0075×2-0.005-0.0025=0.01,故A 选项正确.这100株水稻的稻穗数平均值�=20×(0.005×210+0.0075×230+0.0175×250+0.01×270+0.0075×290+0.0025×310)=256,可知这100株水稻的稻穗数平均值在区间[240,260)中,故B 选项错误.由频率分布直方图知第三个矩形最高,所以这100株水稻的稻穗数的众数是250,故C 选项正确.前两个矩形的面积是0.25<0.5,前三个矩形的面积是0.6>0.5,所以中位数在第三组数据中,即这100株水稻的稻穗数的中位数在区间[240,260)中,故D 选项正确.故选B.12.(2022·邵阳模拟)已知某旅游城市2020年前10个月的游客人数(万人)按从小到大的顺序排列如下:3,5,6,9,x ,y ,15,17,18,21.若该组数据的中位数为13,则该组数据的平均数为()A.12B.10.7C.13D.15A解析:因为该组数据的中位数为13,所以�+�2=13,所以x +y =26,则该组数据的平均数为110(3+5+6+9+x +y +15+17+18+21)=12.13.如图是某工厂对一批新产品长度(单位:mm)检测结果的频率分布直方图,估计这批产品的平均长度为________mm.22.75解析:由图可知,平均长度为12.5×0.02×5+17.5×0.04×5+22.5×0.08×5+27.5×0.03×5+32.5×0.03×5=22.75(mm).14.某校从参加高一物理期末考试的学生中随机抽出60名,将其物理成绩(均为整数)分成六组:[40,50),[50,60),…,[90,100],并绘制成如下的频率分布直方图.由此估计此次高一物理期末考试成绩的第75百分位数为________.82解析:高一物理期末考试成绩的第75百分位数,即成绩从低到高的第60×75%=45名同学.因为前4组的小长方形的面积和为0.01+0.015×2+0.03=0.07,样本量为60,所以前4组的小长方形对应的学生人数为60×0.07×10=42.因为前5组的小矩形的面积和为0.01+0.015×2+0.03+0.025=0.095,又因为样本量为60,所以前5组的小矩形对应的学生人数为60×0.095×10=57.因为分数在[80,90)的人数为0.025×10×60=15,所以此次高一物理期末考试成绩的第75百分位数为80+10×45−4215=82.15.小刘从事螃蟹养殖和批发多年,有着不少客户.小刘把去年采购螃蟹的数量x (单位:箱)在[100,200)的客户称为“大客户”,并把他们去年采购的数量制成如表:采购数量x [100,120)[120,140)[140,160)[160,180)[180,200)客户数10105205已知去年“大客户”们采购的螃蟹数量占小刘去年总销售量的58.(1)根据表中的数据完善频率分布直方图,并估计采购数在168箱以上(含168箱)的“大客户”人数;(2)估算小刘去年总的销售量(同一组中的数据用该组区间的中点值为代表);(3)小刘今年销售方案有两种:①不在网上销售螃蟹,则按去年的价格销售,每箱利润为20元,预计销售量与去年持平;②在网上销售螃蟹,则需把每箱售价下调m元(2≤m≤5),销售量可增加1000m箱.问:哪一种方案利润最大?求出今年利润Y(单位:元)的最大值.解:(1)作出频率分布直方图如图,×20+5=17.根据上图,可知采购量在168箱以上(含168箱)的“大客户”人数为180−16820(2)去年“大客户”所采购的螃蟹总数大约为110×10+130×10+150×5+170×20+190×5=7500(箱),=12000(箱).小刘去年总销售量为7500÷58(3)若不在网上销售螃蟹,则今年小刘的利润为Y=12000×20=240000(元).若在网上销售螃蟹,则今年的销售量为(12000+1000m)箱,每箱的利润(20-m),则今年小刘的收入为Y=(20-m)·(12000+1000m)=1000(-m2+8m+240)=1000[-(m-4)2+256].当m=4时,Y取得最大值256000.因为256000>240000,所以方案②利润最大,且小刘今年利润Y的最大值为256000元.。
高考数学一轮复习学案:11.2 用样本估计总体(含答案)11.2用样本估计总体用样本估计总体最新考纲考情考向分析1.了解分布的意义和作用,能根据频率分布表画频率分布直方图.频率折线图.茎叶图,体会它们各自的特点2.理解样本数据标准差的意义和作用,会计算数据标准差3.能从样本数据中提取基本的数字特征如平均数,标准差,并做出合理的解释4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.主要考查平均数,方差的计算以及茎叶图与频率分布直方图的简单应用;题型以选择题和填空题为主,出现解答题时经常与概率相结合,难度为中低档.1作频率分布直方图的步骤1求极差即一组数据中最大值与最小值的差2决定组距与组数3将数据分组4列频率分布表5画频率分布直方图2频率分布折线图和总体密度曲线1频率分布折线图连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图2总体密度曲线随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线3茎叶图统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数4标准差和方差1标准差是样本数据到平均数的一种平均距离2标准差s1nx1x2x2x2xnx2.3方差s21nx1x2x2x2xnx2xn是样本数据,n是样本容量,x 是样本平均数知识拓展1频率分布直方图的特点1频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示频率组距,频率组距频率组距.2在频率分布直方图中,各小长方形的面积总和等于1,因为在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比3频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观2平均数.方差的公式推广1若数据x1,x2,,xn的平均数为x,那么mx1a,mx2a,mx3a,,mxna的平均数是mxa.2数据x1,x2,,xn的方差为s2.数据x1a,x2a,,xna的方差也为s2;数据ax1,ax2,,axn的方差为a2s2.题组一思考辨析1判断下列结论是否正确请在括号中打“”或“”1平均数.众数与中位数从不同的角度描述了一组数据的集中趋势2一组数据的众数可以是一个或几个,那么中位数也具有相同的结论3从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了4茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次5在频率分布直方图中,最高的小长方形底边中点的横坐标是众数6在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的题组二教材改编2P100A组T21一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为A4B8C12D16答案B解析设频数为n,则n320.25,n32148.3.P81A组T1若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是A91.5和91.5B91.5和92C91和91.5D92和92答案A解析这组数据由小到大排列为87,89,90,91,92,93,94,96,中位数是9192291.5,平均数x8789909192939496891.5.4P71T1如图是100位居民月均用水量的频率分布直方图,则月均用水量为2,2.5范围内的居民有______人答案25解析0.50.510025.题组三易错自纠5若数据x1,x2,x3,,xn的平均数x5,方差s22,则数据3x11,3x21,3x31,,3xn1的平均数和方差分别为A5,2B16,2C16,18D16,9答案C解析x1,x2,x3,,xn的平均数为5,x1x2x3xnn5,3x13x23x33xnn135116,x1,x2,x3,,xn的方差为2,3x11,3x21,3x31,,3xn1的方差是32218.6为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分分制如图所示,假设得分的中位数为m,众数为n,平均数为x,则m,n,x的大小关系为________用“x乙,s2甲s2乙,所以甲组的研发水平优于乙组2记恰有一组研发成功为事件E,在所抽得的15个结果中,恰有一组研发成功的结果是a,b,a,b,a,b,a,b,a,b,a,b,a,b,共7个因此事件E发生的频率为715.用频率估计概率,即得所求概率为PE715.高考中频率分布直方图的应用考点分析频率分布直方图是高考考查的热点,考查频率很高,题型有选择题,填空题,也有解答题,难度为中低档用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致通过频率分布表和频率分布直方图可以对总体作出估计频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误典例12分某城市100户居民的月平均用电量单位度,以160,180,180,200,200,220,220,240,240,260,260,280,280,300分组的频率分布直方图如图1求直方图中x的值;2求月平均用电量的众数和中位数;3在月平均用电量为220,240,240,260,260,280,280,300的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在220,240的用户中应抽取多少户规范解答解1由0.0020.00950.0110.0125x0.0050.0025201,得x0.0075,所以直方图中x的值是0.0075.2分2月平均用电量的众数是2202402230.4分因为0.0020.00950.011200.450.5,所以月平均用电量的中位数在220,240内,设中位数为a,由0.0020.00950.011200.0125a2200.5,得a224,所以月平均用电量的中位数是224.8分3月平均用电量为220,240的用户有0.01252021025户,月平均用电量为240,260的用户有0.00752021015户,月平均用电量为260,280的用户有0.0052021010户,月平均用电量为280,300的用户有0.0025202105户,抽取比例为11251510515,所以月平均用电量在220,240的用户中应抽取25155户12分。
第二节用样本估计总体[备考方向要明了][归纳·知识整合]1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差);(2)决定组距与组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线.3.茎叶图的优点茎叶图的优点是可以保留原始数据,而且可以随时记录,方便记录与表示. 4.标准差和方差(1)标准差是样本数据到平均数的一种平均距离. (2)标准差: s =1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2]. (3)方差:s 2=1n [(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2](x n 是样本数据,n 是样本容量,x是样本平均数).5.利用频率分布直方图估计样本的数字特征(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值.(2)平均数:平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.(3)众数:在频率分布直方图中,众数是最高的矩形的中点的横坐标. [探究] 1.在频率分布直方图中如何确定中位数?提示:在频率分布直方图中,中位数左边和右边的直方图的面积是相等的. 2.利用茎叶图求数据的中位数的步骤是什么?提示:(1)将茎叶图中数据按大小顺序排列;(2)找中间位置的数.[自测·牛刀小试]1.(2012·山东高考)在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的是( )A .众数B .平均数C .中位数D .标准差解析:选D 只有标准差不变,其中众数、平均数和中位数都加2. 2.(2011·安庆模拟)如图是根据某校10位高一同学的身高(单位:cm)画出的茎叶图,其中左边的数字从左到右分别表示学生身高的百位数字和十位数字,右边的数字表示学生身高的个位数字,从图中可以得到这10位同学身高的中位数是( )A .161B .162C .163D .16415 5 5 7 8 16 1 3 3 5 1712解析:选B 由给定的茎叶图可知,这10位同学身高的中位数为161+1632=162.3.某校举行2013年元旦汇演,七位评委为某班的小品打出的分数如下茎叶统计图,去掉一个最高分和一个最低分,所剩数据的方差为________.解析:由茎叶图知,去掉一个最高分和一个最低分,所剩数据为84,84,86,84,87,所以由公式得方差为1.6.答案:1.64.从一堆苹果中任取10只,称得它们的质量如下(单位:克):125,120,122,105,130,114,116,95,120,134,则样本数据落在[114.5,124.5)内的频率为________.解析:数据落在[114.5,124.5)内的有:120,122,116,120共4个,故所求频率为410=0.4.答案:0.45.(2012·大同模拟)将容量为n 的样本中的数据分为6组,绘制频率分布直方图,若第一组至第六组的数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和为27,则n =________.解析:由已知,得2+3+42+3+4+6+4+1·n =27,即920·n =27,解得n =60. 答案:60[例1] (1)在样本频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他10个小长方形面积和的14,且样本容量为160,则中间一组的频数为( )A .32B .0.2C .40D .0.25(2)某区高二年级的一次数学统考中,随机抽取200名同学的成绩,成绩全部在50分至100分之间,将成绩按如下方式分成5组:第一组,成绩大于等于50分且小于60分;第二组,成绩大于等于60分且小于70分;……第五组,成绩大于7 9 8 4 4 6 4 7 93等于90分且小于等于100分,据此绘制了如图所示的频率分布直方图.则这200名同学中成绩大于等于80分且小于90分的学生有______名.[自主解答] (1)由频率分布直方图的性质,可设中间一组的频率为x ,则x +4x =1,解得x =0.2.故中间一组的频数为160×0.2=32.(2)由题知,成绩大于等于80分且小于90分的学生所占的频率为1-(0.005×2+0.025+0.045)×10=0.2,所以这200名同学中成绩大于等于80分且小于90分的学生有200×0.2=40名.[答案] (1)A (2)40 ——————————————————— 频率分布直方图反映了样本的频率分布(1)在频率分布直方图中纵坐标表示频率组距,频率=组距×频率组距.(2)频率分布表中频率的和为1,故频率分布直方图中各长方形的面积和为1.1.已知一个样本容量为100的样本数据的频率分布直方图如图所示,样本数据落在[6,10)内的样本频数为________,样本数据落在[2,10)内的频率为________.解析:样本数据落在[6,10)内的样本频数为0.08×4×100=32,样本数据落在[2,10)内的频率为(0.02+0.08)×4=0.4.答案:32 0.4[例2] (2012·安徽高考)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差[自主解答] 由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9.所以甲、乙的成绩的平均数均为6,A 错;甲、乙的成绩的中位数分别为6,5,B 错;甲、乙的成绩的方差分别为15×[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=2,15×[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=125,C 对;甲、乙的成绩的极差均为4,D 错.[答案] C ———————————————————样本数字特征及公式推广(1)平均数和方差都是重要的数字特征,是对总体一种简明的阐述.平均数、中位数、众数描述总体的集中趋势,方差和标准差描述波动大小.(2)平均数、方差公式的推广若数据x 1,x 2,…,x n 的平均数为x -,方差为s 2,则数据mx 1+a ,mx 2+a ,…,mx n +a 的平均数为m x -+a ,方差为m 2s 2.2.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为m e ,众数为m 0,平均值为x ,则( )A .m e =m 0=xB .m e =m 0<xC .m e <m 0<xD .m 0<m e <x解析:选D 由图可知,30名学生的得分情况依次为:2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分.中位数为第15,16个数(分别为5,6)的平均数即m e =5.5,5出现次数最多,故m 0=5,x =2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×1030≈5.97.于是得m 0<m e <x .[例3] 某校高三年级进行了一次数学测验,随机从甲、乙两班各抽取6名同学,所得分数的茎叶图如图所示.(1)(2)现从甲班这6名同学中随机抽取两名同学,求他们的分数之和大于165分的概率. [自主解答] (1)因为乙班的成绩集中在80分,且没有低分,所以乙班的平均分比较高. (2)设从甲班中任取两名同学,两名同学分数之和超过165分为事件A .从甲班6名同学中任取两名同学,则基本事件空间中包含了15个基本事件,又事件A 中包含4个基本事件,所以,P (A )=415.即从甲班中任取两名同学,两名同学分数之和超过165分的概率为415.———————————————————茎叶图的优缺点由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较繁琐.3.(2012·湖南高考)如图是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________.0 8 9 135(注:方差s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x 为x 1,x 2,…,x n 的平均数)解析:该运动员五场比赛中的得分为8,9,10,13,15,平均得分x =8+9+10+13+155=11,方差s 2=15[(8-11)2+(9-11)2+(10-11)2+(13-11)2+(15-11)2]=6.8.答案:6.84.随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图(中间的数字表示身高的百位、十位数,旁边的数字分别表示身高的个位数)如图所示.甲班 乙班2 18 1 9 8 1 0 17 2 5 6 6 9 8 8 4 2 163 5 98157(1)根据茎叶图判断哪个班的平均身高较高; (2)计算甲班的样本方差.解:(1)由茎叶图可知乙班身高比较集中在170~181之间,所以乙班的平均身高较高. (2)甲班的方差为:110×[(182-170)2+(179-170)2+(178-170)2+(171-170)2+(170-170)2+(168-170)2+(168-170)2+(164-170)2+(162-170)2+(158-170)2]=54.2.2个异同——众数、中位数和平均数的异同,标准差和方差的异同 (1)众数、中位数和平均数的异同①众数、中位数和平均数都是描述一组数据集中趋势的量,平均数是最重要的量. ②由于平均数与每一个样本数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数和中位数都不具有的性质.③众数考查各数据出现的频率,其大小只与这组数据中部分数据有关.当一组数据中有不少数据多次重复出现时,其众数往往更能反映问题.④某些数据的改动对中位数可能没有影响,中位数可能出现在所给的数据中,也可能不在所给的数据中.当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势.(2)标准差和方差的异同标准差和方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度就越大;标准差、方差越小,数据的离散程度则越小.因为方差与原始数据的单位不同,且平方后可能夸大了偏差程度,所以虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差.2个区别——直方图与条形图的区别不要把直方图错以为条形图,两者的区别在于条形图是离散随机变量,纵坐标刻度为频数或频率,直方图是连续随机变量,纵坐标刻度为频率/组距,这是密度,连续随机变量在某一点上是没有频率的.易误警示——频率分布直方图中的易误点[典例](2012·山东高考)如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5℃的城市个数为11,则样本中平均气温不低于25.5℃的城市个数为________.[解析]最左边两个矩形面积之和为0.10×1+0.12×1=0.22,总城市数为11÷0.22=50,最右边矩形面积为0.18×1=0.18,50×0.18=9.[答案]9[名师点评]1.忽视频率分布直方图中纵轴的含义为频率/组距,误认为是每组相应的频率值,导致失误;2.不清楚直方图中各组的面积之和为1,导致某组的频率不会求;3.不理解由直方图求样本平均值的方法,误用每组的频率乘以每组的端点值而导致失误;4.由直方图确定众数时应为最高矩形中点对应的横坐标值,中位数应为左右两侧的频率均等各为12.[变式训练]对某种电子元件的使用寿命进行跟踪调查,所得样本的频率分布直方图如图所示,由图可知,这一批电子元件中使用寿命在100~300 h 的电子元件的数量与使用寿命在300~600 h 的电子元件的数量的比是________.解析:寿命在100~300 h 的电子元件的频率为⎝⎛⎭⎫12 000+32 000×100=420=15; 寿命在300~600 h 的电子元件的频率为⎝⎛⎭⎫1400+1250+32 000×100=45. 则它们的电子元件数量之比为15∶45=14.答案:14一、选择题(本大题共6小题,每小题5分,共30分)1.(2012·湖北高考)容量为20的样本数据,分组后的频数如下表:则样本数据落在区间[10,40)的频率为( ) A .0.35 B .0.45 C .0.55D .0.65解析:选B 求得该频数为2+3+4=9,样本容量是20,所以频率为920=0.45.2.某校100名学生的数学测试成绩分布直方图如图所示,分数不低于a 即为优秀,如果优秀的人数为20人,则a 的估计值是( )A .130B .140C .134D .137解析:选C 由题意知,优秀的频率为0.2,故a 的值在130~140之间,则(140-a )×0.015=0.1,解得a =133.4.3.(2012·陕西高考)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )A .46,45,56B .46,45,53C .47,45,56D .45,47,53解析:选A 从茎叶图中可以看出样本数据的中位数为中间两个数的平均数,即45+472=46,众数为45,极差为68-12=56.4.某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表:A.25B.725C.35D .2解析:选Ax甲=7,s 2甲=15[(6-7)2+(7-7)2+(7-7)2+(8-7)2+(7-7)2]=25,x乙=7,s 2乙=15[(6-7)2+(7-7)2+(6-7)2+(7-7)2+(9-7)2]=65, 两组数据的方差中较小的一个为s 2甲,即s 2=25. 5.某单位举办技能比赛,9位评委给生产科打出的分数如茎叶图所示,统计员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x )无法看清,若记分员计算无误,则数字x 应该是( )评委给生产科打出的分数A.2 C .4D .5解析:选A 若数字90+x 是最高分,则为x 1=17(88+89+91+92+92+93+94)≈91.3,不合题意,因此最高分为94分,此时平均分x 2=17(88+89+91+92+92+93+90+x ),∴17(635+x )=91,解得x =2. 6.(2012·江西高考)小波一星期的总开支分布如图(1)所示,一星期的食品开支如图(2)所示,则小波一星期的鸡蛋开支占总开支的百分比为( )A .30%B .10%C .3%D .不能确定解析:选C 由图(1)得到小波一星期的总开支,由图(2)得到小波一星期的食品开支,从而再借助图(2)计算出鸡蛋开支占总开支的百分比.由图(2)知,小波一星期的食品开支为30+40+100+80+50=300元,由图(1)知,小波一星期的总开支为30030%=1 000元,则小波一星期的鸡蛋开支占总开支的百分比为301 000×100%=3%.二、填空题(本大题共3小题,每小题5分,共15分)7.(2013·徐州模拟)学校为了调查学生在课外读物方面的支出情况,抽出了一个容量为n 且支出在[20,60)元的样本,其频率分布直方图如图所示,其中支出在[50,60)元的同学有30人.则n 的值为________.解析:支出在[50,60)的频率为1-0.36-0.24-0.1=0.3,因此30n=0.3,故n =100.答案:1008.(2013·南京模拟)为了分析某篮球运动员在比赛中发挥的稳定程度,统计了该运动员在6场比赛中的得分,用茎叶图表示如图,则该组数据的方差为________.解析:该运动员6场的总得分为14+17+18+18+20+21=108,平均得分为1086=18分,方差=16[(14-18)2+(17-18)2+(18-18)2+(18-18)2+(20-18)2+(21-18)2]=5.答案:59.为了了解大连市今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图所示),已知图中从左到右的前3个小组的频率之比为1∶2∶3,第2小组的频数为120,则抽取的学生人数是________.解析:由频率分布直方图知:学生的体重在65~75 kg 的频率为(0.012 5+0.037 5)×5=0.25,则学生的体重在50~65 kg 的频率为1-0.25=0.75.从左到右第2个小组的频率为0.75×26=0.25,所以抽取的学生人数是120÷0.25=480. 答案:480三、解答题(本大题共3小题,每小题12分,共36分)10.(2012·安徽高考)若某产品的直径长与标准值的差的绝对值不超过1 mm 时,则视为合格品,否则视为不合格品,在近期一次产品抽样检查中,从某厂生产的此种产品中,随机抽取5 000件进行检测,结果发现有50件不合格品.计算这50件不合格品的直径长与标准值的差(单位:mm),将所得数据分组,得到如下频率分布表:1 4 7 8 8 21(1)将上面表格中缺少的数据补充完整;(2)估计该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率;(3)现对该厂这种产品的某个批次进行检查,结果发现有20件不合格品.据此估算这批产品中的合格品的件数.解:(1) 频率分布表(2)由频率分布表知,该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率约为0.50+0.20=0.70.(3)设这批产品中的合格品数为x件,依题意有505 000=20x+20,解得x=5 000×2050-20=1 980.所以该批产品的合格品件数估计是1 980件.11.(2012·广东高考)某班50位学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中x的值;(2)从成绩不低于80分的学生中随机选取2人,该2人中成绩在90分以上(含90分)的人数记为ξ,求ξ的数学期望.解:(1)由题意得:10x =1-(0.006×3+0.01+0.054)×10=0.18, 所以x =0.018.(2)∵成绩不低于80分的学生共有(0.018+0.006)×10×50=12人,其中90分以上(含90分)的共有0.006×10×50=3人,因此ξ的可能值为0,1,2三个值,P (ξ=0)=C 29C 212=611,p (ξ=1)=C 19C 13C 212=922,P (ξ=2)=C 23C 212=122,∴ξ的分布列为:∴E (ξ)=0×611+1×922+2×122=12.12.某中学共有1 000名学生参加了该地区高三第一次质量检测的数学考试,数学成绩如下表所示:样的方法抽取100名同学进行问卷调查,甲同学在本次测试中数学成绩为95分,求他被抽中的概率;(2)已知本次数学成绩的优秀线为110分,试根据所提供数据估计该中学达到优秀线的人数;(3)作出频率分布直方图,并估计该学校本次考试的数学平均分(同一组中的数据用该组区间的中点值作代表).解:(1)分层抽样中,每个个体被抽到的概率均为样本容量总体中个体总数,故甲同学被抽到的概率P =110. (2)由题意得x =1 000-(60+90+300+160)=390. 故估计该中学达到优秀线的人数 m =160+390×120-110120-90=290.(3)频率分布直方图如图所示.该学校本次考试的数学平均分.x =60×15+90×45+300×75+390×105+160×1351 000=90.估计该学校本次考试的数学平均分为90分.1.(2012·陕西高考)从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲乙两组数据的平均数分别为x 甲,x 乙,中位数分别为m 甲,m 乙,则( )A.x 甲<x 乙,m 甲>m 乙B.x 甲<x 乙,m 甲<m 乙C.x 甲>x 乙,m 甲>m 乙D.x 甲>x 乙,m 甲<m 乙解析:选B 由茎叶图可知甲数据集中在10至20之间,乙数据集中在20至40之间,明显x甲<x 乙,甲的中位数为20,乙的中位数为29,即m 甲<m 乙.2.某乡镇供电所为了调查农村居民用电量情况,随机抽取了500户居民去年的月均用电量(单位:kW/h),将所得数据整理后,画出频率分布直方图如下,其中直方图从左到右前3个小矩形的面积之比为1∶2∶3,试估计:(1)该乡镇月均用电量在[39.5,43.5)内的居民所占百分比约是多少? (2)该乡镇居民月均用电量的中位数约是多少?(精确到0.01)解:(1)设直方图从左到右前3个小矩形的面积分别为P ,2P ,3P . 由直方图可知,最后两个小矩形的面积之和为 (0.087 5+0.037 5)×2=0.25.因为直方图中各小矩形的面积之和为1, 所以P +2P +3P =0.75,即P =0.125. 所以3P +0.087 5×2=0.55.由此估计,该乡镇居民月均用电量在[39.5,43.5)内的居民所占百分比约是55%. (2)显然直方图的面积平分线位于正中间一个矩形内,且该矩形在面积平分线左侧部分的面积为0.5-P -2P =0.5-0.375=0.125,设样本数据的中位数为39.5+x .因为正中间一个矩形的面积为3P =0.375,所以x ∶2=0.125∶0.375,即x =23≈0.67.从而39.5+x ≈40.17,由此估计,该乡镇居民月均用电量的中位数约是40.17(kW/h). 3.为了解学生身高情况,某校以10%的比例对全校700名学生按性别进行分层抽样调查,测得身高情况的统计图如图所示.(1)估计该校男生的人数;(2)估计该校学生身高在170~185 cm 之间的概率;(3)从样本中身高在180~190 cm 之间的男生中任选2人,求至少有1人身高在185~190 cm 之间的概率.解:(1)样本中男生人数为40,分层抽样比为10%. 故估计全校男生人数为400.(2)由统计图知,样本中身高在170~185 cm 之间的学生有14+13+4+3+1=35人,样本容量为70.故该校学生身高在170~185 cm 之间的概率 P 1=3570=0.5.(3)由统计图知,样本中身高在180~185 cm 之间的男生有4人(不妨设为A 、B 、C 、D ),样本身高在185~190 cm 之间的男生有2人(不妨设为E ,F )从身高在180~190 cm 之间的6人中任选2人有15种结果,其中至少1人身高在185~190 cm 之间的结果有9种,故所求事件的概率P 2=915=35.。
1.把样本容量为20的数据分组,分组区间与频数如下:[10,20),2;[20,30),3;[30,40),4;[40,50),5;[50,60),4;[60,70],2,则在区间[10,50)上的数据的频率是( )
A .0.05
B .0.25
C .0.5
D .0.7
解析:选D.由题知,在区间[10,50)上的数据的频数是2+3+4+5=14,故其频率为
14
20=0.7.
2.(2014·高考广东卷)已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )
A .200,20
B .100,20
C .200,10
D .100,10
解析:选A.该地区中小学生总人数为3 500+2 000+4 500=10 000,则样本容量为10 000×2%=200,其中抽取的高中生近视人数为2 000×2%×50%=20,故选A.
3.(2016·郑州第二次质量检测)已知甲、乙两组数据如茎叶图所示,若它们的中位数相同,平均数也相同,则图中的m 、n 的比值m
n
=( )
A .1 B.13 C.29
D.38
解析:选D.由题中茎叶图可知甲的数据为27,30+m 、39,乙的数据为20+n 、32、34、38.由此可知乙的中位数是33,所以甲的中位数也是33,所以m =3.由此可以得出甲的平均数为33,所以乙的平均数也为33,所以有20+n +32+34+384=33,所以n =8,所以m n =3
8
.
4.(2016·邢台摸底考试)样本中共有五个个体,其值分别为0,1,2,3,m.若该样本的
平均值为1,则其样本方差为( )
A.
105
B.
305
C. 2 D .2
解析:选D.依题意得m =5×1-(0+1+2+3)=-1,样本方差s 2=1
5(12+02+12+22+
22)=2,即所求的样本方差为2.
5.(2016·武汉调研)如图是依据某城市年龄在20岁到45岁的居民上网情况调查而绘制的频率分布直方图,现已知年龄在[30,35),[35,40),[40,45]的上网人数呈现递减的等差数列分布,则年龄在[35,40)的网民出现的频率为( )
A .0.04
B .0.06
C .0.2
D .0.3
解析:选C.由频率分布直方图的知识得,年龄在[20,25)的频率为0.01×5=0.05,[25,30)的频率为0.07×5=0.35,设年龄在[30,35),[35,40),[40,45]的频率为x ,y ,z ,又x ,
y ,z 成等差数列,所以可得
解得y =0.2,所以年龄在[35,40)的网民出现的频率为0.2.
6.(2016·辽宁省五校联考)某商场在庆元宵促销活动中,对元宵节9时至14时的销售额进行统计,其频率分布直方图如图所示,已知9时至10时的销售额为2.5万元,则11时至12时的销售额为________万元.
解析:依题意,注意到9时至10时与11时至12时相应的频率之比为0.10∶0.40=1∶4,因此11时至12时的销售额为2.5×4=10(万元).
答案:10
7.在样本的频率分布直方图中,共有4个小长方形,这4个小长方形的面积由小到大构成等比数列{a n },已知a 2=2a 1,且样本容量为300,则小长方形面积最大的一组的频数为________.
解析:因为小长方形的面积由小到大构成等比数列{a n },且a 2=2a 1, 所以样本的频率构成一个等比数列,且公比为2, 所以a 1+2a 1+4a 1+8a 1=15a 1=1,所以a 1=1
15,
所以小长方形面积最大的一组的频数为300×8a 1=160. 答案:160
8.已知x 是1,2,3,x ,5,6,7这七个数据的中位数且1,2,x 2,-y 这四个数据的平均数为1,则y -1
x
的最小值为________.
解析:1+2+x 2-y =4,所以y =x 2-1.由中位数定义知,3≤x ≤5,所以y -1
x =x 2-1
-1x .当x ∈[3,5]时,函数y =x 2-1与y =-1x 均为增函数,所以y =x 2-1-1
x 为增函数,所以⎝⎛⎭
⎫y -1x min
=8-13=23
3.
答案:23
3
9.某校高一某班的某次数学测试成绩(满分为100分)的茎叶图和频率分布直方图都受了不同程度的破坏,但可见部分如图,据此解答下列问题:
(1)求分数在[50,60]的频率及全班人数;
(2)求分数在[80,90]之间的频数,并计算频率分布直方图中[80,90]间的矩形的高. 解:(1)分数在[50,60]的频率为0.008×10=0.08.由茎叶图知,分数在[50,60]之间的频数为2,所以全班人数为
2
0.08
=25. (2)分数在[80,90]之间的频数为25-2-7-10-2=4,频率分布直方图中[80,90]间的矩形的高为4
25
÷10=0.016.
10.(2016·湖南省雅礼中学一模)某车间将10名技工平均分成甲、乙两组加工某种零件,在单位时间内每个技工加工的合格零件的统计数据的茎叶图如图所示,已知两组技工在单位时间内加工的合格零件的平均数都为10.
(1)求出m ,n 的值;
(2)求出甲、乙两组技工在单位时间内加工的合格零件的方差s 2
甲和s 2乙,并由此分析两组
技工的加工水平.
解:(1)根据题意可知:x -甲=15(7+8+10+12+10+m)=10,x -乙=15(9+n +10+11+12)
=10,
所以n =8,m =3.
(2)s 2甲=15[(7-10)2+(8-10)2+(10-10)2+(12-10)2+(13-10)2
]=5.2, s 2乙=15
[(8-10)2+(9-10) 2+(10-10)2+(11-10)2+(12-10)2]=2, 因为x -甲=x -乙,s 2甲>s 2乙,所以甲、乙两组的整体水平相当,乙组技工更稳定一些.。