10.2 用样本估计总体(课时测试)-2017届高三数学(文)一轮复习(原卷版)
- 格式:doc
- 大小:179.02 KB
- 文档页数:4
【步步高】(江苏专用)2017版高考数学一轮复习第十章统计 10.2用样本估计总体文1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差).(2)决定组距与组数.(3)将数据分组.(4)列频率分布表.(5)画频率分布直方图.2.频率分布折线图和总体分布的密度曲线(1)频率分布折线图:将频率分布直方图中各个相邻的矩形的上底边的中点顺次连结起来,就得到频率分布折线图.(2)总体分布的密度曲线:将样本容量取得足够大,分组的组距取得足够小,那么相应的频率折线图趋于一条光滑曲线,称这条光滑曲线为总体分布的密度曲线. 3.茎叶图统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数. 4.标准差和方差(1)标准差是样本数据到平均数的一种平均距离. (2)标准差:s =1n[x 1-x2+x 2-x2+…+x n -x2].(3)方差:s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2](x n 是样本数据,n 是样本容量,x是样本平均数). 【知识拓展】1.频率分布直方图的特点(1)频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示频率组距,频率=组距×频率组距.(2)频率分布直方图中各小长方形的面积之和为1,因为在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观. 2.平均数、方差的公式推广(1)若数据x 1,x 2,…,x n 的平均数为x ,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是m x +a .(2)数据x 1,x 2,…,x n 的方差为s 2.①数据x 1+a ,x 2+a ,…,x n +a 的方差也为s 2; ②数据ax 1,ax 2,…,ax n 的方差为a 2s 2. 【思考辨析】判断下面结论是否正确(请在括号中打“√”或“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( √ ) (2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( × ) (3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( √ )(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( × )(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( √)(6)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.( ×)1.(2015·陕西改编)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为________.答案137解析由题干扇形统计图可得该校女教师人数为:110×70%+150×(1-60%)=137.2.若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是__________.答案91.5和91.5解析∵这组数据由小到大排列为87,89,90,91,92,93,94,96,∴中位数为12×(91+92)=91.5.平均数为18×(87+89+90+91+92+93+94+96)=91.5.3.在“世界读书日”前夕,为了了解某地 5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5 000名居民的阅读时间的全体是________. 答案 总体解析 调查的目的是“了解某地5 000名居民某天的阅读时间”,所以“5 000名居民的阅读时间的全体”是调查的总体.4.(教材改编)某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们每场比赛得分的情况用如图所示的茎叶图表示,则甲、乙两名运动员得分的中位数分别为________.答案 19,135.(教材改编)甲、乙两人在相同条件下各射靶10次,每次命中环数如下: 甲 4 7 10 9 5 6 8 6 8 8 乙 7 8 6 8 6 7 8 7 5 9 试问10次射靶的情况较稳定的是________. 答案 乙解析 x 甲=4+7+10+9+5+6+8+6+8+810=7.1,x 乙=7+8+6+8+6+7+8+7+5+910=7.1.s 2甲=110[(4-7.1)2+(7-7.1)2+…+(8-7.1)2]=3.09, s 2乙=110[(7-7.1)2+(8-7.1)2+…+(9-7.1)2]=1.29. s 2甲>s 2乙,∴乙较稳定.题型一频率分布直方图的绘制与应用例1 (2015·课标全国Ⅱ)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.A地区用户满意度评分的频率分布直方图图①B地区用户满意度评分的频数分布表(1)评分的平均值及分散程度(不要求计算出具体值,给出结论即可).B地区用户满意度评分的频率分布直方图图②(2)根据用户满意度评分,将用户的满意度分为三个等级:解(1)如图所示.通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(2)A地区用户的满意度等级为不满意的概率大.记C A表示事件:“A地区用户的满意度等级为不满意”;C B表示事件:“B地区用户的满意度等级为不满意”.由直方图得P(C A)的估计值为(0.01+0.02+0.03)×10=0.6,P(C B)的估计值为(0.005+0.02)×10=0.25.所以A地区用户的满意度等级为不满意的概率大.思维升华(1)明确频率分布直方图的意义,即图中的每一个小矩形的面积是数据落在该区间上的频率,所有小矩形的面积和为1.(2)对于统计图表类题目,最重要的是认真观察图表,从中提炼有用的信息和数据.(1)(2014·山东改编)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为________.答案12解析志愿者的总人数为200.16+0.24×1=50,所以第三组人数为50×0.36=18,有疗效的人数为18-6=12.(2)某校从参加高一年级期中考试的学生中随机抽出60名学生,将其物理成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如图所示的频率分布直方图,观察图形的信息,回答下列问题:①求分数在[70,80)内的频率,并补全这个频率分布直方图;②统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试中的平均分.解①设分数在[70,80)内的频率为x,根据频率分布直方图,有(0.010+0.015×2+0.025+0.005)×10+x=1,可得x=0.3,所以频率分布直方图如图所示.②平均分:45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71(分).题型二 茎叶图的应用例2 (1)(2015·山东)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温; ③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差. 其中根据茎叶图能得到的统计结论的编号为________.(2)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x ,y 的值分别为__________. 答案 (1)①④ (2)5,8解析 (1)甲地5天的气温为:26,28,29,31,31, 其平均数为x 甲=26+28+29+31+315=29;方差为s 2甲=15[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2]=3.6;标准差为s 甲= 3.6.乙地5天的气温为:28,29,30,31,32, 其平均数为x 乙=28+29+30+31+325=30;方差为s 2乙=15[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2]=2;标准差为s 乙= 2. ∴x 甲<x 乙,s 甲>s 乙.(2)由茎叶图及已知得x =5,又乙组数据的平均数为16.8,即9+15+10+y +18+245=16.8,解得y =8. 引申探究1.本例(2)中条件不变,试比较甲、乙两组哪组成绩较好. 解 由原题可知x =5,则甲组平均分为9+12+15+24+275=17.4.而乙组平均分为16.8,所以甲组成绩较好.2.在本例(2)条件下:①求乙组数据的中位数、众数;②求乙组数据的方差. 解 ①由茎叶图知,乙组中五名学生的成绩为9,15,18,18,24. 故中位数为18,众数为18.②s 2=15[(9-16.8)2+(15-16.8)2+(18-16.8)2×2+(24-16.8)2]=23.76.思维升华 茎叶图的优缺点由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较烦琐.(2014·课标全国Ⅱ)某市为了考核甲,乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:(1)分别估计该市的市民对甲,乙两部门评分的中位数; (2)分别估计该市的市民对甲,乙两部门的评分高于90的概率; (3)根据茎叶图分析该市的市民对甲,乙两部门的评价.解 (1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75. 50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为66+682=67,所以该市的市民对乙部门评分的中位数的估计值是67.(2)由所给茎叶图知,50位市民对甲,乙部门的评分高于90的比率分别为550=0.1,850=0.16,故该市的市民对甲,乙部门的评分高于90的概率的估计值分别为0.1,0.16.(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.(注:考生利用其他统计量进行分析,结论合理的同样给分.) 题型三 用样本的数字特征估计总体的数字特征例3 甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价. 解 (1)由题图象可得甲、乙两人五次测试的成绩分别为 甲:10分,13分,12分,14分,16分; 乙:13分,14分,12分,12分,14分.x 甲=10+13+12+14+165=13;x 乙=13+14+12+12+145=13,s 2甲=15[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4;s 2乙=15[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.(2)由s 2甲>s 2乙可知乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.思维升华 平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.(2015·广东)某工厂36名工人的年龄数据如下表.(1)年龄数据为44,列出样本的年龄数据; (2)计算(1)中样本的均值x 和方差s 2;(3)36名工人中年龄在x -s 与x +s 之间的有多少人?所占的百分比是多少(精确到0.01%)?解 (1)44,40,36,43,36,37,44,43,37.(2)x =44+40+36+43+36+37+44+43+379=40.s 2=19[(44-40)2+(40-40)2+(36-40)2+(43-40)2+(36-40)2+(37-40)2+(44-40)2+(43-40)2+(37-40)2]=1009.(3)40-103=1103,40+103=1303在⎝ ⎛⎭⎪⎫1103,1303的有23个,占63.89%.9.高考中频率分布直方图的应用典例 (14分)(2015·广东)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户? 规范解答解 (1)由(0.002+0.009 5+0.011+0.012 5+x +0.005+0.002 5)×20=1得:x =0.007 5, 所以直方图中x 的值是0.007 5.[3分](2)月平均用电量的众数是220+2402=230.[4分]因为(0.002+0.009 5+0.011)×20=0.45<0.5,所以月平均用电量的中位数在[220,240)内,设中位数为a ,由(0.002+0.009 5+0.011)×20+0.012 5×(a -220)=0.5得:a =224,所以月平均用电量的中位数是224.[8分](3)月平均用电量为[220,240)的用户有0.012 5×20×100=25(户),月平均用电量为[240,260)的用户有0.007 5×20×100=15(户),月平均用电量为[260,280)的用户有0.005×20×100=10(户),月平均用电量为[280,300]的用户有0.002 5×20×100=5(户),抽取比例=1125+15+10+5=15,所以月平均用电量在[220,240)的用户中应抽取25×15=5(户).[14分]温馨提醒本题的难点是对频率分布直方图意义的理解以及利用这个图提供的数据对所提问题的计算,频率分布直方图中纵轴上的数据是频率除以组距,组距越大该数据越小,在解答这类问题时要特别注意.[方法与技巧]1.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.2.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.3.若取值x1,x2,…,x n的频率分别为p1,p2,…,p n,则其平均值为x1p1+x2p2+…+x n p n;若x1,x2,…,x n的平均数为x,方差为s2,则ax1+b,ax2+b,…,ax n+b的平均数为a x +b,方差为a2s2.[失误与防范]频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.A组专项基础训练(时间:40分钟)1.下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为____________.答案0.4解析10个数据落在区间[22,30)内的数据有22,22,27,29,共4个,因此,所求的频率为410=0.4.2.(2014·陕西改编)某公司10位员工的月工资(单位:元)为x1,x2,…,x10,其均值和方差分别为x和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为____________.答案x+100,s2解析x1+x2+…+x1010=x,y i=x i+100,所以y1,y2,…,y10的均值为x+100,方差不变.3.某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是________.答案50解析由频率分布直方图,知低于60分的频率为(0.01+0.005)×20=0.3.∴该班学生人数n=150.3=50.4.在某次测量中得到的A样本数据如下:42,43,46,52,42,50,若B样本数据恰好是A样本数据每个都减5后所得数据,则A,B两样本的数字特征对应相同的是__________.答案标准差解析利用平均数、标准差、众数、中位数等统计特征数的概念求解.由B样本数据恰好是A样本数据每个都减5后所得数据,可得平均数、众数、中位数分别是原来结果减去5,即与A样本不相同,标准差不变.5.如图是某青年歌手大奖赛上七位评委为甲、乙两名选手打出的分数的茎叶图(其中m为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a1、a2,则一定有________.①a 1>a 2 ②a 2>a 1 ③a 1=a 2④a 1,a 2的大小与m 的值有关 答案 ②解析 去掉一个最高分和一个最低分后,甲选手叶上的数字之和是20,乙选手叶上的数字之和是25,故a 2>a 1.6.样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均值为1,则样本方差为________________. 答案 2解析 由题意可知样本的平均值为1,所以a +0+1+2+35=1,解得a =-1,所以样本的方差为15[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.7.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:则7个剩余分数的方差为________. 答案367解析 由题意知87+94+90+91+90+90+x +917=91,解得x =4.所以s 2=17[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2] =17(16+9+1+0+1+9+0)=367. 8.从某小学随机抽取100名学生,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a =____________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.答案 0.030 3解析 ∵小矩形的面积等于频率,∴除[120,130)外的频率和为0.700,∴a =1-0.70010=0.030.由题意知,身高在[120,130),[130,140),[140,150]内的学生分别为30人,20人,10人,∴由分层抽样可知抽样比为1860=310,∴在[140,150]中选取的学生应为3人.9.某校高一某班的某次数学测试成绩(满分为100分)的茎叶图和频率分布直方图都受了不同程度的破坏,但可见部分如图,据此解答下列问题:(1)求分数在[50,60]的频率及全班人数;(2)求分数在[80,90]之间的频数,并计算频率分布直方图中[80,90]间的矩形的高.解(1)分数在[50,60]的频率为0.008×10=0.08.由茎叶图知,分数在[50,60]之间的频数为2,所以全班人数为20.08=25.(2)分数在[80,90]之间的频数为25-2-7-10-2=4,频率分布直方图中[80,90]间的矩形的高为425÷10=0.016.10.某工厂对一批产品进行了抽样检测.如图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36.(1)求样本容量及样本中净重大于或等于98克并且小于104克的产品的个数;(2)已知这批产品中每个产品的利润y (单位:元)与产品净重x (单位:克)的关系式为y =⎩⎪⎨⎪⎧3,96≤x <98,5,98≤x <104,4,104≤x ≤106,求这批产品平均每个的利润.解 (1)产品净重小于100克的频率为(0.050+0.100)×2=0.300.设样本容量为n . ∵样本中产品净重小于100克的个数是36, ∴36n=0.300,∴n =120.∵样本中净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.750,∴样本中净重大于或等于98克并且小于104克的产品的个数是120×0.750=90.(2)产品净重在[96,98),[98,104),[104,106]内的频率分别为0.050×2=0.100,(0.100+0.150+0.125)×2=0.750,0.075×2=0.150,∴其相应的频数分别为120×0.100=12,120×0.750=90,120×0.150=18, ∴这批产品平均每个的利润为1120×(3×12+5×90+4×18)=4.65(元). B 组 专项能力提升 (时间:30分钟)11.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是________.答案①解析由于频率分布直方图的组距为5,排除③、④,又[0,5),[5,10)两组各一人,排除②,①符合条件,故①正确.12.(2014·江苏)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm.答案24解析底部周长在[80,90)的频率为0.015×10=0.15,底部周长在[90,100)的频率为0.025×10=0.25,样本容量为60,所以树木的底部周长小于100 cm的株数为(0.15+0.25)×60=24. 13.(2015·湖北)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a=________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.答案(1)3 (2)6 000解析由频率分布直方图及频率和等于1可得0.2×0.1+0.8×0.1+1.5×0.1+2×0.1+2.5×0.1+a×0.1=1,解得a=3.于是消费金额在区间[0.5,0.9]内频率为0.2×0.1+0.8×0.1+2×0.1+3×0.1=0.6,所以消费金额在区间[0.5,0.9]内的购物者的人数为:0.6×10 000=6 000,故应填3,6 000.14.若某产品的直径长与标准值的差的绝对值不超过1 mm 时,则视为合格品,否则视为不合格品.在近期一次产品抽样检查中,从某厂生产的此种产品中,随机抽取5 000件进行检测,结果发现有50件不合格品.计算这50件不合格品的直径长与标准值的差(单位:mm),将所得数据分组,得到如下频率分布表:(1)(2)估计该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率; (3)现对该厂这种产品的某个批次进行检查,结果发现有20件不合格品.据此估算这批产品中的合格品的件数.解 (1)如下表所示频率分布表.(2)由频率分布表知,(1,3]内的概率约为 0.50+0.20=0.70.(3)设这批产品中的合格品数为x 件, 依题意505 000=20x +20,解得x =5 000×2050-20=1 980.所以该批产品的合格品件数是1 980.15.(2014·广东)某车间20名工人年龄数据如下表:年龄(岁)19282930313240工人数(人)133543 1(1)求这20(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;(3)求这20名工人年龄的方差.解(1)这20名工人年龄的众数为:30;这20名工人年龄的极差为:40-19=21.(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图如下:(3)这20名工人年龄的平均数为:(19+28×3+29×3+30×5+31×4+32×3+40)÷20=30;所以这20名工人年龄的方差为:1 20(30-19)2+320(30-28)2+320(30-29)2+520(30-30)2+420(30-31)2+320(30-32)2+120(30-40)2=12.6.。
11.2 用样本估计总体一、选择题1.样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均值为1,则样本方差为()A.65 B.65C. 2 D.22.从一堆苹果中任取10只,称得它们的质量如下(单位:克):12512012210513011411695120134则样本数据落在『114.4,124.5)内的频率为()A.0.2 B.0.3C.0.4 D.0.53.如图所示是一样本的频率分布直方图,则由图形中的数据,可以估计众数与中位数分别是()A.12.512.5 B.12.513C.1312.5 D.13134.如图是依据某城市年龄在20岁到45岁的居民上网情况调查而绘制的频率分布直方图,现已知年龄在『30,35),『35,40)、『40,45)的上网人数呈现递减的等差数列分布,则年龄在『35,40)的网民出现的频率为()A.0.04 B.0.06C.0.2 D.0.35.甲、乙两位同学在高三的5次月考中数学成绩统计如茎叶图所示,若甲、乙两人的平均成绩分别是x甲,x乙,则下列叙述正确的是()A.x甲>x乙;乙比甲成绩稳定B.x甲>x乙;甲比乙成绩稳定C.x甲<x乙;乙比甲成绩稳定D.x甲<x乙;甲比乙成绩稳定6.某中学高三年级从甲、乙两个班级各选出8名学生参加数学竞赛,他们取得的成绩(满分100分)的茎叶图如图,其中甲班学生成绩的平均分是86,乙班学生成绩的中位数是83,则x+y的值为()A.9 B.10C.11 D.13二、填空题7.若一组样本数据2,3,7,8,a的平均数为5,则该组数据的方差s2=__________.8.某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们每场比赛得分的情况用右图所示的茎叶图表示,若甲运动员的中位数为a,乙运动员的众数为b,则a-b=__________.9.某地区为了解中学生的日平均睡眠时间(单位:h),随机选择了n位中学生进行调查,根据所得数据画出样本的频率分布直方图如图所示,且从左到右的第1个、第4个、第2个、第3个小长方形的面积依次构成公差为0.1的等差数列,又第一小组的频数是10,则n =________.三、解答题10.从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:组号分组频数1『0,2)62『2,4)83『4,6)174『6,8)225『8,10)256『10,12)127『12,14)68『14,16)29『16,18)2合计100(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率;(2)求频率分布直方图中的a,b的值;(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组.(只需写出结论)11.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分『75,85)『85,95)『95,105)『105,115)『115,125)组频数62638228(1)在下表中作出这些数据的频率分布直方图:(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?12.(2014·新课标全国卷Ⅱ)某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:(1)分别估计该市的市民对甲、乙两部门评分的中位数;(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.答案一、选择题 1.『解析』由题可知样本的平均值为1,所以a +0+1+2+35=1,解得a =-1,所以样本的方差为15『(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2』=2,故选D.『答案』D2.『解析』依题意得,样本数据落在『114.4,124.5)内的频率为410=0.4,选C.『答案』C3.『解析』根据频率分布直方图特点可知,众数是最高矩形的中点,由图可知为12.5,中位数是10+0.5-0.20.1=13.『答案』B4.『解析』由频率分布直方图可知,年龄在『20,25)的频率为0.01×5=0.05,『25,30)的频率为0.07×5=0.35,又年龄在『30,35),『35,40),『40,45)的频率成等差数列分布,所以年龄在『35,40)的网民出现的频率为0.2.『答案』C5.『解析』由题意可知,x 甲=15×(72+77+78+86+92)=81,x 乙=15×(78+88+88+91+90)=87.又由方差公式可得s 2甲=15×『(81-72)2+(81-77)2+(81-78)2+(81-86)2+(81-92)2』=50.4,s 2乙=15×『(87-78)2+(87-88)2+(87-88)2+(87-91)2+(87-90)2』=21.6,因为s 2乙<s 2甲,故乙的成绩波动较小,乙的成绩比甲稳定.故选C.『答案』C6.『解析』观察茎叶图,甲班学生成绩的平均分是86,故x =8,乙班学生成绩的中位数是83,故y =5,∴x +y =13,故选D.『答案』D二、填空题 7.『解析』由2+3+7+8+a5=5,得a =5,所以s 2=15『(2-5)2+(3-5)2+(7-5)2+(8-5)2+(5-5)2』=265.『答案』265 8.『解析』由茎叶图可知,a =19,b =11,∴a -b =8. 『答案』89.『解析』设第1个小长方形的面积为S ,则4个小长方形的面积之和为4S +4×32×0.1, 由题意知,4S +4×32×0.1=1,∴S =0.1.又10n=0.1,∴n =100. 『答案』100三、解答题 10.『解析』(1)根据频数分布表,100名学生中课外阅读时间不少于12小时的学生共有6+2+2=10名,所以样本中的学生课外阅读时间少于12小时的频率是1-10100=0.9.从该校随机选取一名学生,估计其课外阅读时间少于12小时的概率为0.9. (2)课外阅读时间落在组『4,6)的有17人,频率为0.17,所以a =频率组距=0.172=0.085.课外阅读时间落在组『8,10)的有25人,频率为0.25,所以b =频率组距=0.252=0.125.(3)样本中的100名学生课外阅读时间的平均数在第4组. 11.『解析』(1)(2)质量指标值的样本平均数为x=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.12.『解析』(1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为66+682=67,所以该市的市民对乙部门评分的中位数的估计值是67.(2)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为550=0.1,850=0.16,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.。
【创新方案】2017届高考数学一轮复习第十章统计与统计案例第二节用样本估计总体课后作业理[全盘巩固]一、选择题1.(2015·陕西高考)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )A.93 B.123 C.137 D.1672.(2015·安徽高考)若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为( )A.8 B.15 C.16 D.323.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的中位数等于乙的成绩的中位数C.甲的成绩的方差小于乙的成绩的方差D.甲的成绩的极差小于乙的成绩的极差4.如图是依据某城市年龄在20岁到45岁的居民上网情况调查而绘制的频率分布直方图,现已知年龄在[30,35)、[35,40)、[40,45]的网民人数成递减的等差数列,则年龄在[35,40)的网民出现的频率为( )A.0.04 B.0.06 C.0.2 D.0.35.从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲、乙两组数据的平均数分别为x甲、x乙,中位数分别为mm乙,则( )甲、A.x甲<x乙,m甲>m乙B.x甲<x乙,m甲<m乙C.x甲>x乙,m甲>m乙D.x甲>x乙,m甲<m乙二、填空题6.某中学高三从甲、乙两个班中各选出7名学生参加数学竞赛,他们取得的成绩(满分100分)的茎叶图如图所示,其中甲班学生成绩的众数是85,乙班学生成绩的中位数是83,则x+y的值为________.7.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.(1)直方图中x的值为________;(2)在这些用户中,用电量落在区间[100,250)内的户数为________.8.PM2.5是指大气中直径小于或等于 2.5 微米的颗粒物,也称为可入肺颗粒物,如图是根据某地某日早 7 点至晚 8 点甲、乙两个监测点统计的数据(单位:毫克/立方米)列出的茎叶图,则甲、乙两地浓度的方差较小的是________.三、解答题9.为检查某工厂所生产的8万台电风扇的质量,抽查了其中20台的无故障连续使用时限(单位:小时)如下:248 256 232 243 188 268 278 266 289 312274 296 288 302 295 228 287 217 329 283(1)完成下面的频率分布表,并作出频率分布直方图;(2)估计8 万台电风扇中有多少台无故障连续使用时限不低于280小时;(3)用组中值(同一组中的数据在该组区间的中点值)估计样本的平均无故障连续使用时限.10.某工厂36到的年龄数据为44,列出样本的年龄数据;(2)计算(1)中样本的均值x和方差s2;(3)36名工人中年龄在x-s与x+s之间有多少人?所占的百分比是多少(精确到0.01%)?[冲击名校]1.如图,样本A 和B 分别取自两个不同的总体,它们的样本平均数分别为x A 和 x B ,样本标准差分别为s A 和s B ,则( )A.x A >x B ,s A >s BB.x A <x B ,s A >s BC.x A >x B ,s A <s BD.x A <x B ,s A <s B2.如图是某位篮球运动员8场比赛得分的茎叶图,其中一个数据染 上污渍用x 代替,那么这位运动员这8场比赛的得分平均数不小于 得分中位数的概率为( ) A.15 B.310 C.35 D.7103.为组织好“市九运会”,组委会征集了800名志愿者,现对他们的年龄抽样统计后,得到如图所示的频率分布直方图,但是年龄在[25,30)内的数据不慎丢失,依据此图可得:(1)年龄在[25,30)内对应小长方形的高度为________; (2)这800名志愿者中年龄在[25,35)内的人数为________.答 案 [全盘巩固]一、选择题1.解析:选C 初中部的女教师人数为110×70%=77,高中部的女教师人数为150×(1-60%)=60,该校女教师的人数为77+60=137,故选C.2.解析:选C 已知样本数据x 1,x 2,…,x 10的标准差为s =8,则s 2=64,数据2x 1-1,2x 2-1,…,2x 10-1的方差为22s 2=22×64,所以其标准差为22×64=2×8=16,故选C.3.解析:选C 由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9,所以甲、乙的成绩的平均数均为6,A 错;甲、乙的成绩的中位数分别为6,5,B 错;甲、乙的成绩的方差分别为15×[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=2,15×[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=125,C 对;甲、乙的成绩的极差均为4,D 错.4. 解析:选C 由题意得,年龄在[20,25)的网民出现的频率为0.01×5=0.05,[25,30)的网民出现的频率为0.07×5=0.35,又[30,35)、[35,40)、[40,45]的网民人数成递减的等差数列,则其频率也成等差数列,又[30,45]的频率为1-0.05-0.35=0.6,则年龄在[35,40)的网民出现的频率为0.2.5. 解析:选B 由茎叶图知m 甲=22+182=20,m 乙=27+312=29,∴m 甲<m 乙;x 甲=116(41+43+30+30+38+22+25+27+10+10+14+18+18+5+6+8)=34516,x 乙=116(42+43+48+31+32+34+34+38+20+22+23+23+27+10+12+18)=45716,∴x 甲<x 乙.二、填空题6. 解析:由甲班学生成绩的众数是85,知x =5,由乙班学生成绩的中位数是83,得y =3.所以x +y =8.答案:87. 解析:(1)由频率分布直方图总面积为1,得(0.001 2+0.002 4×2+0.003 6+x +0.006 0)×50=1,解得x =0.004 4;(2)用电量在[100,250)内的频率为(0.003 6+0.004 4+0.006 0)×50=0.7,故户数为100×0.7=70.答案:(1)0.004 4 (2)708. 解析:由茎叶图可知甲监测点的数据较为集中,乙监测点的数据较为分散,所以甲地的方差较小.答案:甲 三、简答题9. 解:(1)频率分布表及频率分布直方图如下所示:(2)由题意可得8×(0.30+0.10+0.05)=3.6,所以估计8万台电风扇中有3.6万台无故障连续使用时限不低于280小时.(3)由频率分布直方图可知x =190×0.05+210×0.05+230×0.10+250×0.15+270×0.20+290×0.30+310×0.10+330×0.05=269(小时),所以样本的平均无故障连续使用时限为269小时.10. 解:(1)由系统抽样的知识可知,36人分成9组,每组4人,其中第一组的工人年龄为44,所以其编号为2,故所有样本数据的编号为4n -2,n =1,2,…,9.其数据为:44,40,36,43,36,37,44,43,37.(2)x =44+40+…+379=40.由方差公式知,s 2=19[(44-40)2+(40-40)2+…+(37-40)2]=1009.(3)因为s 2=1009,所以s =103∈(3,4),所以36名工人中年龄在x -s 和x +s 之间的人数等于在区间[37,43]内的人数,即40,40,41,…,39,共23人.所以36名工人中年龄在x -s 和x +s 之间的人数所占的百分比为2336≈63.89%.[冲击名校]1. 解析:选BxA=2.5+10+5+7.5+2.5+106=37.56,xB=15+10+12.5+10+12.5+106=706,显然x A <x B ;s 是标准差,反映的是数据的波动程度,波动程度越大,s 越大,由图可知,样本A 中的数据波动较大,而样本B 中的数据波动较小,故选B.2. 解析:选B 由茎叶图可知0≤x ≤9且x ∈N ,中位数是10+7+x 2=27+x2,这位运动员这8场比赛的得分平均数为18(7+8+7+9+x +3+1+10×4+20×2)=18(x +115),由18(x +115)≥27+x2,得3x ≤7,即x =0,1,2,所以这位运动员这8场比赛的得分平均数不小于得分中位数的概率为310,故选B.3. 解析:(1)因为各个小长方形的面积之和为1,所以年龄在[25,30)内对应小长方形的高度为15[1-(5×0.01+5×0.07+5×0.06+5×0.02)]=0.04.(2)年龄在[25,35)内的频率为0.04×5+0.07×5=0.55,人数为0.55×800=440. 答案:(1)0.04 (2)440。
高三一轮复习(理)10.2用样本估计总体(练习学生版)一、选择题1..下图是某公司10个销售店某月销售某产品数量(台)的茎叶图,则数据落在区间[22,30)内的频率为()189212279300 3A.0.2B.0.4C.0.5D.0.62.在某次测量中得到的A样本数据如下:42,43,46,52,42,50,若B样本数据恰好是A样本数据每个都减5后所得数据,则A,B两样本的下列数字特征对应相同的是()A.平均数 B .标准差 C.众数 D .中位数3.样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均值为1,则样本方差为()A.65 B.65 C. 2 D.24.如图是一组样本数据的频率分布直方图,由图中的数据,可以估计总体的平均数与中位数分别是()A.12.5,12.5 B.13,13 C.13.5,12.5 D.13.5,13二、填空题5.某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们每场比赛得分的情况用下图所示的茎叶图表示,若甲运动员的中位数为a,乙运动员的众数为b,则a-b=__________。
6.(2016北京市通州区一模)甲、乙两人在5次体育测试中成绩见下表,其中●表示一个数字被污损,则甲的平均成绩超过乙的平均成绩的概率为.(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a=________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.三、解答题8.(2016年北京市丰台区一模)某空调专卖店试销A、B、C三种新型空调,销售情况如表所示:(2)根据C型空调前三周的销售情况,预估C型空调五周的平均周销售量为10台,当C型空调周销售量的方差最小时,求C4,C5的值;(注:方差s2=[x1﹣)2+(x)2+…+(x n﹣)2],其中为x1,x2,…,x n的平均数)(3)为跟踪调查空调的使用情况,根据销售记录,从第二周和第三周售出的空调中分别随机抽取一台,求抽取的两台空调中A型空调台数X的分布列及数学期望.。
§11.2用样本估计总体1.(2017·全国Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳答案 A解析对于选项A,由图易知,月接待游客量每年7,8月份明显高于12月份,故A错;对于选项B,观察折线图的变化趋势可知,年接待游客量逐年增加,故B正确;对于选项C,D,由图可知显然正确.故选A.2.(2018届广东肇庆检测)下面茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为()A.58 B.49C.67 D.310答案 A解析由题意根据甲组数据的中位数为15,可得x=5;乙组数据的平均数为16.8,则9+15+18+24+10+y5=16.8,求得y=8.3.(2016·全国Ⅲ)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15℃,B点表示四月的平均最低气温约为5℃.下面叙述不正确的是()A.各月的平均最低气温都在0℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20℃的月份有5个答案 D解析由题意知,平均最高气温高于20℃的有七月,八月,故选D.4.某工厂对一批新产品的长度(单位:mm)进行检测,如图是检测结果的频率分布直方图,据此估计这批产品的中位数为()A.20 B.25C.22.5 D.22.75答案 C解析产品的中位数出现在频率是0.5的地方.自左至右各小矩形的面积依次为0.1,0.2,0.4,0.15,0.15,设中位数是x ,则由0.1+0.2+0.08×(x -20)=0.5, 得x =22.5,故选C.5.(2017·长沙适应性考试)某校开展“爱我母校,爱我家乡”摄影比赛,七位评委为甲,乙两名选手的作品打出的分数的茎叶图如图所示(其中m 为数字0~9中的一个),去掉一个最高分和一个最低分后,甲,乙两名选手得分的平均数分别为a 1,a 2,则一定有( )A .a 1>a 2B .a 2>a 1C .a 1=a 2D .a 1,a 2的大小与m 的值有关 答案 B解析 由茎叶图知,a 1=80+1+5+5+4+55=84,a 2=80+4+4+6+4+75=85,故选B.6.若样本数据x 1,x 2,…,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为( )A .8B .15C .16D .32 答案 C解析 已知样本数据x 1,x 2,…,x 10的标准差为s =8,则s 2=64,数据2x 1-1,2x 2-1,…,2x 10-1的方差为22s 2=22×64,所以其标准差为22×64=2×8=16,故选C.7.已知样本数据x1,x2,…,x n的平均数x=5,则样本数据2x1+1,2x2+1,…,2x n+1的平均数为________.答案11解析由x1,x2,…,x n的平均数x=5,得2x1+1,2x2+1,…,2x n+1的平均数为2x+1=2×5+1=11.8.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间『80,130』上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm.答案24解析底部周长在『80,90)的频率为0.015×10=0.15,底部周长在『90,100)的频率为0.025×10=0.25,样本容量为60,所以树木的底部周长小于100 cm的株数为(0.15+0.25)×60=24. 9.(2018·郑州模拟)某电子商务公司对10 000名网络购物者2016年度的消费情况进行统计,发现消费金额(单位:万元)都在区间『0.3,0.9』内,其频率分布直方图如图所示:(1)直方图中的a=________;(2)在这些购物者中,消费金额在区间『0.5,0.9』内的购物者的人数为________.答案(1)3(2)6 000解析由频率分布直方图及频率和等于1,可得0.2×0.1+0.8×0.1+1.5×0.1+2×0.1+2.5×0.1+a×0.1=1,解得a=3.于是消费金额在区间『0.5,0.9』内的频率为0.2×0.1+0.8×0.1+2×0.1+3×0.1=0.6,所以消费金额在区间『0.5,0.9』内的购物者的人数为0.6×10 000=6 000.10.某校女子篮球队7名运动员身高(单位:cm)分布的茎叶图如图,已知记录的平均身高为175 cm,但记录中有一名运动员身高的末位数字不清晰,如果把其末位数字记为x,那么x 的值为________.答案 2解析 170+17×(1+2+x +4+5+10+11)=175,17×(33+x )=5,即33+x =35,解得x =2. 11.(2017·贵州遵义检测)在一个文艺比赛中,12名专业人士和12名观众代表各组成一个评判小组,给参赛选手打分,如图是两个评判组对同一选手打分的茎叶图:(1)求A 组数的众数和B 组数的中位数;(2)对每一组计算用于衡量相似性的数值,回答:小组A 与小组B 哪一个更像是由专业人士组成的?并说明理由.解 (1)由茎叶图可得:A 组数据的众数为47,B 组数据的中位数为55+582=56.5.(2)小组A ,B 数据的平均数分别为 x A =112(42+42+44+45+46+47+47+47+49+50+50+55)=56412=47, x B =112(36+42+46+47+49+55+58+62+66+68+70+73)=67212=56, 小组A ,B 数据的方差分别为s 2A =112『(42-47)2+(42-47)2+…+(55-47)2』 =112(25+25+9+4+1+0+0+0+4+9+9+64)=12.5, s 2B =112『(36-56)2+(42-56)2+…+(73-56)2』 =112(400+196+100+81+49+1+4+36+100+144+196+289)=133.因为s2A<s2B,所以A组成员的相似程度高,由于专业裁判给分更符合专业规则,相似程度应该高,因此A组更像是由专业人士组成的.12.(2016·北京)某市民用水拟实行阶梯水价,每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费,从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替,当w=3时,估计该市居民该月的人均水费.解(1)如题图所示,用水量在『0.5,3)的频率的和为(0.2+0.3+0.4+0.5+0.3)×0.5=0.85.∴用水量小于等于3立方米的频率为0.85,又w为整数,∴为使80%以上的居民在该月的用水价格为4元/立方米,w至少定为3.(2)当w=3时,该市居民该月的人均水费估计为(0.1×1+0.15×1.5+0.2×2+0.25×2.5+0.15×3)×4+0.15×3×4+『0.05×(3.5-3)+0.05×(4-3)+0.05×(4.5-3)』×10=7.2+1.8+1.5=10.5(元).即当w=3时该市居民该月的人均水费估计为10.5元.13.(2017·全国Ⅰ)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数答案 B解析因为可以用极差、方差或标准差来描述数据的离散程度,所以要评估亩产量稳定程度,应该用样本数据的极差、方差或标准差.故选B.14.某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.A地区用户满意度评分的频率分布直方图图①B地区用户满意度评分的频数分布表(1)在图②中作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);B地区用户满意度评分的频率分布直方图图②(2)根据用户满意度评分,将用户的满意度分为三个等级:估计哪个地区用户的满意度等级为不满意的概率大?说明理由.解(1)作出频率分布直方图如图:通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(2)A地区用户的满意度等级为不满意的概率大.记C A表示事件:“A地区用户的满意度等级为不满意”;C B表示事件:“B地区用户的满意度等级为不满意”.由直方图得P(C A)的估计值为(0.01+0.02+0.03)×10=0.6,P(C B)的估计值为(0.005+0.02)×10=0.25.所以A地区用户的满意度等级为不满意的概率大.15.(2017·山西大学附中诊断测试)已知样本(x 1,x 2,…,x n )的平均数为x ,样本(y 1,y 2,…,y m )的平均数为y (x ≠y ),若样本(x 1,x 2,…,x n ,y 1,y 2,…,y m )的平均数z =a x +(1-a )y ,其中0<a <12,则n ,m 的大小关系为( ) A .n <mB .n >mC .n =mD .不能确定答案 A解析 由题意可得x =x 1+x 2+…+x n n, y =y 1+y 2+…+y m m, z =x 1+x 2+…+x n +y 1+y 2+…+y m n +m=n n +m ·x 1+x 2+…+x n n +m n +m ·y 1+y 2+…+y m m =n n +m ·x +m n +m ·y =a x +(1-a )y , 所以n n +m =a ,m n +m=1-a ,又0<a <12, 所以0<n n +m <12<m n +m,所以n <m .故选A. 16.(2018·洛阳质检)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得到如下频数分布表:(1)作出这些数据的频率分布直方图;(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?解(1)样本数据的分布直方图如图所示:(2)质量指标值的样本平均数为x=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.。
第二节用样本估计总体[备考方向要明了][归纳·知识整合]1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差);(2)决定组距与组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线.3.茎叶图的优点茎叶图的优点是可以保留原始数据,而且可以随时记录,方便记录与表示. 4.标准差和方差(1)标准差是样本数据到平均数的一种平均距离. (2)标准差: s =1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2]. (3)方差:s 2=1n [(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2](x n 是样本数据,n 是样本容量,x是样本平均数).5.利用频率分布直方图估计样本的数字特征(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值.(2)平均数:平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.(3)众数:在频率分布直方图中,众数是最高的矩形的中点的横坐标. [探究] 1.在频率分布直方图中如何确定中位数?提示:在频率分布直方图中,中位数左边和右边的直方图的面积是相等的. 2.利用茎叶图求数据的中位数的步骤是什么?提示:(1)将茎叶图中数据按大小顺序排列;(2)找中间位置的数.[自测·牛刀小试]1.(2012·山东高考)在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的是( )A .众数B .平均数C .中位数D .标准差解析:选D 只有标准差不变,其中众数、平均数和中位数都加2. 2.(2011·安庆模拟)如图是根据某校10位高一同学的身高(单位:cm)画出的茎叶图,其中左边的数字从左到右分别表示学生身高的百位数字和十位数字,右边的数字表示学生身高的个位数字,从图中可以得到这10位同学身高的中位数是( )A .161B .162C .163D .16415 5 5 7 8 16 1 3 3 5 1712解析:选B 由给定的茎叶图可知,这10位同学身高的中位数为161+1632=162.3.某校举行2013年元旦汇演,七位评委为某班的小品打出的分数如下茎叶统计图,去掉一个最高分和一个最低分,所剩数据的方差为________.解析:由茎叶图知,去掉一个最高分和一个最低分,所剩数据为84,84,86,84,87,所以由公式得方差为1.6.答案:1.64.从一堆苹果中任取10只,称得它们的质量如下(单位:克):125,120,122,105,130,114,116,95,120,134,则样本数据落在[114.5,124.5)内的频率为________.解析:数据落在[114.5,124.5)内的有:120,122,116,120共4个,故所求频率为410=0.4.答案:0.45.(2012·大同模拟)将容量为n 的样本中的数据分为6组,绘制频率分布直方图,若第一组至第六组的数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和为27,则n =________.解析:由已知,得2+3+42+3+4+6+4+1·n =27,即920·n =27,解得n =60. 答案:60[例1] (1)在样本频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他10个小长方形面积和的14,且样本容量为160,则中间一组的频数为( )A .32B .0.2C .40D .0.25(2)某区高二年级的一次数学统考中,随机抽取200名同学的成绩,成绩全部在50分至100分之间,将成绩按如下方式分成5组:第一组,成绩大于等于50分且小于60分;第二组,成绩大于等于60分且小于70分;……第五组,成绩大于7 9 8 4 4 6 4 7 93等于90分且小于等于100分,据此绘制了如图所示的频率分布直方图.则这200名同学中成绩大于等于80分且小于90分的学生有______名.[自主解答] (1)由频率分布直方图的性质,可设中间一组的频率为x ,则x +4x =1,解得x =0.2.故中间一组的频数为160×0.2=32.(2)由题知,成绩大于等于80分且小于90分的学生所占的频率为1-(0.005×2+0.025+0.045)×10=0.2,所以这200名同学中成绩大于等于80分且小于90分的学生有200×0.2=40名.[答案] (1)A (2)40 ——————————————————— 频率分布直方图反映了样本的频率分布(1)在频率分布直方图中纵坐标表示频率组距,频率=组距×频率组距.(2)频率分布表中频率的和为1,故频率分布直方图中各长方形的面积和为1.1.已知一个样本容量为100的样本数据的频率分布直方图如图所示,样本数据落在[6,10)内的样本频数为________,样本数据落在[2,10)内的频率为________.解析:样本数据落在[6,10)内的样本频数为0.08×4×100=32,样本数据落在[2,10)内的频率为(0.02+0.08)×4=0.4.答案:32 0.4[例2] (2012·安徽高考)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差[自主解答] 由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9.所以甲、乙的成绩的平均数均为6,A 错;甲、乙的成绩的中位数分别为6,5,B 错;甲、乙的成绩的方差分别为15×[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=2,15×[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=125,C 对;甲、乙的成绩的极差均为4,D 错.[答案] C ———————————————————样本数字特征及公式推广(1)平均数和方差都是重要的数字特征,是对总体一种简明的阐述.平均数、中位数、众数描述总体的集中趋势,方差和标准差描述波动大小.(2)平均数、方差公式的推广若数据x 1,x 2,…,x n 的平均数为x -,方差为s 2,则数据mx 1+a ,mx 2+a ,…,mx n +a 的平均数为m x -+a ,方差为m 2s 2.2.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为m e ,众数为m 0,平均值为x ,则( )A .m e =m 0=xB .m e =m 0<xC .m e <m 0<xD .m 0<m e <x解析:选D 由图可知,30名学生的得分情况依次为:2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分.中位数为第15,16个数(分别为5,6)的平均数即m e =5.5,5出现次数最多,故m 0=5,x =2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×1030≈5.97.于是得m 0<m e <x .[例3] 某校高三年级进行了一次数学测验,随机从甲、乙两班各抽取6名同学,所得分数的茎叶图如图所示.(1)(2)现从甲班这6名同学中随机抽取两名同学,求他们的分数之和大于165分的概率. [自主解答] (1)因为乙班的成绩集中在80分,且没有低分,所以乙班的平均分比较高. (2)设从甲班中任取两名同学,两名同学分数之和超过165分为事件A .从甲班6名同学中任取两名同学,则基本事件空间中包含了15个基本事件,又事件A 中包含4个基本事件,所以,P (A )=415.即从甲班中任取两名同学,两名同学分数之和超过165分的概率为415.———————————————————茎叶图的优缺点由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较繁琐.3.(2012·湖南高考)如图是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________.0 8 9 135(注:方差s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x 为x 1,x 2,…,x n 的平均数)解析:该运动员五场比赛中的得分为8,9,10,13,15,平均得分x =8+9+10+13+155=11,方差s 2=15[(8-11)2+(9-11)2+(10-11)2+(13-11)2+(15-11)2]=6.8.答案:6.84.随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图(中间的数字表示身高的百位、十位数,旁边的数字分别表示身高的个位数)如图所示.甲班 乙班2 18 1 9 8 1 0 17 2 5 6 6 9 8 8 4 2 163 5 98157(1)根据茎叶图判断哪个班的平均身高较高; (2)计算甲班的样本方差.解:(1)由茎叶图可知乙班身高比较集中在170~181之间,所以乙班的平均身高较高. (2)甲班的方差为:110×[(182-170)2+(179-170)2+(178-170)2+(171-170)2+(170-170)2+(168-170)2+(168-170)2+(164-170)2+(162-170)2+(158-170)2]=54.2.2个异同——众数、中位数和平均数的异同,标准差和方差的异同 (1)众数、中位数和平均数的异同①众数、中位数和平均数都是描述一组数据集中趋势的量,平均数是最重要的量. ②由于平均数与每一个样本数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数和中位数都不具有的性质.③众数考查各数据出现的频率,其大小只与这组数据中部分数据有关.当一组数据中有不少数据多次重复出现时,其众数往往更能反映问题.④某些数据的改动对中位数可能没有影响,中位数可能出现在所给的数据中,也可能不在所给的数据中.当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势.(2)标准差和方差的异同标准差和方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度就越大;标准差、方差越小,数据的离散程度则越小.因为方差与原始数据的单位不同,且平方后可能夸大了偏差程度,所以虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差.2个区别——直方图与条形图的区别不要把直方图错以为条形图,两者的区别在于条形图是离散随机变量,纵坐标刻度为频数或频率,直方图是连续随机变量,纵坐标刻度为频率/组距,这是密度,连续随机变量在某一点上是没有频率的.易误警示——频率分布直方图中的易误点[典例](2012·山东高考)如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5℃的城市个数为11,则样本中平均气温不低于25.5℃的城市个数为________.[解析]最左边两个矩形面积之和为0.10×1+0.12×1=0.22,总城市数为11÷0.22=50,最右边矩形面积为0.18×1=0.18,50×0.18=9.[答案]9[名师点评]1.忽视频率分布直方图中纵轴的含义为频率/组距,误认为是每组相应的频率值,导致失误;2.不清楚直方图中各组的面积之和为1,导致某组的频率不会求;3.不理解由直方图求样本平均值的方法,误用每组的频率乘以每组的端点值而导致失误;4.由直方图确定众数时应为最高矩形中点对应的横坐标值,中位数应为左右两侧的频率均等各为12.[变式训练]对某种电子元件的使用寿命进行跟踪调查,所得样本的频率分布直方图如图所示,由图可知,这一批电子元件中使用寿命在100~300 h 的电子元件的数量与使用寿命在300~600 h 的电子元件的数量的比是________.解析:寿命在100~300 h 的电子元件的频率为⎝⎛⎭⎫12 000+32 000×100=420=15; 寿命在300~600 h 的电子元件的频率为⎝⎛⎭⎫1400+1250+32 000×100=45. 则它们的电子元件数量之比为15∶45=14.答案:14一、选择题(本大题共6小题,每小题5分,共30分)1.(2012·湖北高考)容量为20的样本数据,分组后的频数如下表:则样本数据落在区间[10,40)的频率为( ) A .0.35 B .0.45 C .0.55D .0.65解析:选B 求得该频数为2+3+4=9,样本容量是20,所以频率为920=0.45.2.某校100名学生的数学测试成绩分布直方图如图所示,分数不低于a 即为优秀,如果优秀的人数为20人,则a 的估计值是( )A .130B .140C .134D .137解析:选C 由题意知,优秀的频率为0.2,故a 的值在130~140之间,则(140-a )×0.015=0.1,解得a =133.4.3.(2012·陕西高考)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )A .46,45,56B .46,45,53C .47,45,56D .45,47,53解析:选A 从茎叶图中可以看出样本数据的中位数为中间两个数的平均数,即45+472=46,众数为45,极差为68-12=56.4.某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表:A.25B.725C.35D .2解析:选Ax甲=7,s 2甲=15[(6-7)2+(7-7)2+(7-7)2+(8-7)2+(7-7)2]=25,x乙=7,s 2乙=15[(6-7)2+(7-7)2+(6-7)2+(7-7)2+(9-7)2]=65, 两组数据的方差中较小的一个为s 2甲,即s 2=25. 5.某单位举办技能比赛,9位评委给生产科打出的分数如茎叶图所示,统计员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x )无法看清,若记分员计算无误,则数字x 应该是( )评委给生产科打出的分数A.2 C .4D .5解析:选A 若数字90+x 是最高分,则为x 1=17(88+89+91+92+92+93+94)≈91.3,不合题意,因此最高分为94分,此时平均分x 2=17(88+89+91+92+92+93+90+x ),∴17(635+x )=91,解得x =2. 6.(2012·江西高考)小波一星期的总开支分布如图(1)所示,一星期的食品开支如图(2)所示,则小波一星期的鸡蛋开支占总开支的百分比为( )A .30%B .10%C .3%D .不能确定解析:选C 由图(1)得到小波一星期的总开支,由图(2)得到小波一星期的食品开支,从而再借助图(2)计算出鸡蛋开支占总开支的百分比.由图(2)知,小波一星期的食品开支为30+40+100+80+50=300元,由图(1)知,小波一星期的总开支为30030%=1 000元,则小波一星期的鸡蛋开支占总开支的百分比为301 000×100%=3%.二、填空题(本大题共3小题,每小题5分,共15分)7.(2013·徐州模拟)学校为了调查学生在课外读物方面的支出情况,抽出了一个容量为n 且支出在[20,60)元的样本,其频率分布直方图如图所示,其中支出在[50,60)元的同学有30人.则n 的值为________.解析:支出在[50,60)的频率为1-0.36-0.24-0.1=0.3,因此30n=0.3,故n =100.答案:1008.(2013·南京模拟)为了分析某篮球运动员在比赛中发挥的稳定程度,统计了该运动员在6场比赛中的得分,用茎叶图表示如图,则该组数据的方差为________.解析:该运动员6场的总得分为14+17+18+18+20+21=108,平均得分为1086=18分,方差=16[(14-18)2+(17-18)2+(18-18)2+(18-18)2+(20-18)2+(21-18)2]=5.答案:59.为了了解大连市今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图所示),已知图中从左到右的前3个小组的频率之比为1∶2∶3,第2小组的频数为120,则抽取的学生人数是________.解析:由频率分布直方图知:学生的体重在65~75 kg 的频率为(0.012 5+0.037 5)×5=0.25,则学生的体重在50~65 kg 的频率为1-0.25=0.75.从左到右第2个小组的频率为0.75×26=0.25,所以抽取的学生人数是120÷0.25=480. 答案:480三、解答题(本大题共3小题,每小题12分,共36分)10.(2012·安徽高考)若某产品的直径长与标准值的差的绝对值不超过1 mm 时,则视为合格品,否则视为不合格品,在近期一次产品抽样检查中,从某厂生产的此种产品中,随机抽取5 000件进行检测,结果发现有50件不合格品.计算这50件不合格品的直径长与标准值的差(单位:mm),将所得数据分组,得到如下频率分布表:1 4 7 8 8 21(1)将上面表格中缺少的数据补充完整;(2)估计该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率;(3)现对该厂这种产品的某个批次进行检查,结果发现有20件不合格品.据此估算这批产品中的合格品的件数.解:(1) 频率分布表(2)由频率分布表知,该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率约为0.50+0.20=0.70.(3)设这批产品中的合格品数为x件,依题意有505 000=20x+20,解得x=5 000×2050-20=1 980.所以该批产品的合格品件数估计是1 980件.11.(2012·广东高考)某班50位学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中x的值;(2)从成绩不低于80分的学生中随机选取2人,该2人中成绩在90分以上(含90分)的人数记为ξ,求ξ的数学期望.解:(1)由题意得:10x =1-(0.006×3+0.01+0.054)×10=0.18, 所以x =0.018.(2)∵成绩不低于80分的学生共有(0.018+0.006)×10×50=12人,其中90分以上(含90分)的共有0.006×10×50=3人,因此ξ的可能值为0,1,2三个值,P (ξ=0)=C 29C 212=611,p (ξ=1)=C 19C 13C 212=922,P (ξ=2)=C 23C 212=122,∴ξ的分布列为:∴E (ξ)=0×611+1×922+2×122=12.12.某中学共有1 000名学生参加了该地区高三第一次质量检测的数学考试,数学成绩如下表所示:样的方法抽取100名同学进行问卷调查,甲同学在本次测试中数学成绩为95分,求他被抽中的概率;(2)已知本次数学成绩的优秀线为110分,试根据所提供数据估计该中学达到优秀线的人数;(3)作出频率分布直方图,并估计该学校本次考试的数学平均分(同一组中的数据用该组区间的中点值作代表).解:(1)分层抽样中,每个个体被抽到的概率均为样本容量总体中个体总数,故甲同学被抽到的概率P =110. (2)由题意得x =1 000-(60+90+300+160)=390. 故估计该中学达到优秀线的人数 m =160+390×120-110120-90=290.(3)频率分布直方图如图所示.该学校本次考试的数学平均分.x =60×15+90×45+300×75+390×105+160×1351 000=90.估计该学校本次考试的数学平均分为90分.1.(2012·陕西高考)从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲乙两组数据的平均数分别为x 甲,x 乙,中位数分别为m 甲,m 乙,则( )A.x 甲<x 乙,m 甲>m 乙B.x 甲<x 乙,m 甲<m 乙C.x 甲>x 乙,m 甲>m 乙D.x 甲>x 乙,m 甲<m 乙解析:选B 由茎叶图可知甲数据集中在10至20之间,乙数据集中在20至40之间,明显x甲<x 乙,甲的中位数为20,乙的中位数为29,即m 甲<m 乙.2.某乡镇供电所为了调查农村居民用电量情况,随机抽取了500户居民去年的月均用电量(单位:kW/h),将所得数据整理后,画出频率分布直方图如下,其中直方图从左到右前3个小矩形的面积之比为1∶2∶3,试估计:(1)该乡镇月均用电量在[39.5,43.5)内的居民所占百分比约是多少? (2)该乡镇居民月均用电量的中位数约是多少?(精确到0.01)解:(1)设直方图从左到右前3个小矩形的面积分别为P ,2P ,3P . 由直方图可知,最后两个小矩形的面积之和为 (0.087 5+0.037 5)×2=0.25.因为直方图中各小矩形的面积之和为1, 所以P +2P +3P =0.75,即P =0.125. 所以3P +0.087 5×2=0.55.由此估计,该乡镇居民月均用电量在[39.5,43.5)内的居民所占百分比约是55%. (2)显然直方图的面积平分线位于正中间一个矩形内,且该矩形在面积平分线左侧部分的面积为0.5-P -2P =0.5-0.375=0.125,设样本数据的中位数为39.5+x .因为正中间一个矩形的面积为3P =0.375,所以x ∶2=0.125∶0.375,即x =23≈0.67.从而39.5+x ≈40.17,由此估计,该乡镇居民月均用电量的中位数约是40.17(kW/h). 3.为了解学生身高情况,某校以10%的比例对全校700名学生按性别进行分层抽样调查,测得身高情况的统计图如图所示.(1)估计该校男生的人数;(2)估计该校学生身高在170~185 cm 之间的概率;(3)从样本中身高在180~190 cm 之间的男生中任选2人,求至少有1人身高在185~190 cm 之间的概率.解:(1)样本中男生人数为40,分层抽样比为10%. 故估计全校男生人数为400.(2)由统计图知,样本中身高在170~185 cm 之间的学生有14+13+4+3+1=35人,样本容量为70.故该校学生身高在170~185 cm 之间的概率 P 1=3570=0.5.(3)由统计图知,样本中身高在180~185 cm 之间的男生有4人(不妨设为A 、B 、C 、D ),样本身高在185~190 cm 之间的男生有2人(不妨设为E ,F )从身高在180~190 cm 之间的6人中任选2人有15种结果,其中至少1人身高在185~190 cm 之间的结果有9种,故所求事件的概率P 2=915=35.。
【赢在微点】高三数学(文)一轮复习练习:10-3用样本估计总体(含答案解析)配餐作业(五十九) 用样本估计总体一、选择题1.某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100]。
若低于60分的人数是15,则该班的学生人数是( )A .45B .50C .55D .60解析:根据频率分布直方图,低于60分的同学所占频率为:(0.005+0.01)×20=0.3,故该班的学生人数为150.3=50,故选B 。
答案:B2.某公司10位员工的月工资(单位:元)为x 1,x 2,…,x 10,其均值和方差分别为x 和s 2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( )A.x ,s 2+1002B.x +100,s 2+1002C.x ,s 2D.x +100,s 2解析:方法一:对平均数和方差的意义深入理解可巧解。
因为每个数据都加上了100,故平均数也增加100,而离散程度应保持不变,故选D 。
方法二:由题意知x 1+x 2+…+x n =n x ,s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],则所求均值y =1n [(x 1+100)+(x 2+100)+…+(x n +100)]=1n(n x +n×100)=x +100,而所求方差s′2=1n [(x 1+100-y )2+(x 2+100-y )2+…+(x n +100-y )2]=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]=s 2,故选D 。
答案:D3.PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物,下图是据北京某日早7点至晚8点甲、乙两个PM2.5监测点统计的数据(单位:毫克/立方米)列出的茎叶图,则甲、乙两地浓度的中位数较低的是()A.甲、乙相等B.甲C.乙D.无法确定解析:由茎叶图可得甲地浓度的中位数为0.066,乙地浓度的中位数为0.062,因此乙地浓度的中位数较低。
高三一轮复习(文)10.2用样本估计总体(检测学生版)
时间:50分钟总分:70分
班级:姓名:
一、选择题(共6小题,每题5分,共30分)
1.学校为了解学生在课外读物方面的支出情况,抽取了n位同学进行调查,结果显示这些同学的支出都在[10,50)(单位:元)内,其中支出在[30,50)(单位:元)内的同学有67人,其频率分布直方图如图所示,则n的值为()
A.100 B.120 C.130 D.390
2.为了让人们感知丢弃塑料袋对环境造成的影响,某班环保小组的六名同学记录了自己家中一周内丢的塑料袋的数量,结果如下(单位:个):33,25,28,26,25,31.如果该班有45名学生,那么根据提供的数据估计本周全班同学各家共丢弃塑料袋()
A.900个B.1 080个C.1 260个D.1 800个
3.若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为() A.8 B.15 C.16 D.32
4.(2016年北京市丰台区一模)某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们每场比赛得分的情况用如图所示的茎叶图表示,则甲、乙两名运动员的中位数分别为()
A.19、13 B.13、19 C.20、18 D.18、20.
5.甲、乙两位同学在高三的5次月考中数学成绩统计如茎叶图所示,若甲、乙两人的平均成绩分别是x甲,x乙,则下列叙述正确的是()
A.x甲>x乙;乙比甲成绩稳定B.x甲>x乙;甲比乙成绩稳定
C.x甲<x乙;乙比甲成绩稳定D.x甲<x乙;甲比乙成绩稳定
6.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是()
二、填空题(共4小题,每题5分,共20分)
7.(2016年北京模拟)在2016年4月23日“世界读书日”到来之际,某单位对本单位全部200名员工平均每天的读书世界进行了调查,得到如图所示的频率分布直方图,根据该频率分步直方图,估计该单位每天
平均读书时间在[1.5,2.5)之间的员工人数为.
8.样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均值为1,则样本方差为________.
9 (2016年北京市海淀区二模)某校为了解全校高中同学五一小长假参加实践活动的情况,抽查了100名
同学,统计他们假期参加活动的时间,绘成的频率分布直方图如图所示,则这100名同学中参加活动时间在
小时内的人数为___.
10.(2016北京市大兴区高三)在测量某物体的重量时,得到如下数据:a 1,a 2,…a 9,其中a 1≤a 2≤…≤a 9,若用a 表示该物体重量的估计值,使a 与每一个数据差的平方和最小,则a 等于 ;若用b 表示该物体重量的估计值,使b 与每一个数据差的绝对值的和最小,则b 等于 . 三、解答题(共2小题,每题10分,共20分)
11. ( 2016北京市朝阳区二模)某城市要建宜居的新城,准备引进优秀企业进行城市建设.这个城市的甲区、
乙区分别对6个企业进行评估,综合得分情况如茎叶图所示. (Ⅰ)根据茎叶图,分别求甲、乙两区引进企业得分的平均值;
(Ⅱ)规定85分以上(含85分)为优秀企业.若从甲、乙两个区准备引进的优秀企业中各随机选取1个,求这两个企业得分的差的绝对值不超过5分的概率.
12.某工厂对一批产品进行了抽样检测.如图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36.
(1)求样本容量及样本中净重大于或等于98克并且小于104克的产品的个数;
(2)已知这批产品中每个产品的利润y (单位:元)与产品净重x (单位:克)的关系式为y =⎩⎪⎨⎪⎧
3,96≤x <98,5,98≤x <104,
4,104≤x ≤106,求
这批产品平均每个的利润.。