(江西版)2013年高考数学总复习 第十章10.6 随机抽样与用样本估计总体 理 北师大版(含详解)
- 格式:doc
- 大小:4.68 MB
- 文档页数:5
第三节随机抽样与用样本估计总体1.简单随机抽样(1)抽取方式:逐个不放回抽取;(2)特点:每个个体被抽到的概率相等;(3)常用方法:抽签法和随机数法.⇒利用随机数表抽样时,①选定的初始数和读数的方向是任意的;②对各个个体编号要视总体中的个体数情况而定,且必须保证所编号码的位数一致.2.分层抽样(1)在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.(2)分层抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.利用分层抽样要注意按比例抽取,若各层应抽取的个体数不都是整数,则应当调整各层容量,即先剔除各层中“多余”的个体.3.系统抽样(1)系统抽样适用于元素个数很多且均衡的总体.(2)系统抽样的步骤假设要从容量为N的总体中抽取容量为n的样本.①先将总体的N个个体编号;②确定分段间隔k,对编号进行分段.当Nn(n是样本容量)是整数时,取k=Nn;③在第1段用简单随机抽样确定第一个个体编号l(l≤k);④按照一定的规则抽取样本.通常是将l加上间隔k得到第2个个体编号l+k,再加k 得到第3个个体编号l+2k,依次进行下去,直到获取整个样本.4.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差);(2)决定组距与组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图.5.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.6.茎叶图统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.7.标准差和方差(1)标准差是样本数据到平均数的一种平均距离.(2)标准差:s=1n[(x1-x)2+(x2-x)2+…+(x n-x)2].(3)方差:s2=1n[(x1-x)2+(x2-x)2+…+(x n-x)2](x n是样本数据,n是样本容量,x是样本平均数).1.标准差与方差的特点反映了各个样本数据聚集于样本平均数周围的程度.标准差(方差)越小,表明各个样本数据在样本平均数周围越集中;标准差(方差)越大,表明各个样本数据在样本平均数的两边越分散.2.平均数、方差的公式推广(1)若数据x1,x2,…,x n的平均数为\x\to(x),那么mx1+a,mx2+a,mx3+a,…,mx n+a的平均数是m\x\to(x)+a.,(2)数据x1,x2,…,x n的方差为s2.,①数据x1+a,x2+a,…,x n+a的方差也为s2;,②数据ax1,ax2,…,ax n的方差为a2s2.[小题查验基础]一、判断题(对的打“√”,错的打“×”)(1)在简单随机抽样中,某一个个体被抽到的可能性与第几次抽取有关,第一次被抽到的可能性最大.()(2)分层抽样中,每个个体被抽到的可能性与层数及分层有关.()(3)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.()(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.()(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.()答案:(1)×(2)×(3)√(4)×(5)√二、选填题1.为了了解某地参加计算机水平测试的5 000名学生的成绩,从中抽取了200名学生的成绩进行统计分析.在这个问题中,这200名学生成绩的全体是( )A.总体B.个体C.从总体中抽取的一个样本D.样本容量解析:选C 根据随机抽样的概念可知选C.2.某学校为调查高三年级的240名学生完成课后作业所需的时间,采取了两种抽样调查方式:第一种由学生会的同学随机抽取24名同学进行调查;第二种由教务处对高三年级的学生进行编号,从001到240,抽取学号最后一位为3的同学进行调查,则这两种抽样方法依次为( )A.分层抽样,简单随机抽样B.简单随机抽样,分层抽样C.分层抽样,系统抽样D.简单随机抽样,系统抽样解析:选D 由三种抽样方法的定义可知,题中第一种方法为简单随机抽样,第二种为系统抽样.3.为评估一种农作物的种植效果,选了n 块地作试验田.这n 块地的亩产量(单位:kg)分别为x 1,x 2,…,x n ,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )A.x 1,x 2,…,x n 的平均数B.x 1,x 2,…,x n 的标准差C.x 1,x 2,…,x n 的最大值D.x 1,x 2,…,x n 的中位数解析:选B 统计问题中,体现数据的稳定程度的指标为数据的方差或标准差.故选B. 4.某学校高一、高二、高三年级的学生人数之比为3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取________名学生.解析:设应从高二年级抽取x 名学生,则x 50=310,解得x =15. 答案:155.如图是某班8位学生诗词比赛得分的茎叶图,那么这8位学生得分的众数和中位数分别为________.解析:依题意,结合茎叶图,将题中的数由小到大依次排列得到:86,86,90,91,93,93,93,96,因此这8位学生得分的众数是93,中位数是91+932=92.答案:93 92考点一 抽样方法[基础自学过关][题组练透]1.利用简单随机抽样,从n 个个体中抽取一个容量为10的样本.若第二次抽取时,余下的每个个体被抽到的概率为13,则在整个抽样过程中,每个个体被抽到的概率为( )A.14 B.13 C.514D.1027解析:选C 根据题意,9n -1=13,解得n =28.故在整个抽样过程中每个个体被抽到的概率为1028=514.2.福利彩票“双色球”中红球的号码可以从01,02,03,…,32,33这33个两位号码中选取,小明利用如下所示的随机数表选取红色球的6个号码,选取方法是从第1行第9列的数字开始,从左到右依次读取数据,则第四个被选中的红色球的号码为( )A.12B.33C.06D.16解析:选C 被选中的红色球的号码依次为17,12,33,06,32,22.所以第四个被选中的红色球的号码为06.3.利用系统抽样法从编号分别为1,2,3,…,80的80件不同产品中抽取一个容量为16的样本,如果抽出的产品中有一件产品的编号为13,则抽到产品的最大编号为( )A.73B.78C.77D.76解析:选B 样本的分段间隔为8016=5,所以13号在第三组,则最大的编号为13+(16-3)×5=78.4.某电视台在因特网上就观众对其某一节目的喜爱程度进行调查,参加调查的一共有20 000人,其中各种态度对应的人数如下表所示:电视台为了了解观众的具体想法和意见,打算从中抽取100人进行详细的调查,为此要进行分层抽样,那么在分层抽样时,每类人中应抽取的人数分别为( )A.25,25,25,25B.48,72,64,16C.20,40,30,10D.24,36,32,8解析:选D 因为抽样比为10020 000=1200,所以每类人中应抽取的人数分别为4 800×1200=24,7 200×1200=36,6 400×1200=32,1 600×1200=8. 5.为了了解高一、高二、高三学生的身体状况,现用分层抽样的方法抽取一个容量为1 200的样本,三个年级学生人数之比依次为k ∶5∶3,已知高一年级共抽取了240人,则高三年级抽取的人数为________.解析:因为高一年级抽取学生的比例为2401 200=15,所以k k +5+3=15,解得k =2,故高三年级抽取的人数为1 200×32+5+3=360.答案:360[名师微点]1.应用随机数法的两个关键点(1)确定以表中的哪个数(哪行哪列)为起点,以哪个方向为读数的方向;(2)读数时注意结合编号特点进行读取,若编号为两位数字,则两位两位地读取,若编号为三位数字,则三位三位地读取,有超过总体号码或出现重复号码的数字舍去,这样继续下去,直到获取整个样本.2.解决分层抽样题的关键先确定抽样比,然后把各层个体数乘以抽样比,即得各层要抽取的个体数.常用公式: (1)抽样比=样本容量总体容量=各层样本容量各层个体总量;(2)层1的容量∶层2的容量∶层3的容量=样本中层1的容量∶样本中层2的容量∶样本中层3的容量.考点二 频率分布直方图的应用[师生共研过关][典例精析]我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x (吨),一位居民的月用水量不超过x 的部分按平价收费,超出x 的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a 的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由; (3)若该市政府希望使85%的居民每月的用水量不超过标准x (吨),估计x 的值,并说明理由.[解] (1)由频率分布直方图知,月均用水量在[0,0.5)中的频率为0.08×0.5=0.04, 同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.由0.04+0.08+0.5×a +0.20+0.26+0.5×a +0.06+0.04+0.02=1, 解得a =0.30.(2)由(1)可知,100位居民中每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.根据样本中的频率,可以估计全市30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.(3)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85, 前5组的频率之和为0.04+0.08+0.15+0.20+0.26=0.73<0.85, 所以2.5≤x <3.由0.30×(x -2.5)=0.85-0.73, 解得x =2.9.所以估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.[解题技法]1.谨记频率分布直方图的相关公式 (1)直方图中各小长方形的面积之和为1.(2)直方图中纵轴表示频率组距,故每组样本的频率为组距×频率组距,即矩形的面积.(3)直方图中每组样本的频数为频率×总数. 2.频率分布直方图中数字特征的计算(1)最高的小长方形底边中点的横坐标即是众数. (2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.[过关训练]1.(2019·贵阳模拟)在某中学举行的环保知识竞赛中,将三个年级参赛学生的成绩进行整理后分为5组,绘制如图所示的频率分布直方图,图中从左到右依次为第一、第二、第三、第四、第五小组,已知第二小组的频数是40,则成绩在80~100分的学生人数是( )A.15B.18C.20D.25解析:选A 根据频率分布直方图,得第二小组的频率是0.040×10=0.4,∵频数是40,∴样本容量是400.4=100,又成绩在80~100分的频率是(0.010+0.005)×10=0.15,∴成绩在80~100分的学生人数是100×0.15=15.2.某网络营销部门随机抽查了某市200名网友在2018年11月11日的网购金额,所得数据如下表:已知网购金额不超过3千元与超过3千元的人数比恰为3∶2. (1)试确定x ,y ,p ,q 的值,并补全频率分布直方图(如图);(2)该营销部门为了了解该市网友的购物体验,从这200名网友中,用分层抽样的方法从网购金额在(1,2]和(4,5]的两个群体中确定5人进行问卷调查,若需从这5人中随机选取2人继续访谈,则此2人来自不同群体的概率是多少?解:(1)根据题意有⎩⎪⎨⎪⎧16+24+x +y +16+14=200,16+24+x y +16+14=32,解得⎩⎪⎨⎪⎧x =80,y =50,∴p =0.40,q =0.25.补全频率分布直方图如图所示.(2)根据题意,抽取网购金额在(1,2]内的人数为 2424+16×5=3(人). 抽取网购金额在(4,5]内的人数为1624+16×5=2(人). 故此2人来自不同群体的概率P =C 13C 12C 25=35.考点三 茎叶图的应用[师生共研过关][典例精析]某良种培育基地正在培育一小麦新品种A ,将其与原有的一个优良品种B 进行对照试验,两种小麦各种植了25亩,所得亩产量的数据(单位:千克)如下.品种A :357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454品种B :363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430(1)作出品种A 与B 亩产量数据的茎叶图; (2)用茎叶图处理现有的数据,有什么优点?(3)通过观察茎叶图,对品种A 与B 的亩产量及其稳定性进行比较,写出统计结论. [解] (1)画出茎叶图如图所示.(2)由于每个品种的数据都只有25个,样本容量不大,画茎叶图很方便;此时茎叶图不仅清晰明了地展示了数据的分布情况,便于比较,没有任何信息损失,而且可以随时记录新的数据.(3)通过观察茎叶图可以看出:①品种A的亩产量的平均数(或均值)比品种B高;②品种A的亩产量的标准差(或方差)比品种B大,故品种A的亩产量的稳定性较差.[解题技法]茎叶图的使用策略(1)茎叶图的绘制需注意:①“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;②重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据.(2)茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等.[过关训练]1.如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为()A.3,5B.5,5C.3,7D.5,7解析:选A甲组数据的中位数为65,由甲、乙两组数据的中位数相等,得y=5.又甲、乙两组数据的平均值相等,∴15×(56+65+62+74+70+x)=15×(59+61+67+65+78),∴x=3.故选A.2.某赛季甲、乙两名篮球运动员每场比赛的得分如茎叶图所示.下列结论错误的是()A.乙运动员得分的中位数是36B.甲运动员发挥的稳定性比乙运动员发挥的稳定性差C.甲运动员的平均分为27分D.乙运动员的得分有613集中在茎3上解析:选C 从茎叶图知,A 、D 是正确的,乙运动员的得分较集中,甲运动员得分较分散,故B 是正确的,甲运动员得分的平均分为29011<27.故选C.考点四 用样本的数字特征估计总体的数字特征[师生共研过关][典例精析]某大学艺术专业的400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据按[20,30),[30,40),…,[80,90]分成7组,并整理得到如图所示的频率分布直方图.(1)估计总体的众数;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数; (3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女学生人数相等.试估计总体中男生和女生人数的比例.[解] (1)由频率分布直方图可估计总体的众数为70+802=75.(2)由频率分布直方图可知,样本中分数在区间[50,90)内的人数为(0.01+0.02+0.04+0.02)×10×100=90.因为样本中分数小于40的学生有5人,所以样本中分数在区间[40,50)内的人数为100-90-5=5. 设总体中分数在区间[40,50)内的人数为x ,则5100=x 400,解得x =20, 故估计总体中分数在区间[40,50)内的人数为20.(3)由频率分布直方图可知,样本中分数不小于70的人数为(0.04+0.02)×10×100=60. 因为样本中分数不小于70的男女学生人数相等, 所以样本中分数不小于70的男生人数为30.因为样本中有一半男生的分数不小于70,所以样本中男生的人数为60,女生的人数为40. 由样本估计总体,得总体中男生和女生人数的比例约为3∶2.[解题技法]利用样本的数字特征解决优化决策问题的依据(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.[过关训练]1.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的中位数等于乙的成绩的中位数C.甲的成绩的方差小于乙的成绩的方差D.甲的成绩的极差小于乙的成绩的极差 解析:选C 甲的平均数是4+5+6+7+85=6,中位数是6,极差是4,方差是(-2)2+(-1)2+02+12+225=2;乙的平均数是5+5+5+6+95=6,中位数是5,极差是4,方差是(-1)2+(-1)2+(-1)2+02+325=125,比较可得选项C 正确.2.已知一组数据x 1,x 2,x 3,x 4,x 5的方差是2,则数据2x 1,2x 2,2x 3,2x 4,2x 5的标准差为________.解析:由s 2=1n ∑i =1n(x i -x )2=2,则数据2x 1,2x 2,2x 3,2x 4,2x 5的方差是8,标准差为2 2.答案:2 23.甲、乙两人参加某体育项目训练,近期的五次测试成绩(单位:分)如图所示:(1)分别求出甲、乙两人成绩的平均数与方差; (2)根据(1)的结果,对两人的成绩作出评价.解:(1)由题图可得甲、乙两人五次测试的成绩分别为 甲:10分,13分,12分,14分,16分; 乙:13分,14分,12分,12分,14分. x 甲=10+13+12+14+165=13, x 乙=13+14+12+12+145=13,s 2甲=15×[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4, s 2乙=15×[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8. (2)由s 2甲>s 2乙,可知乙的成绩较稳定.从题图看,甲的成绩基本呈上升趋势,而乙的成绩上下波动,因此甲的成绩在不断提高,而乙的成绩则无明显提高.[课时跟踪检测]一、题点全面练1.(2018·石家庄模拟)某校一年级有男生560人,女生420人,用分层抽样的方法从该年级全体学生中抽取一个容量为140的样本,则此样本中男生人数为()A.80B.120C.160D.240解析:选A因为男生和女生的比例为560∶420=4∶3,样本容量为140,所以应该抽取男生的人数为140×44+3=80,故选A.2.一个总体中有600个个体,随机编号为001,002,…,600,利用系统抽样方法抽取容量为24的一个样本,总体分组后在第一组随机抽得的编号为006,则在编号为051~125之间抽得的编号为()A.056,080,104B.054,078,102C.054,079,104D.056,081,106解析:选D系统抽样的间隔为60024=25,编号为051~125之间抽得的编号为006+2×25=056,006+3×25=081,006+4×25=106.3.(2019·天水模拟)甲、乙两名同学6次考试的成绩统计如图所示,甲、乙两组数据的平均数分别为x甲,x乙,标准差分别为s甲,s乙,则()A.x甲<x乙,s甲<s乙B.x甲<x乙,s甲>s乙C.x甲>x乙,s甲<s乙D.x甲>x乙,s甲>s乙解析:选C由图可知,甲同学除第二次考试成绩略低于乙同学外,其他考试成绩都远高于乙同学,可知x甲>x乙.图中数据显示甲同学的成绩比乙同学稳定,故s甲<s乙.4.(2019·中山模拟)某商场在国庆黄金周的促销活动中,对10月1日9时至14时的销售额进行统计,其频率分布直方图如图所示.已知9时至10时的销售额为3万元,则9时至14时的销售总额为()A.10万元B.12万元C.15万元D.30万元解析:选D由图知,9时至10时的销售额频率为0.1,因此9时至14时的销售总额为30.1=30(万元),故选D.5.(2019·昆明调研)如图是1951~2016年我国的年平均气温变化的折线图.根据图中信息,下列结论正确的是()A.1951年以来,我国的年平均气温逐年增高B.1951年以来,我国的年平均气温在2016年再创新高C.2000年以来,我国每年的年平均气温都高于1981~2010年的平均值D.2000年以来,我国的年平均气温的平均值高于1981~2010年的平均值解析:选D由图可知,1951年以来,我国的年平均气温变化是有起伏的,不是逐年增高的,所以选项A错误;1951年以来,我国的年平均气温最高的不是2016年,所以选项B错误;2012年的年平均气温低于1981~2010年的平均值,所以选项C错误;2000年以来,我国的年平均气温的平均值高于1981~2010年的平均值,所以选项D正确.故选D.6.样本中共有五个个体,其值分别为0,1,2,3,m.若该样本的平均值为1,则其方差为()A.105 B.305C. 2D.2解析:选D依题意得m=5×1-(0+1+2+3)=-1,样本方差s2=15[(-1)2+02+12+22+(-2)2]=2,即所求的样本方差为2.7.(2018·南宁模拟)已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为()A.100,20B.200,20C.200,10D.100,10解析:选B 由题图甲可知学生总人数是10 000,样本容量为10 000×2%=200,抽取的高中生人数是2 000×2%=40,由题图乙可知高中生的近视率为50%,所以高中生的近视人数为40×50%=20,故选B.8.为了了解某校高三美术生的身体状况,抽查了部分美术生的体重,将所得数据整理后,作出了如图所示的频率分布直方图.已知图中从左到右的前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,则被抽查的美术生的人数是________.解析:设被抽查的美术生的人数为n ,因为后2个小组的频率之和为(0.037 5+0.012 5)×5=0.25,所以前3个小组的频率之和为0.75.又前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,所以前3个小组的频数分别为5,15,25,所以n =5+15+250.75=60.答案:609.随着智能手机的普及,网络购物越来越受到人们的青睐,某研究性学习小组对使用智能手机的利与弊随机调查了10位同学,得到的满意度打分如茎叶图所示.若这组数据的中位数、平均数分别为a ,b ,则a ,b 的大小关系是________.解析:已知茎叶图中的数据分别为75,76,77,81,83,87,89,93,94,95,则中位数a =12×(83+87)=85,平均数b =110×(75+76+77+81+83+87+89+93+94+95)=85,故a =b . 答案:a =b10.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示,则7个剩余分数的方差为________.解析:由图可知去掉的两个数是87,99,所以87+90×2+91×2+94+90+x =91×7,解得x =4.故s 2=17[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=367.答案:367二、专项培优练(一)易错专练——不丢怨枉分1.设某总体是由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取6个个体,选取方法是从随机数表第1行的第3列数字开始从左到右依次选取两个数字,则选出来的第6个个体编号为________.1818 0792 4544 1716 5809 7983 8619 6206 7650 0310 5523 6405 0526 6238解析:由题意可得,选取的这6个个体分别为18,07,17,16,09,19,故选出的第6个个体编号为19.答案:192.已知一组正数x 1,x 2,x 3,x 4的方差s 2=14(x 21+x 22+x 23+x 24-16),则数据x 1+2,x 2+2,x 3+2,x 4+2的平均数为________.解析:设正数x 1,x 2,x 3,x 4的平均数为x ,则s 2=14[(x 1-x )2+(x 2-x )2+(x 3-x )2+(x 4-x )2],得s 2=14(x 21+x 22+x 23+x 24)-x 2,又已知s 2=14(x 21+x 22+x 23+x 24-16)=14(x 21+x 22+x 23+x 24)-4,所以x 2=4,所以x =2,故14[(x 1+2)+(x 2+2)+(x 3+2)+(x 4+2)]=x +2=4.答案:4(二)交汇专练——融会巧迁移3.[与概率的交汇]如图是某位篮球运动员8场比赛得分的茎叶图,其中一个数据染上污渍用x 代替,那么这位运动员这8场比赛的得分平均数不小于得分中位数的概率为( )A.15 B.310 C.35D.710解析:选B 由茎叶图可知0≤x ≤9且x ∈N ,中位数是17+10+x 2=27+x2,这位运动员这8场比赛的得分平均数为18(7+8+7+9+x +3+1+10×4+20×2)=18(x +115),由18(x+115)≥27+x2,得3x ≤7,即x =0,1,2,所以这位运动员这8场比赛的得分平均数不小于得分中位数的概率为310.4.[与数列、不等式的交汇]我市某高中从高三年级甲、乙两个班中各选出7名学生参加2018年全国高中数学联赛(河南初赛),他们取得的成绩(满分140分)的茎叶图如图所示,其中甲班学生成绩的中位数是81,乙班学生成绩的平均数是86,若正实数a ,b 满足a ,G ,b 成等差数列且x ,G ,y 成等比数列,则1a +4b的最小值为( )A.49B.2C.94D.9解析:选C 由甲班学生成绩的中位数是81,可知81为甲班7名学生的成绩按从小到大的顺序排列的第4个数,故x =1.由乙班学生成绩的平均数为86,可得(-10)+(-6)+(-4)+(y -6)+5+7+10=0,解得y =4.由x ,G ,y 成等比数列,可得G 2=xy =4,由正实数a ,b 满足a ,G ,b 成等差数列,可得G =2,a +b =2G =4,所以1a +4b =⎝⎛⎭⎫1a +4b ×⎝⎛⎭⎫a 4+b 4=14⎝⎛⎭⎫1+b a +4a b +4≥14×(5+4)=94(当且仅当b =2a 时取等号).故1a +4b 的最小值为94,选C.(三)素养专练——学会更学通5.[数据分析]PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物.如图是根据环保部门某日早6点至晚9点在A 县、B 县两个地区附近的PM2.5监测点统计的数据(单位:毫克/立方米)列出的茎叶图,A 县、B 县两个地区浓度的方差较小的是( )A.A 县B.B 县C.A 县、B 县两个地区相等D.无法确定解析:选A 根据茎叶图中的数据可知,A 县的数据都集中在0.05和0.08之间,数据分布比较稳定,而B 县的数据分布比较分散,不如A 县数据集中,所以A 县的方差较小.6.[数学运算、数据分析]有A ,B ,C ,D ,E 五位工人参加技能竞赛培训.现分别从A ,B 二人在培训期间参加的若干次预赛成绩中随机抽取8次.用茎叶图表示这两组数据:(1)A ,B 二人预赛成绩的中位数分别是多少?(2)现要从A ,B 中选派一人参加技能竞赛,从平均状况和方差的角度考虑,你认为派哪位工人参加合适?请说明理由.(3)若从参加培训的5位工人中选2人参加技能竞赛,求A ,B 二人中至少有一人参加技能竞赛的概率.解:(1)A 的中位数是83+852=84,B 的中位数是84+822=83.(2)派B 参加比较合适.理由如下:x B =18(78+79+81+82+84+88+93+95)=85,x A =18(75+80+80+83+85+90+92+95)=85,s 2B =18[(78-85)2+(79-85)2+(81-85)2+(82-85)2+(84-85)2+(88-85)2+(93-85)2+(95-85)2]=35.5,s 2A =18[(75-85)2+(80-85)2+(80-85)2+(83-85)2+(85-85)2+(90-85)2+(92-85)2+(95-85)2]=41,因为x A =x B ,但s 2B < s 2A ,说明B 稳定,派B 参加比较合适.(3)A ,B 都没参加技能竞赛的概率P =C 23C 25=310,故A ,B 二人中至少有一人参加技能竞赛的概率为1-310=710.7.[数据分析、数学建模]今年西南一地区遭遇严重干旱,某乡计划向上级申请支援,为上报需水量,乡长事先抽样调查了100户村民的月均用水量,得到这100户村民月均用水量的频率分布表如表:(月均用水量的单位:吨)(1)请完成该频率分布表,并画出相对应的频率分布直方图和频率分布折线图; (2)估计样本的中位数是多少;(3)已知上级将按每户月均用水量向该乡调水,若该乡共有1 200户,请估计上级支援该乡的月调水量是多少吨?解:(1)频率分布表与相应的频率分布直方图和频率分布折线图如下:。
2013年高考第一轮复习数学北师(江西版)理第十章10.6 随机抽样
与用样本估计总体练习
一、选择题
1.某校高三年级有男生500人,女生400人.为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查,这种抽样方法是( ).A.简单随机抽样 B.抽签法
C.随机数法 D.分层抽样
2.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( ).
A.91.5和91.5 B.91.5和92
C.91和91.5 D.92和92
3.一段高速公路有300盏太阳能标志灯,其中进口的有30盏,联合研制的有75盏,国产的有195盏,为了掌握每个标志灯的使用情况,要从中抽取一个容量为20的样本,若采用分层抽样的方法,抽取的进口标志灯的数量为( ).
A.2 B.3 C.5 D.13
4.某棉纺厂为了了解一批棉花的质量,从中随机抽测了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率分布直方图如图所示,则在抽测的100根中,纤维的长度小于20 mm的棉花根数为( ).
A.20 B.30 C.40 D.50
5.某服装加工厂某月生产A,B,C三种产品共4 000件,为了保证产品质量,进行抽样检验,根据分层抽样的结果
由于不小心,表格中A产品的样本容量比C产品的样本容量多10,根据以上信息,可得C产品数量是( ).A.80 B.800 C.90 D.900
6.如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为x A和x B,样本标准差分别为s A和s B,则( ).
A.x A>x B,s A>s B
B.x A<x B,s A>s B
C.x A>x B,s A<s B
D.x A<x B,s A<s B
二、填空题
7.(2011天津高考,理9)一支田径队有男运动员48人,女运动员36人.若用分层抽样的方法从该队的全体运动员中抽取一个容量为21的样本,则抽取男运动员的人数为__________.
8.(2011浙江高考,文13)某中学为了解学生数学课程的学习情况,在3 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测,这3 000名学生在该次数学考试中成绩小于60分的学生数是________.
9.某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本.用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是__________.若用分层抽样方法,则40岁以下年龄段应抽取__________人.
三、解答题
10.为了对某课题进行研究,用分层抽样方法从三所高校A,B,C的相关人员中,抽取
(1)求x,y;
(2)若从高校B,C抽取的人中选2人作专题发言,求这2人都来自高校C的概率.
11.(2011广东高考,文17)在某次测验中,有6位同学的平均成绩为75分,用x n表示编号为n(n=1,2
(1)求第66
(2)从前5位同学中,随机地选2位同学,求恰有1位同学成绩在区间(68,75)中的概率.
12.某校从参加高三模拟考试的学生中随机抽取60名学生,将其数学成绩(均为整数)分成六段[90,100),[100,110),…,[140,150)后得到如下部分频率分布直方图.观察图形的信息,回答下列问题:
(1)求分数在[120,130)内的频率,并补全这个频率分布直方图;
(2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试的平均分;
(3)用分层抽样的方法在分数段为[110,130)的学生中抽取一个容量为6的样本,将该样本看成一个总体,从中任取2人,求至多有1人在分数段[120,130)内的概率.
参考答案
一、选择题
1.D 解析:因为总体是由差异明显的两部分组成,所以选用的是分层抽样.
2.A 解析:按照从小到大的顺序排列为87,89,90,91,92,93,94,96.
∵有8个数据,∴中位数是中间两个的平均数:91+922
=91.5, 平均数:
87+89+90+91+92+93+94+968
=91.5. 3.A 解析:抽取的样本容量与总体中的个体数的比值为20300=115
, 所以抽取的样本中,进口的标志灯抽取的数量为30×115
=2. 4.B 解析:由频率分布直方图观察得棉花纤维长度小于20 mm 的根数为(0.01+0.01+0.04)×5×100=30.
5.B 解析:设C 产品数量为x .由B 种产品样本容量∶产品数量=1∶10知拿出了110
的产品做样本,
又∵A 产品的数量比C 多100件,由x +2 300+(x +100)=4 000得C 产品数量为800.
6.B 解析:x A =2.5+10+5+7.5+2.5+106=37.56
, x B =15+10+12.5+10+12.5+106
=706
, 显然x A <x B ,s 是标准差,反映的是数据的波动程度,可以看出A 图中数据的波动较大,而B 图则较为有规律,而且波动幅度较小,所以B 的稳定性好,稳定性好的标准差小,选B.
二、填空题
7.12 解析:设抽取男运动员人数为n ,则女运动员人数21-n .由分层抽样知:
n 48=21-n 36
,∴n =12. 8.600 解析:由频率分布直方图易得,成绩低于60分的频率为0.002×10+0.006×10+0.012×10=0.2,故3 000名学生中成绩低于60分的学生数为3 000×0.2=600.
9.37 20 解析:由分组可知,抽号的间隔为5,又因为第5组抽出的号码为22,所以第6组抽出的号码为27,第7组抽出的号码为32,第8组抽出的号码为37.
40岁以下的年龄段的职工数为200×0.5=100,则应抽取的人数为40200
×100=20(人). 三、解答题
10.解:(1)由题意可得x 18=236=y 54
,所以x =1,y =3. (2)记从高校B 抽取的2人为b 1,b 2,从高校C 抽取的3人为c 1,c 2,c 3,则从高校B ,C 抽取的5人中选2人作专题发言的基本事件有(b 1,b 2),(b 1,c 1),(b 1,c 2),(b 1,c 3),(b 2,c 1),(b 2,c 2),(b 2,c 3),(c 1,c 2),(c 1,c 3),(c 2,c 3)共10种.
设选中的2人都来自高校C 的事件为X ,则X 包含的基本事件有(c 1,c 2),(c 1,c 3),(c 2,
c 3)共3种.因此P (X )=310
. 故选中的2人都来自高校C 的概率为310
. 11.解:(1)由题意知x 1+x 2+x 3+x 4+x 5+x 6==75×6=450,
∴x 6=450-(70+76+72+70+72)=90.
∴s 2=(70-75)2+(76-75)2+…+(90-75)26
=49. ∴s =7.
(2)由题意知本题是一个古典概型,试验发生包含的事件是从5位同学中选2个,共有10种结果,满足条件的事件是恰有1位成绩在区间(68,75)中,共有4种结果,根据古典概型得
到P =410
=0.4. 12.解:(1)分数在[120,130)内的频率为1-(0.1+0.15+0.15+0.25+0.05)=1-0.7
=0.3,频率组距=0.310
=0.03,补全后的直方图如下.
(2)平均分为 x =95×0.1+105×0.15+115×0.15+125×0.3+135×0.25+145×0.05=121.
(3)由题意,[110,120)分数段的人数为60×0.15=9,[120,130)分数段的人数为60×0.3=18.
∵用分层抽样的方法在分数段为[110,130)的学生中抽取一个容量为6的样本,
∴需在[110,120)分数段内抽取2人,并分别记为m ,n ;在[120,130)分数段内抽取4人,并分别记为a ,b ,c ,d .
设“从样本中任取2人,至多有1人在分数段[120,130)内”为事件A ,则基本事件共有:(m ,n ),(m ,a ),…,(m ,d ),(n ,a ),…,(n ,d ),(a ,b ),…,(c ,d )共15种,
则事件A 包含的基本事件有:(m ,n ),(m ,a ),(m ,b ),(m ,c ),(m ,d ),(n ,a ),(n ,b ),(n ,c ),(n ,d )共9种.
∴P (A )=915=35
.。