【优化方案】高考数学理(江苏专用)一轮总复习练习:9.1抽样方法、总体分布的估计(含答案解析)
- 格式:doc
- 大小:297.50 KB
- 文档页数:8
(江苏专版)2019届高考数学一轮复习第九章概率、统计与算法第1讲抽样方法、总体分布的估计分层演练直击高考文编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望((江苏专版)2019届高考数学一轮复习第九章概率、统计与算法第1讲抽样方法、总体分布的估计分层演练直击高考文)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为(江苏专版)2019届高考数学一轮复习第九章概率、统计与算法第1讲抽样方法、总体分布的估计分层演练直击高考文的全部内容。
第1讲抽样方法、总体分布的估计1.(2018·南通调研测试)某中学共有学生2 800人,其中高一年级970人,高二年级930人,高三年级900人,现采用分层抽样的方法,抽取280人进行体育达标检测,则抽取高二年级学生人数为________.[解析] 设高二年级抽取n人,则错误!=错误!,故n=93人.[答案] 932.某校数学教研组为了解学生学习数学的情况,采用分层抽样的方法从高一600人、高二780人、高三n人中,抽取35人进行问卷调查.已知高二被抽取的人数为13,则n=________.[解析]由已知条件,抽样比为13780=错误!,从而错误!=错误!,解得n=720。
[答案] 7203。
对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是________.[解析]由题意知各数为12,15,20,22,23,23,31,32,34,34,38,39,45,45,45,47,47,48,48,49,50,50,51,51,54,57,59,61,67,68,中位数是46,众数是45,最大数为68,最小数为12,极差为68-12=56。
第77课 抽样方法与总体分布的估计一、考纲要求1.初步感受抽样统计的重要性和必要性;2.会用简单随机抽样法、系统抽样法、分层抽样法从总体中抽取样本;3.会列样本频率分布表,会画频率分布直方图、折线图、茎叶图,体会它们的特点,会用样本的频率分布估计总体分布的规律. 二、基础梳理 回顾要求1、阅读必修三第43—64页,完成以下任务:(1) 了解统计的基本思想是什么,明白抽样是统计分析的基础。
(2) 圈画简单随机抽样,系统抽样,分层抽样定义的关键词,并了解他们的具体步骤。
(3) 能结合书本明白简单随机抽样,系统抽样,分层抽样的特点和联系。
(4) 会利用频率分布直方图、茎叶图对总体进行估计,尤其是频率分布直方图的应用更是高考考查的热点.2、第50页的思考:出现这种身高差,你觉得他们是采用了哪一种抽样方法?3、 在教材上的空白处做以下题目:第49页的练习第2、第4题 要点解析1.统计学的基本思想方法是用样本估计总体,即通过从总体中抽取一个样本,根据样本的情况去估计总体的相应情况;2.系统抽样当n N 是整数时,取n N k ;当nN不是整数时,从总体中剔除一些个体,使剩下的总体中个体的个数N ′能被n 整除,分层抽样是将总体中的个体按不同的特点分成层次比较分明的几个部分,然后按各个部分在总体中所占的比实施抽样;3.总体中的个体性质相似,无明显层次;总体容量较小,尤其是样本容量较小用简单随机抽样;系统抽样适用于元素个数很多且均衡的总体;分层抽样适用于总体由差异明显的几部分组成的情况;4.作频率分布直方图的步骤(1)求极差;(2)确定组距和组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图.三、诊断练习1、教学处理:课前由学生自主完成4道小题,并要求将解题过程扼要地写在学习笔记栏.课前抽查批阅部分同学的解答,了解学生的思路及主要错误.点评时呈现典型错误,以纠正学生错误的认识.2、诊断练习点评题1:对总数为N 的一批零件抽取一个容量为30的样本,若每个零件被抽到的概率为0.25,则N 的值 为 .【分析与点评】简单随机抽样是在特定总体中抽取样本,总体中每一个个体被抽取的可能性是等同的,如果用从个体数为N 的总体中抽取一个容量为n 的样本,那么每个个体被抽取的可能性等于n N,易得答案为120.题2.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为________.【分析与点评】由系统抽样的特点知:抽取号码的间隔为96032=30,抽取的号码依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n 项,显然有729=459+(n -1)×30,解得n =10.所以做问卷B 的有10人.题3.某中学为了解学生数学课程的学习情况,在3 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测,这3 000名学生在该次数学考试中成绩小于60分的学生数是________.答案为:600解析 由直方图易得数学考试中成绩小于60分的频率为(0.002+0.006+0.012)×10=0.2,所以所求分数小于60分的学生数为3 000×0.2=600. 3、要点归纳(1)在三种抽样方法中,简单随机抽样是最基本、最简单的抽样方法,其他两种抽样方法都是建立在它的基础之上的.(2)三种抽样方法各有特点和适用范围,在抽样实践中要根据具体情况选取相应的抽样方法.四、范例导析例1、下列问题中,采用怎样的抽样方法较为合理?(1)从10台冰箱中抽取3台进行质量检查;(2)某电影院有32排座位,每排有40个座位,座位号为1~40。
1.简单随机抽样(1)抽取方式:逐个不放回抽取;(2)特点:每个个体被抽到的概率相等;(3)常用方法:抽签法和随机数表法.2.分层抽样(1)在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.(2)分层抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.3.系统抽样的步骤(1)采用随机的方式将总体中的N个个体编号;(2)将编号按间隔k分段,当错误!是整数时,取k=错误!;当错误!不是整数时,从总体中剔除一些个体,使剩下的总体中个体的个数N′能被n整除,这时取k=错误!,并将剩下的总体重新编号;(3)在第一段中用简单随机抽样确定起始的个体编号l;(4)按照一定的规则抽取样本,通常将编号为l,l+k,l+2k,…,l+(n—1)k的个体抽出.4.作频率分布直方图的步骤(1)求全距;(2)决定组距与组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图.5.茎叶图的优点茎叶图的优点是不但可以保留所有信息,而且可以随时记录,这对数据的记录和表示都能带来方便.[提醒] 茎叶图中茎是指中间的一列数,叶是从茎的旁边生长出来的数.6.样本的数字特征(1)众数、中位数、平均数(2)标准差、方差1标准差:样本数据到平均数的一种平均距离,一般用s表示,s=错误!.2方差:标准差的平方s2s2=错误![(x1—错误!)2+(x2—错误!)2+…+(x n—错误!)2],其中x i(i=1,2,3,…,n)是样本数据,n是样本容量,错误!是样本平均数.[小题体验]1.为调查某高校学生对“一带一路”政策的了解情况,现采用分层抽样的方法抽取一个容量为500的样本.其中大一年级抽取200人,大二年级抽取100人.若其他年级共有学生3000人,则该校学生总人数是________.解析:设该校学生总人数为n,则1—错误!=错误!,解得n=7 500.答案:7 5002.某校为了了解教科研工作开展状况与教师年龄之间的关系,将该校不小于35岁的80名教师按年龄分组,分组区间为[35,40),[40,45),[45,50),[50,55),[55,60],由此得到频率分布直方图如图,则这80名教师中年龄小于45岁的有________人.解析:由频率分布直方图可知45岁以下的教师的频率为5×(0.040+0.080)=0.6,所以共有80×0.6=48(人).答案:483.已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________.解析:5个数的平均数错误!=错误!=5.1,所以它们的方差s2=错误![(4.7—5.1)2+(4.8—5.1)2+(5.1—5.1)2+(5.4—5.1)2+(5.5—5.1)2]=0.1.答案:0.11.简单随机抽样中易忽视样本是从总体中逐个抽取,是不放回抽样,且每个个体被抽到的概率相等.2.系统抽样中,易忽视抽取的样本数也就是分段的段数,当错误!不是整数时,注意剔除,剔除的个体是随机的,各段入样的个体编号成等差数列.3.在绘制茎叶图时,易遗漏重复出现的数据,重复出现的数据要重复记录,同时不要混淆茎叶图中茎与叶的含义.[小题纠偏]1.已知某商场新进3000袋奶粉,为检查其三聚氰胺是否超标,现采用系统抽样的方法从中抽取150袋检查,若第一组抽出的号码是11,则第六十一组抽出的号码为________.解析:每组袋数:d=错误!=20,由题意知这些号码是以11为首项,20为公差的等差数列.a61=11+60×20=1211.答案:12112.如图是甲、乙两名篮球运动员在五场比赛中所得分数的茎叶图,则在这五场比赛中得分较为稳定(方差较小)的那名运动员得分的方差为________.解析:由茎叶图知,得分较为稳定的那名运动员是乙,他在五场比赛中得分分别为8,9,10,13,15,所以错误!乙=错误!=11,s错误!=错误!×[(8—11)2+(9—11)2+()2+(13—11)2+(15—11)2]=6.8.答案:6.8错误!错误![题组练透]1.总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为________.7816 657208026314070243699728 01983204923449358200 36234869 6938 7481解析:由随机数表法的随机抽样的过程可知选出的5个个体是08,02,14,07,01,所以第5个个体的编号是01.答案:012.采用系统抽样方法从1000人中抽取50人做问卷调查,将他们随机编号1,2,…,1000.适当分组后在第一组采用简单随机抽样的方法抽到的号码为8.若抽到的50人中,编号落入区间[1,400]的人做问卷A,编号落入区间[401,750]的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷C 的人数为________.解析:根据系统抽样的特点可知,所有做问卷调查的人的编号构成首项为8,公差d=错误!=20的等差数列{a n},所以通项公式a n=8+20(n—1)=20n—12,令751≤20n—12≤1000,得错误!≤n≤错误!,又因为n∈N*,所以39≤n≤50,所以做问卷C的共有12人.答案:123.(2019·南京调研)某高校甲、乙、丙、丁四个专业分别有150,150,400,300名学生.为了解学生的就业倾向,用分层抽样的方法从该校这四个专业中抽取40名学生进行调查,则应从丙专业抽取的学生人数为________.解析:由题意得,应从丙专业抽取的学生人数为40×错误!=16.答案:164.某企业三月中旬生产A、B、C三种产品共3000件,根据分层抽样的结果,企业统计员制作了如下的统计表格:由于不小心,表格中A、C产品的有关数据已被污染看不清楚,统计员记得A产品的样本容量比C产品的样本容量多10,根据以上信息,可得C的产品数量是________件.解析:设样本容量为x,则错误!×1300=130,所以x=300.所以A产品和C产品在样本中共有300—130=170(件).设C产品的样本容量为y,则y+y+10=170,所以y=80.所以C产品的数量为错误!×80=800(件).答案:800[谨记通法]三种抽样方法的比较分层抽样将总体分成几层,分层按比例进行抽取各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成错误!错误![典例引领]1.(2019·启东模拟)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x +y的值为________.解析:由茎叶图知,甲组的中位数为65,当乙组的中位数也为65时,y=5,此时乙组的平均数为错误!=66,所以x=66×5—(56+65+62+74+70)=3,所以x+y=8.答案:82.(2018·海安质量测试)某校高一年级共有800名学生,根据他们参加某项体育测试的成绩得到了如图所示的频率分布直方图,则成绩不低于80分的学生人数为________.解析:由题设中提供的频率分布直方图可以看出:不低于80分的学生人数为(0.02+0.01)×10×800=240.答案:2403.(2018·苏州测试)为了了解某校今年准备报考飞行员的学生的体重情况,将所得的数据整理后,其频率分布直方图如图所示,已知图中从左到右的前3个小组的频率之比为1∶2∶3,第2小组的频数为12,则报考飞行员的学生人数为________.解析:设报考飞行员的学生人数为x,则错误!=(1—0.037×5—0.013×5)×错误!,解得x=48,即报考飞行员的学生人数为48.答案:48[由题悟法]1.茎叶图中的3个关注点(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一.(2)重复出现的数据要重复记录,不能遗漏.(3)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心”下移者平均数较大,数据集中者方差较小.2.由频率分布直方图进行相关计算时,需掌握的2个关系式(1)错误!×组距=频率.(2)错误!=频率,此关系式的变形为错误!=样本容量,样本容量×频率=频数.[即时应用]1.(2018·苏北四市期末)某次比赛甲得分的茎叶图如图所示,若去掉一个最高分,去掉一个最低分,则剩下4个分数的方差为________.错误!错误!解析:剩下的4个分数是42,44,46,52,则其平均数是46,故方差为错误!×(16+4+0+36)=14.答案:142.随着社会的发展,食品安全问题渐渐成为社会关注的热点,为了提高学生的食品安全意识,某学校组织全校学生参加食品安全知识竞赛,成绩的频率分布直方图如图所示,数据的分组依次为[20,40),[40,60),[60,80),[80,100],若该校的学生总人数为3000,则成绩不超过60分的学生人数大约为________.解析:由频率分布直方图知,成绩不超过60分的学生的频率为(0.005+0.01)×20=0.3,所以成绩不超过60分的学生人数大约为0.3×3000=900.答案:900错误!错误![锁定考向]样本的数字特征常与频率分布直方图、茎叶图等知识交汇命题.常见的命题角度有:(1)样本的数字特征与直方图交汇;(2)样本的数字特征与茎叶图交汇;(3)样本的数字特征与优化决策问题.[题点全练]角度一:样本的数字特征与直方图交汇1.(2019·苏州调研)样本容量为100的频率分布直方图如图所示,根据样本频率分布直方图估计平均数为________ .解析:平均数为错误!×(6×10+20×12+40×14+24×16+10×18)=14.24.答案:14.24角度二:样本的数字特征与茎叶图交汇2.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示.则7个剩余分数的方差为________.解析:根据茎叶图,去掉1个最低分87,1个最高分99,则错误![87+94+90+91+90+(90+x)+91]=91,所以x=4.所以s2=错误![(87—91)2+(94—91)2+(90—91)2+(91—91)2+(90—91)2+(94—91)2+(91—91)2]=错误!.答案:错误!角度三:样本的数字特征与优化决策问题3.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):甲108999乙1010799解析:因为错误!甲=错误!乙=9,s错误!=错误!×[(9—10)2+(9—8)2+(9—9)2+(9—9)2+(9—9)2]=错误!,s错误!=错误!×[(9—10)2+(9—10)2+(9—7)2+(9—9)2+(9—9)2]=错误!>s错误!,故甲更稳定.答案:甲[通法在握]1.利用频率分布直方图估计样本的数字特征的方法(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数值.(2)平均数:平均数的估计值等于每个小矩形的面积乘以矩形底边中点横坐标之和.(3)众数:最高的矩形的中点的横坐标.2.利用样本的数字特征解决优化决策问题的依据(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.[演练冲关]1.(2019·常州调研)用茎叶图记录甲、乙两名同学高三前5次数学测试的成绩,如图.他们在分析对比成绩变化时,发现乙同学成绩的一个数字看不清楚了.若已知乙的平均成绩低于甲的平均成绩,则看不清楚的数字为________.解析:甲的平均成绩为错误!×(99+100+101+102+103)=101,设看不清楚的数字为x,则由题意得错误!×(93+94+97+110+110+x)<101,解得x<1.因为x≥0,x∈N,所以x=0,即看不清楚的数字为0.答案:02.为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为________.解析:不妨设样本数据为x1,x2,x3,x4,x5,且x1<x2<x3<x4<x5,则由样本方差为4,知(x1—7)2+(x2—7)2+(x3—7)2+(x4—7)2+(x5—7)2=20.若5个整数的平方和为20,则这5个整数的平方只能在0,1,4,9,16中选取(每个数最多出现2次),当这5个整数的平方中最大的数为16时,分析可知,总不满足和为20;当这5个整数的平方中最大的数为9时,0,1,1,9,9这组数满足要求,此时对应的样本数据为x1=4,x2=6,x3=7,x4=8,x5=10;当这5个整数的平方中最大的数不超过4时,总不满足要求,因此不存在满足条件的另一组数据.答案:10一抓基础,多练小题做到眼疾手快1.(2019·南通中学高三学情调研)一汽车厂生产A,B,C三类轿车,每类轿车均有舒适型和标准型两种型号,某月的产量如下表(单位:辆):轿车A轿车B轿车C舒适型100150z标准型300450600按类用分层抽样的方法在这个月生产的轿车中抽取50辆,其中有A类轿车10辆,则z的值为________.解析:由题意知错误!=错误!,解得z=400.答案:4002.(2018·泰州调研)某校在高三年级的1000名学生中随机抽出100名学生的数学成绩作为样本进行分析,得到样本频率分布直方图如图所示,则估计该校高三学生中数学成绩在[110,140)之间的人数为________.解析:由样本频率分布直方图知该校高三学生中数学成绩在[110,140)之间的频率为(0.02+0.026+0.02)×10=0.66,所以估计该校高三学生中数学成绩在[110,140)之间的人数为1000×0.66=660.答案:6603.某校高三年级500名学生中,血型为O型的有200人,A型的有125人,B型的有125人,AB型的有50人.为研究血型与色弱之间的关系,现用分层抽样的方法从这500名学生中抽取一个容量为60的样本,则应抽取________名血型为AB的学生.解析:在整个抽样过程中,每个个体被抽到的概率为错误!=错误!,所以血型为AB的学生应抽取的人数为50×错误!=6.答案:64.已知一组数据:87,x,90,89,93的平均数为90,则该组数据的方差为________.解析:由题意知错误!×(87+x+90+89+93)=90,解得x=91,所以方差s2=错误!×[(87—90)2+(91—90)2+(90—90)2+(89—90)2+(93—90)2]=4.答案:45.(2019·启东第一中学月考)某厂共有1000名员工,准备选择50人参加技术评估,现将这1000名员工编号为1到1000,准备用系统抽样的方法抽取.已知随机抽取到的员工最小的编号是15,那么抽取到的员工最大的编号是________.解析:样本间隔为1000÷50=20,∵随机抽取到的最小的编号是15,∴在抽取到的员工中最大的编号是15+49×20=995.答案:9956.(2018·苏州期末)若一组样本数据9,8,x,10,11的平均数为10,则该组样本数据的方差为________.解析:由错误!=10,得x=12,故方差s2=错误!=2.答案:2二保高考,全练题型做到高考达标1.(2018·通州期末)如图所示的茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分),已知甲组数据的中位数为17,则x的值为________.答案:72.(2019·如皋检测)从编号为01,02,…,50的50个产品中用系统抽样的方法抽取一个样本,已知样本中的前两个编号分别为03,08(编号按从小到大的顺序排列),则样本中最大的编号是________.解析:由题意知,抽样间隔是5,∴样本中最大的编号是3+5×9=48.答案:483.(2018·南京学情调研)为了解某一段公路汽车通过时的车速情况,现随机抽测了通过这段公路的200辆汽车的时速,所得数据均在区间[40,80]中,其频率分布直方图如图所示,则在抽测的200辆汽车中,时速在区间[40,60)内的汽车有________辆.解析:根据频率分布直方图得,时速在区间[40,60)内的频率为(0.01+0.03)×10=0.4,故时速在区间[40,60)内的汽车有0.4×200=80(辆).答案:804.用分层抽样的方法从某高中学生中抽取一个容量为45的样本,其中高一年级抽20人,高三年级抽10人,已知该校高二年级共有学生300人,则该校学生的总人数为________.解析:样本中高二年级抽45—20—10=15(人),设该校学生的总人数为n,则错误!=错误!,所以n=900.答案:9005.(2018·扬州期末)某学校从高三年级共800名男生中随机抽取50名测量身高.根据测量结果可知被测学生身高全部介于155cm和195cm之间,将测量结果按如下方式分成八组:第一组[155,160),第二组[160,165),…,第八组[190,195].按上述分组方式得到的频率分布直方图的一部分如图所示,估计这所学校高三年级全体男生身高在180 cm以上(含180 cm)的人数为________.解析:这所学校高三年级全体男生身高在180 cm以上(含180 cm)的频率为1—(0.008+0.016+0.04+0.04+0.06)×5=1—0.82=0.18,所以全体男生身高在180 cm以上(含180 cm)的人数为0.18×800=144.答案:1446.(2019·海门中学检测)已知数据x1,x2,…,x10的均值为2,标准差为s,又知数据3x1+2,3x2+2,…,3x10+2的方差为27,则s=________.解析:∵数据x1,x2,…,x10的均值为2,标准差为s,数据3x1+2,3x2+2,…,3x10+2的方差为27,∴9s2=27,解得s=错误!.答案:错误!7.已知x是1,2,3,x,5,6,7这七个数据的中位数且1,2,x2,—y这四个数据的平均数为1,则y—错误!的最小值为________.解析:由题意1+2+x2—y=4,所以y=x2—1.由中位数定义知,3≤x≤5,所以y—错误!=x2—1—错误!.当x∈[3,5]时,函数y=x2—1与y=—错误!均为增函数,所以y=x2—1—错误!在[3,5]上为增函数,所以错误!min=8—错误!=错误!.答案:错误!8.(2018·南通调研)为了了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校400名授课教师中抽取20名,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示,如图所示.据此可估计上学期该校400名教师中,使用多媒体进行教学的次数在[16,30)内的人数为________.解析:由茎叶图可知,在20名教师中,上学期使用多媒体进行教学的次数在[16,30)内的人数为8,据此可以估计400名教师中,使用多媒体进行教学的次数在[16,30)内的人数为400×错误!=160.答案:1609.某初级中学共有学生2000名,各年级男、女生人数如下表:初一年级初二年级初三年级女生373x y男生377370z已知在全校学生中随机抽取1名,抽到初二年级女生的概率是0.19.(1)求x的值;(2)现用分层抽样的方法在全校抽取48名学生,问应在初三年级抽取多少名?解:(1)因为错误!=0.19,所以x=380.(2)初三年级人数为y+z=2000—(373+377+380+370)=500,现用分层抽样的方法在全校抽取48名学生,应在初三年级抽取的人数为:错误!×500=12(名).10.某班100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a的值.(2)若在同一组数据中,将该组区间的中点值作为这组数据的平均分,根据频率分布直方图,估计这100名学生语文成绩的平均分.(3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如表所示,求数学成绩在[50,90)之外的人数.分数段[50,60)[60,70)[70,80)[80,90)x∶y1∶12∶13∶44∶5解:(1)由频率分布直方图知(0.04+0.03+0.02+2a)×10=1,因此a=0.005.(2)估计这次成绩的平均分错误!=55×0.05+65×0.4+75×0.3+85×0.2+95×0.05=73.所以这100名学生语文成绩的平均分为73分.(3)分别求出语文成绩在分数段[50,60),[60,70),[70,80),[80,90)的人数依次为0.05×100=5,0.4×100=40,0.3×100=30,0.2×100=20.所以数学成绩分数段在[50,60),[60,70),[70,80),[80,90)的人数依次为5,20,40,25.所以数学成绩在[50,90)之外的人数有100—(5+20+40+25)=10(人).三上台阶,自主选做志在冲刺名校1.(2018·苏州测试)已知等差数列{a n}的公差为d,若a1,a2,a3,a4,a5的方差为8,则d =________.解析:因为数列{a n}为等差数列,所以a1,a2,a3,a4,a5的平均数为a3,所以方差为错误![(—2d)2+(—d)2+0+d2+(2d)2]=2d2=8,解得d=±2.答案:±22.一组数据是19,20,x,43,已知这组数据的平均数是整数,且24<x<28,则这组数据的方差为________.解析:因为错误!(19+20+x+43)=错误!为整数,且24<x<28,所以x=26,所以这组数据的平均数为错误!=27,方差为错误![(19—27)2+(20—27)2+(26—27)2+(43—27)2]=错误!(64+49+1+256)=错误!×370=92.5.答案:92.53.(2017·北京高考)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等,试估计总体中男生和女生人数的比例.解:(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,所以样本中分数小于70的频率为1—0.6=0.4.所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4.(2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9,分数在区间[40,50)内的人数为100—100×0.9—5=5.所以总体中分数在区间[40,50)内的人数估计为400×错误!=20.(3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60,所以样本中分数不小于70的男生人数为60×错误!=30.所以样本中的男生人数为30×2=60,女生人数为100—60=40,男生和女生人数的比例为60∶40=3∶2.所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2.。
1.简单随机抽样(1)定义:一般地,设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N ),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样. (2)最常用的简单随机抽样方法有两种——抽签法和随机数法. 2.系统抽样的步骤一般地,假设要从容量为N 的总体中抽取容量为n 的样本. (1)先将总体的N 个个体编号;(2)确定分段间隔k ,对编号进行分段.当N n (n 是样本容量)是整数时,取k =Nn ;(3)在第1段用简单随机抽样确定第一个个体编号l (l ≤k );(4)按照一定的规则抽取样本.通常是将l 加上间隔k 得到第2个个体编号(l +k ),再加k 得到第3个个体编号(l +2k ),依次进行下去,直到获取整个样本. 3.分层抽样(1)定义:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样. (2)分层抽样的应用范围:当总体由差异明显的几个部分组成时,往往选用分层抽样的方法. 【思考辨析】判断下列结论是否正确(请在括号中打“√”或“×”) (1)简单随机抽样是一种不放回抽样.( √ )(2)简单随机抽样每个个体被抽到的机会不一样,与先后有关.( × ) (3)抽签法中,先抽的人抽中的可能性大.( × ) (4)系统抽样在第1段抽样时采用简单随机抽样.( √ )(5)要从1 002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平.( × )(6)分层抽样中,每个个体被抽到的可能性与层数及分层有关.( × )1.(教材改编)某公司有员工500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人,为了调查员工的身体健康状况,从中抽取100名员工,则应在这三个年龄段分别抽取人数为( ) A .33,34,33 B .25,56,19 C .20,40,30 D .30,50,20答案 B解析 因为125∶280∶95=25∶56∶19, 所以抽取人数分别为25,56,19.2.(2015·四川)某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是( ) A .抽签法 B .系统抽样法 C .分层抽样法 D .随机数法 答案 C解析 根据年级不同产生差异及按人数比例抽取易知应为分层抽样法.3.(1)某学校为了了解2016年高考数学学科的考试成绩,在高考后对1 200名学生进行抽样调查,其中文科400名考生,理科600名考生,艺术和体育类考生共200名,从中抽取120名考生作为样本. (2)从10名家长中抽取3名参加座谈会.Ⅰ.简单随机抽样法 Ⅱ.系统抽样法 Ⅲ.分层抽样法 问题与方法配对正确的是( ) A .(1)Ⅲ,(2)Ⅰ B .(1)Ⅰ,(2)Ⅱ C .(1)Ⅱ,(2)Ⅲ D .(1)Ⅲ,(2)Ⅱ 答案 A解析 通过分析可知,对于(1),应采用分层抽样法,对于(2),应采用简单随机抽样法.4.将参加英语口语测试的1 000名学生编号为000,001,002,…,999,从中抽取一个容量为50的样本,按系统抽样的方法分为50组,如果第一组编号为000,001,002,…,019,且第一组随机抽取的编号为015,则抽取的第35个编号为________. 答案 695解析 由题意可知,第一组随机抽取的编号l =15,分段间隔数k =N n =1 00050=20,则抽取的第35个编号为a 35=15+(35-1)×20=695.5.某学校高一,高二,高三年级的学生人数之比为3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取________名学生.答案15解析设应从高二年级抽取x名学生,则x∶50=3∶10,解得x=15.题型一简单随机抽样例1(1)以下抽样方法是简单随机抽样的是()A.在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2709的为三等奖B.某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格C.某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解对学校机构改革的意见D.用抽签方法从10件产品中选取3件进行质量检验(2)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()A.08 B.07 C.02 D.01答案(1)D(2)D解析(1)选项A、B不是简单随机抽样,因为抽取的个体间的间隔是固定的;选项C不是简单随机抽样,因为总体的个体有明显的层次;选项D是简单随机抽样.(2)由题意知前5个个体的编号为08,02,14,07,01.思维升华应用简单随机抽样应注意的问题(1)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.(2)在使用随机数法时,如遇到三位数或四位数,可从选择的随机数表中的某行某列的数字计起,每三个或四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字舍去.(1)下列抽样试验中,适合用抽签法的有()A.从某厂生产的5 000件产品中抽取600件进行质量检验B.从某厂生产的两箱(每箱18件)产品中抽取6件进行质量检验C.从甲、乙两厂生产的两箱(每箱18件)产品中抽取6件进行质量检验D.从某厂生产的5 000件产品中抽取10件进行质量检验(2)下列抽取样本的方式不属于简单随机抽样的有________________.①从无限多个个体中抽取100个个体作为样本.②盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.③从20件玩具中一次性抽取3件进行质量检验.④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛. 答案 (1)B (2)①②③④解析 (1)A ,D 中的总体个体数较多,不适宜抽签法,C 中甲、乙两厂的产品质量有区别,也不适宜抽签法,故选B.(2)①不是简单随机抽样.②不是简单随机抽样.由于它是放回抽样.③不是简单随机抽样.因为这是“一次性”抽取,而不是“逐个”抽取.④不是简单随机抽样.因为指定个子最高的5名同学是56名中特指的,不存在随机性,不是等可能抽样. 题型二 系统抽样例2 (1)(2015·湖南)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是( ) A .3 B .4 C .5 D .6(2)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( ) A .11 B .12 C .13 D .14 答案 (1)B (2)B解析 (1)由题意知,将1~35号分成7组,每组5名运动员,成绩落在区间[139,151]的运动员共有4组,故由系统抽样法知,共抽取4名.故选B.(2)由84042=20,即每20人抽取1人,所以抽取编号落在区间[481,720]的人数为720-48020=24020=12.引申探究1.本例(2)中条件不变,若第三组抽得的号码为44,则在第八组中抽得的号码是________. 答案 144解析 在第八组中抽得的号码为(8-3)×20+44=144.2.本例(2)中条件不变,若在编号为[481,720]中抽取8人,则样本容量为________.答案 28解析 因为在编号[481,720]中共有720-480=240人,又在[481,720]中抽取8人,所以抽样比应为240∶8=30∶1,又因为单位职工共有840人,所以应抽取的样本容量为84030=28.思维升华 (1)系统抽样适用的条件是总体容量较大,样本容量也较大.(2)使用系统抽样时,若总体容量不能被样本容量整除,可以先从总体中随机地剔除几个个体,从而确定分段间隔.(3)起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便随之确定.(1)(2017·马鞍山月考)高三(1)班有学生52人,现将所有学生随机编号,用系统抽样方法,抽取一个容量为4的样本,已知5号、31号、44号学生在样本中,则样本中还有一个学生的编号是( ) A .8 B .13 C .15 D .18(2)(2016·烟台模拟)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为( ) A .7 B .9 C .10 D .15 答案 (1)D (2)C解析 (1)分段间隔为524=13,故还有一个学生的编号为5+13=18,故选D.(2)由系统抽样的特点知:抽取号码的间隔为96032=30,抽取的号码依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n 项,显然有729=459+(n -1)×30,解得n =10.所以做问卷B 的有10人. 题型三 分层抽样命题点1 求总体或样本容量例3 (1)(2016·东北三校联考)某工厂生产甲、乙、丙三种型号的产品,产品数量之比为3∶5∶7,现用分层抽样的方法抽出容量为n 的样本,其中甲种产品有18件,则样本容量n 等于( ) A .54 B .90 C .45 D .126(2)甲、乙两套设备生产的同类型产品共4 800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件. 答案 (1)B (2)1 800解析 (1)依题意得33+5+7×n =18,解得n =90,即样本容量为90.(2)分层抽样中各层的抽样比相同.样本中甲设备生产的产品有50件,则乙设备生产的产品有30件.在4 800件产品中,甲、乙设备生产的产品总数比为5∶3,所以乙设备生产的产品的总数为1 800件. 命题点2 求某层入样的个体数例4 (1) (2015·北京)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( )A.90 B .100 C .180 D .300(2)(2015·福建)某校高一年级有900名学生,其中女生400名.按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为________. 答案 (1)C (2)25解析 (1)由题意抽样比为3201 600=15,∴该样本中的老年教师人数为900×15=180.(2)由题意知,男生共有500名,根据分层抽样的特点,在容量为45的样本中男生应抽取人数为45×500900=25.思维升华 分层抽样问题类型及解题思路(1)求某层应抽个体数量:按该层所占总体的比例计算.(2)已知某层个体数量,求总体容量或反之:根据分层抽样就是按比例抽样,列比例式进行计算. (3)确定是否应用分层抽样:分层抽样适用于总体中个体差异较大的情况.(1)已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为________.(2)某公司共有1 000名员工,下设若干部门,现采用分层抽样方法,从全体员工中抽取一个样本容量为80的样本,已告知广告部门被抽取了4个员工,则广告部门的员工人数为________. 答案 (1)200,20 (2)50解析 (1)该地区中小学生总人数为 3 500+2 000+4 500=10 000,则样本容量为10 000×2%=200,其中抽取的高中生近视人数为2 000×2%×50%=20.(2)1 00080=x 4,x =50.五审图表找规律典例 (12分)某单位有2 000名职工,老年、中年、青年分布在管理、技术开发、营销、生产各部门中,如下表所示:人数 管理 技术开发 营销 生产 共计 老年 40 40 40 80 200 中年 80 120 160 240 600 青年 40 160 280 720 1 200 共计1603204801 0402 000(1)若要抽取40人调查身体状况,则应怎样抽样?(2)若要开一个25人的讨论单位发展与薪金调整方面的座谈会,则应怎样抽选出席人? (3)若要抽20人调查对广州亚运会举办情况的了解,则应怎样抽样?抽取40人调查身体状况↓(观察图表中的人数分类统计情况) 样本人群应受年龄影响↓(表中老、中、青分类清楚,人数确定) 要以老、中、青分层,用分层抽样 ↓要开一个25人的座谈会 ↓(讨论单位发展与薪金调整)样本人群应受管理、技术开发、营销、生产方面的影响 ↓(表中管理、技术开发、营销、生产分类清楚,人数确定) 要以管理、技术开发、营销、生产人员分层,用分层抽样 ↓要抽20人调查对广州亚运会举办情况的了解↓(可认为亚运会是大众体育盛会,一个单位人员对情况了解相当) 将单位人员看作一个整体 ↓(从表中数据看总人数为2 000) 人员较多,可采用系统抽样规范解答解 (1)按老年、中年、青年分层,用分层抽样法抽取,[1分] 抽取比例为402 000=150.[2分] 故老年人、中年人、青年人各抽取4人、12人、24人.[4分] (2)按管理、技术开发、营销、生产分层,用分层抽样法抽取,[5分] 抽取比例为252 000=180,[6分] 故管理、技术开发、营销、生产各部门抽取2人、4人、6人、13人.[8分] (3)用系统抽样,对全部2 000人随机编号,号码从0001~2000,每100号分为一组,从第一组中用简单随机抽样抽取一个号码,然后将这个号码分别加100,200,…,1 900,共20人组成一个样本.[12分]1.某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名.现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为( ) A .6 B .8 C .10 D .12答案 B解析 设样本容量为N ,则N ×3070=6,∴N =14,∴高二年级所抽学生人数为14×4070=8.2.(2017·榆林月考)打桥牌时,将洗好的扑克牌(52张)随机确定一张为起始牌后,开始按次序搬牌,对任何一家来说,都是从52张总体抽取一个13张的样本.这种抽样方法是( ) A .系统抽样 B .分层抽样C .简单随机抽样D .非以上三种抽样方法 答案 A解析 符合系统抽样的特点,故选A.3.对一个容量为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p 1,p 2,p 3,则( ) A .p 1=p 2<p 3 B .p 2=p 3<p 1 C .p 1=p 3<p 2 D .p 1=p 2=p 3 答案 D解析 由于三种抽样过程中,每个个体被抽到的概率都是相等的,因此p 1=p 2=p 3.4.为了解1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为( ) A .50 B .40 C .25 D .20 答案 C解析 由1 00040=25,可得分段的间隔为25.5.某初级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,…,270,使用系统抽样时,将学生统一随机编号为1,2,…,270,并将整个编号依次分为10段,如果抽得号码有下列四种情况: ①7,34,61,88,115,142,169,196,223,250 ②5,9,100,107,111,121,180,195,200,265 ③11,38,65,92,119,146,173,200,227,254 ④30,57,84,111,138,165,192,219,246,270 关于上述样本的下列结论中,正确的是( ) A .②、③都不能为系统抽样 B .②、④都不能为分层抽样 C .①、④都可能为系统抽样 D .①、③都可能为分层抽样 答案 D解析 因为③可以为系统抽样,所以选项A 不对;因为②可以为分层抽样,所以选项B 不对;因为④不为系统抽样,所以选项C 不对,故选D.6.将参加夏令营的600名学生编号为001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中的人数依次为( ) A .26,16,8 B .25,17,8 C .25,16,9 D .24,17,9答案 B解析 由题意及系统抽样的定义可知,将这600名学生按编号依次分成50组,每一组各有12名学生,第k (k ∈N *)组抽中的号码是3+12(k -1). 令3+12(k -1)≤300得k ≤1034,因此第Ⅰ营区被抽中的人数是25; 令300<3+12(k -1)≤495得1034<k ≤42,因此第Ⅱ营区被抽中的人数是42-25=17.故选B.7.(2016·山西大同一中月考)用简单随机抽样的方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a “第一次被抽到”的可能性与“第二次被抽到”的可能性分别是( )A.110,110B.310,15C.15,310D.310,310答案 A解析 在抽样过程中,个体a 每一次被抽中的概率是相等的,因为总体容量为10,故个体a “第一次被抽到”的可能性与“第二次被抽到”的可能性均为110,故选A.8.(2017·天津质检)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查,已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取________名学生. 答案 60解析 设应从一年级本科生中抽取x 名学生,则x 300=44+5+5+6,解得x =60.9.(2016·潍坊模拟)某高中在校学生有2 000人.为了响应“阳光体育运动”的号召,学校开展了跑步和登山的比赛活动.每人都参与而且只能参与其中一项比赛,各年级参与比赛的人数情况如下表:其中a ∶b ∶c =2∶3∶5,全校参与登山的人数占总人数的25.为了了解学生对本次活动的满意程度,从中抽取一个200人的样本进行调查,则从高二年级参与跑步的学生中应抽取的人数为________. 答案 36解析 根据题意,可知样本中参与跑步的人数为200×35=120,所以从高二年级参与跑步的学生中应抽取的人数为120×32+3+5=36.10.一个总体中有90个个体,随机编号0,1,2,…,89,以从小到大的编号顺序平均分成9个小组,组号依次为1,2,3,…,9.现用系统抽样方法抽取一个容量为9的样本,规定如果在第1组随机抽取的号码为m ,那么在第k 组中抽取的号码个位数字与m +k 的个位数字相同,若m =8,则在第8组中抽取的号码是________. 答案 76解析 由题意知m =8,k =8,则m +k =16,也就是第8组抽取的号码个位数字为6,十位数字为8-1=7,故抽取的号码为76.11.200名职工年龄分布如图所示,从中随机抽取40名职工作样本,采用系统抽样方法,按1~200编号,分为40组,分别为1~5,6~10,…,196~200,第5组抽取号码为22,第8组抽取号码为________.若采用分层抽样,40岁以下年龄段应抽取________人.答案 37 20解析 将1~200编号分为40组,则每组的间隔为5,其中第5组抽取号码为22,则第8组抽取的号码应为22+3×5=37;由已知条件200名职工中40岁以下的职工人数为200×50%=100,设在40岁以下年龄段中应抽取x 人,则40200=x100,解得x =20.12.某校共有学生2 000名,各年级男、女学生人数如下表.已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为________.答案 16解析 依题意可知二年级的女生有380人,那么三年级的学生人数应该是2 000-373-377-380-370=500,即总体中各个年级的人数比为3∶3∶2,故用分层抽样法应在三年级抽取的学生人数为64×28=16.13.某公路设计院有工程师6人,技术员12人,技工18人,要从这些人中抽取n 个人参加市里召开的科学技术大会.如果采用系统抽样和分层抽样的方法抽取,不用剔除个体,如果参会人数增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,求n . 解 总体容量为6+12+18=36.当样本容量是n 时,由题意知,系统抽样的间隔为36n ,分层抽样的比例是n 36,抽取的工程师人数为n36×6=n 6,技术员人数为n 36×12=n 3,技工人数为n 36×18=n2, 所以n 应是6的倍数,36的约数,即n =6,12,18.当样本容量为(n +1)时,总体容量是35人,系统抽样的间隔为35n +1,因为35n +1必须是整数,所以n 只能取6.即样本容量n =6.*14.某公司有一批专业技术人员,对他们进行年龄状况和接受教育程度(学历)的调查,其结果(人数分布)如下表:(1)用分层抽样的方法在35~50岁年龄段的专业技术人员中抽取一个容量为5的样本,将该样本看成一个总体,从中任取2人,求至少有1人学历为研究生的概率;(2)在这个公司的专业技术人员中按年龄状况用分层抽样的方法抽取N 个人,其中35岁以下48人,50岁以上10人,再从这N 个人中随机抽取出1人,此人的年龄为50岁以上的概率为539,求x ,y 的值.解 (1)用分层抽样的方法在35~50岁中抽取一个容量为5的样本,设抽取学历为本科的人数为m , ∴3050=m5,解得m =3. 抽取的样本中有研究生2人,本科生3人,分别记作S 1,S 2;B 1,B 2,B 3.从中任取2人的所有等可能基本事件共有10个:(S 1,B 1),(S 1,B 2),(S 1,B 3),(S 2,B 1),(S 2,B 2),(S 2,B 3),(S 1,S 2),(B 1,B 2),(B 1,B 3),(B 2,B 3),其中至少有1人的学历为研究生的基本事件有7个:(S 1,B 1),(S 1,B 2),(S 1,B 3),(S 2,B 1),(S 2,B 2),(S 2,B 3),(S 1,S 2), ∴从中任取2人,至少有1人学历为研究生的概率为710. (2)由题意,得10N =539,解得N =78,∴35~50岁中被抽取的人数为78-48-10=20, ∴4880+x =2050=1020+y, 解得x =40,y =5,即x ,y 的值分别为40,5.第十一章统计与概率第1讲抽样方法与总体分布的估计一、选择题1.为了了解所加工一批零件的长度,抽测了其中200个零件的长度,在这个问题中,200个零件的长度是( ).A.总体 B.个体是每一个零件C.总体的一个样本 D.样本容量解析200个零件的长度是总体的一个样本.答案 C2.用随机数表法从100名学生(其中男生25人)中抽取20人进行评教,某男学生被抽到的概率是( ).A.1100B.125C.15D.14解析从容量N=100的总体中抽取一个容量为n=20的样本,每个个体被抽到的概率都是n N =1 5.答案 C3.样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均值为1,则样本方差为( ).A. 65B.65C. 2 D.2解析由题可知样本的平均值为1,所以a+0+1+2+35=1,解得a=-1,所以样本的方差为15[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.答案 D4.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则().A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差解析 由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9.所以甲、乙的成绩的平均数均为6,A 错;甲、乙的成绩的中位数分别为6,5,B 错;甲、乙的成绩的方差分别为15×[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=2,15×[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=125,C 对;甲、乙的成绩的极差均为4,D 错. 答案 C5.为了检查某超市货架上的奶粉是否含有三聚氰胺,要从编号依次为1到50的袋装奶粉中抽取5袋进行检验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的5袋奶粉的编号可能是( ). A .5,10,15,20,25B .2,4,8,16,32C .1,2,3,4,5D .7,17,27,37,47解析 利用系统抽样,把编号分为5段,每段10个,每段抽取一个,号码间隔为10,故选D. 答案 D6.一组数据的平均数是2.8,方差是3.6,若将这组数据中的每一个数据都加上60,得到一组新数据,则所得新数据的平均数和方差分别是( ).A .57.2,3.6B .57.2,56.4C .62.8,63.6D .62.8,3.6 解析 平均数增加,方差不变. 答案 D 二、填空题7.体育彩票000001~100000编号中,凡彩票号码最后三位数为345的中一等奖,采用的抽样方法是________.解析系统抽样的步骤可概括为:总体编号,确定间隔,总体分段,在第一段内确定起始个体编号,每段内规则取样等几步.该抽样符合系统抽样的特点.答案系统抽样8.某学校为了解学生数学课程的学习情况,在1 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图可估计这1 000名学生在该次数学考试中成绩不低于60分的学生人数是________.解析低于60分学生所占频率为(0.002+0.006+0.012)×10=0.2,故低于60分的学生人数为1 000×0.2=200,所以不低于60分的学生人数为1 000-200=800.答案8009.沈阳市某高中有高一学生600人,高二学生500人,高三学生550人,现对学生关于消防安全知识了解情况进行分层抽样调查,若抽取了一个容量为n的样本,其中高三学生有11人,则n的值等于________.解析由n600+500+550=11550,得n=33(人).答案3310.某年级120名学生在一次百米测试中,成绩全部介于13秒与18秒之间.将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率分布直方图.如果从左到右的5个小矩形的面积之比为1∶3∶7∶6∶3,那么成绩在[16,18]的学生人数是__________________________________________________________________.解析成绩在[16,18]的学生的人数所占比例为6+31+3+7+6+3=920,所以成绩在[16,18]的学生人数为120×920=54.答案54三、解答题11.某公路设计院有工程师6人,技术员12人,技工18人,要从这些人中抽取n个人参加市里召开的科学技术大会.如果采用系统抽样和分层抽样的方法抽取,不用剔除个体,如果参会人数增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,求n.解总体容量为6+12+18=36.当样本容量是n时,由题意知,系统抽样的间隔为36n,分层抽样的比例是n36,抽取的工程师人数为n36×6=n6,技术员人数为n36×12=n3,技工人数为n36×18=n2,所以n应是6的倍数,36的约数,即n=6,12,18.当样本容量为(n+1)时,总体容量是35人,系统抽样的间隔为35n+1,因为35n+1必须是整数,所以n只能取6.即样本容量n=6.12.某校高一某班的某次数学测试成绩(满分为100分)的茎叶图和频率分布直方图都受了不同程度的破坏,但可见部分如图,据此解答下列问题:。
§9.1随机抽样、用样本估计总体1.随机抽样(1)简单随机抽样①定义:一般地,从个体数为N的总体中逐个不放回地取出n个个体作为样本(n<N),如果每个个体都有相同的机会被取到,那么这样的抽样方法称为简单随机抽样.②最常用的简单随机抽样方法有两种——抽签法和随机数表法.(2)分层抽样①定义:一般地,当总体由差异明显的几个部分组成时,为了使样本更客观地反映总体情况,我们常常将总体中的个体按不同的特点分成层次比较分明的几个部分,然后按各个部分在总体中所占的比实施抽样,这种抽样方法叫分层抽样,所分成的各个部分称为“层”.②分层抽样的应用范围:当总体由差异明显的几个部分组成时,往往选用分层抽样的方法.2.用样本的频率分布估计总体分布(1)在频率分布直方图中,纵轴表示频率/组距,数据落在各小组内的频率用各小长方形的面积表示.各小长方形的面积总和等于1.(2)①频率分布折线图:如果将频率分布直方图中各个相邻的矩形的上底边的中点顺次连结起来,那么就得到频率分布折线图.②总体分布的密度曲线:如果将样本容量取得足够大,分组的组距取得足够小,那么相应的频率折线图将趋于一条光滑曲线,我们称这条光滑曲线为总体分布的密度曲线.3.用样本的数字特征估计总体的数字特征(1)众数:一组数据中出现次数最多的数.(2)中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数.(3)平均数:x =x 1+x 2+…+x nn,反映了一组数据的平均水平.(4)标准差:是样本数据到平均数的一种平均距离,s =(5)方差:s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2](x n 是样本数据,n 是样本容量,x 是样本平均数).概念方法微思考1.简单随机抽样和分层抽样有什么共同点和联系? 提示 (1)抽样过程中每个个体被抽取的机会相等. (2)分层抽样中各层抽样时采用简单随机抽样. 2.平均数、标准差与方差反映了数据的哪些特征?提示 平均数反映了数据取值的平均水平,标准差、方差反映了数据对平均数的波动情况,即标准差、方差越大,数据的离散程度越大,越不稳定;反之离散程度越小,越稳定.题组一 思考辨析1.判断下列结论是否正确(请在括号中打“√”或“×”)(1)简单随机抽样每个个体被抽到的机会不一样,与先后有关.( × ) (2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( × ) (3)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( √ ) 题组二 教材改编2.某公司有员工500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人,为了调查员工的身体健康状况,从中抽取100名员工,则应在这三个年龄段分别抽取人数为( ) A .33,34,33 B .25,56,19 C .20,40,30 D .30,50,20答案 B解析 设在不到35岁的员工抽取x 人,则100500=x125,所以x =25,同理可得这三个年龄段抽取人数分别为25,56,19.3.如图是100位居民月均用水量的频率分布直方图,则月均用水量在[2,2.5)范围内的居民有______人.答案25解析0.5×0.5×100=25.题组三易错自纠4.(多选)下表是某电器销售公司2019年度各类电器营业收入占比和净利润占比统计表:则下列判断中正确的是()A.该公司2019年度冰箱类电器销售亏损B.该公司2019年度小家电类电器营业收入和净利润相同C.该公司2019年度净利润主要由空调类电器销售提供D.剔除冰箱类电器销售数据后,该公司2019年度空调类电器销售净利润占比将会降低答案ACD解析根据表中数据知,该公司2019年度冰箱类电器销售净利润占比为-0.48%,是亏损的,A正确;小家电类电器营业收入占比和净利润占比是相同的,但收入与净利润不一定相同,B错误;该公司2019年度空调类电器净利润占比为95.80%,是主要利润来源,C正确;所以剔除冰箱类电器销售数据后,该公司2019年度空调类电器销售净利润占比将会降低,D正确.故选ACD.5.(2020·惠州调研)某高校调查了320名学生每周的自习时间(单位:小时)制成了下图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20],(20,22.5],(22.5,25],(25,27.5],(27.5,30].根据频率分布直方图,这320名学生中每周的自习时间不足22.5小时的人数是()A.70 B.72 C.248 D.200答案 B解析由频率分布直方图可得,320名学生中每周的自习时间不足22.5小时的人数是320×(0.02+0.07)×2.5=72(人).故选B.6.若数据x1,x2,x3,…,x n的平均数x=5,方差s2=2,则数据3x1+1,3x2+1,3x3+1,…,3x n+1的平均数和方差分别为________.答案16,18解析∵x1,x2,x3,…,x n的平均数为5,∴x1+x2+x3+…+x nn=5,∴3x1+3x2+3x3+…+3x nn+1=3×5+1=16,∵x1,x2,x3,…,x n的方差为2,∴3x1+1,3x2+1,3x3+1,…,3x n+1的方差是32×2=18.抽样方法1.用简单随机抽样的方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a “第一次被抽到”的可能性与“第二次被抽到”的可能性分别是( ) A.110,110 B.310,15 C.15,310 D.310,310答案 A解析 方法一 在抽样过程中,个体a 每一次被抽中的概率是相等的,因为总体容量为10,故个体a “第一次被抽到”的可能性与“第二次被抽到”的可能性均为110.故选A.方法二 第一次被抽到,显然为110;第二次被抽到,首先第一次不能被抽到,第二次抽才被抽到.可能性为910·19=110.故选A.2.某校要从高一、高二、高三共2 012名学生中选取50名组成志愿团,若先用简单随机抽样的方法从2 012名学生中剔除12名,再从剩下的2 000名学生中按分层抽样的方法抽取50名,则下面对每名学生入选的概率描述正确的是________.(填序号) ①都相等且为502 012;②都相等且为140;③不完全相等.答案 ①解析 根据分层抽样的定义可得,每个个体被抽到的概率都等于502 012.3.(2019·安徽毛坦厂中学模拟)某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种,10种,30种,20种,现从中抽取一个容量为20的样本进行食品安全检测,若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是________. 答案 6解析 本题主要考查对分层抽样的理解.抽样比为2040+10+30+20=15,则抽取的植物油类种数是10×15=2,抽取的果蔬类食品种数是20×15=4,所以抽取的植物油类与果蔬类食品种数之和是2+4=6.思维升华 (1)简单随机抽样是分层抽样的基础,是一种等概率的抽样,由定义应抓住以下特点:①它要求总体个数较少;②它是从总体中逐个抽取的;③它是一种不放回抽样.(2)分层抽样适用于总体中个体差异较大的情况.统计图表及应用命题点1 扇形图例1 (2018·全国Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下扇形图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半答案 A解析设新农村建设前,农村的经济收入为a,则新农村建设后,农村的经济收入为2a.新农村建设前后,各项收入的对比如下表:故选A.命题点2折线图例2(2017·全国Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳答案 A解析对于选项A,由图易知月接待游客量每年7,8月份明显高于12月份,故A错;对于选项B,观察折线图的变化趋势可知年接待游客量逐年增加,故B正确;对于选项C,D,由图可知显然正确.故选A.命题点3频率分布直方图例3(2019·南昌调研)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图.(1)直方图中x 的值为________;(2)在这些用户中,月用电量落在区间[100,250)内的户数为________. 答案 (1)0.004 4 (2)70解析 (1)由频率分布直方图知数据落在[200,250)内的频率为1-(0.002 4+0.003 6+0.006 0+0.002 4+0.001 2)×50=0.22,于是x =0.2250=0.004 4.(2)因为数据落在[100,250)内的频率为(0.003 6+0.006 0+0.004 4)×50=0.7,所以所求户数为0.7×100=70.思维升华 (1)通过扇形统计图可以很清楚的表示出各部分数量同总数之间的关系. (2)折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.(3)准确理解频率分布直方图的数据特点:①频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率,不要和条形图混淆.②频率分布直方图中各小长方形的面积之和为1,这是解题的关键,常利用频率分布直方图估计总体分布.跟踪训练1 (1)已知某地区中小学生人数和近视情况分别如图①和图②所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )A.200,20 B.100,20C.200,10 D.100,10答案 A解析由图①得样本容量为(3 500+2 000+4 500)×2%=10 000×2%=200,抽取的高中生人数为2 000×2%=40(人),则近视人数为40×0.5=20(人),故选A.(2)(多选)“搜索指数”是网民通过搜索引擎,以每天搜索关键词的次数为基础所得到的统计指标.搜索指数越大,表示网民搜索该关键词的次数越多,对该关键词相关的信息关注度也越高.如图是2017年9月到2018年2月这半年来,某个关键词的搜索指数变化的统计图.根据该统计图判断,下列结论不正确的是()A.这半年来,网民对该关键词相关的信息关注度呈周期性变化B.这半年来,网民对该关键词相关的信息关注度不断减弱C.从该关键词的搜索指数来看,2017年10月的方差小于11月的方差D.从该关键词的搜索指数来看,2017年12月的平均值大于2018年1月的平均值答案ABC解析由统计图可知,这半年来,该关键词的搜索指数变化的周期性并不显著,A项错误;由统计图可知,这半年来,该关键词的搜索指数的整体减弱趋势不显著,B项错误;由统计图可知,2017年10月该关键词的搜索指数波动较大,11月的波动较小,所以2017年10月的方差大于11月的方差,C项错误;由统计图可知,2017年12月该关键词的搜索指数大多高于10 000,该月平均值大于10 000,2018年1月该关键词的搜索指数大多低于10 000,该月平均值小于10 000,D项正确,故选ABC.(3)(2019·昆明模拟)为了解学生“阳光体育”活动的情况,随机统计了n名学生的“阳光体育”活动时间(单位:分钟),所得数据都在区间[10,110]内,其频率分布直方图如图所示.已知活动时间在[10,35)内的频数为80,则n的值为()A.700 B.800 C.850 D.900答案 B解析根据频率分布直方图,知组距为25,所以活动时间在[10,35)内的频率为0.1,因为活动时间在[10,35)内的频数为80,所以n=800.1=800.用样本的数字特征估计总体的数字特征1.(2019·全国Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是()A.中位数B.平均数C.方差D.极差答案 A解析记9个原始评分分别为a,b,c,d,e,f,g,h,i(按从小到大的顺序排列),易知e 为7个有效评分与9个原始评分的中位数,故不变的数字特征是中位数,故选A.2.某项测试成绩满分为10分,现随机抽取30名学生参加测试,得分情况如图所示,假设得分值的中位数为m e,平均数为x,众数为m0,则()A.m e=m0=x B.m e=m0<xC .m e <m 0<xD .m 0<m e <x答案 D解析 由图知m 0=5.由中位数的定义知应该是第15个数与第16个数的平均值,由图知将数据从小到大排,第15个数是5,第16个数是6,所以m e =5+62=5.5.x =3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×230≈5.97>5.5, 所以m 0<m e <x .3.(2019·全国Ⅱ)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为________. 答案 0.98解析 经停该站高铁列车所有车次的平均正点率的估计值为10×0.97+20×0.98+10×0.9910+20+10=0.98.4.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):如果甲、乙两人中只有1人入选,则入选的最佳人选应是________. 答案 甲解析 由题意可得x 甲=x 乙=9,又∵s 2甲=15×[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=25, s 2乙=15×[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=65>s 2甲,∴甲更稳定,故最佳人选应是甲.思维升华 (1)用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似值.实际应用时,需先计算样本数据的平均数,分析平均水平,再计算方差(标准差)分析稳定情况.(2)若给出图形,一方面可以由图形得到相应的样本数据,再计算平均数、方差(标准差);另一方面,可以从图形直观分析样本数据的分布情况,大致判断平均数的范围,并利用数据的波动性大小比较方差(标准差)的大小.1.为确保食品安全,某市质检部门检查了1 000袋方便面的质量,抽查总量的2%,在这个问题中,下列说法正确的是()A.总体是指这1 000袋方便面B.个体是1袋方便面C.样本是按2%抽取的20袋方便面D.样本容量为20答案 D解析总体是指这1 000袋方便面的质量,A中说法错误;个体是指1袋方便面的质量,B 中说法错误;样本是指按照2%抽取的20袋方便面的质量,C中说法错误;样本容量为20,D中说法正确.2.某中学有高中生3 500人,初中生1 500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为()A .100B .150C .200D .250 答案 A解析 方法一 由题意可得70n -70=3 5001 500,解得n =100.方法二 由题意,得抽样比为703 500=150,总体容量为3 500+1 500=5 000,故n =5 000×150=100.3.(2020·镇江模拟)如图为某省高考数学(理)卷近三年难易程度的对比图(图中数据为分值).根据对比图,给出正面三个结论:①近三年容易题分值逐年增加;②近三年中档题分值所占比例最高的年份是2017年;③2018年的容易题与中档题的分值之和占总分的90%以上.其中正确结论的个数为( )A .0B .1C .2D .3 答案 C解析 根据对比图得,2016年,2017年,2018年容易题分值分别为40,55,96,逐年增加,①正确;近三年中档题分值所占比例最高的年份是2016年,②错误;2018年的容易题与中档题的分值之和为96+42=138,138150=0.92>90%,③正确.故选C.4.(2019·全国Ⅲ)《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为( ) A .0.5 B .0.6 C .0.7 D .0.8 答案 C解析 根据题意阅读过《红楼梦》《西游记》的人数用韦恩图表示如下:所以该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为70100=0.7.5.高三学生李丽在一年的五次数学模拟考试中的成绩(单位:分)为:x ,y,105,109,110.已知该同学五次数学成绩数据的平均数为108,方差为35.2,则|x -y |的值为( ) A .15 B .16 C .17 D .18答案 D解析 由题意得,x +y +105+109+1105=108,①(x -108)2+(y -108)2+9+1+45=35.2,②由①②解得⎩⎪⎨⎪⎧ x =99,y =117或⎩⎪⎨⎪⎧x =117,y =99,所以|x -y |=18.故选D.6.若数据x 1,x 2,…,x n 的平均数为x ,方差为s 2,则2x 1+3,2x 2+3,…,2x n +3的平均数和方差分别为( ) A.x 和s 2 B .2x +3和4s 2 C .2x +3和s 2 D .2x +3和4s 2+12s +9答案 B解析 方法一 平均数为1n (2x 1+3+2x 2+3+…+2x n +3)=1n [2(x 1+x 2+…+x n )+3n ]=2x +3;方差为1n {[(2x 1+3)-(2x +3)]2+[(2x 2+3)-(2x +3)]2+…+[(2x n +3)-(2x +3)]2}=1n[4(x1-x)2+4(x2-x)2+…+4(x n-x)2]=4s2.方法二原数据乘以2加上3得到一组新数据,则由平均数、方差的性质可知得到的新数据的平均数和方差分别是2x+3和4s2.7.(多选)(2020·山东模拟)下图为某地区2006年~2018年地方财政预算内收入、城乡居民储蓄年末余额折线图.根据该折线图可知,该地区2006年~2018年()A.财政预算内收入、城乡居民储蓄年末余额均呈增长趋势B.财政预算内收入、城乡居民储蓄年末余额的逐年增长速度相同C.财政预算内收入年平均增长量高于城乡居民储蓄年末余额年平均增长量D.城乡居民储蓄年末余额与财政预算内收入的差额逐年增大答案AD解析由图可以看出两条曲线均在上升,选项A正确;图中两曲线间隔越来越大,说明年增长速度不同,差额逐年增大,选项B错误,选项D正确;又从图中可以看出财政预算内收入年平均增长量应该小于城乡居民储蓄年末余额年平均增长量,选项C错误.故选AD. 8.(多选)(2020·广东华附、省实、广雅、深中四校联考)随着人民生活水平的提高,对城市空气质量的关注度也逐步增大,下图是某城市1月至8月的空气质量检测情况,图中一、二、三、四级是空气质量等级,一级空气质量最好,一级和二级都是质量合格天气,下面四种说法正确的是()A .1月至8月空气合格天数超过20天的月份有5个B .第二季度与第一季度相比,空气合格天数的比重下降了C .8月是空气质量最好的一个月D .6月的空气质量最差 答案 ABC解析 1月至8月空气合格天数超过20天的月份有:1月,2月,6月,7月,8月,共5个,所以A 是正确的;第一季度合格天数的比重为22+26+1931+29+31≈0.736 3,第二季度合格天数的比重为19+13+2530+31+30≈0.626 4,所以第二季度与第一季度相比,空气质量合格的天数的比重下降了,所以B 是正确的;8月空气质量合格天气达到30天,是空气质量最好的一个月,所以C 是正确的;5月空气质量合格天气只有13天,5月份的空气质量最差,所以D 是错误的,故选ABC.9.(2019·江苏)已知一组数据6,7,8,8,9,10,则该组数据的方差是________. 答案 53解析 数据6,7,8,8,9,10的平均数是6+7+8+8+9+106=8,则方差是4+1+0+0+1+46=53.10.为了了解一批产品的长度(单位:毫米)情况,现抽取容量为400的样本进行检测,如图是检测结果的频率分布直方图,根据产品标准,单件产品长度在区间[25,30)的为一等品,在区间[20,25)和[30,35)的为二等品,其余均为三等品,则样本中三等品的件数为________.答案 100解析 由题意得,三等品的长度在区间[10,15),[15,20)和[35,40]内,根据频率分布直方图可得三等品的频率为(0.012 5+0.025 0+0.012 5)×5=0.25, ∴样本中三等品的件数为400×0.25=100.11.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):如果甲、乙两人中只有1人入选,则入选的最佳人选应是________. 答案 甲解析 由题意可得x 甲=x 乙=9,又∵s 2甲=15×[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=25, s 2乙=15×[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=65>s 2甲,∴甲更稳定,故最佳人选应是甲.12.为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据,已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为________. 答案 10解析 设5个班级中参加的人数分别为x 1,x 2,x 3,x 4,x 5,则由题意知x 1+x 2+x 3+x 4+x 55=7,(x1-7)2+(x2-7)2+(x3-7)2+(x4-7)2+(x5-7)2=20,五个整数的平方和为20,则必为0+1+1+9+9=20,由|x-7|=3可得x=10或x=4.由|x-7|=1可得x=8或x=6.由上可知参加的人数分别为4,6,7,8,10,故最大值为10.13.(2019·榆林模拟)为了反映各行业对仓储物流业务需求变化的情况,以及重要商品库存变化的动向,中国物流与采购联合会和中储发展股份有限公司通过联合调查,制定了中国仓储指数.由2017年1月至2018年7月的调查数据得出的中国仓储指数,绘制出如下折线图.根据该折线图,下列结论正确的是()A.2017年各月的仓储指数最大值是在3月份B.2018年1月至7月的仓储指数的中位数为55C.2018年1月与4月的仓储指数的平均数为52D.2017年1月至4月的仓储指数相对于2018年1月至4月,波动性更大答案 D解析2017年各月的仓储指数最大值是在11月份,所以A错误;由图可知,2018年1月至7月的仓储指数的中位数约为53,所以B错误;2018年1月与4月的仓储指数的平均数为51+552=53,所以C错误;由图可知,2017年1月至4月的仓储指数比2018年1月至4月的仓储指数波动更大,故选D.14.(多选)“微信运动”是腾讯开发的一个记录跑步或行走情况(步数里程)的公众号,用户通过该公众号可查看自己某时间段的运动情况.某人根据2018年1月至2018年11月期间每月跑步的里程(单位:十公里)的数据绘制了下面的折线图.根据该折线图,下列结论正确的是()A.月跑步里程逐月增加B.月跑步里程最大值出现在10月C.月跑步里程的中位数为5月份对应的里程数D.1月至5月的月跑步里程相对于6月至11月波动性更小,变化比较平稳答案BCD解析在A中,2月跑步里程比1月的小,8月跑步里程比7月的小,11月跑步里程比10月的小,故A错误;在B中,月跑步里程10月最大,故B正确;在C中,月跑步里程高峰期大致在9,10月,从小到大依次为2月、8月、3月、4月、1月、5月、7月、6月、11月、9月、10月,故C正确;在D中,1月至5月的月跑步平均里程相对于6月至11月,波动性更小,变化比较平稳,故D正确.故选BCD.15.气象意义上从春季进入夏季的标志为:连续5天每天日平均温度不低于22 ℃.现有甲、乙、丙三地连续5天的日平均温度的记录数据(记录数据都是正整数,单位:℃).①甲地:5个数据的中位数为24,众数为22;②乙地:5个数据的中位数为27,平均数为24;③丙地:5个数据中有一个数据是32,平均数为26,方差为10.2.则肯定进入夏季的地区有________个.答案 2解析甲地肯定进入夏季,因为众数为22,所以22 ℃至少出现两次,若有一天低于22 ℃,则中位数不可能为24;丙地肯定进入,10.2×5-(32-26)2≥(26-x)2,所以15≥(26-x)2,若x≤22不成立;乙地不一定进入,如13,23,27,28,29,故答案为2.16.共享单车入驻某市一周年以来,因其“绿色出行,低碳环保”的理念而备受人们的喜爱,值此周年之际,某机构为了了解共享单车使用者的年龄段、使用频率、满意度等三个方面的信息,在全市范围内发放5 000份调查问卷,回收到有效问卷3 125份,现从中随机抽取80份,分别对使用者的年龄段、26~35岁使用者的使用频率、26~35岁使用者的满意度进行汇总,得到如下三个表格:表(一)表(二)表(三)(1)依据上述表格完成下列三个统计图:(2)某城区现有常住人口30万,请用样本估计总体的思想,试估计年龄在26岁~35岁之间,每月使用共享单车在7~14次的人数.解(1)(2)由表(一)可知:年龄在26岁~35岁之间的有40人,占总抽取人数的一半,用样本估计总体的思想可知,某城区30万人口中年龄在26岁~35岁之间的约有30×12=15(万人);又年龄在26岁~35岁之间每月使用共享单车在7~14次之间的有10人,占总抽取人数的14,用样本估计总体的思想可知,城区年龄在26岁~35岁之间每月使用共享单车在7~14次之间的约有15×14=154(万人),所以年龄在26岁~35岁之间,每月使用共享单车在7~14次之间的人数约为154万人.。
2025年高考数学一轮复习-抽样方法、统计图表、用样本估计总体-专项训练基础巩固练1.(2023连云港期中)下列一组数据的第30百分位数是()2.1,3.0,3.2,3.8,3.4,4.0,4.2,4.4,5.3,5.6.A.3.0B.3.2C.3.3D.4.42.从某中学抽取10名同学,得到他们的数学成绩(单位:分)如下:88,85,82,92,90,92,96,92,96,98.这10名同学数学成绩的众数、中位数分别为()A.92,92B.92,96C.96,92D.92,903.(2023宿迁月考)统计某样本数据得到的频率分布直方图如图所示,已知该样本容量为300,则样本数据落在[6,14)内的频数为()A.68B.170C.204D.2404.如图,这是某市2023年国庆节假期的楼房认购量与成交量的折线图,小明同学根据折线图对这7天的认购量(单位:套)与成交量(单位:套)作出如下判断,则下列判断正确的为()A.日成交量的中位数是16B.日成交量超过日平均成交量的有2天C.10月7日认购量的增幅大于10月7日成交量的增幅D.日认购量的方差大于日成交量的方差5.(多选题)在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本.方法1:采用简单随机抽样的方法,将零件分别编号为00,01,02,…,99,用抽签法抽取20个.方法2:采用分层随机抽样的方法,从一级品中随机抽取4个,从二级品中随机抽取6个,从三级品中随机抽取10个.对于上述问题,下列说法正确的是()A.无论采用哪种抽样方法,这100个零件中每一个零件被抽到的可能性都是15B.采用不同的方法,这100个零件中每一个零件被抽到的可能性各不相同C.在上述两种抽样方法中,方法2抽到的样本比方法1抽到的样本更能反映总体的特征D.在上述两种抽样方法中,方法1抽到的样本比方法2抽到的样本更能反映总体的特征6.(多选题)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则()甲乙A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的平均数等于乙的成绩的平均数C.甲的成绩的第80百分位数等于乙的成绩的第80百分位数D.甲的成绩的极差等于乙的成绩的极差7.在一次竞选中,规定一个人获胜的条件如下:(1)在竞选中得票最多;(2)得票数不低于总票数的一半.在计票时,周鹏得票的数据丢失.候选人赵明钱红孙华李丽周鹏得票数3001003060x如果周鹏获胜,那么周鹏的得票数x的最小值为.8.(2023盐城调研)已知某8个数据的平均数为5,方差为3,现又加入一个新数据5,此时这9个数据的方差为.9.某大学艺术专业400名学生参加某次测评,根据男、女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成[20,30),[30,40),…,[80,90]七组,并整理得到如图所示的频率分布直方图:(1)从样本中随机抽取一人,求其分数小于70的频率.(2)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男、女生人数相等.试估计总体中男生和女生人数的比.综合提升练10.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量,并得到频率分布直方图如图:则这20名工人一天生产该产品的数量的中位数为()A.65B.64C.62.5D.6011.一组数据的平均数为a,方差为b,将这组数据的每个数都乘m(m>0)后得到一组新数据,则下列说法正确的是()A.这组新数据的平均数为aB.这组新数据的平均数为a+mC.这组新数据的方差为mbD.这组新数据的方差为m2b12.(多选题)(2023徐州质检)在第一次全市高三年级统考后,数学老师为了解本班学生的本次数学考试情况,将全班50名学生的数学成绩绘制成了频率分布直方图.已知该班级学生的数学成绩(单位:分)全部介于65到145之间(满分150分),将数学成绩按如下方式分成八组:第一组[65,75),第二组[75,85),…,第八组[135,145].按上述分组方法得到的频率分布直方图的一部分如图所示,则下列结论正确的是()A.第七组的频率为0.008B.该班级数学成绩的中位数的估计值为101C.该班级数学成绩的平均分的估计值大于95D.该班级数学成绩的方差的估计值大于2613.已知甲、乙两组数据如下表所示,其中a,b∈N*,若甲、乙两组数据的平均数相等,要使甲组数据的方差小于乙组数据的方差,则(a,b)为.(只需填一组)甲12ab10乙12471114.某校从高一年级中随机抽取部分学生,将他们的期末数学测试成绩分成[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]6组加以统计,得到如图所示的频率分布直方图.据此统计,期末数学测试成绩不少于第60百分位数的分数至少为.15.6月17日是联合国确定的“世界防治荒漠化和干旱日”,为增强全社会对防治荒漠化的认识与关注,聚焦联合国2030年可持续发展目标——实现全球土地退化零增长.自2004年以来,我国荒漠化和沙化状况呈现整体遏制、持续缩减、功能增强、成效明显的良好态势.治理沙漠离不开优质的树苗,现从苗圃中随机地抽测了200株树苗的高度(单位:cm),得到如图所示的频率分布直方图.(1)求频率分布直方图中a的值及众数、中位数.(2)已知树高为185cm及以上的是可以移栽的合格树苗.①求合格树苗的平均高度(结果精确到个位);②从样本中按分层抽样的方法抽取20株树苗进一步研究,不合格树苗、合格树苗分别应抽取多少株?创新应用练16.某小区毗邻一条公路,为了解交通噪声,有关部门连续25天监测噪声值(单位:分贝),得到频率分布直方图(图1),发现噪声污染严重,采取了在公路旁加装隔声板等治理措施,而后,再连续25天监测噪声值,得到频率分布直方图(图2).图1图2同一组中的数据用该组区间的中点值作代表,请解答下列问题:(1)根据上面两个频率分布直方图,估计治理后比治理前的平均噪声值降低了分贝.(2)国家“城市区域环境噪声”规定:重度污染:>65分贝;中度污染:60~65分贝;轻度污染:55~60分贝;较好:50~55分贝;好:≤50分贝.把上述两个样本数据的频率视为概率,根据图1估算出该小区噪声治理前一年内(365天)噪声中度污染及以上的天数为277,根据图2估计一年内(365天)噪声中度污染及以上的天数比治理前减少了天.(精确到1天)参考答案1.C2.A3.C4.D5.AC6.BCD7.4908 839.解(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,所以样本中分数小于70的频率为1-0.6=0.4.所以从样本中随机抽取一人,其分数小于70的频率为0.4.(2)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60,所以样本中分数不小于70的男生人数为60 12=30,所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比为60∶40=3∶2.所以根据分层抽样原理,估计总体中男生和女生人数的比为3∶2.10.C11.D12.BCD13.(4,8)或(5,7)或(6,6)或(7,5)或(8,4)(填其中一个即可)14.7415.解(1)∵(0.0015+0.0110+0.0225+0.0300+a+0.0080+0.0020)×10=1,∴a=0.0250.众数为185+1952=190.设中位数为x,∵(0.0015+0.0110+0.0225)×10=0.35<0.5,(0.0015+0.0110+0.0225+0.030)×10=0.65>0.5,∴185<x<195,(0.0015+0.0110+0.0225)×10+0.030(x-185)=0.5,∴x=190.(2)∵树苗高度为185cm及以上的频率是(0.0300+0.0250+0.0080+0.0020)×10=0.65, =[190×(0.030×10)+200×(0.0250×10)+210×(0.0080×10)+220×(0.002 0×10)]÷0.65≈197(cm).(3)应抽取不合格的树苗20×0.35=7(株),合格的树苗20×0.65=13(株),故不合格树苗、合格树苗分别应抽取7株和13株.16.(1)2.56(2)138。
12.3 抽样方法、总体分布的估计一、知识梳理(一)抽样1.简单随机抽样:设一个总体的个体数为N .如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样⑴用简单随机抽样从含有N 个个体的总体中抽取一个容量为n 的样本时,每次抽取一个个体时任一个体被抽到的概率为N1;在整个抽样过程中各个个体被抽到的概率为Nn; ⑵简单随机抽样的特点是,逐个抽取,且各个个体被抽到的概率相等; ⑶简单随机抽样方法,体现了抽样的客观性与公平性,是其他更复杂抽样方法的基础.(4).简单随机抽样的特点:它是不放回抽样;它是逐个地进行抽取;它是一种等概率抽样 简单抽样常用方法:(1)抽签法:先将总体中的所有个体(共有N 个)编号(号码可从1到N ),并把号码写在形状、大小相同的号签上(号签可用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签时每次从中抽一个号签,连续抽取n 次,就得到一个容量为n 的样本适用范围:总体的个体数不多时优点:抽签法简便易行,当总体的个体数不太多时适宜采用抽签法.(2)随机数表法: 随机数表抽样“三步曲”:第一步,将总体中的个体编号;第二步,选定开始的数字;第三步,获取样本号码2.系统抽样:当总体中的个体数较多时,可将总体分成均衡的几个部分,然后按预先定出的规则,从每一部分抽取一个个体,得到需要的样本,这种抽样叫做系统抽样.系统抽样的步骤:①采用随机的方式将总体中的个体编号为简便起见,有时可直接采用个体所带有的号码,如考生的准考证号、街道上各户的门牌号,等等②为将整个的编号分段(即分成几个部分),要确定分段的间隔k 当Nn(N为总体中的个体的个数,n 为样本容量)是整数时,k=N n ;当Nn不是整数时,通过从总体中剔除一些个体使剩下的总体中个体的个数N '能被n 整除,这时k=N n'.③在第一段用简单随机抽样确定起始的个体编号l ④按照事先确定的规则抽取样本(通常是将l 加上间隔k ,得到第2个编号l +k,第3个编号l +2k ,这样继续下去,直到获取整个样本)①系统抽样适用于总体中的个体数较多的情况,它与简单随机抽样的联系在于:将总体均分后的每一部分进行抽样时,采用的是简单随机抽样;②与简单随机抽样一样,系统抽样是等概率抽样,它是客观的、公平的. ③总体中的个体数恰好能被样本容量整除时,可用它们的比值作为系统抽样的间隔;当总体中的个体数不能被样本容量整除时,可用简单随机抽样先从总体中剔除少量个体,使剩下的个体数能被样本容量整除在进行系统抽样3.分层抽样:当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比例进行抽样,这种抽样叫做分层抽样,所分成的部分叫做层体,称这样的抽样为不放回抽样;如果每次抽出个体后再将它放回总体,称这样的抽样为放回抽样.随机抽样、系统抽样、分层抽样都是不放回抽样(二)总体分布1.总体:在数理统计中,通常把被研究的对象的全体叫做总体.2.频率分布:用样本估计总体,是研究统计问题的基本思想方法,样本中所有数据(或数据组)的频数和样本容量的比,就是该数据的频率.所有数据(或数据组)的频率的分布变化规律叫做样本的频率分布.可以用样本频率表、样本频率分布条形图或频率分布直方图来表示.3.总体分布:从总体中抽取一个个体,就是一次随机试验,从总体中抽取一个容量为n的样本,就是进行了n次试验,试验连同所出现的结果叫随机事件,所有这些事件的概率分布规律称为总体分布.4.总体密度曲线:样本容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概率.设想样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,这条曲线叫做总体密度曲线.它反映了总体在各个范围内取值的概率.根据这条曲线,可求出总体在区间(a,b)内取值的概率等于总体密度曲线,直线x=a,x=b及x轴所围图形的面积.0.5 时间(小时) 0 1.0 1.5 2.0二、基础训练1.一个总体中共有10个个体,用简单随机抽样的方法从中抽取一容量为3的样本,则某特定个体入样的概率是CA.310C 3B.89103⨯⨯C.103 D.101 2.(2004年江苏,6)某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示.根据条形图可得这50名学生这一天平均每人的课外阅读时间为BA.0.6 hB.0.9 hC.1.0 hD.1.5 h3.一个年级有12个班,每个班有50名同学,随机编号为1~50号,为了了解他们在课外的兴趣爱好,要求每班的33号学生留下来参加阅卷调查,这里运用的抽样方法是DA.分层抽样法B.抽签法C.随机数表法D.系统抽样法4.为调查参加运动会的1000名运动员的年龄情况,从中抽查了100名运动员的年龄,就这个问题来说,下列说法正确的是A.1000名运动员是总体B.每个运动员是个体C.抽取的100名运动员是样本D.样本容量是100 解析:这个问题我们研究的是运动员的年龄情况.因此应选D. 答案:D5.一个容量为n 的样本,分成若干组,已知某数的频数和频率分别为40、0.125,则n 的值为A.640B.320C.240D.160解析:∵n40=0.125,∴n =320.故选B.答案:B6.某单位有老年人27人,中年人54人,青年人81人,为了调查他们的健康状况,需从他们中抽取一个容量为36的样本,在简单随机抽样、系统抽样、分层抽样这三种方法中较合适的抽样方法是___________.解析:要研究的总体里各部分情况差异较大,因此用分层抽样. 答案:分层抽样那么分数在[100,110)中的频率和分数不满110分的累积频率分别是______________、_______(精确到0.01).解析:由频率计算方法知:总人数=45.分数在[100,110)中的频率为458=0.178≈0.18.分数不满110分的累积频率为458652+++=4521≈0.47.答案:0.18 0.47三、例题剖析【例1】 (2004年湖南,5)某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是A.分层抽样法,系统抽样法B.分层抽样法,简单随机抽样法C.系统抽样法,分层抽样法D.简单随机抽样法,分层抽样法剖析:此题为抽样方法的选取问题.当总体中个体较多时宜采用系统抽样;当总体中的个体差异较大时,宜采用分层抽样;当总体中个体较少时,宜采用随机抽样.依据题意,第①项调查应采用分层抽样法、第②项调查应采用简单随机抽样法.故选B. 答案:B评述:采用什么样的抽样方法要依据研究的总体中的个体情况来定.【例2】 (2004年福建,15)一个总体中有100个个体,随机编号为0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m ,那么在第k 小组中抽取的号码个位数字与m +k 的个位数字相同.若m =6,则在第7组中抽取的号码是___________.剖析:此问题总体中个体的个数较多,因此采用系统抽样.按题目中要求的规则抽取即可.∵m =6,k =7,m +k =13,∴在第7小组中抽取的号码是63. 答案:63评述:当总体中个体个数较多而差异又不大时可采用系统抽样.采用系统抽样在每小组内抽取时应按规则进行.【例3】 把容量为100的某个样本数据分为10组,并填写频率分布表,若前七组的累积频率为0.79,而剩下三组的频数成公比大于2的整数等比数列,则剩下三组中频数最高的一组的频数为___________.剖析:已知前七组的累积频率为0.79,而要研究后三组的问题,因此应先求出后三组的频率之和为1-0.79=0.21,进而求出后三组的共有频数,或者先求前七组共有频数后,再计算后三组的共有频数.由已知知前七组的累积频数为0.79×100=79,故后三组共有的频数为21,依题意qq a --⋅1)1(31=21,a 1(1+q +q 2)=21.∴a 1=1,q =4.∴后三组频数最高的一组的频数为16.答案:16评述:此题剖析只按第二种思路给出了解答,你能按第一种思路来解吗?(1)列出频率分布表;(2)画出频率分布直方图和累积频率分布图;(3)估计电子元件寿命在100~400 h 以内的概率; (4)估计电子元件寿命在400 h 以上的概率.剖析:通过本题可掌握总体分布估计的各种方法和步骤.(2)频率分布直方图如下:(h ) 1.0.0.0.0.(3)由累积频率分布图可以看出,寿命在100~400 h 内的电子元件出现的频率为0.65,所以我们估计电子元件寿命在100~400 h 内的概率为0.65.(4)由频率分布表可知,寿命在400 h 以上的电子元件出现的频率为0.20+0.15=0.35,故我们估计电子元件寿命在400 h 以上的概率为0.35.评述:画频率分布条形图、直方图时要注意纵、横坐标轴的意义.【例5】 某批零件共160个,其中,一级品48个,二级品64个,三级品32个,等外品16个.从中抽取一个容量为20的样本.请说明分别用简单随机抽样、系统抽样和分层抽样法抽取时总体中的每个个体被取到的概率均相同.【例6】一个容量为100的样本,数据的分组和各组的一些相关信息如下:(1)完成上表;(2)画出频率分布直方图和累积频率分布图;(3)根据累积频率分布图,总体中小于22的样本数据大约占多大的百分比?〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒 四、同步练习 g3.1099 抽样方法、总体分布的估计1.某公司甲、乙、丙、丁四个地区分别有150 个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其收入和售后服务等情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是 ( B )()A 分层抽样法,系统抽样法()B 分层抽样法,简单随机抽样法 ()C 系统抽样法,分层抽样法 ()D 简单随机抽样法,分层抽样法2.已知样本方差由102211(5)10i i s x ==-∑,求得,则1210x x x +++= 50 . 3.设有n 个样本12,,,n x x x ,其标准差为x s ,另有n 个样本12,,,n y y y ,且35k k y x =+(1,2,,)k n = ,其标准差为y s ,则下列关系正确的是 ( B )()A 35y x s s =+ ()B 3y x s s =()C y x s = ()D 5y x s =+时间(小时)4.某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用右侧的条形图表示. 根据条形图可得这50名学生这一天平均每人的课外阅读时间为 ( B ) ()A 0.6小时 ()B 0.9小时()C 1.0小时 ()D 1.5小时5.x 是12100,,x x x 的平均数,a 是1240,,x x x 的平均数,b 是4142100,,x x x 的平均数,则x ,a ,b 之间的关系为4060100a bx +=.6.某校有老师200人,男学生1200人,女学生1000人.现用分层抽样的方法从所有师生中抽取一个容量为n 的样本;已知从女学生中抽取的人数为80人,则n =112.7.一个总体中有100个个体,随机编号0,1,2,…,99,依编号顺序平均分成10个小 组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m ,那么在第k 组中抽取的号码个位数字与m k +的个位数字相同,若6m =,则在第7组中抽取的号码是 63 .8.在样本的频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他10个小长方形的面积之和的14,且样本容量为160,则中间一组的频数为 32 . 9.某中学有员工160人,其中中高级教师48人,一般教师64人,管理人员16人,行政人员32人,从中抽取容量为20的一个样本.以此例说明,无论使用三种常用的抽样方法中的哪一种方法,总体中的每个个体抽到的概率都相同.10. 现有30个零件,需从中抽取10个进行检查,问如何采用简单随机抽样得到一个容量为10的样本?11.质检部门对甲、乙两种日光灯的使用时间进行了破坏性试验,10次试验得到的两 种日光灯的使用时间如下表所示,问:哪一种质量相对好一些?(2)画出频率分布直方图;(3)根据累积频率分布,估计小于134的数据约占多少百分比.13.为检测某种产品的质量,抽取了一个容量为30的样本,检测结果为一级品5件,二级品8件,三级品13件,次品4件。
1.(2016·南通调研测试)某中学共有学生2 800人,其中高一年级970人,高二年级930人,高三年级900人,现采用分层抽样的方法,抽取280人进行体育达标检测,则抽取高二年级学生人数为________.解析:设高二年级抽取n 人,则n 930=2802 800,故n =93人. 答案:932.(2016·唐山摸底考试)某公司有A 、B 两个部门,共有职工300人,其中A 部门有职工132人,按部门职工数比例用分层抽样的方法,从该公司的职工中抽取一个容量为25的样本,则从B 部门抽取的员工人数是________.解析:B 部门有职工300-132=168人,所以应从B 部门抽取的员工人数为25×168300=14.答案:143.(2016·江西省名校调研)抽测100名学生的身高(单位:cm),其中频率分布直方图如图所示,则这100名学生中,身高不低于160 cm 的人数为________.解析:根据频率分布直方图,得学生的身高位于区间[160,190)上的频率为(0.040+0.020+0.010)×10=0.7,所以对应的人数为100×0.7=70.答案:704.(2016·南京、盐城、徐州模拟)某工厂为了了解一批产品的净重(单位:克)情况,从中随机抽测了100件产品的净重,所得数据均在区间[96,106]中,其中频率分布直方图如图所示,则在抽测的100件产品中,净重在区间[100,104]上的产品件数是________.解析:根据题意得净重在区间[100,104]上的产品的频率为(0.150+0.125)×2=0.55,所以在此区间内的产品的件数为0.55×100=55件.答案:555.(2016·无锡模拟)若一组样本数据8,x ,10,11,9的平均数为10,则该组样本数据的方差为________.解析:因为平均数=8+x +10+11+95=10,所以x =12,从而方差为s 2=15(4+4+0+1+1)=2.答案:26.(2016·辽宁省五校协作体联考改编)PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物.如图是根据哈尔滨三中学生社团某日早6点至晚9点在南岗、群力两个校区附近的PM2.5监测点统计的数据(单位:毫克/立方米)列出的茎叶图,南岗、群力两个校区浓度的方差较小的是________校区.南岗校区29 36 2 13 3 16 47 0.040.050.060.070.080.09群力校区1 2 3 6 9 2 9 9 7 2 4 6解析:方差较小即两者比较时数据比较集中,从茎叶图知,南岗校区数据集中,而群力校区数据分散的很明显,故南岗校区浓度的方差较小. 答案:南岗7.(2016·鹰潭模拟改编)某市共有400所学校,现要用系统抽样的方法抽取20所学校作为样本,调查学生课外阅读的情况.把这400所学校编上1~400的号码,再从1~20中随机抽取一个号码,如果此时抽得的号码是6,则在编号为21到40的学校中,应抽取的学校的编号为________.解析:根据系统抽样的条件,可知抽取的号码为第一组的号码加上组距的整数倍,所以为号20+6=26号.答案:268.(2016·武汉调研)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示,则7个剩余分数的方差为________.解析:由题图可知去掉的两个数是87,99,所以87+90×2+91×2+94+90+x =91×7,解得x =4.所以s 2=17×[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=367. 答案:3679.一组数据中的每一个数据都乘以2,再都减去80,得一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是________.解析:记原数据依次为x 1,x 2,x 3,…,x n ,则新数据依次为2x 1-80,2x 2-80,2x 3-80,…,2x n -80,且2(x 1+x 2+…+x n )-80n n=1.2, 因此有x 1+x 2+…+x n n =1.2+802=40.6. (2x 1-80-1.2)2+(2x 2-80-1.2)2+…+(2x n -80-1.2)2n=4.4, 4[](x 1-40.6)2+(x 2-40.6)2+…+(x n -40.6)2=4.4n ,因此有(x 1-40.6)2+(x 2-40.6)2+…+(x n -40.6)2n=1.1. 答案:40.6,1.110.容量为60的样本的频率分布直方图共有n(n>1)个小矩形,若其中一个小矩形的面积等于其余n -1个小矩形面积和的15,则这个小矩形对应的频数是________. 解析:设所求小矩形的面积为x ,则x +5x =1,得x =16,即所求小矩形对应的频率为16,所以所求小矩形对应的频数为60×16=10. 答案:1011.一次数学模拟考试,共12道选择题,每题5分,共计60分,每道题有四个可供选择的答案,仅有一个是正确的.学生小张只能确定其中10道题的正确答案,其余2道题完全靠猜测回答.小张所在班级共有40人,此次考试选择题得分情况统计表如下:现采用分层抽样的方法从此班抽取20人的试卷进行选择题质量分析.(1)应抽取多少张选择题得60分的试卷?(2)若小张选择题得60分,求他的试卷被抽到的概率.解:(1)得60分的人数为40×10%=4.设抽取x 张选择题得60分的试卷,则4020=4x, 则x =2,故应抽取2张选择题得60分的试卷.(2)设小张的试卷为a 1,另三名得60分的同学的试卷为a 2,a 3,a 4,所有抽取60分试卷的方法为(a 1,a 2),(a 1,a 3),(a 1,a 4),(a 2,a 3),(a 2,a 4),(a 3,a 4)共6种,其中小张的试卷被抽到的抽法共有3种,故小张的试卷被抽到的概率为P =36=12. 12.甲、乙两名战士在相同条件下各射靶10次,每次命中的环数分别是:甲:8,6,7,8,6,5,9,10,4,7;乙:6,7,7,8,6,7,8,7,9,5.(1)分别计算两组数据的平均数;(2)分别计算两组数据的方差;(3)根据计算结果,估计一下两名战士的射击水平谁更好一些.解:(1) x -甲=110(8+6+7+8+6+5+9+10+4+7)=7, x -乙=110(6+7+7+8+6+7+8+7+9+5)=7. (2)由方差公式s 2=1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2]可求得s 2甲=3.0,s 2乙=1.2. (3)由x -甲=x -乙,说明甲、乙两战士的平均水平相当; 又因为s 2甲>s 2乙,说明甲战士射击情况波动大,因此乙战士比甲战士射击情况稳定.1.(2016·湖州模拟)某工厂在12月份共生产了3 600双皮靴,在出厂前要检查这批产品的质量,决定采用分层抽样的方法进行抽取,若从一、二、三车间抽取的产品数分别为a,b,c,且a,b,c构成等差数列,则第二车间生产的产品数为________.解析:因为a,b,c成等差数列,所以2b=a+c,即第二车间抽取的产品数占抽样产品总数的三分之一,根据分层抽样的性质可知,第二车间生产的产品数占总数的三分之一,即为1 200双皮靴.答案:1 2002.(2016·北京海淀区模拟)某企业三个分厂生产同一种电子产品,三个分厂产量分布如图所示,现在用分层抽样方法从三个分厂生产的该产品中共抽取100件做使用寿命的测试,则第一分厂应抽取的件数为________;由所得样品的测试结果计算出一、二、三分厂取出的产品的使用寿命平均值分别为1 020小时、980小时、1 030小时,估计这个企业所生产的该产品的平均使用寿命为________小时.解析:第一分厂应抽取的件数为100×50%=50;该产品的平均使用寿命为1 020×0.5+980×0.2+1 030×0.3=1 015.答案:50 1 0153.为了研究大学生就业后的收入问题,一个研究机构调查了在2009年已经就业且工作满两年的10 000人,并根据所得数据画了样本的频率分布直方图(如图所示).为了分析其收入与学历、职业、性别等方面的关系,要从这10 000人中再用分层抽样方法抽出200人作进一步调查,其中月收入低于1 500元的称为低收入者,高于3 000元的称为高收入者,则应在低收入者和高收入者中分别抽取的人数是________.解析:低收入者的频率是0.000 2×500=0.1,故从低收入者中抽取200×0.1=20人;高收入者的频率是(0.000 3+0.000 1)×500=0.2,故从高收入者中抽取200×0.2=40人.答案:20,404.某班有48名学生,在一次考试中统计出平均分为70分,方差为75,后来发现有2名同学的分数登记错了,甲实得80分,却记了50分,乙实得70分,却记了100分,更正后平均分和方差分别是________.解析:因为甲少记了30分,乙多记了30分,故平均分不变,设更正后的方差为s2,则由题意可得:s2=148[(x1-70)2+(x2-70)2+…+(80-70)2+(70-70)2+…+(x48-70)2],而更正前有75=148[(x1-70)2+(x2-70)2+…+(50-70)2+(100-70)2+…+(x48-70)2],化简整理得s2=50.答案:70,505.某学校为准备参加市运动会,对本校甲、乙两个田径队中30名跳高运动员进行了测试,并采用茎叶图表示本次测试30人的跳高成绩(单位:cm),跳高成绩在175 cm以上(包括175 cm)定义为“合格”,跳高成绩在175 cm以下(不包括175 cm)定义为“不合格”.(1)如果用分层抽样的方法从甲、乙两队所有的运动员中共抽取5人,则5人中“合格”与“不合格”的人数各为多少?(2)若从甲队178 cm(包括178 cm)以上的6人中抽取2人,则至少有一人在186 cm以上(包括186 cm)的概率为多少?解:(1)根据茎叶图可知,30人中有12人“合格”,有18人“不合格”.用分层抽样的方法,则5人中“合格”与“不合格”的人数分别为2人、3人.(2)甲队178 cm(包括178 cm)以上的6人中抽取2人的基本事件为(178,181),(178,182),(178,184),(178,186),(178,191),(181,182),(181,184),(181,186),(181,191),(182,184),(182,186),(182,191),(184,186),(184,191),(186,191),共15个.其中都不在186 cm以上的基本事件为(178,181),(178,182),(178,184),(181,182),(181,184),(182,184),共6个.所以都不在186 cm 以上的概率P =615=25,由对立事件的概率公式得,至少有一人在186 cm 以上(包括186 cm)的概率为1-P =1-25=35. 6.(2016·潍坊联考)交通指数是交通拥堵指数的简称,是综合反映道路网畅通或拥堵的概念,记交通指数为T ,其范围为[0,10],分别有五个级别:T ∈[0,2)畅通;T ∈[2,4)基本畅通;T ∈[4,6)轻度拥堵;T ∈[6,8)中度拥堵;T ∈[8,10]严重拥堵.晚高峰时段(T≥2),从某市交通指挥中心选取了市区20个交通路段,依据其交通指数数据绘制的部分直方图如图所示.(1)请补全直方图,并求出轻度拥堵、中度拥堵、严重拥堵路段各有多少个;(2)用分层抽样的方法从交通指数在[4,6),[6,8),[8,10]的路段中共抽取6个路段,求依次抽取的三个级别路段的个数;(3)从(2)中抽出的6个路段中任取2个,求至少1个路段为轻度拥堵的概率.解:(1)补全直方图如图:由直方图可知:(0.1+0.2)×1×20=6,(0.25+0.2)×1×20=9,(0.1+0.05)×1×20=3.所以这20个路段中,轻度拥堵、中度拥堵、严重拥堵的路段分别为6个、9个、3个.(2)由(1)知拥堵路段共有6+9+3=18个,按分层抽样从18个路段中选出6个,每种情况分别为:618×6=2,618×9= 3,618×3=1,即这三个级别路段中分别抽取的个数为2,3,1. (3)记(2)中选取的2个轻度拥堵路段为A 1,A 2,选取的3个中度拥堵路段为B 1,B 2,B 3,选取的1个严重拥堵路段为C 1,则从6个路段选取2个路段的可能情况如下:(A1,A2),(A1,B1),(A1,B2),(A1,B3),(A1,C1),(A2,B1),(A2,B2),(A2,B3),(A2,C1),(B1,B2),(B1,B3),(B1,C1),(B2,B3),(B2,C1),(B3,C1),共15种可能.其中至少有1个轻度拥堵的有:(A1,A2),(A1,B1),(A1,B2),(A1,B3),(A1,C1),(A2,B1),(A2,B2),(A2,B3),(A2,C1),共9种可能.所以所选2个路段中至少1个路段轻度拥堵的概率为915=35.。