全国版2019版高考数学一轮复习第9章统计统计案例第1讲随机抽样增分练
- 格式:doc
- 大小:48.00 KB
- 文档页数:4
板块四模拟演练·提能增分[A级基础达标]1.[2017·全国卷Ⅰ]为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数答案 B解析因为可以用极差、方差或标准差来描述数据的离散程度,所以要评估亩产量稳定程度,应该用样本数据的极差、方差或标准差.故选B.2.[2018·湖南模拟]在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是() A.3 B.4 C.5 D.6答案 B解析由茎叶图可知,在区间[139,151]的人数为20,再由系统抽样的性质可知人数为20×735=4人.3.[2018·广州联考]学校为了解学生在课外读物方面的支出情况,抽取了n 位同学进行调查,结果显示这些同学的支出都在[10,50)(单位:元),其中支出在[30,50)(单位:元)的同学有67人,其频率分布直方图如图所示,则n 的值为( )A.100 B .120 C .130 D .390 答案 A解析 由图知[10,30)的频率为:(0.023+0.01)×10=0.33,[30,50)的频率为1-0.33=0.67,所以n =670.67=100,故选A.4.[2018·郑州质量预测]PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物.如图是根据某地某日早7点到晚8点甲、乙两个PM2.5监测点统计的数据(单位:毫克/立方米)列出的茎叶图,则甲、乙两地浓度的方差较小的是( )A .甲B .乙C .甲、乙相等D .无法确定答案 A解析 从茎叶图上可以观察到:甲监测点的样本数据比乙监测点的样本数据更加集中,因此甲地浓度的方差较小.5.甲、乙两人在一次射击比赛中射靶5次,两人成绩的条形统计图如图所示,则( )A.甲的成绩的平均数小于乙的成绩的平均数 B .甲的成绩的中位数等于乙的成绩的中位数 C .甲的成绩的方差小于乙的成绩的方差 D .甲的成绩的极差小于乙的成绩的极差 答案 C解析 甲的平均数是4+5+6+7+85=6,中位数是6,极差是4,方差是(-2)2+(-1)2+02+12+225=2;乙的平均数是5+5+5+6+95=6,中位数是5,极差是4,方差是(-1)2+(-1)2+(-1)2+02+325=125,故选C.6.[2018·金华模拟]设样本数据x 1,x 2,…,x 10的均值和方差分别为1和4,若y i =x i +a (a 为非零常数,i =1,2,…,10),则y 1,y 2,…,y 10的均值和方差分别为( )A .1+a,4B .1+a,4+aC .1,4D .1,4+a答案 A解析 由均值和方差的定义及性质可知:y =x +a =1+a ,s 2y =s 2x =4.故选A.7.[2015·重庆高考]重庆市2013年各月的平均气温(℃)数据的茎叶图如下:则这组数据的中位数是()A.19 B.20 C.21.5 D.23答案 B解析由茎叶图知,平均气温在20 ℃以下的有5个月,在20 ℃以上的也有5个月,恰好是20 ℃的有2个月,由中位数的定义知,这组数据的中位数为20.选B.8.[2018·聊城模拟]某校女子篮球队7名运动员身高(单位:厘米)分布的茎叶图如图,已知记录的平均身高为175 cm,但有一名运动员的身高记录不清楚,其末位数记为x,那么x的值为________.答案 2解析由题意有:175×7=180×2+170×5+1+1+2+x+4+5⇒x=2.9.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):________.答案甲解析x甲=x乙=9,s2甲=15×[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=25,s2乙=15×[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=65>s2甲,故甲更稳定.10.某学校随机抽取部分新生调查其上学所需时间(单位:分钟),并将所得数据绘制成频率分布直方图(如图),其中,上学所需时间的范围是[0,100],样本数据分组为[0,20),[20,40),[40,60),[60,80),[80,100].则(1)图中的x=________;(2)若上学所需时间不少于1小时的学生可申请在学校住宿,则该校600名新生中估计有________名学生可以申请住宿.答案(1)0.0125(2)72解析x等于该组的频率除以组距20.由频率分布直方图知20x=1-20×(0.025+0.0065+0.003+0.003),解得x=0.0125.上学时间不少于1小时的学生频率为0.12,因此估计有0.12×600=72(名)学生可以申请住宿.[B级知能提升]1.为了了解某校高三美术生的身体状况,抽查了部分美术生的体重,将所得数据整理后,作出了如图所示的频率分布直方图.已知图中从左到右的前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,则被抽查的美术生的人数是()A.35 B.48 C.60 D.75答案 C解析设被抽查的美术生的人数为n,因为后2个小组的频率之和为(0.0375+0.0125)×5=0.25,所以前3个小组的频率之和为0.75.又前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,所以前3个小组的频数分别为5,15,25,所以n=5+15+250.75=60.2.[2015·安徽高考]若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为()A.8 B.15 C.16 D.32答案 C解析已知样本数据x1,x2,…,x10的标准差为s=8,则s2=64,数据2x1-1,2x2-1,…,2x10-1的方差为22s2=22×64,所以其标准差为22×64=2×8=16.3.如图所示的茎叶图是甲、乙两组各5名学生的数学竞赛成绩(70~99分),若甲、乙两组学生的平均成绩一样,则a=________;甲、乙两组学生的成绩相对整齐的是________.答案 5 甲组解析 由题意可知75+88+89+98+90+a5= 76+85+89+98+975=89,解得a =5.因为s 2甲=15×(142+1+0+92+62)=3145,s 2乙=15×(132+42+0+92+82)=3305,所以s 2甲<s 2乙,故成绩相对整齐的是甲组.4.[2018·南宁模拟]某班级准备从甲、乙两人中选一人参加某项比赛,已知在一个学期10次考试中,甲、乙两人的成绩(单位:分)的茎叶图如图所示.(1)你认为选派谁参赛更合适?并说明理由;(2)若从甲、乙两人90分以上的成绩中各随机抽取1次,求抽到的2次成绩均大于95分的概率.解 (1)由茎叶图可知,甲的平均成绩,x -甲=79+84+85+87+87+88+93+94+96+9710=89,乙的平均成绩x -乙=75+77+85+88+89+89+95+96+97+9910=89,甲、乙的平均成绩相等.又甲成绩的方差s 2甲=110[(79-89)2+(84-89)2+(85-89)2+(87-89)2+(87-89)2+(88-89)2+(93-89)2+(94-89)2+(96-89)2+(97-89)2]=30.4,乙成绩的方差s2乙=110[(75-89)2+(77-89)2+(85-89)2+(88-89)2+(89-89)2+(89-89)2+(95-89)2+(96-89)2+(97-89)2+(99-89)2]=60.6,故甲成绩的方差小于乙成绩的方差,因此选派甲参赛更合适.(2)从甲、乙两人90分以上的成绩中各随机抽取1次的不同结果有(93,95),(93,96),(93,97),(93,99),(94,95),(94,96),(94,97),(94,99),(96,95),(96,96),(96,97),(96,99),(97,95),(97,96),(97,97),(97,99),共16种.记“抽到的2次成绩均大于95分”为事件A,则事件A的结果有(96,96),(96,97),(96,99),(97,96),(97,97),(97,99),共6种.因此抽到的2次成绩均大于95分的概率P(A)=616=38.5.[2017·云南统一检测]某校1200名高三年级学生参加了一次数学测验(满分为100分),为了分析这次数学测验的成绩,从这1200人的数学成绩中随机抽取200人的成绩绘制成如下的统计表,请根据表中提供的信息解决下列问题:(1)(2)如果从这1200名学生中随机抽取一人,试估计这名学生该次数学测验及格的概率P(注:60分及60分以上为及格);(3)试估计这次数学测验的年级平均分.解(1)由题意可得,b=1-(0.015+0.125+0.5+0.31)=0.05,a=200×0.05=10,c=200×0.5=100.(2)根据已知,在抽出的200人的数学成绩中,及格的有162人.∴P=162200=81100=0.81.(3)这次数学测验样本的平均分为x-=16×3+32.1×10+55×25+74×100+88×62200=73,∴这次数学测验的年级平均分大约为73分.。
第九章统计与统计案例第一节随机抽样[基础知识深耕]一、简单随机抽样1.设一个总体含有N个个体,从中逐个不放回地抽取n 个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.2.简单随机抽样的常用方法最常用的简单随机抽样有抽签法和随机数法:(1)抽签法:把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.(2)随机数法:利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫做随机数法.二、系统抽样假设要从容量为N 的总体中抽取容量为n 的样本.1.先将总体的N 个个体编号.2.确定分段间隔k ,对编号进行分段,当N n 是整数时,取k =N n ,当N n 不是整数时,随机从总体中剔除余数,再取k =⎣⎢⎡⎦⎥⎤N n . 3.在第1段用简单随机抽样确定第一个个体编号l (l ≤k ).4.按照一定的规则抽取样本,通常是将l 加上间隔k 得到第2个个体编号(l +k ),再加k 得到第3个个体编号(l +2k ),依次进行下去,直到获取整个样本.这种抽样方法是一种系统抽样.三、分层抽样1.定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是分层抽样.2.应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.【方法技巧】分层抽样中的比例关系(1)抽样比=样本容量个体总量=各层样本容量各层个体数量;(2)层1的数量∶层2的数量∶层3的数量=样本1的容量∶样本2的容量∶样本3的容量.[基础能力提升]1.给出下列命题正确的是()①简单随机抽样是一种不放回抽样;②简单随机抽样每个个体被抽到的机会不一样,与先后有关;③系统抽样在起始部分抽样时采用简单随机抽样;④要从1 002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平;⑤分层抽样中,每个个体被抽到的可能性与层数及分层有关.A.①②③④⑤B.①②④⑤C.①③④⑤D.①③【解析】简单随机抽样是不放回地、等可能抽样,故②④⑤错误.【答案】 D2.将参加英语口语测试的1 000名学生编号为000,001,002,…,999,从中抽取一个容量为50的样本,按系统抽样的方法分为50组,如果第一组编号为000,001,002,…,019,且第一组随机抽取的编号为015,则抽取的第35个编号为()A.700 B.669C.695 D.676【解析】第35个编号为15+(35-1)×20=695.【答案】 C3.要完成下列两项调查:①从某社区125户高收入家庭,280户中等收入家庭,95户低收入家庭中选出100户调查社会购买力的某项指标;②从某中学的15名艺术特长生中选出3人调查学习负担情况.宜采用的抽样方法依次为()A.①简单随机抽样法,②系统抽样法B.①分层抽样法,②简单随机抽样法C.①系统抽样法,②分层抽样法D.①②都用分层抽样法【解析】①中由于收入差别较大,宜于用分层抽样,②中个数较少,宜于用简单随机抽样.【答案】 B4.某工厂生产A、B、C三种不同型号的产品,产品数量之比依次为2∶3∶5,现用分层抽样方法抽出一个容量为n 的样本,样本中A型产品有16件,那么此样本容量n=________.【解析】依题意A、B、C三种不同型号样本个数之比为2∶3∶5,∴样本中B型产品有24件,C型产品有40件,∴n =16+24+40=80.【答案】80三种抽样方法的区别与联系第二节用样本估计总体[基础知识深耕]一、用样本的频率分布估计总体分布1.频率分布表与频率分布直方图频率分布表与频率分布直方图的绘制步骤如下:(1)求极差,即求一组数据中最大值与最小值的差.(2)确定组距与组数.(3)将数据分组.(4)列频率分布表.落在各小组内的数据的个数叫做频数,每小组的频数与数据总数的比值叫做这一小组的频率.计算各小组的频率,列出频率分布表.(5)画频率分布直方图.依据频率分布表画频率分布直方图,其中纵坐标(小长方形的高)表示频率与组距的比值,其相应组距上的频率等于该组上的小长方形的面积,即每个小长方形的面积=组距×频率组距=频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组的频率的大小,各个小长方形面积的总和等于1.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.3.茎叶图统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数.用茎叶图刻画数据有两个优点:a.所有的信息都可以从图中得到;b.茎叶图便于数据的记录和表示,能够展示数据的分布情况.但当样本数据较多或数据位数较多时,茎叶图就显得不太方便.二、用样本的数字特征估计总体的数字特征1.众数、中位数、平均数2.标准差和方差(1)标准差是样本数据到平均数的一种平均距离.(2)标准差:s=1n[(x1-x)2+(x2-x)2+…+(x n-x)2].(3)方差:s2=1n[(x1-x)2+(x2-x)2+…+(x n-x)2](x n是样本数据,n是样本容量,x是样本平均数).【拓展延伸】平均数、方差的公式推广(1)若数据x1,x2,…,x n的平均数为x,那么mx1+a,mx2+a,mx3+a,…,mx n+a的平均数是m x+a.(2)数据x1,x2,…,x n的方差为s2.①数据x1+a,x2+a,…,x n+a的方差也为s2;②数据ax1,ax2,…,ax n的方差为a2s2.[基础能力提升]1.给出下列命题,正确的是()①在频率分布直方图中,小矩形的高表示频率;②频率分布直方图中各个长方形的面积之和为1;③茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次;④在频率分布直方图中,最高的小长方形底边中点的横坐标是众数;⑤在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.A.①②③④⑤B.①②C.②③④D.②④【解析】只有②④正确,①③⑤均错误.【答案】 D2.某雷达测速区规定:凡车速大于或等于70 km/h的汽车视为“超速”,并将受到处罚.如图是某路段的一个检测点对200辆汽车的车速进行检测所得结果的频率分布直方图,则从图9-2-1中可以看出被处罚的汽车大约有() A.30辆B.40辆C.60辆D.80辆图9-2-1【解析】由题图可知,车速大于或等于70 km/h的汽车的频率为0.02×10=0.2,则将被处罚的汽车大约有200×0.2=40(辆).【答案】 B3.若某校高一年级8个班参加合唱比赛的得分如茎叶图9-2-2所示,则这组数据的中位数图9-2-2和平均数分别是()A.91.5和91.5B.91.5和92C.91和91.5D.92和92【解析】这组数据由小到大排列为87,89,90,91,92,93,94,96.∴中位数是91+922=91.5.平均数x=87+89+90+91+92+93+94+968=91.5.【答案】 A4.某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差s2=________.【解析】 x =10+6+8+5+65=7, s 2=15[(10-7)2+(6-7)2+(8-7)2+(5-7)2+(6-7)2]=165=3.2. 【答案】3.21.两点注意(1)频率分布直方图与条形统计图不同.(2)①众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量,与每个样本数据有关,这是中位数、众数所不具有的性质.②标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度就越大.2.三个特征利用频率分布直方图估计样本的数字特征:(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数值.(2)平均数:平均数的估计值等于每个小矩形的面积乘以矩形底边中点横坐标之和.(3)众数:最高的矩形的中点的横坐标.第三节变量间的相关关系、统计案例[基础知识深耕]一、相关关系与回归方程1.相关关系的分类(1)正相关:从散点图上看,点散布在从左下角到右上角的区域内.(2)负相关:从散点图上看,点散布在从左上角到右下角的区域内.2.线性相关关系从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫回归直线.3.回归方程(1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫最小二乘法.(2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(x n,y n),其回归方程为y^=b^x+a^,则b^=∑ni=1(x i-x)(y i-y)∑ni=1(x i-x)2=∑ni=1x i y i-n x y∑ni=1x2i-n x2,a^=y-b^x,其中,b^是回归方程的回归系数,a^是在y轴上的截距,(x,y)是样本点的中心.4.样本相关系数r=∑ni=1(x i-x)(y i-y)∑ni=1(x i-x)2∑ni=1(y i-y)2,用它来衡量两个变量间的线性相关关系.(1)当r>0时,表明两个变量正相关;(2)当r<0时,表明两个变量负相关;(3)r的绝对值越接近1,表明两个变量的线性相关性越强;r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r|>0.75时,认为两个变量有很强的线性相关关系.二、独立性检验1.2×2列联表假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称2×2列联表)为:2.K2统计量K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)(其中n=a+b+c+d为样本容量).[基础能力提升] 1.已知x,y的取值如表所示:如果y与x呈线性相关,且回归方程为y^=b^x+72,则b^等于()A.-12 B.12C.-110 D.110【解析】∵x=2+3+43=3,y=5+4+63=5.∴5=3b^+72,∴b^=12.【答案】 B2.两个变量y与x的回归模型中,分别选择了4个不同模型,它们的R2如下,其中拟合效果最好的模型是()A.模型1 B.模型2 C.模型3 D.模型4【解析】∵0.98>0.80>0.50>0.25,∴模型1最好.【答案】 A3.下面是2×2列联表:则表中a,b的值分别为()A.94,72 B.52,50C.52,74 D.74,52【解析】∵a+21=73,∴a=52.又a+22=b,∴b=74.【答案】 C4.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算K2的观测值k=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________的(填“有关”或“无关”).【解析】∵k=27.63>6.635,∴有99%的把握认为“打鼾与患心脏病有关”.【答案】有关1.一个区别——相关关系与函数关系函数关系是一种确定性关系,体现的是因果关系;而相关关系是一种非确定性关系,体现的不一定是因果关系,可能是伴随关系.2.三点注意——回归分析与独立性检验的有效性(1)回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.(2)根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.(3)独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.。
第2讲用样本估计总体板块一知识梳理·自主学习[必备知识]考点1用样本的频率分布估计总体分布1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差).(2)决定组距与组数.(3)将数据分组.(4)列频率分布表.(5)画频率分布直方图.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线.3.茎叶图茎是指中间的一列数,叶是从茎的旁边生长出来的数.考点2用样本的数字特征估计总体的数字特征1.众数:一组数据中出现次数最多的数.2.中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数.3.平均数:x-=x1+x2+…+x nn,反映了一组数据的平均水平.4.标准差:是样本数据到平均数的一种平均距离,s=1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2]. 5.方差:s 2=1n [(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2](x n 是样本数据,n 是样本容量,x -是样本平均数).[必会结论]频率分布直方图与众数、中位数与平均数的关系(1)最高的小长方形底边中点的横坐标即是众数.(2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.[考点自测]1.判断下列结论的正误.(正确的打“√”,错误的打“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( )(2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( )(3)一组数据的方差越大,说明这组数据越集中.( )(4)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( )(5)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( )答案 (1)√ (2)× (3)× (4)√ (5)×2.[2017·芜湖模拟]某市中心购物商场在“双11”开展的“买三免一”促销活动异常火爆,对当日8时至22时的销售额进行统计,以组距为2小时的频率分布直方图如图所示,已知12时至16时的销售额为90万元,则10时至12时销售额为( )A.120万元 B .100万元 C .80万元 D .60万元答案 D解析 由图可知12时至16时频率为0.45,销售额90万元,10时至12时频率为0.3,销售额为0.30.45×90=60万元.故选D.3.如图是2017年某大学自主招生面试环节中,七位评委为某考生打出的分数的茎叶图,去掉一个最高分和一个最低分后,所剩数据的平均数和众数依次为( )A .85,84B .84,85C .86,84D .84,86答案 A解析 由图可知去掉一个最高分和一个最低分后,所剩数据为84,84,86,84,87,则平均数为85,众数为84.4.[课本改编]在样本频率分布直方图中,共有9个小长方形,若中间一个小长方形的面积等于其他8个长方形的面积和的25,且样本容量为140,则中间一组的频数为( )A .28B .40C .56D .60答案 B解析 设中间一个小长方形面积为x ,其他8个长方形面积为52x ,因此x +52x =1,∴x =27.所以中间一组的频数为140×27=40.故选B.5.[2015·湖北高考]某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a =________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.答案 (1)3 (2)6000解析 (1)由0.1×1.5+0.1×2.5+0.1×a +0.1×2.0+0.1×0.8+0.1×0.2=1,解得a =3.(2)区间[0.3,0.5)内的频率为0.1×1.5+0.1×2.5=0.4,故[0.5,0.9]内的频率为1-0.4=0.6.因此,消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10000=6000.板块二 典例探究·考向突破考向 频率分布直方图的应用例 1 [2016·山东高考]某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56 B.60 C.120 D.140答案 D解析由频率分布直方图知这200名学生每周的自习时间不少于22.5小时的频率为1-(0.02+0.10)×2.5=0.7,则这200名学生中每周的自习时间不少于22.5小时的人数为200×0.7=140.故选D.触类旁通应用频率分布直方图应注意的问题(1)频率分布直方图是从各个小组数据在样本容量中所占比例大小的角度,表示数据分布的规律.(2)图中各小长方形的面积等于相应各组的频率,它直观反映了数据在各个小组的频率的大小.(3)要把握一个基本公式:频率=频数样本容量.【变式训练1】为了解某校高三学生联考的数学成绩情况,从该校参加联考学生的数学成绩中抽取一个样本,并分成五组,绘成如图所示的频率分布直方图,已知第一组至第五组的频率之比为1∶2∶8∶6∶3,第五组的频数为6,则样本容量为________.答案40解析因为第一组至第五组的频率之比为1∶2∶8∶6∶3,所以可设第一组至第五组的频率分别为k,2k,8k,6k,3k,又频率之和为1,所以k+2k+8k+6k+3k=1,解得k=120=0.05,所以第五组的频率为3×0.05=0.15,又第五组的频数为6,所以样本容量为60.15=40.考向茎叶图的应用例2[2017·山东高考]如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为()A.3,5 B.5,5 C.3,7 D.5,7答案 A解析甲组数据的中位数为65,由甲、乙两组数据的中位数相等得y=5.又甲、乙两组数据的平均值相等,∴15×(56+65+62+74+70+x )=15×(59+61+67+65+78),∴x =3.故选A.触类旁通茎叶图的绘制及应用(1)一般制作茎叶图的方法是:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大顺序由上到下列出.(2)估计数字特征,给定两组数据的茎叶图,“重心”下移者平均数较大,数据集中者方差较小.【变式训练2】 [2018·长沙模拟]下面的茎叶图是某班学生在一次数学测试时的成绩:根据茎叶图,得出该班男、女生数学成绩的四个统计结论,其中错误的一项是( )A .15名女生成绩的平均分为78B .17名男生成绩的平均分为77C .女生成绩和男生成绩的中位数分别为82,80D .男生中的高分段和低分段均比女生多,相比较男生两极分化比较严重答案 C解析 15名女生成绩的平均分为115×(90+93+80+80+82+82+83+83+85+70+71+73+75+66+57)=78,A 正确;17名男生成绩的平均分为117×(93+93+96+80+82+83+86+86+88+71+74+75+62+62+68+53+57)=77,故B正确;观察茎叶图,对男生、女生成绩进行比较,可知男生两极分化比较严重,D正确;根据女生和男生成绩数据分析可得,两组数据的中位数均为80,C错误.考向数字特征的应用命题角度1样本数字特征与直方图交汇例3[2018·益阳模拟]为了了解某校九年级1600名学生的体能情况,随机抽查了部分学生,测试1分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图所示的频率分布直方图,根据统计图的数据,下列结论错误的是()A.该校九年级学生1分钟仰卧起坐的次数的中位数为26.25B.该校九年级学生1分钟仰卧起坐的次数的众数为27.5C.该校九年级学生1分钟仰卧起坐的次数超过30的人数约为320D.该校九年级学生1分钟仰卧起坐的次数少于20的人数约为32答案 D解析由频率分布直方图可知,中位数是频率分布直方图面积等分线对应的数值,是26.25;众数是最高矩形的中间值27.5;1分钟仰卧起坐的次数超过30的频率为0.2,所以估计1分钟仰卧起坐的次数超过30的人数为320;1分钟仰卧起坐的次数少于20的频率为0.1,所以估计1分钟仰卧起坐的次数少于20的人数为160.故D错.命题角度2样本的数字特征与茎叶图例4将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:则7个剩余分数的方差为________.答案36 7解析由图可知去掉的两个数是87,99,所以87+90×2+91×2+94+90+x=91×7,x=4.s2=17[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=36 7.命题角度3样本的数字特征与优化决策问题例5某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔30 min抽取一包产品,称其重量,分别记录抽查数据如下:甲:102,101,99,98,103,98,99;乙:110,115,90,85,75,115,110.(1)这种抽样方法是哪一种?(2)将这两组数据用茎叶图表示;(3)将两组数据比较,说明哪个车间的产品较稳定.解(1)因为间隔时间相同,所以是系统抽样.(2)茎叶图如下:(3)甲车间:平均值:x1=17(102+101+99+98+103+98+99)=100,方差:s21=17[(102-100)2+(101-100)2+…+(99-100)2]=247.乙车间:平均值:x2=17(110+115+90+85+75+115+110)=100,方差:s22=17[(110-100)2+(115-100)2+…+(110-100)2]=16007.∵x1=x2,s21<s22,∴甲车间的产品较稳定.触类旁通(1)用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似.实际应用中,需先计算数据的平均数,分析平均水平,再计算方差(标准差)分析稳定情况.(2)若给出图形,一方面可以由图形得到相应的样本数据,再计算平均数、方差(标准差);另一方面,可以从图形直观分析样本数据的分布情况,大致判断平均数的范围,并利用数据的波动性大小比较方差(标准差)的大小.核心规律1.由于平均数与每一个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变,这是中位数、众数都不具有的性质.2.众数考查各数据出现的频率,其大小只与这组数据中的部分数据有关.当一组数据中有不少数据多次重复出现时,其众数往往更能反映问题.3.某些数据的变动对中位数可能没有影响.中位数可能出现在所给数据中,也可能不在所给数据中.当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势.满分策略1.正确理解频率分布直方图(1)纵轴表示频率组距,即小长方形的高=频率组距; (2)小长方形的面积=组距×频率组距=频率; (3)数据落在各小组内的频率用各小长方形的面积表示,各小长方形的面积总和等于1.2.茎叶图中一定要分清茎、叶的含义.3.求解中位数时一定要注意先对原始数据进行排序后才能求解.板块三 启智培优·破译高考易错警示系列11——频率分布直方图中概念不清致误[2016·四川高考]我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a 的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;(3)估计居民月均用水量的中位数.错因分析 (1)在频率分布直方图中,小矩形的面积表示频率,纵坐标表示频率组距,解本题时,易把纵坐标误认为频率而致误. (2)频率分布直方图中中位数左右两边小长方形的面积相等,解本题时由于中位数的概念不清易出错.解 (1)由频率分布直方图,可知:月均用水量在 [0,0.5)的频率为0.08×0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a +0.5×a ,解得a =0.30.(2)由(1)知,100位居民月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300000×0.12=36000.(3)设中位数为x 吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5,而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5,所以2≤x <2.5.由0.50×(x -2)=0.5-0.48,解得x =2.04.故可估计居民月均用水量的中位数为2.04.答题启示 条形统计图(直方图)中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值.跟踪训练某城市100户居民的月平均用电量(单位:度),以[160, 180),[180, 200),[200, 220),[220, 240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?解 (1)依题意,20×(0.002+0.0095+0.011+0.0125+x +0.005+0.0025)=1,解得x =0.0075.(2)由图可知,最高矩形的数据组为[220,240),∴众数为220+2402=230. ∵[160,220)的频率之和为(0.002+0.0095+0.011)×20=0.45,依题意,设中位数为y ,∴0.45+(y -220)×0.0125=0.5.解得y =224,∴中位数为224.(3)月平均用电量在[220,240)的用户在四组用户中所占比例为0.01250.0125+0.0075+0.005+0.0025=511,∴月平均用电量在[220,240)的用户中应抽取11×511=5户.板块四模拟演练·提能增分[A级基础达标]1.[2017·全国卷Ⅰ]为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数答案 B解析因为可以用极差、方差或标准差来描述数据的离散程度,所以要评估亩产量稳定程度,应该用样本数据的极差、方差或标准差.故选B.2.[2018·湖南模拟]在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是() A.3 B.4 C.5 D.6答案 B解析由茎叶图可知,在区间[139,151]的人数为20,再由系统抽样的性质可知人数为20×735=4人.3.[2018·广州联考]学校为了解学生在课外读物方面的支出情况,抽取了n位同学进行调查,结果显示这些同学的支出都在[10,50)(单位:元),其中支出在[30,50)(单位:元)的同学有67人,其频率分布直方图如图所示,则n的值为()A.100 B.120 C.130 D.390答案 A解析由图知[10,30)的频率为:(0.023+0.01)×10=0.33,[30,50)的频率为1-0.33=0.67,所以n=670.67=100,故选A.4.[2018·郑州质量预测]PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物.如图是根据某地某日早7点到晚8点甲、乙两个PM2.5监测点统计的数据(单位:毫克/立方米)列出的茎叶图,则甲、乙两地浓度的方差较小的是()A.甲B.乙C .甲、乙相等D .无法确定答案 A 解析 从茎叶图上可以观察到:甲监测点的样本数据比乙监测点的样本数据更加集中,因此甲地浓度的方差较小.5.甲、乙两人在一次射击比赛中射靶5次,两人成绩的条形统计图如图所示,则( )A.甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差答案 C解析 甲的平均数是4+5+6+7+85=6,中位数是6,极差是4,方差是(-2)2+(-1)2+02+12+225=2;乙的平均数是5+5+5+6+95=6,中位数是5,极差是4,方差是(-1)2+(-1)2+(-1)2+02+325=125,故选C.6.[2018·金华模拟]设样本数据x 1,x 2,…,x 10的均值和方差分别为1和4,若y i =x i +a (a 为非零常数,i =1,2,…,10),则y 1,y 2,…,y 10的均值和方差分别为( )A .1+a,4B .1+a,4+aC .1,4D .1,4+a答案 A解析由均值和方差的定义及性质可知:y=x+a=1+a,s2y=s2x=4.故选A.7.[2015·重庆高考]重庆市2013年各月的平均气温(℃)数据的茎叶图如下:则这组数据的中位数是()A.19 B.20 C.21.5 D.23答案 B解析由茎叶图知,平均气温在20 ℃以下的有5个月,在20 ℃以上的也有5个月,恰好是20 ℃的有2个月,由中位数的定义知,这组数据的中位数为20.选B.8.[2018·聊城模拟]某校女子篮球队7名运动员身高(单位:厘米)分布的茎叶图如图,已知记录的平均身高为175 cm,但有一名运动员的身高记录不清楚,其末位数记为x,那么x的值为________.答案 2解析由题意有:175×7=180×2+170×5+1+1+2+x+4+5⇒x=2.9.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):99________.答案 甲 解析 x 甲=x 乙=9,s 2甲=15×[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=25, s 2乙=15×[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=65>s 2甲,故甲更稳定.10.某学校随机抽取部分新生调查其上学所需时间(单位:分钟),并将所得数据绘制成频率分布直方图(如图),其中,上学所需时间的范围是[0,100],样本数据分组为[0,20),[20,40),[40,60),[60,80),[80,100].则(1)图中的x =________;(2)若上学所需时间不少于1小时的学生可申请在学校住宿,则该校600名新生中估计有________名学生可以申请住宿.答案 (1)0.0125 (2)72解析 x 等于该组的频率除以组距20.由频率分布直方图知20x =1-20×(0.025+0.0065+0.003+0.003),解得x =0.0125.上学时间不少于1小时的学生频率为0.12,因此估计有0.12×600=72(名)学生可以申请住宿.[B级知能提升]1.为了了解某校高三美术生的身体状况,抽查了部分美术生的体重,将所得数据整理后,作出了如图所示的频率分布直方图.已知图中从左到右的前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,则被抽查的美术生的人数是()A.35 B.48 C.60 D.75答案 C解析设被抽查的美术生的人数为n,因为后2个小组的频率之和为(0.0375+0.0125)×5=0.25,所以前3个小组的频率之和为0.75.又前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,所以前3个小组的频数分别为5,15,25,所以n=5+15+250.75=60.2.[2015·安徽高考]若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为()A.8 B.15 C.16 D.32答案 C解析已知样本数据x1,x2,…,x10的标准差为s=8,则s2=64,数据2x1-1,2x2-1,…,2x10-1的方差为22s2=22×64,所以其标准差为22×64=2×8=16.3.如图所示的茎叶图是甲、乙两组各5名学生的数学竞赛成绩(70~99分),若甲、乙两组学生的平均成绩一样,则a=________;甲、乙两组学生的成绩相对整齐的是________.答案 5 甲组解析 由题意可知75+88+89+98+90+a 5= 76+85+89+98+975=89,解得a =5.因为s 2甲=15×(142+1+0+92+62)=3145,s 2乙=15×(132+42+0+92+82)=3305,所以s 2甲<s 2乙,故成绩相对整齐的是甲组.4.[2018·南宁模拟]某班级准备从甲、乙两人中选一人参加某项比赛,已知在一个学期10次考试中,甲、乙两人的成绩(单位:分)的茎叶图如图所示.(1)你认为选派谁参赛更合适?并说明理由;(2)若从甲、乙两人90分以上的成绩中各随机抽取1次,求抽到的2次成绩均大于95分的概率.解 (1)由茎叶图可知,甲的平均成绩,x -甲=79+84+85+87+87+88+93+94+96+9710=89,乙的平均成绩x -乙=75+77+85+88+89+89+95+96+97+9910=89,甲、乙的平均成绩相等.又甲成绩的方差s2甲=110[(79-89)2+(84-89)2+(85-89)2+(87-89)2+(87-89)2+(88-89)2+(93-89)2+(94-89)2+(96-89)2+(97-89)2]=30.4,乙成绩的方差s2乙=110[(75-89)2+(77-89)2+(85-89)2+(88-89)2+(89-89)2+(89-89)2+(95-89)2+(96-89)2+(97-89)2+(99-89)2]=60.6,故甲成绩的方差小于乙成绩的方差,因此选派甲参赛更合适.(2)从甲、乙两人90分以上的成绩中各随机抽取1次的不同结果有(93,95),(93,96),(93,97),(93,99),(94,95),(94,96),(94,97),(94,99),(96,95),(96,96),(96,97),(96,99),(97,95),(97,96),(97,97),(97,99),共16种.记“抽到的2次成绩均大于95分”为事件A,则事件A的结果有(96,96),(96,97),(96,99),(97,96),(97,97),(97,99),共6种.因此抽到的2次成绩均大于95分的概率P(A)=616=38.5.[2017·云南统一检测]某校1200名高三年级学生参加了一次数学测验(满分为100分),为了分析这次数学测验的成绩,从这1200人的数学成绩中随机抽取200人的成绩绘制成如下的统计表,请根据表中提供的信息解决下列问题:(1)(2)如果从这1200名学生中随机抽取一人,试估计这名学生该次数学测验及格的概率P(注:60分及60分以上为及格);(3)试估计这次数学测验的年级平均分.解(1)由题意可得,b=1-(0.015+0.125+0.5+0.31)=0.05,a=200×0.05=10,c=200×0.5=100.(2)根据已知,在抽出的200人的数学成绩中,及格的有162人.∴P=162200=81100=0.81.(3)这次数学测验样本的平均分为x-=16×3+32.1×10+55×25+74×100+88×62200=73,∴这次数学测验的年级平均分大约为73分.。
2019届高考数学一轮复习第九篇统计与统计案例第1节随机抽样训练理新人教版编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2019届高考数学一轮复习第九篇统计与统计案例第1节随机抽样训练理新人教版)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2019届高考数学一轮复习第九篇统计与统计案例第1节随机抽样训练理新人教版的全部内容。
第1节随机抽样【选题明细表】知识点、方法题号简单随机抽样1,12系统抽样2,4,6,7分层抽样3,5,8,9,11,13三种抽样方法的综合10,14基础巩固(时间:30分钟)1。
(2017·福州一模)在检测一批相同规格共500 kg航空耐热垫片的品质时,随机抽取了280片,检测到有5片非优质品,则这批垫片中非优质品约为( B )(A)2。
8 kg (B)8.9 kg (C)10 kg (D)28 kg解析:由题意,这批垫片中非优质品约为×500≈8。
9 kg。
故选B。
2。
用系统抽样法(按等距离的规则),要从160名学生中抽取容量为20的样本,将160名学生从1~160进行编号.按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组应抽出的号码为125,则第一组中按此抽签方法确定的号码是( B )(A)7 (B)5 (C)4 (D)3解析:设第一组确定的号码是x,则x+(16—1)×8=125,解得x=5.故选B.3.从1 008名学生中抽取20人参加义务劳动,规定采用下列方法选取:先用简单随机抽样的方法从1 008人中剔除8人,剩下1 000人再按系统抽样的方法抽取,那么这1 008人中每个人入选的概率是( B )(A)都相等且等于(B)都相等且等于(C)不全相等(D)均不相等解析:在抽取时,每个人被抽到的概率均为=.故选B。
第1讲随机抽样
板块四模拟演练·提能增分
[A级基础达标]
1.对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则( ) A.p1=p2<p3B.p2=p3<p1
C.p1=p3<p2D.p1=p2=p3
答案 D
解析随机抽样包括:简单随机抽样,系统抽样和分层抽样.随机抽样的特点就是每个个体被抽到的概率相等.
2.[2018·海口调研]某校三个年级共有24个班,学校为了了解同学们的心理状况,将每个班编号,依次为1到24,现用系统抽样方法,抽取4个班进行调查,若抽到的最小编号为3,则抽取的最大编号为( )
A.15 B.18 C.21 D.22
答案 C
解析系统抽样的抽取间隔为24
4
=6,若抽到的最小编号为3,则抽取到的最大编号为
6×3+3=21.故选C.
3.[2018·青岛模拟]某中学高中一年级有400人,高中二年级有320人,高中三年级有280人,现从中抽取一个容量为200的样本,则高中二年级被抽取的人数为( ) A.28 B.32 C.40 D.64
答案 D
解析由分层抽样的定义可知高中二年级被抽取的人数为
320
400+320+280
×200=64.故
选D.
4.福利彩票“双色球”中红色球的号码由编号为01,02,…,33的33个个体组成,某彩民利用下面的随机数表选取6组数作为6个红色球的编号,选取方法是从随机数表第1行的第6列和第7列数字开始由左到右依次选取两个数字,则选出来的第6个红色球的编号为( )
答案 C
解析从随机数表第1行的第6列和第7列数字开始由左到右依次选取两个数字,则选出的6个红色球的编号依次为21,32,09,16,17,02,故选出的第6个红色球的编号为02.
5.某工厂的三个车间在12月份共生产了3600双皮靴,在出厂前要检查这批产品的质量,决定采用分层抽样的方法进行抽取,若从第一、二、三车间抽取的产品数分别为a,b,c,且a,b,c构成等差数列,则第二车间生产的产品数为( )
A.800 B.1000 C.1200 D.1500
答案 C
解析 因为a ,b ,c 成等差数列,所以2b =a +c . 所以
a +
b +c
3=b .所以第二车间抽取的产品数占抽样产品总数的1
3
.根据分层抽样的性质,
可知第二车间生产的产品数占总数的13,即为1
3
×3600=1200.
6.[2018·东北三校联考]某工厂生产甲、乙、丙三种型号的产品,产品数量之比为3∶5∶7,现用分层抽样的方法抽出容量为n 的样本,其中甲种产品有18件,则样本容量 n =( )
A .54
B .90
C .45
D .126 答案 B
解析 依题意得3
3+5+7
×n =18,解得n =90,即样本容量为90.
7.某工厂平均每天生产某种机器零件10000件,要求产品检验员每天抽取50件零件,检查其质量状况,采用系统抽样方法抽取,将零件编号为0000,0001,0002,…,9999,若抽取的第一组中的号码为0010,则第三组抽取的号码为( )
A .0210
B .0410
C .0610
D .0810 答案 B
解析 将零件分成50段,分段间隔为200,因此,第三组抽取的号码为0010+2×200=0410,选B.
8.[2018·无锡模拟]若采用系统抽样的方法从420人中抽取21人做问卷调查,为此将他们随机编号为1,2,…,420,则抽取的21人中,编号在区间[241,360]内的人数是________.
答案 6
解析 ∵样本容量为21,∴样本组距为420÷21=20,编号在[241,360]内应抽取的人数是(360-241+1)÷20=6.
9.[2018·潍坊模拟]某校对高三年级1600名男女学生的视力状况进行调查,现用分层抽样的方法抽取一个容量是200的样本,已知样本中女生比男生少10人,则该校高三年级的女生人数是________.
答案 760
解析 设样本中女生有x 人,则男生有x +10人,所以x +x +10=200,得x =95,设该校高三年级的女生有y 人,则由分层抽样的定义可知
y
1600=95
200
,解得y =760. 10.[2018·深圳模拟]一汽车厂生产A ,B ,C 三类轿车,每类轿车均有舒适型和标准型两种型号,某月的产量如表(单位:辆):
z
的值为________.
答案 400
解析 设该厂本月生产轿车为n 辆,由题意得50n =10
100+300,所以n =2000,z =2000-
100-300-150-450-600=400.
[B 级 知能提升]
1.[2018·江西八校联考]从编号为001,002,…,500的500个产品中用系统抽样的方法抽取一个样本,已知样本中编号最小的两个编号分别为007,032,则样本中最大的编号应该为 ( )
A .480
B .481
C .482
D .483 答案 C
解析 根据系统抽样的定义可知样本的编号成等差数列,令a 1=7,a 2=32,d =25,所以7+25(n -1)≤500,所以n ≤2018
25
,n ∈N ,最大编号为7+25×19=482.
2.[2018·浙江五校联考]某报社做了一次关于“什么是新时代的雷锋精神”的调查,在
A ,
B ,
C ,
D 四个单位回收的问卷数依次成等差数列,且共回收1000份,因报道需要,再从
回收的问卷中按单位分层抽取容量为150的样本,若在B 单位抽取30份,则在D 单位抽取的问卷是________份.
答案 60
解析 由题意依次设在A ,B ,C ,D 四个单位回收的问卷数分别为a 1,a 2,a 3,a 4,在D 单位抽取的问卷数为n ,则有30a 2=1501000
,解得a 2=200,又a 1+a 2+a 3+a 4=1000,即3a 2+a 4
=1000,∴a 4=400,∴n 400=150
1000
,解得n =60.
3.一个总体中有100个个体,随机编号为0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为1,2,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m ,那么在第k 组中抽取的号码个位数字与m +k 的个位数字相同.若
m =6,则在第7组中抽的号码是________.
答案 63
解析 由题设知,若m =6,则在第7组中抽取的号码个位数字与13的个位数字相同,而第7组中数字编号顺次为60,61,62,63,…,69,故在第7组中抽取的号码是63.
4.[2015·天津高考]设甲、乙、丙三个乒乓球协会的运动员人数分别为27,9,18.现采用分层抽样的方法从这三个协会中抽取6名运动员组队参加比赛.
(1)求应从这三个协会中分别抽取的运动员的人数;
(2)将抽取的6名运动员进行编号,编号分别为A 1,A 2,A 3,A 4,A 5,A 6.现从这6名运动员中随机抽取2人参加双打比赛.
①用所给编号列出所有可能的结果;
②设A 为事件“编号为A 5和A 6的两名运动员中至少有1人被抽到”,求事件A 发生的概率.
解 (1)应从甲、乙、丙三个协会中抽取的运动员人数分别为3,1,2.
(2)①从6名运动员中随机抽取2人参加双打比赛的所有可能结果为{A 1,A 2},{A 1,A 3},{A 1,A 4},{A 1,A 5},{A 1,A 6},{A 2,A 3},{A 2,A 4),{A 2,A 5},{A 2,A 6},{A 3,A 4},{A 3,A 5},
{A 3,A 6},{A 4,A 5},{A 4,A 6},{A 5,A 6},共15种.
②编号为A 5和A 6的两名运动员中至少有1人被抽到的所有可能结果为{A 1,A 5},{A 1,A 6},{A 2,A 5},{A 2,A 6},{A 3,A 5},{A 3,A 6},{A 4,A 5},{A 4,A 6},{A 5,A 6},共9种,因此,事件A 发生的概率P (A )=915=35
.
5.[2018·开封模拟]某公路设计院有工程师6人,技术员12人,技工18人,要从这些人中抽取n 个人参加市里召开的科学技术大会.如果采用系统抽样和分层抽样的方法抽取,不用剔除个体,如果参会人数增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,求n .
解 总体容量为6+12+18=36.
当样本容量是n 时,由题意知,系统抽样的间隔为36n ,分层抽样的比例是n
36,抽取的工
程师人数为n 36×6=n 6,技术员人数为n 36×12=n 3,技工人数为n 36×18=n
2,所以n 应是6的倍
数,36的约数,即n =6,12,18.
当样本容量为(n +1)时,总体容量剔除以后是35人,系统抽样的间隔为35n +1,因为35
n +1
必须是整数,所以n 只能取6,即样本容量n =6.。