(全国通用)2019届高考数学大一轮复习第十一章统计与统计案例11.1随机抽样学案
- 格式:doc
- 大小:340.00 KB
- 文档页数:14
第1节分类加法计数原理与分步乘法计数原理最新考纲 1.理解分类加法计数原理和分步乘法计数原理; 2. 会用分类加法计数原理或分步乘法计数原理分析和解决一些简单的实际问题.知识梳理 1.分类加法计数原理 做一件事,完成它有 n 类办法,在第一类办法中有 m 1种不同的方法,在第二类办法中有 m 2种不同的方法,……,在第 n 类办 法中有 m n 种不同的方法 .则完成这件事共有 N = ________________种不同的方法. m +m +…+m 1 2 n 2.分步乘法计数原理做一件事,完成它需要分成 n 个步骤,做第一个步骤有 m 1种不 同的方法,做第二个步骤有 m 2种不同的方法,……,做第 n 个步骤有 m n 种不同的方法 .那么完成这件事共有= m ×m ×…×m _________________n 种不同的方法. 1 23.分类加法和分步乘法计数原理,区别在于:分类加法计数原理针对“分类”问题,其中各种方法相互独立,用其中任何一种方法都可以做完这件事;分步乘法计数原理针对“分步”问题,各个步骤相互依存,只有各个步骤都完成了才算完成这件事.[常用结论与微点提醒]1.切实理解“完成一件事”的含义,以确定需要分类还是需要分步进行.2.分类的关键在于要做到“不重不漏”,分步的关键在于要正确设计分步的程序,即合理分类,准确分步.诊断自测1.思考辨析(在括号内打“√”或“×”)(1)在分类加法计数原理中,两类不同方案中的方法可以相同.( )(2)在分类加法计数原理中,每类方案中的方法都能直接完成这件事.( )(3)在分步乘法计数原理中,每个步骤中完成这个步骤的方法是各不相同的.( )(4)在分步乘法计数原理中,事情是分两步完成的,其中任解析分类加法计数原理,每类方案中的方法都是不同的,每一种方法都能完成这件事;分步乘法计数原理,每步的方法都是不同的,每步的方法只能完成这一步,不能完成这件事,所以(1),(4)均不正确.答案(1)× (2)√ (3)√(4)×2.从3名女同学和2名男同学中选1人主持主题班会,则不同的选法种数为( )A.6 C.3B.5 D.2解析5个人中每一个都可主持,所以共有5种选法. 答案 B3.(教材练习改编)现有4种不同颜色要对如图所示的四个部分进行着色,要求有公共边界的两块不能用同一种颜色,则不同的着色方法共有( )A.24种B.30种D.48种解析C.36种需要先给C块着色,有4种结果;再给A块着色,有3 种结果;再给B块着色,有2种结果;最后给D块着色,有2种结果,由分步乘法计数原理知共有4×3×2×2=48(种).答案 D4.5位同学报名参加两个课外活动小组,每位同学限报其中一个小组,则不同的报名方法有________种(用数字作答).解析每位同学都有2种报名方法,因此,可分五步安排5名同学报名,由分步乘法计数原理,总的报名方法共2×2×2×2×2=32(种).答案325.(2018·阜新月考)已知某公园有5个门,从任一门进,另一门出,则不同的走法的种数为________(用数字作答).解析分两步,第一步选一个门进有5种方法,第二步再选一个门出有4种方法,所以共有5×4=20种走法.答案20考点一分类加法计数原理的应用【例1】(1)满足a,b∈{-1,0,1,2},且关于x的方程ax+2x2 +b=0有实数解的有序数对(a,b)的个数为________.(2)在所有的两位数中,个位数字大于十位数字的两位数的个数为________.解析(1)当a=0时,b的值可以是-1,0,1,2,故(a,b)的个数为4;当a≠0时,要使方程ax2+2x+b=0有实数解,需使Δ=4-4ab≥0,即ab≤1.若a=-1,则b的值可以是-1,0,1,2,(a,b)的个数为4;若a=1,则b的值可以是-1,0,1,(a,b)的个数为3;若a=2,则b的值可以是-1,0,(a,b)的个数为2.由分类加法计数原理可知,(a,b)的个数为4+4+3+2=13.(2)当个位数字为2时,十位数字为1,共1个;当个位数字为3时,十位数字为1,2,共2个;当个位数字为4时,十位数字为1,2,3,共3个;……当个位数字为9时,十位数字为1,2,3,4,…,7,8,共8 个;由分类加法计数原理可知满足条件的两位数的个数为1+2+3+…+8=36.答案(1)13 (2)36规律方法分类标准是运用分类加法计数原理的难点所在,应抓住题目中的关键词、关键元素和关键位置.(1)根据题目特点恰当选择一个分类标准.(2)分类时应注意完成这件事情的任何一种方法必须属于某一类,并且分别属于不同种类的两种方法是不同的方法,不能重复. (3)分类时除了不能交叉重复外,还不能有遗漏,如本例(1)中易漏a=0这一类.【训练1】(1)从集合{1,2,3,…,10}中任意选出三个不同的数,使这三个数成等比数列,这样的等比数列的个数为( )A.3B.4C.6D.8(2)如图,从A到O有________种不同的走法(不重复过一点).解析(1)以1为首项的等比数列为1,2,4;1,3,9;以2为首项的等比数列为2,4,8;以4为首项的等比数列为4,6,9;把这4个数列的顺序颠倒,又得到另外的4个数列,∴所求的数列共有2(2+1+1)=8个.(2)分3类:第一类,直接由A到O,有1种走法;第二类,中间过一个点,有A→B→O和A→C→O共2种不同的走法;第三类,中间过两个点,有A→B→C→O和A→C→B→O共2种不同的走法,由分类加法计数原理可得共有1+2+2=5种不同的走法. 答案(1)D (2)5考点二分步乘法计数原理的应用【例2】(1)(2018·石家庄模拟)教学大楼共有五层,每层均有两个楼梯,由一层到五层的走法有( )A.10种B.2种C.5种D.2种(2)(2016·全国Ⅱ卷)如图,小明从街道的E处出发,先到F处5 2 4与小红会合,再一起到位于G处的老年公寓参加志愿者活动,则小明到老年公寓可以选择的最短路径条数为( )A.24B.18C.12D.9解析(1)每相邻的两层之间各有2种走法,共分4步.由分步乘法计数原理,共有24种不同的走法.(2)分两步,第一步,从E→F,有6条可以选择的最短路径;第二步,从F→G,有3条可以选择的最短路径.由分步乘法计数原理可知有6×3=18条可以选择的最短路径.故选B.答案(1)D (2)B规律方法(1)在第(1)题中,易误认为分5步完成,错选B.(2)利用分步乘法计数原理应注意:①要按事件发生的过程合理分步,即分步是有先后顺序的;②各步中的方法互相依存,缺一不可,只有各步骤都完成才算完成这件事.【训练2】(1)用0,1,2,3,4,5可组成无重复数字的三位数的个数为________.(2)(2018·合肥质检)五名学生报名参加四项体育比赛,每人限报一项,则不同的报名方法的种数为________.五名学生争夺四项比赛的冠军(冠军不并列),则获得冠军的可能性有________种.解析(1)可分三步给百、十、个位放数字,第一步:百位数字有5种放法;第二步:十位数字有5种放法;第三步:个位数字有4种放法,根据分步乘法计数原理,三位数的个数为5×5×4 =100.(2)五名学生参加四项体育比赛,每人限报一项,可逐个学生落实,每个学生有4种报名方法,共有45种不同的报名方法.五名学生争夺四项比赛的冠军,可对4个冠军逐一落实,每个冠军有5种获得的可能性,共有54种获得冠军的可能性.答案(1)100 (2)45 5 4考点三两个计数原理的综合应用(多维探究)命题角度1组数、组点、组线、组对及抽取问题【例3-1】如果一条直线与一个平面垂直,那么称此直线与平面构成一个“正交线面对”.在一个正方体中,由两个顶点确定的直线与含有四个顶点的平面构成的“正交线面对”的个数是( )A.48B.18C.24D.36解析在正方体中,每一个表面有四条棱与之垂直,六个表面,共构成24个“正交线面对”;而正方体的六个对角面中,每个对角面有两条面对角线与之垂直,共构成12个“正交线面对”,所以共有36个“正交线面对”.命题角度2涂色、种植问题【例3-2】(一题多解)如图所示,将一个四棱锥的每一个顶点染上一种颜色,并使同一条棱上的两端异色,如果只有5种颜色可供使用,求不同的染色方法种数.解法一按所用颜色种数分类.5第一类:5种颜色全用,共有A种不同的方法;5第二类:只用4种颜色,则必有某两个顶点同色(A与C,或B与D),共有2×A45种不同的方法;第三类:只用3种颜色,则A与C,B与D必定同色,共有A35种不同的方法.55 4535由分类加法计数原理,得不同的染色方法种数为A+2×A+A=420(种).法二以S,A,B,C,D顺序分步染色.第一步:S点染色,有5种方法;第二步:A点染色,与S在同一条棱上,有4种方法;第三步:B点染色,与S,A分别在同一条棱上,有3种方法;第四步:C点染色,也有3种方法,但考虑到D点与S,A,C相邻,需要针对A与C是否同色进行分类,当A与C同色时,D点有3种染色方法;当A与C不同色时,因为C与S,B也不同色,所以C点有2种染色方法,D点也有2种染色方法.由分步乘法、分类加法计数原理得不同的染色方法共有5×4×3×(1×3+2×2)=420(种).规律方法(1)①注意在综合应用两个原理解决问题时,一般是先分类再分步.在分步时可能又用到分类加法计数原理.②注意对于较复杂的两个原理综合应用的问题,可恰当地列出示意图或列出表格,使问题形象化、直观化.(2)解决涂色问题,可按颜色的种数分类,也可按不同的区域分步完成.例题中,相邻顶点不同色,要按A,C和B,D是否同色分类处理.【训练3】(1)(一题多解)(2018·青岛质检)如图所示,用4种不同的颜色涂入图中的矩形A,B,C,D中,要求相邻的矩形涂色不同,则不同的涂法有( )A.72种C.24种B.48种D.12种(2)如图所示,在连结正八边形的三个顶点而成的三角形中,与正八边形有公共边的三角形有________个(用数字作答).解析(1)法一首先涂A有4种涂法,则涂B有3种涂法,C与A,B相邻,则C有2种涂法,D只与C相邻,则D有3种涂法,所以共有4×3×2×3=72种涂法.法二按要求涂色至少需要3种颜色,故分两类:一是4种颜色都用,这时A有4种涂法,B有3种涂法,C有2种涂法,D有1种涂法,共有4×3×2×1=24(种)涂法;二是用3种颜色,这时A,B,C的涂法有4×3×2=24(种),D只要不与C同色即可,故D有2种涂法,所以不同的涂法共有24+24×2=72(种).(2)把与正八边形有公共边的三角形分为两类:第一类,有一条公共边的三角形共有8×4=32(个). 第二类,有两条公共边的三角形共有8个.由分类加法计数原理知,共有32+8=40(个).答案(1)A (2)40。
§11.3 变量间的相关关系、统计案例1.两个变量的线性相关 (1)正相关在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关. (2)负相关在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关. (3)线性相关关系、回归直线如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线. 2.回归方程 (1)最小二乘法求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法. (2)回归方程方程y ^=b ^x +a ^是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的回归方程,其中a ^,b ^是待定参数.⎩⎨⎧b ^=∑ni =1(x i-x )(y i-y )∑ni =1(x i-x )2=∑ni =1x i y i-n x y ∑n i =1x 2i-n x2,a ^=y -b ^x .3.回归分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法. (2)样本点的中心对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其中(x ,y )称为样本点的中心. (3)相关系数当r >0时,表明两个变量正相关; 当r <0时,表明两个变量负相关.r 的绝对值越接近于1,表明两个变量的线性相关性越强.r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r |大于0.75时,认为两个变量有很强的线性相关性. 4.独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量. (2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X 和Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称为2×2列联表)为2×2列联表构造一个随机变量K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d 为样本容量.(3)独立性检验利用随机变量K 2来判断“两个分类变量有关系”的方法称为独立性检验.题组一 思考辨析1.判断下列结论是否正确(请在括号中打“√”或“×”)(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.( × ) (2)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.( √ )(3)只有两个变量有相关关系,所得到的回归模型才有预测价值.( √ )(4)某同学研究卖出的热饮杯数y 与气温x (℃)之间的关系,得线性回归方程y ^=-2.352x +147.767,则气温为2℃时,一定可卖出143杯热饮.( × )(5)事件X ,Y 关系越密切,则由观测数据计算得到的K 2的观测值越大.( √ )题组二 教材改编2.[P97A 组T2]为调查中学生近视情况,测得某校男生150名中有80名近视,在140名女生中有70名近视.在检验这些学生眼睛近视是否与性别有关时,用下列哪种方法最有说服力( )A .回归分析B .均值与方差C .独立性检验D .概率答案 C解析 “近视”与“性别”是两类变量,其是否有关,应用独立性检验判断. 3.[P97练习]下面是2×2列联表:则表中a ,b 的值分别为( ) A .94,72 B .52,50 C .52,74 D .74,52答案 C解析 ∵a +21=73,∴a =52. 又a +22=b ,∴b =74.4.[P81例1]某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程y ^=0.67x +54.9.现发现表中有一个数据看不清,请你推断出该数据的值为________. 答案 68解析 由x =30,得y =0.67×30+54.9=75. 设表中的“模糊数字”为a ,则62+a +75+81+89=75×5,∴a =68.题组三 易错自纠5.某医疗机构通过抽样调查(样本容量n =1 000),利用2×2列联表和K 2统计量研究患肺病是否与吸烟有关.计算得K 2=4.453,经查阅临界值表知P (K 2≥3.841)≈0.05,现给出四个结论,其中正确的是( )A .在100个吸烟的人中约有95个人患肺病B .若某人吸烟,那么他有95%的可能性患肺病C .有95%的把握认为“患肺病与吸烟有关”D .只有5%的把握认为“患肺病与吸烟有关” 答案 C解析 由已知数据可得,有1-0.05=95%的把握认为“患肺病与吸烟有关”.6.在一次考试中,5名学生的数学和物理成绩如下表:(已知学生的数学和物理成绩具有线性相关关系)现已知其线性回归方程为y ^=0.36x +a ^,则根据此线性回归方程估计数学得90分的同学的物理成绩为______.(四舍五入到整数) 答案 73解析 x =60+65+70+75+805=70,y =62+64+66+68+705=66,所以66=0.36×70+a ^,a ^=40.8,即线性回归方程为y ^=0.36x +40.8.当x =90时,y ^=0.36×90+40.8=73.2≈73.题型一相关关系的判断1.观察下列各图形,其中两个变量x,y具有相关关系的图是()A.①②B.①④C.③④D.②③答案 C解析由散点图知③中的点都分布在一条直线附近.④中的点都分布在一条曲线附近,所以③④中的两个变量具有相关关系.2.(2018·广州质检)根据下面给出的2004年至2013年我国二氧化硫排放量(单位:万吨)的柱形图.以下结论不正确的是()A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关答案 D解析从2006年,将每年的二氧化硫排放量与前一年作差比较,得到2008年二氧化硫排放量与2007年排放量的差最大,A选项正确;2007年二氧化硫排放量较2006年降低了很多,B选项正确;虽然2011年二氧化硫排放量较2010年多一些,但自2006年以来,整体呈递减趋势,C选项正确;自2006年以来我国二氧化硫年排放量与年份负相关,D选项错误,故选D.3.x 和y 的散点图如图所示,则下列说法中所有正确命题的序号为________.①x ,y 是负相关关系; ②在该相关关系中,若用y =21ec xc 拟合时的相关指数为R 21,用y ^=b ^x +a ^拟合时的相关指数为R 22,则R 21>R 22;③x ,y 之间不能建立线性回归方程. 答案 ①②解析 在散点图中,点散布在从左上角到右下角的区域,因此x ,y 是负相关关系,故①正确;由散点图知用y =21ec xc 拟合比用y ^=b ^x +a ^拟合效果要好,则R 21>R 22,故②正确;x ,y 之间可以建立线性回归方程,但拟合效果不好,故③错误. 思维升华 判定两个变量正,负相关性的方法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.(2)相关系数:r >0时,正相关;r <0时,负相关.(3)线性回归方程中:b ^>0时,正相关;b ^<0时,负相关. 题型二 线性回归分析典例 (2016·全国Ⅲ)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码1~7分别对应年份2008~2014.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量. 附注:参考数据:∑i =17y i =9.32,∑i =17t i y i =40.17,i =17(y i -y )2=0.55,7≈2.646.参考公式:相关系数r =i =1n (t i -t )(y i -y )i =1n (t i -t )2i =1n (y i -y )2,回归方程y ^=a ^+b ^t 中斜率和截距的最小二乘估计公式分别为:b ^=i =1n (t i -t )(y i -y )i =1n (t i -t )2,a ^=y -b ^t .解 (1)由折线图中数据和附注中参考数据得 t =4,i =17(t i -t )2=28,i =17(y i -y )2=0.55.i =17(t i -t )(y i -y )=∑i =17t i y i -t ∑i =17y i=40.17-4×9.32=2.89, 所以r ≈ 2.890.55×2×2.646≈0.99.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系. (2)由y =9.327≈1.331及(1)得b ^=i =17(t i -t )(y i -y )i =17(t i -t )2=2.8928≈0.103, a ^=y -b ^t ≈1.331-0.103×4≈0.92.所以y 关于t 的回归方程为y ^=0.92+0.10t . 将2016年对应的t =9代入回归方程得y ^=0.92+0.10×9=1.82.所以预测2016年我国生活垃圾无害化处理量将约为1.82亿吨. 思维升华 线性回归分析问题的类型及解题方法 (1)求线性回归方程①利用公式,求出回归系数b ^,a ^.②待定系数法:利用回归直线过样本点的中心求系数.(2)利用回归方程进行预测,把线性回归方程看作一次函数,求函数值.(3)利用回归直线判断正、负相关;决定正相关还是负相关的是系数b ^.(4)回归方程的拟合效果,可以利用相关系数判断,当|r |越趋近于1时,两变量的线性相关性越强.跟踪训练 某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响,对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.表中w i =x i ,w =18∑i =18w i .(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题: ①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v ^=α^+β^u 的斜率和截距的最小二乘估计分别为β^=i =1n (u i -u )(v i -v )i =1n (u i -u )2,α^=v -β^u .解 (1)由散点图可以判断,y =c +d x 适宜作为年销售量y 关于年宣传费x 的回归方程类型. (2)令w =x ,先建立y 关于w 的线性回归方程,由于d ^=i =18(w i -w )·(y i -y )i =18(w i -w )2=108.81.6=68,c ^=y -d ^w =563-68×6.8=100.6,所以y 关于w 的线性回归方程为y ^=100.6+68w ,因此y 关于x 的回归方程为y ^=100.6+68x . (3)①由(2)知,当x =49时,年销售量y 的预报值y ^=100.6+6849=576.6,年利润z 的预报值z ^=576.6×0.2-49=66.32. ②根据(2)的结果知,年利润z 的预报值z ^=0.2(100.6+68x )-x =-x +13.6x +20.12.所以当x =13.62=6.8,即x =46.24时,z ^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.题型三 独立性检验典例(2017·全国Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)设两种养殖方法的箱产量相互独立,记A 表示事件“旧养殖法的箱产量低于50 kg ,新养殖法的箱产量不低于50 kg ”,估计A 的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01). 附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).解 (1)记B 表示事件“旧养殖法的箱产量低于50 kg ”,C 表示事件“新养殖法的箱产量不低于50 kg ”.由题意知,P (A )=P (BC )=P (B )P (C ). 旧养殖法的箱产量低于50 kg 的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62, 故P (B )的估计值为0.62.新养殖法的箱产量不低于50 kg 的频率为 (0.068+0.046+0.010+0.008)×5=0.66, 故P (C )的估计值为0.66.因此,事件A 的概率估计值为0.62×0.66=0.409 2. (2)根据箱产量的频率分布直方图得列联表如下:K 2=200×(62×66-34×38)2100×100×96×104≈15.705.由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)因为新养殖法的箱产量频率分布直方图中,箱产量低于50 kg 的直方图面积为(0.004+0.020+0.044)×5=0.34<0.5,箱产量低于55 kg 的直方图面积为(0.004+0.020+0.044+0.068)×5=0.68>0.5,故新养殖法箱产量的中位数的估计值为50+0.5-0.340.068≈52.35 (kg).思维升华 (1)比较几个分类变量有关联的可能性大小的方法 ①通过计算K 2的大小判断:K 2越大,两变量有关联的可能性越大.②通过计算|ad -bc |的大小判断:|ad -bc |越大,两变量有关联的可能性越大. (2)独立性检验的一般步骤①根据样本数据制成2×2列联表.②根据公式K 2=n (ad -bc )2(a +b )(a +c )(b +d )(c +d )计算K 2的观测值k .③比较k 与临界值的大小关系,作统计推断.跟踪训练 (2017·石家庄质检)微信是现代生活进行信息交流的重要工具,某公司200名员工中90%的人使用微信,其中每天使用微信时间在一小时以内的有60人,其余的员工每天使用微信的时间在一小时以上,若将员工分成青年(年龄小于40岁)和中年(年龄不小于40岁)两个阶段,那么使用微信的人中75%是青年人.若规定:每天使用微信时间在一小时以上为经常使用微信,那么经常使用微信的员工中有23是青年人.(1)若要调查该公司使用微信的员工经常使用微信与年龄的关系,列出2×2列联表:(2)根据2×2列表中的数据利用独立性检验的方法判断是否有99.9%的把握认为“经常使用微信与年龄有关”?附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).解 (1)由已知可得,该公司员工中使用微信的有200×90%=180(人). 经常使用微信的有180-60=120(人), 其中青年人有120×23=80(人),使用微信的人中青年人有180×75%=135(人), 故2×2列联表如下:(2)将列联表中数据代入公式可得: K 2=180×(80×5-55×40)2120×60×135×45≈13.333,由于13.333>10.828,所以有99.9%的把握认为“经常使用微信与年龄有关”.求线性回归方程的方法技巧典例 (12分)某地最近十年粮食需求量逐年上升,下表是部分统计数据:(1)利用所给数据求年需求量与年份之间的线性回归方程y ^=b ^x +a ^; (2)利用(1)中所求出的线性回归方程预测该地2018年的粮食需求量.思想方法指导 回归分析是处理变量相关关系的一种数学方法.主要解决:(1)确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;(2)根据一组观测值,预测变量的取值及判断变量取值的变化趋势;(3)求出线性回归方程. 规范解答解 (1)由所给数据看出,年需求量与年份之间近似直线上升,下面来求线性回归方程,先将数据处理如下表.对处理的数据,容易算得x =0,y =3.2,[4分]b ^=(-4)×(-21)+(-2)×(-11)+2×19+4×29-5×0×3.2(-4)2+(-2)2+22+42-5×02=26040=6.5,a ^=y -b ^x =3.2.[6分]由上述计算结果,知所求线性回归方程为y ^-257=6.5(x -2010)+3.2,即y ^=6.5(x -2010)+260.2.[8分](2)利用所求得的线性回归方程,可预测2018年的粮食需求量大约为 6.5×(2018-2010)+260.2=6.5×8+260.2=312.2(万吨).[12分]1.根据如下样本数据:得到的线性回归方程为y ^=b ^x +a ^,则( )A.a ^>0,b ^>0B.a ^>0,b ^<0C.a ^<0,b ^>0 D.a ^<0,b ^<0答案 B解析 根据给出的数据可发现:整体上y 与x 呈现负相关,所以b ^<0,由样本点(3,4.0)及(4,2.5)可知a ^>0,故选B.2.(2017·江西南城一中、高安中学等九校联考)随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.由K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),得K 2=100×(45×22-20×13)265×35×58×42≈9.616.参照下表,正确的结论是( )A .在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”B .在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”C .有99%以上的把握认为“生育意愿与城市级别有关”D .有99%以上的把握认为“生育意愿与城市级别无关” 答案 C解析 ∵K 2≈9.616>6.635,∴有99%以上的把握认为“生育意愿与城市级别有关”,故选C. 3.对具有线性相关关系的变量x ,y 有一组观测数据(x i ,y i )(i =1,2,…,8),其线性回归方程是y ^=13x +a ^,且x 1+x 2+x 3+…+x 8=2(y 1+y 2+y 3+…+y 8)=6,则实数a ^的值是( )A.116B.18C.14D.12 答案 B解析 依题意可知样本点的中心为⎝⎛⎭⎫34,38,则38=13×34+a ^,解得a ^=18. 4.(2017·山东)为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系,设其线性回归方程为y ^=b ^x +a ^.已知∑10i =1x i =225,∑10i =1y i =1 600,b ^=4.该班某学生的脚长为24,据此估计其身高为( )A .160B .163C .166D .170 答案 C解析 ∵∑10i =1x i =225,∴x =110∑10i =1x i =22.5.∵∑10i =1y i =1 600,∴y =110∑10i =1y i =160.又b ^=4,∴a ^=y -b ^x =160-4×22.5=70.∴线性回归方程为y ^=4x +70.将x =24代入上式,得y ^=4×24+70=166.故选C.5.(2018·湖南永州模拟)已知x 与y 之间的几组数据如下表:假设根据上表数据所得的线性回归方程为y ^=b ^x +a ^.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )A.b ^>b ′,a ^>a ′B.b ^>b ′,a ^<a ′C.b ^<b ′,a ^>a ′ D.b ^<b ′,a ^<a ′答案 C解析 由两组数据(1,0)和(2,2)可求得直线方程为y =2x -2,b ′=2,a ′=-2.而利用线性回归方程的公式与已知表格中的数据,可求得b ^=∑6i =1x i y i -6x ·y ∑i =16x 2i -6x2=58-6×72×13691-6×⎝⎛⎭⎫722=57,a ^=y -b^x =136-57×72=-13,所以b ^<b ′,a ^>a ′.6.某地2009年至2015年中,每年的人口总数y (单位:万)的数据如下表:若t 与y 之间具有线性相关关系,则其回归直线y ^=b ^t +a ^一定过点( ) A .(3,9) B .(9,3) C .(6,14) D .(4,11)答案 A解析 t =17(0+1+2+3+4+5+6)=3,y =17(8+8+8+9+9+10+11)=9,所以回归直线y ^=b ^t +a ^一定过点(3,9).7.(2017·遵义联考)某公司为确定明年投入某产品的广告支出,对近5年的年广告支出m 与年销售额t (单位:百万元)进行了初步统计,得到下列表格中的数据:经测算,年广告支出m 与年销售额t 满足线性回归方程t ^=6.5m +17.5,则p =________. 答案 60解析 由于回归直线过样本点的中心,m =5,t =190+p5,代入t ^=6.5m +17.5,解得p =60.8.以下四个命题,其中正确的序号是________.①从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量相关性越强,则相关系数的绝对值越接近于1;③在线性回归方程y ^=0.2x +12中,当解释变量x 每增加一个单位时,预报变量y ^平均增加0.2个单位;④对分类变量X 与Y 的统计量K 2来说,K 2越小,“X 与Y 有关系”的把握程度越大. 答案 ②③解析 ①是系统抽样;对于④,统计量K 2越小,说明两个相关变量有关系的把握程度越小. 9.为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到如图所示2×2列联表:已知P (K 2≥3.841)≈0.05,P (K 2≥5.024)≈0.025.根据表中数据,得到K 2的观测值k =50×(13×20-10×7)223×27×20×30≈4.844,则有________的把握认为选修文科与性别有关.答案 95%解析 由题意,K 2=50×(13×20-10×7)223×27×20×30≈4.844,因为5.024>4.844>3.841,所以有95%的把握认为选修文科与性别有关.10.(2017·武邑模拟)对具有线性相关关系的变量x ,y 有10组观测数据(x i ,y i )(i =1,2,…,10),其线性回归方程为y ^=-3+2x ,若∑10i =1x i =17,则∑10i =1y i =________. 答案 4解析 依题意x =1710=1.7,而直线y ^=-3+2x 一定经过(x ,y ),∴y =-3+2x =-3+2×1.7=0.4,∴∑10i =1y i =0.4×10=4. 11.某地区2009年至2015年农村居民家庭人均纯收入y (单位:千元)的数据如下表:(1)求y 关于t 的线性回归方程;(2)利用(1)中的线性回归方程,分析2009年至2015年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2018年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘估计公式分别为:b ^=i =1n (t i -t )(y i -y )i =1n (t i -t )2,a ^=y -b ^t .解 (1)由所给数据计算得t =17(1+2+3+4+5+6+7)=4,y =17(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,i =17(t i -t )2=9+4+1+0+1+4+9=28,i =17(t i -t )(y i -y )=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,b ^=i =17(t i -t )(y i -y )i =17(t i -t )2=1428=0.5, a ^=y -b ^t =4.3-0.5×4=2.3,所求线性回归方程为y ^=0.5t +2.3.(2)由(1)知,b ^=0.5>0,故2009年至2015年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.将2018年的年份代号t =10代入(1)中的线性回归方程,得y ^=0.5×10+2.3=7.3, 故预测该地区2018年农村居民家庭人均纯收入为7.3千元.12.(2017·西安质检)某省会城市地铁将于2017年6月开始运营,为此召开了一个价格听证会,拟定价格后又进行了一次调查,随机抽查了50人,他们的收入与态度如下:(1)若以区间的中点值为该区间内的人均月收入,求参与调查的人员中“赞成定价者”与“认为价格偏高者”的月平均收入的差异是多少(结果保留2位小数);(2)由以上统计数据填下面2×2列联表,分析是否有99%的把握认为“月收入以55百元为分界点对地铁定价的态度有差异”.附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).解 (1)“赞成定价者”的月平均收入为x 1=20×1+30×2+40×3+50×5+60×3+70×41+2+3+5+3+4≈50.56.“认为价格偏高者”的月平均收入为x 2=20×4+30×8+40×12+50×5+60×2+70×14+8+12+5+2+1=38.75,∴“赞成定价者”与“认为价格偏高者”的月平均收入的差距是x 1-x 2=50.56-38.75=11.81(百元).(2)根据条件可得2×2列联表如下:K 2=50×(3×11-7×29)210×40×18×32≈6.272<6.635,∴没有99%的把握认为“月收入以55百元为分界点对地铁定价的态度有差异”.13.(2017·通州一模)对两个变量y 和x 进行回归分析,得到一组样本数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),则下列说法中不正确的是( )A .由样本数据得到的回归直线y ^=b ^x +a ^必过样本点的中心(x ,y ) B .残差平方和越小的模型,拟合的效果越好C .用相关指数R 2来刻画回归效果,R 2的值越小,说明模型的拟合效果越好D .若变量y 和x 之间的相关系数r =-0.936 2,则变量y 与x 之间具有线性相关关系 答案 C解析 R 2的值越大,说明残差平方和越小,也就是模型的拟合效果越好,故选C.14.(2018·河北保定模拟)中央政府为了应对因人口老龄化而造成的劳动力短缺问题,拟定出台“延迟退休年龄政策”.为了了解人们对“延迟退休年龄政策”的态度,责成人社部进行调研.人社部从网上年龄在15~65的人群中随机调查100人,调查数据的频率分布直方图和支持“延迟退休”的人数与年龄的统计结果如下:(1)由以上统计数据填写2×2列联表,并判断是否有95%的把握认为以45岁为分界点的不同人群对“延迟退休年龄政策”的支持度有差异;(2)若以45岁为分界点,从不支持“延迟退休年龄政策”的人中按分层抽样的方法抽取8人参加某项活动.现从这8人中随机抽2人,求至少有1人是45岁及45岁以上的概率. 参考数据:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).解 (1)2×2列联表如下:因为K 2=100×(35×5-45×15)250×50×80×20=254=6.25>3.841,所以有95%的把握认为以45岁为分界点的不同人群对“延迟退休年龄政策”的支持度有差异.(2)从不支持“延迟退休年龄政策”的人中抽取8人,则45岁以下的应抽6人,45岁及45岁以上的应抽2人.则8人中随机抽2人共有C 28=28种抽法,至少有1人是45岁及45岁以上共有C 16C 12+C 22=13(种)抽法,故所求概率为1328.15.(2018·青岛模拟)针对时下的“韩剧热”,某校团委对“学生性别和喜欢韩剧是否有关”作了一次调查,其中女生人数是男生人数的12,男生喜欢韩剧的人数占男生人数的16,女生喜欢韩剧的人数占女生人数的23.若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有________人.答案 12解析 设男生人数为x ,由题意可得列联表如下:若有95%的把握认为是否喜欢韩剧和性别有关, 则k >3.841,即k =3x 2⎝⎛⎭⎫x 6·x 6-5x 6·x 32x ·x 2·x 2·x =3x 8>3.841,解得x >10.243.因为x 6,x2为整数,所以若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有12人.16.(2017·包头一模)如图是某企业2010年至2016年的污水净化量(单位:吨)的折线图. 注:年份代码1~7分别对应年份2010~2016.(1)由折线图看出,可用线性回归模型拟合y 和t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回归方程,预测2017年该企业的污水净化量; (3)请用数据说明回归方程预报的效果.参考数据:y =54,∑7i =1(t i -t )(y i -y )=21,14≈3.74, ∑7i =1(y i -y ^i)2=94. 参考公式:相关系数r =∑ni =1 (t i -t )(y i -y )∑ni =1 (t i -t )2∑ni =1(y i -y )2,线性回归方程y ^=a ^+b ^t ,b ^=∑ni =1(t i -t )(y i -y )∑ni =1(t i -t )2,a ^=y -b ^t .反映回归效果的公式为:R 2=1-∑ni =1 (y i -y ^i )2∑ni =1(y i -y )2,其中R 2越接近于1,表示回归的效果越好.解 (1)由折线图中的数据得,t =4,∑7i =1(t i -t )2=28,∑7i =1(y i -y )2=18, 所以r =2128×18≈0.935. 因为y 与t 的相关系数近似为0.935,说明y 与t 的线性相关程度相当大,所以可以用线性回归模型拟合y 与t 的关系.(2)因为y =54,b ^=∑7i =1(t i -t )(y i -y )∑7i =1(t i -t )2=2128=34, 所以a ^=y -b ^t =54-34×4=51,所以y 关于t 的线性回归方程为y ^=b ^t +a ^=34t +51.将2017年对应的t =8代入得y ^=34×8+51=57,所以预测2017年该企业污水净化量约为57吨. (3)因为R 2=1-∑7i =1(y i -y ^i )2∑7i =1(y i -y )2=1-94×118=1-18=78=0.875,所以“污水净化量的差异”有87.5%是由年份引起的,这说明回归方程预报的效果是良好的.。
2019-2020学年高考数学一轮复习 第十一章概率与统计11.7随机抽样教学案 新人教B 版考纲要求1.理解随机抽样的必要性和重要性.2.会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法.1.总体、个体、样本、样本容量的概念一般把所考察对象的某一数值指标的全体构成的集合看作______,构成总体的每一个元素作为______,从总体中抽取若干个体所组成的集合叫做______,样本中个体的数目叫做__________.2.简单随机抽样(1)定义:一般地,从元素个数为N 的总体中不放回地抽取容量为n 的样本,如果每一次抽取时总体中的各个个体有________的可能性被抽到,这种抽样方法叫做简单随机抽样.这样抽取的样本,叫做________.(2)最常用的简单随机抽样的方法:________和________.3.系统抽样的步骤假设要从容量为N 的总体中抽取容量为n 的样本.(1)先将总体的N 个个体______.(2)确定__________,对编号进行______.当N n 是整数时,取k =N n.(3)在第1段用______________确定第一个个体编号s (s ≤k ).(4)按照一定的规则抽取样本,通常是将s 加上间隔k 得到第2个个体编号______,再加k 得到第3个个体编号______,依次进行下去,直到获取整个样本.4.分层抽样(1)定义:当总体由________________组成时,常将总体中各个个体按某种特征分成若干个______的几部分,每一部分叫做____,在各层中按____________________,这种抽样方法叫做分层抽样.(2)分层抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.1.为确保食品安全,质检部门检查一箱装有1 000件包装食品的质量,抽查总量的2%.在这个问题中下列说法正确的是( ).A .总体是指这箱1 000件包装食品B .个体是一件包装食品C .样本是按2%抽取的20件包装食品D .样本容量为202.一个班级有5个小组,每一个小组有10名学生,随机编号为1~10号,为了了解他们的学习情况,要求抽取每组的2号学生留下来进行问卷调查,这里运用的方法是( ).A .分层抽样法B .抽签法C .随机数表法D .系统抽样法3.一个总体分为A ,B 两层,用分层抽样方法从总体中抽取一个容量为10的样本.已知B 层中每个个体被抽到的概率都为112,则总体中的个体数为__________. 4.为了了解参加一次知识竞赛的1 252名学生的成绩,决定采用系统抽样的方法抽取一个容量为50的样本,那么总体中应随机剔除的个体数目是__________.一、简单随机抽样 【例1】 某大学为了支援我国西部教育事业,决定从2012年应届毕业生报名的18名志愿者中,选取6人组成志愿小组.请用抽签法和随机数法设计抽样方案.方法提炼1.一个抽样试验能否用抽签法,关键是看两点:一是抽签是否方便;二是号签是否容易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.2.随机数表中共随机出现0,1,2,…,9十个数字,也就是说,在表中的每个位置上出现各个数字的机会都是相等的.在使用随机数表时,如遇到三位数或四位数时,可从选择的随机数表中的某行某列的数字记起,每三个或每四个作为一个单位,按事先确定的读数方向选取,有超过总体号码或出现重复号码的数字舍去.请做演练巩固提升1二、系统抽样【例2】某单位在岗职工共624人,为了调查工人用于上班途中的时间,该单位工会决定抽取10%的工人进行调查,请问如何采用系统抽样法完成这一抽样?方法提炼1.当总体中的个体数较多,并且没有明显的层次差异时,可用系统抽样的方法,把总体分成均衡的几部分,按照预先制定的规则,从每一部分抽取一个个体,得到需要的样本.2.在利用系统抽样时,经常遇到总体容量不能被样本容量整除的情况,这时可以先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量整除.请做演练巩固提升2,3三、分层抽样【例3】为了对某课题进行研究,用分层抽样方法从三所高校A,B,C的相关人员中,抽取若干人组成研究小组,有关数据见下表(单位:人).高校相关人数抽取人数A18xB36 2C54y(1)求x,y;(2)若从高校B,C抽取的人中选2人作专题发言,求这2人都来自高校C的概率.方法提炼分层抽样适用于总体是由差异明显的几部分组成的情况,这样更能反映总体的情况,是等可能抽样.当各层抽取的个体数目确定后,每层中的样本抽取可用简单随机抽样或系统抽样的方法.用分层抽样法抽样的关键是确定抽样比,抽样比=样本容量总体中的个体数=每层抽取的个体数该层的个体数.用抽样比乘以该层的个体数就等于在该层中应抽取的个体数.请做演练巩固提升3要重视分层抽样的抽样比【典例】 (2012江苏高考)某学校高一、高二、高三年级的学生人数之比为3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取__________名学生.解析:根据分层抽样的特点,可得高二年级学生人数占学生总人数的310,因此在样本中,高二年级的学生所占比例也应该为310,故应从高二年级抽取50×310=15(名)学生.答案:15答题指导:1.看清总体是按什么样的标准抽样.2.计算各层的个数和总数的比,按各层个体数占总体数的比确定各层应抽取个体数.1.下面的抽样方法是简单随机抽样的是( ).A.在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2709的为三等奖B.某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格C.某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解学校机构改革的意见D.用抽签方法从10件产品中选取3件进行质量检验2.为了检查某超市货架上的饮料是否含有塑化剂,要从编号依次为1到50的塑料瓶装饮料中抽取5瓶进行检验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的5瓶饮料的编号可能是( ).A.5,10,15,20,25 B.2,4,8,16,32C.1,2,3,4,5 D.7,17,27,37,473.(2012浙江高考)某个年级有男生560人,女生420人,用分层抽样的方法从该年级全体学生中抽取一个容量为280的样本,则此样本中男生人数为__________.参考答案基础梳理自测知识梳理1.总体 个体 样本 样本容量2.(1)相同 简单随机样本 (2)抽签法 随机数表法3.(1)编号 (2)分段间隔k 分段 (3)简单随机抽样 (4)s +k s +2k4.(1)有明显差别的几部分 互不重叠层 层在总体中所占比例进行简单随机抽样或系统抽样基础自测1.D 解析:由从总体中抽取样本的意义知D 是正确的.2.D 解析:由系统抽样的特点可知选D.3.120 解析:分层抽样中,每个个体被抽到的概率都相等,则10x =112x =120. 4.2 解析:由系统抽样特点知应剔除2个.考点探究突破【例1】解:抽签法:第一步,将18名志愿者编号,编号为1,2,3, (18)第二步,将18个号码分别写在18张外形完全相同的纸条上,并揉成团,制成号签. 第三步,将18个号签放入一个不透明的盒子里,充分搅匀.第四步,从盒子中逐个抽取6个号签,并记录上面的编号.第五步,所得号码对应的志愿者,就是志愿小组的成员.随机数法:第一步,将18名志愿者编号,编号为01,02,03,…,18. 第二步,在随机数表中任选一数作为开始,按任意方向读数,比如第8行第29列的数7开始,向右读.第三步,从数7开始,向右读,每次取两位,凡不在01~18中的数,或已读过的数,都跳过去不作记录,依次可得到12,07,15,13,02,09.第四步,找出以上号码对应的志愿者,就是志愿小组的成员.【例2】解:(1)将624名职工用随机方式编号由000至623.(2)利用随机数法从总体中剔除4人.(3)将剩下的620名职工重新编号由000至619.(4)分段,取间隔k =62062=10,将总体分成62组,每组含10人. (5)从第一段,即为000至009号随机抽取一个号l .(6)按编号将l,10+l,20+l ,…,610+l 共62个号码选出.这62个号码所对应的职工组成样本.【例3】解:(1)由题意,可得x 18=236=y 54,所以x =1,y =3. (2)记从高校B 抽取的2人为b 1,b 2,从高校C 抽取的3人为c 1,c 2,c 3,则从高校B ,C 抽取的5人中选2人作专题发言的基本事件有(b 1,b 2),(b 1,c 1),(b 1,c 2),(b 1,c 3),(b 2,c 1),(b 2,c 2),(b 2,c 3),(c 1,c 2),(c 1,c 3),(c 2,c 3)共10种.设选中的2人都来自高校C 的事件为X ,则X 包含的基本事件有(c 1,c 2),(c 1,c 3),(c 2,c 3)共3种.因此P (X )=310. 故选中的2人都来自高校C 的概率为310. 演练巩固提升1.D 解析:A ,B 不是简单随机抽样,因为抽取的个体间的间隔是固定的;C 不是简单随机抽样,因为总体的个体有明显的层次差异;D 是简单随机抽样.2.D 解析:利用系统抽样,把编号分为5段,每段10个,每段抽取一个,号码间隔为10.3.160 解析:根据分层抽样的特点,此样本中男生人数为560560+420×280=160.。
§11.2 统计图表、用样本估计总体最新考纲考情考向分析1.了解分布的意义和作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(如平均数,标准差),并做出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.主要考查平均数,方差的计算以及茎叶图与频率分布直方图的简单应用;题型以选择题和填空题为主,出现解答题时经常与概率相结合,难度为中低档.1.统计图表统计图表是表达和分析数据的重要工具,常用的统计图表有条形统计图、扇形统计图、折线统计图、茎叶图等. 2.数据的数字特征 (1)众数、中位数、平均数众数:在一组数据中,出现次数最多的数据叫作这组数据的众数.中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫作这组数据的中位数.平均数:样本数据的算术平均数,即x =1n(x 1+x 2+…+x n ).在频率分布直方图中,中位数左边和右边的直方图的面积应该相等. (2)样本方差、标准差 标准差s =1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x n 是样本数据的第n 项,n 是样本容量,x 是平均数.标准差是刻画数据的离散程度的特征数,样本方差是标准差的平方.通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差. 3.用样本估计总体(1)通常我们对总体作出的估计一般分成两种,一种是用样本的频率分布估计总体的频率分布,另一种是用样本的数字特征估计总体的数字特征.(2)在频率分布直方图中,纵轴表示f iΔx i ,数据落在各小组内的频率用各小长方形的面积表示,各小长方形的面积总和等于1.(3)在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,称之为频率折线图.(4)当样本数据较少时,用茎叶图表示数据的效果较好,它没有信息的缺失,而且可以随时记录,方便表示与比较. 知识拓展1.频率分布直方图的特点(1)频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示f i Δx i ,频率=组距×f iΔx i .(2)在频率分布直方图中,各小长方形的面积总和等于1,因为在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观. 2.平均数、方差的公式推广(1)若数据x 1,x 2,…,x n 的平均数为x ,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是m x +a .(2)数据x 1,x 2,…,x n 的方差为s 2.①数据x 1+a ,x 2+a ,…,x n +a 的方差也为s 2; ②数据ax 1,ax 2,…,ax n 的方差为a 2s 2.题组一 思考辨析1.判断下列结论是否正确(请在括号中打“√”或“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( √ ) (2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( × ) (3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( √ )(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( × )(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( √ ) (6)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.( × ) 题组二 教材改编2.一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为( ) A .4 B .8 C .12 D .16 答案 B解析 设频数为n ,则n32=0.25,∴n =32×14=8.3.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )A .91.5和91.5B .91.5和92C .91和91.5D .92和92答案 A解析 ∵这组数据由小到大排列为87,89,90,91,92,93,94,96,∴中位数是91+922=91.5,平均数x =87+89+90+91+92+93+94+968=91.5.4.如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民有________人.答案 25解析 0.5×0.5×100=25. 题组三 易错自纠5.若数据x1,x2,x3,…,x n的平均数x=5,方差s2=2,则数据3x1+1,3x2+1,3x3+1,…,3x n+1的平均数和方差分别为( )A.5,2 B.16,2C.16,18 D.16,9答案 C解析∵x1,x2,x3,…,x n的平均数为5,∴x1+x2+x3+…+x nn=5,∴3x1+3x2+3x3+…+3x nn+1=3×5+1=16,∵x1,x2,x3,…,x n的方差为2,∴3x1+1,3x2+1,3x3+1,…,3x n+1的方差是32×2=18.6.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分的中位数为m,众数为n,平均数为x,则m,n,x的大小关系为________.(用“<”连接)答案n<m<x解析由图可知,30名学生得分的中位数为第15个数和第16个数(分别为5,6)的平均数,即m=5.5;又5出现次数最多,故n=5;x=2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×1030≈5.97.故n<m<x.题型一茎叶图的应用1.(2017·山东)如图所示的茎叶图记录了甲,乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为( )A .3,5B .5,5C .3,7D .5,7 答案 A解析 甲组数据的中位数为65,由甲,乙两组数据的中位数相等,得y =5.又甲、乙两组数据的平均值相等,∴15×(56+65+62+74+70+x )=15×(59+61+67+65+78),∴x =3.故选A. 2.(2017·长沙一模)空气质量指数(Air Quality Index ,简单AQI)是定量描述空气质量状况的指数,空气质量按照AQI 大小分为六级,0~50为优;51~100为良;101~150为轻度污染;151~200为中度污染;201~300为重度污染;大于300为严重污染.从某地一环保人士某年的AQI 记录数据中,随机抽取10个,用茎叶图记录如下.根据该统计数据,估计此地该年AQI 大于100的天数约为________.(该年有365天)答案 146解析 该样本中AQI 大于100的频数是4,频率为25,由此估计该地全年AQI 大于100的频率为25,估计此地该年AQI 大于100的天数约为365×25=146.思维升华 茎叶图的优缺点由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较烦琐.题型二 频率分布直方图的绘制与应用命题点1 用频率分布直方图求频率、频数典例 从全校参加数学竞赛的学生的试卷中抽取一个样本,考察竞赛的成绩分布,将样本分成5组,绘成频率分布直方图,图中从左到右各小组的小长方形的高之比为1∶3∶6∶4∶2,最右边一组的频数是6,请结合频率分布直方图提供的信息,解答下列问题:(1)求样本的容量; (2)列出频率分布表;(3)成绩落在哪个范围内的人数最多,并求出该小组的频数、频率; (4)估计这次竞赛中,成绩高于60分的学生占总人数的百分比.解 (1)由于最右边一组的频数是6,从左到右各小组的长方形的高之比为1∶3∶6∶4∶2, 故设样本容量为n ,得(1+3+6+4+2)∶n =2∶6, 解得n =(1+3+6+4+2)×62=48.(2)频率分布表如下:分组 频数 频率 [50.5,60.5) 3 116 [60.5,70.5) 9 316 [70.5,80.5) 18 38 [80.5,90.5) 12 14 [90.5,100.5)6 18 合计481(3)由(2)知成绩落在[70.5,80.5)内的人数最多,频数为18,频率为38.(4)估计成绩高于60分的学生占总人数的百分比为3+6+4+21+3+6+4+2×100%=93.75%.命题点2 用频率分布直方图估计总体典例(2016·四川)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5)分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(3)估计居民月均用水量的中位数.解(1)由频率分布直方图可知,月均用水量在[0,0.5)的频率为0.08×0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5)等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,解得a=0.30.(2)估计全市居民中月均用水量不低于3吨的人数为3.6万.理由如下:由(1)知,100位居民中月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.(3)设中位数为x吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5.而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5.所以2≤x<2.5.由0.50×(x-2)=0.5-0.48,解得x=2.04.故可估计居民月均用水量的中位数为2.04吨.思维升华 (1)准确理解频率分布直方图的数据特点,频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率,不要和条形图混淆.(2)在很多题目中,频率分布直方图中各小长方形的面积之和为1,是解题的关键,常利用频率分布直方图估计总体分布.跟踪训练(2017·北京)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90),并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数; (3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.解 (1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6, 所以样本中分数小于70的频率为1-0.6=0.4,所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4. (2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9, 分数在区间[40,50)内的人数为100-100×0.9-5=5, 所以总体中分数在区间[40,50)内的人数估计为400×5100=20. (3)由题意可知,样本中分数不小于70的学生人数为 (0.02+0.04)×10×100=60,所以样本中分数不小于70的男生人数为60×12=30,所以样本中的男生人数为30×2=60, 女生人数为100-60=40,所以样本中男生和女生人数的比例为60∶40=3∶2,所以根据分层抽样原理,估计总体中男生和女生人数的比例为3∶2. 题型三 用样本的数字特征估计总体的数字特征典例 (1)(2017·南京模拟)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:运动员 第1次 第2次 第3次 第4次 第5次 甲 87 91 90 89 93 乙8990918892则成绩较为稳定(方差较小)的那位运动员成绩的方差为________. 答案 2解析 x 甲=15(87+91+90+89+93)=90,x 乙=15(89+90+91+88+92)=90,s 2甲=15[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2]=4,s 2乙=15[(89-90)2+(90-90)2+(91-90)2+(88-90)2+(92-90)2]=2.(2)甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图:①分别求出两人得分的平均数与方差;②根据图和上面算得的结果,对两人的训练成绩作出评价. 解 ①由图像可得甲、乙两人五次测试的成绩分别为 甲:10分,13分,12分,14分,16分; 乙:13分,14分,12分,12分,14分.x 甲=10+13+12+14+165=13;x 乙=13+14+12+12+145=13,s 2甲=15[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4;s 2乙=15[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.②由s 2甲>s 2乙,可知乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.思维升华 平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.跟踪训练 (2018·福建漳平质检)某企业有甲、乙两个研发小组,为了比较他们的研发水平,现随机抽取这两个小组往年研发新产品的结果如下:(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),其中a ,a 分别表示甲组研发成功和失败;b ,b 分别表示乙组研发成功和失败.(1)若某组成功研发一种新产品,则给该组记1分,否则记0分.试计算甲、乙两组研发新产品的成绩的平均数和方差,并比较甲、乙两组的研发水平;(2)若该企业安排甲、乙两组各自研发一种新产品,试估计恰有一组研发成功的概率. 解 (1)甲组研发新产品的成绩为1,1,1,0,0,1,1,1,0,1,0,1,1,0,1,其平均数x 甲=1015=23;方差为s 2甲=115⎣⎢⎡⎦⎥⎤⎝ ⎛⎭⎪⎫1-232×10+⎝ ⎛⎭⎪⎫0-232×5=29. 乙组研发新产品的成绩为1,0,1,1,0,1,1,0,1,0,0,1,0,1,1,其平均数x 乙=915=35;方差为s 2乙=115⎣⎢⎡⎦⎥⎤⎝ ⎛⎭⎪⎫1-352×9+⎝ ⎛⎭⎪⎫0-352×6=625. 因为x 甲>x 乙,s 2甲<s 2乙,所以甲组的研发水平优于乙组.(2)记恰有一组研发成功为事件E ,在所抽得的15个结果中,恰有一组研发成功的结果是(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),共7个.因此事件E发生的频率为715.用频率估计概率,即得所求概率为P (E )=715.高考中频率分布直方图的应用考点分析 频率分布直方图是高考考查的热点,考查频率很高,题型有选择题,填空题,也有解答题,难度为中低档.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.典例 (12分)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300)分组的频率分布直方图如图.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300)的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户? 规范解答解 (1)由(0.002+0.009 5+0.011+0.012 5+x +0.005+0.002 5)×20=1,得x =0.007 5, 所以直方图中x 的值是0.007 5.[2分](2)月平均用电量的众数是220+2402=230.[4分]因为(0.002+0.009 5+0.011)×20=0.45<0.5,所以月平均用电量的中位数在[220,240)内,设中位数为a ,由(0.002+0.009 5+0.011)×20+0.012 5×(a -220)=0.5,得a =224,所以月平均用电量的中位数是224.[8分](3)月平均用电量为[220,240)的用户有0.012 5×20×100=25(户),月平均用电量为[240,260)的用户有0.007 5×20×100=15(户),月平均用电量为[260,280)的用户有0.005×20×100=10(户),月平均用电量为[280,300)的用户有0.002 5×20×100=5(户), 抽取比例为1125+15+10+5=15,所以月平均用电量在[220,240)的用户中应抽取25×15=5(户).[12分]1.(2017·全国Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是( )A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳答案 A解析对于选项A,由图易知,月接待游客量每年7,8月份明显高于12月份,故A错;对于选项B,观察折线图的变化趋势可知,年接待游客量逐年增加,故B正确;对于选项C,D,由图可知显然正确.故选A.2.(2018届广东肇庆检测)下面茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为( )A.5 8 B.4 9C.6 7 D.3 10答案 A解析由题意根据甲组数据的中位数为15,可得x=5;乙组数据的平均数为16.8,则9+15+18+24+10+y5=16.8,求得y=8.3.(2016·全国Ⅲ)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15℃,B点表示四月的平均最低气温约为5℃.下面叙述不正确的是( )A.各月的平均最低气温都在0℃以上B .七月的平均温差比一月的平均温差大C .三月和十一月的平均最高气温基本相同D .平均最高气温高于20℃的月份有5个 答案 D解析 由题意知,平均最高气温高于20℃的有七月,八月,故选D.4.某工厂对一批新产品的长度(单位:mm)进行检测,如图是检测结果的频率分布直方图,据此估计这批产品的中位数为( )A .20B .25C .22.5D .22.75答案 C解析 产品的中位数出现在频率是0.5的地方.自左至右各小矩形的面积依次为0.1,0.2,0.4,0.15,0.15,设中位数是x ,则由0.1+0.2+0.08×(x -20)=0.5,得x =22.5,故选C.5.(2017·长沙适应性考试)某校开展“爱我母校,爱我家乡”摄影比赛,七位评委为甲,乙两名选手的作品打出的分数的茎叶图如图所示(其中m 为数字0~9中的一个),去掉一个最高分和一个最低分后,甲,乙两名选手得分的平均数分别为a 1,a 2,则一定有( )A .a 1>a 2B .a 2>a 1C .a 1=a 2D .a 1,a 2的大小与m 的值有关答案 B解析 由茎叶图知,a 1=80+1+5+5+4+55=84,a 2=80+4+4+6+4+75=85,故选B.6.若样本数据x 1,x 2,…,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为( )A.8 B.15 C.16 D.32答案 C解析已知样本数据x1,x2,…,x10的标准差为s=8,则s2=64,数据2x1-1,2x2-1,…,2x10-1的方差为22s2=22×64,所以其标准差为22×64=2×8=16,故选C.7.已知样本数据x1,x2,…,x n的平均数x=5,则样本数据2x1+1,2x2+1,…,2x n+1的平均数为________.答案11解析由x1,x2,…,x n的平均数x=5,得2x1+1,2x2+1,…,2x n+1的平均数为2x+1=2×5+1=11.8.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130)上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm.答案24解析底部周长在[80,90)的频率为0.015×10=0.15,底部周长在[90,100)的频率为0.025×10=0.25,样本容量为60,所以树木的底部周长小于100 cm的株数为(0.15+0.25)×60=24. 9.(2018·郑州模拟)某电子商务公司对10 000名网络购物者2016年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9)内,其频率分布直方图如图所示:(1)直方图中的a=________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.答案(1)3 (2)6 000解析由频率分布直方图及频率和等于1,可得0.2×0.1+0.8×0.1+1.5×0.1+2×0.1+2.5×0.1+a×0.1=1,解得a=3.于是消费金额在区间[0.5,0.9)内的频率为0.2×0.1+0.8×0.1+2×0.1+3×0.1=0.6,所以消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10 000=6 000.10.某校女子篮球队7名运动员身高(单位:cm)分布的茎叶图如图,已知记录的平均身高为175 cm ,但记录中有一名运动员身高的末位数字不清晰,如果把其末位数字记为x ,那么x 的值为________.答案 2解析 170+17×(1+2+x +4+5+10+11)=175,17×(33+x )=5,即33+x =35,解得x =2. 11.(2017·贵州遵义检测)在一个文艺比赛中,12名专业人士和12名观众代表各组成一个评判小组,给参赛选手打分,如图是两个评判组对同一选手打分的茎叶图:(1)求A 组数的众数和B 组数的中位数;(2)对每一组计算用于衡量相似性的数值,回答:小组A 与小组B 哪一个更像是由专业人士组成的?并说明理由.解 (1)由茎叶图可得:A 组数据的众数为47,B 组数据的中位数为55+582=56.5.(2)小组A ,B 数据的平均数分别为x A =112(42+42+44+45+46+47+47+47+49+50+50+55)=56412=47, x B =112(36+42+46+47+49+55+58+62+66+68+70+73)=67212=56, 小组A ,B 数据的方差分别为s 2A =112[(42-47)2+(42-47)2+…+(55-47)2] =112(25+25+9+4+1+0+0+0+4+9+9+64)=12.5, s 2B =112[(36-56)2+(42-56)2+…+(73-56)2]=112(400+196+100+81+49+1+4+36+100+144+196+289)=133.因为s2A<s2B,所以A组成员的相似程度高,由于专业裁判给分更符合专业规则,相似程度应该高,因此A组更像是由专业人士组成的.12.(2016·北京)某市民用水拟实行阶梯水价,每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费,从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替,当w=3时,估计该市居民该月的人均水费.解(1)如题图所示,用水量在[0.5,3)的频率的和为(0.2+0.3+0.4+0.5+0.3)×0.5=0.85.∴用水量小于等于3立方米的频率为0.85,又w为整数,∴为使80%以上的居民在该月的用水价格为4元/立方米,w至少定为3.(2)当w=3时,该市居民该月的人均水费估计为(0.1×1+0.15×1.5+0.2×2+0.25×2.5+0.15×3)×4+0.15×3×4+[0.05×(3.5-3)+0.05×(4-3)+0.05×(4.5-3)]×10=7.2+1.8+1.5=10.5(元).即当w=3时该市居民该月的人均水费估计为10.5元.13.(2017·全国Ⅰ)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数答案 B解析因为可以用极差、方差或标准差来描述数据的离散程度,所以要评估亩产量稳定程度,应该用样本数据的极差、方差或标准差.故选B.14.某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.A地区用户满意度评分的频率分布直方图图①B地区用户满意度评分的频数分布表满意度评分分组[50,60)[60,70)[70,80)[80,90)[90,100)频数281410 6(1)在图②中作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);B地区用户满意度评分的频率分布直方图图②(2)根据用户满意度评分,将用户的满意度分为三个等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意估计哪个地区用户的满意度等级为不满意的概率大?说明理由.解(1)作出频率分布直方图如图:通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(2)A 地区用户的满意度等级为不满意的概率大.记C A 表示事件:“A 地区用户的满意度等级为不满意”;C B 表示事件:“B 地区用户的满意度等级为不满意”.由直方图得P (C A )的估计值为(0.01+0.02+0.03)×10=0.6,P (C B )的估计值为(0.005+0.02)×10=0.25.所以A 地区用户的满意度等级为不满意的概率大.15.(2017·山西大学附中诊断测试)已知样本(x 1,x 2,…,x n )的平均数为x ,样本(y 1,y 2,…,y m )的平均数为y (x ≠y ),若样本(x 1,x 2,…,x n ,y 1,y 2,…,y m )的平均数z =a x +(1-a )y ,其中0<a <12,则n ,m 的大小关系为( )A .n <mB .n >mC .n =mD .不能确定答案 A解析 由题意可得x =x 1+x 2+…+x nn,y =y 1+y 2+…+y mm,z =x 1+x 2+…+x n +y 1+y 2+…+y mn +m=nn +m ·x 1+x 2+…+x n n +m n +m ·y 1+y 2+…+y mm=n n +m·x +m n +m·y =a x +(1-a )y ,所以nn +m=a ,mn +m =1-a ,又0<a <12, 所以0<nn +m <12<m n +m,所以n <m .故选A. 16.(2018·洛阳质检)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得到如下频数分布表:质量指标值分组[75,85) [85,95) [95,105) [105,115) [115,125) 频数62638228(1)作出这些数据的频率分布直方图;(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?解(1)样本数据的分布直方图如图所示:(2)质量指标值的样本平均数为x=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.。
第5节古典概型最新考纲 1.理解古典概型及其概率计算公式;2.会计算一些随机事件所包含的基本事件数及事件发生的概率.知识梳理1.基本事件的特点(1)任何两个基本事件是______互斥的.(2)任何事件(除不可能事件)都可以表示成基本事件的和.2.古典概型具有以下两个特征的概率模型称为古典的概率模型,简称古典概型.有限个(1)试验的所有可能结果只有__________,每次试验只出现其中的一个结果.(2)每一个试验结果出现的可能性______.相同3.如果一次试验中可能出现的结果有 n 个,而且所有结果出现的可能性都相等那 1 么每一个基本事件的概率都是______;如果某个事件 A 包括的结果有 m 个,那么n m 事件 A 的概率 P (A )=_____. n 4.古典概型的概率公式事件A 包含的可能结果数 试验的所有可能结果数 P (A )=___________________________.[常用结论与微点提醒]1.古典概型中的基本事件都是互斥的,确定基本事件的方法主要有列举法、列表法与树状图法.2.概率的一般加法公式P(A∪B)=P(A)+P(B)-P(A∩B)中,易忽视只有当A∩B=∅,即A,B互斥时,P(A∪B)=P(A) +P(B),此时P(A∩B)=0.诊断自测1.思考辨析(在括号内打“√”或“×”)(1)“在适宜条件下,种下一粒种子观察它是否发芽”属于古典概型,其基本事件是“发芽与不发芽”.( )(2)掷一枚硬币两次,出现“两个正面”“一正一反”“两个反面”,这三个结果是等可能事件.( )(3)从-3,-2,-1,0,1,2中任取一数,取到的数小于0 与不小于0的可能性相同.( )(4)利用古典概型的概率可求“在边长为2的正方形内任取一点,这点到正方形中心距离小于或等于1”的概率.( )解析对于(1),发芽与不发芽不一定是等可能,所以(1)不正确;对于(2),三个事件不是等可能,其中“一正一反”应包括正反与反正两个基本事件,所以(2)不正确;对于(4),应利用几何概型求概率,所以(4)不正确.答案(1)× (2)× (3)√(4)×2.(教材习题改编)掷两颗均匀的骰子,则点数之和为5的概率等于( )1 18 1 1 112A. B.9 C.6D.解析所有基本事件的个数为6×6=36,点数之和为5的基本事件有(1,4),(2,4 13),(3,2),(4,1)共4个.故所求概率为P==.36 9答案 B3.(2016·北京卷)从甲、乙等 5名学生中随机选出 2人,则甲被选中的概率为(1 52 C.2589 25 A. B.5 D. 1 1 C C 4 2 1 4 解析甲被选中的概率为 P = == .2 C 10 5 5 答案 B4.(2018·长沙模拟)在装有相等数量的白球和黑球的口袋中放进一个白球,此时这1个口袋中取出一个白球的概率比原来由此口袋中取出一个白球的概率大22,口袋中原有小球的个数为( )A.5B.6C.10D.11n+1 n 1解析设原来口袋中白球、黑球的个数分别为n个,依题意+1-=,解得n2n 22=5.所以原来口袋中小球共有2n=10个.答案 Cn π 5. (2018·盘锦调研)在集合x x 10中任取一个元素,则所= 6,n =1,2,3,…, 1 2取元素恰好满足方程 cos x =的概率是________. 1 2 解析基本事件总数为 10,满足方程 c o s x =的基本数为 2,故所求概率为 P2 1 ==.10 5 1 5 答案考点一简单的古典概型的概率【例1】(1)(2017·山东卷)从分别标有1,2,…,9的9张卡片中不放回地机抽取2次,每次抽取1张,则抽到的2张卡片上的数奇偶性不同的概率是( ) 5 18 B.94 C.59 D.97A.(2)(2018·沈阳模拟)将A,B,C,D这4名同学从左至右随机地排成一排,则“A与B相邻且A与C之间恰好有1名同学”的概率是( ) 12 B.41 C.16 D.81A.5×4×2解析(1)由题意得,所求概率P=9×8=59.(2)A,B,C,D 4名同学排成一排有A44=24种排法.当A,C 是B时,有2×24+2 1=4种排法,当A,C之间是D时,有2种排法,24 4所以所求概率为=.答案(1)C (2)B规律方法 1.计算古典概型事件的概率可分三步:(1)计算基本事件总个数n;(2)计算事件A所包含的基本事件的个数m;(3)代入公式求出概率P.2.(1)用列举法写出所有基本事件时,可借助“树状图”列举,以便做到不重、不漏.(2)利用排列、组合计算基本事件时,一定要分清是否有序,并重视两个计数原理的灵活应用.【训练1】(1)(2018·湖南衡阳八中、长郡中学等十三校二模)同学聚会上,某学从《爱你一万年》《十年》《父亲》《单身情歌》四首歌中选出两首歌进行演,A.31B.21C.23D.65则《爱你一万年》未被选取的概率为( )(2)(2018·昆明诊断)从集合A={-2,-1,2}中随机抽取一个数记为a,从合 B={-1,1,3}中随机抽取一个数记为b,则直线ax-y+b=0不经过第四限A.92B.31C.49D.41的概率为( )解析 (1)从四首歌中任选两首共有 C 24=6种选法,不选取《爱你一万年的方法有3 1 6 2 2 3 C =3种,故所求的概率为 P == .(2)(a ,b )所有可能的结果为(-2,-1),(-2,1),(-2,3),(-1,-1),(1),a ≥0, (-1,3),(2,-1),(2,1),(2,3),共 9种.由 ax -y +b =0y =ax +b ,当b ≥0时,直线不经过第四象限,符合条件的(a ,b )的结果为(2,1),(2,3),共 种,∴直 2 9 线 a x -y +b =0不经过第四象限的概率 P = .答案 (1)B (2)A考点二复杂的古典概型的概率(典例迁移)【例2】(经典母题)某市A,B两所中学的学生组队参加辩论赛,A中学推荐了3名男生、2名女生,B中学推荐了3名男生、4名女生,两校所推荐的学生一起参加集训.由于集训后队员水平相当,从参加集训的男生中随机抽取3人、女生中随机抽取3人组成代表队.(1)求A中学至少有1名学生入选代表队的概率;(2)某场比赛前,从代表队的6名队员中随机抽取4人参赛,求参赛女生人数不少于2人的概率.解 (1)由题意,参加集训的男、女生各有 6名.参赛学生全从 B 中学抽取(等于 A 3 3 C C 1 3 4 中学没有学生入选代表队)的概率为 =,因此,A 中学至少有 1名学生入3 3 C C 100 6 61 99 代表队的概率为 1-= .100 100 (2)设“参赛的 4人中女生不少于 2人”为事件 A ,记“参赛女生有 2人”B , 2 2 3 1 3 3 4 C 5 6C C 3 C C 1 3 3 “参赛女生有 3人”为事件 C .则 P (B )= =,P (C )= = . 4 C 5 6 由互斥事件的概率加法公式, 得 P (A )=P (B )+P (C )=+=,故所求事件的概率为45.3 145 5 5【迁移探究1】求A 中学至多有1人入选代表队的概率.解设“A 中学至多有 1人入选代表队”为事件 A ,“A 中学无人入选代表队”为事件 B ,“A 中学有 1人入选代表队”为事件 C ,则 1 2 3 3 3 4 1 2 3 2 4 3 3 63 3 C C C +C C C C C 1 3 25 34 P (B )= =,P (C )= =, 3 3 3 C C 100 C ·C 6 6 6 1 3 13 由互斥事件的概率加法公式得 P (A )=P (B )+P (C )=+=,故所求事件的概 100 25 100率为10013 .【迁移探究2】求B 中学入选代表队的女生人数多于男生人数解设“中学入选代表队的女生人数多于男生人数”为事件 A ,则 P (A )= 的概率. B 3 4 2 3 0 1 2 3 3 1 0 2 4 3 2 3 3 0 0 3 4 3 2 3 2 1 4 3 1 2 2 3 2 0 1 3 4 3 2 3 1 0 4 3 2 3 C ·C ·C C +C C C C +C C C C +C C ·C C +C C C C +C C ·C C 2 3 3 6 3 6C ·C =12,即 B 中学入选代表队的女生人数多于男生人数的概率为 . 12规律方法 1.求较复杂事件的概率问题,解题关键是理解题目的实际含义,把实际问题转化为概率模型,必要时将所求事件转化成彼此互斥事件的和,或者先求其对立事件的概率,进而再用互斥事件的概率加法公式或对立事件的概率公式求解.2.注意区别排列与组合,以及计数原理的正确使用.【训练 2】 (1)(2018·亳州模拟)已知集合 M ={1,2,3,4},N ={(a ,b )|a ,b ∈M },A 是集合 N 中任意一点,O 为坐标原点,则直线 OA 与 y =x 2+1有交点的率是( ) 1 2 1 3 1 1 8 A. B.C. 4D.(2)(2018·兰州模拟)如图,在平行四边形 ABCD 中,O 是AC 与 BD 的交点,P ,Q ,M ,N 分别是线段 OA ,OB ,OC ,OD 的中点.在 A ,P ,M ,C 中任取一点记为 E , 在 B ,Q ,N ,D 中任取一点记为 F .设 G 为满足向量OG → =OE →+OF →的点,则在上述的点 G 组成的集合中的点,落在平行四边形 ABCD 外(不含边界)的概率为________.y =x 2+1, 解析 (1)设 A (a ,b ),则直线 O A 的方程为 y =bax ,由 b y = x得 x 2-bax +1=0, a b 由题意得 Δ=- 2-4≥0,即 b ≥2a 或 b ≤-2a ,由于A 的坐标可能取到的所有 a 情况有:(1,1),(1,2),(1,3),(1,4),(2,1),(2,2),(2,3),(2,4),(1),(3,2),(3,3),(3,4),(4,1),(4,2),(4,3),(4,4),共 16种,其中b ≥2a或 b ≤-2a 的情况有(1,2),(1,3),(1,4),(2,4),共 4种,的概率为 P 4 1 ==.16 4(2)易知基本事件的总数是4×4=16,在OG→=OE→+OF→中,当OG→OP→+OQ→,OG→=OP→+ON→,OG→=ON→+OM→,OG→=OM→+OQ→时,点G在平行四边形的边界上,而其4 3余情况的点G都在平行四边形外,故所求的概率是1-=.16 4答案(1)C(2)34考点三古典概型与统计知识的交汇问题【例3】(2018·黄冈质检)已知某中学高三理科班学生的数学与物理的水平测试成绩抽样统计如下表:若抽取学生n人,成绩分为A(优秀),B(良好),C(及格)三个等级,设x,y分别表示数学成绩与物理成绩,例如:表中物理成绩为A等级的共有14+40+10=64(人),数学成绩为B等级且物理成绩为C等级的共有8人.已知x与y均为A等级的概率是0.07.(1)设在该样本中,数学成绩的优秀率是30%,求a,b的值;(2)已知a≥7,b≥6,求数学成绩为A等级的人数比C等级的人数多的概率.解 (1)由题意知14n =0.07,解得 n =200,∴14+a +28 200 ×100%=30%,解得 a =18,易知 a +b =30,所以 b =12. (2)由 14+a +28>10+b +34得 a >b +2,又 a +b =30且 a ≥7,b ≥6,则(a 的所有可能结果为(7,23),(8,22),(9,21),…,(24,6),共 18种,而 a >b 可 8 4能结果为(17,13),(18,12),…,(24,6),共 8种,则所求概率 P == .18 9规律方法求解古典概型与统计交汇问题的思路(1)依据题目的直接描述或频率分布表、频率分布直方图、茎叶图等统计图表给出的信息,提炼需要的信息.(2)进行统计与古典概型概率的正确计算.【训练3】从某地高中男生中随机抽取100名同学,将他们的体重(单位:kg)数据绘制成频率分布直方图(如图所示).由图中数据可知体重的平均值为________kg;若要从体重在[60,70),[70,80),[80,90]三组内的男生中,用分层抽样的方法选取12人参加一项活动,再从这12个人中选两人当正副队长,则这两人体重不在同一组内的概率为________.解析由频率分布直方图可知,体重在[40,50)内的男生人数为0.005×10×100=5, 同理,体重在[50,60),[60,70),[70,80),[80,90]内的人数分别为 3530,20, 45×5+55×35+65×30+75×20+85×10 10,所以体重的平均值为 =64.5.利用分100 层抽样的方法选取 12人,则从体重在[60,70),[70,80),[80,90]内选取的 30 60 20 60 10 60人数分别为 12×=6,12×=4,12×=2,则两人体重不在同一组内的概1 1 6 6 1 1 1 1 2 10 C C +C C +C C 为 =23. 4 8 2 A12 2 3 答案 64.5。
§11.1 随机抽样 最新考纲 考情考向分析 1.理解随机抽样的必要性和重要性. 2.会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样的方法.
在抽样方法的考查中,系统抽样,分层抽样是考查的重点,题型主要以选择题和填空题为主,属于中低档题.
1.简单随机抽样 (1)定义:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样. (2)最常用的简单随机抽样方法有两种——抽签法和随机数法. (3)应用范围:总体个体数较少. 2.系统抽样的步骤 一般地,假设要从容量为N的总体中抽取容量为n的样本. (1)先将总体的N个个体编号;
(2)确定分段间隔k,对编号进行分段.当Nn(n是样本容量)是整数时,取k=Nn; (3)在第1段用简单随机抽样确定第一个个体编号l (l≤k); (4)按照一定的规则抽取样本.通常是将l加上间隔k得到第2个个体编号(l+k),再加k得到第3个个体编号(l+2k),依次进行下去,直到获取整个样本. 3.分层抽样 (1)定义:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样. (2)分层抽样的应用范围: 当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法. 题组一 思考辨析 1.判断下列结论是否正确(请在括号中打“√”或“×”) (1)简单随机抽样是一种不放回抽样.( √ ) (2)简单随机抽样每个个体被抽到的机会不一样,与先后有关.( × ) (3)抽签法中,先抽的人抽中的可能性大.( × ) (4)系统抽样在第1段抽样时采用简单随机抽样.( √ ) (5)要从1 002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平.( × ) (6)分层抽样中,每个个体被抽到的可能性与层数及分层有关.( × ) 题组二 教材改编 2.[P100A组T1]在“世界读书日”前夕,为了了解某地5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5 000名居民的阅读时间的全体是( ) A.总体 B.个体 C.样本的容量 D.从总体中抽取的一个样本 答案 A 解析 由题目条件知,5 000名居民的阅读时间的全体是总体;其中1名居民的阅读时间是个体;从5 000名居民某天的阅读时间中抽取的200名居民的阅读时间是从总体中抽取的一个样本,样本容量是200. 3.[P100A组T2]某公司有员工500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人,为了调查员工的身体健康状况,从中抽取100名员工,则应在这三个年龄段分别抽取人数为( ) A.33,34,33 B.25,56,19 C.20,40,30 D.30,50,20 答案 B 解析 因为125∶280∶95=25∶56∶19, 所以抽取人数分别为25,56,19. 4.[P59T2]某班共有52人,现根据学生的学号,用系统抽样的方法,抽取一个容量为4的样本,已知3号,29号,42号学生在样本中,那么样本中还有一个学生的学号是( ) A.10 B.11 C.12 D.16 答案 D 解析 从被抽中的3名学生的学号中可以看出学号间距为13,所以样本中还有一个学生的学号是16,故选D. 题组三 易错自纠 5.从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是( ) A.5,10,15,20,25 B.3,13,23,33,43 C.1,2,3,4,5 D.2,4,6,16,32 答案 B 解析 间隔距离为10,故可能的编号是3,13,23,33,43. 6.甲、乙两套设备生产的同类型产品共4 800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件. 答案 1 800 解析 分层抽样中各层的抽样比相同.样本中甲设备生产的产品有50件,则乙设备生产的产品有30件.在4 800件产品中,甲、乙设备生产的产品总数比为5∶3,所以乙设备生产的产品的总数为1 800件.
题型一 简单随机抽样 1.某班级有男生20人,女生30人,从中抽取10人作为样本,其中一次抽样结果是:抽到了4名男生,6名女生,则下列命题正确的是( ) A.这次抽样中可能采用的是简单随机抽样 B.这次抽样一定没有采用系统抽样 C.这次抽样中每个女生被抽到的概率大于每个男生被抽到的概率 D.这次抽样中每个女生被抽到的概率小于每个男生被抽到的概率 答案 A 解析 利用排除法求解.这次抽样可能采用的是简单随机抽样,A正确;这次抽样可能采用系统抽样,男生编号为1~20,女生编号为21~50,间隔为5,依次抽取1号,6号,„,46号便可,B错误;这次抽样中每个女生被抽到的概率等于每个男生被抽到的概率,C和D均错误. 2.总体由编号为01,02,„,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( ) 7816 6572 0802 6314 0702 4369 9728 0198 3204 9234 4935 8200 3623 4869 6938 7481
A.08 B.07 C.02 D.01 答案 D 解析 由题意知前5个个体的编号为08,02,14,07,01. 3.利用简单随机抽样,从n个个体中抽取一个容量为10的样本.若第二次抽取时,余下的
每个个体被抽到的概率为13,则在整个抽样过程中,每个个体被抽到的概率为( )
A.14 B.13 C.514 D.1027 答案 C 解析 由题意知9n-1=13,得n=28,所以整个抽样过程中每个个体被抽到的概率为1028=514,故选C. 思维升华 应用简单随机抽样应注意的问题 (1)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法. (2)在使用随机数法时,如遇到三位数或四位数,可从选择的随机数表中的某行某列的数字计起,每三个或四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字舍去. 题型二 系统抽样 典例 (1)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示:
若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是( ) A.3 B.4 C.5 D.6 答案 B 解析 由题意知,将1~35号分成7组,每组5名运动员,成绩落在区间[139,151]内的运动员共有4组,故由系统抽样法知,共抽取4名.故选B. (2)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,„,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( ) A.11 B.12 C.13 D.14 答案 B
解析 由84042=20,即每20人抽取1人,所以抽取编号落入区间[481,720]的人数为720-48020
=24020=12. 引申探究 1.若本例(2)中条件不变,若号码“5”被抽到,那么号码“55”________被抽到.(填“能”或“不能”) 答案 不能 解析 若55被抽到,则55=5+20n,n=2.5,n不是整数.故不能被抽到. 2.若本例(2)中条件不变,若在编号为[481,720]中抽取8人,则样本容量为________. 答案 28 解析 因为在编号[481,720]中共有720-480=240人,又在[481,720]中抽取8人,
所以抽样比应为240∶8=30∶1,又因为单位职工共有840人,所以应抽取的样本容量为84030
=28. 思维升华 (1)系统抽样适用的条件是总体容量较大,样本容量也较大. (2)使用系统抽样时,若总体容量不能被样本容量整除,可以先从总体中随机地剔除几个个体,从而确定分段间隔. (3)起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便随之确定. 跟踪训练 将参加夏令营的600名学生按001,002,„,600进行编号.采用系统抽样的方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分别住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区,则三个营区被抽中的人数依次为( ) A.26,16,8 B.25,17,8 C.25,16,9 D.24,17,9 答案 B 解析 由题意及系统抽样的定义可知,将这600名学生按编号依次分成50组,每一组各有
12名学生,第k(k∈N*)组抽中的号码是3+12(k-1).令3+12(k-1)≤300,得k≤1034,