高考数学一轮必备 10.1《随机抽样》考情分析学案
- 格式:doc
- 大小:84.50 KB
- 文档页数:5
第十章 统计、统计案例 第一讲 随机抽样知识梳理·双基自测知识梳理知识点一 总体、个体、样本、样本容量的概念统计中所考察对象的全体构成的集合看做总体,构成总体的每个元素作为个体,从总体中抽取的__一部分个体__所组成的集合叫做样本,样本中个体的__数目__叫做样本容量.知识点二 简单随机抽样一般地,设一个总体含有N 个个体,从中逐个__不放回__地抽取n 个个体作为样本(n ≤N ),如果每次抽取时总体内的各个个体被抽到的__机会都相等__,就把这种抽样方法叫做简单随机抽样.最常用的简单随机抽样的方法有两种:__抽签法__和__随机数表法__. 知识点三 系统抽样当总体中的个体比较多且均衡时,首先把总体分成均衡的若干部分,然后__按照预先定出的规则__,从每一部分中抽取一个个体,得到所需要的样本,这种抽样方法叫做系统抽样.系统抽样的步骤一般地,假设要从容量为N 的总体中抽取容量为n 的样本. (1)先将总体的N 个个体__编号__;(2)确定__分段间隔k __,对编号进行__分段__.当N n (n 是样本容量)是整数时,取k =Nn ;(3)在第1段用__简单随机抽样__确定第一个个体编号l (k ≤k );(4)按照一定的规则抽取样本.通常是将l 加上间隔k 得到第2个个体编号__(l +k )__,再加k 得到第3个个体编号__(l +2k )__,依次进行下去,直到获取整个样本.知识点四 分层抽样一般地,在抽样时将总体分成互不交叉的层,然后按照__一定的比例__,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.分层抽样的应用范围:当总体是由__差异明显的几个部分__组成时,往往选用分层抽样的方法.重要结论1.不论哪种抽样方法, 总体中的每一个个体入样的概率都是相同的.2.系统抽样一般也称为等距抽样,入样个体的编号相差分段时间隔k的整数倍.3.分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘抽样比.双基自测题组一走出误区1.(多选题)下列结论中正确的是(AB)A.简单随机抽样是从总体中逐个不放回的抽取样本B.系统抽样在起始部分抽样时采用简单随机抽样C.要从1 002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平D.抽签法中,先抽的人抽中的可能性大题组二走进教材2.(P100A组T2)某公司有员工500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人,为了调查员工的身体健康状况,从中抽取100名员工,则应在这三个年龄段分别抽取人数为(B)A.33,34,33 B.25,56,19C.30,40,30 D.30,50,20[解析]因为12528095=255619,所以抽取人数分别为25,56,19.3.(P59T2)某班共有52人,现根据学生的学号,用系统抽样的方法,抽取一个容量为4的样本,已知3号,29号,42号学生在样本中,那么样本中还有一个学生的学号是(D) A.10 B.11C.12 D.16[解析]从被抽中的3名学生的学号中可以看出学号间距为13,所以样本中还有一个学生的学号是16,故选D.题组三考题再现4.(2018·课标全国Ⅲ)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是__分层抽样__.[解析]因为不同年龄段客户对其服务的评价有较大差异,所以根据三种抽样方法的特点可知最合适的抽样方法是分层抽样.5.(2019·课标全国Ⅰ)某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是(C)A.8号学生B.200号学生C.616号学生D.815号学生[解析] 将1 000名学生分成100组,每组10人,则每组抽取的号码构成公差为10的等差数列{a n },由题意知a 5=46,则a n =a 5+(n -5)×10=10n -4,n ∈N *,易知只有C 选项满足题意.故选C .KAO DIAN TU PO HU DONG TAN JIU考点突破·互动探究考点一 简单随机抽样——自主练透例1 (1)(2019·陕西模拟)某班级有男生20人,女生30人,从中抽取10人作为样本,其中一次抽样结果是:抽到了4名男生、6名女生,则下列命题正确的是( A )A .这次抽样可能采用的是简单随机抽样B .这次抽样一定没有采用系统抽样C .这次抽样中每个女生被抽到的概率大于每个男生被抽到的概率D .这次抽样中每个女生被抽到的概率小于每个男生被抽到的概率(2)(2019·山西大同)用简单随机抽样的方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a “第一次被抽到”的可能性与“第二次被抽到”的可能性分别是( A )A .110,110B .310,15C .15,310D .310,310(3)(2020·山西大学附中诊断)某工厂利用随机数表对生产的600个零件进行抽样测试,先将600个零件进行编号,编号分别为001,002,…,599,600从中抽取60个样本,如下提供随机数表的第4行到第6行:32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 42;84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 04;32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45若从表中第6行第6列开始向右依次读取3个数据,则得到的第6个样本编号( D ) A .522 B .324 C .535D .578[解析] (1)利用排除法求解.这次抽样可能采用的是简单随机抽样,A 正确;这次抽样可能采用系统抽样,男生编号为1~20,女生编号为21~50,间隔为5,依次抽取1号,6号,…,46号便可,B 错误;这次抽样中每个女生被抽到的概率等于每个男生被抽到的概率,C 和D 均错误,故选A .(2)在抽样过程中,个体a 每一次被抽中的概率是相等的,因为总体容量为10,故个体a “第一次被抽到”的可能性与“第二次被抽到”的可能性均为110.故选A .(3)从第6行第6列开始向右依次读取3个数,依次得到的样本为436,535,577,348,522,578,故选D .名师点拨 ☞(1)简单随机抽样满足:①抽取的个体数有限;②逐个抽取;③不放回抽取;④等可能抽取.(2)抽签法适用于总体中个体数较少的情况,随机数表法适用于总体中个体数较多的情况.考点二 系统抽样——师生共研例2 (1)(2019·甘肃张掖诊断)某校高三科创班共48人,班主任为了解学生高考前的心理状况,将学生按1至48的学号用系统抽样方法抽取8人进行调查若抽到的最大学号为48,则抽到的最小学号为__6__.(2)(2019·湖北模拟)将参加数学竞赛决赛的500名学生编号为:001,002,…,500,采用系统抽样的方法抽取一个容量为50的样本,分组后,在第一组采用简单随机抽样抽得的号码为003.这500名学生分别在三个考点考试,从001到200在第一考点,从201到355在第二考点,从356到500在第三考点,则第三考点被抽中的人数为( A )A .14B .15C .16D .21[解析] (1)系统抽样的抽取间隔为488=6,则48-6×7=6,则抽到的最小学号为6,故答案为6。
随机抽样、用样本估计总体学习目标1.理解随机抽样的必要性和重要性,会用简单随机抽样方法从总体中抽取样本,了解分层抽样的方法.2.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.1.随机抽样(1)简单随机抽样:一般地,从个体数为N 的总体中逐个不放回地取出n 个个体作为样本(n <N ),如果每个个体都有相同的机会被取到,那么这样的抽样方法称为简单随机抽样.(2)分层抽样:一般地,当总体由差异明显的几个部分组成时,为了使样本更客观地反映总体情况,我们常常将总体中的个体按不同的特点分成层次比较分明的几个部分,然后按各个部分在总体中所占的比实施抽样,这种抽样方法叫分层抽样,所分成的各个部分称为“层”. 2.用样本的频率分布估计总体分布(1)在频率分布直方图中,纵轴表示频率/组距,数据落在各小组内的频率用各小长方形的面积表示.各小长方形的面积的总和等于1. (2)频率分布折线图和总体密度曲线①频率分布折线图:如果将频率分布直方图中各个相邻的矩形的上底边的中点顺次连结起来,那么就得到频率分布折线图.②总体分布的密度曲线:如果将样本容量取得足够大,分组的组距取得足够小,那么相应的频率折线图将趋于一条光滑曲线,我们称这条光滑曲线为总体分布的密度曲线. (3)茎叶图茎是指中间的一列数,叶是从茎的旁边生长出来的数. 3.用样本的数字特征估计总体的数字特征 (1)众数:一组数据中出现次数最多的数.(2)中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数.(3)平均数:x =x 1+x 2+…+x n n ,反映了一组数据的平均水平.(4)把一组数据的最大值与最小值的差称为极差. (5)标准差:是样本数据到平均数的一种平均距离,s =1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2](6)方差:s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2](x n 是样本数据,n 是样本容量,x 是样本平均数). 基础达标1.判断下列结论是否正确(请在括号中打“√”或“×”)(1)简单随机抽样中,每个个体被抽到的机会不一样,与先后有关.( ) (2)分层抽样中,每个个体被抽到的可能性与层数及分层有关.( )(3)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( )(4)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变.( ) 2.某公司有员工500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人,为了调查员工的身体健康状况,从中抽取100名员工,则应在这三个年龄段分别抽取人数为( ) A .33,34,33 B .25,56,19 C .20,40,30D .30,50,203.某射击小组有20人,教练将他们某次射击的数据绘制成如下表格,则这组数据的众数和中位数分别是( )环数 5 6 7 8 9 10 人数127631A .7,7B .8,7.5C .7,7.5D .8,6 4.如图是100位居民月均用水量的频率分布直方图,则月均用水量在[2,2.5)范围内的居民有______人.题组三 易错自纠5.已知一组数据的频率分布直方图如图,则众数是______,平均数是________.6.若数据x1,x2,x3,…,x n的平均数x=5,方差s2=2,则数据3x1+1,3x2+1,3x3+1,…,3x n+1的平均数和方差分别为________.题组训练1.用简单随机抽样的方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a“第一次被抽到”的可能性与“第二次被抽到”的可能性分别是()A.110,110 B.310,15C.15,310 D.310,3102.(2020·吉安模拟)总体由编号为00,01,02,…,48,49的50个个体组成,利用下面的随机数表选取6个个体,选取方法是从随机数表第6行的第9列和第10列数字开始从左到右依次选取两个数字,则选出的第3个个体的编号为()附:第6行至第9行的随机数表如下:2635 7900 3370 9160 1620 3882 7757 49503211 4919 7306 4916 7677 8733 9974 67322748 6198 7164 4148 7086 2888 8519 16207477 0111 1630 2404 2979 7991 9683 5125A.33 B.16 C.38 D.203.为了调查城市PM2.5的情况,按地域把48个城市分成大型、中型、小型三组,相应的城市数分别为24,16,8.若用分层抽样的方法抽取12个城市,则应抽取的中型城市数为() A.3 B.4 C.5 D.6典型例题例1 (2018·全国Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半例2 下面两个图是2020年6月25日由国家卫健委发布的全国疫情累计趋势图,每图下面横向标注日期,纵向标注累计数量.现存确诊为存量数据,计算方法为:累计确诊数-累计死亡数-累计治愈数.则下列对新冠肺炎叙述错误的是()A.自1月20日以来一个月内,全国累计确诊病例属于快速增长时期B.自4月份以来,全国累计确诊病例增速缓慢,疫情扩散势头基本控制C.自6月16日至24日以来,全国每日现存确诊病例平缓增加D.自6月16日至24日以来,全国每日现存确诊病例逐步减少例3 如图所示的茎叶图记录了甲,乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均数也相等,则x和y的值分别为()A.3,5 B.5,5 C.3,7 D.5,7例4 (2020·天津)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47]内的个数为()A.10 B.18 C.20 D.36跟踪训练(1)由于受疫情的影响,学校停课,同学们通过三种方式在家自主学习,现学校想了解同学们对假期学习方式的满意程度,收集如图1所示的数据;教务处通过分层抽样的方法抽取4%的同学进行满意度调查,得到的数据如图2.下列说法错误的是()A.样本容量为240B.若m=50,则本次自主学习学生的满意度不低于四成C.总体中对方式二满意的学生约为300人D.样本中对方式一满意的学生为24人(2)(2021·贵阳模拟)某网站为了了解某“跑团”每月跑步的平均里程,收集并整理了2019年1月至2019年11月期间该“跑团”每月跑步的平均里程(单位:公里)的数据,绘制了下面的折线图.根据折线图,下列结论正确的是()A.月跑步平均里程的中位数为6月份对应的里程数B.月跑步平均里程逐月增加C.月跑步平均里程高峰期大致在8,9月份D.1月至5月的月跑步平均里程相对于6月至11月波动性更小,变化比较平稳(3)(2020·成都模拟)如图是某赛季甲、乙两名篮球运动员9场比赛所得分数的茎叶图,则下列说法错误的是()A.甲所得分数的极差为22 B.乙所得分数的中位数为18C.两人所得分数的众数相等D.甲所得分数的平均数低于乙所得分数的平均数(4)如图是某班50名学生期中考试数学成绩的频率分布直方图,其中成绩分组区间为[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],则图中x的值为________.题组训练1.(2019·全国Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是()A.中位数B.平均数C.方差D.极差2.某项测试成绩满分为10分,现随机抽取30名学生参加测试,得分情况如图所示,假设得分值的中位数为m e,平均数为x,众数为m0,则()A.m e=m0=x B.m e=m0<xC.m e<m0<x D.m0<m e<x3.(2019·全国Ⅱ)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为________.4.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):甲108999乙1010799如果甲、乙两人中只有1人入选,则入选的最佳人选应是________.。
一、教学目标1.知识与技能(1)理解什么是简单随机抽样,简单随机抽样的特点;(2)能够根据实际问题的需求,深刻理解样本的代表性,选择恰当的抽样方法获取样本数据.2.过程与方法(1)学会从现实生活中提出具有一定价值的问题;(2)在学习中,逐步提升数据分析、数学抽象的素养.3.情感态度与价值观认识“不确定性”,体会统计思维与确定性思维的差异.二、教学重难点重点:能从现实生活或其他学科中提出具有一定价值的统计问题,理解随机抽样的必要性与重要性.难点:理解怎样的抽样是随机抽样,如何抽样才能使样本更好地代表总体.三、教学方法从学生的认知规律出发进行启发、诱导、探索,运用讲授法、讨论法等充分调动学生的积极性,发挥学生的主体作用。
四、教学过程1、提出问题上课开始师先说这样一番话:统计是研究“不确定性”的学科,它的研究对象是数据,核心是数据分析。
主要面对两个问题,第一,这堆数据从哪里来的,就是说,这个现象是真的现象吗?怎样找出“数据”呢?第二,这堆数据在说什么?它对我们的生活有什么意义呢?【设计意图】学生整体感受统计是研究不确定的学科,与前面学习研究函数等确定性学科不一样。
师边读边解释:生还没静下来,不大喜欢听改成:先让学生看总统选举的例子师总结:可见科学、合理的选取有代表性的样本有多么重要。
这就是统计要研究的内容。
第一,这堆数据从哪里来的,就是说,这个现象是真的现象吗?怎样找出“数据”呢?第二,这堆数据在说什么?它对我们的生活有什么意义呢?我们今天就来学习一种收集数据的方法------简单随机抽样板书课题,ppt展示学习目标2、概念引入探究一、统计基本概念某校高中学生有900人,校医务室想对全校高中学生的身高情况作一次调查,为了不影响正常教学,准备抽取50名学生作为调查对象.(1)这个问题涉及调查对象的总体、个体、样本、样本容量分别是什么?生1:总体是全校高中学生师:有不同意见吗?生2:应该是全体学生的身高师:让生2接着回答样本,个体,师补充:总体应该是被考察对象的某一数值指标(2)怎样才能使抽取的样本充分地反映总体的情况?生:抽签、随机抽样、公平的抽取,公正师:公平?换成数学语言就是生:每个个体都有相同的可能性被抽到师:用三个字总结:板书:随机性、均等性3、概念形成在抽样时要保证①每一个个体都可能被抽到(随机性)②每一个个体被抽到的机会是均等的(均等性,什么叫做均等?),满足这样的条件的抽样是随机抽样.思考:检查袋装饼干卫生是否合格要进行抽样,如何做才能满足抽样的随机性和个体被抽取机会的均等性?生:给饼干贴上编号、闭着眼睛、用个不透明的袋子、师:怎么抓?抓一把生:一个个的抓师:抓了再扔回去?生:不放回师:满足这样的抽样就是简单随机抽样,板书:加上不放回【设计意图】(1)了解统计的几个基本概念(总体(这里主要指有限的总体)、样本、样本量)及这些概念与数据分析的关系。
教学设计一、导入:根据单元主题式教学要求,本单元主要讲授的是随机抽样方法,随机抽样是比较普遍和常用的抽样方法,对于生活中数据分析、物体性能分析有着不可替代的作用。
本节课我们主要来探究随机抽样中的简单随机抽样。
在上课之前我们来看一则笑话:妈妈:“儿子,帮妈妈买盒火柴去。
”妈妈:“这次注意点,上次你买的火柴好多划不着。
” .........儿子高兴地跑回来。
孩子:“妈妈,这次的火柴全划得着,我每根都试过了。
”大家都笑了,觉得这个孩子怎么这么一根筋呢!我们再来看这一幅图:妈妈做好了一样菜,让你来尝尝味道你会把整锅菜都吃掉吗?很显然不会,我们只是会简单尝几口,然后告诉妈妈味道咸淡即可。
在生活中,我们常常需要研究一些物体的性能,有的时候当物体的总量非常大,我们一个个地去研究物体个体的性能往往显得不符合实际而且费时费力,(就像刚刚买火柴的小孩,把所有火柴都点着试了个遍一样,不符合实际而且还浪费资源),所以我们需要从物体的总体中抽出几个样本来研究,通过研究样本的性能,从而推断总体的性能。
(火柴好不好用,咱试几个即可,饭菜味道如何,咱尝几口就知道。
)所以这节课我们就来学习,简单随机抽样,学习如何抽取样本。
二、新授:《概念理解》大家来看一下这几个概念:总体:考察对象的某一数值指标的全体构成的集合。
个体:构成总体的每一个元素。
样本:从总体中抽出若干个体组成的集合。
样本容量:样本中个体的数目。
总体的这个概念中重点是什么?考察对象:某一数值指标我们来看看这个案例,分析一下,总体,个体,样本,样本容量在这个案例中各指什么?某校高中学生有600人,校医务室想对全校高中学生的身高情况作一次调查,为了不影响正常教学,准备抽取10名学生作为调查对象。
你能帮医务室设计一个抽取方案吗?在这个问题中,总体是全体高中生的身高,每一名学生的身高是个体。
要从总体中抽取容量为10的样本来做调查。
例1我校期中考试后,为了分析高一年级1220名学生的学习成绩, 从中随机抽取了50名学生的成绩单,就这个问题来说,下面说法中正确的是()A.1220名学生是总体B.每个学生是个体C.50名学生是所抽取的样本D.样本容量是50个体,样本,样本容量之后我们再来看看,什么是简单随机抽样?看看概念,你觉得概念中比较重要的部分是什么?一般地,从个体数为N的总体中逐个不放回地抽取出容量为n的样本,如果每个个体都有相同的可能性被抽到,那么这样的抽样方法称为简单随机抽样,这样抽取的样本,叫做简单随机样本。
第1讲随机抽样基础知识整合1.简单随机抽样(1)定义:设一个总体含有N个个体,从中错误!逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会错误!都相等,就把这种抽样方法叫做简单随机抽样.(2)最常用的简单随机抽样的方法:错误!抽签法和错误!随机数法.(3)抽签法与随机数法的区别与联系抽签法和随机数法都是简单随机抽样的方法,但是抽签法适合在总体和样本都较少,容易搅拌均匀时使用,而随机数法除了适合总体和样本都较少的情况外,还适用于总体较多但是需要的样本较少的情况,这时利用随机数法能够快速地完成抽样.2.系统抽样的步骤假设要从容量为N的总体中抽取容量为n的样本.(1)先将总体的N个个体错误!编号.(2)确定错误!分段间隔k,对编号进行错误!分段,当错误!是整数时,取k=错误!。
(3)在第1段用错误!简单随机抽样确定第一个个体编号l(l≤k).(4)按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号错误!(l+k),再加k得到第3个个体编号错误!(l+2k),依次进行下去,直到获取整个样本.3.分层抽样(1)定义:在抽样时,将总体分成错误!互不交叉的层,然后按照一定的错误!比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.(2)分层抽样的应用范围:当总体是由错误!差异明显的几个部分组成时,往往选用分层抽样.1.不论哪种抽样方法,总体中的每一个个体入样的概率是相同的.2.系统抽样是等距抽样,入样个体的编号相差错误!的整数倍.3.分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘以抽样比.1.对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则()A.p1=p2〈p3B.p2=p3<p1C.p1=p3<p2D.p1=p2=p3答案D解析随机抽样包括:简单随机抽样、系统抽样和分层抽样.随机抽样的特点就是每个个体被抽到的概率都相等.故选D.2.(2019·海口调研)某校三个年级共有24个班,学校为了了解同学们的心理状况,将每个班编号,依次为1到24,现用系统抽样方法,抽取4个班进行调查,若抽到的最小编号为3,则抽取的最大编号为()A.15 B.18 C.21 D.22答案C解析系统抽样的抽取间隔为错误!=6,若抽到的最小编号为3,则抽取到的最大编号为6×3+3=21.故选C。
随机抽样〖复习目标〗①理解随机抽样的必要性和重要性。
②会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法。
〖知识梳理〗1.随机抽样:抽样时保证每一个个体都可能被抽到,每一个个体被抽到的机会是均等的,满足这样的条件的抽样是随机抽样.2.随机抽样的方法:简单随机抽样、系统抽样、分层抽样〖基础自测〗1.从2004名学生中选取50名组成参观团。
若采用下面的方法选取:先用简单随机抽样从2004人中剔除4人,剩下的2000人再按系统抽样的方法进行。
则每人入选的概率()A.不全相等B.均不相等C.都相等,且为251002D.都相等,且为1402.现在要完成下列3项抽样调查:①从10盒酸奶中抽取3盒进行抽样调查。
②科技报告厅有32排,每排有40个座位,有一次报告会恰好坐满了听众,报告会结束后,为了听取意见,需要请32名听众进行座谈。
3东方中学有160名教职工,其中一般教师120名,行政人员16名,后勤人员24名。
为了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20的样本。
较为合理的抽样方法是()A.①简单随机抽样,②系统抽样,③分层抽样B.①简单随机抽样,②分层抽样,③系统抽样C.①系统抽样,②简单随机抽样,③分层抽样D.①分层抽样,②系统抽样,③简单随机抽样3.课题组进行城市空气质量调查,按地域把24个城市分为甲乙、丙三组,对应城市数分别为4,12,8。
若用分层抽样抽取6个城市,则丙组中应抽取的城市数为4.①某小区有800个家庭,其中高收入家庭200户,中等收入家庭480户,低收入家庭120户,为了了解家用轿车购买力的某个指标,要从中抽取一个容量为100的样本;②从10名同学抽取3个参加座谈会。
I简单随机抽样方法;II系统抽样;III分层抽样。
问题和方法配对正确的是()A.①I,②II B.①III,②IC.①II,②III D.①III,②II5.一个单位有职工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人。
2.1.1简单随机抽样教学设计一、教学目标1.知识与技能(1)理解什么是简单随机抽样;会用简单随机抽样从总体中抽取样本;(2)通过学习本小节知识,提高学生对统计的认识,提高学生应用教材知识解决实际问题的能力.2.过程与方法(1)通过自学、实践、研究、归纳、总结形成本章较为科学的知识网,并掌握知识之间的联系.(2)进行数学应用意识教育,提高学习数学的积极性.3.情感与价值观(1)结合教学内容培养学生学习数学的兴趣以及“用数学”的意识,激励学生勇于创新. (2)强化学生的注意力及新旧知识的联系,树立学生求真的勇气和自信心.二、教学重点难点重点:简单随机抽样的定义、两种抽样方法的实施步骤难点:简单随机抽样的定义和特点、随机数表法的实施步骤三、教学方法读书指导法课堂讨论法实验法四、学法指导自主阅读合作交流五、教学过程2.1.1简单随机抽样学情分析学生在初中阶段已经学习过统计学的知识,知道了它的一些应用.为了让学生更好的了解统计学在科学研究领域的作用,课前学生以小组为单位搜集与统计学有关的故事和案例.学生已经具备一定的小组合作学习能力,自主学习能力.学生对抽签法比较熟悉,能够通过阅读课本和实际操作自己完成步骤的总结.对于随机数表法学生没见过,可能在学习过程中会遇到困难.2.1.1简单随机抽样效果分析为了突出重点突破难点在学习简单随机抽样的定义和特点时采用自主学习,集体朗读,总结特点的方法,并准备了练习题加以巩固,效果良好.抽签法学生比较熟悉,采用了分组实践,在动手操作中总结步骤效果良好.随机数表法学生陌生,学习上会遇到困难。
采用教师讲解与学生自学相结合的方式,学生介绍步骤,教师引导学生发现问题,自我完善,达成共识,完成抽样.用学到的方法解决问题,再次强化步骤,最终学会设计出完美方案.整个随机数表法的学习过程循序渐进,层次分明,学生渐入佳境,很好的达到预期效果.2.1.1简单随机抽样教材分析六、教材地位及作用本节课是人教B版必修三第二章统计第一节第一课时内容.本章内容是在初中“统计初步”的基础上学习的.在数理统计中要研究两个基本问题:一是如何从总体中抽取样本,另一个是如何通过对所抽取的样本进行计算和分析,对总体的相应情况做出推断.本课时就是解决第一个问题——如何抽取样本.“简单随机抽样”是“随机抽样”的基础,“随机抽样”又是“统计学”的基础,因此,在“统计学”中,“简单随机抽样”是基础的基础。
第一节随机抽样【课程标准】1.知道获取数据的基本途径.2.了解总体、样本、样本量的概念,了解数据的随机性.3.通过实例,了解简单随机抽样的含义及其解决问题的过程,掌握两种简单随机抽样方法:抽签法和随机数法,会计算样本均值和样本方差,了解样本与总体的关系.4.通过实例,了解分层随机抽样的特点和适用范围,了解分层随机抽样的必要性,掌握各层样本量比例分配的方法.结合具体实例,掌握分层随机抽样的样本均值和样本方差.5.在简单的实际情境中,能根据实际问题的特点,设计恰当的抽样方法解决问题.【考情分析】考点考法:高考命题常以抽样为载体,考查抽样方法.简单随机抽样、分层随机抽样以及分层随机抽样中的抽样数值、均值是高考热点,常以选择题或填空题的形式出现.核心素养:数学抽象、数学运算、数据分析【必备知识·逐点夯实】【知识梳理·归纳】1.总体、个体、样本调查对象的全体(或调查对象的某些指标的全体)称为总体,组成总体的每一个调查对象(或每一个调查对象的相应指标)称为个体,在抽样调查中,从总体中抽取的那部分个体称为样本,样本中包含的个体数称为样本容量,简称样本量.2.简单随机抽样抽签法和随机数法是比较常用的两种简单随机抽样的方法.3.总体平均数与样本平均数(1)总体平均数①总体中有N 个个体,它们的变量值分别为Y 1,Y 2,…,Y N ,则称=1+2+…+=N ii 11Y =∑N 为总体平均数.②如果总体的N 个变量值中,不同的值共有k (k ≤N )个,不妨记为Y 1,Y 2,…,Y k ,其中Y i出现的频数f i (i =1,2,…,k ),则总体均值还可以写成加权平均数的形式=ki i i 11f Y =∑N .(2)样本平均数如果从总体中抽取一个容量为n 的样本,它们的变量值分别为y 1,y 2,…,y n ,则称=1+2+…+=为样本平均数.4.分层随机抽样(1)定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.(2)比例分配:在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.【基础小题·自测】类型辨析改编易错题号12,341.(多维辨析)(多选题)下列结论正确的是()A.在简单随机抽样中,每个个体被抽到的机会与先后顺序有关B.抽签法和随机数法都是简单随机抽样C.在比例分配的分层随机抽样中,每个个体被抽到的可能性与层数及分层有关D.不论哪种抽样方法,总体中的每一个个体入样的概率是相同的【解析】选BD.由简单随机抽样、分层随机抽样的概念可知:选项A错误,选项C 错误,选项D正确;由抽签法和随机数法的概念可知:选项B正确.2.(必修第二册P189习题6改编)已知数据x1,x2,x3,…,x n的平均数为5,则数据2x1+1,2x2+1,2x3+1,…,2x n+1的平均数为()A.3B.5C.10D.11【解析】选D.每个数据都变成原数据的2倍再加1的形式,所以平均数也变成原来平均数的2倍再加1,即11.3.(必修第二册P189习题5改编)某单位有200名职工,其中女职工有60名,男职工有140名,现要从中抽取30名进行调研座谈,如果用比例分配的分层随机抽样的方法进行抽样,则应抽女职工________名.【解析】设应抽女职工x名,则60200=30,解得x=9.答案:94.(不会读数导致错误)假设要考察某公司生产的狂犬疫苗的剂量是否达标,现用随机数法从500支疫苗中抽取50支进行检验,利用随机数表抽取样本时,先将500支疫苗按000,001,…,499进行编号,若从随机数表第7行第7列的数开始向右读,则抽取的第3支疫苗的编号为__________.(下面摘取了利用R统计软件生成的随机数表的第7行至第11行) 84421753315724550688770415776721763350258392120676 6301637859169555671998105071751286735807443952387933211234297864560782524207443815510013429966027954【解析】由题意,从随机数表第7行第7列的数开始向右读,对应的编号依次为533,157,245,506,887,704,157,767,217,…,超出499的和重复的都不符合条件,故符合条件的前三个编号依次是157,245,217,故抽取的第3支疫苗的编号是217.答案:217【核心考点·分类突破】考点一简单随机抽样[例1](1)(多选题)下列抽取样本的方式,是简单随机抽样的是()A.从无限多个个体中抽取100个个体作为样本B.盒子里共有80个零件,从中逐个不放回地选出5个零件进行质量检验C.从20件玩具中一次性抽取3件进行质量检查D.某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛【解析】选BC.A不是简单随机抽样,因为被抽取样本的总体的个体数是无限的,而不是有限的;B是简单随机抽样;C是简单随机抽样,因为“一次性”抽取与“逐个”抽取是等价的;D不是简单随机抽样,因为指定个子最高的5名同学是56名同学中特指的,不具有随机性,不是等可能的抽样.(2)(2023·聊城模拟)国家高度重视青少年视力健康问题,指出要“共同呵护好孩子的眼睛,让他们拥有一个光明的未来”.某校为了调查学生的视力健康状况,决定从每班随机抽取5名学生进行调查.若某班有50名学生,将每名学生从01到50编号,从下面所给的随机数表的第2行第4列的数开始,每次从左向右选取两个数字,则选取的第三个号码为()015432876595428753467953258657413369832445977386524435786241A.13B.24C.33D.36【解析】选D.根据随机数表的读取方法,第2行第4列的数为3,每次从左向右选取两个数字,所以第一组数字为32,即为第一个号码;第二组数字58,舍去;第三组数字65,舍去;第四组数字74,舍去;第五组数字13,即为第二个号码;第六组数字36,即为第三个号码,所以选取的第三个号码为36.(3)某中学开学后从高一年级的学生中随机抽取90名学生进行家庭情况调查,经过一段时间后再次从这个年级随机抽取100名学生进行学情调查,发现有20名同学上次被抽到过,估计这个学校高一年级的学生人数为()A.180B.400C.450D.2000【解析】选C.设这个学校高一年级的学生人数为x,则90=20100,所以x=450.【解题技法】抽签法与随机数法的适用情况(1)抽签法适用于总体中个数较少的情况,随机数法适用于总体中个数较多的情况.(2)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.【对点训练】1.有一批计算机,其编号分别为001,002,003,…,112,为了调查这批计算机的质量问题,打算抽取4台入样.现在利用随机数法抽样,在下面随机数表中选第1行第6个数“0”作为开始,向右读,那么抽取的第4台计算机的编号为()537970762694292743995519810685019264460720213920776638173256164058587766317005002593054553707814A.072B.021C.077D.058【解析】选B.依次可得到需要的编号是076,068,072,021,故抽取的第4台计算机的编号为021.2.某市在创建文明城市期间,对某小区的居民按分层抽样的方法抽取一个容量为n的样本进行问卷调查.在这n个个体的样本中,任取1人,抽取到未成年人的概率为0.2,成年人共80人,则n=________(用数字作答).【解析】由题可得,n·(1-0.2)=80,n=100.答案:100考点二样本的均值[例2](1)某工厂抽取50个机械零件检验其直径大小,得到如表数据:直径(单位:cm)121314频数12344估计这50个零件的直径为__________cm.【解析】12×12+13×34+14×450=12.84(cm).答案:12.84(2)已知数据x1,x2,x3,…,x200的平均数是6,数据y1,y2,y3,…,y300的平均数是20,则∑ +∑ 500=()A.13B.14.4C.15D.15.4【解析】选B.由已知得∑ +∑ 500=200×6500+300×20500=14.4.【解题技法】数据平均数的求法(1)观察所给数据,选择计算公式.(2)代入公式进行计算,注意数据的个数.【对点训练】1.(2020·江苏高考)已知一组数据4,2a,3-a,5,6的平均数为4,则a的值是______.【解析】由4+2r(3-)+5+65=4可知a=2.答案:22.一组5个数据中,前4个数据的平均数是20,全部5个数据的平均数是19,则第5个数据是__________.【解析】设5个数据分别为a,b,c,d,e,因为前4个数据的平均数是20,所以rrr4=20,则a+b+c+d=80①,全部5个数据的平均数是19,所以rrrr5=19,所以a+b+c+d+e=95②,②-①得,e=15.答案:15【加练备选】现有某地一年的GDP(亿元)数据,第一季度GDP为232亿元,第四季度GDP 为241亿元,四个季度的GDP逐季度增长,且中位数与平均数相同,则该地一年的GDP为________亿元.【解析】设第二季度GDP为x亿元,第三季度GDP为y亿元,则232<x<y<241,因为中位数与平均数相同,所以r2=232+rr2414,所以x+y=473,所以该地一年的GDP为232+x+y+241=946(亿元).答案:946考点三抽样比的应用[例3](1)某学校高一年级1800人,高二年级1600人,高三年级1500人,现采用比例分配的分层随机抽样的方法从中抽取98名学生参加全国中学生禁毒知识竞赛,则在高一、高二、高三三个年级中抽取的人数分别为()A.35,33,30B.36,32,30C.36,33,29D.35,32,31【解析】选B.因为高一年级1800人,高二年级1600人,高三年级1500人,所以三个年级的人数所占比例分别为1849,1649,1549,因此,各年级抽取人数分别为98×1849=36,98×1649=32,98×1549=30.(2)(多选题)杭州亚运会共设40个竞赛大项,其中31个奥运项目,9个非奥运项目.为了调查高中生对各个项目的了解情况,在某高中3000名学生中,按照高一、高二、高三学生人数的比例用分层随机抽样的方法,抽取一个容量为150的样本,所得数据如表:项目高一高二高三只对31个奥运项目全部了解50444540个项目全部了解0110则下列判断正确的是()A.该校高一、高二、高三的学生人数比为10∶9∶11B.该校高三学生的人数比高一人数多50C.估计该校高三学生对40个项目全部了解的人数为200D.估计该校学生中对40个项目全部了解的人数不足8%【解析】选ACD.由题表可知,50+44+1+45+10=150,所以该校高一、高二、高三的学生人数比为50∶45∶55,即10∶9∶11,A正确;高三学生人数为3000×55150=1100(人),高一学生人数为3000×50150=1000(人),故高三学生的人数比高一人数多1100-1000=100(人),B错误;高三学生对40个项目全部了解的人数约为3000×10150=200(人),C正确;该校学生中对40个项目全部了解的人数约为11150≈7.33%,D正确.【解题技法】1.按比例分配的分层随机抽样的步骤(1)将总体按一定标准分层.(2)计算各层的个体数与总体数的比,按各层个体数占总体数的比确定各层应抽取的样本量.(3)在每一层进行抽样(可用简单随机抽样).2.在比例分配的分层随机抽样中的抽样比抽样比=样本容量总体容量=各层样本容量各层个体总量.【对点训练】(多选题)某学校有体育特长生25人,美术特长生35人,音乐特长生40人,用比例分配的分层随机抽样的方法从中抽取40人,则()A.抽取的体育特长生为10人B.抽取的美术特长生为15人C.抽取的音乐特长生为16人D.抽取的体育特长生和美术特长生共25人【解析】选AC.抽取的体育特长生、美术特长生、音乐特长生分别为2525+35+40×40=10(人),3525+35+40×40=14(人),4025+35+40×40=16(人).【加练备选】某市6月1日起正式实施的《生活垃圾分类管理条例》将城市生活垃圾分为“可回收物”“有害垃圾”“厨余垃圾”和“其他垃圾”四大类.某社区为了分析不同年龄段的人群对垃圾分类知识的了解情况,对辖区内的居民进行比例分配的分层随机抽样调查.已知该社区的青年人、中年人和老年人分别有800人、900人、700人,若在老年人中的抽样人数是35,则在青年人中的抽样人数是()A.20B.40C.60D.80【解析】选B.由题可知抽取的比例为k=35700=120,故青年人应该抽取的人数为800×120=40.考点四分层抽样样本均值的计算[例4]某高中的高一、高二、高三这三个年级学生的平均身高分别为,,,若按年级采用分层抽样的方法抽取了一个600人的样本,抽到高一、高二、高三的学生人数分别为100,200,300,则估计该高中学生的平均身高为() A.16+13+12B.rr2C.12+13+16D.rr3【解析】选A.设该高中的总人数为m,由题意知,高一、高二、高三的学生人数分别为6,3,2,所以估计该高中学生的平均身高为6·r3·r2·=16+13+12.【解题技法】分层抽样样本均值的求法在比例分配的分层随机抽样中,如果层数分为两层,第一层的样本量为m,均值为;第二层的样本量为n,均值为,则样本的均值为B+B r.【对点训练】在调查某中学的学生身高时,利用比例分配的分层随机抽样的方法抽取男生20人,女生15人,得到了男生身高的均值为170cm,女生身高的均值为165cm,估计该中学所有学生的平均身高为________cm(结果精确到0.1).【解析】20×170+15×16520+15≈167.9(cm),即该中学所有学生的平均身高约为167.9cm.答案:167.9【加练备选】在比例分配的分层随机抽样中,总体共分为2层,第1层的样本量为20,样本平均数为3,第2层的样本量为30,样本平均数为8,则该样本的平均数为________.【解析】2020+30×3+3020+30×8=6.答案:6。
第二节随机抽样[考纲传真](教师用书独具)1.理解随机抽样的必要性和重要性2会用简单随机抽样方法从总体中抽取样本3 了解分层抽样和系统抽样方法4会用随机抽样的基本方法解决一些简单的实际问题.双基自主测评I莊理自测巩固基础知识(对应学生用书第160页)[基础知识填充]1. 抽样调查(1) 抽样调查通常情况下,从调查对象中按照一定的方法抽取一部分,进行调查或观测,获取数据,并以此对调查对象的某些指标作出推断,这就是抽样调查.(2) 总体和样本调查对象的全体称为总体,被抽取的一部分称为样本.(3) 抽样调查与普查相比有很多优点,最突出的有两点:①迅速、及时;②节约人力、物力和财力.2•简单随机抽样(1) 简单随机抽样时,要保证每个个体被抽到的概率相同. ___(2) 通常采用的简单随机抽样的方法:抽签法和随机数法.3. 分层抽样(1) 定义:将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的样本•这种抽样方法通常叫作分层抽样,有时也称为类型 _ 抽样.(2) 分层抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.4•系统抽样系统抽样是将总体中的个体进行编号,等距分组,在第一组中按照简单随机抽样抽取第一个样本,然后按分组的间隔(称为抽样距)抽取其他样本.这种抽样方法也叫等距抽样或机械抽样.[知识拓展]三种抽样方法的共性:等概率抽样,不放回抽样,逐个抽取,总体确定.[基本能力自测]1. (思考辨析)判断下列结论的正误.(正确的打“V”,错误的打“X”)(1)简单随机抽样中每个个体被抽到的机会不一样,与先后有关. ()(2)系统抽样在起始部分抽样时采用简单随机抽样.( )(3) 要从1 002个学生中用系统抽样的方法选取一个容量为 个学生,这样对被剔除者不公平.( )(4)分层抽样中,每个个体被抽到的可能性与层数及分层有关. ()[答案]⑴ X (2) V (3) X (4) X2.(教材改编)在“世界读书日”前夕,为了了解某地5 000名居民某天的阅读时间,从中抽取了 200名居民的阅读时间进行统计分析•在这个问题中, 5 000名居民的阅读时间的全体是( )A.总体B.个体C.样本的容量D.从总体中抽取的一个样本A [从5 000名居民某天的阅读时间中抽取 200名居民的阅读时间,样本容量是 200, 抽取的200名居民的阅读时间是 个样本,每名居民的阅读时间就是一个个体,5 000名居民的阅读时间的全体是总体. ]3.老师在班级50名学生中,依次抽取学号为5,10,15,20,25,30,35,40,45,50的学生进行作业检查,这种抽样方法是 ()A.随机抽样B.分层抽样C.系统抽样D.以上都不是C [因为抽取学号是以5为公差的等差数列,故采用的抽样方法应是系统抽样.]4. 利用简单随机抽样从含有 8个个体的总体中抽取一个容量为4的样本,则总体中每个个体被抽到的概率是 __________ .1 M 4 1o [总体个数为N= 8,样本容量为M= 4,则每一个个体被抽到的概率为 P ===-.] 2 N 8 2 5 . (2017 •江苏高考)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100 件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽 取60件进行检验,则应从丙种型号的产品中抽取 ____________ 件. 彳o r 样本容量 ____________ 60 _______ 3 18 [… = =—总体个数—200 + 400 + 300 + 100—50'3•••应从丙种型号的产品中抽取X 300= 18(件).]50(对应学生用书第160页)20的样本,需要剔除 2题型分类突破I科析探求规律方法湖 (1)下列抽取样本的方式属于简单随机抽样的个数为( )① 盒子里共有80个零件,从中选出 5个零件进行质量检验•在抽样操作时,从中 任意拿出一个零件进行质量检验后再把它放回盒子里; ② 从20件玩具中一次性抽取 3件进行质量检验;③ 某班有56名同学,指定个子最高的 5名同学参加学校组织的篮球赛. A. 0 B • 1C. 2D. 3(2)利用简单随机抽样, 从n 个个体中抽取一个容量为10的样本.若第二次抽取时,余下的每个个体被抽到的概率为 1,则在整个抽样过程中, 每个个体被抽到的概率为A.(1) A (2)C [(1)①②③中都不是简单随机抽样, 这是因为:①是放回抽样,②中是“― 次性”抽取,而不是“逐个”抽取, ③中“指定个子最高的 5名同学”,不存在随机性, 不是等可能抽样.(2)根据题意得, 岛 =3,解得门=28.故每个个体被抽到的概率为10=吕.] n — 1 328 14[规律方法]1.简单随机抽样的特点 1抽取的个体数较少,2逐个抽取. 点都满足的抽样才是简单随机抽样 .2.抽签法与随机数法的适用情况1抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况2 一个抽样试验能否用抽签法,关键看两点: 一是制签是否方便;二是号签是否易搅匀 .一般地,当总体容量和样本容量都较小时可用抽签法.3. 从总体数N 中抽取一个样本容量为 n 的样本12在一次抽取中,每个个体被抽到的概率是 NB.C.5 14D.10 27不放回抽取,'1等可能抽取•只有四个特1在整个抽样过程中,每个个体被抽到的概率是 nN -[跟踪训练](1)下列抽样检验中,适合用抽签法的是()A. 从某厂生产的5 000件产品中抽取600件进行质量检验B. 从某厂生产的两箱(每箱18件)产品中抽取6件进行质量检验C. 从甲、乙两厂生产的两箱(每箱18件)产品中抽取6件进行质量检验D.从某厂生产的5 000件产品中抽取10件进行质量检验⑵ 总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第 5个个体的编号为()A. 08 B . 07 C⑴B (2)D [(1)A , D 中总体的个体数较多,不适宜用抽签法,C 中,一般甲、乙两厂的产品质量有区别,也不适宜用抽签法,故选B.(2)由随机数表法的随机抽样的过程可知选出的 5个个体是08,02,14,07,01 ,所以第5个个体的编号是01.]"■■I (1)采用系统抽样方法从 1 000人中抽取50人做问卷调查,将他们随机编号1,2,…,1 000.适当分组后在第一组采用简单随机抽样的方法抽到的号码为8.若抽到的50人中,编号落入区间[1,400]的人做问卷 A 编号落入区间[401,750]的人做问卷B,其余的人做 问卷C 则抽到的人中,做问卷 C 的人数为()A. 12B. 13C. 14D. 15(2)(2017 •湖北重点中学适应模拟 )某校高三年级共有 30个班,学校心理咨询室为 了了解同学们的心理状况,将每个班编号,依次为1到30,现用系统抽样的方法抽取5个班进行调查,若抽到的编号之和为 75,则抽到的最小的编号为 _______________ .【导学号:79140323】(1) A (2) 3 [(1)根据系统抽样的特点可知, 所有做问卷调查的人的编号构成首项为 8,公差d =耳00 = 20的等差数列{a n } ,•••通项公式 a n = 8 + 20( n — 1) = 20n — 12,令50 751 <20n — 12W 1 000,得 n W 253,又I n € N U ,• 39< n W 50,20 512人,故选A.设抽到的最小编号为 x ,则 x + (6 + X ) + (12 + X ) + (18 + X ) + (24 + x ) = 75,所以 x = 3.] [规律方法]1.系统抽样的三个关注点•做问卷C 的共有⑵系统抽样的抽取间隔为 30[跟踪训练]为规范学校办学,某省教育厅督察组对某所高中进行了抽样调查.抽到的班级 一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为 4的样本,已知7号、33号、46号同学在样本中,那么样本中还有一位同学的编号应是( )A. 13B. 19C. 20D. 51一 52C [由系统抽样的原理知抽样的间隔为 —=13,故抽取的样本的编号分别为 7,7 + 13,7+ 13X 2,7 + 13X 3,从而可知选 C.]川 (1)(2018 •南昌一模)某校为了解学生学习的情况,采用分层抽样的方法从高一1000人、高二1 200人、高三n 人中,抽取81人进行问卷调查.已知高二被抽取的人数 为30,那么n =()A. 860B. 720D. 1 040(2)(2018 •南京、盐城、连云港二模)下表是关于青年观众的性别与是否喜欢戏剧的 调查数据,人数如表所示:欢戏剧的男性青年观众”中抽取了8人,则n 的值为 __________ .分层抽样C. 1 020[规律方法]进行分层抽样的相关计算时,常用到的两个关系I 样本容量n 该层抽取的个体数. 1总体的个数N = 该层的个体数 ;2总体中某两层的个体数之比等于样本中这两层抽取的个体数之比[跟踪训练]~~(1)某校高中生共有 900人,其中高一年级~~300人,高二年级 200人,高三年 级400人,现分层抽取容量为 45的样本,那么高一、高二、高三年级抽取的人数分别为 ( )A. 15,10,20B. 10,5,30C. 15,15,15D. 15,5,25(2)某企业三月中旬生产 A B 、C 三种产品共3 000件,根据分层抽样的结果,企业 统计员制作了如下的统计表格:本容量比C 产品的样本容量多10,根据以上信息,可得 C 的产品数量是 _____________ 件.【导学号:79140324】300 200400(1) A (2) 800 [(1)三个年级抽取的人数分别为 45= 15, 而 X 45= 10,45=20.故选A.x(2)设样本容量为 X ,则3000 X 1 300 = 130,••• x = 300. ••• A 产品和C 产品的样本中共有 300 — 130= 170(件).设C 产品的样本容量为y ,贝U y + y + 10= 170,3 000• y = 80. • C 产品的数量为 页了 X 80= 800(件).](1) D (2) 30 [由分层抽样的特点可得 30 1 200811 000 + 1 200 + n,解得n = 1 040,故选D.(2)由题意可得 8n =40X 150= 30.]。
9.2随机抽样一、教学目标1、让学生理解随机抽样的必要性和重要性;2、会用简单随机抽样方法从总体中抽取样本;3、了解分层抽样和系统抽样方法。
二、教学重点、难点1、重点:理解随机抽样的概念和方法;2、难点:利用随机抽样的方法,解决抽取样本的相关参数问题。
三、教学方法:讲练结合四、教学过程(一)高考考情追踪高考对随机抽样的考查主要以选择题或填空题的形式出现,在解答题中通常与概率问题相结合作为某一问的形式出现,命题重点主要有两个方面:一是抽样方法的选择,二是样本容量的求解。
试题比较简单,属于中低档题目。
准确把握各种抽样方法的特征以及具体的抽样步骤是解决此类问题的关键。
(二)考点梳理1、简单随机抽样:设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都会相等。
抽签法。
随机表数法。
2、系统抽样的步骤:假设要从容量为N的总体中抽取容量为n的样本.(1)先将总体的N个个体编号;(2)确定分段间隔k,对编号进行分段,当N/n是整数时,取k=N/n,当N/n不是整数时,随机从总体中剔除余数,再去k=N/n;(3)在第1段用简单随机抽样确定第一个个体编号l(l≤k);(4)按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号(l+k),再加k得到第3个个体编号(l+2k),依次进行下去,直到获取整个样本。
3、分层抽样(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本。
(2)应用范围:当总体是由差异明显的几个部分组成时。
4、抽样方法的选取标准:抽样方法的选取关键在于总体的特征和样本的需求,总体的特征要关注两个方面:一是总体的构成是否具有明显的差异性。
样本的需求关键在于定位,即选取样本的目的性。
同一个总体,不同的样本需求,对应的抽样方法也可能不同;不同的总体,同样的样本需求,对应的抽样方法也可能相同。
2020届高三数学《随机抽样》学案最新考纲 1.理解随机抽样的必要性和重要性;2.会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法.知识梳理1.简单随机抽样2.系统抽样3.分层抽样诊断自测1.在“世界读书日”前夕,为了了解某地5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5 000名居民的阅读时间的全体是( )A.总体B.个体C.样本的容量D.从总体中抽取的一个样本2.为规范学校办学,省教育厅督察组对某所高中进行了抽样调查.抽到的班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中还有一位同学的编号应为( )A.13B.19C.20D.513.(2019河师附中)某单位共有职工150名,其中高级职称45人,中级职称90人,初级职称15人,现采用分层抽样方法从中抽取容量为30的样本,则各职称人数分别为()A.9,18,3 B.10,15,5 C.10,17,3 D.9,16,5考点一简单随机抽样【例1】 (1)(2019唐山二模)用简单随机抽样的方法从含有100个个体的总体中抽取一个容量为5的样本,则个体M被抽到的概率为( )A.1100B.199C.120D.150(2)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )A.08B.07C.02D.01考点二系统抽样【例2】 (2019鄂州模拟)一个总体共有600个个体,随机编号为001,002,…,600.现采用系统抽样的方法抽取一个容量为50的样本,且随机抽得的号码为003.这600个个体分三组,从001到300在第一组,从301到495在第2组,从496到600在第3组,则这三组抽中的个数依次为( ) A.25,16,9 B.25,18,7C.25,17,8 D.25,19,6【变式2】(2019皖南八校)某校为了解1000名高一新生的身体生长状况,用系统抽样法(按等距的规则)抽取40名同学进行检查,将学生从1~1000进行编号,现已知第18组抽取的号码为443,则第一组用简单随机抽样抽取的号码为()A.16 B.17 C.18 D.19考点三 分层抽样【例3】 (1)甲、乙两套设备生产的同类型产品共4 800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件.(2)(2015·福建卷)某校高一年级有900名学生,其中女生400名.按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为________人.课后巩固: 1.(2019郑州质量)为了解600名学生的视力情况,采用系统抽样的方法,从中抽取容量为20的样本,则需要分成几个小组进行抽取( )A .20B .30C .40D .50 2.(2019重庆模拟)我国古代数学算经十书之一的《九章算术》有一衰分问题:今有北乡八千一百人,西乡七千四百八十八人,南乡六千九百一十二人,凡三乡,发役三百人,则北乡遣( )A .104人B .108人C .112人D .120人3.(2016·柳州、北海、钦州三市联考)某企业在甲、乙、丙、丁四个城市分别有150个,120个,190个,140个销售点.为了调查产品的质量,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙城市有20个特大型销售点,要从中抽取8个调查,记这项调查为②,则完成①,②这两项调查宜采用的抽样方法依次为( )A.分层抽样法、系统抽样法B.分层抽样法、简单随机抽样法C.系统抽样法、分层抽样法D.简单随机抽样法、分层抽样法4.(2015·湖南卷)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是( )A.3B.4C.5D.65.已知高二某班学生语文与数学的学业水平测试成绩抽样统计如下表,若抽取学生n 人,成绩分为A (优秀)、B (良好)、C (及格)三个等级,设,x y 分别表示语文成绩与数学成绩.例如:表中语文成绩为B ABCA 7 20 5B 918 6Ca4b(2)设该样本中,语文成绩优秀率是30%,求,a b 值;(3)已知10,8a b ≥≥,求语文成绩为A 等级的总人数比语文成绩为C 等级的总人数少的概率.人数 语文数学yx6.(2019衡水调研)衡水市某县区共有甲、乙、丙三所高中的高三文科学生共有800人,各学校男、女生人数如下表:已知在三所高中的所有高三文科学生中随机抽取1人,抽到乙高中女生的概率为.(1)求表中x 的值;(2)衡水市第一次调研考试后,该县区决定从三所高中的所有高三文科学生中利用随机数表法抽取100人进行成绩统计分析,先将800人按001,002,…,800进行编号.如果从第8行第7列的数开始向右读,请你依次写出最先抽取的3个人的编号; (下面摘取了随机数表中第7行至第9行)8442 1753 3157 2455 0688 7704 7447 6721 7633 5026 8392 6301 5316 5916 9275 3862 9821 5071 7512 8673 5807 4439 1326 3321 1342 7864 1607 8252 0744 3815 0324 4299 7931(3)已知145y ≥,145z ≥,求丙高中学校中的女生比男生人数多的概率.。
随_机_抽_样[知识能否忆起]一、简单随机抽样: 1.简单随机抽样的概念:设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.2.最常用的简单随机抽样方法有两种——抽签法和随机数法. 二、系统抽样的步骤假设要从容量为N 的总体中抽取容量为n 的样本: (1)先将总体的N 个个体编号;(2)确定分段间隔k ,对编号进行分段,当N n 是整数时,取k =Nn ;(3)在第1段用简单随机抽样确定第一个个体编号l(l≤k);(4)按照一定的规则抽取样本.通常是将l 加上间隔k 得到第2个个体编号l +k ,再加k 得到第3个个体编号l +2k ,依次进行下去,直到获取整个样本.三、分层抽样 1.分层抽样的概念:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是分层抽样.2.当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法. 3.分层抽样时,每个个体被抽到的机会是均等的.[小题能否全取]1.(教材习题改编)在某班的50名学生中,依次抽取学号为5、10、15、20、25、30、35、40、45、50的10名学生进行作业检查,这种抽样方法是( )A .随机抽样B .分层抽样C .系统抽样D .以上都不是解析:选C 由系统抽样的特点可知C 正确.2.为了了解一批零件的长度,抽测了其中200个零件的长度,在这个问题中,200个零件的长度是( ) A .总体B .个体是每一个零件C .总体的一个样本D .样本容量解析:选C 200个零件的长度是总体的一个样本.3.某工厂生产A ,B ,C 三种不同型号的产品,产品的数量之比依次为3∶4∶7,现在用分层抽样的方法抽出容量为n 的样本,样本中A 型产品有15件,那么样本容量n 为( )A .50B .60C.70 D.80解析:选C 由n×33+4+7=15得n=70.4.(2018·金华模拟)某学院有A,B,C三个专业共1 200名学生.现采用分层抽样的方法抽取一个容量为120的样本,已知A专业有420名学生,B专业有380名学生,则在C专业应抽取________名学生.解析:由已知条件可得每一名学生被抽取的概率为P=1201 200=110,则应在C专业中抽取(1 200-420-380)×110=40名学生.答案:405.将某班的60名学生编号为:01,02,…,60,采用系统抽样方法抽取一个容量为5的样本,且随机抽得的一个号码为04,则剩下的四个号码依次是________.解析:依据系统抽样方法的定义知,将这60名学生依次按编号每12人作为一组,即01~12、13~24、…、49~60,当第一组抽得的号码是04时,剩下的四个号码依次是16,28,40,52(即其余每一小组所抽出来的号码都是相应的组中的第四个号码).答案:16,28,40,52三种抽样方法的异同点:典题导入[例1] 下面的抽样方法是简单随机抽样的是( )A.在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2 709的为三等奖B.某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格C.某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解学校机构改革的意见D.用抽签法从10件产品中选取3件进行质量检验[自主解答] A、B是系统抽样,因为抽取的个体间的间隔是固定的;C是分层抽样,因为总体的个体有明显的层次;D是简单随机抽样.[答案] D由题悟法1.简单随机抽样需满足:(1)抽取的个体数有限;(2)逐个抽取;(3)是不放回抽取;(4)是等可能抽取.2.简单随机抽样常有抽签法(适用总体中个体数较少的情况)、随机数法(适用于个体数较多的情况).以题试法1.(2018·宁波月考)在简单随机抽样中,某一个个体被抽到的可能性( )A.与第几次抽样有关,第一次抽到的可能性最大B.与第几次抽样有关,第一次抽到的可能性最小C.与第几次抽样无关,每一次抽到的可能性相等D.与第几次抽样无关,与样本容量无关解析:选C 由随机抽样的特点知某个体被抽到的可能性与第几次抽样无关,每一次抽到的可能性相等.典题导入[例2] (2018·山东高考)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C.则抽到的人中,做问卷B的人数为( ) A.7 B.9C.10 D.15[自主解答] 由系统抽样的特点知:抽取号码的间隔为96032=30,抽取的号码依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n项,显然有729=459+(n-1)×30,解得n=10.所以做问卷B的有10人.[答案] C由题悟法1.系统抽样适用的条件是总体容量较大,样本容量也较大.2.使用系统抽样时,若总体容量不能被样本容量整除,可以先从总体中随机地剔除几个个体.以题试法2.(2018·武夷模拟)用系统抽样法从160名学生中抽取容量为20的样本,将160名学生随机地从1~160编号,按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组抽出的号码为126,则第1组中用抽签的方法确定的号码是________.解析:设第1组抽取的号码为b,则第n组抽取的号码为8(n-1)+b,∴8×(16-1)+b=126,∴b=6,故第1组抽取的号码为6.答案:6典题导入[例3] (1)(2018·福建高考)一支田径队有男女运动员98人,其中男运动员有56人.按男女比例用分层抽样的方法,从全体运动员中抽出一个容量为28的样本,那么应抽取女运动员人数是________.(2)(2018·天津高考)某地区有小学150所,中学75所,大学25所.现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取____________所学校,中学中抽取____________所学校.[自主解答] (1)依题意,女运动员有98-56=42(人).设应抽取女运动员x 人,根据分层抽样特点,得x 42=2898,解得x =12. (2)150×30150+75+25=150×30250=18,75×30250=9.[答案] (1)12 (2)18 9本例(2)中条件变为“某地区有小学、中学、大学若干所,现采用分层抽样的方法从这些学校中抽取30所学校,其中从150所小学中抽取18所”试求该地区共有多少所学校.解:设共有n 所学校, ∴150×30n =18,∴n =250.由题悟法进行分层抽样时应注意以下几点(1)分层抽样中分多少层,如何分层要视具体情况而定,总的原则是:层内样本的差异要小,两层之间的样本差异要大,且互不重叠.(2)为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性相同. (3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样. (4)抽样比=样本容量总体容量=各层样本数量各层个体数量.以题试法3.(2018·惠州二调)某工厂的一、二、三车间在12月份共生产了3 600双皮靴,在出厂前要检查这批产品的质量,决定采用分层抽样的方法进行抽取,若从一、二、三车间抽取的产品数分别为a 、b 、c ,且a 、b 、c 构成等差数列,则二车间生产的产品数为( )A .800B .1 000C .1 200D .1 500解析:选C 因为a 、b 、c 成等差数列,所以2b =a +c ,所以二车间抽取的产品数占抽取产品总数的三分之一,根据分层抽样的性质可知,二车间生产的产品数占总数的三分之一,即为3 600×13=1 200.1.(2018·江西模拟)在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本:①采用随机抽样法,将零件编号为00,01,02,…,99,从中抽出20个;②采用系统抽样法,将所有零件分成20组,每组5个,然后每组中随机抽取1个;③采用分层抽样法,随机从一级品中抽取4个,二级品中抽取6个,三级品中抽取10个.则( )A .不论采取哪种抽样方法,这100个零件中每个零件被抽到的概率都是15B .①②两种抽样方法,这100个零件中每个零件被抽到的概率都是15,③并非如此C .①③两种抽样方法,这100个零件中每个零件被抽到的概率都是15,②并非如此D .采用不同的抽样方法,这100个零件中每个零件被抽到的概率各不相同解析:选A 由于随机抽样法、系统抽样法与分层抽样法均是等可能性抽样,因此不论采取哪种抽样方法,这100个零件中每个零件被抽到的概率都是15.2.某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查.这种抽样方法是( )A .简单随机抽样法B .抽签法C .随机数法D .分层抽样法解析:选D 总体由差异明显的几部分组成、按比例抽样,为分层抽样.3.(2018·忻州一中月考)将参加夏令营的600名学生编号为:001,002,…,600,采用系统抽样的方法抽取一个容量为50的样本,且随机抽得的编号为003.这600名学生分住在3个营区,从001到300住在第1营区,从301到495住在第2营区,从496到600住在第3营区,则3个营区被抽中的人数依次为( )A .26,16,8B .25,16,9C .25,17,8D .24,17,9解析:选C 由题意知,被抽中的学生的编号构成以3为首项,12为公差的等差数列{a n },其通项a n =12n -9(1≤n≤50,n ∈N *).令1≤12n-9≤300,得1≤n≤25,故第1营区被抽中的人数为25;令301≤12n-9≤495,得26≤n≤42,故第2营区被抽中的人数为17;令496≤12n-9≤600,得43≤n≤50,故第3营区被抽中的人数为8.4.(2018·潍坊模拟)为调查参加运动会的1 000名运动员的年龄情况,从中抽查了100名运动员的年龄,就这个问题来说,下列说法正确的是( )A .1 000名运动员是总体B .每个运动员是个体C .抽取的100名运动员是样本D .样本容量是100解析:选D 所调查的是运动员的年龄,故A、B、C错误,样本容量是100.5.(2018·濮阳调研)甲校有3 600名学生,乙校有5 400名学生,丙校有1 800名学生.为统计三校学生某方面的情况,计划采用分层抽样法,抽取一个容量为90的样本,应该在这三校分别抽取的学生人数是( ) A.30,30,30 B.30,45,15C.20,30,10 D.30,50,10解析:选 B 抽取比例是903 600+5 400+1 800=1120,故三校分别抽取的学生人数为 3 600×1120=30,5400×1120=45,1 800×1120=15.6.某学校在校学生2 000人,为了加强学生的锻炼意识,学校举行了跑步和登山比赛,每人都参加且每人只参加其中一项比赛,各年级参加比赛的人数情况如下:其中a∶b∶c=2∶5∶3,全校参加登山的人数占总人数的4.为了了解学生对本次活动的满意程度,按分层抽样的方式从中抽取一个200人的样本进行调查,则高三年级参加跑步的学生中应抽取( ) A.15个B.30人C.40人D.45人解析:选D 由题意,全校参加跑步的人数占总人数的34,所以高三年级参加跑步的总人数为34×2 000×310=450,由分层抽样的特征,得高三年级参加跑步的学生中应抽取的人数为2002 000×450=45.7.(2018·浙江高考)某个年级有男生560人,女生420人,用分层抽样的方法从该年级全体学生中抽取一个容量为280的样本,则此样本中男生人数为________.解析:由分层抽样得,此样本中男生人数为560×280560+420=160.答案:1608.(2018·湖北高考)一支田径运动队有男运动员56人,女运动员42人.现用分层抽样的方法抽取若干人,若抽取的男运动员有8人,则抽取的女运动员有________人.解析:分层抽样的特点是按照各层占总体的比相等抽取样本,设抽取的女运动员有x人,则x8=4256,解得x=6.答案:69.(2018·江西模拟)某市有A、B、C三所学校,共有高三文科学生1 500人,且A、B、C三所学校的高三文科学生人数成等差数列,在三月进行全市联考后,准备用分层抽样的方法从所有高三文科学生中抽取容量为n 的样本,进行成绩分析,若从B校学生中抽取40人,则n=________.解析:设A、B、C三所学校学生人数分别为x,y,z,由题知x,y,z成等差数列,所以x+z=2y,又x+y+z=1 500,所以y=500,用分层抽样方法抽取B校学生人数为n1 500×500=40,得n=120.答案:12010.(2018·开封模拟)某公路设计院有工程师6人,技术员12人,技工18人,要从这些人中抽取n 个人参加市里召开的科学技术大会.如果采用系统抽样和分层抽样的方法抽取,不用剔除个体;如果参会人数增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,求n.解:总体容量为6+12+18=36.当样本容量是n 时,由题意知,系统抽样的间隔为36n ,分层抽样的比例是n 36,抽取的工程师人数为n36×6=n 6,技术员人数为n 36×12=n 3,技工人数为n 36×18=n2,所以n 应是6的倍数,36的约数,即n =6,12,18. 当样本容量为(n +1)时,总体容量是35人,系统抽样的间隔为35n +1,因为35n +1必须是整数,所以n 只能取6.即样本容量n =6.11.(2018·聊城联考)某单位有2 000名职工,老年、中年、青年分布在管理、技术开发、营销、生产各部门中,如下表所示:(1)若要抽取40人调查身体状况,则应怎样抽样?(2)若要开一个25人的讨论单位发展与薪金调整方面的座谈会,则应怎样抽选出席人? (3)若要抽20人调查对某运动会筹备情况的了解,则应怎样抽样? 解:(1)用分层抽样,并按老年4人,中年12人,青年24人抽取.(2)用分层抽样,并按管理2人,技术开发4人,营销6人,生产13人抽取.(3)用系统抽样,对2 000人随机编号,号码从0001~2 000,每100号分为一组,从第一组中用随机抽样抽取一个号码,然后将这个号码分别加100,200,…,1 900,得到容量为20的样本.12.一个城市有210家百货商店,其中大型商店有20家,中型商店有40家,小型商店有150家.为了掌握各商店的营业情况,要从中抽取一个容量为21的样本,按分层抽样方法抽取样本时,各类百货商店要分别抽取多少家?写出抽样过程.解:∵21∶210=1∶10, ∴2010=2,4010=4,15010=15. ∴应从大型商店中抽取2家,从中型商店中抽取4家,从小型商店中抽取15家. 抽样过程:(1)计算抽样比21210=110;(2)计算各类百货商店抽取的个数: 2010=2,4010=4,15010=15;(3)用简单随机抽样方法依次从大、中、小型商店中抽取2家、4家、15家;(4)将抽取的个体合在一起,就构成所要抽取的一个样本.1.从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是( )A.5,10,15,20,25 B.3,13,23,33,43C.1,2,3,4,5 D.2,4,6,16,32解析:选B 间隔距离为10,故可能编号是3,13,23,33,43.2.最近络上流行一种“QQ农场游戏”,这种游戏通过虚拟软件模拟种植与收获的过程.为了了解本班学生对此游戏的态度,高三(6)班计划在全班60人中展开调查,根据调查结果,班主任计划采用系统抽样的方法抽取若干名学生进行座谈,为此先对60名学生进行编号01,02,03,…,60,已知抽取的学生中最小的两个编号为03,09,则抽取的学生中最大的编号为________.解析:由最小的两个编号为03,09可知,抽样间距为6,因此抽取人数的比例为16,即抽取10名同学,其编号构成首项为3,公差为6的等差数列,故最大编号为3+(10-1)×6=57.答案:573.(2018·山西四校联考)调查某高中1 000名学生的身高情况,得下表.已知从这批学生中随机抽取1名学生,抽到偏低男生的概率为0.15.(1)求x的值;(2)若用分层抽样的方法,从这批学生中随机抽取50名,问应在偏高学生中抽多少名;(3)已知y≥193,z≥193,求偏高学生中男生不少于女生的概率.解:(1)由题意可知,x1 000=0.15,故x=150.(2)由题意可知,偏高学生人数为y+z=1 000-(100+173+150+177)=400.设应在偏高学生中抽m名,则m400=501 000,故m=20.应在偏高学生中抽20名.(3)由(2)知y+z=400,且y≥193,z≥193,满足条件的(y,z)有(193,207),(194,206),…,(207,193),共有15组.设事件A:“偏高学生中男生不少于女生”,即y≤z,满足条件的(y,z)有(193,207),(194,206),…,(200,200),共有8组,所以P(A)=8 15.偏高学生中男生不少于女生的概率为815.1.(2018·抚顺模拟)某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测.若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是( )A.4 B.5C.6 D.7解析:选C 四类食品的每一种被抽到的概率为2040+10+30+20=15,则植物油类和果蔬类食品被抽到的种数之和为(10+20)×15=6.2.某工厂生产A、B、C三种不同型号的产品,其相应产品数量之比为2∶3∶5,现用分层抽样方法抽出一个容量为n的样本,样本中A型号产品有16件,那么此样本的容量n=________.解析:设分别抽取B、C型号产品m1,m2件,则由分层抽样的特点可知216=3m1=5m2,∴m1=24,m2=40,∴n=16+m1+m2=80. 答案:80。
随机抽样一.【课标要求】1.能从现实生活或其他学科中提出具有一定价值的统计问题;2.结合具体的实际问题情境,理解随机抽样的必要性和重要性;3.在参与解决统计问题的过程中,学会用简单随机抽样方法从总体中抽取样本;通过对实例的分析,了解分层抽样和系统抽样方法;4.能通过试验、查阅资料、设计调查问卷等方法收集数据二.【命题走向】统计是在初中数学统计初步的深化和扩展,本讲的主要内容是随机抽样的方法在总体中抽取样本。
预测2010年高考对本讲的考察是:(1)以基本题(中、低档题为主),多以选择题、填空题的形式出现,以实际问题为背景,综合考察学生学习基础的知识、应用基础知识、解决实际问题的能力;(2)热点是随机抽样方法中的分层抽样、系统抽样方法三.【要点精讲】三种常用抽样方法:1.简单随机抽样:设一个总体的个数为N。
如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样。
实现简单随机抽样,常用抽签法和随机数表法(1)抽签法制签:先将总体中的所有个体编号(号码可以从1到N),并把号码写在形状、大小相同的号签上,号签可以用小球、卡片、纸条等制作,然后将这些号签放在同一个箱子里,进行均匀搅拌;抽签:抽签时,每次从中抽出1个号签,连续抽取n次;成样:对应号签就得到一个容量为n的样本。
抽签法简便易行,当总体的个体数不多时,适宜采用这种方法(2)随机数表法编号:对总体进行编号,保证位数一致;数数:当随机地选定开始读数的数后,读数的方向可以向右,也可以向左、向上、向下等等。
在读数过程中,得到一串数字号码,在去掉其中不合要求和与前面重复的号码后,其中依次出现的号码可以看成是依次从总体中抽取的各个个体的号码。
成样:对应号签就得到一个容量为n的样本结论:①用简单随机抽样,从含有N个个体的总体中抽取一个容量为n的样本时,每次抽取一个个体时任一个体被抽到的概率为N1;在整个抽样过程中各个个体被抽到的概率为N n ;② 基于此,简单随机抽样体现了抽样的客观性与公平性;③ 简单随机抽样的特点:它是不放回抽样;它是逐个地进行抽取;它是一种等概率抽样。
第1讲随机抽样最新考纲 1.理解随机抽样的必要性和重要性;2.会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法.知识梳理1.简单随机抽样(1)定义:设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.(2)最常用的简单随机抽样的方法:抽签法和随机数法.(3)应用范围:总体中的个体数较少.2.系统抽样(1)定义:当总体中的个体数目较多时,可将总体分成均衡的几个部分,然后按照事先定出的规则,从每一部分抽取一个个体得到所需要的样本,这种抽样方法叫做系统抽样.(2)系统抽样的操作步骤第一步编号:先将总体的N个个体编号;第二步分段:确定分段间隔k,对编号进行分段,当Nn(n是样本容量)是整数时,取k=Nn;第三步确定首个个体:在第1段用简单随机抽样确定第一个个体编号l(l≤k);第四步获取样本:按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号(l+k),再加k得到第3个个体编号(l+2k),依次进行下去,直到获取整个样本.(3)应用范围:总体中的个体数较多.3.分层抽样(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.(2)应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.诊断自测1.判断正误(在括号内打“√”或“×”)精彩PPT展示(1)在简单随机抽样中,某一个个体被抽到的可能性与第几次抽取有关,第一次抽到的可能性最大.(×)(2)系统抽样在起始部分抽样时采用简单随机抽样.(√)(3)要从1 002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平.(×)(4)分层抽样中,每个个体被抽到的可能性与层数及分层有关.(×)2.(2014·四川卷)在“世界读书日”前夕,为了了解某地5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5 000名居民的阅读时间的全体是()A.总体 B.个体C.样本的容量 D.从总体中抽取的一个样本解析由题目条件知,5 000名居民的阅读时间的全体是总体;其中1名居民的阅读时间是个体;从5 000名居民某天的阅读时间中抽取的200名居民的阅读时间是从总体中抽取的一个样本,样本容量是200.答案 A3.(2014·重庆卷)某中学有高中生3 500人,初中生1 500人.为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为()A.100 B.150C.200 D.250解析样本抽取比例为703 500=150,该校总人数为1 500+3 500=5 000,则n5 000=150,故n=100,选A.答案 A4.(2014·湖南卷)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则()A.p1=p2<p3 B.p2=p3<p1C.p1=p3<p2 D.p1=p2=p3解析由随机抽样的知识知,三种抽样中,每个个体被抽到的概率都相等,故选D.答案 D5.为了调查某产品的销售情况,销售部门从下属的92家销售连锁店中抽取30家了解情况.若用系统抽样法,则抽样间隔和随机剔除的个体数分别为________.解析因为92=3×30+2,所以抽样间隔为3,随机剔除的个体数为2.答案3,2考点一简单随机抽样【例1】下列抽取样本的方式是否属于简单随机抽样?(1)从无限多个个体中抽取100个个体作为样本.(2)盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.(3)从20件玩具中一次性抽取3件进行质量检验.(4)某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.解(1)不是简单随机抽样.因为被抽取的样本总体的个体数是无限的,而不是有限的.(2)不是简单随机抽样.因为它是放回抽样.(3)不是简单随机抽样.因为这是“一次性”抽取,而不是“逐个”抽取.(4)不是简单随机抽样.因为不是等可能抽样.规律方法(1)简单随机抽样需满足:①被抽取的样本总体的个体数有限;②逐个抽取;③是不放回抽取;④是等可能抽取.(2)简单随机抽样常有抽签法(适用总体中个体数较少的情况)、随机数法(适用于个体数较多的情况).【训练1】(1)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()7816657208026314070243699728019832049234493582003623486969387481A.08B.07C.02 D.01(2)下列抽样试验中,适合用抽签法的有()A.从某厂生产的5 000件产品中抽取600件进行质量检验B.从某厂生产的两箱(每箱18件)产品中抽取6件进行质量检验C.从甲、乙两厂生产的两箱(每箱18件)产品中抽取6件进行质量检验D.从某厂生产的5 000件产品中抽取10件进行质量检验解析(1)从第1行第5列、第6列组成的数65开始由左到右依次选出的数为08,02,14,07,01,所以第5个个体编号为01.(2)A,D中的总体中个体数较多,不适宜抽签法,C中甲、乙两厂的产品质量有区别,也不适宜抽签法,故选B.答案(1)D(2)B考点二系统抽样【例2】(1)已知某单位有40名职工,现要从中抽取5名职工,将全体职工随机按1~40编号,并按编号顺序平均分成5组.按系统抽样方法在各组内抽取一个号码.若第1组抽出的号码为2,则所有被抽出职工的号码为________.(2)为了解1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为()A.50 B.40C.25 D.20解析(1)由系统抽样知识知,第一组1~8号;第二组为9~16号;第三组为17~24号;第四组为25~32号;第五组为33~40号.第一组抽出号码为2,则依次为10,18,26,34.(2)由系统抽样的定义知,分段间隔为1 00040=25.故答案为C.答案(1)2,10,18,26,34(2)C规律方法(1)系统抽样又称“等距抽样”,所以依次抽取的样本对应的号码就组成一个等差数列,首项就是第1组所抽取的样本号码,公差为间隔数,根据等差数列的通项公式就可以确定每一组内所要抽取的样本号码,但有时也不是按一定间隔抽取的.(2)系统抽样时,如果总体中的个体数不能被样本容量整除时,可以先用简单随机抽样从总体中剔除几个个体,然后再按系统抽样进行.训练2】(1)从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是()A.5,10,15,20,25 B.3,13,23,33,43C.1,2,3,4,5 D.2,4,6,16,32(2)(2014·临沂模拟)某班共有52人,现根据学生的学号,用系统抽样的方法,抽取一个容量为4的样本,已知3号、29号、42号同学在样本中,那么样本中还有一个同学的学号是()A.10 B.11C.12 D.16解析(1)间隔距离为10,故可能编号是3,13,23,33,43.(2)因为29号、42号的号码差为13,所以3+13=16,即另外一个同学的学号是16.答案(1)B(2)D考点三分层抽样【例3】(1)(2014·湖北卷)甲、乙两套设备生产的同类型产品共4 800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件.(2)某学校高一、高二、高三年级的学生人数之比为3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取________名学生.解析(1)由题意知,甲乙两套设备产品数量抽样比为5∶3,故乙设备生产的产品共4 800×38=1 800(件).(2)高二年级学生人数占总数的33+3+4=310.样本容量为50,则高二年级抽取:50×310=15(名)学生.答案(1)1 800(2)15规律方法在分层抽样的过程中,为了保证每个个体被抽到的可能性是相同的,这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体的个体数之比,即n i∶N i=n∶N.【训练3】(2014·云南检测)某公司一共有职工200人,其中老年人25人,中年人75人,青年人100人,有关部门为研究老年人、中年人、青年人对公司发展的态度问题,现在用分层抽样的方法从这个公司抽取m人进行问卷调查,如果抽到老年人3人,那么m=()A.16 B.20C.24 D.28解析由325=m200,解得m=24,故选C.答案 C[思想方法]三种抽样方法中简单随机抽样是最基本的抽样方法,是其他两种方法的基础,适用范围不同,要根据总体的具体情况选用不同的方法;它们的共同点都是等概率抽样,即抽样过程中每个个体被抽取的概率相等,体现了这三种抽样方法的客观性和公平性,若样本容量为n,总体的个体数为N,则用这三种方法抽样时,每一个个体被抽到的概率都是n N.[易错防范]应用分层抽样应遵循的三点:(1)分层,将相似的个体归为一类,即为一层,分层要求每层的各个个体互不交叉,即不重复不遗漏.(2)分层保证每个个体等可能被抽取,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比与这层个体数量与总体容量的比相等.(3)若各层应抽取的个体数不都是整数,则应当调整样本容量,先剔除“多余”的个体.基础巩固题组(建议用时:30分钟)一、选择题1.某中学进行了该学年度期末统一考试,该校为了了解高一年级1 000名学生的考试成绩,从中随机抽取了100名学生的成绩,就这个问题来说,下面说法正确的是()A.1 000名学生是总体B.每个学生是个体C.1 000名学生的成绩是一个个体D.样本的容量是100解析 1 000名学生的成绩是总体,其容量是1 000,100名学生的成绩组成样本,其容量是100.答案 D2.(2014·西安质检)现要完成下列3项抽样调查:①从10盒酸奶中抽取3盒进行食品卫生检查.②科技报告厅有32排,每排有40个座位,有一次报告会恰好坐满了听众,报告会结束后,为了听取意见,需要请32名听众进行座谈.③高新中学共有160名教职工,其中一般教师120名,行政人员16名,后勤人员24名,为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20的样本.较为合理的抽样方法是( )A .①简单随机抽样,②系统抽样,③分层抽样B .①简单随机抽样,②分层抽样,③系统抽样C .①系统抽样,②简单随机抽样,③分层抽样D .①分层抽样,②系统抽样,③简单随机抽样解析 对于①,个体没有差异且总数不多可用随机抽样法,是简单随机抽样;对于②,将总体分成均衡的若干部分指的是将总体分段,在第1段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整数倍即为抽样编号,是系统抽样;对于③,个体有明显的差异,所以选用分层抽样,故选A.答案 A3.某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( )A .11 B.12 C .13D.14解析 由84042=20,即每20人抽取1人,所以抽取编号落入区间[481,720]的人数为720-48020=24020=12(人). 答案 B4.某工厂在12月份共生产了3 600双皮靴,在出厂前要检查这批产品的质量,决定采用分层抽样的方法进行抽取,若从一、二、三车间抽取的产品数分别为a ,b ,c ,且a ,b ,c 构成等差数列,则第二车间生产的产品数为( )A .800 B.1 000 C .1 200D.1 500解析 因为a ,b ,c 成等差数列,所以2b =a +c ,即第二车间抽取的产品数占抽样产品总数的三分之一,根据分层抽样的性质可知,第二车间生产的产品数占总数的三分之一,即为1 200双皮靴.答案 C5.(1)某学校为了了解2014年高考数学学科的考试成绩,在高考后对1 200名学生进行抽样调查,其中文科400名考生,理科600名考生,艺术和体育类考生共200名,从中抽取120名考生作为样本.(2)从10名家长中抽取3名参加座谈会.Ⅰ.简单随机抽样法;Ⅱ.系统抽样法;Ⅲ.分层抽样法.问题与方法配对正确的是( )A .(1)Ⅲ,(2)Ⅰ B.(1)Ⅰ,(2)Ⅱ C .(1)Ⅱ,(2)ⅢD.(1)Ⅲ,(2)Ⅱ解析 通过分析可知,对于(1),应采用分层抽样法,对于(2),应采用简单随机抽样法. 答案 A 二、填空题6.(2014·天津卷)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取________名学生.解析 由题意知应抽取人数为300×44+5+5+6=60.答案 607.(2015·青岛模拟)某班级有50名学生,现要采取系统抽样的方法在这50名学生中抽出10名学生,将这50名学生随机编号1~50号,并分组,第一组1~5号,第二组6~10号,…,第十组46~50号,若在第三组中抽得号码为12的学生,则在第八组中抽得号码为________的学生.解析 因为12=5×2+2,即第三组抽出的是第二个同学,所以每一组都相应抽出第二个同学,所以第8组中抽出的号码为5×7+2=37号.答案 378.200名职工年龄分布如图所示,从中随机抽40名职工作样本,采用系统抽样方法,按1~200编号为40组,分别为1~5,6~10,…,196~200,第5组抽取号码为22,第8组抽取号码为______.若采用分层抽样,40岁以下年龄段应抽取________人.解析 将1~200编号分为40组,则每组的间隔为5,其中第5组抽取号码为22,则第8组抽取的号码应为22+3×5=37;由已知条件200名职工中40岁以下的职工人数为200×50%=100,设在40岁以下年龄段中抽取x 人,则40200=x100,解得x =20.答案 37 20 三、解答题9.某初级中学共有学生2 000名,各年级男、女生人数如下表:已知在全校学生中随机抽取1(1)求x 的值;(2)现用分层抽样的方法在全校抽取48名学生,问应在初三年级抽取多少名? 解 (1)∵x2 000=0.19.∴x =380.(2)初三年级人数为y +z =2 000-(373+377+380+370)=500,现用分层抽样的方法在全校抽取48名学生,应在初三年级抽取的人数为:482 000×500=12名.10.某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人.上级机关为了了解政府机构改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,请具体实施抽取.解 用分层抽样方法抽取. 具体实施抽取如下:(1)∵20∶100=1∶5,∴105=2,705=14,205=4,∴从副处级以上干部中抽取2人,从一般干部中抽取14人,从工人中抽取4人.(2)因副处级以上干部与工人的人数较少,他们分别按1~10编号与1~20编号,然后采用抽签法分别抽取2人和4人;对一般干部70人采用00,01,02,…,69编号,然后用随机数表法抽取14人.(3)将2人,4人,14人的编号汇合在一起就取得了容量为20的样本.能力提升题组(建议用时:20分钟)11.某初级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,…,270,使用系统抽样时,将学生统一随机编号为1,2,…,270,并将整个编号依次分为10段,如果抽得号码有下列四种情况:①7,34,61,88,115,142,169,196,223,250; ②5,9,100,107,111,121,180,195,200,265; ③11,38,65,92,119,146,173,200,227,254; ④30,57,84,111,138,165,192,219,246,270. 关于上述样本的下列结论中,正确的是( ) A .②、③都不能为系统抽样 B.②、④都不能为分层抽样 C .①、④都可能为系统抽样D.①、③都可能为分层抽样解析 ①在1~108之间有4个,109~189之间有3个,190~270之间有3个,符合分层抽样的规律,可能是分层抽样.同时,从第二个数据起每个数据与前一个的差都为27,符合系统抽样的规律,则可能是系统抽样得到的;同理③符合分层抽样的规律,可能是分层抽样时,从第二个数据起每个数据与前一个的差都为27,符合系统抽样的规律,则可能是系统抽样得到的,故选D.答案 D12.将参加夏令营的600名学生编号为001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中的人数依次为( )A .26,16,8 B.25,17,8 C .25,16,9D.24,17,9解析 由题意及系统抽样的定义可知,将这600名学生按编号依次分成50组,每一组各有12名学生,第k (k ∈N *)组抽中的号码是3+12(k -1).令3+12(k -1)≤300得k ≤1034,因此第Ⅰ营区被抽中的人数是25;令300<3+12(k -1)≤495得1034<k ≤42,因此第Ⅱ营区被抽中的人数是42-25=17.结合各选项知,选B. 答案 B13.一个总体中有90个个体,随机编号0,1,2,…,89,依从小到大的编号顺序平均分成9个小组,组号依次为1,2,3,…,9.现用系统抽样方法抽取一个容量为9的样本,规定如果在第1组随机抽取的号码为m,那么在第k组中抽取的号码个位数字与m+k的个位数字相同,若m=8,则在第8组中抽取的号码是________.解析由题意知:m=8,k=8,则m+k=16,也就是第8组抽取的号码个位数字为6,十位数字为8-1=7,故抽取的号码为76.答案7614.某公路设计院有工程师6人,技术员12人,技工18人,要从这些人中抽取n个人参加市里召开的科学技术大会.如果采用系统抽样和分层抽样的方法抽取,不用剔除个体,如果参会人数增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,求n.解总体容量为6+12+18=36.当样本容量是n时,由题意知,系统抽样的间隔为36n,分层抽样的比例是n36,抽取的工程师人数为n36×6=n6,技术员人数为n36×12=n3,技工人数为n36×18=n2,所以n应是6的倍数,36的约数,即n=6,12,18.当样本容量为(n+1)时,总体容量是35人,系统抽样的间隔为35n+1,因为35n+1必须是整数,所以n只能取6.即样本容量n=6.第2讲用样本估计总体最新考纲 1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解他们各自的特点;2.理解样本数据标准差的意义和作用,会计算数据标准差;3.能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想;5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.知识梳理1.用样本的频率分布估计总体分布(1)频率分布:样本中所有数据(或者数据组)的频数和样本容量的比,就是该数据的频率,所有数据(或者数据组)的频率的分布变化规律叫做频率分布.(2)作频率分布直方图的步骤:①求极差,即一组数据中的最大值与最小值的差;②决定组距与组数;③将数据分组;④列频率分布表;⑤画频率分布直方图.在频率分布直方图中,纵轴表示频率组距,数据落在各小组内的频率用各小长方形的面积表示,各小长方形的面积总和等于1.(3) 总体密度曲线①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑的曲线,统计中称之为总体密度曲线.(4)茎叶图:统计中还有一种被用来表示数据的图叫茎叶图,茎是指中间一列数,叶是从茎的旁边生长出来的数.当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有信息,而且可以随时记录,给数据的记录和表示都带来方便.2.用样本的数字特征估计总体的数字特征(1)众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.(2)中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(3)平均数:样本数据的算术平均数,即x=1n(x1+x2+…+x n).(4)样本方差、标准差标准差s=1n[(x1-x)2+(x2-x)2+…+(x n-x)2].其中x n是样本数据的第n项,n是样本容量,x是平均数.标准差是反映总体波动大小的特征数,样本方差是标准差的平方.通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差.诊断自测1.判断正误(在括号内打“√”或“×”)精彩PPT展示(1)在频率分布直方图中,小矩形的高表示频率.(×)(2)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.(√)(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.(√) (4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.(×)2.对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )A .46,45,56B .46,45,53C .47,45,56D .45,47,53解析 由题意知各数为12,15,20,22,23,23,31,32,34,34,38,39,45,45,45,47,47,48,48,49,50,50,51,51,54,57,59,61,67,68,中位数是46,众数是45,最大数为68,最小数为12,极差为68-12=56.答案 A3.(2014·山东卷)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.下图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A .6 B.8 C .12D.18解析 全体志愿者共有:20(0.24+0.16)×1=50(人),所以第三组有志愿者:0.36×1×50=18(人), ∵第三组中没有疗效的有6人, ∴有疗效的有18-6=12(人),故选C. 答案 C4.(2014·陕西卷)某公司10位员工的月工资(单位:元)为x 1,x 2,…,x 10,其均值和方差分别为x 和s 2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( )A.x ,s 2+1002B.x +100,s 2+1002C.x ,s 2D.x +100,s 2解析 x =x 1+x 2+…+x 1010,s 2=110[(x 1-x )2+(x 2-x )2+…+(x 10-x )2],月工资增加100元后:x ′=(x 1+100)+(x 2+100)+…+(x 10+100)10=x 1+x 2+…+x 1010+100=x +100,s ′2=110[(x 1+100-x ′)2+(x 2+100-x ′)2+…+(x 10+100-x ′)2]=s 2.故选D.答案 D5.(人教A 必修3P82A6改编)甲乙两台机床同时生产一种零件,10天中,两台机床每天出的次品数分别是: 甲 0 1 0 2 2 0 3 1 2 4 乙 2 3 1 1 0 2 1 1 0 1 则机床性能较好的为________.解析 ∵x 甲=1.5,x 乙=1.2,s 2甲=1.65,s 2乙=0.76, ∴s 2乙<s 2甲,∴乙机床性能较好.答案 乙考点一 频率分布直方图【例1】(2014·新课标全国Ⅰ卷)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:(1)(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?解(1)(2)质量指标值的样本平均数为x=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.规律方法解决频率分布直方图的问题,关键在于找出图中数据之间的联系.这些数据中,直接的有组距、频率组距,间接的有频率、小长方形的面积,合理使用这些数据,再结合两个等量关系:小长方形面积=组距×频率组距=频率,小长方形面积之和等于1,即频率之和等于1,就可以解决直方图的有关问题.训练1】(2015·郑州质量预测)某班的全体学生参加消防安全知识竞赛,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是________.解析依题意,低于60的人数的频率为1-(0.020+0.015)×20=0.3,因此该班学生人数是15÷0.3=50.答案50考点二茎叶图【例2】(2014·广东卷)某车间20名工人年龄数据如下表:(1)求这20名工人年龄的众数与极差;(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图; (3)求这20名工人年龄的方差.解 (1)由题意可知,这20名工人年龄的众数是30,极差是40-19=21. (2)这20名工人年龄的茎叶图如图所示:(3)这20名工人年龄的平均数为x =120(19+3×28+3×29+5×30+4×31+3×32+40)=30,∴这20名工人年龄的方差为s 2=120 i =120 (x i -x )2=112+6×22+7×12+5×02+10220=25220=12.6.规律方法 (1)茎叶图的绘制需注意:①“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;②重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据.(2)茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等.训练2】 (2015·海口调研)某样本数据的茎叶图如图所示,若该组数据的中位数为85,则该组数据的平均数为________.解析 依题意得,将样本数据由小到大排列,中间的两个数之和等于85×2=170,因此x =6,样本数据的平均数等于110(70×2+80×6+90×2+53)=85.3.答案 85.3考点三 用样本的数字特征估计总体的数字特征【例3】 甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价. 解 (1)由题图可得甲、乙两人五次测试的成绩分别为 甲:10分,13分,12分,14分,16分; 乙:13分,14分,12分,12分,14分. x 甲=10+13+12+14+165=13,x 乙=13+14+12+12+145=13,s 2甲=15[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4, s 2乙=15[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8. (2)由s 2甲>s 2乙可知乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高. 规律方法 平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.训练3】 将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:8 7 794 0 1 0 x 9 1则7个剩余分数的方差为( ) A.1169 B.367 C .36D.677解析 由题意知87+94+90+91+90+90+x +917=91,解得x =4.所以s 2=17[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2]=17(16+9+1+0+1+9+0)=367.。
高考数学一轮复习:第二节随机抽样命题分析预测学科核心素养对于随机抽样,主要考查三种抽样方法,尤其是分层抽样和系统抽样,一般以选择题和填空题的形式出现.本节通过三种抽样方法,考查考生的数据分析、逻辑推理核心素养.授课提示:对应学生用书第237页知识点一简单随机抽样、分层抽样1.简单随机抽样(1)抽取方式:逐个不放回抽取;(2)每个个体被抽到的概率相等;(3)常用方法:抽签法和随机数法W.2.分层抽样(1)在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.(2)分层抽样的应用范围当总体是由差异明显的几个部分组成时,往往选用分层抽样.•温馨提醒•1.分层抽样中,易忽视每层抽取的个体的比例是相同的,即样本容量n总体个数N.2.不论哪种抽样方法,总体中的每一个个体入样的概率是相同的.1.一段高速公路有300个太阳能标志灯,其中进口的有30个,联合研制的有75个,国产的有195个,为了掌握每个标志灯的使用情况,要从中抽取一个容量为20的样本,若采用分层抽样的方法,抽取的进口的标志灯的数量为()A.2B.3C.5 D.13解析:20×30300=2.答案:A2.利用简单随机抽样,从n个个体中抽取一个容量为10的样本.若第二次抽取时,余下的每个个体被抽到的概率为13,则在整个抽样过程中,每个个体被抽到的概率为( )A .14B .13C .514D .1027解析:根据题意,9n -1=13,解得n =28.故每个个体被抽到的概率为1028=514.答案:C3.(2021·东北三校联考)某工厂生产甲、乙、丙三种型号的产品,产品数量之比为3∶5∶7,现用分层抽样的方法抽出容量为n 的样本,其中甲种产品有18件,则样本容量n =( ) A .54 B .90 C .45D .126解析:依题意得33+5+7×n =18,解得n =90,即样本容量为90.答案:B知识点二 系统抽样 系统抽样的步骤假设要从容量为N 的总体中抽取容量为n 的样本. (1)先将总体的N 个个体编号;(2)确定分段间隔k ,对编号进行分段W.当N n (n 是样本容量)是整数时,取k =Nn ;(3)在第1段用简单随机抽样确定第一个个体编号l (l ≤k );(4)按照一定的规则抽取样本.通常是将l 加上间隔k 得到第2个个体编号(l +k ),再加k 得到第3个个体编号(l +2k ),依次进行下去,直到获取整个样本. • 温馨提醒 •系统抽样中,易忽视抽取的样本数也就是分段的段数,当Nn 不是整数时,注意剔除,剔除的个体是随机的,各段入样的个体编号成等差数列.1.在一次游戏中,获奖者可以得到5件不同的奖品,这些奖品要从由1~50编号的50种不同奖品中随机抽取确定,用系统抽样的方法为某位获奖者确定5件奖品的编号可以为( ) A .5,15,25,35,45 B .1,3,5,7,9 C .11,22,33,44,50D .12,15,19,23,28解析:1~50编号依次分成5组,在第一组随机抽取一个号码,其他组依次加10即可,选项A 符合要求.2.(易错题)某次考试结束后,从考号为1~1 000的1 000份试卷中,采用系统抽样法抽取50份试卷进行试评,则在考号区间[850,949]之中被抽到的试卷份数()A.一定是5 B.可能是4C.可能是10 D.不能具体确定解析:样本间隔为1 000÷50=20,考号在区间[850,949]的个数为949-850+1=100,100÷20=5,所以在考号区间[850,949]之中被抽到的试卷份数一定是5.答案:A授课提示:对应学生用书第238页题型一简单随机抽样1.下列抽样试验中,适合用抽签法的有()A.从某厂生产的5 000件产品中抽取600件进行质量检验B.从某厂生产的两箱(每箱18件)产品中抽取6件进行质量检验C.从甲、乙两厂生产的两箱(每箱18件)产品中抽取6件进行质量检验D.从某厂生产的5 000件产品中抽取10件进行质量检验解析:A,D中的总体中个体数较多,不适宜抽签法,C中甲、乙两厂的产品质量有区别,也不适宜抽签法.答案:B2.总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()7816657208026314070243699728019832049234493582003623486969387481A.08C.02 D.01解析:由题意知前5个个体的编号为08,02,14,07,01.答案:D3.“七乐彩”的中奖号码是从分别标有1,2,…,30的30个小球中逐个不放回地摇出7个小球来按规则确定中奖情况,这种从30个号码中选7个号码的抽样方法是()A.系统抽样法B.抽签法C.随机数法D.其他抽样方法解析:30个小球相当于号签,搅拌均匀后逐个不放回地抽取,是典型的抽签法.简单随机抽样的特点(1)抽取的个体数较少;(2)是逐个抽取;(3)是不放回抽取;(4)是等可能抽取.只有四个特点都满足的抽样才是简单随机抽样.题型二 系统抽样1.(2019·高考全国卷Ⅰ)某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是( ) A .8号学生 B .200号学生 C .616号学生D .815号学生解析:根据题意,系统抽样是等距抽样, 所以抽样间隔为1 000100=10.因为46除以10余6,所以抽到的号码都是除以10余6的数,结合选项知应为616. 答案:C2.(2020·贵州凯里一中检测)利用系统抽样法从编号分别为1,2,3,…,80的80件不同产品中抽出一个容量为16的样本,如果抽出的产品中有一件产品的编号为13,则抽的产品的最大编号为( ) A .73 B .78 C .77D .76解析:样本的分段间隔为8016=5,所以13号在第三组,则最大的编号为13+(16-3)×5=78. 答案:B3.从编号为1,2,…,59,60的60个产品中,用系统抽样的方法抽取一个样本,已知样本中最大的两个编号为51,57,则第一个入样的编号为_________.解析:由最大的两个编号为51,57,知分段间隔为57-51=6,即共抽取了606=10个产品,设第一个入样的编号为x ,则x +(10-1)×6=57,解得x =3. 答案:3题型三 分层抽样[例] (1)(2021·河南名校联考)《九章算术》第三章“衰分”中有如下问题:“今有甲持钱五百六十,乙持钱三百五十,丙持钱一百八十,凡三人俱出关,关税百钱,欲以钱数多少衰出之,问各几何.”其意为:今有甲带了560钱,乙带了350钱,丙带了180钱,三人一起出关,共需要交关税100钱,依照钱的多少按比例出钱,则丙应出 钱(所得结果四舍五入,保留整数).(2)某学校三个兴趣小组的学生人数分布如下表(每名同学只参加一个小组)(单位:人).篮球组 书画组 乐器组 高一 45 30 a 高二151020小组的学生中抽取30人,结果篮球组被抽出12人,则a 的值为_________.[解析] (1)按照钱的多少按比例出钱,所以丙应该出钱为180560+350+180×100=18 0001 090≈17.(2)由分层抽样得1245+15=30120+a ,解得a =30.[答案] (1)17 (2)30分层抽样中的计算问题分层抽样满足“每层中抽取的个体数量本层的总个体数量=样本容量总体数量”,即“n 1N 1=n 2N 2=…=nN 或n 1∶n 2∶…∶n =N 1∶N 2∶…∶N ”,据此在已知每层间的个体数量或数量比、样本容量、总体数量中的两个时,就可以求出第三个.[题组突破]1.某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( )类别 人数 老年教师 900 中年教师 1 800 青年教师 1 600 合计4 300A.90B.100 C.180 D.300解析:设该样本中的老年教师人数为x,由题意及分层抽样的特点得x900=3201 600,故x=180.答案:C2.甲、乙两套设备生产的同类型产品共4 800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为件.解析:由题设,抽样比为804 800=160.设甲设备生产的产品为x件,则x60=50,所以x=3 000.故乙设备生产的产品总数为4 800-3 000=1 800.答案:1 800抽样方法中的核心素养数据分析、数学运算——分层抽样的创新应用[例](2021·湖南四校摸底调研)某家电公司销售部门共有200名销售员,每年部门对每名销售员都有1 400万元的年度销售任务.已知这200名销售员去年的销售额都在区间[2,22](单位:百万元)内,现将其分成5组,第1组、第2组、第3组、第4组、第5组对应的区间分别为[2,6),[6,10),[10,14),[14,18),[18,22],并绘制出如下的频率分布直方图.(1)求a的值,并计算完成年度任务的人数;(2)用分层抽样的方法从这200名销售员中抽取容量为25的样本,求这5组分别应抽取的人数;(3)现从(2)中完成年度任务的销售员中随机选取2名,奖励海南三亚三日游,求获得此奖励的2名销售员在同一组的概率.[解析](1)∵(0.02+0.08+0.09+2a)×4=1,∴a=0.03,∴完成年度任务的人数为2×0.03×4×200=48.(2)第1组应抽取的人数为0.02×4×25=2,第2组应抽取的人数为0.08×4×25=8,第3组应抽取的人数为0.09×4×25=9,第4组应抽取的人数为0.03×4×25=3,第5组应抽取的人数为0.03×4×25=3,(3)在(2)中完成年度任务的销售员中,第4组有3人,记这3人分别为A1,A2,A3;第5组有3人,记这3人分别为B1,B2,B3.从这6人中随机选取2名,所有的基本事件为A1A2,A1A3,A1B1,A1B2,A1B3,A2A3,A2B1,A2B2,A2B3,A3B1,A3B2,A3B3,B1B2,B1B3,B2B3,共有15个基本事件,获得此奖励的2名销售员在同一组所包含的基本事件有6个,故所求概率P=615=2 5.解决分层抽样与样本数据分析问题的注意点(1)弄清分层抽样问题中每层的数据.(2)求解概率时注意概率类型的判断.[对点训练](2021·重庆九校联盟模拟)某社区为了解该社区退休老人每天的平均户外活动时间,从该社会退休老人中随机抽取了100位老人进行调查,获得了每人每天的平均户外活动时间(单位:时),活动时间按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成样本的频率分布直方图如图所示.(1)求图中a 的值;(2)估计该社区退休老人每人每天的平均户外活动时间的中位数;(3)在[1,1.5),[1.5,2)这两组中采用分层抽样的方法抽取7人,再从这7人中随机抽取2人,求抽取的2人恰好在同一个组的概率.解析:(1)由频率分布直方图,可知平均户外活动时间在[0,0.5)内的频率为0.08×0.5=0.04.同理,平均户外活动时间在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]内的频率分别为0.08,0.20,0.25,0.07,0.04,0.02,由1-(0.04+0.08+0.20+0.25+0.07+0.04+0.02)=0.5a +0.5a ,解得a =0.30. (2)设中位数为m 时.因为前5组的频率之和为0.04+0.08+0.15+0.20+0.25=0.72>0.5, 而前4组的频率之和为0.04+0.08+0.15+0.20=0.47<0.5,所以2≤m <2.5. 所以0.50×(m -2)=0.5-0.47,解得m =2.06.故可估计该社区退休老人每人每天的平均户外活动时间的中位数为2.06时. (3)由题意得平均户外活动时间在[1,1.5),[1.5,2)内的人数分别为15,20, 按分层抽样的方法在[1,1.5),[1.5,2)内分别抽取3人、4人,再从7人中随机抽取2人,共有21种方法,抽取的两人恰好都在同一个组有9种方法,故抽取的2人恰好在同一个组的概率P =921=37.。
【知识特点】1.统计中所学的内容是数理统计中最基本的问题,通过这些内容主要来介绍相关的统计思想和方法,了解一些有关统计学的基本知识,并能够应用几个基本概念、基本公式来处理实际生活中的一些基本问题。
2.统计案例为新课标中新增内容,主要是通过案例体会运用统计方法解决实际问题的思想和方法。
增加了统计和统计案例后,使得高中数学的整个体系更加完善了,有利于开阔数学视野,丰富数学思想和方法。
【重点关注】1.从对新课标高考试题的分析可以发现,主要考查抽样方法、各种统计图表、样本数字特征等。
对这部分的考查主要以选择题和填空题的形式出现。
2.统计案例中的独立性检验和回归分析也会逐步在高考题中出现,难度不会太大,多数情况下是考查两种统计分析方法的简单知识,以选择题和填空题为主。
【地位与作用】《全国新课程标准高考数学考试大纲》中对考生能力要求明确界定为空间想象能力、抽象概括能力、推理论证能力、运算求解能力、数据处理能力以及应用意识和创新意识等六个方面,其中数据处理能力是首次提出的一个能力要求,这定义为:会收集数据、整理数据、分析数据,能从大量数据中抽取对研究问题有用的信息,并作出判断。
数据处理能力主要依据统计(高考考试大纲对知识点要求如下表所示)或统计案例中的方法对数据进行整理、分析,并解决给定的实际问题,对统计的要求已提升到能力的高度。
统计的思想方法广泛应用于自然科学和社会科学的研究中,统计的语言不仅是数学的语言,也是各学科经常引用的大众语言,统计知识是作为一个新时期公民所比备的知识。
统计学就是应用科学的方法收集、整理、分析、描述所要研究的数据资料,然后根据所得到的结果,进行推断或决策的一门实用性很强的科学。
统计这部分内容,在高中数学新课程中,主要分布在必修3第二章(约16课时)与选修2—3第三章(约9课时)。
相对于高中学生的认知水平和生活经历还相对不是很高,所以它只能属于非重点内容,所出的相关题目一般来说都相对比较简单。
10.1随机抽样
考情分析
分层抽样时高考考查的重点,单独考查以选择、填空为主,近两年和其它知识综合考查出现的成为亮点,同时应加强系统抽样的复习。
基础知识
1.简单随机抽样
(1)定义:设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.
(2)最常用的简单随机抽样的方法:抽签法和随机数法.
2.系统抽样的步骤
假设要从容量为N 的总体中抽取容量为n 的样本.
(1)先将总体的N 个个体编号;
(2)确定分段间隔k,对编号进行分段,当是N n 整数时,取k=N n
; (3)在第1段用简单随机抽样确定第一个个体编号l (l k );
(4)按照一定的规则抽取样本,通常是将l 加上间隔k 得到第2个个体编号(l +k ),再加k 得到第3个个体编号(l +2k ),依次进行下去,直到获取整个样本.
3.分层抽样
(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.
(2)分层抽样的应用范围:
当总体是由差异明显的几个部分组成时,往往选用分层抽样.
注:三种抽样方法的共同点和联系:
(1)抽样过程中每个个体被抽取的机会均等;
(2)系统抽样中在分段后确定第一个个体时采用简单随机抽样,分层抽样中各层抽样时采用简单随机抽样或系统抽样.
注意事项
1.三种抽样方法的共同点都是等概率抽样,即抽样过程中每个个体被抽到的概率相等,体现了这三种抽样方法的客观性和公平性.若样本容量为n ,总体的个体数为N ,则用这三种方法抽样时,每个个体被抽到的概率都是n N
.
2. (1)简单随机抽样的特点:总体中的个体性质相似,无明显层次;总体容量较小,尤其是样本容量较小;用简单随机抽样法抽出的个体带有随机性,个体间无固定间距.
(2)系统抽样的特点:适用于元素个数很多且均衡的总体;各个个体被抽到的机会均等;总体分组后,在起始部分抽样时,采用简单随机抽样.
(3)分层抽样的特点:适用于总体由差异明显的几部分组成的情况;分层后,在每一层抽样时可采用简单随机抽样或系统抽样.
题型一 简单随机抽样
【例1】►某车间工人加工一种轴承100件,为了了解这种轴承的直径,要从中抽取10件轴承在同一条件下测量,如何采用简单随机抽样的方法抽取样本?
解 法一 (抽签法)将100件轴承编号为1,2,…,100,并做好大小、形状相同的号签,分别写上这100个数,将这些号签放在一起,进行均匀搅拌,接着连续抽取10个号签,然后测量这10个号签对应的轴的直径.
法二 (随机数表法)将100件轴承编号为00,01,02,…,99,在随机数表中选定一个起始位置,如取第21行(见随机数表)第1个数开始,选取10个为68,34,30,13,70,55,74,30,77,40,这10件即为所要抽取的样本.
【变式1】 福利彩票的中奖号码是在1~36个号码中,选出7个号码来按规则确定中奖情况,这种从36个号码中选7个号的适宜的抽样方法是________.
答案 抽签法
题型二 系统抽样
【例2】将参加夏令营的600名学生编号为:001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中的人数依次为 ( )
A. 26,16,8
B. 25,17,8
C. 25,16,9
D. 24,17,9
答案:B
解析:由题意知间隔为60050
=12,故抽到的号码为12k +3(k =0,1,…,49),列出不等式可解得:第Ⅰ营区抽25人,第Ⅱ营区抽17人,第Ⅲ营区抽8人.
【变式2】 从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是
( ).
A .5,10,15,20,25
B .3,13,23,33,43
C .1,2,3,4,5
D .2,4,6,16,32
解析 间隔距离为10,故可能编号是3,13,23,33,43.
答案 B
题型三 分层抽样
【例3】某市电视台在因特网上征集电视节目的现场参与观众,报名的共有1 2000人,分别来自4个城区,其中东城区2 400人,西城区4 600人,南城区3 800人,北城区1 200人,从中抽取60人参加现场节目,应当如何抽取?
解 因为:60∶1 2000=1∶200,所以2 400200=12,4 600200=23,3 800200=19,1 200200
=6. 故从东城区中抽取12人,从西城中抽23人,从南城中抽19人,从北城区中抽6人.
【变式3】某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为7人,则样本容量为( ).
A .7
B .15
C .25
D .35
解析 由题意知,青年职工人数∶中年职工人数∶老年职工人数=350∶250∶150=7∶5∶
3.由样本中青年职工为7人得样本容量为15.
答案 B
重难点突破
【例4】某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本.用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号),若第5组抽出的号码为22,则第8组抽出的号码应是________.若用分层抽样方法,则40岁以下年龄段应抽取________人.
答案:37 20
解析:∵间距为5,第5组抽22号,
∴第8组抽出的号码为22+5(8-5)=37.
40岁以下职工人数为100,应抽取40200
×100=20(人). 巩固提高
1. 2013年7月6日~8日某市重点中学在高一进行了期末统一考试,为了了解一年级1000名学生的考试成绩,从中随机抽取了100名学生的成绩单,下面说法正确的是( ) A.1000名学生是总体
B.每个学生是个体
C.1000名学生的成绩是一个个体
D.样本的容量是100
答案:D
解析:1000名学生的成绩是统计中的总体,每个学生的成绩是个体,被抽取的100名学生的成绩是一个样本,其样本的容量是100.
2. 某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点,公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务等情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是( ) A.分层抽样法,系统抽样法
B.分层抽样法,简单随机抽样法
C.系统抽样法,分层抽样法
D.简单随机抽样法,分层抽样法
答案:B
解析:对于调查①,各个地区之间的销售点差异较大,宜用分层抽样法;对于调查②,总体容量较小,宜用简单随机抽样法.故应选B.
3.某单位共有老、中、青职工430人,其中有青年职工160人,中年职工人数是老年职工人数的2倍.为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本的老年职工抽取人数为( )
A.9 B.18
C.27 D.36
答案:B
解析:设老年职工人数为x人,中年职工人数为2x,所以160+x+2x=430,得x=90.
由题意老年职工抽取人数为90×32
160
=18(人).
4.用系统抽样法(按等距离的规则),要从160名学生中抽取容量为20的样本,将160
名学生从1~160编号.按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组应抽出的号码为125,则第一组中按抽签方法确定的号码是( ) A.7 B.5
C.4 D.3
答案:B
解析:设第一组确定的号码是x,则x+(16-1)×8=125,解得x=5.
5.从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是( )
A. 5,10,15,20,25
B. 3,13,23,33,43
C. 1,2,3,4,5
D. 2,4,6,16,32
答案:B
解析:间隔距离为10,故可能编号是3,13,23,33,43.。