高中数学 1.2.2分层抽样和系统抽样一 北师大版必修3
- 格式:ppt
- 大小:199.50 KB
- 文档页数:23
第一章 统计2.2分层抽样和系统抽样一 分层抽样1。
基本概念:(1)将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中随机抽取一定的样本,这种抽样方法就叫作分层抽样,有时也称作类型抽样.(2)在每个层中进行抽样时,大多数情况下采用简单随机抽样,有时也会用到其他的抽样方法,这要根据问题的需要来决定.2.分层抽样的操作步骤是:第一步,将总体按适当的标准进行分层; 第二步,计算出抽样比总体容量样本容量=k ; 第三步,按抽样比确定每层需要抽取的个体数;第四步,各层分别进行抽样;第五步,汇合成样本.例如,一个单位的职工有500人,其中不到35岁的有125人,35岁∽49岁的有280人,50岁以上的有95人,为了了解这个单位职工与身体状况有关的某项指标,要从中抽出一个容量为100的样本,由于职工年龄与这项指标有关,决定采用分层抽样的方法进行抽取.因为样本容量与总体的个体数的比为100∶500=1∶5,所以在各年龄段抽取的个体数依次是:5125 ,5280,595,即25,56,19. 在各年龄段分别抽取时,可采用前面介绍的简单随机抽样,将各年龄段抽取的个体合在一起,就是所要抽取的样本.不难看出,由于各部分抽取的个体数与这一部分个体数的比等于样本容量与总体的个体数的比,分层抽样时,每一个个体被抽到的概率都是相等的.3.分层抽样具有以下特点:(1)适用于总体由差异明显的部分组成情况;(2)在每一层进行抽样时,可以根据个体情况采用不同的抽样方法.(3)它能够充分利用已掌握的信息,使样本具有良好的抽样;(4)它也是等概率抽样,分层抽样是等概率抽样,它也是公平的.用分层抽样从个体数为N 的总体中抽取一个容量为n 的样本时,在整个抽样过程中每个个体被抽到的概率相等,都等于Nn . 二 系统抽样1。
基本概念(1)系统抽样是将总本的个体进行编号,按简单随机抽样抽取第一个样本,然后按相同的间隔(称为抽样距)抽取其他样本.这种抽样方法有时也叫等距抽样或机械抽样.(2)在抽样时,如果总体的排列存在明显的周期性或者事先是排好序的,那么利用系统抽样时将会产生明显的偏差,因为这样抽取的样本不具有代表性.2.系统抽样的步骤:一般地,假设要从容量为N 的总体中抽取容量为n 的样本,可以按下列步骤进行系统抽样: 第一步,采用随机的方式将总体的N 个个体编号.有时可直接利用个体自身所带的号码,如学号,准考证号,门牌号等;第二步,确定分段间隔k 对将整个的编号分段(即分成几个部分).当n N 是整数时,取n N k =;当nN 不是整数时,则先通过从总体中用简单随机抽样剔除一些个体使剩下的总体中个体的个数能被n 整除,即][nN k =. 第三步,在第一段用简单随机抽样确定一个个体编号)(k m m ≤;第四步,按照事先确定的规则抽取样本,通常是将m 加上间隔k ,得到第2个个体编号为(k m +),再加上间隔k 得到第3个个体编号(k m 2+),这样继续下去,直到获取整个样本.例如,为了了解参加某种知识竞赛的1000名学生的成绩,打算从中抽取一个容量为50的样本.假定这1000名学生的编号1,2,…,1000.由于50∶1000=1∶20,我们将总体均分成50个部分,其中每一部分包括20个个体,例如第1部分的个体的编号是1,2,…,20.然后在第1部分随机抽取一个号码,比如它是第18号,那么可以从第18号起,每隔20个抽取一个号码,这样得到一个容量为50的样本 18,38,58,…,978,998.再如,上面的参加某种知识竞赛的学生为1003名,假定这1003名生的编号1,2,…,1000,1001,1002,1003,应从总体中剔除3个个体(可用随机数表法),将剩余的1000名学生重新编号,后再按上例抽样.3.系统抽样的特点:(1)适用于总体容量较大的情况;(2)剔除多余个体及第一段抽样都用简单随机抽样,因而与简单随机抽样有密切联系;(3)是等概率抽样,每个个体被抽到的概率都是Nn . 简单随机抽样、系统抽样、分层抽样的异同点例1 某校有在校高中生900人,其中高一学生300人,高二学生200人,高三学生400人,用分层抽样法抽取一个容量为45的样本,那么高一、高二、高三各年级的抽取人数分别是( )A .15,5,25B .15,15,15C .10,5,30D .15,10,20解:因为20190045=,所以高一、高二、高三各年级的抽取人数分别是 15300201=⨯,10200201=⨯,20400201=⨯, 即应从高一、高二、高三各年级分别抽取15人,10人和20人,组成一个容量为45的样本.故选D .例2 下列抽样实验中,最适宜用系统抽样法的是( ).A .某市的4个区共有2000名学生,且4个区的学生人数之比为3∶2∶8∶2,从中抽取200人入样.B .某厂生产的2000个电子元件中随机抽取5个入样.C .从某厂生产的2000个电子元件中随机抽取200个入样.D .从某厂生产的20个电子元件中随机抽取5个入样.解:A 中总体有明显层次,不适用系统抽样法;B 中样本容量很小,适宜用简单随机抽样法中的随机数表法;D 中总体数很小,故适宜用抽签法.而C 比较符合适用系统抽样法.综上,可知选C .例3某校有在校高中生共1 600人,其中高一学生520人,高二学生500人,高三学生580人.如果想通过抽查其中的80人,来调查学生的消费情况,考虑到学生的年级高低消费情况有明显差别,而同一年级内消费情况差异较少,问应采用怎样的抽样方法?高三学生中应抽查多少人?解:因不同年级的学生消费情况有明显差别,所以应采用分层抽样.因为520:500:580=26:25:29,于是将80分成26:25:29的三部分,设三部分各抽个体数分别为26x ,25x ,29x ,由26x +25x +29x =80得x =1,所以高三学生中应抽查29人.例4为了了解某地区今年高一学生期中考试数学学科的成绩,拟从参加考试的25000名学生的数学成绩中,抽取容量为250的样本.请你选择恰当的抽样方法,设计抽样过程.规范解:注意到总体数和样本容量较大,且所有个体没有明显差异,故应采用系统抽样.按系统抽样的要求应先划分分段间隔,由于10025025000==k ,所以可按以下四步抽取样本: (1)对全体学生的数学成绩进行编号:1,2,3, (25000)(2)分段:由于样本容量与总体容量的比是1∶100,所以我们可将总体平均分为250个部分,其中每一部分包括100个个体.(3)在第一部分,即1到100号用简单随机抽样,抽取一个号码,如78.(4)以78作为起始数,然后顺次抽取178,且无明显差异时,宜采用系统抽样.点评:系统抽样方法的操作步骤是:编号——分段——确定起始号码——加间隔获取各段号码——获取样本.特别注意分段间隔,当总体容量能被样本容量整除时,分段间隔nN k =,使用系统抽样抽取样本时,通常是将起始数s 加上间隔k 得到第二个个体编号(s+k ),再加k 得到第三个个体编号(s+2k ),依次进行下去,直到获取整个样本.例5 为了了解某大学一年级新生英语学习的情况,拟从503名大学一年级学生中抽取50名作为样本,如何采用系统抽样方法完成这一抽样?解:第一步,将503名学生用随机方式编号为1,2,3, (503)第二步,用抽签法或随机数表法,剔除3个个体,这样剩下500名学生,对剩下的500名学生重新编号,或采用补齐号码的方式.第三步,确定分段间隔k ,将总体分为50个部分,每一部分包括10个个体,这时,每1部分的个体编号为1,2,...,10;第2部分的个体编号为11,12,...,20;依此类推,第50部分的个体编号为491,492, (500)第四步,在第1部分用简单随机抽样确定起始的个体编号,例如是5.第五步,依次在第2部分,第3部分,…,第50部分,取出号码为15,25,…,495这样得到一个容量为50的样本.例6(2006年四川卷)甲校有3 600名学生,乙校有5 400名学生,丙校有1 800名学生,为统计三校学生某方面的情况,计划采用分层抽样法,抽取一个容量为90人的样本,应在这三校分别抽取学生(A )30人,30人,30人 (B )30人,30人,15人(C )20人,30人,10人 (D )30人,50人,10人解:甲校有3 600名学生,乙校有5 400名学生,丙校有1 800名学生,为统计三校学生某方面的情况,计划采用分层抽样法,抽取一个容量为90人的样本,应在这三校分别抽取学生30人,30人,15人,选B .练习:1.某地区有300家商店,其中大型商店有30家 ,中型商店有75家,小型商店有195家.为了掌握各商店的营业情况,要从中抽取一个容量为20的样本.若采用分层抽样的方法,抽取的中型商店数是A . 2B . 3C . 5D . 132.(2007年浙江卷,文13)某校有学生2000人,其中高三学生500人,为了解学生的身体素质情况,彩用按年级分层抽样的方法,从该校学生中抽取一个200人的样本,则样本中高三学生的人数为 .3.某学校有职工140人,其中教师91人,教辅行政人员28人,总务后勤人员21人. 为了解职工的某种情况,要从中抽取一个容量为20的样本.以下的抽样方法中,依简单随机抽样、系统抽样、分层抽样顺序的是 ( )方法1:将140人从1~140编号,然后制作出有编号1~140的140个形状、大小相同的号签,并将号签放人同一箱子里进行均匀搅拌,然后从中抽取20个号签,编号与签号相同的20个人被选出;方法2:将140人分成20组,每组7人,并将每组7人按1—7编号,在第一组采用抽签法抽出k号(1≤k≤7),则其余各组尾号也被抽到,20个人被选出;方法3:按20:140=1:7的比例,从教师中抽取13人,从教辅行政人员中抽取4人,从总务后勤人员中抽取3人.从各类人员中抽取所需人员时,均采用随机数表法,可抽到20个人.A.方法2,方法1,方法3 B.方法2,方法3,方法1C.方法1,方法2,方法3 D.方法3,方法1,方法24.从某厂生产的802辆家用轿车中随机抽取80辆测试某项性能.请合理选择抽样方法进行抽样,并写出抽样过程.5.一个单位有500名职工,其中不到35岁的有125人,35岁~49岁的有280人,50岁以上的有95人.为了了解这个单位职工与身体状况有关的某项指标,如何从中抽取一个容量为100的样本?。
2.2 分层抽样与系统抽样考纲定位重难突破1.理解、掌握分层抽样、系统抽样.2.会用分层抽样、系统抽样从总体中抽取样本.3.了解三种抽样方法的联系与区别.重点:两种抽样方法的步骤和使用范围.难点:1.三种抽样方法的选择.2.两种抽样方法的具体应用.授课提示:对应学生用书第05页[自主梳理]1.分层抽样将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的样本.这种抽样方法通常叫作分层抽样,有时也称为类型抽样.2.系统抽样系统抽样是将总体的个体进行编号,等距分组,在第一组中按照简单随机抽样抽取第一个样本.然后按相同间隔(称为抽样距)抽取其他样本.这种抽样方法有时也叫等距抽样或机械抽样.[双基自测]1.某市为了了解职工家庭生活状况,先把职工按所从事的行业分为8类(每类家庭数不完全相同),再对每个行业抽取的职工家庭进行调查,这种抽样方法是()A.简单随机抽样B.系统抽样C.分层抽样D.不属于以上几类抽样解析:因为职工所从事的行业有明显差异,所以适合用分层抽样.答案:C2.某报告厅有50排座位,每排有60个座号,一次报告会坐满了听众,会后留下座位号为18,78,138,198,…的50位听众进行座谈,这种抽取样本的方法是()A.抽签法B.随机数表法C.系统抽样D.有放回抽样解析:总体容量(3 000)较大,抽取间隔相等,符合系统抽样的特点,是系统抽样.答案:C3.若总体中含有1 645个个体,采用系统抽样的方法从中抽取容量为35的样本,则编号后确定编号分为______段,分段间隔k=______,每段有______个个体.解析:因为N=1 645,n=35,则编号后确定编号分为35段,且k=Nn=1 64535=47,则分段间隔k=47,每段有47个个体.答案:354747授课提示:对应学生用书第06页探究一分层抽样[典例1] 某政府机关现有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人,上级机关为了了解政府机构改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,并写出具体实施过程.[解析] 因为机构改革关系到各种人的不同利益,故采用分层抽样方法为妥.(1)因为每个人的地位不一样,我们按类别分为3层.(2)计算总体的个数与样本容量的比:10020=5. (3)按照样本容量的比例随机抽取各层应抽取的样本.因为10020=5,所以105=2,705=14,205=4.所以从副处级以上干部中抽取2人,从一般干部中抽取14人,从工人中抽取4人.(4)因副处以上干部与工人人数较少,他们分别按1~10编号与1~20编号,然后采用抽签法分别抽取2人和4人,对一般干部70人采用00,01,02,…,69编号,然后用随机数法抽取14人.1.如果总体中的个体有差异时,就用分层抽样抽取样本.用分层抽样抽取样本时,要把性质、结构相同的个体,组成一层.2.在实际操作中,应先计算出抽样比k =样本容量总体容量,获得各层入样数的百分比,再按抽样比确定每层需要抽取的个体数:抽样比×该层个体数目=样本容量总体容量×该层个体数目.1.某电视台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为12 000很喜爱 喜爱 一般 不喜爱2 435 4 5673 926 1 072应怎样进行抽样?解析:采用分层抽样的方法,抽样比为6012 000. “很喜爱”的有2 435人,应抽取2 435×6012 000≈12(人); “喜爱”的有4 567人,应抽取4 567×6012 000≈23(人); “一般”的有3 926人,应抽取3 926×6012 000≈20(人); “不喜爱”的有1 072人,应抽取1 072×6012 000≈5(人). 因此,采用分层抽样的方法在“很喜爱”、“喜爱”、“一般”和“不喜爱”的人中分别抽取12人、23人、20人和5人.探究二 系统抽样[典例2] 某单位共有在岗职工624人,为了调查职工上班时从离开家到来到单位的平均用时,决定抽取10%的工人进行调查,如何采用系统抽样完成这一抽样?[解析] 第一步 由题意知,应抽取在岗职工62人作为样本,即分成62组,由于62462的商是10,余数是4,所以每组有10人,还剩4人.这时,抽样距是10;第二步用随机数法从这些职工中抽取4人,不进行调查;第三步将余下的在岗职工620人进行编号,编号分别为000,001,002, (619)第四步在第一组000,001,002,…,009这10个编号中,随机选定一个起始编号.每间隔10抽取一个编号,共抽62个编号,这样就抽取了容量为62的一个样本.1.解决系统抽样问题的关键步骤:(1)分组的方法应依据抽取比例而定,即根据定义每组抽取一个样本.(2)起始编号的确定应用随机抽样的方法,一旦起始编号确定,其他编号便随之确定了.2.当总体容量不能被样本容量整除时,可以先从总体中随机剔除几个个体.但要注意的是剔除过程必须是随机的,也就是总体中的每个个体被剔除的机会均等,剔除几个个体后使总体中剩余的个体数能被样本容量整除.2.为了了解参加某种知识竞赛的1 003名学生的成绩,抽取一个容量为50的样本,选用什么抽样方法比较恰当?简述抽样过程.解析:适宜选用系统抽样,抽样过程如下:(1)随机地将这1 003个个体编号为1,2,3,…,1 003.(2)利用简单随机抽样,先从总体中随机剔除3个个体,剩下的个体数1 000能被样本容量50整除,然后将1 000个个体重新编号为1,2,3,…,1 000.(3)将总体按编号顺序均分成50部分,每部分包含20个个体.(4)在编号为1,2,3,…,20的第一部分个体中,利用简单随机抽样抽取一个号码,比如抽取的号码是18.(5)以18为起始号码,这样得到一个容量为50的样本:18,38,58,…,978,998.探究三三种抽样方法的综合应用[典例3]已知某工厂共有20个生产车间,并且每个生产车间内的工人已经按随机方式编好了序号,假定该厂每车间工人数都相同.为了考查工人对技术水平的熟练程度,采取以下三种方式进行抽查:①从全厂20个车间中任意抽取一个车间,再从该车间中任意抽取20人,考查这20个工人的技术水平.②每个车间都抽取1人,共计20人,考查这20个工人的技术水平.③把工人按技术等级分成高级工、一级工、初级工三个级别,从中抽取100名工人进行调查(已知按技术等级分,该厂工人中高级工共150人,一级工共600人,初级工共250人).根据上面的叙述,试回答下列问题:(1)上面三种抽取方式中,各自采用何种抽取样本的方法?(2)试分别写出上面三种抽取方式各自抽取样本的步骤.[解析](1)上面三种抽取方式中,第一种方式采用的是简单随机抽样法;第二种方式采用的是系统抽样法和简单随机抽样法;第三种方式采用的是分层抽样法和简单随机抽样法.(2)第一种方式抽样的步骤如下:第一步,在这20个车间中用抽签法任意抽取一个车间.第二步,从这个车间中按编号用随机数法或抽签法抽取20名工人,考查其技术水平.第二种方式抽样的步骤如下:第一步,在第一个车间中,用简单随机抽样法任意抽取某一工人,记其编号为x.第二步,在其余的19个车间中,选取编号为x 的工人,共计20人.第三种方式抽样的步骤如下:第一步,分层,因为若按技术水平等级分,其中高级工共150人,一级工共600人,初级工共250人,所以在抽取样本中,应该把全体工人分成三个层次.第二步,确定各个层次抽取的人数,因为样本容量与总体的个数比为100∶1 000=1∶10,所以在每个层次抽取的个体数依次为15010,60010,25010,即15,60,25. 第三步,按层次分别抽取:在高级工中用简单随机抽样法取15人;在一级工中用简单随机抽样法抽取60人;在初级工中用简单随机抽样法抽取25人.解决此类问题的关键是灵活运用统计中的一些基本概念和基本方法,对照简单随机抽样、系统抽样、分层抽样的概念得出抽样过程.三种抽样方法有各自的适用范围,在抽样时要分析实际情况,抓住总体的本质特点,灵活选择合适的方法,有时要综合运用几种不同的抽样方法.三种抽样方法,关系密切,对抽取样本来说,可谓异曲同工.3.为了考察某校的教学水平,对这个学校高三年级的部分学生的本年度考试成绩进行考察.为了全面地反映实际情况,采取以下三种方式进行抽查(已知该校高三年级共有20个教学班,并且每个班内的学生已经按随机方式编好了学号,假定该校每班学生人数都相等):①从全年级20个班中任意抽取一个班,再从该班任意抽取20名学生,考察他们的学习成绩; ②每个班都抽取1人,共计20人,考察这20名学生的成绩;③把学生成绩分成优秀、良好、普通三个级别.从其中共抽取100名学生进行考察.(已知该校高三学生共1 000人,若按成绩分,其中优秀生共150人,良好生共600人,普通生共250人).根据上面的叙述,试回答下列问题:(1)上面三种抽取方式的总体、个体、样本分别是什么?每一种抽取方式抽取的样本中,样本容量分别是多少?(2)上面三种抽取方式各自采用的是何种抽取样本的方法?(3)试分别写出上面三种抽取方式各自抽取样本的步骤.解析:(1)上面三种抽取方式中,总体都是高三全体学生本学年的考试成绩,个体都是指高三年级每个学生本学年的考试成绩.其中第一种抽取方式中样本为所抽取的20名学生本学年的考试成绩,样本容量为20;第二种抽取方式中样本为所抽取的20名学生本学年的考试成绩,样本容量为20; 第三种抽取方式中样本为所抽取的100名学生本学年的考试成绩,样本容量为100.(2)上面三种抽取方式中,第一种方式采用的是简单随机抽样;第二种方式采用的是系统抽样和简单随机抽样;第三种方式采用的是分层抽样和系统抽样.(3)第一种方式抽样的步骤如下:第一步,在这20个班中用抽签法任意抽取1个班;第二步,从这个班中用简单随机抽样法抽取20名学生,考察其考试成绩.第二种方式抽样的步骤如下:第一步,在第1个班中,用简单随机抽样法抽取某一学生(其学号为a ).第二步,在其余的19个班中,选取学号为a 的学生,共计20人.第三种方式抽样的步骤如下:第一步,分层,因为若按成绩分,其中优秀生共150人,良好生共600人,普通生共250人,所以在抽取样本时,应把全体学生分成三层.第二步,确定各层抽取的人数,因为样本容量与总体的个体数的比为100∶1 000=1∶10,所以在每层抽取的个体数依次为15010,60010,25010,即15,60,25. 第三步,按层次分别抽取,分别在优秀生、良好生、普通生中用系统抽样的方法各抽取15人、60人、25人.因选取抽样方法不当致误[典例] 某校共有教师302名,其中老年教师30名,中年教师150名,青年教师122名.为调查他们对新课程改革的看法,从中抽取一个60人的样本.请写出抽样过程.[解析] (1)把122名青年教师编号,利用随机数法剔除2个个体.(2)因为60300=15,30×15=6,150×15=30,120×15=24,所以可将老年教师30名,中年教师150名,青年教师120名编号后,运用随机数法,分别从中抽取6,30,24个个体,合在一起即为要抽取的60人样本.[错因与防范] 本题的一种错误解法是从总人数中,利用随机数法剔除2个个体,再将剩余的300名教师重新编号,分成60段.从每段抽一人,共抽取60人,以上抽样方法对该问题抽取的样本代表性不强,因3个层次的教师对新课程改革的看法是有较大差别的,因此应采用分层抽样,又因为教师总人数和青年教师人数均不能被60整除,此时就需先从青年教师中剔除2个个体,再进行抽样.[随堂训练] 对应学生用书第07页1.某社区有400个家庭,其中高等收入家庭120个,中等收入家庭180个,低等收入家庭100个.为了调查社会购买力的某项指标,要从中抽取一个容量为100的样本,记作①.某校高一年级有13名排球运动员,要从中选出3人调查学习负担情况,记作②.那么,完成上述两项调查宜采用的抽样方法分别是( )A .①用简单随机抽样,②用系统抽样B .①用分层抽样,②用简单随机抽样C .①用系统抽样,②用分层抽样D .①用分层抽样,②用系统抽样解析:由于①中总体的个体数量较多,不同个体的差异较大,∴应采用分层抽样方法;由于②中总体的个体数量较少,个体之间差异不大,∴应采用简单随机抽样,故选B.答案:B2.某厂从50件产品中,依次抽取到编号为4,8,12,16,20,24,28,32,36,40,44,48的产品进行质检,这种抽样方法最有可能是( )A .随机数法B .抽签法C .系统抽样D .以上都不是解析:系统抽样的显著特点是抽出个体的编号是等距的.答案:C3.某市有大型超市200家、中型超市400家、小型超市1 400家,为掌握各类超市的营业情况,现按分层抽样方法抽取一个容量为100的样本,应抽取中型超市________家.解析:根据题意,可得抽样比为100200+400+1400=120,故应抽取中型超市400×120=20(家).答案:204.某企业三月中旬生产A ,B ,C 三种产品共3 000件,根据分层抽样的结果,企业统计员制作了如下的统计表格:由于不小心,表格中A ,C A 产品的数量比样本中C 产品的数量多10,根据以上信息,求该企业生产C 产品的数量.解析:设样本的容量为x ,则x 3 000×1 300=130, ∴x =300.∴在样本中A 产品和C 产品共有300-130=170(件).设样本中C 产品数量为y ,则y +y +10=170,∴y =80.∴该企业生产C 产品的数量为3 000300×80=800.。
1.2.2分层抽样与系统抽样 本节教材分析一、三维目标1、知识与技能:(1)正确理解系统抽样和分层抽样的概念;(2)掌握系统抽样和分层抽样的一般步骤;(3)区分简单随机抽样、系统抽样和分层抽样,并选择适当正确的方法进行抽样.2、过程与方法通过对实际问题的探究,归纳应用数学知识解决实际问题的方法,理解分类讨论的数学方法.3、情感态度与价值观通过数学活动,感受数学对实际生活的需要,体会现实世界和数学知识的联系.二、教学重点:正确理解系统抽样和分层抽样的概念,能够灵活应用系统抽样和分层抽样的方法解决统计问题.三、教学难点:三种抽样方法的区别和联系.四、教学建议对于分层抽样,教科书也是从一个现实问题展开,目的是让学生理解分层抽样在现实情况中的应用,以及学习分层抽样的必要性.教科书在给出两个例子的同时,分析了分层抽样与简单随机抽样之间的关系.系统抽样是针对大量的总体时,经常采用的一种机械的抽样方法.因此,有时也称系统抽样为机械抽样.系统抽样最大的优点是简单、易操作,在日常生活中应用非常广泛.教科书所给出的两个例子,进一步分析和总结了系统抽样的一般步骤.值得注意的是在教学过程中,适当介绍当nN 不是整数时,应如何实施系统抽样. 新课导入设计导入一某中学有5 000名学生,打算抽取200名各年级的学生,调查他们对奥运会的看法,采用简单随机抽样时,无论是抽签法还是随机数法,实施过程很复杂,需要大量的人力和物力,那么有没有更为方便可行的抽样方法呢?这就是今天我们学习的内容:系统抽样和分层抽样.导入二在1936年美国总统选举前,一份颇有名气的杂志(Literary Digest)的工作人员做了一次民意测验.调查兰顿(A .Landon)(当时任堪萨斯州州长)和罗斯福(F .D .Roosevelt)(当时的总统)中谁将当选下一届总统.为了了解公众意向,调查者通过电话簿和车辆登记簿上的名单给一大批人发了调查表(注意在1936年电话和汽车只有少数富人拥有).通过分析收回的调查表,显示兰顿非常受欢迎,于是此杂志预测兰顿将在选举中获胜.实际选举结果正好相反,最后罗斯福在选举中获胜,其数据如下:预测结果出错的原因是:在民意测验的过程中,即抽取样本时,抽取的样本不具有代表性.1936年拥有电话和汽车的美国人只是一小部分,那时大部分人还很穷.其调查的结果只是富人的意见,不能代表穷人的意见.由此可以看出,抽取样本时,要使抽取出的样本具有代表性,否则调查的结果与实际相差较大.今天我们就来学习抽样方法就是用来避免出现以上的错误的——系统抽样和分层抽样.教学过程:一、复习准备:1. 提问:简单随机抽样应注意几点?有哪几种方法?每种方法的优点和缺点是什么?2. 分别用两种方法设计从本班学生53人中抽取5人进行调查的抽样方案.3. 引入:当个体的数量较多的时候,为了使个体的被抽中的机会均等,要用随机数法. 可是数量太多,编号的工作量又太大,也很难搅拌均匀. 面对这种情况,我们今天来学一种新的抽样方法——系统抽样.二、讲授新课:1、教学系统抽样的概念及步骤:①系统抽样概念:当总体中的个体数较多时,将总体的每个个体进行编号,并根据样本数对编号进行分段,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需样本的抽样方法.②进行系统抽样的步骤:(1)先将总体的N个个体编号. 有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等;(2)确定分段间隔k,对编号进行分段.当N/n(n是样本容量)是整数时,取k=N/n;(3)在第一段用简单随机抽样确定第一个个体编号l(l≤k);(4)按照一定的规则抽取样本. 通常是将l加上间隔k得到第2个个体编号(l+k),再加得到第3个个体编号(l+2k),依次进行下去,直到获取整个样本.③注意:分段间隔k的确定. 当总体个数N恰好是样本容量n的整数倍时,取Nkn;若Nn不是整数时,可以先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量n整除. 每个个体被剔除的机会相等,从而使整个抽样过程中每个个体被抽取的机会仍然相等.2、教学例题:①出示例:我校为了了解高一年级学生对教师教学的意见,打算从高一年级的500名学生中抽取50名进行调查. 用系统抽样的方法,你怎样进行操作呢?解:第一步,编号,给500名同学编号.(注意和随机数法不同,500人、编号不一定是三位数. 如1,2,3. . . ) ;第二步,分段,确定分段间隔k=500/50=10.(把500人分成了10段);第三步,确定起始号,在第一段1~10里随机的选一个数(抽签法)比如6;第四步,抽取样本,每隔10个号码抽取一个,要选的50个数的编号是6、16、26、36、46. . . . . . . . . 496(如果第三步选的是10,则他们的编号是10、20、30. . . . 500)②思考:当第二步的k不是整数的时候怎么办呢?例题变式502人. (先随机剔除几个个体)③练习:在2003名同学间选出100人进行有关视力的问卷调查,你怎样选取样本呢?分析:我们知道2003/100不是整数,这时我们就要随机的选出3名同学(用什么方法?)然后再重新进行编号,步骤就和能整除的时候一样了.3、小结:由同学来总结系统抽样有那些优点和缺点. (优点:可以利用个体自身的编号,对数量较多的个体操作比较便捷. 缺点:当对总体情况不是很了解的情况下,样本的代表性较差. )注意:在使用抽样方法时,总体的数量较多,但必须要对总体有个大概了解的前提下.三、巩固练习:见课时训练。
高中数学学习材料唐玲出品2.2分层抽样与系统抽样[读教材·填要点]1.分层抽样的概念将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的样本.这种抽样方法通常叫作分层抽样,有时也称为类型抽样.2.系统抽样的概念系统抽样是将总体的个体进行编号,按照简单随机抽样抽取第一个样本,然后按相同的间隔(称为抽样距)抽取其他样本.系统抽样又叫等距抽样或机械抽样.[小问题·大思维]1.分层抽样时为什么要将总体分成互不重叠的层?提示:在总体中由于个体之间存在着明显的差异,为了使抽取的样本更合理,更具有代表性,所以将总体分成互不重叠的层,而后独立地抽取一定数量的个体.2.系统抽样的第二步中,当Nn不是整数时,从总体中剔除一些个体采用的方法是什么?影响系统抽样的公平性吗?提示:剔除一些个体可以用简单随机抽样抽取,不影响系统抽样的公平性.[研一题][例1]某企业共有3 200名职工,其中青、中、老年职工的比例为3∶5∶2.若从所有职工中抽取一个容量为400的样本,则采用哪种抽样方法更合理?青、中、老年职工应分别抽取多少人?每人被抽到的可能性相同吗?[自主解答] 因为总体由差异明显的三部分(青、中、老年)组成,所以采用分层抽样的方法更合理.因为青、中、老年职工的比例是3∶5∶2,所以应分别抽取:青年职工400×310=120(人);中年职工400×510=200(人); 老年职工400×210=80(人). 由样本容量为400,总体容量为3 200可知,抽样比是4003 200=18,所以每人被抽到的可能性相同,均为18. [悟一法]分层抽样的步骤:(1)根据已经掌握的信息,将总体分成互不重叠的层;(2)根据总体中的个体数N 和样本容量n 计算抽样比 k =n N; (3)确定第i 层应该抽取的个体数目n i =N i ×k (N i 为第i 层所包含的个体数),使得各n i 之和为n ;(4)在各层中,按步骤(3)中确定的数目在各层中随机地抽取个体,合在一起得到容量为n 的样本.[通一类]1.某城市有210家百货商店,其中大型商店20家,中型商店40家,小型商店150家.为了掌握各商店的营业情况,计划抽取一个容量为21的样本,按照分层抽样方法抽取时,各种百货商店分别要抽取多少家?写出抽样过程.解:第一步:样本容量与总体容量的比为21210=110;第二步:确定各种商店要抽取的数目:大型商店:20×110=2(家),中型商店:40×110=4(家),小型商店:150×110=15(家);第三步:采用简单随机抽样在各层中分别抽取大型商店2家,中型商店4家,小型商店15家,综合每层抽样即得样本.[研一题][例2] 相关部门对某食品厂生产的303盒月饼进行质量检验,需要从中抽取10盒,请用系统抽样法完成对此样本的抽取.[自主解答] 第一步 将303盒月饼用随机的方式编号.第二步 从总体中剔除3盒月饼,将剩下的300盒月饼重新编号(分别为000,001,…,299),并分成10段.第三步 在第一段中用简单随机抽样抽取起始号码l .第四步 将编号为l ,l +30,l +2×30,…,l +9×30的个体取出,组成样本.[悟一法]1.当总体容量能被样本容量整除时,分段间隔k =N n;当用系统抽样抽取样本时,通常是将起始数s 加上间隔k 得到第2个个体编号(s +k ),再加k 得到第3个个体编号(s +2k ),依次进行下去,直到获得整个样本.2.当总体容量不能被样本容量整除时,可以先从总体中随机剔除几个个体,但要注意的是剔除过程必须是随机的,也就是总体中的每个个体被剔除的机会均等,剔除几个个体后使总体中剩余的个体能被样本容量整除,然后再按系统抽样方法抽取样本.[通一类]2.为了了解某地区今年高一学生期末考试数学学科的成绩,拟从参加考试的15 000名学生的数学成绩中抽取容量为150的样本.请用系统抽样写出抽取过程.解析:(1)对全体学生的数学成绩进行编号:1,2,3,…,15 000.(2)分段:由于样本容量与总体容量的比是1∶100,所以我们将总体平均分为150个部分,其中每一部分包含100个个体.(3)在第一部分即1号到100号用简单随机抽样抽取一个号码,比如是56.(4)以56作为起始数,然后依次抽取156,256,356,…,14 956,这样就得到容量为150的一个样本.[研一题][例3] 选择恰当的抽样方法,并写出抽样过程.(1)有30个篮球,其中,甲厂生产的有21个,乙厂生产的有9个,现抽取10个作样品;(2)有甲厂生产的30个篮球,其中一箱21个,另一箱9个,现取出3个作样品;(3)有甲厂生产的300个篮球,抽取10个作样品;(4)有甲厂生产的300个篮球,从中抽取30个作样品.[自主解答] (1)因总体是由差异明显的几部分构成,可采用分层抽样的方法抽取.第一步 确定抽取个数.因为1030=13,所以甲厂生产的应抽取21×13=7(个),乙厂生产的应抽取9×13=3(个); 第二步 用抽签法分别抽取甲厂生产的篮球7个,乙厂生产的篮球3个.这些篮球便组成了我们要抽取的样本.(2)总体容量较小,用抽签法.第一步 将30个篮球编号,编号为00,01, (29)第二步将以上30个编号分别写在一张小纸条上,揉成小球,制成号签;第三步把号签放入一个不透明的袋子中,充分搅匀;第四步从袋子中逐个抽取3个号签,并记录上面的号码;第五步找出与所得号码对应的篮球.(3)总体容量较大,样本容量较小,适宜用随机数法.第一步将300个篮球用随机方式编号,编号为001,002, (300)第二步在随机数表中随机的确定一个数作为开始,如第3行第5列的数“3”开始.任选一个方向作为读数方向,比如向右读;第三步从数“3”开始向右读,每次读三位,凡不在001~300中的数跳过去不读,遇到已经读过的数也跳过去不读,便可依次得到241,242,232,283,039,101,158,272,266,166这10个号码,这就是所要抽取的10个样本个体的号码.(4)总体容量较大,样本容量也较大,适宜用系统抽样法.第一步将300个篮球用随机方式编号,编号为000,001,002,…,299,并分成30段;第二步在第一段000,001,002,…,009这十个编号中用简单随机抽样抽出一个(如002)作为起始号码;第三步将编号为002,012,022,…,292的个体抽出,组成样本.[悟一法]1.三种抽样的适用范围不同,各自的特点也不同,但各种方法间又有密切联系.在应用时要根据实际情况选取合适的方法.2.三种抽样中每个个体被抽到的可能性都是相同的.[通一类]3.某社区有700户家庭,其中高收入家庭225户,中等收入家庭400户,低收入家庭75户.为了调查社会购买力的某项指标,要从中抽取一个容量为100户的样本,记作①;某中学高二年级有12名篮球运动员,要从中选出3人调查投篮命中率情况,记作②;从某厂生产的802辆轿车中抽取40辆测试某项性能,记作③.为完成上述三项抽样,则应采取的抽样方法是()A.①简单随机抽样,②系统抽样,③分层抽样B.①分层抽样,②简单随机抽样,③系统抽样C.①简单随机抽样,②分层抽样,③系统抽样D.①分层抽样,②系统抽样,③简单随机抽样解析:对于①,总体由高收入家庭、中等收入家庭和低收入家庭差异明显的三部分组成,而所调查的指标与收入情况密切相关,所以应采用分层抽样;对于②,总体中的个体数较少,而且所调查内容对12名调查对象是平等的,应采用简单随机抽样;对于③,总体中的个体数较多,且个体之间差异不明显,样本中个体数也较多,应采用系统抽样.答案:B一个单位有职工160人,其中有业务人员112人,管理人员16人,后勤服务人员32人,为了了解职工的某种情况,要从中抽取一个容量为20的样本,试确定业务人员、管理人员、后勤服务人员各抽取的人数是多少?[解] 法一:三部分所含个体数之比为112∶16∶32=7∶1∶2,设三部分各抽个体数为7x ,x,2x ,则由7x +x +2x =20得x =2.故业务人员、管理人员、后勤服务人员抽取的个体数分别为14,2和4.法二:由160÷20=8,所以可在各层人员中按8∶1的比例抽取,又因为112÷8=14,16÷8=2,32÷8=4,所以业务人员14人,管理人员2人,后勤服务人员4人.法三:因为共有职工160人,所抽取的人数为20,所以样本容量与总体容量之比为20160=18, 则业务人员应抽取112×18=14人,管理人员应抽16×18=2人,后勤服务人员应抽32×18=4人.1.简单随机抽样、系统抽样、分层抽样之间的共同点是( )A .都是从总体中逐个抽取B .将总体分成几部分,按事先确定的规则在各部分中抽取C .抽样过程中每个个体被抽取的机会相同D .将总体分成几层,分层进行抽取解析:简单随机抽样、系统抽样、分层抽样的共同点是:在抽样过程中每个个体被抽取的概率是相同的.答案:C2.某市场想通过检查发票及销售记录的2%来快速估计每月的销量总额.采取如下方法:从某本发票的存根中随机抽一张,如15号,然后按顺序往后将65号, 115号,165号,…抽出,发票上的销售额组成一个调查样本.这种抽取样本的方法是( )A .抽签法B .随机数法C .系统抽样法D .其他的抽样方法解析:上述抽样方法是将发票平均分成若干组,每组50张.从第一组中抽取15号,以后各组抽取15+50n (n ∈N *)号,符合系统抽样的特点.答案:C3.某校高三年级有男生500人,女生400人.为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查,这种抽样方法是( )A .简单随机抽样法B .抽签法C .随机数表法D .分层抽样法解析:样本由差异明显的几部分组成,抽取的比例由每层个体占总体的比例确定,即为分层抽样法.答案:D4.将一个总体分为A 、B 、C 三层,其个体数之比为5∶3∶2,若用分层抽样方法抽取容量为100的样本,则应从C 中抽取的个体数为________.解析:25+3+2×100=20. 答案:205.将参加数学夏令营的100名同学编号为001,002,…,100.现采用系统抽样方法抽取一个容量为25的样本,且第一段中随机抽得的号码为004,则在046至078号中,被抽中的人数为________.解析:抽样距为4,第一个号码为004,故001~100中是4的整数倍的数被抽出,在046至078号中有048,052,056,060,064,068,072,076,共8个.答案:86.某中学有教职工300人,分为教学人员、管理人员、后勤服务人员三部分,其组成比例为8∶1∶1.现用分层抽样从中抽取容量为20的样本,请写出抽样的过程.解:抽样过程如下:(1)确定抽样比20300=115; (2)确定各层抽样数目为300×81015=16, 300×11015=2,300×11015=2; (3)用系统抽样法从教学人员中抽取16人,用简单随机抽样法分别从管理人员和后勤服务人员中各抽取2人;(4)将上述各层所抽的个体合在一起即为所要抽取的样本.一、选择题1.某牛奶生产线上每隔30分钟抽取一袋进行检验,该抽样方法记为①;从某中学的30名数学爱好者中抽取3人了解学业负担情况,该抽样方法记为②.那么() A.①是系统抽样,②是简单随机抽样B.①是简单随机抽样,②是简单随机抽样C.①是简单随机抽样,②是系统抽样D.①是系统抽样,②是系统抽样解析:对于①,因为每隔30分钟抽取一袋,是等间距抽样,故①为系统抽样;对于②,总体数量少,样本容量也小,故②为简单随机抽样.答案:A2.(2012·四川高考)交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为()A.101 B.808C.1 212 D.2 012解析:依题意得知,甲社区驾驶员的人数占总人数的1212+21+25+43=12101,因此有96N=12101,解得N=808.答案:B3.一个单位有职工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本.则从上述各层中依次抽取的人数分别是() A.12,24,15,9 B.9,12,12,7C.8,15,12,5 D.8,16,10,6解析:由题意,各种职称的人数比为160∶320∶200∶120=4∶8∶5∶3,所以抽取的具有高、中、初级职称的人数和其他人员的人数分别为40×420=8,40×820=16,40×520=10,40×320=6.答案:D4.下列抽样中不是系统抽样的是()A.从标有1~15号的15个球中,任选3个作为样本.将15个球按从小号到大号排序,随机选i0号作为起始号码,以后选i0+5,i0+10(超过15则从1再数起)号入样B.工厂生产的产品,在用传送带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽取一件产品进行检验C.进行某一市场调查时,规定在商场门口随机抽取一个人进行询问调查,直到调查到事先规定的调查人数为止D.在报告厅对与会听众进行调查,通知每排(每排人数相等)座位号为14的听众留下来座谈解析:分析各选项中抽样的特点,与系统抽样的概念、特点进行比较.A、D显然是系统抽样.B项中,传送带的速度是恒定的,实际上是将某一段时间内生产的产品分成一组,且可以认为这些产品已经排好,又总在某一位置抽取样品,这正好符合系统抽样的概念.选项C因事先不知道总体的个数,而且抽样时不能保证每个个体等可能入样,因此它不是系统抽样.答案:C5.某学校有职工140人,其中教师91人,教辅行政人员28人,总务后勤人员21人.为了了解职工的某种情况,要从中抽取一个容量为20的样本.以下的抽样方法中,依次为简单随机抽样、系统抽样、分层抽样顺序的是()方法1:将140人从1~140编号,然后制作出编号1~140的形状、大小相同的号签,并将号签放入同一箱子里均匀搅拌,然后从中抽取20个号签,编号与号签相同的20个人被选出;方法2:将140人分成20组,每组7人,并将每组7人按1~7编号,在第一组采用抽签法抽出k号(1≤k≤7),其余各组k号也被抽出,20个人被选出;方法3:按20∶140=1∶7的比例,从教师中抽出13人,从教辅行政人员中抽出4人,从总务后勤人员中抽出3人.从各类人员中抽取所需人员时,均采用随机数法,可抽到20人.A.方法2,方法1,方法3B.方法2,方法3,方法1C.方法1,方法2,方法3D.方法3,方法1,方法2解析:结合简单随机抽样、系统抽样、分层抽样的定义判断.答案:C二、填空题6.(2012·浙江高考)某个年级有男生560人,女生420人,用分层抽样的方法从该年级全体学生中抽取一个容量为280的样本,则此样本中男生人数为________.解析:由分层抽样得,此样本中男生人数为560×280560+420=160. 答案:1607.(2013·日照高一检测)某学校高一、高二、高三三个年级共有学生3 500人,其中高三学生数是高一学生数的两倍,高二学生数比高一学生数多300人,现在按1100的抽样比用分层抽样的方法抽取样本,则应抽取高一学生数为________.解析:若设高三学生数为x ,则高一学生数为x 2,高二学生数为x 2+300,所以有x +x 2+x 2+300=3 500,解得x =1 600.故高一学生数为800,因此应抽取高一学生数为800100=8. 答案:88.(2013·中山高一检测)一个总体中有100个个体,随机编号为0、1、2、…、99,依编号顺序平均分成10个小组,组号依次为1、2、3、…、10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m ,那么在第k 组中抽取的号码个位数字与m +k 的个位数字相同.若m =6,则在第7组中抽取的号码是________.解析:第k 组的号码为(k -1)10,(k -1)10+1,…,(k -1)·10+9,当m =6、k =7时,第k 组抽取的号码m +k 的个位数字为3,所以(7-1)×10+3=63.答案:63三、解答题9.为了调查某路口一个月的车流量情况,交警采用系统抽样的方法,样本距为7,从每周中随机抽取一天,他正好抽取的是星期日,经过调查后做出报告.你认为交警这样的抽样方法有什么问题?应当怎样改进?如果是调查一年的车流量情况呢?解:交警所统计的数据以及由此所推断出来的结论,只能代表星期日的交通流量.由于星期日是休息时间,很多人不上班,不能代表其他几天的情况.改进方法可以将所要调查的时间段的每一天先随机地编号,再用系统抽样方法来抽样,或者使用简单随机抽样来抽样亦可.如果是调查一年的交通流量,使用简单随机抽样法显然已不合适,比较简单可行的方法是把样本距改为8.10.某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加其中一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.登山组的职工占参加活动总人数的14,且该组中,青年人占50%,中年人占40%,老年人占10%.为了了解各组不同的年龄层的职工对本次活动的满意程度,现用分层抽样的方法从参加活动的全体职工中抽取容量为200的样本.试求:(1)游泳组中,青年人、中年人、老年人分别所占的比例;(2)游泳组中,青年人、中年人、老年人分别应抽取的人数.解:(1)设登山组人数为x ,游泳组中,青年人、中年人、老年人各占比例分别为a ,b ,c ,则有x ·40%+3xb 4x=47.5%, x ·10%+3xc 4x=10%. 解得b =50%,c =10%.故a =1-50%-10%=40%.即游泳组中,青年人、中年人、老年人各占比例分别为40%、50%、10%.(2)游泳组中,抽取的青年人人数为200×34×40%=60; 抽取的中年人人数为200×34×50%=75; 抽取的老年人人数为200×34×10%=15.。