系统抽样
- 格式:docx
- 大小:16.81 KB
- 文档页数:3
一、知识概述1、系统抽样:当总体中的个体数较多时,可将总体分成均衡的几个部分,然后按预先定出的规则,从每一部分抽取一个个体,得到需要的样本,这种抽样叫做系统抽样.2、系统抽样的步骤:①采用随机的方式将总体中的个体编号.为简便起见,有时可直接采用个体所带有的号码,如考生的准考证号、街道上各户的门牌号,等等.②为将整个的编号分段(即分成几个部分),要确定分段的间隔k.当(N为总体中的个体的个数,n为样本容量)是整数时,k=;当不是整数时,通过从总体中剔除一些个体使剩下的总体中个体的个数能被n整除,这时k=.③在第一段用简单随机抽样确定起始的个体编号.④按照事先确定的规则抽取样本(通常是将加上间隔k,得到第2个编号+k,第3个编号+2k,这样继续下去,直到获取整个样本).说明:①系统抽样适用于总体中的个体数较多的情况,它与简单随机抽样的联系在于:将总体均分后的每一部分进行抽样时,采用的是简单随机抽样;②与简单随机抽样一样,系统抽样是等概率抽样,它是客观的、公平的;③总体中的个体数恰好能被样本容量整除时,可用它们的比值作为系统抽样的间隔;当总体中的个体数不能被样本容量整除时,可用简单随机抽样先从总体中剔除少量个体,使剩下的个体数能被样本容量整除再进行系统抽样.3、系统抽样与简单随机抽样的区别与联系系统抽样与简单随机抽样相比,有如下区别:(1)系统抽样比简单随机抽样更容易实施,可节约成本.(2)系统抽样所得到的样本的代表性和个体的编号有关;而简单随机抽样所得样本的代表性与个体的编号无关.如果编号的特征随编号的变化呈现一定的周期性,可能会使系统抽样的代表性很差.如,如果学号按照男生单号女生双号的方法编排,那么,用系统抽样的方法抽取样本就可能会是全部为男生或全部为女生.(3)系统抽样比简单随机抽样的应用范围更广.联系是:(1)系统抽样适用于总体中的个体较多的情况,因为这时应用简单随机抽样就显得很不方便;(2)系统抽样与简单随机抽样之间存在着密切联系,即在将总体中的个体均分后的每一段进行抽样时,采用的是简单随机抽样;(3)与简单随机抽样一样,系统抽样也属于等概率抽样.二、例题讲解例1、在10000个有机会中奖的号码(编号为0000~9999)中,有关部门按照随机抽样的方式确定后两位是68的号码为中奖号码,这是运用哪种抽样方式来确定号码的()A.抽签法B.系统抽样C.随机数表法D.其他抽样方法解:由题意可知抽出的号码分别为0068,0168,0268,……,9968,显然这是将10000个中奖号码平均分成100组,从第一组抽取了0068号,其余号码在此基础上加上100的倍数得到的,可见这是采用系统抽样法.答案:B例2、一个总体中有100个个体,随机编号0,1,2,……,99.依编号顺序平均分成10个小组,组号依次为1,2,3,……,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第一组随机抽取的号码为t,则在第k组中抽取的号码个位数字与t +k的个位数字相同,若t=7,则在第8组中抽取的号码应是________.答案:75例3、为了了解参加某种知识竞赛的1000名学生的成绩,应采用什么抽样方法恰当?简述抽样过程.解:假设抽取50名学生.适宜选用系统抽样,抽样过程如下:(1)随机地将这1000名学生编号为1,2,3, (1000)(2)将总体按编号顺序均分成50部分,每部分包括20个个体.(3)在第一部分的个体编号1,2,3,…,20中,利用简单随机抽样抽取一个号码,比如是18.(4)以18为起始号码,每间隔20抽取一个号码,这样得到一个容量为50的样本:18,38,58,…,978,998.例4、为了了解参加某种知识竞赛的1003名学生的成绩,请用系统抽样抽取一个容量为50的样本.解:(1)随机地将这1003个个体编号为1,2,3,…,1003.利用简单随机抽样,先从总体中剔除3个个体.(2)再按系统抽样的方法抽取.例5、某制罐厂每小时生产易拉罐10000个,每天生产时间为12小时,为了保证产品的合格率,每隔一段时间要抽取一个易拉罐送检,工厂规定每天共抽取1200个进行检测,请你设计一个抽样方案.若工厂规定每天共抽取980个进行检测呢?解:每天共生产易拉罐120000个,共抽取1200个,所以分1200组,每组100个,然后采用简单随机抽样法从001~100中随机选出1个,再每隔100个,拿出1个送检,或者根据每小时生产10000个,每隔×3600=36秒拿出1个易拉罐送检.若共要抽取980个进行检测,则要分980组,但980不能整除120000,则先计算出120000除以980的整数部分是122,所以先要剔除120000-980×122=440个,剩下119560个平均分为980组,每组122个,然后采用简单随机抽样法从001~122中随机选出1个编号,例如选出的是108号,可以从第108个易拉罐开始,每隔122个,拿出1个送检,或者根据每小时生产10000个,每隔×3600=43.92秒拿出一个易拉罐送检.例6、下面给出某村委会调查本村各户收入情况所作的抽样,阅读并回答问题:本村人口:1200人,户数300,每户平均人口数4人;应抽户数:30户;抽样间隔:;确定随机数字,取一张人民币,编码的后两位数为12;确定第一样本户:编码的后两位数为12的户为第一样本户;确定第二样本户:12+40=52,52号为第二样本户;……(1)该村委会采用了何种抽样方法?(2)抽样过程中存在哪些问题,并修改.(3)何处是用简单随机抽样.解:(1)系统抽样.(2)本题是对某村各户进行抽样,而不是对某村人口抽样,抽样间隔为:,其他步骤相应改为确定随机数字;取一张人民币,编码的后两位数为12,确定第一样本户:编号为12的户为第一样本户;确定第二样本户:12+10=22,22号为第二样本户.(3)确定随机数字用的是简单随机抽样.取一张人民币,编码的后两位数为12.。
2.1.2 系统抽样1.系统抽样的定义当总体元素个数很大时,样本容量就不宜太小,采用简单随机抽样,就显得费事.这时,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样.在系统抽样中,由于抽样的间隔相等,因此系统抽样也被称作等距抽样.2.系统抽样的步骤一般地,假设要从容量为N的总体中抽取容量为n的样本,我们可以按下列步骤进行系统抽样:(1)先将总体的N个个体编号.有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等.(2)确定分段间隔k,对编号进行分段.当Nn(n是样本容量)是整数时,取k=Nn.(3)在第1段用简单随机抽样确定第一个个体编号l(l≤k);(4)按照一定的规则抽取样本.通常是将l加上间隔k得到第2个个体编号(l +k),再加k得到第3个个体编号(l+2k),依次进行下去,直到获取整个样本.思考:使用系统抽样抽出的个体编号有什么特点?[提示]编号都是等距的.1.有20个同学,编号为1~20,现在从中抽取4人的作文进行调查,用系统抽样方法确定所抽的编号为()A.5,10,15,20B.2,6,10,14C.2,4,6,8 D.5,8,11,14A[将20分成4个组,每组5个号,间隔等距离为5.]2.某报告厅有50排座位,每排有60个座位(编号1~60),一次报告会坐满了观众,会后留下座号为18的所有观众进行座谈.这是运用了() A.抽签法B.随机数表法C.系统抽样D.有放回抽样C[符合系统抽样的特点.]3.(2019·全国卷Ⅰ)某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是() A.8号学生B.200号学生C.616号学生D.815号学生C[∵从1 000名学生中抽取一个容量为100的样本,∴系统抽样的分段间隔为1 000100=10,∵46号学生被抽到,则根据系统抽样的性质可知,第一组随机抽取一个号码为6,以后每个号码都比前一个号码增加10,所有号码数是以6为首项,以10为公差的等差数列,设其数列为{a n},则a n=6+10(n-1)=10n-4,故可知C项正确.]4.一个总体的60个个体的编号为0,1,2,…,59,现要从中抽取一个容量为10的样本,请根据编号按被6除余3的方法,取足样本,则抽取的样本号码是_______________________________________.3,9,15,21,27,33,39,45,51,57[由题目可知,采用的抽样方法是系统抽样,抽样间隔是6.]【例1】(1)某商场欲通过检查部分发票及销售记录来快速估计每月的销售金额,采用如下方法:从某本发票的存根中随机抽一张,如15号,然后按顺序将65号,115号,165号,…,发票上的销售金额组成一个调查样本.这种抽取样本的方法是()A.抽签法B.随机数法C.系统抽样法D.以上都不对(2)为了解1 200名学生对学校某项教改试验的意见,打算从中抽取一个容量为30的样本,考虑采用系统抽样,则分段的间隔k=________.[思路探究]解决此类问题的关键是根据系统抽样的概念及特征,抓住系统抽样适用的条件作出判断.(1)C(2)40[(1)上述抽样方法是将发票平均分成若干组,每组50张,从第一组抽出了15号,以后各组抽15+50n(n∈N*)号,符合系统抽样的特点.(2)根据样本容量为30,将1 200名学生分为30段,每段人数即间隔k=1 200 30=40.]系统抽样的适用条件及判断方法,适用条件:系统抽样适用于个体数较多的总体.判断方法:判断一种抽样是否为系统抽样,首先看在抽样前是否知道总体是由什么构成的.抽样的方法能否保证将总体分成几个均衡的部分,并保证每个个体等可能入样.1.下列抽样试验中,最适宜用系统抽样法的是()A.某市的4个区共有2 000名学生,且4个区的学生人数之比为3∶2∶8∶2,从中抽取200人入样B.从某厂生产的2 000个电子元件中随机抽取5个入样C.从某厂生产的2 000个电子元件中随机抽取200个入样D.从某厂生产的20个电子元件中随机抽取5个入样C[只有C选项样本容量和总体容量都较大,且个体之间无明显差异.]【例2】抽取13人参加运动会,若种子选手必须参加,请用系统抽样法给出抽样过程.[思路探究]种子选手必须参加,实质上是从198名运动员中抽取11人参赛.[解]S1将不包括2名种子选手的198名运动员进行编号,编号为001,002, (198)S2将编号按顺序每18个一段分成11段;S3在第1段001,002,…,018这18个编号中用简单随机抽样法抽出1个号(如010)作为起始号;S4依次加18,将编号为010,028,046,…,190的个体抽出,再加上2名种子选手组成代表队参加运动会.在应用系统抽样时,要解决两个关键的问题:(1)分组的方法应依据抽取比例而定,即根据定义每组抽取一个样本.(2)起始编号的确定应用简单随机抽样的方法,起始编号确定,其他编号便随之确定了.2.某班共有52人,现根据学生的学号,用系统抽样的方法抽取一个容量为4的样本.已知3号、29号、42号同学在样本中,那么样本中还有一个同学的学号是()A.10 B.11C.12 D.16D[分段间隔k=524=13,可推出另一个同学的学号为16,故选D.][1.运用系统抽样抽取样本时,需要计算分段间隔k,得到k值的目的是什么?[提示]当总体容量能被样本容量整除时,分段间隔k=Nn,计算出k值是为了把所有个体分成n段,每段有k个个体,从而从k个个体中抽取一个入样.2.对总体分段后,先从第一段随机抽取一个个体,其他各段不再抽取,而是加上分段间隔的若干倍得到,这样做公平吗?[提示]公平.因为第一段中抽取是随机的,每一个个体入样有均等的机会,进而其余各段的每一个个体都有均等入样的机会.3.在系统抽样中,N不一定能被n整除,那么系统抽样还公平吗?[提示]在系统抽样中,(1)若N能被n整除,则将比值Nn作为分段间隔k.由于起始编号的抽取采用简单随机抽样的方法,因此每个个体被抽取的可能性是一样的.(2)若N不能被n整除,则用简单随机抽样的方法从总体中剔除几个个体,使得总体中剩余的个体数能被n整除,再确定样本.因此每个个体被抽取的可能性还是一样的.所以,系统抽样是公平的.【例3】为了了解参加某种知识竞赛的1 003名学生的成绩,抽取一个容量为50的样本,选用什么抽样方法比较恰当?简述抽样过程.[思路探究]编号→剔除→再编号→分段→在第一段上抽样→在其他段上抽样→成样[解](1)随机地将这1 003个个体编号为1,2,3,…,1 003;(2)利用简单随机抽样,先从总体中随机剔除3个个体,剩下的个体数1 000能被样本容量50整除,然后将1 000个个体重新编号为1,2,3,…,1 000;(3)将总体按编号顺序均分成50组,每组包括20个个体;(4)在编号为1,2,3,…,20的第一组个体中,利用简单随机抽样抽取一个号码,比如是18;(5)以18为起始号码,每间隔20抽取一个号码,这样得到一个容量为50的样本:18,38,58,…,978,998.1.(变条件)从某厂生产的802辆轿车中抽取80辆测试某项性能.请用系统抽样方法进行抽样,并写出抽样过程.[解]第一步,先从802辆轿车中剔除2辆轿车(剔除方法可用随机数表法);第二步,将余下的800辆轿车编号为1,2,…,800,并均匀分成80段,每=10个个体;段含k=80080第三步,从第1段即1,2,…,10这10个编号中,用简单随机抽样的方法抽取一个号(如5)作为起始号;第四步,从5开始,再将编号为15,25,…,795的个体抽出,得到一个容量为80的样本.2.(变结论)为了了解参加某种知识竞赛的1 003名学生的成绩,抽取一个容量为50的样本,若选择抽签法抽取,有什么弊端?[解]制签成本高,个体太多,不易“搅拌均匀”,抽取的样本代表性差.当总体容量不能被样本容量整除时,可以先从总体中随机剔除几个个体.但要注意的是剔除过程必须是随机的,也就是总体中的每个个体被剔除的机会均等.剔除几个个体后使总体中剩余的个体数能被样本容量整除.提醒:剔除个体后需对样本重新编号.1.本节课的重点是记住系统抽样的方法和步骤,难点是会用系统抽样从总体中抽取样本.2.本节课要理解并记住系统抽样的三个特征:①总体已知且数量较大;②抽样必须等距;③每个个体入样的机会均等.3.本节课要掌握设计系统抽样的四个步骤:编号→分段→确定初始编号→抽取样本.4.本节课的易错点有:(1)概念理解错误致错.(2)忽视每个个体被抽到的机会相等而致误.1.思考辨析(1)总体个数较多时可以用系统抽样.( )(2)系统抽样的过程中,每个个体被抽到的概率不相等.( )(3)用系统抽样从N 个个体中抽取一个容量为n 的样本,要平均分成n 段,每段各有N n 个号码.( )[答案] (1)√ (2)× (3)×2.下列抽样问题中最适合用系统抽样法抽样的是( )A .从全班48名学生中随机抽取8人参加一项活动B .一个城市有210家百货商店,其中大型商店20家,中型商店40家,小型商店150家.为了掌握各商店的营业情况,要从中抽取一个容量为21的样本C .从参加模拟考试的1 200名高中生中随机抽取100人分析试题作答情况D .从参加模拟考试的1 200名高中生中随机抽取10人了解某些情况C [A.总体容量较小,样本容量也较小,可采用抽签法.B .总体中的个体有明显的层次,不适宜用系统抽样法.C .总体容量较大,样本容量也较大,可用系统抽样法.D .总体容量较大,样本容量较小,可用随机数表法.]3.为了了解参加某次知识竞赛的1 252名学生的成绩,决定采用系统抽样的方法抽取一个容量为50的样本,那么从总体中应随机剔除的个体数目为( )A.2B.3C.4D.5A[因为1 252=50×25+2,所以应随机剔除2个个体,故选A.]4.中秋节,相关部门对某食品厂生产的303盒中秋月饼进行质量检验,需要从中抽取10盒,请用系统抽样的方法完成对此样本的抽取.[解](1)将303盒月饼用随机的方式编号;(2)从总体中用简单随机抽样的方式剔除3盒月饼,将剩下的月饼重新用000~299编号,并等距分成10段;(3)在第一段000,001,002,…,029这30个编号中用简单随机抽样确定起始号码l;(4)将编号为l,l+30,l+2×30,l+3×30,…,l+9×30的个体抽出,组成样本.。
系统抽样法系统抽样法是一种常用的统计抽样方法,可以有效的代表总体,用于对总体进行推断和估计。
系统抽样法是在总体中按照一定规则选择一部分样本作为代表,从而得到可靠的总体估计。
系统抽样法的步骤如下:1. 确定总体:首先需要明确研究对象或感兴趣的总体,例如某产品的用户群体。
2. 确定样本量:根据所设定的误差容限和置信水平,计算得到所需的样本量。
3. 确定抽样间隔:抽样间隔是指从总体中选择样本的规则,比如每隔5个元素选择一个样本。
4. 确定起始点:从总体中任意选择一个起始点作为第一个样本。
5. 依次选择样本:按照设定的抽样间隔,从起始点开始,依次选择样本,直到达到所需的样本量为止。
6. 数据收集和分析:对所选择的样本进行数据收集和分析,可以获得关于总体的一些统计特征。
7. 总体估计:基于对样本数据的分析,对总体的特征进行估计,如总体均值、总体比例等。
系统抽样法的优点包括:1. 相对于随机抽样,系统抽样具有较高的效率,能够达到相同的估计效果,样本量较少时,所需的抽样量较少。
2. 系统抽样相对于方便抽样和判断抽样,具有较高的代表性,能够更好地反映总体的特征。
3. 系统抽样法适用范围广,可以应用于各种类型的总体,如人群、产品、地域等。
然而,系统抽样法也存在一些局限性:1. 当总体的分布不规律时,系统抽样可能导致样本选择出现一定的偏差,因此在使用系统抽样方法之前,需要确保总体具有较好的规律性。
总之,系统抽样法是一种常用的统计抽样方法,可以帮助研究者从总体中选择出具有代表性的样本,从而对总体进行推断和估计。
在实际应用中,研究者需要根据具体情况选择合适的抽样方法,并确保抽样过程的准确性和可靠性。
系统抽样一、引言在统计学中,抽样是一种常用的数据收集方法,通过从总体中选择部分样本进行观察和分析,从而推断总体的特征和属性。
系统抽样是抽样方法中的一种重要方式,它基于一个系统性的策略,按照一定的规则从总体中选择样本,以确保样本能够代表整体。
本文将深入探讨系统抽样的原理、应用、优缺点以及如何进行样本量确定等相关内容。
二、系统抽样的原理系统抽样的原理是基于总体的有序结构,通过选择一个起始点,然后按照固定的间隔选取样本。
这个间隔通常用总体容量除以样本容量来计算,以保证选取的样本能够均匀地分布在总体中。
例如,若总体容量为N,样本容量为n,则每隔N/n个元素选取一个样本。
三、系统抽样的应用系统抽样广泛应用于各个领域,特别适用于大规模的调查和研究。
以下是系统抽样的几个典型应用:1. 民意调查:在政治选举、市场调研等方面,使用系统抽样可以有效地代表总体,从而推断出人们对候选人或产品的态度和偏好。
2. 质量控制:在生产过程中,可以使用系统抽样来检验产品质量是否符合标准,通过取样检查可以发现潜在的问题并进行修正。
3. 教育评估:在教育领域中,使用系统抽样可以评估学生对知识和技能的掌握程度,从而改进教学方法和提供个性化的教育支持。
4. 医学研究:在医学研究中,系统抽样可以帮助研究人员选择适当的样本,以研究特定疾病或治疗方法的有效性。
四、系统抽样的优缺点1. 优点:(1)代表性:系统抽样可以确保样本从总体中均匀地抽取,从而更好地代表总体的特征。
(2)效率高:相对于简单随机抽样,系统抽样在样本容量相同时,能够提供更精确的结果。
(3)容易实施:系统抽样是一种简单易行的抽样方法,不需要复杂的随机数生成过程。
2. 缺点:(1)陷入周期性误差:如果总体的有序结构与取样规则之间存在某种周期性关系,系统抽样可能导致样本集中在某些特定的区域,从而影响结果的准确性。
(2)对总体结构要求较高:系统抽样通常要求总体具有明确的有序结构,否则可能无法正确执行。
系统抽样一、系统抽样的定义:一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样。
【说明】由系统抽样的定义可知系统抽样有以下特证:(1)当总体容量N较大时,采用系统抽样。
(2)将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,因此,系统抽N].样又称等距抽样,这时间隔一般为k=[n(3)预先制定的规则指的是:在第1段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整倍数即为抽样编号。
例:下列抽样中不是系统抽样的是()A、从标有1~15号的15号的15个小球中任选3个作为样本,按从小号到大号排序,随机确定起点i,以后为i+5, i+10(超过15则从1再数起)号入样B工厂生产的产品,用传关带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品检验C、搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止D、电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈点拨:(2)c不是系统抽样,因为事先不知道总体,抽样方法不能保证每个个体按事先规定的概率入样。
二、系统抽样的一般步骤:(1)采用随机抽样的方法将总体中的N个个编号。
(2)将整体按编号进行分段,确定分段间隔k(k∈N,L≤k).(3)在第一段用简单随机抽样确定起始个体的编号L(L∈N,L≤k)。
(4)按照一定的规则抽取样本,通常是将起始编号L加上间隔k得到第2个个体编号L+K,再加上K得到第3个个体编号L+2K,这样继续下去,直到获取整个样本。
【说明】从系统抽样的步骤可以看出,系统抽样是把一个问题划分成若干部分分块解决,从而把复杂问题简单化,体现了数学转化思想。
【例题精析】例1、某校高中三年级的295名学生已经编号为1,2,……,295,为了了解学生的学习情况,要按1:5的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程。
2.1.2 系统抽样
1教学目标
(1)正确理解系统抽样的概念;
(2)会用系统抽样从总体中抽取样本。
2学情分析
学生已初步了解掌握了简单随机抽样的两种方法,即抽签法与随机数表法,在此基础上进一步学习系统抽样,它也是“统计学”的重要组成部分,通过对系统抽样的学习,更加突出统计在日常生活中的应用,体现它在中学数学中的地位。
3重点难点
教学重点:应用系统抽样的方法进行抽样。
教学难点:对系统抽样中的“系统”思想的理解和样本随机性的理解。
4教学过程 4.1 第一学时教学活动活动1【讲授】教学过程
复习引入
处理方式
提问:简单随机抽样的优点和缺点是什么?
抽签法的优点和缺点:抽签法简单易行,当总体中的个体不多时,使总体处于“均匀搅拌”的状态较容易,这时,每个个体有均等的机会被抽出,从而能保证样本的代表性。
但是当总体的个体很多时,将总体“均匀搅拌”就比较困难,不能确保每个个体有均等的机会被抽出,从而样本的代表性就差。
与抽签法相比,随机数表法抽选样本的优点是节省人力、物力、财力和时间。
缺点是所产生的样本不是真正的简单样本。
新知探究
提问:当总体个数比较多时,采用哪种抽样方法呢?
【问题1】:为了了解某市今年高一学生期末考试数学科的成绩,拟从参加考试的1500名学生的数学成绩中抽取容量为150的样本,你能设计一个合理的抽取方法吗?
让学生讨论采取的方法,将学生提出的几种方法进行分类讨论,比较各种方法的优劣。
经过一翻讨论之后,教师引导,提出用系统抽样的方法来解决这个问题。
最后给出详细步骤如下:
⑴把全市学生的数学成绩编号,号码为1到1500。
⑵由于样本容量与总体容量的比为150:1500=1:100,所以我们将总体平均分为150部分,每一部分包含100个个体。
⑶从1到100号进行简单随机抽样,抽取一人号码,比如说是23。
⑷接下来顺次取出号码为123、223、…、14 923的学生,得到容量为150的一个样本。
处理方式
通过大家的讨论解决了一类问题,即当总体中个数较多时如何抽样的问题。
这就是常用的一种抽样方法----系统抽样。
推进新课
系统抽样的概念
一般地,在抽样中当总体中个体数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则从每一部分抽取一个个体,得到所需的样本,这种抽样方法叫做系统抽样,有时也称机械抽样。
系统抽样比简单随机抽样的应用范围更广。
如:对工业生产线上的产品实行质量控制,需要实时(随时)监控生产线的工作状态是否正常。
在这种情况下,在抽样的过程中,并不知道总体所包含的个体总数,因此不能用简单随机抽样方法,虽然等生产完一批产品之后,就可以利用简单随机抽样的方法获取样本,但这对实时监控生产线的工作状态没有任何帮助。
如果按产品生产的先后次序作为编号,并事先规定好分段时间间隔,则可以利用系统抽样方法进行抽样。
思考:请将系统抽样与简单随机抽样做一个比较,你认为这种抽样的方法能提高样本的代表性吗?为什么?
系统抽样比较简单抽样更容易实施,可节约抽样成本。
系统抽样所得样本的代表性和具体的编号有关样本;而简单随机抽样所得样本的代表性与个体的编号无关。
如果编号的个体特征随编号的变化呈现一定的周期性,可能会使系统抽样的代表性很差。
如果学号按照男生单号女生双号的方法编排,那么,用系统抽样的方法抽取的样本就可能会是全部为男生或全部为女生。
系统抽样比简单随机抽样的应用范围更广。
【问题2】要从1003名学生中抽取一个容量为20的样本,试用系统抽样的方法给出抽样过程。
【研析】
第一步,将1003名学生进行编号;
第二步,因为不是整数,所以先从总体中剔除3人(可以使用随机数法进行剔除);
第三步,将剩下的1000名学生从000~999重新进行编号,并分成20段,每段50人,即抽样间隔为50;
第四步,在第一段000,001,002,…,049这50个编号中抽出一个(如003)作为起始号码;
第五步,依次抽取出编号为003,053,103,…,953的个体组成样本。
【方法探究】用系统抽样抽取样本,当不为整数时,取 =[ ],即先从总体中用简单随机抽样的方法剔除个个体,且剔除多余个体不影响抽样的公平性,本题因为1003=20×50+3,为了保证“等距”分段,应先剔除3人。
归纳提升
系统抽样的步骤如下:
先将总体的N个个体编号,有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等;
确定分段间隔k对编号进行分段。
当(n是样本容量)是整数时,取;
在第1段用简单随机抽样确定第一个个体编号;
按照一定的规则抽取样本。
通常是将加上间隔得到第2个个体编号,再加上
k得到第3个个体编号 ,依次进行下去,直到获取整个样本。
思考:剔除部分个体后,每个个体被抽到的可能性是否相等?
我们以下面具体例子来说明这个问题。
例如,从1003名学生中抽取50名参加数学竞赛,由于1003不能被50整除,则从总体中剔除3个个体,其中每个个体不被剔除的可能性是,对于仍留在总体中的1000个个体,采用系统抽样法时每个个体被抽取的概率是,因此在整个抽样过程中,每个个体被抽取的概率是 .
这说明在整个抽样过程中,每个个体被抽取的概率仍然是相等的。
课后延续
(一)小结:
(1)系统抽样与简单随机抽样的比较:从对总体的代表性看,系统抽样方法的第一段是简单随机抽取,而以后为等距离抽取,不如生产部门是随机抽样中所有个体都有相互独立的被选机会那样有更强的代表性;但从抽取个体在总体中分布的均匀程度来看,系统抽样的个体比简单随机抽样在总体中的分布更均匀,从不同角度看,两种方法各有优越性。
(2)系统抽样的步骤:编号、分段、确定起始个体编号、按规则抽样
(3)系统抽样的公平性:
(4)系统抽样的特点:
①适用于容量较大的情况;
②剔除多余个体及第一段抽样都用简单随机抽样,因而与简单随机抽样有密切联系;
③是等可能抽样,每个个体被抽到的可能性都是n/N.
(二)回顾本课内容。
(三)布置作业:P59、第1题、第2题、第3题。