简单随机抽样
- 格式:ppt
- 大小:971.50 KB
- 文档页数:68
一、知识概述1、简单随机抽样:设一个总体的个体数为N.如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的机会相等,就称这样的抽样为简单随机抽样.注:(1)一般地,用简单随机抽样从含有N个个体的总体中抽取一个容量为的样本时,每次抽取一个个体时任一个体被抽到的概率为;在整个抽样过程中各个个体被抽到的概率为;(2)简单随机抽样的特点是,逐个抽取,且各个个体被抽到的概率相等;(3)简单随机抽样方法,体现了抽样的客观性与公平性,是其他更复杂抽样方法的基础.介绍:抽样方法在统计学中很多,如果按照抽取样本时总体中的每个个体被抽取的概率是否相等来进行分类,可分为:等概率抽样和不等概率抽样.在等概率抽样中,又可以分为不放回抽样和放回抽样.在实际应用中,使用较多的是不放回抽样,相对来说,放回抽样在理论研究中显得更为重要.2、简单随机抽样的实施方法:(1)抽签法:先将总体中的所有个体(共有N个)编号(号码可从1到N),并把号码写在形状、大小相同的号签上(号签可用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签时每次从中抽一个号签,连续抽取n次,就得到一个容量为n的样本.适用范围:总体的个体数不多时.优点:抽签法简便易行,当总体的个体数不太多时适宜采用抽签法.(2)随机数表法:1°.制定随机数表;2°.给总体中各个个体编号;3°.按照一定的规则确定所要抽取的样本的号码.随机数表抽样“三步曲”:第一步,将总体中的个体编号;第二步,选定开始的数字;第三步,获取样本号码.3、简单随机抽样的特点:它是不放回抽样;它是逐个地进行抽取;它是一种等概率抽样.注:抽签法与随机数表法的比较:共同点:(1)抽签法和随机数表法都是简单随机抽样的方法,并且要求被抽取样本的总体的个数有限;(2)抽签法和随机数表法都是从总体中逐个地进行抽取,都是不放回抽样.不同点:(1)抽签法相对于随机数表法简单,随机数表法较抽签法稍麻烦一点;(2)随机数表法更适用于总体中的个体数较多的时候,而抽签法适用于总体中的个数相对较少的时候,所以当总体中的个数较多时,应当选用随机数表法,这样可以节约大量的人力和制作号签的成本与精力.二、例题讲解例1、某次考试有70000名学生参加,为了了解这70000名考生的数学成绩,从中抽取1000名考生的数学成绩进行统计分析,在这个问题中,有以下四种说法:(1)1000名考生是总体的一个样本;(2)1000名考生数学成绩的平均数是总体平均数;(3)70000名考生是总体;(4)样本容量是1000,其中正确的说法有()A.1种B.2种C.3种D.4种解:(3)(4)对,故选B.例2、现要从20名学生中抽取5名进行阅卷调查,写出抽取样本的过程.解:①先将20名学生进行编号,从1编到20;②把号码写在形状、大小均相同的号签上;③将号签放在一个箱子中进行充分搅拌,力求均匀,然后从箱子中抽取5个号签,这5个号签上的号码对应的学生,即为所求的样本.例3、为了检验某种产品的质量,决定从40件产品中抽取10件进行检查,写出用随机数表法抽取样本的过程.解:第一步,先将40件产品编号,可以编为00,01,02,…,38,39.第二步,利用本节教材中提供的随机数表,任选一个数作为开始,例如从第10行第6列的数字开始.第三步,从选定的数6开始,从左往右读,依次得到样本号码是:24,29,05,28,27,34,32,38,20,00.这10个号码所对应的产品为样本.例4、上海某中学从40名学生中选1人作为上海男篮拉拉队的成员,采用下面两种选法:选法一将这40名学生从1~40进行编号,相应地制作1~40的40个号签,把这40个号签放在一个暗箱中搅匀,最后随机地从中抽取1个号签,与这个号签编号一致的学生幸运入选.选法二将39个白球与1个红球混合放在一个暗箱中搅匀,让40名学生逐一从中摸取一球,摸到红球的学生成为拉拉队成员.试问这两种选法是否都是抽签法?为什么?这两种选法有何异同?解:选法二不是抽签法.因为抽签法要求所有的号签编号互不相同,而选法二中39个白球无法相互区分.这两种选法相同之处在于每名学生被选中的概率都相等,等于.例5、某市通过电话进行民意测验实施某项调查,该市的电话号码有7位,其中首两位为区域代码,只能为2,3,5,7的任意两两组合,后5位取自0~9这10个数字.现在任意选择3个区域,每个区域随机选取5个号码进行调查.请你设计一种抽取方案,选出这15个电话号码.解:首先列出所有由2,3,5,7两两组合而成的区域代码共16个,用抽签法随机选取3个;然后制作一张0~99999的随机数表,方法是用抽签法或计算机生成法产生若干个0~9之间的随机整数,5个一组,构成0~99999之间的随机数表;最后用随机数表法选出15个5位号码,分成3组,第1组前加上用抽签法选出的第1个区域代码,第2,3组前分别加上选出的第2,3个区域代码.。
随机抽样知识讲解一、统计中的相关概念总体:所考察对象的某一数值指标的全体构成的集合看作总体.个体:构成总体的每一个元素作为个体.样本:从总体中抽出若干个体所组成的集合叫做样本.样本容量:样本中个体的数目叫样本容量.统计的基本思想方法:用样本估计总体,即通常不去直接去研究总体,而是通过从总体中随机抽取一个样本,根据样本的情况去估计总体的相应情况.二、简单随机抽样1.简单随机抽样的概念概念:一般地,从元素个数为N的总体中不放回地抽取容量为n样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样.2.简单随机抽样的特点1)被抽取样本的总体的个数有限;2)从总体中逐个地进行抽取,使抽样便于在实践中操作;3)它是不放回抽样,使其具有广泛的应用性;4)它是等可能抽样,每个个体被抽到的可能性都是nN,保证了抽样方法的公平性.3.常用的简单随机抽样方法1)抽签法:把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一张号签,连续抽取n次,就得到一个容量为n的样本.抽签法的步骤:a.编号,即给总体中的所有个体编号,号码可以从1到N.b.制签,即将1~N这N个号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制作).c搅拌均匀,即将号签放在一个不透明的容器中,搅拌均匀..d逐个不放回抽取,即从容器中每次抽取一个号签,并记录其编号,连续抽取n次.抽签法的优缺点:.a优点:简单易行..b缺点:当总体的容量非常大时,费时、费力又不方便.况且,如果号签搅拌的不均匀,可能导致抽样的不公平.2)随机数表法:随机数表是由0,1,2,,9L这10个数字组成的数表,并且表中的每一位置出现各个数字的可能性相同.通过,随机数表,根据实际需要和方便使用的原则,将几个数组合成一组,然后通过随机数表抽取样本.随机数表法的步骤:.a编号,即将总体中的所有个体进行编号(每个号码位数一致);.b在随机数表中任选一个数作为起始号码;.c从选定的数开始按一定的方向读下去,得到的号码若不在编号中,则跳过,若再编号中,则取出,如果得到的号码前面已经取出,也跳过,如此继续下去,直到取满为止;随机数表法的优缺点:.a优点:简单易行,它很好的解决了用抽签法当总体中的个体数较多时制签难的问题..b缺点:当总体中的个体数很多,需要的样本容量也很大时,用随机数表法抽取仍不方便.4.简单随机抽样的应用应用:常用的简单随机抽样方法有抽签法和随机数表法.抽签法一般适用于容量较小的总体,易于操作;随机数表法解决了制签比较麻烦的问题,但在利用“随机数表法”进行简单随机抽样时,要严格按照课本中介绍的步骤,否则易出错误.结合具体的问题,我们应灵活使用这两种方法.三、系统抽样1.系统抽样的概念概念:当总体元素个数很大时,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样方法叫做系统抽样.(由于抽样样的间隔相等,因此系统抽样也被称作等距抽样)2.系统抽样的步骤:1)编号,即将总体中的个体编号.为方便起见,也可直接利用个体所带有的号码,如准考证号、门牌号等;2)分段,即为将整个的编号进行分段,要确定分段的间隔k .当N n 是整数时,N k n =;当Nn不是整数时,则可用简单随机抽样的方法从总体中剔除一些个体,使剩下的总体中个体个数'N 能被n 整除,这时'N k n=. 3)确定起始个体编号,即由数字1~k 中随机抽取一个数S .4)按照预先确定的规则抽取样本,即通常是将S 依次加上间隔k 的倍数,这样样本的编号依次是:,,2,,(1).S S k S k S n k +++-L3.系统抽样的公平性当N n 是整数时,N k n =;当Nn不是整数时,则可用简单随机抽样的方法从总体中剔除一些个体,使剩下的总体中个体个数'N 能被n 整除,这时'N k n=,上述过程中,总体的每个个体被剔除的可能性相同,也就是说每个个体不被剔除的可能性相同,所以在整个抽样过程中每个个体抽取的可能性仍然相同.4.系统抽样的特点1)适用于总体容量较大的情况;2)剔除多余个体及第一段抽样都用简单随机抽样,因而与简单随机抽样有密切联系; 3)它是等可能抽抽样,每个个体被抽到的可能性都是nN. 四、分层抽样1.分层抽样的概念概念:当总体由有明显差别的几部分组成时,为了使抽取的样本更好地反映总体的情况,我们经常将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这样的抽样方法叫做分层抽样.2.分层抽样的步骤1)分层,即将总体中各个个体按某种特征分成若干个互不重叠的几部分; 2)按比例确定每层抽取个体的个数;3)各层抽样,即各层中采用简单随机抽样或系统抽样抽取相应的个数; 4)汇合成样本.3.分层抽样的特点1)适用于总体由差异明显的几部分组成的情况;2)更充分的反映了总体的情况;3)它是等可能抽样,每个个体被抽到的可能性都是nN .五、三种抽样方式的区别与联系典型例题一.选择题(共5小题)1.(2015•湖北)我国古代数学名著《九章算术》有“米谷粒分”题:粮仓开仓收粮,有人送来米1534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为()A.134石B.169石C.338石D.1365石【解答】解:由题意,这批米内夹谷约为1534×≈169石,故选:B.2.(2014•重庆)某中学有高中生3500人,初中生1500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为()A.100 B.150 C.200 D.250【解答】解:分层抽样的抽取比例为=,总体个数为3500+1500=5000,∴样本容量n=5000×=100.故选:A.3.(2014•广东)为了解1000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为()A.50 B.40 C.25 D.20【解答】解:∵从1000名学生中抽取40个样本,∴样本数据间隔为1000÷40=25.故选:C.4.(2014•湖南)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为P1,P2,P3,则()A.P1=P2<P3B.P2=P3<P1C.P1=P3<P2D.P1=P2=P3【解答】解:根据简单随机抽样、系统抽样和分层抽样的定义可知,无论哪种抽样,每个个体被抽中的概率都是相等的,即P1=P2=P3.故选:D.5.(2013•湖南)某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n=()A.9 B.10 C.12 D.13【解答】解:∵甲、乙、丙三个车间生产的产品件数分别是120,80,60,∴甲、乙、丙三个车间生产的产品数量的比依次为6:4:3,丙车间生产产品所占的比例,因为样本中丙车间生产产品有3件,占总产品的,所以样本容量n=3÷=13.故选:D.二.填空题(共2小题)6.(2017•江苏)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取18件.【解答】解:产品总数为200+400+300+100=1000件,而抽取60件进行检验,抽样比例为=,则应从丙种型号的产品中抽取300×=18件,故答案为:187.(2012•江苏)某学校高一、高二、高三年级的学生人数之比为3:3:4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取15名学生.【解答】解:∵高一、高二、高三年级的学生人数之比为3:3:4,∴高二在总体中所占的比例是=,∵用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,∴要从高二抽取,故答案为:15三.解答题(共3小题)8.从2开始的200个偶数,即2、4、6、8…400中,用系统抽样的办法抽取20个偶数作样本.【解答】解:S1:编号,把2、4、6、8…400这200个偶从002到400按偶数次序编号;S2:分段,计算分间隔为k==10,把编号从小到大依次分成20段,每段10个号;S3:定首号,在第一段002~020的10个号中,用简单随机抽样的方法,抽取一个号码,假设抽中的是008;S4:取余号,依次抽取008,028,048,068,088,108,128,148,168,188,208,228,248,268,288,308,328,348,368,388.9.某校组织高一学生对所在市的居民中拥有电视机、电冰箱、组合音响的情况进行一次抽样调查,调查结果:3户特困户三种全无;有一种的:电视机1090户,电冰箱747户,组合音响850户;有两种的:电视机、组合音响570户,组合音响、电冰箱420户,电视机、电冰箱520户;“三大件”都有的265户.调查组的同学在统计上述数字时,发现没有记下被调查的居民总户数,你能避免重新调查而解决这个问题吗?【解答】解:由题意,抽样调查总数3+265+255+265+72+305+155+125=1445户,∴有两种的有1445﹣3﹣747﹣265=430户,故比例为3:747:430:265,利用分层抽样即可解决.10.某地区工人的平均工资是15元/小时,标准差为4元/小时.若从该地区抽取n=50个工厂,问所取得样本的平均工资的期望和方差各是多少?平均工资的抽样分布是什么?【解答】解:∵某地区工人的平均工资是15元/小时,∴抽取的样本的期望是15.∵标准差为4元/小时,∴抽取样本的方差是16.抽样分布符合二项分布,即X~N(15,16).。
简单随机抽样的方法
简单随机抽样是一种抽样方式,它是指从总体中以任意的、等概率的方式随机抽取n个样本,使得每个个体都有相同的被抽取概率。
以下是简单随机抽样的方法:
1.概率抽样法:将所有个体从总体中标号为1、2、3、…、N。
使用计算机或随机数字表等随机数生成器生成n个随机数,每个随机数对应一个个体,就是样本。
2.抽签法:将所有个体的编号写在同样大小的纸片上,放进一个容器中,摇匀后抽取n个纸片,就是样本。
3.数表抽样法:将所有个体从总体中标号为1、2、3、…、N。
按照取样比例计算出要取多少个样本,然后从以1~N为首项的数列中隔行抽样取得样本。
4.等距抽样法:将总体中每个个体按照一定的顺序排列,然后按照一定的间隔(例如每隔k个个体抽取一个样本)抽取样本。
需要注意的是,简单随机抽样的方法不适用于总体变异系数较大的情形,因为此时抽样可能会出现偏差;对于总体变异系数较小的总体,简单随机抽样是比较可
靠的抽样方法。
简单随机抽样简答题:结合实例,简述什么是简单随机抽样。
【参考答案】(1)简单随机抽样:一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n\;(1≤n<N)个个休作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等。
我们把这样的抽样方法叫做放回简单随机抽样;如果抽取是不放回的,目每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫作不放回简单随机抽样。
放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样。
特点:每个个体被抽中的可能性相同(概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性。
简单随机抽样是其他各种抽样方法的基础。
通常当总体内的个体之间差异程度较小和数目较少时,采用这种抽样方法。
简言之,其特点是:①总体个数有限;②逐个抽取;③等可能抽样。
例如:高一三班52名学生的学号分别是01,52,从中随机挑选2名学生参加演讲表演,这种抽样方法就是简单随机抽样。
(2)分层随机抽样:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层。
适用特征:①总体由差异明显的几部分组成;②分成的各层互不重叠;③各层抽取的比例等于样本在总体中的比例 \frac{n}{N}例如:初级中学有学生270人,其中初一年级108人,初二、初三年级各81人,现要抽取10人参加项调查,使用分层抽样时,将学生按初一、初二、初三年级依次统一编号为1,2,…,270,则抽取比例为\frac{10}{27}=\frac{1}{27} ,所以应分别从初一、初二、初三年级抽取4人,3人,3人。
重点概念补充说明:总体:目标总体与抽样总体目标总体也简称为总体,是指所有研究对象的全体,或是研究人员希望从中获取信息的总体,它研究对象中所有性质相同的个体所组。
简单随机抽样的概念一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样,这样抽取的样本,叫做简单随机样本。
简单随机抽样一般采用两种方法:抽签法和随机数表法。
例1:人们打桥牌时,将洗好的扑克牌随机确定一张为起始牌,这时按次序搬牌时,对任何一家来说,都是从52张牌中抽取13张牌,问这种抽样方法是否是简单随机抽样?例2:某车间工人加工一种轴100件,为了了解这种轴的直径,要从中抽取10件轴在同一条件下测量,如何采用简单随机抽样的方法抽取样本?1、为了了解全校240名学生的身高情况,从中抽取40名学生进行测量,下列说法正确的是A.总体是240 B、个体是每一个学生 C、样本是40名学生 D、样本容量是402、为了正确所加工一批零件的长度,抽测了其中200个零件的长度,在这个问题中,200个零件的长度是()A、总体B、个体是每一个学生C、总体的一个样本D、样本容量3、一个总体中共有200个个体,用简单随机抽样的方法从中抽取一个容量为20的样本,则某一特定个体被抽到的可能性是。
4、从3名男生、2名女生中随机抽取2人,检查数学成绩,则抽到的均为女生的可能性是。
系统抽样的定义:一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样。
例题:例1.某单位在职职工共624人,为了调查工人用于上班途中的时间,决定抽取10%的工人进行调查,试采用系统抽样方法抽取所需的样本。
例2.从编号为150的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是()C()2,4,6,16,32DA()3,13,23,33,43()5,10,15,20,25B()1,2,3,4,51.从2005个编号中抽取20个号码入样,采用系统抽样的方法,则抽样的间隔为()(A)99 (B)99.5 (C)100(D)100.52.从学号为0~50的高一某班50名学生中随机选取5名同学参加数学测试,采用系统抽样的方法,则所选5名学生的学号可能是()(A)1,2,3,4,5 (B)5,16,27,38,49 (C)2, 4, 6, 8 (D)4,13,22,31,403.某校高中三年级的295名学生已经编号为1,2,……,295,为了了解学生的学习情况,要按1:5的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程。