当前位置:文档之家› 常见的随机抽样方法介绍

常见的随机抽样方法介绍

常见的随机抽样方法介绍
常见的随机抽样方法介绍

抽样方法介绍

朱一军

福建省产品质量检验研究院

、随机方法选择及随机数产生

按照GB/T 10111-2008《随机数的产生及其在产品质量抽

样检验中的应用程序》的要求,并根据受检单位的产品堆放形式、基数(批量)大

小,确定抽样方法(通常包括简单随机抽样、分层随机抽样、系统抽样、整群抽

样、全数抽样五种方法

)。

随机数一般可使用随机数表、骰子或扑克牌中任选一种方式产生。

(一)简单随机抽样

(抽签法、随机样数表法)常常用于总体个数较少时,它的主要特征是从总

体中逐个抽取;

优点:操作简便易行

缺点:总体过大不易实行

1.定义:

一般地,设一个总体含有N个个体,从中逐个不放回地抽取

n个个体作为样本(nW N ,如果每次抽取式总体内的各个个体被抽到的机会都相

等,就把这种抽样方法叫做简单随机抽样。

2.简单随机抽样方法

(1)抽签法

一般地,抽签法就是把总体中的N个个体编号,把号码写在

号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取

n次,就得到一个容量为n的样本。

抽签法简单易行,适用于总体中的个数不多时。当总体中

的个体数较多时,将总体“搅拌均匀”就比较困难,用抽签法产生的样本代表性差的可能性很大)

2)随机数法

随机抽样中,另一个经常被采用的方法是随机数法,即利用随机数表、随机数骰子或计算机产生的随机数进行抽样。

二)分层抽样

Stratified Random Sampling)

主要特征分层按比例抽

样,主要使用于总体中的个体有明显差异。共同点:每个个体被抽到的概率都相等N/M。

定义

般地,在抽样时,将总体分成互不交叉的层,然后按照

定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样

stratified sampling )。

三)系统抽样

当总体中的个体数较多时,采用简单随机抽样显得较为费事。这时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样叫做系统抽样。

步骤:

般地,假设要从容量为N 的总体中抽取容量为n 的样本,

我们可以按下列步骤进行系统抽样:

(1)先将总体的N个个体编号。

(2)确定分段间隔k,对编号

进行分段。当N/n (n是样本

容量)是整数时,取k=N/n;

(3)在第一段用简单

随机抽样确定第一个个体编号l (l w

k);

4)按照一定的规则抽取样本。通常是将l 加上间隔k 得

到第2个个体编号(l+k ),再加k得到第3个个体编号(l+2k ), 依次进行下去,直到获取整个样本。

小结:三种抽样方法的比较

1、类别:①简单随机抽样②系统抽样③分层抽样

2、共同点:(1) 抽样过程中每个个体被抽到的可能性相等

(2) 每次抽出个体后不再将它放回,即不放回抽样

3、各自特点:①从总体中逐个抽取②将总体均分成几部分按事先确定的规则在各部分抽取③将总体分成层,分层进行抽取

4、相互联系:①无②在起始部分抽样时采用简单随机抽样③ 各层抽样采用简单随机抽样或系统抽样

5、适用范围①总体中个体数较少②总体中个体数较多③总体由差异明显的几部分组成

四)整群抽样

什么是整群抽样(Cluster sampling)

整群抽样又称聚类抽样。是将总体中各单位归并成若干个互不交叉、互不重复的集合,称之为群;然后以群为抽样单位抽取

样本的一种抽样方式。

应用整群抽样时,要求各群有较好的代表性,即群内各单位

的差异要大,群间差异要小。

整群抽样的优缺点:

整群抽样的优点是实施方便、节省经费;

整群抽样的缺点是往往由于不同群之间的差异较大,由此而引起的抽样误差往往大于简单随机抽样。

整群抽样的实施步骤:

先将总体分为i 个群,然后从i 个群钟随即抽取若干个群,对这些群内所有个体或单元均进行调查。抽样过程可分为以下几个步骤:

、确定分群的标注

二、总体(N)分成若干个互不重叠的部分,每个部分为一群。

三、据各样本量,确定应该抽取的群数。

四、采用简单随机抽样或系统抽样方法,从i 群中抽取确定的群数。

例如,调查中学生患近视眼的情况,抽某一个班做统计;进

行产品检验;每隔8h 抽1h 生产的全部产品进行检验等。

整群抽样与分层抽样的区别

整群抽样与分层抽样在形式上有相似之处,但实际上差别很大。

分层抽样要求各层之间的差异很大,层内个体或单元差异小,而整群抽样要求群与群之间的差异比较小,群内个体或单元差异大;

分层抽样的样本是从每个层内抽取若干单元或个体构成,而整群抽样则是要么整群抽取,要么整群不被抽取。

二、常见的简单随机抽样方法介绍

1、随机数表法

1.1 随机数表简介

随机数表是一组由0 到9 数字组成的表,每个数字都有相同的概率出现在每个位置上。

附录A提供了五张50 X 50的随机数表(见表A. 1?表A. 5)。

如表A.1 不敷使用也可选择其他合适的随机数表。

1. 2获得随机数R的方法

a)确定随机数表号与初始点:首先在第一张表上随机指定一点,以它为起点依次向右读取5 个数字,第一个数字若小于5,

则取该数加1 作为选定的随机数表号,若第一个数字大于或等于

5,则取该数减4 之差作为选定的随机数表号。第2?3 位和4?

5 位组成两个两位数,若两位数小于50,则加上1 ,若两位数大于或等于50,则减去49,最后所得的数表示初始点所在的行数和列数。

b) 获得R0的方法:从初始点依次向下读取所需m位数得到所需的随机数R0。在读取过程中,若读到该页的最后一行则转到第一行依次读取后m列,若最后剩下的几列不足m列则从下一号表的第一列开始依次补上。

1.3 读取样本单元编号R

a)如获得的随机数RW N贝y随机数R就取R);若9N, 则设R=K i N+R,其中K i=[N/R],当(K i+1)N>10m时,舍弃并重新生成随机数R D;当(K i+1)N< 10m时,则取R=R(若0vRvN)或取R=N(若R=0)。重复上述过程,直到获得n个不同的随机数为止。

b)为了提高效率,可以采用下述方法:如获得的随机数

R)< N则随机数R就取R;若R>N,则取一个大于N的适当整数M 一般取M=2X 10m-1, 2.5 X 10m-1, 3X 10m-1或5X 10m-1。

设R=KM+艮其中K2=[ R)/M],则当(K2+1)M>10m时,舍弃并重新生成随机数R0;

当(K2+1)M< 10"时,贝y R=R(若OvRvN)或R=N(若R=0)或舍弃重新生成(若艮〉N)。重复上述过程,直到获得n个不同的随机数为止。

注1:当N 小于200,而所得读数大于200,取读数减去200

的倍数,若其差数小于或等于N则作为所要的随机数,若差数大于N则舍弃;当200vN< 500,而所得读数大于500,则取读数减去500,其差数作为所要的随机数。

注2:若采用注1 的方法.读取所需随机数的效率会更高。

2、随机抽样骰子法

1随机数骰子构成及其使用方法1.1随机数骰子的构成

随机数骰子是均匀材料制成的正二十面体,各面上刻有0?9 的数字各2个。图1为其底视图与俯视图。每套骰子由盒体、盒盖及数种不同颜色的骰子组成,如图

相关主题
文本预览
相关文档 最新文档