分层抽样(计算详解)

格式：docx
大小：37.28 KB
文档页数：2

下载文档原格式

分层抽样

分层抽样
分层抽样
抽样技术作为现代统计学科体系的重要组成部分，被广泛运用到社会实践当中。自从 1895 年挪威首任中央统计局局长凯尔在伯尔尼第五届国际统计学会会议上提出所谓“代表性调查”的抽样方法以来，经过 100 多年的理论探讨和时间积累，抽样理论更加科学，抽样技术日臻完善。抽样又称取样。其原理是从研究的全部样品中抽取一部分样品单位。从被抽取样品单位的分析、研究结果来估计和推断全部样品特性，是科学实验、质量检验、社会调查普遍采用的一种经济有效的工作和研究方法。基本的抽样技术包括简单随机抽样，系统抽样，分层抽样，多阶段抽样等。在实际的抽样调查中我们常常会根据调查成本，调查规模等结合运用各种抽样方法进行实践。
然后，在每个层中分别独立地进行抽样。
1-1、分层抽样的总体均值估计
在分层抽样中，对总体均值Y 的估计是通过对各层Yh 的估计，安权层Wh 加权
平均得到的，公式为
Yˆst l WhYˆh 1 l NhYˆh
h1
N h1
如果得到的是分层随机样本，则总体均值Y 的简单估计为
yˆst l Whyh 1 l Nhyh
3
Whsh 0.4920+1.2543+3.0744=4.8207
h1
因此按尼曼分配时，各层应分配的样本量为
n1 n
W1s1
3
Wh sh
40 0.4920 4.0824 4.8207
h1
故
n2 12.290
n3 23.8235
即各层的样本量分别为 4,12,24.
此时的样本估计量的方差为
3 WhSh
Vopt( yst) h1
ch
3
WhSh
n
h1

系统抽样和分层抽样

)综合每层抽样，组成样本.
简单随机抽样、系统抽样、分层抽样的比较
类别简单随机抽样系统抽样共同点各自特点从总体中逐个抽取（1）抽样过程中每个个体被抽到的可能性相等（2）每次抽出个体后不再将它放回，即不放回抽样联系适用范围总体中个体较少
2.书59第3题
3.一个总体中有100个个体,随机编号为0,1,2,…,99, 依编号顺序平均分成10个小组,组号分别为 1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m,那么在第 k组抽取的号码个位数字与m+k的个位数字相同.若 m=6,则在第7组中抽取的号码是______. 63
(1)总体、个体、样本、样本容量分别是什么？
(2)能否在2500名学生中随机抽取100名学生？为什么？
不能
不具有好的代表性不具有好的代表性
(3)能否在三个年级中平均抽取？
不能
创设情景：
某校高一、高二和高三年级分别有1000，800和700名，为了了解全校学生的视力情况，从中抽取容量为100的样本，你认为应当怎样抽取样本较为合理？
解析:依编号顺序平均分成的10个小组分别为 0~9, 10~19, 20~29, 30~39, 40~49,50~59,60~69,70~79,80~89,90~9 9.因第7组抽取的号码个位数字应是3,所以抽取的号码是63. 这个样本的号码依次是 6,18,29,30,41,52,63,74,85,96这10个号.
例2：一个地区共有5个乡镇，人口15万人，其中人口比例为3：2：5：2：3，现从15万人中抽取一个1500 人的样本，分析某种疾病的发病率，已知这种疾病与不同的地理位置及水土有关，问应采取什么样的方法？并写出具体过程。

【抽样调查】分层随机抽样

【抽样调查】分层随机抽样第2部分：分层随机抽样⽬录概述分层随机抽样的思路：当N ,n 都较⼤，总体单元之间的差异也较⼤时，简单随机抽样会出现⾼成本、低精度情形，解决⽅法是将总体划分为若⼲个⼦总体、减少总体单元之间的差异。

假设在各个⼦总体内已经满⾜实施简单随机抽样的条件，则可以在各个⼦总体内独⽴地进⾏简单随机抽样，再将各个⼦总体参数的估计值进⾏加权，得到总体参数的估计。

分层抽样的概念：层：如果⼀个包含N 个单位的总体可以分成不重不漏的L 个⼦总体，即每个单元必定属于且仅属于⼀个⼦总体，则这样的⼦总体称为层。

有N 1+⋯+N L =N 。

分层抽样：在每⼀层中独⽴进⾏抽样，总的样本由各层样本组成，总体参数⼜按照各层样本参数的汇总作出估计。

有n 1+⋯+n L =n 。

分层随机抽样：每层的样本，都独⽴地按照简单随机抽样进⾏，这样的分层抽样称为分层随机抽样。

符号规定：h ：层。

从⽽N h 代表第h 层的单位总数，n h 代表第h 层的样本数。

i ：层内单位号。

从⽽Y hi 代表第h 层第i 个总体单元，y hi 代表第h 层第i 个样本单元。

W h ：层权，即W h =N h N 。

f h ：层内抽样⽐，即f h =n hN h 。

¯Yh,Y h,S 2h：层内总体参数（均值、总值与⽅差）。

¯y h ,y h ,s 2h：层内样本参数（样本均值、样本总值与样本⽅差）。

简单估计量分层抽样⾸先根据各层的样本，计算出各层均值¯Y h的适当估计值ˆ¯Y h ，然后再使⽤总体层权加权平均，得到总体均值¯Y 的估计，即ˆ¯Y st =L∑h =1W h ˆ¯Y h =1N L∑h =1N h ^¯Y h .对于分层随机抽样，每⼀层的ˆ¯Y h就是h 层的样本均值¯y h ，即ˆ¯Y st =L∑h =1W h ¯y h =1N L∑h =1N h ¯y h .注意这⾥的线性形式。

分层抽样(计算详解)

实验题目：1、某居委会辖有三个居民新村，居委会欲对居民购买彩票的情况进行调查。

调查者考虑以新村分层，在每个新村中随机抽取了10个居民户并进行了调查每户最近一个月购买彩票花费的金额（元），下表为每个新村及调查的情况：请估计该小区居民户购买彩票的平均支出，并给出估计的标准差。

给出95％的置信区间，并与简单随机抽样进行精度比较。

2、随着经济发展，某市居民正在悄悄改变过年的习惯，虽然大多数居民除夕夜在家吃年夜饭、看电视节目，但是有些家庭到饭店吃年夜饭，或逛夜市，或用过年的假期到外地旅游。

为研究这种现象，某研究机构以市中心165万居民户作为研究对象，将居民户按6个行政区分层，每个行政区随机抽取了30户居民户进行了调查（各层抽样比可以忽略），每个行政区的情况以及在家吃年夜饭、看电视节目的居民户比例如下表：试估计该市居民在家吃年夜饭的比例，并给出估计的标准差。

9.030273011===a p933.030283022===a p9.030273033===a p 867.030263044===a p933.030283055===a p 967.030293066===a p867.0*09.09.0*14.0933.0*21.09.0*18.0+++==∑pw p hHhst923.0967.0*22.0933.0*16.0≈++06.0*933.0*301*1.0*9.0*301*)1(1)(ˆ21.018.0222+=--=∑p p nf w p hhhhhhstV067.0*933.0*301*133.0*867.0*301*1.0*9.0*301*16.009.014.0222+++838.322.042033.0*967.0*301*-=+P:[)(ˆ96.1p pststV±]=[0.923±1.96*838.34-]=[0.866,0.979]。

分层抽样的案例（文档3篇）

分层抽样的案例（文档3篇）以下是网友分享的关于分层抽样的案例的资料3篇，希望对您有所帮助，就爱阅读感谢您的支持。

第一篇某市有300所小学，共有240000名学生，这些小学分布在全市5个行政区中，其中重点小学有30所，一般小学有240所，较差的小学有30所。

现在要从全市小学生中抽取1200名学生进行调查，以了解全市小学生的学习情况。

请设计一份抽样方案。

答：分层抽样方案：1、因为有300所小学，240000名学生，假设每所小学的学生人数相同，所以每所小学有学生人数800名。

2、又因为有重点小学30所，一般小学240所，较差小学30所，所以重点小学有学生人数24000名，一般小学有学生人数192000名，较差小学有学生人数24000名。

3、因为要从240000名学生中抽取1200名学生进行调查，所以1200:240000=1:200，即每200名学生中抽取1名学生进行调查，所以由第2步得出24000×1/200=120名；192000×1/200=960名；24000×1/200=120名，然后按照简单随机抽样的方法分别抽取相应的人数。

4、综上所述，要从240000名学生中抽取1200名学生进行调查，应当从30所重点小学中抽取120名学生，从240所一般小学中抽取960名学生，从30所较差小学中抽取120名学生，共计1200名学生。

第二篇作者：金勇进石可统计研究2000年02期一、问题的提出分层抽样中样本量在各层中如何分配，这是抽样设计中的一个重要问题。

计算各层的样本量需要一些辅助信息，如各层中目标变量的方差。

在抽样调查的实践中，特别是一次性的抽样调查中，上述所需的辅助信息常常不具备，因此，我们面临着在信息量最小的条件下如何在各层中分配样本量的问题。

本文产生于作者在美国NORC（National Opinion Research Center）进行研究期间所做的调查设计中的一个实例，这里对其进行了归纳，，加工，提炼与析，希望能够就极小信息量条件下如何在分层抽样中进行样本量的分配这一问题提供一种思考的途径。

高中数学(人教B版)必修第二册：分层抽样【精品课件】

10
2．下列试验中最适合用分层抽样法抽样的是( ) A．从一箱 3 000 个零件中抽取 5 个入样 B．从一箱 3 000 个零件中抽取 600 个入样 C．从一箱 30 个零件中抽取 5 个入样 D．从甲厂生产的 100 个零件和乙厂生产的 200 个零件中抽取 6 个入样 D [D 选项中甲、乙生产的零件有差异，最适合分层抽样．]
160 [男生人数为 560×5602＋80420＝160.]14源自合作探究
释疑
难
15
分层抽样的概念【例 1】 (1)下列各项中属于分层抽样的特点的是( ) A．从总体中逐个抽取 B．将总体分成几层，分层进行抽取 C．将总体分成几部分，按事先确定的规则在各部分中抽取 D．将总体随意分成几部分，然后进行随机抽取
(2)分成的各层互不交叉；
(3)各层抽取的比例都等于样本容量在总体中的比例，即Nn ，其中 n 为样本容量，N 为总体容量．
31
2．计算各层所抽取个体的个数时，若 Ni·Nn 的值不是整数怎么办？
[提示] 为获取各层的入样数目，需先正确计算出抽样比Nn，若 Ni·Nn 的值不是整数，可四舍五入取整，也可先将该层等可能地剔除多余的个体．
21
(1)④ (2)分层抽样 [(1)①中对四个饲养房抽取的白鼠平均分，但由于各饲养房所养数量不一，反而造成了每个个体入选的可能性不相等，是错误的方法．②中保证了每个个体入选的可能性相等，但由于没有注意到处在四个不同环境会产生不同差异，不如采用分层抽样可靠性高，且统一编号、统一选择加大了工作量．③中总体采用了分层抽样，但在每个层次中抽取时有一定的主观性，貌似随机，实则每个个体被抽到的可能性无法保证相等．
11
3．甲校有 3 600 名学生，乙校有 5 400 名学生，丙校有 1 800 名学生，为统计三校学生某方面的情况，计划采用分层抽样法抽取一个容量为 90 的样本，应在这三校分别抽取学生( )

分层抽样和随机抽样详解

例1：某地农田分布在山地、丘陵、平原、洼地不同的地形上，要对这个地区的农作物产量进行调查，应当采用什么抽样方法？解：由于不同类型的农田之间的产量有较大差异，应当采用分层抽样的方法，对不同类型的农田按其占总数的比例来抽取样本.
例2：某公司有1000名员工，其中：高层管理人员为50名，属于高收入者；中层管理人员为150名，属于中等收入者；一般员工为800 名，属于低收入者.要对这个公司员工的收入情况进行调查，欲抽
2.2 分层抽样与系统抽样
1. 正确理解分层抽样、系统抽样的概念，掌握分层抽样、系统抽样的一般步骤. 2. 掌握分层抽样、系统抽样的特点，并能根据
实际问题确定选用哪种抽样方法.
自学导引
分层抽样的概念
属性特征分成若干类型(有时称作层)，然将总体按其_________ 随机抽取一定的样本，这种抽样方法后在每个类型中_____ 称为分层抽样，有时也称为类型抽样．
调查方案.
解：我们可以采用系统抽样，按照下面的步骤设计方案. 第一步按生产时间将一天分为50个时间段，也就是说，每个时间段
大约生产
10000 = 200 件产品.这时，抽样距就是200. 50
第二步将一天中生产的机器零件按生产时间进行顺序编号.比如，第一个生产出的零件就是0号，第二个生产出的零件就是1号等.
第一步把这些图书分成40个组，由于 362 的商是9，余数是2，所以每个组有9册书，还剩2册书.这时，抽样距就是9.
40
第二步先用简单随机抽样的方法从这些书中抽取2册书，不进行检验. 第三步将剩下的书进行编号，编号分别为0，1，...，359. 第四步从第一组（编号分别为0,1,…,8）的书中按照简单随机抽样的方法，抽取1册书，比如说，其编号为k. 第五步顺序地抽取编号分别为下面数字的书：k+9,k+18,k+27,…,k+39×9,

2.1.3 分层抽样

分析：保证每个个体等可能入样是简单随机抽样、系统抽样、分层抽样共同的特征.
（2）如果采用分层抽样，从个体数为N的总体中抽取一个容量为n样本，那么每个个体被抽到的可能性为（ C ）
1 A． N
1 B. n
n C. N
D. N
n
分析:根据每个个体都等可能入样，所以其可能性等于样本容量与总体容量之比.
定层抽取容量
抽样组样结束
要点分析：（1）当总体是由差异明显的几个部分组成时 ,往往选用分层抽样的方法.
（2）每个个体被抽中的可能性相同（3）每一层抽取的数=
该层个体数总体个体数样本 × 容量
〖探究交流〗（1）分层抽样又称类型抽样，即将相似的个体归入一类（层），然后每层抽取若干个体构成样本，所以分层抽样为保证每个个体等可能入样，必须进行（C） A、每层等可能抽样 B、每层不等可能抽样 C、所有层按同一抽样比等可能抽样 D、以上答案都不对
B.分层抽样法,简单随机抽样法 C.系统抽样法,分层抽样法 D.简单随机抽档法,分层抽样法
5、某单位有工程师6人,技术员12人,技工18 人,要从这些人中抽取一个容量为n的样本;如果采用系统抽样和分层抽样方法抽取,不用剔除个体; 如果样本容量增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,求得样本容量为___. 6
4、(2004年全国高考湖南卷)某公司在甲、乙、丙、丁四个地区分别有150个、120个、180 个、150个销售点，公司为了调查产品销售的情况，需从这600个销售点中抽取一个容量为100的样本，记这项调查为①；在丙地区中有20个特大型销售点，要从中抽取7个调查其销售收入和销后服务等情况，记这项调查为②.则完成①、②这两项调查采用的抽样方法依次是( B ) A.分层抽样法,系统抽样法

抽样技术第4章分层抽样

4.7 事后分层
在实际当中，有时进行事先分层会存在一定的困难。 1.各层的抽样框无法得到。 2.几个变量都适合于分层，而要进行事先的多重交叉分层存在一定困难。 3.总体规模太大，事先分层太费事等。在这种情况下，就可以考虑采用事后分层技术。
事后分层的具体实施办法是：先采用简
单随机抽样的方法从总体中抽取一个样本
第四章分层抽样
4.1 什么是分层抽样
在例2.4中我们用简单随机抽样估计每个郡的平均农场面积。我们提到，即使我们认真细致地产生了一个随机样本，还是有一些地区被过分代表，而另一些则根本没有代表。例4.1用分层抽样保持分层变量在样本中的均衡，从而使得总体得到全面的估计。
使用分层抽样的理由： 1.我们要防止得到一个很差的样本。
分层抽样比例
如我们在2.3中所观察到的一样，比例是取
值为0到1之间的一个变量的均值，为了得
到比例的推断，我们用等式（4.1）—
（4.5），其中
，
，
则有
估计总体单元的总数有一个特别相似的性质：
因此，总体单元的总数估计量是每层总数估
计量之和。类似有
。
例4.3 美国团体学习委员会（ACLS）用分层随机抽样在七门学科中选取ACLS中的团体研究出版物格局和属于这些团体的学者使用电脑和图书馆的情况。数据见表4.2.
单元数。这样第h层中第j个单元入样的概率
为
。因此，抽样权重只是抽样概率
的倒数：
（4.8）
抽样权重之和等于总体容量N，每个抽样单元代表一特定数量的总体单元。因此，整个样本代表整个总体。这个定义可以用于检验权重变量是否正确：如果样本权重之和是其它的数，而不是N，那么肯定有某个地方出错了。总体总数的估计量可以写成以下形式：

9.1.2分层随机抽样

解: 采用分层抽样较合理.由样本容量为400, 中,青,老职工所占比例为5:3:2,所以应抽取
中年职工为: 400 5 200人 10
青年职工为:400 3 120人 10
老年职工为:400 2 80人 10
例 2 某市的 3 个区共有高中学生 20 000 人，且 3 个区的高中学生人数之比为 2∶3∶5，现要从所有学生中抽取一个容量为 200 的样本，调查该市高中学生的视力情况，试写出抽样过程．
强调两点：
（1）分层抽样是等概率抽样，它也是公平的。用分层抽样从个体为N的总体中抽取一个容量为n的样本时，在整个抽样过程中每个个体被抽到的概率相等为n/N。
（2）分层抽样是建立在简单随机抽样的基础上的，由于它充分利用了已知信息，因此它获取的样本更具代表性，在实用中更为广泛。
分层抽样的步骤：
解:(1)确定样本容量与总体的个体数之比100：500=1：5。
12（依5次2）为利，用抽2样8比0确定各,，即年29龄5，5段5应6，抽1取9。的个体数， 5（3）利用简单5随机抽样或系5统抽样的方法，从各
年龄段分别抽取25，56,19人，然后合在一起，就是所抽取的样本。
分层抽样
将总体按其属性特征分成若干类型（有时称作层），然后在每个类型中按照所占比例随机抽取一定的样本。这种抽样方法通常叫作分层抽样，有时也称为类型抽样。
（2）能否在三个年级中平均抽取？
（3）三个年级中个体有较大差别，应如何提高样本的代表性？应考虑他们在样本中所占的比例。
创设情境
（4）如何确定各年级所要抽取的人数？
高一
高二
高三
总计
总体
1000
800
700
2500

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

实验题目：
1、某居委会辖有三个居民新村，居委会欲对居民购买彩票的情况进行调查。

调查者考虑以新村分层，在每个新村中随机抽取了10个居民户并进行
了调查每户最近一个月购买彩票花费的金额（元），下表为每个新村及
调查的情况：
请估计该小区居民户购买彩票的平均支出，并给出估计的标准差。

给出95％的置信区间，并与简单随机抽样进行精度比较。

2、随着经济发展，某市居民正在悄悄改变过年的习惯，虽然大多数居民除
夕夜在家吃年夜饭、看电视节目，但是有些家庭到饭店吃年夜饭，或逛
夜市，或用过年的假期到外地旅游。

为研究这种现象，某研究机构以市
中心165万居民户作为研究对象，将居民户按6个行政区分层，每个行
政区随机抽取了30户居民户进行了调查（各层抽样比可以忽略），每个
行政区的情况以及在家吃年夜饭、看电视节目的居民户比例如下表：
试估计该市居民在家吃年夜饭的比例，并给出估计的标准差。

9.03027301
1
===a p
933.030
283022===a p
9.030
27
303
3
===a p 867.03026304
4
===a p
933.030283055
===
a p 967.03029306
6
===a p
867.0*09.09.0*14.0933.0*21.09.0*18.0+++==∑p
w p h
H
h
st
923.0967.0*22.0933.0*16.0≈++
06.0*933.0*301
*1.0*9.0*301*)1(1)(ˆ21.018.02
2
2+=--
=∑p p n
f w p h
h
h
h
h
h
st
V
067.0*933.0*301*133.0*867.0*301*1.0*9.0*301*
16.009.014.02
22
+++
838.322.04
2
033.0*967.0*30
1*
-=+
P:[
)(ˆ96.1p p
st
st
V
±]=[0.923±1.96*838
.34
-]=[0.866,0.979]。

分层抽样(计算详解)

合集下载

分层抽样

系统抽样和分层抽样

【抽样调查】分层随机抽样

分层抽样(计算详解)

分层抽样的案例（文档3篇）

高中数学(人教B版)必修第二册：分层抽样【精品课件】

分层抽样和随机抽样详解

2.1.3 分层抽样

抽样技术第4章分层抽样

9.1.2分层随机抽样

文档推荐

最新文档