分层抽样(计算详解)
- 格式:docx
- 大小:37.28 KB
- 文档页数:2
【抽样调查】分层随机抽样第2部分:分层随机抽样⽬录概述分层随机抽样的思路:当N ,n 都较⼤,总体单元之间的差异也较⼤时,简单随机抽样会出现⾼成本、低精度情形,解决⽅法是将总体划分为若⼲个⼦总体、减少总体单元之间的差异。
假设在各个⼦总体内已经满⾜实施简单随机抽样的条件,则可以在各个⼦总体内独⽴地进⾏简单随机抽样,再将各个⼦总体参数的估计值进⾏加权,得到总体参数的估计。
分层抽样的概念:层:如果⼀个包含N 个单位的总体可以分成不重不漏的L 个⼦总体,即每个单元必定属于且仅属于⼀个⼦总体,则这样的⼦总体称为层。
有N 1+⋯+N L =N 。
分层抽样:在每⼀层中独⽴进⾏抽样,总的样本由各层样本组成,总体参数⼜按照各层样本参数的汇总作出估计。
有n 1+⋯+n L =n 。
分层随机抽样:每层的样本,都独⽴地按照简单随机抽样进⾏,这样的分层抽样称为分层随机抽样。
符号规定:h :层。
从⽽N h 代表第h 层的单位总数,n h 代表第h 层的样本数。
i :层内单位号。
从⽽Y hi 代表第h 层第i 个总体单元,y hi 代表第h 层第i 个样本单元。
W h :层权,即W h =N h N 。
f h :层内抽样⽐,即f h =n hN h 。
¯Yh,Y h,S 2h:层内总体参数(均值、总值与⽅差)。
¯y h ,y h ,s 2h:层内样本参数(样本均值、样本总值与样本⽅差)。
简单估计量分层抽样⾸先根据各层的样本,计算出各层均值¯Y h的适当估计值ˆ¯Y h ,然后再使⽤总体层权加权平均,得到总体均值¯Y 的估计,即ˆ¯Y st =L∑h =1W h ˆ¯Y h =1N L∑h =1N h ^¯Y h .对于分层随机抽样,每⼀层的ˆ¯Y h就是h 层的样本均值¯y h ,即ˆ¯Y st =L∑h =1W h ¯y h =1N L∑h =1N h ¯y h .注意这⾥的线性形式。
实验题目:1、某居委会辖有三个居民新村,居委会欲对居民购买彩票的情况进行调查。
调查者考虑以新村分层,在每个新村中随机抽取了10个居民户并进行了调查每户最近一个月购买彩票花费的金额(元),下表为每个新村及调查的情况:请估计该小区居民户购买彩票的平均支出,并给出估计的标准差。
给出95%的置信区间,并与简单随机抽样进行精度比较。
2、随着经济发展,某市居民正在悄悄改变过年的习惯,虽然大多数居民除夕夜在家吃年夜饭、看电视节目,但是有些家庭到饭店吃年夜饭,或逛夜市,或用过年的假期到外地旅游。
为研究这种现象,某研究机构以市中心165万居民户作为研究对象,将居民户按6个行政区分层,每个行政区随机抽取了30户居民户进行了调查(各层抽样比可以忽略),每个行政区的情况以及在家吃年夜饭、看电视节目的居民户比例如下表:试估计该市居民在家吃年夜饭的比例,并给出估计的标准差。
9.030273011===a p933.030283022===a p9.030273033===a p 867.030263044===a p933.030283055===a p 967.030293066===a p867.0*09.09.0*14.0933.0*21.09.0*18.0+++==∑pw p hHhst923.0967.0*22.0933.0*16.0≈++06.0*933.0*301*1.0*9.0*301*)1(1)(ˆ21.018.0222+=--=∑p p nf w p hhhhhhstV067.0*933.0*301*133.0*867.0*301*1.0*9.0*301*16.009.014.0222+++838.322.042033.0*967.0*301*-=+P:[)(ˆ96.1p pststV±]=[0.923±1.96*838.34-]=[0.866,0.979]。
分层抽样的案例(文档3篇)以下是网友分享的关于分层抽样的案例的资料3篇,希望对您有所帮助,就爱阅读感谢您的支持。
第一篇某市有300所小学,共有240000名学生,这些小学分布在全市5个行政区中,其中重点小学有30所,一般小学有240所,较差的小学有30所。
现在要从全市小学生中抽取1200名学生进行调查,以了解全市小学生的学习情况。
请设计一份抽样方案。
答:分层抽样方案:1、因为有300所小学,240000名学生,假设每所小学的学生人数相同,所以每所小学有学生人数800名。
2、又因为有重点小学30所,一般小学240所,较差小学30所,所以重点小学有学生人数24000名,一般小学有学生人数192000名,较差小学有学生人数24000名。
3、因为要从240000名学生中抽取1200名学生进行调查,所以1200:240000=1:200,即每200名学生中抽取1名学生进行调查,所以由第2步得出24000×1/200=120名;192000×1/200=960名;24000×1/200=120名,然后按照简单随机抽样的方法分别抽取相应的人数。
4、综上所述,要从240000名学生中抽取1200名学生进行调查,应当从30所重点小学中抽取120名学生,从240所一般小学中抽取960名学生,从30所较差小学中抽取120名学生,共计1200名学生。
第二篇作者:金勇进石可统计研究2000年02期一、问题的提出分层抽样中样本量在各层中如何分配,这是抽样设计中的一个重要问题。
计算各层的样本量需要一些辅助信息,如各层中目标变量的方差。
在抽样调查的实践中,特别是一次性的抽样调查中,上述所需的辅助信息常常不具备,因此,我们面临着在信息量最小的条件下如何在各层中分配样本量的问题。
本文产生于作者在美国NORC(National Opinion Research Center)进行研究期间所做的调查设计中的一个实例,这里对其进行了归纳,,加工,提炼与析,希望能够就极小信息量条件下如何在分层抽样中进行样本量的分配这一问题提供一种思考的途径。
实验题目:
1、某居委会辖有三个居民新村,居委会欲对居民购买彩票的情况进行调查。
调查者考虑以新村分层,在每个新村中随机抽取了10个居民户并进行
了调查每户最近一个月购买彩票花费的金额(元),下表为每个新村及
调查的情况:
请估计该小区居民户购买彩票的平均支出,并给出估计的标准差。
给出95%的置信区间,并与简单随机抽样进行精度比较。
2、随着经济发展,某市居民正在悄悄改变过年的习惯,虽然大多数居民除
夕夜在家吃年夜饭、看电视节目,但是有些家庭到饭店吃年夜饭,或逛
夜市,或用过年的假期到外地旅游。
为研究这种现象,某研究机构以市
中心165万居民户作为研究对象,将居民户按6个行政区分层,每个行
政区随机抽取了30户居民户进行了调查(各层抽样比可以忽略),每个
行政区的情况以及在家吃年夜饭、看电视节目的居民户比例如下表:
试估计该市居民在家吃年夜饭的比例,并给出估计的标准差。
9.03027301
1
===a p
933.030
283022===a p
9.030
27
303
3
===a p 867.03026304
4
===a p
933.030283055
===
a p 967.03029306
6
===a p
867.0*09.09.0*14.0933.0*21.09.0*18.0+++==∑p
w p h
H
h
st
923.0967.0*22.0933.0*16.0≈++
06.0*933.0*301
*1.0*9.0*301*)1(1)(ˆ21.018.02
2
2+=--
=∑p p n
f w p h
h
h
h
h
h
st
V
067.0*933.0*301*133.0*867.0*301*1.0*9.0*301*
16.009.014.02
22
+++
838.322.04
2
033.0*967.0*30
1*
-=+
P:[
)(ˆ96.1p p
st
st
V
±]=[0.923±1.96*838
.34
-]=[0.866,0.979]。