不等概抽样ppt课件
- 格式:ppt
- 大小:377.00 KB
- 文档页数:28
Chap7 不等概抽样教学要求:重难点:引语:前面介绍的简单随机抽样的一个特点是对各单元同等对待.实践中常有总体中的各单元处于不同的地位,各单元规模有较大差异.如调查某地区小麦的产量,以村作为抽样单元,各村拥有的麦地面积是不一样的;又如估计一个城市的商业销售总额,对各销售网点进行调查。
各销售网点规模差异很大,有的年销售额几个亿,有的几十万元,有的几千元.这时若仍将各单元平等对待显然不合理,拥有较多麦地或规模较大的销售网点显然更重要。
这时有两处处理方法:一种是将抽样单元(各销售网点)按规模大小分成若干类,以类为层进行分层抽样,各层的抽样比设置成不一样,规模大的层抽样比高一些,规模小的层抽样比可以低一些,少数特大规模的进行100%抽样(即普查),这种抽样方法叫目录抽样。
另一种是考虑得比较细一些,也就是将各个单元的入样概率与单元的规模联系起来:大单元抽到的概率大,小单元抽到的概率小,这就是不等概抽样.7.1主要分类方式一:按抽样单元是否放回分为:● 放回不等概率抽样,特点:样本相互独立,数据处理简单(可以说抽样调查中的放回抽样主要用于不等概率抽样)● 不放回不等概率抽样,特点:效率常常更高,但是无独立性,实施起来和方差估计比较复杂。
方式二:按放回抽样中的每个单元每次被抽到的概率或不放回抽样中最终样本中包含某个单元的概率是否严格的与单元大小成比例。
7.2PPS抽样1. 基本概念设总体中包含N 个,对其进行放回抽样,在每次抽样中,抽到第i 个单元的概率为Zi ,11Nii Z==∑,独立地进行这样的抽样n 次,共抽到n 个单元(可能有重复),称这种不等概率抽样为多项抽样。
多项抽样中,若第i 个单元的入样概率Zi 正比于其大小或规模的度量M i ,即010() Nii i i M Z M M M ===∑称这种单元的入样概率正比于单元规模测度的放回抽样为PPS抽样(sampling with probabilityproportional to size )。
第6章 不等概率抽样1 不等概率抽样原理等概率抽样通常容易设计和解释,但并不总是如不等概率抽样一样的可行、实用、有效。
因为等概率抽样(psu’s)可能导致方差很大(尤其是对于无偏估计量)、管理困难以及成本难以控制。
而不等概率抽样的特点是以不等概率抽取psu’s 、m i 的数目相同,因此不等概率抽样使得每一个样本被抽取的概率相等、调查成本可控、每一个初级样本单元(psu )的样本数相等、方差急剧减小。
当采用不等概率抽样时,我们可以自由的调整选择不同初级样本单元(psu’s )作为样本的概率,并在估计中补充合适的权重。
核心是选择一个给定单元的概率已知: πi =P(psu i), ψi = P(psu i on first sample), ωi =1/πi1.1 抽取一个初级样本单元假定我们只要抽取N 个初级样本单元(psu )中的一个作为样本(n=1)。
初级样本单元i 的总值用t i 表示,我们需要估计总体总值t.用抽取一个初级样本单元的简单例子来说明不等概率抽样的思想。
先来考虑一个所有总体已知的情形。
一个城镇拥有四个超市,从100平方米到1000平方米按面积大小排列。
通过抽取一个超市,来估计四个超市上个月的总营业收入。
你可能预期大超市比小超市的营业收入多而且大超市的收入波动性也明显大于小超市。
因为仅抽取一个超市,所以在第一个回合中一个超市被抽取的概率 ψi 等于这个超市包含在样本中的概率πi 。
即,πi = ψi =P(超市i 被选取),此概率与超市的面积成比例。
超市A 占四个超市总面积的1/16,则它被抽取的概率为1/16。
为了说明性目的,假定我们已知总体的所有总值t i :我们可以以以上给定的概率选择一个容量为1的概率样本,通过洗散16张卡片并从中选择1张。
如果卡片数字为1,则选择超市A;如果卡片数字为2或3,则选择超市B;…… 在估计量中,我们通过使用 ψi 补充选取的不等概率权重。
如果超市面积与超市营业收入近似成比例,那么超市A 的营业收入在总收入的1/16,则可用超市A 的营业收入的16倍来估计四个超市的总收入。