07 第七章整群抽样

格式：doc
大小：748.00 KB
文档页数：15

下载文档原格式

07第七章等距抽样

一般，若随机起为i，则抽中的n/2对样本单元的号码可以表示为
i+2jK,2(j+1)K-i+1］ [j=0,1,…,(n/2)-1]]
当n为奇数时，式中的j由0变到(n-1)/2-1为止，并且，要加上接近末端的第i+(n-1)K个单元。
实际中，为便于对称等距抽样的实施，当N=nK时，可以将原来由小到大(或由大到小)顺序排列的单元按照顺逆交替的次序排列在一个表中，这样，按随机起点等距抽样所抽取的样本即为对称等距样本。所谓顺逆交替是指在单元的排序中，若第一间隔由小到大排序，则第二间隔按由大到小排序，以此类推。
设N=nK,n为偶数。抽样时，先把总体单元分成n/2个抽样间隔，使每一抽样间隔含有2K个单元。然后，在每一抽样间隔内，抽取分别与两端距离相等的两个单元，这样共抽取n个单元组成等距样本。
即：如果随机起点为i，则在第一个抽样间隔所抽两个样本单元的号码分别为i及2K-i+1；在第二个抽样间隔所抽两个样本单元号码为 i+2K 及 2(2K)-i+1；如此，最后在第n/2个抽样间隔所抽两个样本单元号码分别为i+(n-2)K及nK-i+1。
七、累计和等距抽样
以上所讨论的等距抽样都是以各单元大小相同为前提的，是等概率抽样。如果抽样单元的大小不同，且单元的大小又与调查变量相关时，用上述方法就不大合适了，此时，应采用不等概率抽样。
其基本思路是：在总体各单元按某一标志排序后，累计各单元的大小Mi(当各抽样单元的大小用所含下一阶单元的数目表示时，也可直接累计其下一阶单元数)并进行编码，以总的累计数除以n作为抽样间隔，用K表示，然后在最初的1到K个数中随机确定一个数j(1≤j≤K)，j所对应的单元即为第一个被抽中单元，以后每间隔K抽取一个随机数，并按同样的方法确定出对应的单元作为样本单元，组成等距样本。累计和等距抽样的原理同上一章所讨论的群大小不等时群的代码法，此法在实际工作中经常用到。

第七章整群抽样

j 1
y 1 yi i M M
y
j 1
M
总体总值及按群平均的总体均值：
Y Yi Yij
i 1 i 1 j 1 A A M
Y 1 A Y Yi A A i 1
样本总值及按群平均的样本均值：
y yi yij
i 1 i 1 j 1 a a M
• 总体均值 Y 的无偏估计： y y 1 aM aM
V ( y) 1 f 2 Sb aM
1 a y y y ij i a M i 1 j 1 i 1
a
M
• 方差：
2 • 方差的无偏估计： v ( y ) 1 f sb
aM
第二节
群大小相等的整群抽样
LOGO
第一节
抽样方式
LOGO
• 实施理由： ① 缺少调查单位的必要信息无法对其直接编制抽样框实施概率抽样，而由调查单位组成的群是现成的或者群很容易划分从而编制群抽样框非常容易时，常采用整群抽样。 ② 使调查实施便利、节省费用而采用整群抽样。 ③ 对某些由特殊结构的群组成的总体实施整群抽样能使精度有较大提高。
第七章整群抽样
本章要点
LOGO
对于整群抽样，本章给出了群大小相等和群大小不等的整群抽样方法及与之匹配的估计量、估计量的方差及方差的估计量。 • 具体要求： • 掌握群大小相等情形对群进行简单随机抽样简单估计量的无偏性、方差及方差的无偏估计，掌握群的划分原则；了解群内方差、群间方差概念及其对整群抽样精度的影响。 • 掌握群大小不等情形与简单随机抽样相匹配的简单估计量、比率估计量及与抽样相匹配的汉森－赫维茨估计量及性质。 • 掌握估计总体比例的整群抽样方法及简单估计量、比率估计量。

(抽样检验)第七章整群抽样最全版

（抽样检验）第七章整群抽样第七章整群抽样第壹节整群抽样概述壹、整群抽样的概念整群抽样是先将总体各单元划分成若干群（组），然后以群为单位，从中随机抽取壹部分群，对中选群内的所有单元进行全面调查。

确切地说，这种抽样组织形式应称为单级整群抽样。

如果总体中的单元能够分成多级，则能够对前几级单元采用多阶抽样，而在最后壹阶中对该阶抽样单元所包含的全部个体（最基本单元）进行调查，这种抽样称作多级整群抽样。

本章只讨论单级整群抽样。

设总体被划分为Ｎ群，第i群含有Ｍi个次级单元，全部总体次级抽样单元数记为Ｍ0，即Ｍ0＝∑M i。

当诸Ｍi都相等时，称为等群；否则，称为不等群。

采用整群抽样的俩个理由：-抽选群能大大降低数据收集的费用，当总体的分布比较广且调查采用面访时更是如此；-从总体中直接抽选个体在实际中且不总是可行的（没有关于个体的抽样框）；有时，抽选单元组成群体组更简便易行（如整个住户）。

整群抽样包括俩步：首先，总体被分为群；然后，在总体中抽取群的样本且访问群中的所有单元。

如果总体单元是自然分成组或群的，创建壹个这种关于群的抽样框且对它们进行抽样比创建总体中所有单元的名录框更为容易。

或者，无法得到关于总体中所有单元的名录框，但却有这些单元分布地域的地图，因而能够创建地域框。

群的抽取能够采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。

二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大，每个群中有多少单元，及抽中群的数量。

同分层抽样壹样，整群抽样的前提是先要对总体进行分群。

关于群的划分，有俩个问题：壹是如何定义群，即当群且非是壹个自然形成的单位时，确定每个群的组成；二是如何确定群的规模即群的大小。

分层抽样是在各层都进行随机抽样，“层是缩小了的总体”，抽样单元仍然是总体基本单元。

这决定了分层的原则是：尽量缩小层内差异，而扩大层间差异。

而整群抽样只是在各群之间抽取壹部分群进行调查，且在抽中的群内作全面调查。

整群抽样

当各群所含次级单元数相等时，就称群
的大小相等；当各群所含次级单元数不相等时，就称群的大小不相等。
第二节群规模相等时的估计
一、符号说明二、估计量三、整群抽样效率分析

一、符号说明
设总体有N个群,每个群包含的单元数M相等 (或相近). 符号: 总体群数: N 样本群数:n 总体第 i 群中第 j 个单元的指标值: Yij 样本第 i 群中第 j 个单元的指标值: yij 第 i 群中的单元数: M i

注意：整群抽样的随机性体现在群与群间不重叠，也无遗漏，群的抽选按概率确定。如果把每一个群看作一个单位，则整群抽样可以被理解为是一种特殊的简单随机抽样。整群抽样是由一阶抽样向多阶段抽样过渡的桥梁.此章介绍的是单阶段整群抽样.

(二)特点优点： 1. 抽样框编制得以简化。
M1 M 2 ... M N M
它们之间的关系为：
1 2 2 S [( N 1) Sb N ( M 1) S w ] NM 1
2
M 仍为M ，不难将 Y 改为 y ，n 代替 N ，由于是整群抽样，得到样本方差平方和的关系式：
1 2 2 s [( n 1) sb n( M 1) sw ] nM 1
二、估计量

(一)均值估计量的定义
若群的抽取是简单随机的,且群的大小(M)相等, 则总体均值的估计为:
1 n y yi n i 1 i 1 j 1 nM
n
M
yij
(二)估计量 y 的性质

性质1
y 是 Y 的无偏估计
Y E( y) Y M

性质2
y 的方差为:

抽样技术第七章整群抽样ppt课件

NM
NM
故有可推得
NM
2
(Yij Y )(Yik Y )
c
i1 jk
(M 1)(NM 1)S 2
c
1
NMSw2 (NM 1)S 2
1
Sw2 S2
13
ρc可估计为
ˆc

sb2
sb2 (M
sw2 1) sw2
y 的方差可写成如下形式：
《抽样技术》第七章
1
第七章整群抽样
§7.1 概述 §7.2 群大小相等的情形 §7.3 群大小不相等的情形 §7.4 按与群大小成比例的不等概率抽样抽群
2
§7.1 概述
设总体由N个大单元，即初级单元组成，每个初级单元又由若干个较小的次级单元或二级单元组成。从总体中按某种方式抽取n个初级单元，观测其中所包含的所有次级单元。这种抽样称为整群抽样。确切地说，应称为单阶整群抽样。
1N N 1 i1
Yi Y
2 1 f nM
Sb2
s2 y 1 f
n
1 n
n 1 i1
yi y 2
1 f nM
sb2
其中f=n/N为抽样比。可见，sb2 是Sb2的无偏估计。
8
当n足够大时，总体均值Y 的置信度为1−α的置信区间为：
y u 2s y
例7.1 在一次某城市居民小区居民食品消费量调查中，以每个楼层(相当于居民小组)为群进行整群抽样。每个楼层都有M=8个住户。用简单随机抽样在全部N＝510个楼层中抽取n＝12个楼层。全部96个样本户人均月食品消费额yij及按楼层的平均数yi 与标准差si ，如下表所示。试估计该居民小区人均食品消费额的户平均值，并给出其0.95的置信区间。

(抽样检验)第七章整群抽样

第七章整群抽样第一节整群抽样概述一、整群抽样的概念整群抽样是先将总体各单元划分成若干群（组），然后以群为单位，从中随机抽取一部分群，对中选群内的所有单元进行全面调查。

确切地说，这种抽样组织形式应称为单级整群抽样。

如果总体中的单元可以分成多级，则可以对前几级单元采用多阶抽样，而在最后一阶中对该阶抽样单元所包含的全部个体（最基本单元）进行调查，这种抽样称作多级整群抽样。

本章只讨论单级整群抽样。

设总体被划分为Ｎ群，第i群含有Ｍi个次级单元，全部总体次级抽样单元数记为Ｍ0，即Ｍ0＝∑M i。

当诸Ｍi都相等时，称为等群；否则，称为不等群。

采用整群抽样的两个理由：- 抽选群能大大降低数据收集的费用，当总体的分布比较广且调查采用面访时更是如此；- 从总体中直接抽选个体在实际中并不总是可行的（没有关于个体的抽样框）；有时，抽选单元组成群体组更简便易行（如整个住户）。

整群抽样包括两步：首先，总体被分为群；然后，在总体中抽取群的样本并访问群中的所有单元。

如果总体单元是自然分成组或群的，创建一个这种关于群的抽样框并对它们进行抽样比创建总体中所有单元的名录框更为容易。

或者，无法得到关于总体中所有单元的名录框，但却有这些单元分布地域的地图，因而可以创建地域框。

群的抽取可以采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。

二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大，每个群中有多少单元，及抽中群的数量。

同分层抽样一样，整群抽样的前提是先要对总体进行分群。

关于群的划分，有两个问题：一是如何定义群，即当群并非是一个自然形成的单位时，确定每个群的组成；二是如何确定群的规模即群的大小。

分层抽样是在各层都进行随机抽样，“层是缩小了的总体”，抽样单元仍然是总体基本单元。

这决定了分层的原则是：尽量缩小层内差异，而扩大层间差异。

而整群抽样只是在各群之间抽取一部分群进行调查，并在抽中的群内作全面调查。

因此，群间差异的大小直接影响到抽样误差的大小，而群内差异的大小则不影响抽样误差。

统计学原理第七章抽样调查

29
合
计
x A 2 x A ( d ) f ( d )f d σ f f
2
256 72 σ 50 11504 50 53.63 200 200
2
30
第三节全及指标的推断
一、全及指标的点估计
22
不具有某一标志的单位数用N0表示。 ► 总体成数和标准差与样本成数和标准差的计算方法相同。只是总体指标用大写字母表示，样本指标用小写字母表示。例如： ► 具有某一标志的单位数占总体的比重：
N1 P N
总体成数
n1 p n
样本成数
不具有某一标志的单位数占总体的比重：
N0 Q 1 P N
13
► 2.
（二）中心极限定律 ► 1. 独立同分布中心极限定理：证明不论变量总体服从何种分布，只要它的数学期望和方差存在，从中抽取容量为n 的样本，则这个样本的总和或平均数是个随机变量，当n 充分大时，样本的总和或平均数趋于正态分布.
► 2.
德莫佛-拉普拉斯中心极限定理：证明属性总体的样本成数和样本方差，在n足够大时，同样趋于正态分布。
σ N n σ n μx ( ) μx (1 ) n N 1 n N
2 2
总体单位总数
样本单位总数
抽样比例
21
（一）抽样成数的抽样平均误差μp ► 属性总体的标志值是用文字表示的，且标志只有两个取值，非此即彼，故将属性总体的标志称为“交替标志”或“是非标志”。 ► 交替标志也可以计算平均数（即成数）和标准差。为了计算交替标志的平均数和标准差必须将交替变异的标志过渡到数量标志。 ► 交替标志仍以x表示，设：x =1表示单位具有某一标志， x = 0表示单位不具有某一标志。具有某一标志的单位数用N1表示；

应用抽样技术课件第七章资料.

•但是如果在杭州地区按学校进行抽样，在抽得的几所学校中对该校所有中学生进行全面调查，抽样框的编制和调查实施都大大简化。。 •这就是整群抽样。
4
一、整群抽样的定义及其实施理由
（一）定义若总体可分为 A个初级单位（称为群），每个初
级单位包含若干次级单位。按照某种方式从总体中抽取 a个群，对这些群中的所有次级单位全部进行调查。这种抽样方式称为整群抽样。
第七章整群抽样
cluster sampling
本章要点
本章给出整群抽样的定义，讨论了群大小相等的整群抽样方法及与之匹配的估计量、估计量的方差及方差的估计量。具体要求：
①掌握群大小相等的情形下整群抽样的简单估计量及方差的无偏估计，了解群内方差、群间方差概念及其对整群抽样精度的影响，掌握群的划分原则。
试估计该学校平均每个学生每周的零花钱
宿舍1 宿舍2 宿舍3 宿舍4 宿舍5 宿舍6 宿舍7 宿舍8
学生1 58
91 123 99 110 111 120 96
学生2 83
83
89 105 99 100 115 80
学生3 74
79
94
98 132 116 117 63
学生4 82 111 109 107 87
11
4、整群抽样的最大优点：便于组织实施，节省费用和时间。
• 5、整群抽样的缺点：由于调查单位比较集中、在总体中的分布不够均匀，且群内调查单位指标值或多或少具有一定的正相关性，因此
• 在样本量相同的条件下，整群抽样的精度可能不如简单随机抽样高，尤其当群间差异较大的时候。
• 但由于平均单位调查费用较少，因此可以把节省的费用用来适当扩大群样本量以提高整群抽样的精度。

抽样技术 5 整群抽样

2.群内相关系数：是表达总体中群内小单元间相关程度的一个指标。定义：
(Y

E (Yij Y )(Yik Y ) E (Yij Y )
2 i 1 j k
N
M
ij
Y )(Yik Y )

2 NCM 2 ( Y Y ) ij i 1 j 1 N M
NM 2 (Yij Y )(Yik Y )
学生2
学生3 学生4 学生5 学生6
83
74 82 66 87
83
79 111 101 69
89
94 109 79 80
105
98 107 129 90
99
132 87 99 124
100
116 99 107 105
115
117 99 106 120
80
63 130 105 86
试估计该学校平均每个学生每周的零花钱，并给出置信度为95%的置信区间。
11 22 17 26 16 27
12 33 17 40 24 17
13 15 10 4 6 8
14 17 18 12 11 10
15 13 9 5 7 9
16 18 23 13 15 8
17 33 5 26 30 11
18 26 15 13 17 3
19 7 32 4 6 9
20 15 1 1 6 5
2 ( Y Y ) i N
Y
N 1
i
Y

2
N 1
5.2 群规模大小相等时的估计
3、 V ( y ) 的样本估计为
1 f 2 1 f v( y ) sb nM n
M n s ( yi y)2 n 1 i 1

第七章抽样调查

数据计算出样本均值（平均耐用时间）
x=1055小时，样本成数（合格率） p=91% 依据样本统计量可以对总体参数进行估计（估计方法将在第三节介绍）。
六、抽样推断的基本原理
样本指标 1、理论基础：大数定律中心极限定理 2、抽样估计的基本要求：
无偏性、有效性、一致性
总体指标
第二节抽样组织方式
对无限总体不能采用全面调查。
另外，有些产品的质量检查具有破坏性，不可能进行全面调
查，只能采用抽样调查。从理论上讲，有些现象虽然可以进行全面调查，但实际上没有必要或很难办到，也要采用抽样调查
抽样调查可以用于工业生产过程的质量控制。
三、抽样推断的内容
（一）参数估计。特点是不知道总体的数量特征，
X
x

2
K
p
P p
K
2
抽样平均数平均误差的计算公式：
采用重复抽样：
x

n
此公式说明，抽样平均误差与总体标准差成正比，与样本容量成反比。（当总体标准差未知时，可用样本标准差代替）
例：假定抽样单位数增加 2 倍、0.5倍时，抽样平均误差怎样变化？
解：抽样单位数增加 2 倍，即为原来的 3 倍
1 则： x 0.577 3n 3
即：当样本单位数增加2倍时，抽样平均误差为原来的0.577倍。抽样单位数增加 0.5倍，即为原来的 1.5倍

则：
1 x 0.8165 1.5n 1.5

即：当样本单位数增加0.5倍时，抽样平均误差为原来的0.8165 倍。
例：某施工班组5个工人的日工资分别为：34、38、
例：
某厂生产一种新型灯泡共2000只，随机抽出400只作耐用时间试验，测试结果平均使用寿命为4800小时，样本标准差为300小时，求抽样推断的平均误差？已知：

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

07 第七章整群抽样第一节整群抽样概述一、整群抽样的概念整群抽样是先将总体各单元划分成若干群（组），然后以群为单位，从中随机抽取一部分群，对中选群内的所有单元进行全面调查。

确切地讲，这种抽样组织形式应称为单级整群抽样。

如果总体中的单元能够分成多级，则能够对前几级单元采纳多阶抽样，而在最后一阶中对该阶抽样单元所包含的全部个体（最差不多单元）进行调查，这种抽样称作多级整群抽样。

本章只讨论单级整群抽样。

设总体被划分为Ｎ群，第i群含有Ｍi个次级单元，全部总体次级抽样单元数记为Ｍ0，即Ｍ0＝∑Mi。

当诸Ｍi都相等时，称为等群；否则，称为不等群。

采纳整群抽样的两个理由：- 抽选群能大大降低数据收集的费用，当总体的分布比较广且调查采纳面访时更是如此；- 从总体中直截了当抽选个体在实际中并不总是可行的（没有关于个体的抽样框）；有时，抽选单元组成群体组更简便易行（如整个住户）。

整群抽样包括两步：第一，总体被分为群；然后，在总体中抽取群的样本并访咨询群中的所有单元。

如果总体单元是自然分成组或群的，创建一个这种关于群的抽样框并对它们进行抽样比创建总体中所有单元的名录框更为容易。

或者，无法得到关于总体中所有单元的名录框，但却有这些单元分布地域的地图，因而能够创建地域框。

群的抽取能够采纳简单随机抽样、系统抽样或PPS抽样等各种不同的方法。

二、群的划分咨询题整群抽样策略的统计效率取决于群内单元的相似程度有多大，每个群中有多少单元，及抽中群的数量。

同分层抽样一样，整群抽样的前提是先要对总体进行分群。

关于群的划分，有两个咨询题：一是如何定义群，即当群并非是一个自然形成的单位时，确定每个群的组成；二是如何确定群的规模即群的大小。

分层抽样是在各层都进行随机抽样，“层是缩小了的总体”，抽样单元仍旧是总体差不多单元。

这决定了分层的原则是：尽量缩小层内差异，而扩大层间差异。

而整群抽样只是在各群之间抽取一部分群进行调查，并在抽中的群内作全面调查。

因此，群间差异的大小直截了当阻碍到抽样误差的大小，而群内差异的大小则不阻碍抽样误差。

在那个地点抽样单元是各个不同的群体，因此“群实际上是扩大了的总体单元”。

因此，关于前一个咨询题，群的划分应该是：尽量扩大群内差异，而缩小群间差异。

按此原则分群，则能保证每个群对总体都具有足够好的代表性。

作为极端情形，假定各群之间总体单元的分布完全相同，即群间不存在任何差异，那么只需抽取一个群进行调查就能充分满足抽样估量精确度的要求，整群抽样的效率就专门高。

这确实是讲，整群抽样专门适合于群内差异大、而群间差异小的情形。

如此，每个群都具有足够好的代表性。

如果所有的群都相似，那么抽少数群就可获得相当好的精度；反之，若群内的单元比较相似，而群与群之间的差不较大，则整群抽样的效率就低。

因此分群的原则使“群内差异大、群间差异小”与分层的原则使“层内差异小，层间差异大”是恰好相反的。

然在使用自然群时，同一个群内的单元通常专门相似，从而导致这种抽样策略的效率比简单随机抽样低。

下图直观表明了理想的分群与分层，其中同一字母表示观测值相近的单元。

至于群的规模的选择，一是取决于精度与费用之间的平稳，二是从抽样实施的组织治理等因素来考虑。

当相邻单元相似时，抽数量较多的小群比抽少量较大的群的统计效率高。

然而，如果采纳面访，样本的分布越广，调查的费用越高。

这表明：群的规模选得大，则费用省而精度差；群的规模选得小，则精度高而费用大。

因此，需要选择最优的群数量和大小，同时使总费用最小。

这方面除了依靠实践体会外，还可对假定的方差函数与费用函数作理论上的最优选择。

整群抽样可能有一些具体的困难。

如果用地图作为地域框，可能专门难决定某个住宅是否在一个特定的群内。

必须建立一个差不多的原则以决定哪些单元在一个群内。

例如，规定“住宅属于它的正门所在的群”这么一条原则，就能解决大多数咨询题。

如果一个住宅看起来平等地跨过两个群，则采纳掷硬币的方法来确定，以幸免产生任何抽选的偏差。

三、整群抽样的特点同其他抽样组织形式相比较，整群抽样具有如下特点：１．在大规模抽样调查中，常常没有或专门难编制出包括总体所有次级单元在内的抽样框，而整群抽样则不需要编制庞大的抽样框。

当总体单元自然聚合成群（例如：住户、学校）时，整群抽样比简单随机抽样或系统抽样更容易。

２．在样本单元数相同的条件下，整群抽样与简单随机抽样相比，样本单元的分布相对较集中，尽管样本的代表性较差，但调查组织实施过程更加便利，同时还能够大大地节约调查费用。

因此，实际工作中，在权衡费用和精度之后，有时宁可适当增加一些样本单元数，也采纳整群抽样方法。

如果关于调查变量而言，群内单元差异较大，而不同群的差异较小，整群抽样策略比简单随机抽样的统计效率更高。

(例如为估量性不比采纳按户的整群抽样)。

３．整群抽样的随机性体现在群与群间不重叠，也无遗漏，群的抽选按概率确定。

４．如果把每一个群看作一个单位，则整群抽样能够被明白得为是一种专门的简单随机抽样。

５．整群抽样也是多时期抽样的前提和基础。

６．整群抽样有专门的用途。

有些现象的研究，如果直截了当调查作为差不多单元的个体，专门难讲明咨询题，必须以一定范畴所包括的差不多单元为群体，进行整群抽样，才能满足调查的目的。

如人口普查后的复查、要想估量出普查的差错率，只有通过对一定地理区域内的人口群体作全面调查才行。

类似地诸如人口出生率、流淌率等调查都需要采纳整群抽样。

７．整群抽样要求分群后各群所含次级单元数目应该确知，否则会给抽样推断带来不便。

整群抽样的缺点有：对调查变量，若群内单元有趋同性，则整群抽样的统计效率比简单随机抽样低，（这正是通常遇到的情形），但对此项效率的缺失可通过增加群的抽取个数来补偿；通常无法提早明白调查总样本量，因为在进行调查前，我们通常不明白一个群内到底有多少个单元；调查的组织比其他方法复杂；方差估量可能比简单随机抽样更为复杂。

四、关于群大小的计量整群抽样中，如何有效地对群的大小进行计量，直截了当关系到抽样估量效率的高低。

研究表明，对群的大小的最优计量尺度是各群在所研究标志上的标志总量大小。

但在实际工作中，它是未知的。

因此通常选择与所研究标志高度线性有关的另一辅助标志作为计量尺度。

为此，要求把握关于辅助标志的更进一步细致的资料，而这又会带来一系列新的咨询题，如增加工作量及费用等。

因此，在整群抽样的实际应用中，经常选择以各群所含次级单元数的多少作为群大小的计量尺度。

当各群所含次级单元数相等时，就称群的大小相等；当各群所含次级单元数不相等时，就称群的大小不相等。

整群样本（图示）第二节等概率整群抽样的情形整群抽样中对群的抽取有多种方式，本节只讨论按简单随机抽样抽群，即等概率抽样，也称PPF 抽样的情形，下节讨论不等概率的情形。

一、预备知识（一）有关符号的涵义N 为总体群数；M 为各群所含次级单元数；ij y 为第i 群中第j 个次级单元的观则值；），，；，，M j N i 21321(== NM 为总体所含次级单元总数； nM 为样本所含次级单元总数；∑==Mj ij i y Y 1为第i 群各次级单元观测值总和； M Y Y i i =为第i 群的均值；∑==Ni i Y Y 1为总体各次级单元观测值总和； ∑==n i i Y y 1为样本各次级单元观测值总和； N Y N Y Y Ni i ==∑=1为总体各群的均值；n y n Y y n i i ==∑=1为样本各群的均值；∑∑∑=======N i Mj ij N i i NM y NM Y NM Y M Y Y 111为总体均值； nM y nM y nM Y M y y ni Mj ij ni i ====∑∑∑===111为样本均值；∑∑==--=N i M j ij Y y NM S 1122)(11为总体方差； 2112)(11y y nM s n i M j ij --=∑∑==为样本方差； 21212)(11)(1Y Y N Y Y N M S N i i N i i b --=--=∑∑==为总体群间方差；21212)(11)(1y Y n y Y n M s n i i n i i b--=--=∑∑==为样本群间方差； 2112)()1(1∑∑==--=N i Mj i ij Y y M N S ω为总体平均群内方差； 2112)(11i N i Mj ij Y y nM s --=∑∑==ω为样本平均群内方差； Nnf =为抽样比。

（二）群内、群间差异的定量刻划正如前面所分析的，整群抽样的精度在专门大程度上取决于群内各次级单元间差异程度的大小。

那么如何有效地对分群后各群内次级单元间的差异和各群之间的差异加以测定？也确实是对群内差异和群间差异如何样做定量刻划？通常有两种不同的思路：１、离差平方和的分解——群内方差与群间方差的测定先分析总体的情形：关于总体,ij y 对Y 离差的总平方和可作如下分解：211211)()(Y Y Y y Y yi i N i Mj ij N i Mj ij-+-=-∑∑∑∑====21211)()(Y Y M Y y Ni i N i M j ij -+-=∑∑∑===式中第一项为群内离差平方和，用其除以))1((-M N 即为平均群内方差，也可直截了当称之为群内方差，用2ωS 表示，则： )1()(2112--=∑∑==M N Y y S iN i M j ij ϖ < )1(-M N 为自由度>式中的第二项为群间离差平方和，用其除以1-N 即为群间方差，用b S 表示，则：1)(1)(12122--=--=∑∑==N Y Y M N Y YM S Ni i N i ib由此，依总体方差的定义及总体离差平方和分解能够得出： ])1()1[(11222ωS M N S N NM S b -+--=同理，可得样本的方差及其分解如下：],)1()1([11222b s n s M n nM s -+--=ω)1()(1122--=∑∑==M n Y y s n i M j i ij ω 1)(1)(12122--=--=∑∑==n y Y M n y Y M s ni i n i i b需要注意的是，由于群的抽取是简单随机的，因此，能够证明2b s 与2ωs 分不是2b S 与2ωS 的无偏估量。

但从次级单元角度而言，样本并不是简单随机的，因此，2s 不是2S 的无偏估量。

2S 的一个无偏估量可构造如下1)1()1(ˆ222--+-=NM s M N s N S b ω当N 充分大时，Ms M s S b 222)1(ˆω-+≈另一方面，当n 也足够大时，2s 可看作是2S 的近似无偏估量。

２、群内有关系数群内有关系数是反映总体中群内各次级单元间有关程度的一个统计分析指标。

07 第七章整群抽样

合集下载

07第七章等距抽样

第七章整群抽样

(抽样检验)第七章整群抽样最全版

整群抽样

抽样技术第七章整群抽样ppt课件

(抽样检验)第七章整群抽样

统计学原理第七章抽样调查

应用抽样技术课件第七章资料.

抽样技术 5 整群抽样

第七章抽样调查

文档推荐

最新文档

07 第七章 整群抽样

合集下载

07第七章 等距抽样

第七章 整群抽样

(抽样检验)第七章整群抽样最全版

整群抽样

抽样技术第七章整群抽样ppt课件

(抽样检验)第七章整群抽样

统计学原理第七章 抽样调查

应用抽样技术课件第七章资料.

抽样技术 5 整群抽样

第七章 抽样调查

文档推荐

最新文档

07 第七章整群抽样

07第七章等距抽样

第七章整群抽样

统计学原理第七章抽样调查

第七章抽样调查