整群抽样[1]
- 格式:doc
- 大小:224.26 KB
- 文档页数:9
(抽样检验)第七章整群抽样第七章整群抽样第壹节整群抽样概述壹、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取壹部分群,对中选群内的所有单元进行全面调查。
确切地说,这种抽样组织形式应称为单级整群抽样。
如果总体中的单元能够分成多级,则能够对前几级单元采用多阶抽样,而在最后壹阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。
本章只讨论单级整群抽样。
设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。
当诸Mi都相等时,称为等群;否则,称为不等群。
采用整群抽样的俩个理由:-抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;-从总体中直接抽选个体在实际中且不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。
整群抽样包括俩步:首先,总体被分为群;然后,在总体中抽取群的样本且访问群中的所有单元。
如果总体单元是自然分成组或群的,创建壹个这种关于群的抽样框且对它们进行抽样比创建总体中所有单元的名录框更为容易。
或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而能够创建地域框。
群的抽取能够采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。
二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。
同分层抽样壹样,整群抽样的前提是先要对总体进行分群。
关于群的划分,有俩个问题:壹是如何定义群,即当群且非是壹个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。
分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。
这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。
而整群抽样只是在各群之间抽取壹部分群进行调查,且在抽中的群内作全面调查。
第七章整群抽样第一节整群抽样概述一、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取一部分群,对中选群内的所有单元进行全面调查。
确切地说,这种抽样组织形式应称为单级整群抽样。
如果总体中的单元可以分成多级,则可以对前几级单元采用多阶抽样,而在最后一阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。
本章只讨论单级整群抽样。
设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。
当诸Mi都相等时,称为等群;否则,称为不等群。
采用整群抽样的两个理由:- 抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;- 从总体中直接抽选个体在实际中并不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。
整群抽样包括两步:首先,总体被分为群;然后,在总体中抽取群的样本并访问群中的所有单元。
如果总体单元是自然分成组或群的,创建一个这种关于群的抽样框并对它们进行抽样比创建总体中所有单元的名录框更为容易。
或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而可以创建地域框。
群的抽取可以采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。
二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。
同分层抽样一样,整群抽样的前提是先要对总体进行分群。
关于群的划分,有两个问题:一是如何定义群,即当群并非是一个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。
分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。
这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。
而整群抽样只是在各群之间抽取一部分群进行调查,并在抽中的群内作全面调查。
因此,群间差异的大小直接影响到抽样误差的大小,而群内差异的大小则不影响抽样误差。
(标准抽样检验)第七章整群抽样第七章整群抽样第一节整群抽样概述一、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取一部分群,对中选群内的所有单元进行全面调查。
确切地说,这种抽样组织形式应称为单级整群抽样。
如果总体中的单元可以分成多级,则可以对前几级单元采用多阶抽样,而在最后一阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。
本章只讨论单级整群抽样。
设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。
当诸Mi都相等时,称为等群;否则,称为不等群。
采用整群抽样的两个理由:-抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;-从总体中直接抽选个体在实际中并不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。
整群抽样包括两步:首先,总体被分为群;然后,在总体中抽取群的样本并访问群中的所有单元。
如果总体单元是自然分成组或群的,创建一个这种关于群的抽样框并对它们进行抽样比创建总体中所有单元的名录框更为容易。
或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而可以创建地域框。
群的抽取可以采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。
二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。
同分层抽样一样,整群抽样的前提是先要对总体进行分群。
关于群的划分,有两个问题:一是如何定义群,即当群并非是一个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。
分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。
这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。
而整群抽样只是在各群之间抽取一部分群进行调查,并在抽中的群内作全面调查。
习题七一、 单选题1.整群抽样中的群的划分标准为( A )。
A.群的划分尽可能使群间的差异小,群内的差异大B.群的划分尽可能使群间的差异大,群内的差异小C.群的划分尽可能使群间的差异大,群内的差异大D.群的划分尽可能使群间的差异小,群内的差异小 2.整群抽样的一个主要特点是( C )。
A.方便B.经济C.可以使用简单的抽样框D.特定场合中具有较高的精度 3.群规模大小相等时,总体均值Y 的简单估计量为( A )。
A.∑∑===n i Mj ijynM Y 111ˆB.()∑∑==-=n i Mj ij y M n Y 1111ˆ C.∑∑===n i Mj ij y n Y 111ˆD.∑∑===n i Mj ijyNY 111ˆ4.下面关于群内相关系数的取值说法错误的是(D )。
A.若群内次级或基本单元变量值都相等则20S ω=,此时ρ取最大值1B.若群内方差与总体方差相等,则0≈ρ,此时表示分群是完全随机的C.若群内方差大于总体方差时,则ρ取负值D.若20b S =时,ρ达到极小值,此时11-=M ρ5.整群抽样中,对比例估计说法正确的是( B )。
A.群规模相等时,总体比例P 的估计可以为:11ni i p n A ==∑B.群规模不等时,总体比例P 的估计可以为:11()/()n niii i p A M===∑∑C.群规模相等时,总体比例P 的方差估计为:211()(1)()n i v p in n p P ==--∑D.群规模不等时,总体比例P 的方差估计为:2121()1()ni i i v p n n p A M M==•--∑二、多选题1.下面关于整群抽样的说法,有哪些是正确的?(ABC DE ) A.通常情况下抽样误差比较大B.整群抽样可以看作为多阶段抽样的特殊情形,即最后一阶抽样是100%的抽样C.调查相对比较集中,实施便利,节省费用D.整群抽样的方差约为简单随机抽样的方差的1(1)cM ρ+-倍E.为了获得同样的精度,整群抽样的样本量是简单随机抽样的1(1)cM ρ+-倍2.关于整群抽样(群规模相等)的设计效应,下面说法正确的有(ABCD ) A.()1(1)()c srsV y deff M y V ρ=≈+-B.为了获得同样的精度,整群抽样的样本量是简单随机抽样的1(1)cM ρ+-倍C.群内相关系数的估计值为2222(1)ˆb cbM s s ss ωωρ-=+-D.要提高整群抽样估计效率,可通过增大群内单元的差异实现E.整群抽样的精度取决于群内相关系数,群内相关系数越大,则估计量的精度越高 3.关于群规模不等时,可以采用的估计量形式有( B CD )。
A.11111(/)in n i i ij i i j M y n n y y M =====∑∑∑B.0111nnii i i iiy n n y y M z M====∑∑C.11ˆnii n Rii yYM===∑∑D.10ˆˆ1nii Y Y Mn y M ===∑ E.11nii y n y ==∑三、名次解释群内相关系数 四、计算题1. 设某灯泡厂每天生产一批灯泡共200盒,每盒装灯泡6只,今随机抽取8盒,检验其点燃小时数的资料,如下表所列。
(1)计算样本平均点燃时数,并分别按整盒和按灯泡计算其抽样平均误差,比较其估计精度。
(2)如果点燃小时数不到1000的为不良品,计算其样本不良率,并分别按整盒和按灯泡计算其抽样方差,比较何者较优。
2. 某大学为了估计全校学生在1991年夏天对安徽、江苏灾区的捐款总数,从全校124个班随机的抽取10个班级进行调查,数据如下表所示,并假定这10个班的400名学生中分别捐4.5元,5.0元,5.5元,6.0元和6.5元的都各有80名。
10个班级的捐款情况 单位:元(1)求该校学生平均捐款数和捐款总数的估计值;(2)计算该校学生捐款总数估计值的抽样方差,以及捐款总数的95%的置信区间。
3. 在一次对某寄宿中学在校生零花钱的调查中,以宿舍作为群进行整群抽样。
每个宿舍有6名学生。
用简单随机抽样在全部315间宿舍中抽取n=8间宿舍、全部48个学生上周每人的零花钱ijy及相关计算数据如下表。
试估计该学校平均每个学生每周的零花钱Y ,并给出其95%的置信区间。
4. 估计上题中以宿舍为群的群内相关系数与设计效应。
5. 带锯厂负责对他的用户进行修理,其修理费用每季结算一次。
该厂共有96家用户,各拥有不同带锯数,现采用等概简单随机方法抽取20家为样本,资料如下:(2)根据上述资料估计96家用户的修理费用及置信区间(а=0.05)。
(3)若已知这96家用户有710条带锯,利用这一补充信息估计总的修理费用和置信区间。
(4)欲估计下一季度的每带锯平均管理费用,绝对误差Δ=2,试问应抽取多少户作样本。
6. 邮局欲估计每个家庭的平均订报份数,该辖区共有4000户,划分为400个群,每群试估计平均每户家庭的订报份数及总的订报份数及估计量的方差。
7. 汽车运输公司抽样调查在使用的车辆中不安全轮胎的比例,在175辆车中抽中了25 请估计该运输公司的汽车中不安全轮胎的比例及估计量的方差。
8. 某市建筑行业集团共有48个单元,有载货汽车186辆。
按每个单元的车辆拥有量成比例的概率进行放回的PPS 抽样,共抽取10次,对抽中单元的所有车辆调查季度运量(单位:吨)。
样本数如下(其中有一单元被抽中2次,即i=3,7)。
试估计全集团的季度总运量及95%的置信区间。
9. 对某居民小区居民进行电话拥有情况的调查,以每个楼层(相当于居民小组)为群进行整群抽样,每个楼层都有M=8个住户。
用简单随机抽样在全部N=510个楼层中抽取n=12个楼层。
下表是12个样本楼层装有电话的住户数i a 及在楼层8户中所占的比例i p 的资料,10. 若欲调查城市的猪肉人均消费量,讨论下列情况下采用街道作为群的整群抽样是否合适,如果不合适你认为采用什么抽样方式好。
(1)少数民族的居住比较集中;(2)少数民族比较均匀得分布在各街道;(3)少数民族分散在各街道但比重不同。
11. 某一社会研究机构,研究南方某一城镇的社会民俗等情况。
设该镇共有415个居民小组,现从中按简单随机抽样抽取25个居民小组作样本,取得了以下一些数据。
(1)估计该地区户平均收入及其标准差。
(2)估计三代人的户占总户数的比例,并计算其标准差;(3)若以上两项估计的相对标准差均控制在5%,应抽取多少居民小组(群)作样本。
12. 一带锯厂对它的用户负责进行维修,按季定期进行结算,但缺乏每一带锯的平均修理费用,该厂共有96家用户,各拥有不同的带锯数。
现用简单随机抽样抽取20家作样本,要求:(1)估计每一带锯的平均修理费用及其抽样标准误差;(2)在未知总体带锯数的条件下估计96家用户总的修理费用及估计标准误;(3) 若已知这96家用户共有740条带锯,利用这一补充信息估计总的修理费用和估计的标准误;(4) 若欲估计下一季度每一带锯饿平均修理费用,允许最大绝对误差为d=2,置信度为95%,应抽取多少家用作样本。
13. 汽车运输公司抽样检查在使用的车辆中不安全轮胎的比例,在175辆车中抽取了25辆,14. 某工业系统准备一项改革措施,对全系统的人进行一项民意测验,该系统共有87个单位,现采用整群抽样,用简单随机抽取15个单位作为样本,读抽中的单位作全面征求意见,其结果如下:要求:(1) 估计该系统同意这一改革人数的比例,并计算估计标准误;(2) 在调查的基础上对方案作了修改,拟再一次征求意见,要求估计比例的绝对误差不超过4%,置信度为95%,则应抽多少个单位作样本。
15. 在一个估计总体比例问题的抽样设计中,首先作了试调查,研究群的大小与群间方假设费用函数M n n C 7.01.21000++=,确定估计P 时在固定费用为10000元的条件下最优的M 和n 。
16. 假设整群抽样的样本群数为n ,每个群有M 个单元,群间方差为2b S ,群内方差为2w S 试对整群抽样与相同样本量的简单随机抽样的效率的比较进行讨论(fpc 可忽略不计)。
17. 在一次农村调查中,抽样单元是包含M 个农场的群,当抽取n 个群作样本时,其费用是:n tMn C 604+=,其中t 是调查一个农场所花的时间(按小时计算)。
如果这一 样本均值的方差是[]c M MnS ρ)1(12-+,fpc 忽略不计。
如果M 在1—10之间,c ρ=0.1,试问(1)t=0.5,(2)t=2小时,单元多大能得到最精确的结果?你这样解释两个结果的差别。
五、简答题1. 什么是整群抽样,整群抽样有哪几个步骤?2. 整群抽样有哪些优点?3. 整群抽样与多阶段抽样及分层抽样的区别?4. 整群抽样与分层抽样的区别;5. 整群抽样群大小的计量方法;6. 整群抽样的设计效应。
六、设计题欲调查城市的猪肉人均消费量,讨论下列情况下采用街道作为群的整群抽样是否合适,如果不合适,你认为采用什么抽样方式好。
(1)少数民族的居住比较集中;(2)少数民族比较均匀地分布在各条街道;(3)少数民族分散在各街道,但比重不同。