ch6 讲课 整群抽样 (1)
- 格式:ppt
- 大小:592.00 KB
- 文档页数:52
(抽样检验)第七章整群抽样第七章整群抽样第壹节整群抽样概述壹、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取壹部分群,对中选群内的所有单元进行全面调查。
确切地说,这种抽样组织形式应称为单级整群抽样。
如果总体中的单元能够分成多级,则能够对前几级单元采用多阶抽样,而在最后壹阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。
本章只讨论单级整群抽样。
设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。
当诸Mi都相等时,称为等群;否则,称为不等群。
采用整群抽样的俩个理由:-抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;-从总体中直接抽选个体在实际中且不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。
整群抽样包括俩步:首先,总体被分为群;然后,在总体中抽取群的样本且访问群中的所有单元。
如果总体单元是自然分成组或群的,创建壹个这种关于群的抽样框且对它们进行抽样比创建总体中所有单元的名录框更为容易。
或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而能够创建地域框。
群的抽取能够采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。
二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。
同分层抽样壹样,整群抽样的前提是先要对总体进行分群。
关于群的划分,有俩个问题:壹是如何定义群,即当群且非是壹个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。
分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。
这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。
而整群抽样只是在各群之间抽取壹部分群进行调查,且在抽中的群内作全面调查。
第七章整群抽样第一节整群抽样概述一、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取一部分群,对中选群内的所有单元进行全面调查。
确切地说,这种抽样组织形式应称为单级整群抽样。
如果总体中的单元可以分成多级,则可以对前几级单元采用多阶抽样,而在最后一阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。
本章只讨论单级整群抽样。
设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。
当诸Mi都相等时,称为等群;否则,称为不等群。
采用整群抽样的两个理由:- 抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;- 从总体中直接抽选个体在实际中并不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。
整群抽样包括两步:首先,总体被分为群;然后,在总体中抽取群的样本并访问群中的所有单元。
如果总体单元是自然分成组或群的,创建一个这种关于群的抽样框并对它们进行抽样比创建总体中所有单元的名录框更为容易。
或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而可以创建地域框。
群的抽取可以采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。
二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。
同分层抽样一样,整群抽样的前提是先要对总体进行分群。
关于群的划分,有两个问题:一是如何定义群,即当群并非是一个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。
分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。
这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。
而整群抽样只是在各群之间抽取一部分群进行调查,并在抽中的群内作全面调查。
因此,群间差异的大小直接影响到抽样误差的大小,而群内差异的大小则不影响抽样误差。
第七章 整群抽样第一节 整群抽样概述一、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取一部分群,对中选群内的所有单元进行全面调查。
确切地说,这种抽样组织形式应称为单级整群抽样。
采用整群抽样的两个理由:抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;从总体中直接抽选个体在实际中并不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。
二、群的划分问题关于群的划分,有两个问题:一是如何定义群,即当群并非是一个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。
群的划分应该是:尽量扩大群内差异,而缩小群间差异。
这样,每个群都具有足够好的代表性。
如果所有的群都相似,那么抽少数群就可获得相当好的精度;反之,若群内的单元比较相似,而群与群之间的差别较大,则整群抽样的效率就低。
所以分群的原则使“群内差异大、群间差异小”与分层的原则使“层内差异小,层间差异大”是恰好相反的。
至于群的规模的选择,一是取决于精度与费用之间的平衡,二是从抽样实施的组织管理等因素来考虑。
三、整群抽样的特点同其他抽样组织形式相比较,整群抽样具有如下特点:整群抽样则不需要编制庞大的抽样框;在样本单元数相同的条件下,整群抽样与简单随机抽样相比,样本单元的分布相对较集中,组织实施过程更加便利,同时还可以大大地节省调查费用;整群抽样的随机性体现在群与群间不重叠,也无遗漏,群的抽选按概率确定;如果把每一个群看作一个单位,则整群抽样可以被理解为是一种特殊的简单随机抽样;整群抽样也是多阶段抽样的前提和基础;整群抽样有特殊的用途;整群抽样要求分群后各群所含次级单元数目应该确知,否则会给抽样推断带来不便。
第二节 等概率整群抽样的情形一、群的大小相等时(一)估计量1、总体均值Y 的估计∑===ni i Y n y Y 11ˆ2、总体总和Y 的估计y nN Y nN y NM Yni i ∑===•=1ˆ 3、总体比例P的估计∑∑=====ni in i i nMP n p P 1111ˆα(二)估计量的方差及其估计由于群是按简单随机方法抽取的,因此,估计量Y Y ˆ,ˆ与P ˆ的方差及方差的无偏估计量可直接按第三章的方法构造:1)(1)(122---=∑=N Y YnM f y V Ni i22221])1(1[1)1,1(1)1(1[)1(1bC C S nMf M S nM f NM NM N N N M S NM nM f -=-+-≈-≈-≈--+•-•-=ρρ 21211)(1)(ˆb ni is nMf n y Ynf y V-=--•-=∑= 1)()1()()ˆ(ˆ12222---=•=∑=N Y Yn f N y V M N Y VNi i≈22)1(b S nf M N - 1)()1()(ˆ)ˆ(ˆ21222--•-=•=∑=n y Ynf N y V M N Y Vni i≈22)1(b s nf M N -1N )P (P nf 1)Pˆ(V N1i 2i---=∑=1n )PˆP(n f1)P ˆ(Vˆn1---=∑=i i三、群的大小不等时(一)简单估计如果群的抽取是简单随机的,则可将每个群的总和i Y 看作是第i 群的指标,于是总体总和∑==N1i i Y Y 的简单估计可依照简单随机抽样的情形来做,即:y N Y n N Y ˆn 1i i ==∑=可以证明,Yˆ是Y 的无偏估计,其方差为: 1N )Y Y(n)f 1(N )Yˆ(V N1i 2i2--•-=∑=方差估计量为:11N Y ˆ(Vˆ122---=∑=n y Y n f ni i)()())Y ˆ(Vˆ为)Y ˆ(V 无偏估计。
(标准抽样检验)第七章整群抽样第七章整群抽样第一节整群抽样概述一、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取一部分群,对中选群内的所有单元进行全面调查。
确切地说,这种抽样组织形式应称为单级整群抽样。
如果总体中的单元可以分成多级,则可以对前几级单元采用多阶抽样,而在最后一阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。
本章只讨论单级整群抽样。
设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。
当诸Mi都相等时,称为等群;否则,称为不等群。
采用整群抽样的两个理由:-抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;-从总体中直接抽选个体在实际中并不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。
整群抽样包括两步:首先,总体被分为群;然后,在总体中抽取群的样本并访问群中的所有单元。
如果总体单元是自然分成组或群的,创建一个这种关于群的抽样框并对它们进行抽样比创建总体中所有单元的名录框更为容易。
或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而可以创建地域框。
群的抽取可以采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。
二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。
同分层抽样一样,整群抽样的前提是先要对总体进行分群。
关于群的划分,有两个问题:一是如何定义群,即当群并非是一个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。
分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。
这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。
而整群抽样只是在各群之间抽取一部分群进行调查,并在抽中的群内作全面调查。
一、实验背景整群抽样是一种概率抽样方法,其基本思想是将总体划分为若干个群,每个群内部个体之间具有某种相似性或相关性。
通过随机抽取若干个群,然后对所抽取的群内的所有个体进行调查或测试,从而推断出总体的特征。
整群抽样在市场调查、社会研究等领域有着广泛的应用。
本实验旨在通过整群抽样方法,对某城市中学生课外阅读情况进行调查。
二、实验目的1. 了解该城市中学生课外阅读的现状;2. 分析不同年级、性别、家庭背景等群体在课外阅读方面的差异;3. 为提高中学生课外阅读水平提供参考依据。
三、实验方法1. 确定总体:某城市所有中学生;2. 划分群:以学校为单位,将中学生划分为若干个群;3. 抽取样本:随机抽取5所学校,每所学校随机抽取3个班级;4. 数据收集:对抽取的班级内所有学生进行问卷调查;5. 数据分析:运用统计软件对数据进行描述性统计、方差分析等。
四、实验过程1. 确定总体:某城市所有中学生,共10万人;2. 划分群:根据学校分布情况,将中学生划分为100个群,每个群包含1000名学生;3. 抽取样本:随机抽取5所学校,每所学校随机抽取3个班级,共15个班级;4. 数据收集:设计调查问卷,包括学生基本信息、课外阅读习惯、阅读频率、阅读材料等;5. 数据分析:运用SPSS软件对数据进行描述性统计、方差分析等。
五、实验结果1. 描述性统计结果:(1)阅读频率:每天阅读的学生占30%,每周阅读的学生占50%,每月阅读的学生占20%;(2)阅读材料:课外书籍占60%,教材占30%,网络文章占10%;(3)阅读时间:每天阅读1小时以下的学生占40%,1-2小时的学生占50%,2小时以上的学生占10%。
2. 方差分析结果:(1)不同年级学生在阅读频率、阅读材料、阅读时间方面存在显著差异;(2)不同性别学生在阅读频率、阅读材料方面存在显著差异;(3)不同家庭背景学生在阅读频率、阅读材料、阅读时间方面存在显著差异。
六、实验结论1. 该城市中学生课外阅读水平整体偏低,阅读频率、阅读材料、阅读时间等方面存在一定差异;2. 不同年级、性别、家庭背景的学生在课外阅读方面存在显著差异,需针对性地进行引导和培养;3. 为提高中学生课外阅读水平,应从以下几个方面入手:(1)加强阅读教育,提高学生对课外阅读的认识;(2)丰富阅读资源,为学生提供更多优质阅读材料;(3)营造良好的阅读氛围,激发学生的阅读兴趣;(4)关注不同群体学生的阅读需求,提供个性化阅读指导。