第7章 抽样调查及答案
- 格式:doc
- 大小:78.00 KB
- 文档页数:7
(抽样检验)第七章整群抽样第七章整群抽样第壹节整群抽样概述壹、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取壹部分群,对中选群内的所有单元进行全面调查。
确切地说,这种抽样组织形式应称为单级整群抽样。
如果总体中的单元能够分成多级,则能够对前几级单元采用多阶抽样,而在最后壹阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。
本章只讨论单级整群抽样。
设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。
当诸Mi都相等时,称为等群;否则,称为不等群。
采用整群抽样的俩个理由:-抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;-从总体中直接抽选个体在实际中且不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。
整群抽样包括俩步:首先,总体被分为群;然后,在总体中抽取群的样本且访问群中的所有单元。
如果总体单元是自然分成组或群的,创建壹个这种关于群的抽样框且对它们进行抽样比创建总体中所有单元的名录框更为容易。
或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而能够创建地域框。
群的抽取能够采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。
二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。
同分层抽样壹样,整群抽样的前提是先要对总体进行分群。
关于群的划分,有俩个问题:壹是如何定义群,即当群且非是壹个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。
分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。
这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。
而整群抽样只是在各群之间抽取壹部分群进行调查,且在抽中的群内作全面调查。
第七章整群抽样第一节整群抽样概述一、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取一部分群,对中选群内的所有单元进行全面调查。
确切地说,这种抽样组织形式应称为单级整群抽样。
如果总体中的单元可以分成多级,则可以对前几级单元采用多阶抽样,而在最后一阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。
本章只讨论单级整群抽样。
设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。
当诸Mi都相等时,称为等群;否则,称为不等群。
采用整群抽样的两个理由:- 抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;- 从总体中直接抽选个体在实际中并不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。
整群抽样包括两步:首先,总体被分为群;然后,在总体中抽取群的样本并访问群中的所有单元。
如果总体单元是自然分成组或群的,创建一个这种关于群的抽样框并对它们进行抽样比创建总体中所有单元的名录框更为容易。
或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而可以创建地域框。
群的抽取可以采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。
二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。
同分层抽样一样,整群抽样的前提是先要对总体进行分群。
关于群的划分,有两个问题:一是如何定义群,即当群并非是一个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。
分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。
这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。
而整群抽样只是在各群之间抽取一部分群进行调查,并在抽中的群内作全面调查。
因此,群间差异的大小直接影响到抽样误差的大小,而群内差异的大小则不影响抽样误差。
(标准抽样检验)第七章整群抽样第七章整群抽样第一节整群抽样概述一、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取一部分群,对中选群内的所有单元进行全面调查。
确切地说,这种抽样组织形式应称为单级整群抽样。
如果总体中的单元可以分成多级,则可以对前几级单元采用多阶抽样,而在最后一阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。
本章只讨论单级整群抽样。
设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。
当诸Mi都相等时,称为等群;否则,称为不等群。
采用整群抽样的两个理由:-抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;-从总体中直接抽选个体在实际中并不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。
整群抽样包括两步:首先,总体被分为群;然后,在总体中抽取群的样本并访问群中的所有单元。
如果总体单元是自然分成组或群的,创建一个这种关于群的抽样框并对它们进行抽样比创建总体中所有单元的名录框更为容易。
或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而可以创建地域框。
群的抽取可以采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。
二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。
同分层抽样一样,整群抽样的前提是先要对总体进行分群。
关于群的划分,有两个问题:一是如何定义群,即当群并非是一个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。
分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。
这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。
而整群抽样只是在各群之间抽取一部分群进行调查,并在抽中的群内作全面调查。
(抽样检验)第七章第⼀次课抽样原理与⽅法第⼀节抽样⽅案的制定在科学研究中,除了进⾏控制试验外,有时也要进⾏调查研究。
调查研究是对已有的事实通过各种⽅式进⾏了解,然后⽤统计的⽅法对所得数据进⾏分析,从⽽找出其中的规律性。
例如,了解畜禽品种及⽔产资源状况;探索和分析对某种疾病有效的防治规律、措施以及新的检验⼿段和⽅法等。
由于现场调查⽴⾜于⽣产实际,所以它是研究和解决实际问题的⼀种重要研究⽅法。
同时,控制试验的研究课题,往往是在调查研究的基础上确定的;试验研究的成果,⼜必须在其推⼴应⽤后经调查得以验证。
为了使调查研究⼯作有⽬的、有计划、有步骤地顺利开展,必须事先拟定⼀个详细的调查计划。
调查计划应包括以下⼏个内容:(⼀) 调查研究的⽬的任何⼀项调查研究都要有明确的⽬的,即通过调查了解什么问题,解决什么问题。
例如,家畜健康状况的调查的⽬的是评定家畜健康⽔平;畜禽品种资源调查的⽬的是了解畜禽品种的数量、分布与品种特征特性等情况。
同时,调查研究的⽬的还应该突出重点,⼀次调查应针对主要问题收集必要的数据,深⼊分析,为主要问题的解决提出相应的措施和办法。
(⼆) 调查的对象与范围根据调查的⽬的,确定调查的对象、地区和范围,划清调查总体的同质范围、时间范围和地区范围。
例如,四川省家禽品种资源调查,调查地区为四川省,调查总体和对象为全省各市、县的家禽,调查时间从2000年1⽉到2000年12⽉。
(三) 调查的项⽬调查项⽬的确定要紧紧围绕调查⽬的。
调查项⽬确定的正确与否直接关系到调查的质量。
因此,项⽬应尽量齐全,重要的项⽬不能漏掉;项⽬内容要具体、明确,不能模棱两可。
应按不同的指标顺序以表格形式列⽰出来,以达到顺利完成搜集资料的⽬的。
例如,家禽品种资源调查项⽬有:种类(鸡、鸭、鹅等)、品种(柴鸡、来航、⽩洛克等),数量、体重、产蛋性能等项⽬。
调查项⽬有⼀般项⽬和重点项⽬之分。
⼀般项⽬主要是指调查对象的⼀般情况,⽤于区分和查找,如畜主姓名、住址及编号等。
抽样技术测验一、填空题1、抽样调查是按照_____________从总体中抽取一部分单位进行观测,并根据这部分单位的资料推断______________的一种方法。
2、抽样调查的组织方式主要有_______________ 、_______________ 等距抽样和整群抽样等。
3、在抽样推断中,按照随机原则从总体中抽取出来的那一部分单位叫做___________4、____________是抽样调查中不可避免和误差。
5、提高估计和区间估计必须具备____________、误差范围和___________三个基本要素。
6、简单重复抽样情况下,如果其他条件不变,仅将误差范围缩小1/2,则抽样单位数目必须__________;若将误差范围扩大一倍,则抽样单位数目将__________。
二、单项选择题1、在抽样推断中,必须遵循()抽取样本。
A 随意原则B 随机原则C 可比原则D 对等原则2、能够事先加以计算和控制和误差是()A 抽样误差B 登记误差C 系统性误差D 测量误差3、抽样调查的主要目的在于()A 计算和控制抽样误差B 了解全及总体单位的情C 用样本来推断总体D 对调查单位作深的研究4、某企业连续生产,为检查产品质量,在24小时中每隔30分钟取下一分钟的产品进行全部检查,这是()A 整群抽样B 简单随机抽样C 类型抽样D 纯随机抽样5、在抽样调查中,无法避免的误差是()A 登记误差B 系统性误差C 计算误差D 抽样误差6、置信区间的大小表达了区间估计的()A 可靠性B 准确性C 显著性D 及时性7、抽样推断中的概率保证程度表达了区间估计的( )A 显著性B 准确性C 可靠性D 规律性8、样本指标和总体指标()A 前者是个确定值,后者是个随机变量B 前者是个随机变量,后者是个确定值C 两者均是确定值D 两者均是随机变量9、对标志变异程度较大的总体进行抽样调查时,宜采用()A 纯随机抽样B 等距抽样C 类型抽样D 整群抽样10、成数方差的最大值,是当P值趋近于()A 0.1B 0.9C 0.8D 0.511、计算必要抽样数目时,若总体方差末知,应当从几个可供选择的样本方差挑选出数值()A 最小的B 任意的C 最大的D 适中的12、在同等条件下,重复抽样与不重复抽样相比较,其抽样平均误差()A 前者小于后者B 前者大于后者C 两者相等D 无法确定哪一个大13、允许误差反映了样本指标与总体指标之间的()A 抽样误差的平均数B 抽样误差的标准差C 抽样误差的可靠程度D 抽样误差的可能范围14、根据组(群)间方差的资料计算抽样平均的抽样组织方式是()A 纯随机抽样B 机械抽样C 类型抽样D 整群抽样15、从1、2、3、4、5,五个数构成的总体中不重复地随机抽取两个作为样本,则对于所有可能样本的样本均值,以下说法正确的是()A 样本均值的实际抽样误差的最大值为2B 样本均值为3的概率是25%C 样本均值为3的概率为40%D 以上都不对三、多项选择题1、影响抽样误差的主要因素有()A 抽样数目的多少B 总体标志变异程度的大小C 不同的组织方式D 抽样周期的长短E 不同抽样方法2、要提高抽样推断的精确度,可采用的方法有()A 增加样本数目B 减少样本数目C 缩小总体被研究标志的变异程度D 改善抽样的组织方式E 改善抽样的方式3、要增大抽样推断的概率保证程度,可采用的方法有()A 增加抽样数目B 增大概率度C 增大抽样误差范围D 缩小抽样误差范围E 缩小概率度4、在简单重复随机抽样条件下,欲使误差范围缩小1/2,其他要求保持不变,则样本容量必须()A 增加2倍B 增加3倍C 增加到4倍D 减少2倍E 减小3倍5、在区间估计中,如果其他条件保持不变,概率保证程度与精确度之间存在下列关系()A 前者愈低,后者也愈低B 前者愈高,后者也愈高C 前者愈低,后者愈高D 前者愈高,后者愈低E 两者呈相反方向变化6、由于以下原因引起的误差中,不属于抽样误差的是()A 被调查者隐瞒了自己的非法收入,将自己的月收入填报为1000元B 由于调查员的失误,将数字1568填报为1658C 入户调查时被调查者不在家,调查根据自己的估计将户主的收入填报为1500元D 调查者按自己的主观愿望选择样本单位所造成的误差E 以上都不对7、根据抽样调查,某地区10户居民家庭月消费(元)与月收入的资料,配合了反映家庭消费收入关系的回归方程。
第七章 抽样调查一、本章重点1.抽样调查也叫做抽样推断或参数估计,必须坚持随机抽样的原则。
它是一种非全面调查,其意义在于对总体的推断上,存在可控制性误差。
是一种灵活快捷的调查方式。
2.抽样调查有全及总体与样本总体之区分。
样本容量小于30时一般称为小样本。
对于抽样调查来讲全及总体的指标叫做母体参数,是唯一确定的未知的量,样本指标是根据样本总体各单位标志值计算的综合性指标,是样本的一个函数,是一个随机变量,抽样调查就是要用样本指标去估计相应的总体指标。
样本可能数目与样本容量有关也与抽样的方法有关。
抽样方法可以分为考虑顺序的抽样与不考虑顺序的抽样;重复抽样与不重复抽样。
3.大数定律、正态分布理论、中心极限定理是抽样调查的数理基础。
正态分布的密度函数有两个重要的参数(σ;x )。
它有对称性、非负性等特点。
中心极限定理证明了所有样本指标的平均数等于总体指标如X x E =)(。
推出了样本分布的标准差为:1--=N n N n x σμ。
4.抽样推断在逻辑上使用的是归纳推理的方法、在方法上使用的是概率估计的方法、存在着一定误差。
无偏性、一致性和有效性是抽样估计的优良标准。
抽样调查既有登记性误差,也有代表性误差,抽样误差是一个随机变量,而抽样的平均误差是一个确定的值。
抽样误差受总体标志值的差异程度、样本容量、抽样方法、抽样组织形式的影响。
在重复抽样下抽样的平均误差与总体标志值的差异程度成正比,与样本容量的平方根成反比即n x σμ=,不重复抽样的抽样平均误差仅与重复抽样的平均误差相差一个修正因子即N nn x -=1σμ。
在通常情况下总体的方差是未知的,一般要用样本的方差来代替。
把抽样调查中允许的误差范围称作抽样的极限误差x ∆或p ∆。
μt =∆,用抽样的平均误差来度量抽样的极限误差。
把抽样估计的把握程度称为抽样估计的置信度。
抽样的极限误差越大,抽样估计的置信度也越大。
抽样估计又可区分为点估计和区间估计。
按估计的指标不同又可分为总体平均数的估计、总体成数的估计和总体方差的估计。
二、难点释疑1.要区分样本可能数目与必要抽样数目。
样本可能数目是指从总体N中抽取一个样本容量为n的子样最多有多少种抽法,一般用M表示。
而必要抽样数目则是为了使抽样误差控制在一定的范围内,至少应抽取多少个单位作样本,是样本容量(n)的另一种表现形式。
2.大数定律、正态分布理论、中心极限定理都是假定从N中抽取一个样本容量为n的子样,把所有的样本都抽到(有M种抽法)之后进行验证的,在实际工作中不可能办到。
只能用样本的相应指标去推测总体的相应指标。
这些理论只是为了验证抽样推断的科学性。
3.在实际工作中往往是以重复抽样的方法确定必要抽样数目,以不重复抽样的方法来抽取调查单位,进行计算估计,而又用重复抽样的误差公式来计算误差,一方面是计算公式简单,另一方面,这样计算的误差比实际存在的误差大,便于提高抽样推断的可靠性。
4.在抽样调查中总体的方差是未知的,一般都用样本的方差来代替。
对于抽样成数来说,当p=0.5时,抽样成数的方差取极大值0.25。
三、练习题(一)填空题1.抽样调查是建立在(随机原则)上的一种科学的调查方法。
它是从研究对象中(抽取)部分单位进行调查,以其达到对(总体)的认识,并可对(抽样误差)进行计算和控制。
2.样本中所包含的总体单位数称为(样本容量),通常记为n,当n(≥30)时称为大样本。
3.在抽样调查中总体指标是(确定的),而样本指标则是随机的。
4.对确定的总体来说,可能的样本数目与(样本容量)有关,也与(抽样的方法)有关。
5.一般地说,用抽样指标估计总体指标应该有三个要求。
这三个要求是(估计值)、(概率度)、(抽样极限误差)。
6.常用的抽样方法有(考虑顺序的)抽样和(不考虑顺序的)抽样;(重复)抽样和(不重复)抽样。
7.常用的抽样组织形式有(简单随机抽样)、(类型抽样)、(等距抽样)、(整群抽样)、(阶段抽样)。
8.抽样平均误差就是抽样平均数(或抽样成数)的(标准差)。
它反映抽样平均数(或抽样成数)与总体平均数(或总体成数)的(绝对离差的一般水平)。
9.抽样误差是一个(随机变量),抽样平均误差是一个(确定的值)。
前者是在不考虑()条件下,抽样估计值与被估计的真实总体参数之差;后者反映抽样平均数(成数)与总体平均数(成数)的()。
10.影响抽样误差大小的因素有:(总体标志值的差异程度)、(样本容量)、抽样方法和(抽样组织形式)。
11.对于同一种抽样组织形式来讲,重复抽样的平均误差(大于)不重复抽样的平均误差。
当(n/N )很小时,可以用重复抽样的平均误差公式来近似计算不重复抽样的平均误差。
12.在其它条件不变的情况下,极限误差增大,则概率度(大),可靠程度(大)。
13.在缺少总体的方差时,可用(样本方差)代替来计算抽样误差。
14.抽样极限误差是指抽样指标与总体指标之间抽样误差的(允许范围)。
抽样极限误差通常以()为标准单位来衡量。
(二)名词解释1.随机性原则2.抽样误差3.样本4.抽样平均误差5.抽样极限误差6.区间估计7.重复抽样8.不重复抽样(三)判断题1.抽样调查就是凭主观意识,从总体中抽取部分单位进行调查。
(×)2.抽样法不仅是对被研究总体有关指标进行科学推算的方法,而且是搜集统计资料的方法。
()3.抽样调查中的随机误差是可以避免的。
(×)4.所有可能的样本平均数的平均数等于总体的平均数。
()5.抽样误差是不可避免的,但人们可以调整总体的方差的大小来控制抽样误差的大小。
(×)6.缩小抽样的极限误差便会降低推断的把握程度。
()7.由于抽样调查中既有登记性误差又有代表性误差,所以只有登记性误差的全面调查准确性高。
(×)8.重复抽样和不重复抽样是抽取样本的两种方法,各抽样组织方式都可以使用这两种方法。
()(四)单项选择题1.随机抽样的基本要求是严格遵守( B )A、准确性原则B、随机性原则C、代表性原则D、可靠性原则2.抽样调查的主要目的是( D )A、广泛运用数学方法B、计算和控制抽样误差C、修正普查资料D、用样本指标来推算总体指标3. 抽样调查中( A )A、既有登记性误差,也有代表性误差B、只有登记性误差,没有代表性误差C、没有登记性误差,只有代表性误差D、既没有登记性误差,也没有代表性误差4.要使抽样误差减少一半(在其它条件不变的情况下),则抽样单位数必须( D )。
A、增加2倍B、增加到2倍C、增加4倍D、增加到4倍5.抽样平均误差反映了样本指标与总体指标之间的( C )。
A、实际误差B、实际误差的绝对值C、平均误差程度D、可能误差范围6.反映样本指标与总体指标之间抽样误差可能范围的指标是( B )。
A、样本平均误差B、抽样极限误差C、可靠程度D、概率度7.在实际工作中,不重复抽样的抽样平均误差的计算,采用重复抽样的公式的场合是( A )A、抽样单位数占总体单位数的比重很小时B、抽样单位数占总体单位数的比重很大时C、抽样单位数目很少时D、抽样单位数目很多时8.在其它条件不变的情况下,抽样单位数目和抽样误差的关系是( B )。
A、抽样单位数目越大,抽样误差越大B、抽样单位数目越大,抽样误差越小C、抽样单位数目的变化与抽样误差的数值无关D、抽样误差变化程度是抽样单位数变动程度的1/29.事先将全及总体各单位按某一标志排列,然后依固定顺序和间隔来抽选调查单位的抽样组织形式,被称为( D )。
A、分层抽样B、简单随机抽样C、整群抽样D、等距抽样10.在总体内部情况复杂,而且各单位之间差异程度较大,单位数目又多的情况下,宜采用(B )。
A、简单随机抽样B、类型抽样C、等距抽样D、整群抽样11.用考虑顺序的重置抽样方法,从4个单位中抽选2个单位组成一个样本,则样本可能数目为( C )。
A 、1642=B 、10!3!2!5=C 、12!2!4=D 、6!2!2!4=12.无偏性是用抽样指标估计总体指标应满足的要求之一,无偏性是指( D )。
A 、样本平均数等于总体平均数B 、样本成数等于总体成数C 、抽样指标等于总体指标D 、抽样指标的平均数等于总体指标13.在同样条件下,不重置抽样的抽样平均误差与重置抽样的抽样平均误差相比( A )。
A 、前者小于后者B 、前者大于后者C 、两者相等D 、无法判断14.当可靠程度大于0.6828时,抽样极限误差( A )。
A 、大于抽样平均误差B 、小于抽样平均误差C 、等于抽样平均误差D 、与抽样平均误差的大小依样本容量而定15.在其它条件不变的情况下,提高抽样估计的可靠程度,其精确度将( C )。
A 、保持不变B 、随之扩大C 、随之缩小D 、无法确定16.如果总体成数方差未知,计算必要抽样数目时,可用总体方差的最大值,最大值为( B )。
A 、0.24B 、0.25C 、0.50D 、1(五)多项选择题1.抽样调查适用于下列哪些场合( AB C )。
A 、不宜进行全面调查而又要了解全面情况B 、工业产品质量检查C 、调查项目多、时效性强D 、只需了解一部分单位的情况E 、适用于任何调查2.下列哪些调查中存在系统误差( ABD )。
A 、抽查某车间产品质量时将两名徒工的产品排除在外B 、某县用等距抽样调查农户收入时决定:如果中选户户主不在家,则以该户下一户顶替,已知不在家的农户多为外出经商者C 、为了了解学生健康情况而做的普查D、将学生按来自城乡分组后采取按比例抽样调查学生开支情况E、简单随机抽样3.影响抽样误差大小的因素有(ABC )。
A、抽样单位数的多少B、总体被研究标志的变异程度C、抽样组织方式D、登记误差大小E、抽到的样本如何4.合理的或优良的抽样估计,要求用抽样指标估计总体指标时,应该满足如下标准,即(ACE )。
A、无偏性B、代表性C、一致性D、时间性E、有效性5.抽样推断中的抽样误差(ABD )。
A、是不可避免要产生的B、可以事先计算C、可通过不同的抽样方式消除D、误差范围可事先控制E、只能事后进行计算6.抽样平均误差是(ACD )。
A、所有可能样本平均数的标准差B、所有可能样本平均数的平均差C、抽样推断中作为计算误差范围的衡量尺度D、反映抽样平均数与总体平均数的平均误差程度E、是一种系统性误差7.区间估计的基本要素有(BDE )。
A、平均误差B、概率度C、修正系数D、点估计值E、误差范围8.抽样调查的数理依据主要有(BC )。
A、回归分析B、大数定律C、中心极限定理D、误差分布理论E、相关分析9、与典型调查相比较,抽样调查的特点有(ABCDE )。
A、理论基础是概率论大数法则B、按随机原则抽选调查单位C、抽样误差可以事先计算和控制D、调查单位的选取方法不同E、排除主观因素的影响10.抽样估计的特点是(BCE )。