抽样技术考试重点
- 格式:docx
- 大小:152.23 KB
- 文档页数:4
一、选择题1、分层抽样的特点是()A、层内差异小,层间差异大B、层间差异小,层内差异大C、层间差异小D、层内差异大2、下面的表达式中错误的是()A、∑fh=1B、∑nh=n C、∑Wh=1D、∑Nh=13、各省电脑体育彩票中奖号码的产生属于()A、随意抽样B、判断抽样C、随机抽样D、定额抽样4、抽样调查的根本功能是()A、获取样本资料B、计算样本指标C、推断总体数量特征D、节约费用5、最优分配(Vopt )、比例分配(Vprop)的分层随机抽样与相同样本量的简单随机抽样(Vsrs)的精度之间的关系式为()A、Vopt ≤Vprop≤VsrsB、Vprop≤Vopt≤VsrsC、Vprop ≥Vopt≥VsrsD、Vsrs≤Vprop≤Vopt6、我们想了解学生的视力状况,准备抽取若干学校若干班级的学生进行测试,则()A、抽样单位是每一名学生B、调查单位一定是每一名学生C、调查单位可以是班级D、调查单位是学校7、在分层抽样中,当样本容量n固定时,能够使得估计量的方差V(yst)达到最小的分配方式是()A、比例分配B、等额分配C、随机分配D、Neyman分配8、概率抽样与非概率抽样的根本区别是()A、是否能确保总体中的每个单位都有完全相同的概率被抽中B、是否能确保总体中的每个单位都有事先已知或可以计算的非零概率被抽中C、是否能减少调查性误差D、是否能计算和控制抽样误差9、在抽样的总误差中,属于一致性的误差有()A、变量误差与估计量偏差B、估计量偏差与抽样误差C、变量误差与抽样误差D、非抽样误差与估计量偏差10、简单随机抽样、系统抽样、按比例分配的分层抽样三者之间的共同点是()A、将总体分成几部分,然后按事先确定的规则在各部分抽取B、每个个体单元被抽到的可能性都相等C、一旦选定了第一个样本单元,则其余所有样本单元即可完全确定D、三者没有共同点11、下面哪种样本量分配方式属于比例分配?()n nn A 、h =B 、h =N hNnN hShchch∑N h =1LhShC 、n h N Sn W S=L h h D 、h =L h h n n N S∑hh∑W hShh =1h =112、整群抽样中的群的划分标准为()A 、群的划分尽可能使群间的差异小,群内的差异大B 、群的划分尽可能使群间的差异大,群内的差异小C 、群的划分尽可能使群间的差异大,群内的差异大D 、群的划分尽可能使群间的差异小,群内的差异小13、群规模大小相等时,总体均值的简单估计量为()ˆ1A.Y =nM ˆB.Y =∑∑yi =1j =1nM ijn M 1y ij ∑∑n (M -1)i =1j =1ˆ1n M C.Y =∑∑y ij ni =1j =1ˆ1D.Y =N∑∑yi =1j =1nM ij14、关于多阶段抽样的阶段数,下列说法最恰当的是()A 、越多越好B 、越少越好C 、权衡各种因素决定D 、根据主观经验判断15、在多阶段抽样中,当初级单元大小相等时,第一阶段抽样通常采用()A 、系统抽样B 、简单随机抽样C 、不等概率抽样D 、非概率抽样16、将总体共120个单元随机分为10路纵队(共12排),然后任取其中一排,得到12个样本单元,此抽样方法属于()A 、简单随机抽样B 、分层抽样C 、整群抽样D 、系统抽样17、样本包含非同质单位而未被发现时,总体均值估计量的方差()A 、会被高估B 、会被低估C 、可能被高估,也可能被低估D 、会发生变化18、优良估计量的标准是()A 、无偏性、充分性和一致性B 、无偏性、一致性和有效性C 、无误差性、一致性和有效性D 、无误差性、无偏性和有效性19、在放回式PPS 抽样中,记第i 个样本单元y i的抽取概率为p i,则总体总值Yˆ的表达式为()的无偏估计YPPSny 1n y i N A 、∑B 、N∑i C 、n i =1pini =1pi1n p i yi D 、∑∑n i =1yii =1n 20、能使V (y lr )=1-f22(S Y +β2S X -2βS YX )达到极小值的β值为()n2S Y ⋅SXS YXS YXS YXA 、B 、2C 、2D 、SYXS XS YSX21、与简单随机抽样进行比较,样本设计效果系数Deff >1表明()A 、所考虑的抽样设计比简单随机抽样效率低B 、所考虑的抽样设计比简单随机抽样效率高C 、所考虑的抽样设计与简单随机抽样效率相同D 、以上皆对22、下列误差中属于非一致性的有()A 、估计量偏差B 、偶然性误差C 、抽样标准误D 、抽样框偏差23、抽样标准误差的大小与下列哪个因素无关()A 、样本容量B 、抽样方式、方法C 、概率保证程度D 、估计量24、抽样标准误差与抽样极限误差之间的关系是()A 、∆=ˆ)SE (θθˆ)ˆ)tSE (θSE (θˆB 、∆=tSE (θ)C 、∆=D 、∆=θt25、某大学理学院共有六个系,为调查该学院学生通过英语六级的状况,首先采用正比于各系人数规模的有放回PPS 抽样,从六个系中抽取了两个系,然后在这两个系中分别随机抽取10名学生进行调查。
名词解释抽样:从总体全部单元或个体选择部分单元或个体的活动样本:从总体全部单元或个体中选出的部分单元或个体,其全体称为样本总体,简称样本测量对象:又称测量内容,即测量客体的某种或某些属性或特征众值;又称众数,就是在测量过程中出现次数最多的数值再测信度:用同一种测量工具,对同一群测量对象反复测量两次单元:将构成集合体的一个个东西统称为单元或个体抽样调查:从构成总体的所有单元中按一定程序选择一部分单元,并根据这部分单元的特征估计或推断总体特征的调查概率抽样:按照一定概率从构成总体的所有单元中随机选择一部分单元进入样本的抽样方法便利抽样:调查人员根据自己的方便,自行确定入样的单元抽样分布:对一个固定的总体,在确定的样本设计和样本量的条件下,估计量的所有可能取值及其出现概率的序列就是该估计量的抽样分布抽样误差:由于用样本数据对总体特征进行估计所引起的代表性误差非抽样误差:它的来源比较复杂,主要有抽样框未能不重不漏地包含所有抽样单导致的抽样框误差,调查测量不准确引致的测量误差,此外还有无回答误差,粗大误差等比例分配:在分层抽样中,若每层的样本量nh都与层的大小Nh成比例最优分配:在分层随机抽样中,对于给定的费用,使估计量的方差V(yst)达到最小,或者对于给定的估计量方差V,使得总费用达到最小的各层样本量的分配称为最优分配不等概率抽样:如果总体中的每个单元进入样本的可能性是不相等的,则这种随机抽样方式就称不等概率抽样整群抽样:设总体由N个大小单元即初级单元组成,每个初级单元又由若干个较小的次级单元或二级单元组成,首先从总体中按某种方式抽取n个初级单元,然后抽出其中所包含的所有次级单元,构成一个样本,称为整群抽样群内相关系数:表示同一群内不同次级或基本单元的变量值对总体均值的离差乘积的期望值与总体所有次级或基本单元变量值对总体均值离差平方的期望之比非概率抽样:抽样时不遵循随机原则,而是按照研究人员的主观经验或其它条件来抽取样本的一种抽样方法非概率抽样的共同点:不是按照随机原则的方式收取样本判断抽样:目的抽样,主观抽样,立意抽样,专家抽样,它是一种凭研究人员的主观意愿,经验和知识,从总体中选择具有典型代表性的样本点构成样本作为调查客体的一种非概率抽样方法雪球抽样:链式抽样,网络抽样,辐射抽样,连带抽样,它是以”滚雪球”的方式抽取样本,即通过一些”种子”样本点以获取更多样本点的消息,样本逐渐庞大直线等距抽样:假设总体单元数为N,样本容量为n,N=nk,切总体中的N个单元已按某种确定顺序编号为1,2,,N 如抽样程序时先从头k个单元编号中随机抽出一个单元编号,然后每隔k个单元编号抽出一个单元编号,直到抽出n个单元编号为止,则这种等距抽样称为直线等距抽样圆形等距抽样:假设总体单元数为N,样本容量为n,N=nk,总体中的N个单元已按某种确定顺序编号为1,2,,N 如将这些编号看为首尾相接的一个环,并从1到N中按简单随机抽样方式抽取一个单元编号作为随机起点r,然后每隔k抽取一个单元编号,知道抽满n 个单元为止,则这种等距抽样称为圆形等距抽样简答一,概率抽样:按照一定概率从构成总体的所有单元中随机选择一部分单元进入样本的抽样方法概率抽样具有以下特点:1能够表明一个确定的样本包含哪些单元2对每个可能的样本,都有一个确定的被抽取的概率3以随机原则抽取样本4从样本数据估计总体特征时,需要考虑该样本被抽中的概率二,简单随机抽样的抽取规则:1按随机原则取样,在取样时排除任何主观因素选择抽样单元,避免任何先入为主的倾向性,防止出现系统误差2每个抽样单元被抽中的概率都是已知的或事先确定了的 3 每个抽样单元被抽中的概率都是相等的,所以简单随机抽样属于一种等概随机抽样三,抽样调查的具体实施步骤1,调查目标确定2抽样框选择3抽样设计4问卷设计5数据收集6数据编码和录入7审核与插补8参数估计9数据分析和调查结果的表述10数据发布11文档建立四,辅助变量的特点1辅助变量必须是与主要变量高度相关的2辅助变量与主要变量之间的相关关系整体上相当稳定3辅助变量的信息质量更好,帮忙而不添乱4辅助变量的总体总值必须是已知的,或更容易获得的五,二阶段抽样假设总体由N个初级单元组成,没个初级单元又由若干个二级(次级)单元组成,若在总体中按一定的方法抽取n个初级单元,对每个被抽中的初级单元再抽取若干二级单元进行调查,这种抽样被称为二阶段抽样全部抽样分两步实施1从总体中抽初级单元,称为第一阶抽样2从每个被抽样中的初级单元中抽二级单元,称为第二阶段抽样六,整群抽样的特点1可以使用简单的抽样框 2 方便经济3特定场合具有较高的精度七,非概率抽样受重视的原因:1严格的概率抽样几乎无法进行2为了保证随机的原则,对抽样的操作过程要求严格,实施起来比较麻烦费时费力,因为如果调查的目的仅是对问题的初步探索,或是为了获得今后研究的线索,或是为了提出假设,而不是由样本推论总体,采用概率收养就不一定是必须的,3调查对象不确定或者根本无法确定4总体各单位间离散程度不大,且调查有关人员具有丰富的抽样调查经验八,配额抽样:又称定额抽样,它是按照总体的特征予以配置样本的一种非概率抽样方法,首先将总体中的所有单元按一定的标志分为若干类,然后在每个类中按照事先规定的比例或数量用便利抽样或判断抽样方法选取样本点九,配额抽样在实施当中的步骤:1选择样本配额控制特征2估计配额抽样的样本容量3选择配额抽样的具体实施方式4抽样当中的控制措施降低无回答率的方法预防措施有:1首先问卷设计应具有吸引力2严格选择调查员3加强对调查员的培训4事先通知5奖励措施6 多次访问7替换被调查单元8调查中的敏感性问题以及用随机化回答技术解决敏感性问题的方法十,样本轮换应遵循的原则1代表性,所谓代表性,一是指轮换后的新样本必须具有代表性,二指新选取的样本原则上必须满足与被轮换掉的原样本同类型,有代表性2连续性,指样本轮换后进行抽样调查取得的资料应与样本轮换前进行调查所取得的资料连续并可比3保证必选样本点,所谓必选样本点,指进行抽样调查时必须作为样本点的总体单元保证必选样本点,指必选样本点不参加轮换,仅对非必选样本点进行轮换4遵循抽样原理,指在进行样本轮换时,要按照抽样调查的原理来选取被轮换掉的样本点和补入的新样本点选择根据调查误差的性质和特点可分:系统误差随机误差粗大误差众值对其分布特性才有较好表现:连读型单峰性对称分布的随机变量一个好的估计量的标准主要有:无偏性有效性一致性(相合性)估计总体特征:总体总值总体均值总体比例总体总值几种基本的抽样方法:简单随机抽样分层抽样整群抽样系统抽样多阶段抽样满足什么条件选择比率估计量应优先于选择简单估计量:当P>Cx/(2Cy)时,尤其是当Cx Cy时,只要相关系数p>1/2比率估计比简单估计更为精确Srs是simple random sampling的缩写prop是proportional的缩写opt optimu的缩写V opt Vprop Vsrs分层抽样的层数确定:层数最多为n/2, 层数L以不超过6为宜多项抽样是最简单的不等概率抽样实施方法:代码法拉希里法非抽样调查不仅在抽样调查中,而且全国调查中也是存在的,减小非抽样误差的方法主要是严格调查程序、规范调查步骤、加强人员培训和管理,合理的设计问题和答卷,改进测量方法和工具在这方面的理论研究近年来进步较大,在抽样理论中占有越来越重要的地位对于无偏的估计量这个条件就是:总体中每个次级单元或者更一般的说,多阶段抽样中的最终阶段的每一个单元都有相等的被抽中的机会初级单元大小不等时,对比例的估计通常采用两种方法:一种是分别在两阶段中均采用等概率抽样另一种是第一阶段采用PPS抽样,第二阶段采用等概率抽样对Y的估计有三种方法,一种是简单估计,一种是加权估计,还有一种是比率估计系统抽样的主要缺点是:不存在严格意义下的无偏估计量,方差估计十分困难对线性趋势总体的系统抽样的改进沿2个方向进行: 改进抽样方法(中心位置抽样法,对称系统抽样法) 改进估计方法(首尾校正法)便利抽样:又称就近抽样偶遇抽样自然抽样方便抽样对无回答的调整: 二重抽样法加权调整法插补法。
①什么是系统抽样?简述系统抽样的主要优点。
答:设总体中的N 个单元按某种顺序(通常是依照有关标志排队,即按某个在比估计和回归估计钟提到的辅助变量的顺序排列,但也可以是依照无关标志排队,即按不完全满足辅助变量定义的某个已知变量排列,这种排列近似于随机排列),编号为1,2,…,N 。
抽样程序是首先抽取一个或一组起始单元的编号,然后按某种确定的规则选取其他单元的编号,直到满n 个为止,则这种抽样成为系统随机抽样,简称系统抽样。
主要优点:一是在系统抽样方式下,样本单位的取得十分简便,使得这种抽样方式具有很高的实用价值;二是系统抽样可以使样本单元在总体中分布均匀,因而一般具有较好的代表性。
②什么是不等概抽样?不等概抽样适用情况有哪些?答:赋予每个单元与其规模(或辅助变量)或比例的入样概率,这样一来,大单元入样概率大,小单元入样概率小,然后在估计中采用不同的权数进行弥补。
1、抽样单元在总体中所占的地位不一致;2、调查的总体单元与抽样总体的单元不一致;3、改善估计量;4、也广泛应用于整群抽样、多阶段抽样中初级单元规模较大的情形。
③分层抽样的分层的原则及其意义。
答:1、层内单元具有相同性质,通常按调查对象的不同类型进行划分。
这时,分层抽样能够对每一类的目标量进行估计;2、尽可能使层内单元的标志值相近,层间单元的差异尽可能大,从而达到提高抽样估计精度的目的。
3、既按类型又按层内单元标志值相近的原则进行多重分层,同时达到实现估计类值以及提高估计精度的目的。
4、为了抽样组织实施的方便,通常按行政管理机构设置进行分层。
意义:1、分层抽样可以提高参数估计的精度;2、分层抽样不仅能对总体参数进行估计,而且能对各层(子总体)参数进行估计;3、便于依托行政管理机构进行组织和实施,同时还可以根据各层的不同特点采用不同的抽样方式;4、分层抽样样本在总体中分布更加均匀。
④系统抽样的局限性有哪些?答:由于样本量(因而抽样分布)有时不唯一,所以不存在严格意义上的无偏估计,从而导致难以估计抽样误差。
1. 在调查研究中,以下哪种抽样方法最适用于总体较小且同质性较高的情况?A. 简单随机抽样B. 系统抽样C. 分层抽样D. 整群抽样2. 分层抽样中,分层的主要目的是什么?A. 提高样本的代表性B. 减少抽样误差C. 简化数据分析D. 增加样本量3. 在抽样调查中,非抽样误差主要来源于以下哪个方面?A. 样本设计B. 数据收集C. 数据分析D. 样本量计算4. 系统抽样的一个主要优点是?A. 简单易行B. 代表性强C. 成本低D. 适用于任何总体5. 整群抽样适用于以下哪种情况?A. 总体较小B. 总体异质性高C. 群间差异小D. 群内差异小6. 在多阶段抽样中,第一阶段通常采用哪种抽样方法?A. 简单随机抽样B. 系统抽样C. 分层抽样D. 整群抽样7. 抽样误差可以通过以下哪种方式减少?A. 增加样本量B. 改变抽样方法C. 提高数据质量D. 增加调查人员8. 在调查设计中,以下哪种情况可能导致样本偏差?A. 样本量过小B. 抽样方法不当C. 数据收集错误D. 数据分析错误9. 概率抽样与非概率抽样的主要区别在于?A. 样本量的确定B. 抽样方法的选择C. 样本的代表性D. 数据分析的方法10. 在调查中,以下哪种抽样方法可以确保每个个体都有相同的被抽中机会?A. 简单随机抽样B. 系统抽样C. 分层抽样D. 整群抽样11. 分层抽样中,各层的样本量通常如何确定?A. 根据总体比例B. 随机确定C. 根据层的重要性D. 根据层的变异程度12. 在抽样调查中,以下哪种情况可能导致非抽样误差?A. 样本量过小B. 抽样方法不当C. 数据收集错误D. 数据分析错误13. 系统抽样的一个主要缺点是?A. 代表性差B. 成本高C. 可能产生周期性偏差D. 不适用于异质总体14. 整群抽样的一个主要优点是?A. 简单易行B. 代表性强C. 成本低D. 适用于任何总体15. 在多阶段抽样中,第二阶段通常采用哪种抽样方法?A. 简单随机抽样B. 系统抽样C. 分层抽样D. 整群抽样16. 抽样误差与样本量之间的关系是?A. 正比关系B. 反比关系C. 无关D. 复杂关系17. 在调查设计中,以下哪种情况可能导致样本偏差?A. 样本量过小B. 抽样方法不当C. 数据收集错误D. 数据分析错误18. 概率抽样与非概率抽样的主要区别在于?A. 样本量的确定B. 抽样方法的选择C. 样本的代表性D. 数据分析的方法19. 在调查中,以下哪种抽样方法可以确保每个个体都有相同的被抽中机会?A. 简单随机抽样B. 系统抽样C. 分层抽样D. 整群抽样20. 分层抽样中,各层的样本量通常如何确定?A. 根据总体比例B. 随机确定C. 根据层的重要性D. 根据层的变异程度21. 在抽样调查中,以下哪种情况可能导致非抽样误差?A. 样本量过小B. 抽样方法不当C. 数据收集错误D. 数据分析错误22. 系统抽样的一个主要缺点是?A. 代表性差B. 成本高C. 可能产生周期性偏差D. 不适用于异质总体23. 整群抽样的一个主要优点是?A. 简单易行B. 代表性强C. 成本低D. 适用于任何总体24. 在多阶段抽样中,第二阶段通常采用哪种抽样方法?A. 简单随机抽样B. 系统抽样C. 分层抽样D. 整群抽样25. 抽样误差与样本量之间的关系是?A. 正比关系B. 反比关系C. 无关D. 复杂关系26. 在调查设计中,以下哪种情况可能导致样本偏差?A. 样本量过小B. 抽样方法不当C. 数据收集错误D. 数据分析错误27. 概率抽样与非概率抽样的主要区别在于?A. 样本量的确定B. 抽样方法的选择C. 样本的代表性D. 数据分析的方法28. 在调查中,以下哪种抽样方法可以确保每个个体都有相同的被抽中机会?A. 简单随机抽样B. 系统抽样C. 分层抽样D. 整群抽样29. 分层抽样中,各层的样本量通常如何确定?A. 根据总体比例B. 随机确定C. 根据层的重要性D. 根据层的变异程度30. 在抽样调查中,以下哪种情况可能导致非抽样误差?A. 样本量过小B. 抽样方法不当C. 数据收集错误D. 数据分析错误31. 系统抽样的一个主要缺点是?A. 代表性差B. 成本高C. 可能产生周期性偏差D. 不适用于异质总体32. 整群抽样的一个主要优点是?A. 简单易行B. 代表性强C. 成本低D. 适用于任何总体33. 在多阶段抽样中,第二阶段通常采用哪种抽样方法?A. 简单随机抽样B. 系统抽样C. 分层抽样D. 整群抽样34. 抽样误差与样本量之间的关系是?A. 正比关系B. 反比关系C. 无关D. 复杂关系35. 在调查设计中,以下哪种情况可能导致样本偏差?A. 样本量过小B. 抽样方法不当C. 数据收集错误D. 数据分析错误36. 概率抽样与非概率抽样的主要区别在于?A. 样本量的确定B. 抽样方法的选择C. 样本的代表性D. 数据分析的方法37. 在调查中,以下哪种抽样方法可以确保每个个体都有相同的被抽中机会?A. 简单随机抽样B. 系统抽样C. 分层抽样D. 整群抽样38. 分层抽样中,各层的样本量通常如何确定?A. 根据总体比例B. 随机确定C. 根据层的重要性D. 根据层的变异程度39. 在抽样调查中,以下哪种情况可能导致非抽样误差?A. 样本量过小B. 抽样方法不当C. 数据收集错误D. 数据分析错误40. 系统抽样的一个主要缺点是?A. 代表性差B. 成本高C. 可能产生周期性偏差D. 不适用于异质总体41. 整群抽样的一个主要优点是?A. 简单易行B. 代表性强C. 成本低D. 适用于任何总体42. 在多阶段抽样中,第二阶段通常采用哪种抽样方法?A. 简单随机抽样B. 系统抽样C. 分层抽样D. 整群抽样43. 抽样误差与样本量之间的关系是?A. 正比关系B. 反比关系C. 无关D. 复杂关系44. 在调查设计中,以下哪种情况可能导致样本偏差?A. 样本量过小B. 抽样方法不当C. 数据收集错误D. 数据分析错误45. 概率抽样与非概率抽样的主要区别在于?A. 样本量的确定B. 抽样方法的选择C. 样本的代表性D. 数据分析的方法46. 在调查中,以下哪种抽样方法可以确保每个个体都有相同的被抽中机会?A. 简单随机抽样B. 系统抽样C. 分层抽样D. 整群抽样47. 分层抽样中,各层的样本量通常如何确定?A. 根据总体比例B. 随机确定C. 根据层的重要性D. 根据层的变异程度48. 在抽样调查中,以下哪种情况可能导致非抽样误差?A. 样本量过小B. 抽样方法不当C. 数据收集错误D. 数据分析错误49. 系统抽样的一个主要缺点是?A. 代表性差B. 成本高C. 可能产生周期性偏差D. 不适用于异质总体50. 整群抽样的一个主要优点是?A. 简单易行B. 代表性强C. 成本低D. 适用于任何总体51. 在多阶段抽样中,第二阶段通常采用哪种抽样方法?A. 简单随机抽样B. 系统抽样C. 分层抽样D. 整群抽样52. 抽样误差与样本量之间的关系是?A. 正比关系B. 反比关系C. 无关D. 复杂关系53. 在调查设计中,以下哪种情况可能导致样本偏差?A. 样本量过小B. 抽样方法不当C. 数据收集错误D. 数据分析错误54. 概率抽样与非概率抽样的主要区别在于?A. 样本量的确定B. 抽样方法的选择C. 样本的代表性D. 数据分析的方法55. 在调查中,以下哪种抽样方法可以确保每个个体都有相同的被抽中机会?A. 简单随机抽样B. 系统抽样C. 分层抽样D. 整群抽样56. 分层抽样中,各层的样本量通常如何确定?A. 根据总体比例B. 随机确定C. 根据层的重要性D. 根据层的变异程度57. 在抽样调查中,以下哪种情况可能导致非抽样误差?A. 样本量过小B. 抽样方法不当C. 数据收集错误D. 数据分析错误58. 系统抽样的一个主要缺点是?A. 代表性差B. 成本高C. 可能产生周期性偏差D. 不适用于异质总体59. 整群抽样的一个主要优点是?A. 简单易行B. 代表性强C. 成本低D. 适用于任何总体60. 在多阶段抽样中,第二阶段通常采用哪种抽样方法?A. 简单随机抽样B. 系统抽样C. 分层抽样D. 整群抽样1. A2. A3. B4. A5. C6. D7. A8. B9. C10. A11. A12. C13. C14. C15. A16. B17. B18. C19. A20. A21. C22. C23. C24. A25. B26. B27. C28. A29. A30. C31. C32. C33. A34. B35. B36. C37. A38. A39. C40. C41. C42. A43. B44. B45. C46. A47. A48. C49. C51. A52. B53. B54. C55. A56. A57. C58. C59. C60. A。
第四章抽样技术概述班级:姓名:成绩一、填空题:(21分)1、抽样调查是一种()调查,它是从所研究客观现象的总体中,按照()抽取()进行调查,以从这一部分单位调查的结果,来()所研究总体的相应数据。
2、随机原则是指在总体中抽取样本单位时,完全排除()意识,保证总体中()单位都有被抽中的同等可能性原则。
3、抽样调查是以()数据推断的()数据。
4、抽样调查产生的(),可以计算并控制,5、从全及总体中抽取样本单位有()和()两种方法。
6、一般说,不重复抽样的抽样误差()重复抽样的抽样误差。
7、抽样平均误差就是抽样平均数(或抽样成数)与总体平均数(或总体成数)的()。
它反映抽样平均数(或抽样成数)与总体平均数(或总体成数)的()。
8、影响抽样误差的主要因素有()、()、()、()。
9、利用样本统计量估计总体参数,通常运用()和()两种方法。
10、点估计是直接用()估计总体参数的推断方法。
点估计不考虑()及()。
11、置信区间反映了参数估计的精确程度,区间愈小,估计就愈();而置信度则反映了总体参数落在置信区间内的( ),置信度愈高,则估计的把握程度就()。
12、影响样本容量大小的因素主要有五种:()、()、()、()、()。
13、区间估计是用样本统计量估计总体参数时,用一个区间范围的值作为总体参数的估计值,并注明总体参数落在这们一个区间的可能性,或称()。
我们称这一区间为()。
14、对于简单随机重复抽样,若其他条件不变,则当误差范围缩小一半,抽样单位数必须()倍。
若误差范围扩大一倍,则抽样单位数为原来的()。
二、单项选择题:(14分)1、随机抽样的基本要求是严格遵守()A.、准确性原则B、随机性原则C、代表性原则D、可靠性原则。
2、抽样调查的主要目的是()A.、广泛运用数学的方法B、计算和控制抽样误差C、修正普查的资料D、用样本统计量推算总体参数。
3、在抽样调查中()A.、既有登记性误差,也有代表性误差B、既没有登记性误差,也没有代表性误差C、只有登记性误差,没有代表性误差D、、没有登记性误差,只有代表性误差。
习题一1.请列举一些你所了解的以及被接受的抽样调查。
2.抽样调查基础理论及其意义;3.抽样调查的特点。
4.样本可能数目及其意义;5.影响抽样误差的因素;6.某个总体抽取一个n=50的独立同分布样本,样本数据如下:567 601 665 732 366 937 462 619 279 287690 520 502 312 452 562 557 574 350 875834 203 593 980 172 287 753 259 276 876692 371 887 641 399 442 927 442 918 11178 416 405 210 58 797 746 153 644 4761)计算样本均值y与样本方差s2;2)若用y估计总体均值,按数理统计结果,y是否无偏,并写出它的方差表达式;3)根据上述样本数据,如何估计v(y)?4)假定y的分布是近似正态的,试分别给出总体均值μ的置信度为80%,90%,95%,99%的(近似)置信区间。
习题二一判断题1 普查是对总体的所有单元进行调查,而抽样调查仅对总体的部分单元进行调查。
2 概率抽样就是随机抽样,即要求按一定的概率以随机原则抽取样本,同时每个单元被抽中的概率是可以计算出来的。
3 抽样单元与总体单元是一致的。
4 偏倚是由于系统性因素产生的。
5 在没有偏倚的情况下,用样本统计量对目标量进行估计,要求估计量的方差越小越好。
6 偏倚与抽样误差一样都是由于抽样的随机性产生的。
7 偏倚与抽样误差一样都随样本量的增大而减小。
8 抽样单元是构成抽样框的基本要素,抽样单元只包含一个个体。
9 抽样单元可以分级,但在抽样调查中却没有与之相对应的不同级的抽样框。
10 总体目标量与样本统计量有不同的意义,但样本统计量它是样本的函数,是随机变量。
11 一个抽样设计方案比另一个抽样设计方案好,是因为它的估计量方差小。
12 抽样误差在概率抽样中可以对其进行计量并加以控制,随着样本量的增大抽样误差会越来越小,随着n越来越接近N,抽样误差几乎可以消除。
欢迎共阅《抽样技术》期末复习1、设计效应(Deff )答:设计效应(deff )是由基什提出的,用来对不同抽样方法进行比较,其定义为:srs V(y)deff V (y)=,其中srs V (y)为不放回简单随机抽样简单估计量的方差;V(y)为某个抽样设计在同样样本量条件下估计量的方差。
设计效应的定义就是将某个抽样设计的估计量的方差与同样样本量条件下的不放回简单随机抽样简单估计量的方差进行比较。
如果deff<1,则所考虑的抽样率低。
deff n '。
2答:2)每3偏。
(3查数据质量和估计结果的负面影响非常大。
非抽样误差按其来源、性质的不同,可以分为抽样框误差、无回答误差和计量误差等三类。
4、不等概率抽样答:不等概率抽样在抽样前赋予总体每个单元一个入样概率,当然这个入样概率是不相同的,否则抽样就成为等概率的抽样。
不等概抽样的优点是大大提高估计精度,减少抽样误差,但使用它也有条件,就是必须要有说明每个单元规模大小的辅助变量来确定每个单元人样的概率,这在抽样及推算时都是必须的。
不等概率抽样可以按样本单元是否放回分为放回不等概抽样和不放回不等概抽样。
5、最优分配答:在分层随机抽样中,如何将样本量分配到各层,使得在总费用给定的条件下估计量的方差达到最小,或在给定估计量方差的条件下,使总费用最小,能满足这个条件的样本量分配就是最优分配。
6、比率估计答:比率估计(radioestimator)又称比估计,在进行抽样调查时,目标量本身就是总体比率,这样对目标量的估计就叫做比率估计,也可用来提高估计量的精度,它是有偏的。
7、试述分别比估计和联合比估计的比较因为这8如9答:但10区共有N=1000户,调查了n=100户,得y=12.5吨,2s=1252,有40户用水超过了规定的标准。
要求计算:该住宅区总的用水量及95%的置信区间;若要求估计的相对误差不超过10%,应抽多少户作为样本?以95%的可靠性估计超过用水标准的户数;解:已知N=1000,n=100,n100f0.1N1000===,2y=12.5s1252=,估计该住宅区总的用水量Y为:估计该住宅区总的用水量Y的方差和标准差为:因此,在95%的置信度下,该住宅总的用水量的置信区间估计为:即,我们可以以95%的把握认为该住宅总的用水量在5921吨~19079吨之间。
一、选择题1、 分层抽样的特点是()A 、层内差异小,层间差异大B 、层间差异小,层内差异大C 、层间差异小D 、层内差异大2、下面的表达式中错误的是()A 、∑=1h fB 、∑=n n hC 、∑=1h WD 、∑=1h N3、各省电脑体育彩票中奖号码的产生属于()A 、随意抽样B 、判断抽样C 、随机抽样D 、定额抽样4、抽样调查的根本功能是()A 、获取样本资料B 、计算样本指标C 、推断总体数量特征D 、节约费用5、最优分配(opt V )、比例分配(prop V )的分层随机抽样与相同样本量的简单随机抽样(srs V )的精度之间的关系式为()A 、srs prop opt V V V ≤≤B 、srs opt prop V V V ≤≤C 、srs opt prop V V V ≥≥D 、opt prop srs V V V ≤≤6、我们想了解学生的视力状况,准备抽取若干学校若干班级的学生进行测试,则()A 、抽样单位是每一名学生B 、调查单位一定是每一名学生C 、调查单位可以是班级D 、调查单位是学校7、在分层抽样中,当样本容量n 固定时,能够使得估计量的方差)(st y V 达到最小的分配方式是()A 、比例分配B 、等额分配C 、随机分配D 、Neyman 分配8、概率抽样与非概率抽样的根本区别是()A 、是否能确保总体中的每个单位都有完全相同的概率被抽中B 、是否能确保总体中的每个单位都有事先已知或可以计算的非零概率被抽中C 、是否能减少调查性误差D 、是否能计算和控制抽样误差9、在抽样的总误差中,属于一致性的误差有()A 、变量误差与估计量偏差B 、估计量偏差与抽样误差C 、变量误差与抽样误差D 、非抽样误差与估计量偏差10、简单随机抽样、系统抽样、按比例分配的分层抽样三者之间的共同点是()A 、将总体分成几部分,然后按事先确定的规则在各部分抽取B 、每个个体单元被抽到的可能性都相等C 、一旦选定了第一个样本单元,则其余所有样本单元即可完全确定D 、三者没有共同点11、下面哪种样本量分配方式属于比例分配?()A 、N n N n h h =B 、h L h hh hh h h c S Nc S N n n ∑==1 C 、∑==L h h h h h h S N S N n n 1 D 、∑==L h hh h h h S W S W n n 112、整群抽样中的群的划分标准为()A 、群的划分尽可能使群间的差异小,群内的差异大B 、群的划分尽可能使群间的差异大,群内的差异小C 、群的划分尽可能使群间的差异大,群内的差异大D 、群的划分尽可能使群间的差异小,群内的差异小13、群规模大小相等时,总体均值 的简单估计量为() A.∑∑===n i M j ij y nMY 111ˆ B.()∑∑==-=n i M j ij y M n Y 1111ˆ C.∑∑===n i Mj ij y n Y 111ˆ D.∑∑===n i M j ij yN Y 111ˆ14、关于多阶段抽样的阶段数,下列说法最恰当的是()A 、越多越好B 、越少越好C 、权衡各种因素决定D 、根据主观经验判断15、在多阶段抽样中,当初级单元大小相等时,第一阶段抽样通常采用()A 、系统抽样B 、简单随机抽样C 、不等概率抽样D 、非概率抽样16、将总体共120个单元随机分为10路纵队(共12排),然后任取其中一排,得到12个样本单元,此抽样方法属于()A 、简单随机抽样B 、分层抽样C 、整群抽样D 、系统抽样17、样本包含非同质单位而未被发现时,总体均值估计量的方差()A 、会被高估B 、会被低估C 、可能被高估,也可能被低估D 、会发生变化18、优良估计量的标准是()A 、无偏性、充分性和一致性B 、无偏性、一致性和有效性C 、无误差性、一致性和有效性D 、无误差性、无偏性和有效性19、在放回式PPS 抽样中,记第i 个样本单元i y 的抽取概率为i p ,则总体总值Y的无偏估计PPSˆY 的表达式为 () A 、∑=n 1i i i y n 1p B 、∑=n 1i i i y p N C 、∑=n1i i y n N D 、∑=n 1i i i y 1p n 20、能使)2(1)(222YX X Y lr S S S nf y V ββ-+-=达到极小值的β值为() A 、YX X Y S S S ⋅ B 、2X YX S S C 、2Y YX S S D 、XYX S S 2 21、与简单随机抽样进行比较,样本设计效果系数Deff >1表明()A 、所考虑的抽样设计比简单随机抽样效率低B 、所考虑的抽样设计比简单随机抽样效率高C 、所考虑的抽样设计与简单随机抽样效率相同D 、以上皆对22、下列误差中属于非一致性的有()A 、估计量偏差B 、偶然性误差C 、抽样标准误D 、抽样框偏差23、抽样标准误差的大小与下列哪个因素无关()A 、样本容量B 、抽样方式、方法C 、概率保证程度D 、估计量24、抽样标准误差与抽样极限误差之间的关系是()A 、θθ)ˆ(SE =∆ B 、)ˆ(θtSE =∆ C 、θθ)ˆ(tSE =∆ D 、tSE )ˆ(θ=∆ 25、某大学理学院共有六个系,为调查该学院学生通过英语六级的状况,首先采用正比于各系人数规模的有放回PPS 抽样,从六个系中抽取了两个系,然后在这两个系中分别随机抽取10名学生进行调查。
《抽样技术》练习题及答案————————————————————————————————作者:————————————————————————————————日期:习题一1.请列举一些你所了解的以及被接受的抽样调查。
2.抽样调查基础理论及其意义;3.抽样调查的特点。
4.样本可能数目及其意义;5.影响抽样误差的因素;6.某个总体抽取一个n=50的独立同分布样本,样本数据如下:567 601 665 732 366 937 462 619 279 287690 520 502 312 452 562 557 574 350 875834 203 593 980 172 287 753 259 276 876692 371 887 641 399 442 927 442 918 11178 416 405 210 58 797 746 153 644 4761)计算样本均值y与样本方差s2;2)若用y估计总体均值,按数理统计结果,y是否无偏,并写出它的方差表达式;3)根据上述样本数据,如何估计v(y)?4)假定y的分布是近似正态的,试分别给出总体均值μ的置信度为80%,90%,95%,99%的(近似)置信区间。
习题二一判断题1 普查是对总体的所有单元进行调查,而抽样调查仅对总体的部分单元进行调查。
2 概率抽样就是随机抽样,即要求按一定的概率以随机原则抽取样本,同时每个单元被抽中的概率是可以计算出来的。
3 抽样单元与总体单元是一致的。
4 偏倚是由于系统性因素产生的。
5 在没有偏倚的情况下,用样本统计量对目标量进行估计,要求估计量的方差越小越好。
6 偏倚与抽样误差一样都是由于抽样的随机性产生的。
7 偏倚与抽样误差一样都随样本量的增大而减小。
8 抽样单元是构成抽样框的基本要素,抽样单元只包含一个个体。
9 抽样单元可以分级,但在抽样调查中却没有与之相对应的不同级的抽样框。
10 总体目标量与样本统计量有不同的意义,但样本统计量它是样本的函数,是随机变量。
统计基础单元测试第四章抽样技术一、单项选择题(10题20分)1.在抽样推断中,必须遵循( )抽取样本A.随意原则B.随机原则C.可比性原则D.对等原则2.能够事先加以计算和控制的误差是A.抽样误差B.登记误差C.系统误差D.测量误差3.抽样极限误差与抽样平均误差数值之间的关系是A.前者一定小于后者B.前者一定大于后者C.前者一定等于后者D.以上三种情况都有可能4.某企业连续性生产,为检验产品质量,在24小时中每隔半小时抽取一分钟产品进行检验,这是A.整群抽样B.简单随机抽样C.类型抽样D.纯随机抽样5.概率和概率度之间的对应关系是A.前者大于后者B.前者小于后者C.确定性关系D.不确定6.现随机从某批次日兴灯产品中抽取100件产品,测得平均寿命为2000小时,则样本平均A.100小时B.2000小时C.1900小时D.2100小时7.现随机从某批次日兴灯产品中抽取100件产品,其中优质品率为98%,则样本优质品的成数为A.100%B.98%C.2%D.无法计算8.抽样平均误差反映了样本指标与总体指标间的A.可能误差范围B.平均误差程度C.实际误差D.实际误差的绝对值9.在实际工作中,不重复抽样的平均抽样误差的计算,采用重复抽样的公式的情况是A.n占N比重很小时B.n占N比重很大时C.n很小时D.n很大时10.点估计A.不考虑抽样误差及可靠程度B.考虑抽样误差及可靠程度C.适用于推断的准确性要求高的情况D.无需考虑有效性和一致性二、多项选择题(8题24分)1.以下关于抽样调查说法正确的是A.必须遵循随机性原则B.能以样本数据估计总体数C.能节约调查成本D.需要大量调查经费2.总体A.可以是有限总体B.可以是无限总体C.可以抽取多个样本D.其容量用N表示3.从总体中抽取样本单位的方法有A.随机抽样B.重复抽样C.类型抽样D.不重复抽样4.影响抽样误差的主要因素有A.必须抽样数目的多少B.总体标志变异程度的大小C.不同的抽样组织形式D.抽样周期的长短5.要提高抽样推断的精确度,可采用的方法有A.增加样本单位数目B.减少样本单位数目C.缩小总体被研究标志的变异程度D.改变抽样组织方式6.以下相关公式正确的有A.xμ= B.pμC.pμxμ7.在总体1000个单位中,随机抽取100个单位进行调查,则下列说法正确的是A.样本个数是100个B.样本容量是100个C.是一个大样本D.是一个有100个单位的样本8.对总体平均数进行区间估计时必须掌握的基本数据有A.样本平均数B.样本平均数的抽样误差C.抽样间隔数D.概率度t三、填空题(10题10分)1.概率抽样的组织方式主要简单随机抽样、系统随机抽样、分层抽样和整群抽样等2.通常当样本容量小于30时,称为小3.在抽样调查中,按照随机原则从总体中抽取的那部分组成的整体叫做样本4.总体参数估计的方法有点估计和区间估计两种5.抽样极限误差反映了样本指标与总体指标之间的抽样误差的可能范围6.总体参数通常是一个定值(常量),而样本统计量则随机变量7.总体指标的区间估计必须具备样本指标、抽样平均误差和概率度三个素8.在简单重复抽样条件下,如果其他条件保持不变,仅将误差范围缩小二分之一,则样本容量必须扩大为原来的4倍;若将误差范围扩大一倍,则抽样单位数目将缩小为原来的四分之一四、简答题(10分)1.什么是抽样平均误差?影响抽样平均误差的因素有哪些?答:抽样平均误差是指所有样本指标数值与总体指标数值之差的平均数,即所有样本的抽样估计误差与被估计的未知的真实总体参数值之差的平均数。
2015-2016学年第一学期抽样技术考试重点整理
一、名词解释(4*6分)
1、抽样(sampling):是一种非全面的调查,是指从研究对象的全体(总体)
中抽取一部分单元作为样本,根据对所抽取的样本进行调查,获得对总
体目标量的了解。
2、简单随机抽样(simple random sampling):从抽样框内随机地、一个一个
地抽取若干单元作为样本,在每次抽选中,所有未如样的待选单元入选
样本的概率都相等。
3、分层抽样(stratified sampling):将抽样单元按某种特征或规则划分为不
同的层,然后从不同的层中独立、随机地抽取样本。
4、整群抽样(cluster sampling)是指将总体若然基本单元合并为群,然后直
接抽取群,对中选群中的所有基本单元全部实施调查。
5、PPS抽样:按照总体的单元的规模大小来确定单元每次入样的概率,这
种不等概抽样称为放回的与规模大小成比例的概率抽样。
6、系统抽样(systematic sampling):将总体抽样单元按一定顺序排列,在
规定范围内随机抽取一个单元作为初始单元,然后按事先规定好的规则
确定其他样本单元,这种抽样方法称为系统抽样。
7、多阶段抽样(multi-stage sampling):先抽取群,然后从选中的群中抽取
抽取下一级的抽样单元,以此类推,最终抽取基本抽样单元,整个抽样
过程有多段组成,故称为多阶段抽样。
8、简单估计(simple linear estimate):在没有总体其他相关辅助变量信息可
以利用的情况下,用样本特征直接估计总体特征,又叫简单线性估计。
9、间接估计:在没有总体其他相关辅助变量信息可以利用的情况下,用对
应样本特征乘以相关辅助变量的均值和总值称为比率估计(ratio estimate),用对应样本特正与辅助变量的均值和总值的建立回归方程间
接进行估计叫做回归估计(regression estimate)。
10、有限总体校正系数(fpc):1与抽样比之差,较小总体抽样比越大,
掌握的信息就越多,方差越小。
对于同等样本量不放回简单随机样本的
抽样精度高于放回随机抽样。
11、比例分配(proportional allocation):在分层抽样中每层的样本量与层
大小成比例,即按层权成比例的分配每层样本量。
最优分配(optimum allocation):在分层随机抽样中,对于给定的费用,使估计量的方差达到
最小,或者对于给定的估计量方差,使总费用达到最小的各层样本量的
分配。
内曼分配(Neyman allocation):最优分配常见形式,即按与Wh*Sh
成比例的分配各层样本量。
12、多重分层(multiple stratification):当调查指标与多个辅助变量存在
相关关系时,先按最主要的辅助变量分成大层,在大层中再按第二主要
变量分层子层,从而形成交叉分层。
事后分层:事前分层存在困难时,
先采用简单随机抽样方法从总体中抽取一个样本量为n的样本,然后对
样本中的单元按某些特征进行分层。
13、初级抽样单元(PSU):进行整群抽样时,在第一阶段抽样中,如果
随机抽取样本群后,对群内所有单元进行调查,该阶段的群称为初级抽
样单元。
如果随机抽取样本群后,进一步从中按照低一级的二级抽样单元(SSU)抽取子样本,就是两阶段抽样。
14、分别比估计(separate ratio estimator):对每层样本分别进行比估计,
然后对各层的比估计量进行加权平均,即先“比”后“加权”。
联合比估计(combined ratio estimator):对比率的分子分母分别加权计算出总体均值或总体总量的分层估计量,然后用对应的分层估计量来构造比估计,即现“加权”后“比”。
15、均方误差(MSE):指所有可能估计值与待估参数之间离差平方
的均值,等于估计量方差与偏差之和。
估计量方差:估计量分布的方差偏差(bias)反复抽样后,估计值的数学期望与待估参数之间的离差
16、变异系数CV:标准差与其平均数的比,反映数据离散程度的绝对值。
其数据大小不仅受变量值离散程度的影响,而且还受变量值平均水平大小的影响。
17、有放回简单随机样本(SRSWR)
二、数学表达式的区分(5个)
三、简述题(1个)
1、整群抽样(cluster sampling)与分层抽样(stratified sampling)
●整群抽样是指将总体若然基本单元合并为群,然后直接抽取群,对中选群
中的所有基本单元全部实施调查。
分层抽样是指将抽样单元按某种特征或规则划分为不同的层,然后从不同的层中独立、随机地抽取样本。
●分层抽样要求各层之间的差异很大,层内个体或单元差异小,而整群抽样
要求群与群之间的差异比较小,群内个体或单元差异大
●分层抽样保证了样本中包含有各种特征的抽样单位,样本的结构与总体的
结构比较相近,从而可以有效地提高估计的精度,而且在一定条件下方便组织实施调查。
整群抽样抽取样本时只需要群的抽样框,而不必要求包括
所有基本单位的抽样框,简化了编制抽样框的工作量;一般调查地点相对集中,节省费用方便实施调查;但估计精度较差,需要增加基本调查单元。
2、抽样误差与非抽样误差
●抽样误差:由于抽取样本的随机性造成的样本值于总体值之间的差异,只
要采用抽样调查,抽样误差就不可避免,但可以通过改变样本量控制抽样误差。
●非抽样误差:不是有抽样的随机性引起,而是由于其它多种原因引起的估
计值与总体参数之间的差异,如调查对象范围划分不清,目标总体和抽样总体不一致等原因造成的误差
3、准确度与精确度
●精确度测量了来自不同样本的估计值之间彼此接近程度,一般用估计量分
布的方差表示。
●准确度刻画了估计值和真实值之间的接近程度,一般用均方误差表示,是
指所有可能估计值与待估参数之间离差平方的均值,等于估计量方差与偏差(偏差:反复抽样后,估计值的数学期望与待估参数之间的离差)之和。
●一个严重有偏的估计量可能是精确的,但却是不准确的,一般说来人们更
倾向于把准确度,即均方误差,作为评判抽样方案优劣的准则。
四、计算题(1道)
五、证明题(2道)。