最新抽样调查期末复习题
- 格式:doc
- 大小:270.50 KB
- 文档页数:10
一、选择题1、分层抽样的特点是()A、层内差异小,层间差异大B、层间差异小,层内差异大C、层间差异小D、层内差异大2、下面的表达式中错误的是()A、∑fh=1B、∑nh=n C、∑Wh=1D、∑Nh=13、各省电脑体育彩票中奖号码的产生属于()A、随意抽样B、判断抽样C、随机抽样D、定额抽样4、抽样调查的根本功能是()A、获取样本资料B、计算样本指标C、推断总体数量特征D、节约费用5、最优分配(Vopt )、比例分配(Vprop)的分层随机抽样与相同样本量的简单随机抽样(Vsrs)的精度之间的关系式为()A、Vopt ≤Vprop≤VsrsB、Vprop≤Vopt≤VsrsC、Vprop ≥Vopt≥VsrsD、Vsrs≤Vprop≤Vopt6、我们想了解学生的视力状况,准备抽取若干学校若干班级的学生进行测试,则()A、抽样单位是每一名学生B、调查单位一定是每一名学生C、调查单位可以是班级D、调查单位是学校7、在分层抽样中,当样本容量n固定时,能够使得估计量的方差V(yst)达到最小的分配方式是()A、比例分配B、等额分配C、随机分配D、Neyman分配8、概率抽样与非概率抽样的根本区别是()A、是否能确保总体中的每个单位都有完全相同的概率被抽中B、是否能确保总体中的每个单位都有事先已知或可以计算的非零概率被抽中C、是否能减少调查性误差D、是否能计算和控制抽样误差9、在抽样的总误差中,属于一致性的误差有()A、变量误差与估计量偏差B、估计量偏差与抽样误差C、变量误差与抽样误差D、非抽样误差与估计量偏差10、简单随机抽样、系统抽样、按比例分配的分层抽样三者之间的共同点是()A、将总体分成几部分,然后按事先确定的规则在各部分抽取B、每个个体单元被抽到的可能性都相等C、一旦选定了第一个样本单元,则其余所有样本单元即可完全确定D、三者没有共同点11、下面哪种样本量分配方式属于比例分配?()n nn A 、h =B 、h =N hNnN hShchch∑N h =1LhShC 、n h N Sn W S=L h h D 、h =L h h n n N S∑hh∑W hShh =1h =112、整群抽样中的群的划分标准为()A 、群的划分尽可能使群间的差异小,群内的差异大B 、群的划分尽可能使群间的差异大,群内的差异小C 、群的划分尽可能使群间的差异大,群内的差异大D 、群的划分尽可能使群间的差异小,群内的差异小13、群规模大小相等时,总体均值的简单估计量为()ˆ1A.Y =nM ˆB.Y =∑∑yi =1j =1nM ijn M 1y ij ∑∑n (M -1)i =1j =1ˆ1n M C.Y =∑∑y ij ni =1j =1ˆ1D.Y =N∑∑yi =1j =1nM ij14、关于多阶段抽样的阶段数,下列说法最恰当的是()A 、越多越好B 、越少越好C 、权衡各种因素决定D 、根据主观经验判断15、在多阶段抽样中,当初级单元大小相等时,第一阶段抽样通常采用()A 、系统抽样B 、简单随机抽样C 、不等概率抽样D 、非概率抽样16、将总体共120个单元随机分为10路纵队(共12排),然后任取其中一排,得到12个样本单元,此抽样方法属于()A 、简单随机抽样B 、分层抽样C 、整群抽样D 、系统抽样17、样本包含非同质单位而未被发现时,总体均值估计量的方差()A 、会被高估B 、会被低估C 、可能被高估,也可能被低估D 、会发生变化18、优良估计量的标准是()A 、无偏性、充分性和一致性B 、无偏性、一致性和有效性C 、无误差性、一致性和有效性D 、无误差性、无偏性和有效性19、在放回式PPS 抽样中,记第i 个样本单元y i的抽取概率为p i,则总体总值Yˆ的表达式为()的无偏估计YPPSny 1n y i N A 、∑B 、N∑i C 、n i =1pini =1pi1n p i yi D 、∑∑n i =1yii =1n 20、能使V (y lr )=1-f22(S Y +β2S X -2βS YX )达到极小值的β值为()n2S Y ⋅SXS YXS YXS YXA 、B 、2C 、2D 、SYXS XS YSX21、与简单随机抽样进行比较,样本设计效果系数Deff >1表明()A 、所考虑的抽样设计比简单随机抽样效率低B 、所考虑的抽样设计比简单随机抽样效率高C 、所考虑的抽样设计与简单随机抽样效率相同D 、以上皆对22、下列误差中属于非一致性的有()A 、估计量偏差B 、偶然性误差C 、抽样标准误D 、抽样框偏差23、抽样标准误差的大小与下列哪个因素无关()A 、样本容量B 、抽样方式、方法C 、概率保证程度D 、估计量24、抽样标准误差与抽样极限误差之间的关系是()A 、∆=ˆ)SE (θθˆ)ˆ)tSE (θSE (θˆB 、∆=tSE (θ)C 、∆=D 、∆=θt25、某大学理学院共有六个系,为调查该学院学生通过英语六级的状况,首先采用正比于各系人数规模的有放回PPS 抽样,从六个系中抽取了两个系,然后在这两个系中分别随机抽取10名学生进行调查。
高中抽样调查试题及答案一、选择题1. 抽样调查中,样本容量的大小会影响调查结果的准确性。
以下哪个因素与样本容量无关?A. 总体的大小B. 调查的精确度要求C. 调查的预算D. 调查的难度答案:D2. 在进行抽样调查时,以下哪种抽样方法可以保证每个样本被选中的概率相同?A. 简单随机抽样B. 系统抽样C. 分层抽样D. 整群抽样答案:A3. 如果一个总体的分布是正态分布,那么从中抽取的样本的均值分布也将是正态分布,这体现了抽样调查中的什么原理?A. 中心极限定理B. 大数定律C. 抽样误差D. 样本均值的无偏性答案:A二、填空题4. 在抽样调查中,样本的代表性是指样本能够______地反映总体的特征。
答案:真实5. 抽样调查中,如果样本容量增加,样本均值的标准误差会______。
答案:减小三、简答题6. 简述分层抽样与整群抽样的主要区别。
答案:分层抽样是将总体分成若干层,然后从每一层中随机抽取样本。
整群抽样则是将总体分成若干群,然后随机抽取若干群,对选中群中的所有个体进行调查。
分层抽样可以保证每一层的样本比例与总体中的比例相同,而整群抽样则不能保证这一点。
7. 描述抽样调查中样本容量确定的一般步骤。
答案:首先确定调查的精确度要求,包括允许的误差范围和置信水平;然后根据总体的大小和变异性,使用样本容量公式计算所需的样本容量;最后考虑调查的预算和实际操作的可行性,对样本容量进行调整。
四、计算题8. 假设某学校有1000名学生,需要进行一次关于学生课外阅读时间的调查。
如果希望调查结果的误差范围不超过5%,置信水平为95%,试计算所需的样本容量。
答案:根据样本容量公式n=(Z^2*p*(1-p))/(E^2),其中Z为置信水平对应的Z值,p为总体比例的估计值(通常取0.5以获得最大样本容量),E为误差范围。
对于95%的置信水平,Z值约为1.96。
将数值代入公式,得到n=(1.96^2*0.5*0.5)/(0.05^2)≈384。
一、简答题1.答:基本的概率抽样方法,如简单随机抽样、分层抽样、整群抽样、系统抽样。
(1)简单随机抽样的思想:从一个单元数为N 的总体中逐个抽取单元并且无放回,每次都在所有尚未进入样本的单元中等概率地抽取,直到n 个单元抽完。
(2)分层抽样的思想:先按照某种规则把总体划分为不同的层,然后在层内再进行抽样,各层的抽样之间独立进行。
(3)整群抽样思想:抽样仅对初级抽样单元进行,对于抽中的初级单元调查其全部的次级抽样单元,对于没有抽中的初级单元则不进行调查。
(4)系统抽样思想:先将总体中的抽样单元按某种次序排列,在规定范围内随机抽取一个初始单元,然后按事先规定的规则抽取其他样本单元。
2.答:(1)可同时对子总体进行参数估计。
(2)便于依托行政管理机构进行组织和实施,同时还可以根据各层的不同特点采用不同的抽样方式。
(3)可使样本在总体中分布更加均匀,从而具有更好的代表性。
这样就避免了样本分布不均衡的现象。
(4)可以提高参数估计的精度。
事实上分层抽样的精度一般要高于其它抽样方式。
二、计算题 1.解:(1)∑===ni i y n y 1667.601(2)V 5.71530111)(222==≈-=S n S n f y S(y )=)(y V =2.739y +Z 0.025×S(y )=60.667+1.96×2.739=66.035y -Z 0.025×S(y )=60.667-1.96×2.739=55.299所以Y 的95%的置信区间(55.299,66.035)。
(3)由样本计算得到s =15.182,所以,Vˆ(y )==≈-2211s n s n f 30115.1822=7.684 Sˆ(y )=)(ˆy V =2.772 y +Z 0.025×S(y )=60.667+1.96×2.772=66.100y -Z 0.025×S(y )=60.667-1.96×2.772=55.234所以Y 的95%的置信区间(55.234,66.100)。
抽样调查试题及答案一、单选题1. 抽样调查中,样本容量的确定主要取决于以下哪个因素?A. 总体的规模B. 总体的变异性C. 研究者的兴趣D. 研究的预算答案:B2. 在抽样调查中,如果样本容量太小,可能导致以下哪种结果?A. 抽样误差增大B. 抽样误差减小C. 抽样误差不变D. 抽样误差无法确定答案:A3. 以下哪种抽样方法属于概率抽样?A. 便利抽样B. 判断抽样C. 系统抽样D. 配额抽样答案:C二、多选题1. 抽样调查的优点包括以下哪些?A. 节省时间和资源B. 可以快速得到结果C. 能够全面反映总体情况D. 可以减少非抽样误差答案:ABD2. 以下哪些因素会影响抽样调查的准确性?A. 抽样方法B. 样本容量C. 抽样误差D. 非抽样误差答案:ABCD三、判断题1. 抽样调查的结果可以完全代表总体。
()答案:错误2. 抽样调查中,样本的代表性越强,抽样误差越小。
()答案:正确3. 抽样调查中,样本容量越大,抽样误差就越小。
()答案:错误四、简答题1. 请简述抽样调查与普查的区别。
答案:抽样调查是从总体中随机抽取一部分样本进行研究,以推断总体的特征,而普查是对总体中的每一个个体都进行调查。
抽样调查的优点是节省时间和资源,但可能存在抽样误差;普查能够全面反映总体情况,但成本较高。
2. 请说明在进行抽样调查时,如何保证样本的代表性?答案:保证样本代表性的方法包括:确保抽样框的全面性,避免样本选择偏差;采用随机抽样方法,如简单随机抽样、分层抽样、系统抽样等;确保样本容量足够大,以减少抽样误差;对样本进行分层或分层抽样,以确保不同子群体的代表性。
五、计算题1. 如果一个总体有10000个个体,研究者希望抽样误差不超过5%,置信水平为95%,试计算所需的最小样本容量。
答案:根据抽样误差公式,n = (Z^2 * p * (1-p)) / E^2,其中n为样本容量,Z为置信水平对应的Z值,p为总体比例,E为允许的误差范围。
本文部分内容来自网络整理,本司不为其真实性负责,如有异议或侵权请及时联系,本司将立即删除!== 本文为word格式,下载后可方便编辑和修改! ==抽样调查期末试卷篇一:抽样调查期末复习题1、简答题1. 为什么分层抽样常在全国范围抽样调查中被采用?答:(1)分层抽样不仅能对全国指标进行推算,还可以对各省、自治区、直辖市的指标进行推算。
(3分)(2)各个层中分别独立地进行抽样,便于抽样工作的组织实施。
(3分)(3)由于各个地区发展不均衡,导致全国范围内差异较大,分层抽样的层间方差不进入估计误差,而层内的差异相对小一些,因此分层抽样可以提高估计精度,抽样效率较高。
(2分)(4)样本的分布更均匀,代表性更强,不会出现偏颇的情况。
2. 整群抽样的优缺点是什么?答:整群抽样可以简化抽样框的编制。
样本单元比较集中,实施调查便利,且能节约费用。
缺点是:当群内具有一定的相似性,而不同群之间的差别比较大时,相同样本量下整群抽样的抽样效率比简单随机抽样差。
3. 简述分层的原则及如何选择分层标志?答:分层的原则是:一种是为了满足估计各层指标的需要或为了组织实施的便利。
此时,应以需估计的子总体为层或单位自然构成的系统或类为层;另一种是尽可能提高抽样精度,分层应做到“层内差异大,层间差异小”。
最好直接以调查指标的数值作为选择分层标志,若做不到通常选择一个与调查指标有较大线性相关的指标作为分层标志。
这个标志可以是调查指标的前期指标,也可以完全是另一个变量。
4. 为什么多阶抽样常在大型抽样调查中被采用?答:(1)多阶抽样一方面保持了整群抽样的样本比较集中、便于调查、节省费用等优点,同时又避免了对小单元过多调查造成的浪费,充分发挥抽样调查的优点。
(2)由于多阶抽样是分阶段实施的,因此,抽样框也可以分级进行准备,只需编制初级单元的抽样框,对抽中的初级单元再准备二阶抽样单元的抽样框,以此类推,对抽中的单元再准备下一级抽样单元的抽样框,从而大大降低了编制抽样框的工作量。
抽样调查考试题目及答案一、单项选择题(每题2分,共10题,共20分)1. 抽样调查中,样本量的大小与总体的什么因素有关?A. 总体数量B. 总体分布C. 总体的异质性D. 抽样误差答案:C2. 在简单随机抽样中,每个样本单位被抽中的概率是:A. 不相等的B. 相等的C. 随机的D. 取决于样本大小答案:B3. 系统抽样中,抽样间隔的确定通常与以下哪个因素无关?A. 总体数量B. 样本量C. 总体的分布D. 总体的异质性答案:C4. 分层抽样的主要目的是:A. 增加样本的代表性B. 减少抽样误差C. 简化抽样过程D. 降低成本答案:A5. 以下哪项不是抽样调查的优点?A. 节省时间和成本B. 可以对整个总体进行研究C. 可以估计总体参数D. 提供总体的可靠信息答案:B6. 抽样调查中,样本的代表性主要取决于:A. 抽样方法B. 样本大小C. 抽样误差D. 总体的分布答案:A7. 在非概率抽样中,以下哪种抽样方法通常不被认为是科学的?A. 便利抽样B. 配额抽样C. 系统抽样D. 整群抽样答案:A8. 抽样调查中,如果样本量增加,抽样误差通常会:A. 增加B. 减少C. 保持不变D. 先减少后增加答案:B9. 以下哪种情况不适合使用简单随机抽样?A. 总体数量较少B. 总体分布均匀C. 总体数量庞大D. 总体分布不均匀答案:C10. 抽样调查中,样本的可靠性通常与以下哪个因素有关?A. 抽样方法B. 样本大小C. 抽样误差D. 总体的分布答案:B二、多项选择题(每题3分,共5题,共15分)1. 以下哪些因素会影响抽样误差的大小?A. 样本大小B. 总体的异质性C. 抽样方法D. 总体数量答案:A, B, C2. 抽样调查中,以下哪些抽样方法属于概率抽样?A. 简单随机抽样B. 系统抽样C. 分层抽样D. 整群抽样答案:A, B, C, D3. 在抽样调查中,以下哪些措施可以提高样本的代表性?A. 增加样本量B. 使用分层抽样C. 确保抽样的随机性D. 减少抽样误差答案:A, B, C4. 以下哪些因素会影响抽样调查的成本?A. 样本大小B. 抽样方法C. 总体数量D. 调查的复杂性答案:A, B, D5. 抽样调查中,以下哪些因素会影响总体参数的估计?A. 样本的代表性B. 抽样误差C. 总体的分布D. 样本大小答案:A, B, D三、判断题(每题1分,共5题,共5分)1. 抽样调查中,样本量越大,抽样误差一定越小。
抽样技术期末试题及答案1. 选择题1.1. 在随机抽样中,下列哪种方法可以保证每个个体都有被选中的机会?A. 简单随机抽样B. 系统抽样C. 分层抽样D. 整群抽样答案:A. 简单随机抽样1.2. 下列哪种抽样方法适用于对城市中不同居住区的居民进行调查?A. 简单随机抽样B. 道路抽样C. 有限总体抽样D. 群集抽样答案:B. 道路抽样1.3. 在抽样调查中,误差来源主要包括以下几个方面,下列哪个不是?A. 非抽样误差B. 抽样误差C. 召回误差D. 地区误差答案:C. 召回误差2. 判断题2.1. 分层抽样是按照抽样单元的层次结构进行抽样的方法。
(×)错误2.2. 构成总体的个体是抽样的单位。
(√)正确2.3. 方便抽样是一种常用的抽样方法,可以得到客观有效的数据。
(×)错误3. 简答题3.1. 请简要解释什么是整群抽样,并说明适用的情况。
整群抽样是在调查研究中,将总体划分为若干个不相交的群组,再从中随机选取一部分群组作为样本,对所选群组中的所有个体进行调查和观察的方法。
适用情况:适用于总体中的个体具有较大的相似性,并能够通过群组进行划分的情况。
例如,在调查某个城市的居民满意度时,可以将城市的街道或社区作为群组,通过整群抽样来获取样本。
3.2. 简要介绍一种非概率抽样方法,并讨论其优缺点。
一种非概率抽样方法是方便抽样。
方便抽样是在调查过程中,选择离调查者最为便利的、容易获取的个体作为样本。
优点:方便抽样方法简单、快速,可以节省调查时间和成本。
适用于在研究设计初期或资源有限的情况下进行初步探索和观察。
缺点:方便抽样容易导致抽样偏差,样本的代表性较差,结果可能不具有普遍适用性。
调查者的主观意愿会对样本选择产生较大的影响,结果可能存在较大的偏差和误差。
4. 计算题4.1. 一个城市有5个区,每个区的居民数分别为1000、1500、2000、1200和1800人。
如果采用分层随机抽样方法,每个区的抽样比例分别为0.2、0.3、0.1、0.25和0.15,求总体的抽样比例。
抽样技术期末考试试题及答案一、选择题(每题2分,共20分)1. 抽样调查中,样本容量的大小与抽样误差之间的关系是:A. 正相关B. 负相关C. 无关D. 有时正相关,有时负相关答案:B2. 以下哪种抽样方法属于概率抽样?A. 方便抽样B. 系统抽样C. 雪球抽样D. 判断抽样答案:B3. 在分层抽样中,各层的样本容量分配原则是:A. 各层样本容量相等B. 各层样本容量与总体容量成比例C. 各层样本容量与层内变异程度成反比D. 各层样本容量与层内变异程度成正比答案:D4. 以下哪种情况适合使用整群抽样?A. 总体单位分布均匀B. 总体单位分布不均匀C. 总体单位之间相互独立D. 总体单位之间存在明显的关联性答案:B5. 抽样调查中,如果样本容量增加,抽样误差将:A. 增加B. 减少C. 不变D. 先增加后减少答案:B6. 以下哪项不是抽样调查的优点?A. 节省时间和成本B. 可以对整个总体进行研究C. 可以估计总体参数D. 可以控制抽样误差答案:B7. 随机抽样的基本原则是:A. 抽样单位的选取具有随机性B. 抽样单位的选取具有系统性C. 抽样单位的选取具有主观性D. 抽样单位的选取具有代表性答案:A8. 在简单随机抽样中,每个单位被抽中的概率是:A. 不确定的B. 相等的C. 与总体大小成反比D. 与总体大小成正比答案:B9. 抽样调查中,样本的代表性是指:A. 样本能够代表总体B. 样本大小C. 样本的误差D. 样本的抽样方法答案:A10. 以下哪种抽样方法属于非概率抽样?A. 系统抽样B. 分层抽样C. 方差抽样D. 判断抽样答案:D二、简答题(每题10分,共20分)1. 简述分层抽样的优缺点。
答案:分层抽样的优点包括:(1)可以提高样本的代表性;(2)可以减少抽样误差;(3)可以对不同层进行单独分析。
分层抽样的缺点包括:(1)分层标准的选择可能存在主观性;(2)分层后各层的样本容量分配需要精心设计;(3)如果分层不准确,可能会增加抽样误差。
抽样调查期末考试题及答案一、选择题(每题2分,共20分)1. 抽样调查中,样本容量是指:A. 总体中的个体数B. 抽取的样本中的个体数C. 总体中的个体数与样本中的个体数的比值D. 抽取的样本中的个体数与总体中的个体数的比值2. 下列哪个不是随机抽样的特点?A. 每个个体被抽中的概率相等B. 样本容量固定C. 抽样过程可以控制D. 抽样结果具有代表性3. 在分层抽样中,分层的依据是:A. 个体的性别B. 个体的随机性C. 个体的可测量性D. 个体的异质性4. 系统抽样的特点是:A. 抽样间隔固定B. 抽样间隔随机C. 抽样间隔递增D. 抽样间隔递减5. 以下哪项不是抽样误差的来源?A. 抽样方法B. 样本容量C. 总体的异质性D. 抽样调查的实施二、简答题(每题10分,共30分)6. 简述抽样调查与全面调查的区别。
7. 解释什么是分层抽样,并举例说明其应用场景。
8. 描述系统抽样的步骤,并说明其优缺点。
三、计算题(每题15分,共30分)9. 假设一个总体包含1000个个体,采用简单随机抽样抽取100个样本。
如果总体均值为50,标准差为10,计算样本均值的期望值和方差。
10. 给定一个分层抽样的情况,总体分为三个层,每层的个体数分别为200、300和500,总体均值为60,每层的均值分别为55、65和62。
计算分层抽样的估计值。
四、论述题(每题20分,共20分)11. 论述抽样调查在社会调查中的应用及其重要性。
参考答案一、选择题1. B2. C3. D4. A5. D二、简答题6. 抽样调查与全面调查的主要区别在于抽样调查只对总体中的部分个体进行研究,而全面调查则需要对总体中的每一个个体进行研究。
抽样调查可以节省时间和成本,但可能存在抽样误差;全面调查虽然结果更准确,但成本和时间消耗较大。
7. 分层抽样是一种抽样方法,它首先将总体分为若干个互不重叠的层,然后从每一层中独立地抽取样本。
分层抽样的应用场景包括市场调查、教育研究等,它的优点是能够保证样本的代表性,缺点是分层过程可能比较复杂。
抽样调查复习题.doc1-抽样调查的方法包括什么?随机抽样有多种方式,主要包括()。
A?简单随机抽样B. 分层随机抽样C.分群随机抽样D.等距随机抽样E.配额抽样2. 总体.样本、抽样单位、抽样框某市在12万名大学生中抽取1000人进行调查,那么,12万名大学生就是(),被抽到的1000名大学生就是()。
A.调查样本,单位总体B?调查样本,调查总体C.调查总体,调查样本D?调查总体,总体单位3. 如何确定样本规模大小4. 实施抽样过程中所抽取的样本单位无法利用或不适合时的替换方法每当所抽取的样本单位在抽样过程中发现无法利用或不愿意回答或不合适吋,就需要替换。
实践中的替换方法有()。
A.顺移替换B.超量抽样C.重新抽样D.分层抽样E.等距抽样使用(),必须提供被访者完整的样本框架。
A.顺移替换法样法C.重新抽样法D?随机数字表法某企业每次发放的调查问卷的回答率都在40%上下徘彳回,那么该企业想获得100个回答的样本,那必须抽取样本为()份。
这种实施抽样的方法为()。
(2)A .重新抽样B.顺移替换5. 简单随机抽样包括几种方法?下列属于简单随机抽样方法的是()。
A.掷硬币B.掷骰子C.抽签D.查随机数表E.分群以下说法正确的是()。
A. 当总体的标志变异程度较大吋,不能用简单随机抽样B. 实际所需调查总体往往是十分庞大,单位非常多,所以一般不直接使用简单随机抽样C. 简单随机抽样比分层随机抽样和系统抽样更精确D. 简单随机抽样抽出的样本大内较为分散,所以调查时人力、物力、财力消耗较大6. 在什么情况下使用简单随机抽样?简单随机抽样方法在总体单位数量不大、市场调研对象难以划分组类、或总体内个体的差异性较小且容易得到总体清单的情况下,采用的效果较好。
7-分层随机抽样的计算某地区有居民户数2500户,其中收入高的户数有500户,占总户数的20% ;收入中等的户数有1600户,占总户数的64% ;收入低的户数有400户,占总数的16% ;要从中抽取200户进行某新商品购买力调查。
1、简答题1. 为什么分层抽样常在全国范围抽样调查中被采用? 答:(1)分层抽样不仅能对全国指标进行推算,还可以对各省、自治区、直辖市的指标进行推算。
(3分)(2)各个层中分别独立地进行抽样,便于抽样工作的组织实施。
(3分)(3)由于各个地区发展不均衡,导致全国范围内差异较大,分层抽样的层间方差不进入估计误差,而层内的差异相对小一些,因此分层抽样可以提高估计精度,抽样效率较高。
(2分)(4)样本的分布更均匀,代表性更强,不会出现偏颇的情况。
2. 整群抽样的优缺点是什么?答:整群抽样可以简化抽样框的编制。
样本单元比较集中,实施调查便利,且能节约费用。
缺点是:当群内具有一定的相似性,而不同群之间的差别比较大时,相同样本量下整群抽样的抽样效率比简单随机抽样差。
3. 简述分层的原则及如何选择分层标志?答:分层的原则是:一种是为了满足估计各层指标的需要或为了组织实施的便利。
此时,应以需估计的子总体为层或单位自然构成的系统或类为层;另一种是尽可能提高抽样精度,分层应做到“层内差异大,层间差异小”。
最好直接以调查指标的数值作为选择分层标志,若做不到通常选择一个与调查指标有较大线性相关的指标作为分层标志。
这个标志可以是调查指标的前期指标,也可以完全是另一个变量。
4. 为什么多阶抽样常在大型抽样调查中被采用? 答:(1)多阶抽样一方面保持了整群抽样的样本比较集中、便于调查、节省费用等优点,同时又避免了对小单元过多调查造成的浪费,充分发挥抽样调查的优点。
(2)由于多阶抽样是分阶段实施的,因此,抽样框也可以分级进行准备,只需编制初级单元的抽样框,对抽中的初级单元再准备二阶抽样单元的抽样框,以此类推,对抽中的单元再准备下一级抽样单元的抽样框,从而大大降低了编制抽样框的工作量。
所以多阶抽样常用于大范围的且抽样单元为各级行政单位的情况。
对于大型调查中,抽样框变动非常频繁的情况,特别适合用多阶抽样。
2、 简单随机抽样【例1.1】 我们从某个N=100的总体中抽出一个大小为n=10的简单随机样本,要估计总体平均水平并给出置信度为95%的区间估计。
如表解:依题意。
N=100,n=10,1.010010==f计算样本均值及样本方差为:5105011===∑=n i i y n y 11.199172)(11122≈=--=∑=n i iy y n s 因此对总体平均水平的估计为:5ˆ==y Y对的方差及标准差的估计为:3115.1ˆ)ˆ(72.111.19101.011ˆ2≈=≈⨯-=-=)()(Y v Ys S n f Y v由置信度95%对应的t=1.96,因此,可以以95%的把握说总体平均水平大约在3115.196.15⨯±之间,即2.4295~7.570之间。
【例1.2】(续例1.1)如果采取放回抽样,则相应结果为多少?解:由上例知5105011===∑=n i i y n y ,11.199172)(11122≈=--=∑=n i iy y n s 3824.1)(911.111.1910112===⨯==)()(y v y s S n y v由置信度95%对应的1/2 1.96u α-=,因此,可以以95%的把握说总体平均水平大约在3824.196.15⨯±即[2.2905,7.7095]之间。
【例1.3】某销售公司希望了解全部3 000家客户对该公司的综合满意程度,决定用电话来调查一个简单随机样本。
这时,销售公司希望以95%的把握保证客户满意的总体比例P 在样本比例p ±10%的范围内,但对总体比例P 无法给出一个大致的范围。
这时,应该调查多少个客户,才能保证对总体比例估计的要求?(P30)解:由该问题给出的条件:N=3 000,d=10%=0.1,置信度95%,对应的1/2 1.96u α-=,由于无法得到P 的初始估计值,因此取使方差达极大值的P=0.5,得到最保守的n :221/2221.960.50.5960.1u S n d α-⨯⨯≈=≈ 【例1.4】某居民区共10000户,欲估计该居民区的用水量。
采用简单随机抽样抽选了100户,得样本均值为12.5吨,样本方差为1252吨。
(1)估计该居民区的总用水量的置信度95%的置信区间。
(2)若次年再进行调查,要求置信度95%的估计相对误差不超过20%,试问应抽多少户作样本?(P31) 解:(1)25.352061)(ˆ125000ˆ=-====s nf N y Ns Y s y N Y)( []25.19400475.55995ˆˆˆˆ%952121,)(),(的置信区间为:的置信度为=⎥⎦⎤⎢⎣⎡+---Y s u Y Y s u Y Y αα 或612.353831)(ˆ125000ˆ=≈-====n s N s n f N y Ns Y s y N Y)( (2)[]88.19435112.55648ˆˆˆˆ%952121,)(),(的置信区间为:的置信度为=⎥⎦⎤⎢⎣⎡+---Y s u Y Y s u Y Y αα 7159.71417705.769002222/10≈=+=≈==-Nn n n y r s u n )(α3、不等概率抽样【例2.1】 某县农业局要调查全县养猪专业户全年生猪的出栏头数,并有全县365个养猪专业户上年末的生猪存栏数,各养猪专业户的饲养规模相差较大,决定以放回方式按与各养猪专业户上年末生猪存栏头数成正比的概率从中抽取30户进行调查,调查结果见表6.3。
已知全县养猪专业户上年末生猪存栏数为9542头,试估计该县养猪专业户生猪出栏总头数某县养猪专业户年生猪出栏头数调查样本资料 (单位: 头)注:i 表示养猪专业户样本编号,i m 表示各专业户生猪上年末存栏数,i y 表示各专业户调查年生猪出栏头数,其中第2、19号专业户被抽中两次.解:根据题中所给资料,030,9542n M ==1954275134177ˆ(2)5616330152330ni HHi iM y Y nm ===+⨯++≈∑(头)(P56 ,3.1.2)21201022221ˆˆ()()(1)ˆ()(1)954275561631345616317756163[()()2()]30291595422395423095422806070ni HHHH i in i HH i i y v Y Y n n z M y Yn n m M ===--=--=-+-⨯++-⨯≈∑∑ˆ()1575HH se Y =≈(头) (P58,3.1.5)4、分层随机抽样【例3.1】某市进行家庭收入调查,分城镇居民及农村居民两部分抽样,在全部城镇居民23560户中随机抽取300户,在全部农村居民148420户中随机抽取250户,调查结果是城镇年平均户收入为15180元,标准差为2972元;农村年平均户收入为9856元,标准差为2546元。
求全市年平均户收入的置信度为90%的置信区间。
(P75)[]54.1081924.10351,34.142645.139.10585)(),(90%)(34.142)(6756.202601)(39.1058598568630.0151801370.08630.0171980148420,1370.017198023560212121222211121,即]=[+的置信区间为:置信度为故全市年平均户收入的元====解:根据已知条件有:⨯±⎥⎦⎤⎢⎣⎡-=-=⨯+⨯=+====--==∑∑st st st st st i i ii i st Lh h h st y s u y y s u y y v s n f W y v y W y W y W y W W αα【例3.2】在某行业技术人员中,按年龄分层,调查会使用计算机者所占的比例。
调查结果如表所示。
试以95% 的置信度估计总体中会计算机者占的比例。
(P75)解:由表中数据得到:1531.0,1320.0,2790.0,2139.0,2220.0,0800.0,2620.0,2472.0,1765.0,3380.05432154321==========W W W W W p p p p p000534.01)1()1()(2286.051251≈---===∑∑==h h h h h h st h h h st n p p f W p v p W p 方差为以忽略不计。
估计量的由于抽样比很小,故可则[]%39.27%,33.18)(,)(%952121=⎥⎦⎤⎢⎣⎡+---st st st st p v u p p v u p P αα的置信区间为:置信度为 5、样本量在各层的分配【例3.3】调查某地区的2850户居民奶制品年消费支出,以居民户为抽样单元,根据经济及收入水平将居民户分为4层,每层按简单随机抽样抽取10户,调查数据如下,样本量为40,若按比例分配和Neyman 分配时,各层样本量应为多少?解:由表得0067.0,0133.0,025.0,05.0,52632.0,26316.0,14035.0,07018.0102850,1500,750,400,2004321114321143214321===================f f f N nf W W W N N W n n n n N N N N N 各层样本均值及方差为)(56194.73333.193556.8205667.216624165105722.1624)(11,5.3911114124232243212111211111元从而,,,,同理可得========≈--===∑∑∑===h h h st n i i n i i y W y s s s y y y y y n s y n y按比例分配时,各层样本量为(P82)05.2153.1061.581.244332211========n W n n W n n W n n W n ,,,即各层样本量分别为3,6,10,21。
对于Neyman 分配,5330.6667.216628504008286.2722.162428502002211====s W s W ,3181.7333.193285015008380.23556.820528507504433====s W s W ,51775.401=∑=Lh h h s W 即,从而79.251775.408286.2401111≈⨯==∑=Lh hh sW s W nn同理有23.753.23,45.6432===n n n , 即各层样本量分别为3,6,24,7。
【例3.4】 某高校欲了解在校学生用于课外进修(如各种考证辅导班、外语辅导班等)的开支,在全校8 000名学生中抽出了一个200人的简单随机样本。