抽样调查理论与方法 金勇进(第二版)第3章-分层随机抽样
- 格式:ppt
- 大小:1.19 MB
- 文档页数:81
抽样技术期末考前点题整理【第一章绪论】一、概念类1、非概率抽样有哪些常见的类型?答:(1)判断选样(2)方便抽样(3)自愿样本(4)配额抽样2、抽样调查的作用有哪些?答:(1)节约费用(2)时效性强(3)可以承担全面调查无法胜任的项目(4)有助于提高调查数据的质量3、抽样调查与普查之间的关系是什么?答:(1)抽样调查可以作为普查的补充(2)抽样调查可以对全面统计资料进行评估和修正(3)利用抽样调查可以进行深层次的分析(4)利用抽样调查可以提前获得总体目标量的估计(5)普查可以为抽样框提供资料4、目标总体和抽样总体之间的关系是什么?答:(1)目标总体:是指所研究对象的全体,或者是研究人员希望从中获取信息的总体,它由研究对象中所有性质相同的个体所组成,组成目标总体的个体称作总体单元或单位。
(2)抽样总体:是指从中抽取样本的总体。
(3)关系:通常情况下,抽样总体应与目标总体完全一致,但实践中二者常不一致。
5、什么是抽样框?其有哪些类型?一个好的抽样框的基本标准是什么?答:(1)什么是:抽样总体的具体表现是抽样框。
通常,抽样框是一份包含所有抽样单元的名单。
给每个抽样单元编上一个号码,就可以按一定的随机化程序进行抽样。
对抽样框的基本要求是其应该具有抽样单元名称和地理位置信息,以便调查人员能够找到被选中的单元。
(2)类型[1] 名录框[2[ 区域框[3] 自然框(3)基本标准[1] 抽样框与目标总体保持一致[2] 能够提供与调查目的有关的尽可能多的准确、完整的辅助信息6、什么是抽样误差和非抽样误差?抽样误差的表现形式有哪些?答:(1)抽样误差:是指由抽取样本的随机性所造成的样本值与总体值之间的差异。
只要采用抽样调查,抽样误差就不可避免。
(2)非抽样误差:是相对于抽样误差而言的。
它的产生不是由于抽样误差的随机性,而是由于其他多种原因引起的估计值与总体参数之间的差异。
(3)抽样误差的表现形式[1] 抽样实际误差[2] 抽样标准误[3] 抽样极限误差7、抽样调查的步骤有哪些?答:(1)第一步:确定调研问题(2)第二步:设计抽样方案(3)第三步:问卷设计(4)第四步:实施调查过程(5)第五步:数据分析处理(6)第六步:撰写调研报告8、与非概率抽样相比,概率抽样有哪些优点?答:(1)样本的抽取遵循随机性原则(2)可以运用概率估计的方法对总体数量特征进行推断(3)抽样误差可以计算并加以控制9、概率抽样的特点有哪些? 答:(1)按一定的概率以随机原则抽取样本(2)每个单元被抽中的概率是已知的或者是可以计算出来的(3)当用样本量对总体目标量进行估计时,要考虑到该样本被抽样的概率【第二章 简单随机抽样】一、概念类1、简单随机抽样的抽取规则是什么? 答:(1)按随机原则取样,在取样时排除任何主观因素选择抽样单元,避免任何先入为主的倾向性,防止出现系统误差。
抽样技术课后习题-参考答案-金勇进第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。
(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。
然后用r+19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。
第二,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?2.3为了合理调配电力资源,某市欲了解50000户居民的日用电量,从中简单随机抽取了300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。
如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s1706366666206*300500003001500001)()ˆ(222=-=-==s nf N y N v YV 19.413081706366666(==)y v 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为(394035.95,555964.05) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。
总体数量特征 样本数最特征随机变最抽样调查的理论与方法参考答案填空题随机原则概率估计总体数量特征非全面调查 调查对象的全部单位全及总体有限总体无限总体 单位数目30个有顺序不重复抽样无顺序不重复抽样比值比较差值比较偶然性规律性不可能事件必然事件常数统计规律性稳定性稳定值随机因索所有可能事件离散随机变量 连续随机变量非负1统计量样本平均数不重复抽样重复抽样代表性谋差反比关系正比关系反比关系概率度(平均i 吴差u 的倍数)固定 谋差范围(允许课差,谋羌置信限)总体相应指标值P J/9, }=\-a精确程度可靠程度置信系数可靠程度样本平均数区间估计所在区间抽样调查资料对比全面调查资料 总体均值总休方差^(1-—)或 S (i —巴), n N nN 竺◎或巴斗工), n n-[ N总体的方差要求的概率保证程度给定的抽样i 吴差范用 样本方差固定的顺序和间隔 选择排队标志有关标志排队法 无关标志排队法抽取样本方便易行样本单位在总体屮均匀地分布30 随机原则系统偏差31随机原则较好的代表性32各系统样本内部方差的平均值6?则 宀 各系统样本的内部方差 系统样本F(1 P)n 卩(1-P) V n-\确定内部各单位的差别33各部分K个个体各个部分的差别系统样本内部的差异34 单纯随机抽样抽样原理35总体在第i层的权数或权重每一层的总体单位数总体单位数36 比较均匀层内方差37选择分层标志调查的核心项目与调查项目关系密切的项目引起分散的主要原因38各个单位标志值的差异最小该层标志变异指标39越少调查费用40调查费用抽样谋差41层内方差层间方差42调查变量层数的选择43 单纯随机抽样全面调查44齐群内部调查变量的各个标志值齐个群内部务个标志值总体的群45被调查总体均匀总体可能取到的值46均匀分布在总体各个部分低于群内部差别大而群间差别小47各个群内部单位数相等总体单位群平均数7 随机抽样估计48 总体单位数49大样本50总体单位抽样群数抽样群数51横向纵向52有偏抽样分布53增犬相关系数°的值,X、Y的相关程度54分别比估计组合比估计55线性冋归方程样本指标总体指标56辅助变量的选择较好的线性有关资料57 性质不同密切线性关系基期指标58冋归系数b样本相关系数越高59r=0 心060等于小于61小于分别冋归估计纽合冋归估计62 居民家计调查居民家庭63三阶段系统捕样系统抽样64抽取各阶段样本实割实测推算产量65 近三年粮食平均亩产当年预计亩产相应总体各单位的累计播种面积累计播种面积样本单位数66抽样误差调查谋差实割实测67系统抽样68屮轴对称69多阶段抽样系统抽样双重抽样70整群随机抽样系统抽样二、单项选择题1 C B213AD3B4 D 5 A 6B7A8B9c10c11B1214 CB215C16C17 B 18c19c20c21B22B23c245 A 26 C 27 B 28 D 29 D 30 A 31 B 32 C 33 C三、简答题1抽样调杳是建立在随机原则基础上,从总体屮抽取部分单位进行调查,并依据概率估计原理,应用所得到的资料,对总体的数量特征进行推断的一种调查方法。
第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。
(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。
然后用r+19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。
第二,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。
如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为(394035.95,555964.05) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。
随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。
解析:由已知得:10000=N 200=n 35.0=p 02.0==Nnf 又有:35.0)()(===∧p p E p E 0012.0)1(11)(=---=∧p p n fp V该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:])()([2∧∧±P V Z P E α代入数据计算得:该区间为[0.2843,0.4157]2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8 100 18 180 9 110 19 170 1024020120估计该小区平均的文化支出Y ,并给出置信水平95%的置信区间。
第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。
(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。
然后用r+19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。
第二,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。
如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为(394035.95,555964.05) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。
随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。
解析:由已知得:10000=N 200=n 35.0=p 02.0==Nnf 又有:35.0)()(===∧p p E p E 0012.0)1(11)(=---=∧p p n fp V该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:])()([2∧∧±P V Z P E α代入数据计算得:该区间为[0.2843,0.4157]2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8 100 18 180 9 110 19 170 1024020120估计该小区平均的文化支出Y ,并给出置信水平95%的置信区间。
《抽样技术(第二版)金勇进等编著》习题解答第二章2.22.3 解:已知2ˆ9.5,206,50000,300500009.5475000y s N n Y Ny ====∴==⨯=, 222211300/50000ˆ()50000206500000.6825170636666730041308.19128,80964.05491f v YN s n --∴==⨯⨯=⨯===所以居民日用电量的95%的置信区间为 ˆˆ[[47500080964.05491,47500080964.05491] [394035.9451,555964.0549]YY -+=-+=相对误差为ˆd Y Y r Y-=2.4 解:ˆ0.35Pp == , 11200/1000010000()(1)0.35(10.35)0.0011512009999f N V p P P n N --=-=⨯⨯⨯-=-0.03339=∴P 的95%置信区间为:[[0.35 1.960.03339,0.35 1.960.03339][0.2846,0.4154]p p -+=-⨯+⨯=2.5 解:已知200,20N n ==,根据已知数据计算得:2144.5,826.0526,() 6.096915y s v y ==∴== ∴Y 的95%置信区间为:[[144.5 1.96 6.096915,144.5 1.96 6.096915][132.55,156.45]y y -+=-⨯+⨯=2.6 解:已知2ˆ1120,25600,350,503501120392000y S N n Y Ny ====∴==⨯=,2221150/350ˆ()350256003840000506196.773,12145.68f V YN S n --∴==⨯⨯===∴ˆY的95%置信区间为:ˆˆ[[379854.3,404145.7]Y Y -+= 2.7 解:已知21000,2,68,10.95N d S α===-=,222022221000 1.966861.3010002 1.9668Nt S n Nd t S ⨯⨯∴===+⨯+⨯0161.387.571430.7n n r === 样本量最终为88个家庭。
抽样调查及其主要方法抽样调查是社会科学研究中常用的一种方法,通过抽取一部分样本代表整体群体,从而研究群体的特点和现象。
抽样调查可以广泛应用于政治、经济、社会和心理等各个领域,以获取有关群体的信息和数据。
抽样调查的主要方法有以下几种:1.简单随机抽样:基本思想是从总体中以等概率的方式抽取样本。
在简单随机抽样中,每个样本都有被选中的机会,且选中的概率相等。
简单随机抽样适用于总体分布均匀、样本代表性要求高的情况。
2.系统抽样:基本思想是按照一定的规则选择样本。
例如,研究者可以设置一个抽样间隔,按照一些规律选取样本。
系统抽样一般比简单随机抽样更具效率,但要求总体中的个体或单位排列是随机的。
3.分层抽样:将总体划分为若干层,然后从每层中抽取样本。
这样可以保证每个层次都被充分考虑,并使样本更具代表性。
分层抽样适用于总体具有内在差异,且各层之间有一定的相似性的情况。
4.整群抽样:将总体划分为若干个群组,然后从群组中抽取全部样本。
整群抽样可以保证群组内的相关性,但要求群组间的差异较大。
5.整体抽样:直接针对总体进行抽取样本,而不是通过抽取个体或单位来构成样本。
整体抽样适用于总体规模较小,且成本相对较低的情况。
以上是常见的抽样调查方法,不同的方法适用于不同的研究目的和研究问题。
在实际应用中,研究者需要根据具体情况来选择合适的抽样方法,以确保样本的代表性和可靠性。
除了抽样方法,抽样调查还需要注意以下几个方面:1.样本容量确定:样本容量的大小与研究结果的可靠性密切相关。
一般来说,样本容量越大越能准确代表总体。
研究者需要根据具体问题和可行性来合理确定样本容量。
2.抽样误差控制:在抽样调查中,由于样本选择的随机性,样本结果与总体之间会存在一定的误差。
研究者可以通过减小样本误差的方法来提高调查结果的准确性,例如增加样本容量或优化抽样方法。
3.抽样调查的可靠性和有效性:可靠性指研究结果的稳定性和一致性,有效性指研究结果的准确性和适用性。