当前位置:文档之家› 抽样技术A卷答案

抽样技术A卷答案

抽样技术A卷答案
抽样技术A卷答案

抽样技术A 卷答案

一、单项选择题(本大题共5道小题,每题2分,共10分) 下列各题A)、B )、C )、D )四个选项中,只有一个选项是正确的。 1.下面四个关系式中哪一个是正确的?(A )

A.()()

()2

MSE x V x B E x =+

B.()V x =()

MSE x +()2

B

E x

C.()MSE x =()V x +()

B E x D.()2

B

E x =()MSE x +()V x

2.(B )是总体里最小的、不可再分的单元。

A.抽样单元

B.基本单元

C.初级单元

D.次级单元 3.下面哪种抽样方法是最简单的概率抽样方法(A )。

A.简单随机抽样

B.分层随机抽样

C.系统抽样

D.整群抽样 4.抽样比的计算公式为(B )。 A.()

()11f n N =-- B.f n N = C.()1f n N =- D.()f N n N =-

5.关于简单随机抽样的核心定理,下面表达式正确的是(A )。 A.()

21f V y S n -=

B.()211f V y S n -=-

C.()21V y S n =

D.()

2

1f V y s n

-= 6. 下面关于各种抽样方法的设计效应,表述错误的是(B )。

A.简单随机抽样的deff=1

B.分层随机抽样的def f ﹥1

C.整群随机抽样的def f ﹥1

D.机械随机抽样的def f ≈1

7.假设考虑了有效回答率之外所有其他因素后的初始样本量为400,而预计有效回答率为80﹪,那么样本量则应定为(B )。

A.320

B.500

C.400

D.480

8.在要求的精度水平下,不考虑其他因素的影响,若简单随机抽样所需要的样本量为300,分层随机抽样的设计效应deff=0.8,那么若想达到相同的精度,分层随机抽样所需要的样本量为(C )。

A.375

B.540

C.240

D.360 9.分层抽样设计效应满足(B )。 A.1deff = B.1deff C.1deff ≈ D.1deff 10.下面哪种样本量分配方式属于比例分配?(A ) A.

h h n n N N = B.h n n =

1

h h N S =∑ C.

h

n n

=1

h h

L

h

h

h N S N S

=∑ D.

h n n

=1

h h L h h

h W S W S =∑ 二、多项选择题(每题3分,共15分)

下列各题A )、B )、C )、D )、E )五个选项中,至少有两个答案是正确的 11.常用的构造估计量的方法有(AC )。

A.矩估计法

B.点估计法

C.极大似然估计法

D.区间估计法

E.样本估计法

12.通常所要估计的总体特征包括(ABCE)。

A.总体总值

B.总体均值

C.总体比例

D.总体相关系数

E.总体比率

13.根据调查是否针对总体的所有单元,可以将调查分成(CD)。

A.概率抽样调查

B.非概率抽样调查

C.全面调查

D.非全面调查

E.简单随机抽样调查

14.将概率抽样按照单元的入样概率是否相等进行分类,可以分成(CD)。

A.简单随机抽样

B.整群抽样

C.等概率抽样

D.不等概率抽样

E.非概率抽样调查

15.将概率抽样按照具体的抽样方式进行分类,可以分成(ABCDE)。

A. 简单随机抽样

B.分层抽样

C.整群抽样

D.系统抽样

E.多阶段抽样

三、名词解释(本大题共5道小题,每题3分,合计15分)

16.信度

答:在一定条件下进行多次测量时,所得结果之间的符合程度。

17.效度

答:在一定条件下进行多次测量时,所得结果平均值与真实值之间的符合程度。

18.抽样误差

答:由于用样本数据对总体特征进行估计所引起的代表性误差。

19.非抽样误差

答:非抽样误差的来源比较复杂,主要有抽样框未能不重不漏地包含所有抽样单元导致的抽样框误差,调查测量不准确引致的测量误差,此外还有无回答误差、粗大误差等。

20.配额抽样

答:配额抽样(quota sampling)又称定额抽样。它是按照总体的特征予以配置样本的一种非概率抽样方法,首先将总体中的所有单元按一定的标志分为若干类(组)(在这一点上与概率抽样中的分层抽样非常相似),然后在每个类(组)中按照事先规定的比例或数量(即配额)用便利抽样或判断抽样方法选取样本点。

四、简答题(本大题共5小题,每题6分,合计30分)

21.简述控制非抽样误差的方法。

答:控制非抽样误差的方法主要有以下几种:严格调查程序、规范调查步骤、加强人员的培训和管理、合理地设计问题和答卷、已经改进测量方法和工具等。

22.简述产生随机数的方式。

答:产生随机数的方式主要有以下几种:①使用计算器。②使用计算机。③使用随机数表。④使用随机数骰子⑤使用电子随机数抽样器。

23.简述分层随机抽样相对于简单随机抽样的优点

答:相对于简单随机抽样,分层随机抽样的优点在于:①分层随机抽样可同时对子总体进行参数估计。从分层抽样的定义可以看出,由于抽样在每一层中独立进行,所以各层的数据可以用于对本层(子总体)进行参数估计,而不单是汇总后用于对总体参数进行估计。

②分层随机抽样便于依托行政管理机构进行组织和实施,同时还可以根据各层的不同特点采用不同的抽样方式。③分层随机抽样可使样本在总体中分布更加均匀,从而具有更好的代表性。这样就避免了样本分布不平衡的现象。④分层随机抽样可以提高参数估计的精度。抽样调查的目的在于对总体(或子总体)的参数进行估计,而分层抽样的精度一般要高于其他抽样方式。

24.简述多阶段抽样相对于简单随机抽样的优点。

答:相对于简单随机抽样,多阶段抽样的优点在于:①实施方便,每个基本单元的调查费用也低。②多阶段抽样,不仅对初级单元进行了抽样,而且对每个被抽中的初级单元实

施了再抽样,因此它能够充分发挥抽样的效率,节省了人力和物力。③多阶段抽样是分阶段实施的,因此抽样框可以分级准备。

五、计算题(本大题共两小题,每题15分,合计30分)

25.某市包括城镇、农村两个地区,现要进行家庭收入调查。已知城镇共有40000户居民,农村共有60000户居民;城镇、农村居民年收入标准差估计分别为S 城镇=2500,S 农村=2000;城镇、农村居民抽样的平均每户费用分别为64元和100元。若要抽取n=600的样本,请分别计算出在城镇和农村进行比例分配、最优分配(考虑费用因素)时所需的样本量。 (最优分配公式:

k n n

1

h S =∑)

1n =1nW =600×0.4=240(户) 2n =2nW =600×0.6=360(户)

按最优分配时,城镇和农村所需样本量分别为:

1306n =≈(户)

2294n =≈(户)

26.某工厂欲调查该厂某月份每个工人的平均每班的产量,假设工厂采用三班制连续生产,每班有5个班组同时生产,该月30天,总共有450班组(日),用随机方法抽了8个班组(日),每个班组有6个工厂,获取数据如下:

求抽样的标准差。

答:解:每个工人在一班中的产量:

11

1

n M

ij i j i

y y nM =

===

=

∑∑1

51762107886

?≈? 即每人每班平均生产1078件。 方差估计量按公式可得:

()2

2

1111n b i i f f v y S y y nM

n n =-==??--?? ?==- ?- ?????

∑=814502141.8837.5787-?=?

所以抽样的标准差为6.13件。

抽样技术与应用期末复习题

1、 分层抽样的特点是() A 、层内差异小,层间差异大 B 、层间差异小,层内差异大 C 、层间差异小 D 、层内差异大 2、下面的表达式中错误的是() A 、∑=1h f B 、∑=n n h C 、∑=1h W D 、∑=1h N 3、各省电脑体育彩票中奖号码的产生属于() A 、随意抽样 B 、判断抽样 C 、随机抽样 D 、定额抽样 4、抽样调查的根本功能是() A 、获取样本资料 B 、计算样本指标 C 、推断总体数量特征 D 、节约费用 5、最优分配(opt V )、比例分配(prop V )的分层随机抽样与相同样本量的简单随 机抽样(srs V )的精度之间的关系式为() A 、srs prop opt V V V ≤≤ B 、srs opt prop V V V ≤≤ C 、srs opt prop V V V ≥≥ D 、opt prop srs V V V ≤≤ 6、我们想了解学生的视力状况,准备抽取若干学校若干班级的学生进行测试, 则() A 、抽样单位是每一名学生 B 、调查单位一定是每一名学生 C 、调查单位可以是班级 D 、调查单位是学校 7、在分层抽样中,当样本容量n 固定时,能够使得估计量的方差)(st y V 达到最 小的分配方式是() A 、比例分配 B 、等额分配 C 、随机分配 D 、Neyman 分配 8、概率抽样与非概率抽样的根本区别是()

A 、是否能确保总体中的每个单位都有完全相同的概率被抽中 B 、是否能确保总体中的每个单位都有事先已知或可以计算的非零概率被抽中 C 、是否能减少调查性误差 D 、是否能计算和控制抽样误差 9、在抽样的总误差中,属于一致性的误差有() A 、变量误差与估计量偏差 B 、估计量偏差与抽样误差 C 、变量误差与抽样误差 D 、非抽样误差与估计量偏差 10、简单随机抽样、系统抽样、按比例分配的分层抽样三者之间的共同点是() A 、将总体分成几部分,然后按事先确定的规则在各部分抽取 B 、每个个体单元被抽到的可能性都相等 C 、一旦选定了第一个样本单元,则其余所有样本单元即可完全确定 D 、三者没有共同点 11、下面哪种样本量分配方式属于比例分配?() A 、N n N n h h = B 、h L h h h h h h h c S N c S N n n ∑==1 C 、∑==L h h h h h h S N S N n n 1 D 、∑==L h h h h h h S W S W n n 1 12、整群抽样中的群的划分标准为() A 、群的划分尽可能使群间的差异小,群内的差异大 B 、群的划分尽可能使群间的差异大,群内的差异小 C 、群的划分尽可能使群间的差异大,群内的差异大 D 、群的划分尽可能使群间的差异小,群内的差异小 13、群规模大小相等时,总体均值 的简单估计量为() A.∑∑===n i M j ij y nM Y 111?

抽样技术课后习题参考答案金勇进

第二章习题 2.1判断下列抽样方法是否是等概的: (1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。 (2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64. (3)总体20000~21000,从1~1000中产生随机数r 。然后用r+19999作为被抽选的数。 解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。第二,每个单元被抽中的概率是已知的,或者是可以计算的。第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。 因此(1)中只有1~64是可能被抽中的,故不是等概的。(2)不是等概的【原因】(3)是等概的。 2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同? 300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。如果希望相对误差限不超过10%,则样本量至少应为多少? 解:由已知可得,N=50000,n=300,5.9y =,2062=s 该市居民用电量的95%置信区间为 [])(y [2 y V z N α±=[475000±1.96*41308.19] 即为(394035.95,555964.05) 由相对误差公式 y ) (v u 2y α≤10% 可得%10*5.9206*n 50000 n 1*96.1≤- 即n ≥862

欲使相对误差限不超过10%,则样本量至少应为862 2.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。 解析:由已知得:10000=N 200=n 35.0=p 02.0==N n f 又有:35.0)()(===∧p p E p E 0012.0)1(11)(=---=∧p p n f p V 该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:])()([2 ∧ ∧ ±P V Z P E α 代入数据计算得:该区间为[0.2843,0.4157] 2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表: 编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8 100 18 180 9 110 19 170 10 240 20 120 估计该小区平均的文化支出Y ,并给出置信水平95%的置信区间。 解析:由已知得:200=N 20=n 根据表中数据计算得:5.14420120 1 ==∑=i i y y ∴ 该小区平均文化支出Y 的95%置信区间为:])(y [2 y V z α ±即是:[132.544 ,156.456] 故估计该小区平均的文化支出Y =144.5,置信水平95%的置信区间为[132.544 ,156.456]。 2.6某地区350个乡为了获得粮食总产量的估计,调查了50个乡当年的粮食产量,得到 y =1120(吨),225600S =,据此估计该地区今年的粮食总产量,并给出置信水平95%的 置信区间。 解析:由题意知:y =1120 1429.0350 50 n === N f 225600S =?160=s

应用抽样技术答案

第二章 2.1判断题: (1)错;(2)错;(3)对;(4)错;(5)错;(6)错;(7)错;(8)错;(9)对;(10)对;(11)错;(12)错;(13)错。 2.3选择题: (1)b ;(2)b ;(3)d ;(4)c ;(5)c 。 2.7 (13 3.67 4.33 5 5.67 6.33 7 1/10 1/10 2/10 2/10 2/10 1/10 1/10 (2)期望为5,方差为4/3 (3)抽样标准误 = = 1.155 (4)抽样极限误差 = 1.96*1.155 = 2.263 (5)置信区间 = (5.67-2.263, 5.67+2.263) =(3.407, 7.933)。 若区间两端只考虑抽样分布的可能性取值,则可得该抽样分布作为离散分布的置信区间为[3, 7] 第三章 3.1 判断题是否为等概率抽样: (1)是;(2)否;(3)是;(4)否。 3.2 (1)5.51 == ∑i Y N Y 25.6)(1 22=-=∑Y Y N i σ 33.8)(1 1 22=--= ∑Y Y N S i (2)样本:(2, 5) (2, 6) (2, 9) (5, 6) (5, 9) (6, 9) ()()5.55.775.55.545.36 1 =+++++= ∑y E () ∑=+++++=33.8)5.485.05.2485.4(61 2s E 3.3

(1) 1682=∑i y 1182662 =∑i y 03276.030 1750 /3011=-=-n f 760.5630/1682==y 127.8261302^067.503011826611)(11212212 =-?-=?? ? ??--=--=∑∑==y n y n y y n s n i i n i i ()07.27271.82603276.012 =?=-= s n f y v ()203.5)(==y v y se 198.10203.596.1)(=?=?=?y se t 95%置信度下置信区间为(56.067-10.198, 56.067+10.198)=(45.869, 66.265). 因此,对该校学生某月的人均购书支出额的估计为56.07(元),由于置信度95%对应的96.1=t ,所以,可以以95%的把握说该学生该月的人均购书支出额大约在45.87~66.27元之间。 (2) 易知N =1750, n =30,=8,t =1.96 267.03081=== n n p 03389.01 301750 /30111=--=--n f 1957.0)267.01(267.0)1(=-?=-=p p pq 08144.0957.003389.01)1()(=?=--= n pq f p v 0167.030 21 21=?=n P 的95%的置信区间为: ())4433.0,0907.0(0167.008114.096.1267.0211)1(=+?±=???? ??+--±n n pq f t p 则1N 的估计值为46725.467?1 ≈==Np N ,其95%的置信区间为: )776,159()4433.0,0907.0(1750=? (3)64.1054267 .01.0) 267.01(96.122220=?-?= =p q t n γ

抽样技术简答题及答案

抽样技术各类简答题参考答案 习题一 1.请列举一些你所了解的以及被接受的抽样调查。 略 2. 抽样调查基础理论及其意义; 答:大数定律,中心极限定理,误差分布理论,概率理论。 大数定律是统计抽样调查的数理基础,也给统计学中的大量观察法提供了理论和数学方面的依据;中心极限定理说明,用样本平均值产生的概率来代替从总体中直接抽出来的样本计算的抽取样本的概率,为抽样推断奠定了科学的理论基础;认识抽样误差及其分布的目的是希望所设计的抽样方案所取得的绝大部分的估计量能较好的集中在总体指标的附近,通过计算抽样误差的极限是抽样误差处于被控制的状态;概率论作为数学的一个分支而引进统计学中,是统计学发展史上的重要事件。 3.抽样调查的特点。 答:1)随机抽样;2)以部分推断总体;3)存在抽样误差,但可计算,控制;4)速度快、周期短、精度高、费用低;5)抽样技术灵活多样;6)应用广泛。 4.样本可能数目及其意义; 答:样本可能数目是在容量为N的总体中抽取容量为n的样本时,所有可能被抽中的不同样本的个数,用A表示。 意义:正确理解样本可能数目的概念,对于准确理解和把握抽样调查误差的计算,样本统计量的抽样分布、抽样估计的优良标准等一系列理论和方法问题都有十分重要的帮助。 5. 影响抽样误差的因素; 答:抽样误差是用样本统计量推断总体参数时的误差,它属于一种代表性误差,在抽样调查中抽样误差是不可避免的,但可以计算,并且可以被控制在任意小的范围内;影响 抽样误差的因素:1)有样本量大小,抽样误差通常会随着样本量的大小而增减,在某 些情形下,抽样误差与样本量大小的平方根成反比关系;2)所研究现象总体变异程度 的大小,一般而言,总体变异程度越大则抽样误差可能越大;3)抽样的方式方法, 如放回抽样的误差大于不放回抽样,各种不同的抽样组织方式也常会有不同的抽样误 差。 在实际工作中,样本量和抽样方式方法的影响是可以控制的,总体变异程度虽不可以 控制,但却可通过设计一些复杂的抽样技术而将其影响加以控制。 习题二 三简答题 1 概率抽样与非概率抽样的区别 答:概率抽样是指在抽取样本单元时,每个总体单元有一个非零的入样概率,并且样本单元的抽取应遵循一定的随机化程序。 2 普查与抽样调查的区别 答:普查是对总体的所有单元进行调查;抽样调查仅对总体中的部分单元进行调查。 3何谓抽样效率,如何评价设计效果? 答:两个抽样方案的抽样方差之比为抽样效率。当某个估计量的方差比另一估计量的方差小时,则称方差小的估计量效率比较高,因方差的大小与样本容量有直接的关系,因此比

应用抽样技术期末试卷

一、选择题(每题2分,共20分) 1.抽样调查的根本功能是( ) A. 获取样本资料 B. 计算样本资料 C . 推断总体数量特征 D. 节约费用 2.概率抽样与非概率抽样的根本区别是( ) A.是否能保证总体中每个单位都有完全相同的概率被抽中 B.是否能保证总体中每个单位都有事先已知或可以计算的非零概率被抽中 C.是否能减少调查误差 D.是否能计算和控制抽样误差 3. 与简单随机抽样进行比较,样本设计效果系数Deff >1表明( ) A.所考虑的抽样设计比简单随机抽样效率低 B.所考虑的抽样设计比简单随机抽样效率高 C.所考虑的抽样设计与简单随机抽样效率相同 D.以上皆对 4.优良估计量的标准是( ) A.无偏性、充分性和一致性 B.无偏性、一致性和有效性 C. 无误差性、一致性和有效性 D. 无误差性、无偏性和有效性 5.某乡欲估计今年的小麦总产量进行调查,已知去年的总产量为12820吨,全县共123个村,抽取13个村调查今年的产量,得到63.118=y 吨,这些村去年的产量平均为21.104=x 吨。试采用比率估计方法估计今年该地区小麦总产量( ) A.12820.63 B.14593.96 C.12817.83 D.14591.49 6.抽样标准误差的大小与下列哪个因素无关( ) A .样本容量 B .抽样方式、方法 C .概率保证程度 D .估计量 7.当β为某一特定常数时,比率估计量可看成是比率估计量的特例,此时该常数值为( ) A.1 B.0 C. x y D.x 8.抽样标准误差与抽样极限误差之间的关系是( ) A.θ θ )?(SE = ? B.)?(θtSE =? C.θθ)?(tSE =? D.t SE )?(θ=?

应用抽样技术期末复习题

抽样调查 一、选择题 1.抽样调查的根本功能是( C ) A. 获取样本资料 B. 计算样本资料 C . 推断总体数量特征 D. 节约费用 2.概率抽样与非概率抽样的根本区别是( B ) A.是否能保证总体中每个单位都有完全相同的概率被抽中 B.是否能保证总体中每个单位都有事先已知或可以计算的非零概率被抽中 C.是否能减少调查误差 D.是否能计算和控制抽样误差 3. 与简单随机抽样进行比较,样本设计效果系数Deff >1表明( A ) A.所考虑的抽样设计比简单随机抽样效率低 B.所考虑的抽样设计比简单随机抽样效率高 C.所考虑的抽样设计与简单随机抽样效率相同 D.以上皆对 4.优良估计量的标准是( B ) A.无偏性、充分性和一致性 B.无偏性、一致性和有效性 C. 无误差性、一致性和有效性 D. 无误差性、无偏性和有效性 5.某乡欲估计今年的小麦总产量进行调查,已知去年的总产量为12820吨,全县共123个村,抽取13个村调查今年的产量,得到63.118=y 吨,这些村去年的产量平均为21.104=x 吨。试采用比率估计方法估计今年该地区小麦总产量( B ) A.12820.63 B.14593.96 C.12817.83 D.14591.49 6.抽样标准误差的大小与下列哪个因素无关( C ) A .样本容量 B .抽样方式、方法 C .概率保证程度 D .估计量 7.抽样标准误差与抽样极限误差之间的关系是( B ) A.θ θ )?(SE = ? B.)?(θtSE =? C.θθ)?(tSE =? D.t SE )?(θ=? 8.应用比率估计量能使估计精度有较大改进的前提条件是调查变量与辅助变量 之间大致成( A )关系 A.正比例 B.反比例 C.负相关 D.以上皆是 9.能使)2(1)(2 22YX X Y lr S S S n f y V ββ-+-=达到极小值的β值为( B ) A.YX X Y S S S ? B.2X YX S S C.2Y YX S S D.X YX S S 2 10.( B ) 是总体里最小的、不可再分的单元。 A.抽样单元 B.基本单元 C.初级单元 D.次级单元 11. 下面哪种抽样方法是最简单的概率抽样方法( A )。 A.简单随机抽样 B.分层随机抽样 C.系统抽样 D.整群抽样 12. 下面关于各种抽样方法的设计效应,表述错误的是( B )。 A.简单随机抽样的deff=1 B.分层随机抽样的deff ﹥1 C.整群随机抽样的deff ﹥1 D.机械随机抽样的deff ≈1

应用抽样技术期末复习题

抽样调查 一、选择题 1.抽样调查的根本功能是( C ) A. 获取样本资料 B. 计算样本资料 C . 推断总体数量特征 D. 节约费用 2.概率抽样与非概率抽样的根本区别是( B ) A.是否能保证总体中每个单位都有完全相同的概率被抽中 B.是否能保证总体中每个单位都有事先已知或可以计算的非零概率被抽中 C.是否能减少调查误差 D.是否能计算和控制抽样误差 3. 与简单随机抽样进行比较,样本设计效果系数Deff >1表明( A ) A.所考虑的抽样设计比简单随机抽样效率低 B.所考虑的抽样设计比简单随机抽样效率高 C.所考虑的抽样设计与简单随机抽样效率相同 D.以上皆对 4.优良估计量的标准是( B ) A.无偏性、充分性和一致性 B.无偏性、一致性和有效性 C. 无误差性、一致性和有效性 D. 无误差性、无偏性和有效性 5.某乡欲估计今年的小麦总产量进行调查,已知去年的总产量为12820吨,全县共123个村,抽取13个村调查今年的产量,得到63.118=y 吨,这些村去年的产量平均为21.104=x 吨。试采用比率估计方法估计今年该地区小麦总产量( B ) A.12820.63 B.14593.96 C.12817.83 D.14591.49 6.抽样标准误差的大小与下列哪个因素无关( C ) A .样本容量 B .抽样方式、方法 C .概率保证程度 D .估计量 7.抽样标准误差与抽样极限误差之间的关系是( B ) A.θθ )?(SE =? B.)?(θtSE =? C.θθ)?(tSE =? D.t SE )?(θ=? 8.应用比率估计量能使估计精度有较大改进的前提条件是调查变量与辅助变量之间大致成( A )关系 A.正比例 B.反比例 C.负相关 D.以上皆是 9.能使)2(1)(222YX X Y lr S S S n f y V ββ-+-=达到极小值的β值为( B ) A.YX X Y S S S ? B.2X YX S S C.2Y YX S S D.X YX S S 2 10.( B ) 是总体里最小的、不可再分的单元。 A.抽样单元 B.基本单元 C.初级单元 D.次级单元 11. 下面哪种抽样方法是最简单的概率抽样方法( A )。 A.简单随机抽样 B.分层随机抽样 C.系统抽样 D.整群抽样 12. 下面关于各种抽样方法的设计效应,表述错误的是( B )。 A.简单随机抽样的deff=1 B.分层随机抽样的deff ﹥1 C.整群随机抽样的deff ﹥1 D.机械随机抽样的deff ≈1

《抽样技术》第四版习题答案

第2章 2.1 解:()1 这种抽样方法是等概率的。在每次抽取样本单元时,尚未被抽中的编号 为1~64的这些单元中每一个单元被抽到的概率都是 1100 。 ()2这种抽样方法不是等概率的。利用这种方法,在每次抽取样本单元时,尚未被抽中 的编号为1~35以及编号为64的这36个单元中每个单元的入样概率都是2 100 ,而尚未被抽中的编号为36~63的每个单元的入样概率都是 1100 。 ()3这种抽样方法是等概率的。在每次抽取样本单元时,尚未被抽中的编号为20 000~ 21 000中的每个单元的入样概率都是 1 1000 ,所以这种抽样是等概率的。 2.3 解:首先估计该市居民日用电量的95%的置信区间。根据中心极限定理可知,在大 _ y E y y -= 近似服从标准正态分布, _ Y 的195%α-=的置信区 间为y z y z y y α α??-+=-+? ?。

而()2 1f V y S n -= 中总体的方差2S 是未知的,用样本方差2s 来代替,置信区间 为,y y ?? -+???? 。 由题意知道,_ 2 9.5,206y s ==,而且样本量为300,50000n N ==,代入可以求得 _ 21130050000 ()2060.6825300 f v y s n --= =?=。将它们代入上面的式子可得该市居民日用电量的95%置信区间为7.8808,11.1192????。 下一步计算样本量。绝对误差限d 和相对误差限r 的关系为_ d rY =。 根据置信区间的求解方法可知 _ ___ 11P y Y r Y P αα? ???-≤≥-?≤≥-???? 根据正态分布的分位数可以知道1P Z αα??? ≤≥-???? ,所以()2_2rY V y z α?? ?= ??? 。也就是2 _2 _2 22 /221111r Y r Y S n N z S n N z αα?? ?????? ????? ???-=?=+ ? ????? ?? ???? 。 把_ 2 9.5,206,10%,50000y s r N ====代入上式可得,861.75862n =≈。所以样本量至少为862。 2.4 解:总体中参加培训班的比例为P ,那么这次简单随机抽样得到的P 的估计值p 的方差()()111f N V p P P n N -= --, 在大样本的条件下近 似服从标准正态分布。在本题中,样本量足够大,从而可得P 的195%α- =的置信区间为 2p z p z αα?-+?。 而这里的()V p 是未知的,我们使用它的估计值

抽样技术试题

第四章抽样技术概述 班级:姓名:成绩 一、填空题:(21分) 1、抽样调查是一种()调查,它是从所研究客观现象的总体中,按照()抽取()进行调查,以从这一部分单位调查的结果,来()所研究总体的相应数据。 2、随机原则是指在总体中抽取样本单位时,完全排除()意识,保证总体中()单位都有被抽中的同等可能性原则。 3、抽样调查是以()数据推断的()数据。 4、抽样调查产生的(),可以计算并控制, 5、从全及总体中抽取样本单位有()和()两种方法。 6、一般说,不重复抽样的抽样误差()重复抽样的抽样误差。 7、抽样平均误差就是抽样平均数(或抽样成数)与总体平均数(或总体成数)的()。它反映抽样平均数(或抽样成数)与总体平均数(或总体成数)的()。 8、影响抽样误差的主要因素有()、()、()、()。 9、利用样本统计量估计总体参数,通常运用()和()两种方法。 10、点估计是直接用()估计总体参数的推断方法。点

估计不考虑()及()。 11、置信区间反映了参数估计的精确程度,区间愈小,估计就愈();而置信度则反映了总体参数落在置信区间内的( ),置信度愈高,则估计的把握程度就()。 12、影响样本容量大小的因素主要有五种:()、()、()、()、()。 13、区间估计是用样本统计量估计总体参数时,用一个区间范围的值作为总体参数的估计值,并注明总体参数落在这们一个区间的可能性,或称()。我们称这一区间为()。 14、对于简单随机重复抽样,若其他条件不变,则当误差范围缩小一半,抽样单位数必须()倍。若误差范围扩大一倍,则抽样单位数为原来的()。 二、单项选择题:(14分) 1、随机抽样的基本要求是严格遵守() A.、准确性原则B、随机性原则C、代表性原则D、可靠性原则。 2、抽样调查的主要目的是() A.、广泛运用数学的方法B、计算和控制抽样误差C、修正普查的资料D、用样本统计量推算总体参数。 3、在抽样调查中() A.、既有登记性误差,也有代表性误差B、既没有登记性误差,也没有代表性误差C、只有登记性误差,没有代表性误差D、、

抽样技术期末试卷

一、选择题(每题2分,共20分) 1.抽样调查的根本功能是( ) A. 获取样本资料 B. 计算样本资料 C . 推断总体数量特征 D. 节约费用 2.概率抽样与非概率抽样的根本区别是( ) A.是否能保证总体中每个单位都有完全相同的概率被抽中 B.是否能保证总体中每个单位都有事先已知或可以计算的非零概率被抽中 C.是否能减少调查误差 D.是否能计算和控制抽样误差 3. 与简单随机抽样进行比较,样本设计效果系数Deff >1表明( ) A.所考虑的抽样设计比简单随机抽样效率低 B.所考虑的抽样设计比简单随机抽样效率高 C.所考虑的抽样设计与简单随机抽样效率相同 D.以上皆对 4.优良估计量的标准是( ) A.无偏性、充分性和一致性 B.无偏性、一致性和有效性 C. 无误差性、一致性和有效性 D. 无误差性、无偏性和有效性 4.某乡欲估计今年的小麦总产量进行调查,已知去年的总产量为12820吨,全县共123个村,抽取13个村调查今年的产量,得到63.118=y 吨,这些村去年的产量平均为21.104=x 吨。试采用比率估计方法估计今年该地区小麦总产量( ) A.12820.63 B.14593.96 C.12817.83 D.14591.49 6.抽样标准误差的大小与下列哪个因素无关( ) A .样本容量 B .抽样方式、方法 C .概率保证程度 D .估计量 7.当β为某一特定常数时,比率估计量可看成是比率估计量的特例,此时该常数值为( ) A.1 B.0 C. x y D.x 8.抽样标准误差与抽样极限误差之间的关系是( ) A.θ θ )?(SE = ? B.)?(θtSE =? C.θθ)?(tSE =? D.t SE )?(θ=? 9.应用比率估计量能使估计精度有较大改进的前提条件是调查变量与辅助变量之间大致成( )关系

《抽样技术》第四版习题答案

第2章 解:这种抽样方法是等概率的。在每次抽取样本单元时,尚未被抽中的编号为1~64的这些单元中每一个单元被抽到的概率都是。 这种抽样方法不是等概率的。利用这种方法,在每次抽取样本单元时,尚未被抽中的编号为1~35以及编号为64的这36个单元中每个单元的入样概率都是,而尚未被抽中的编号为36~63的每个单元的入样概率都是。 这种抽样方法是等概率的。在每次抽取样本单元时,尚未被抽中的编号为20 000~21 000中的每个单元的入样概率都是,所以这种抽样是等概率的。 解: 解:首先估计该市居民日用电量的95%的置信区间。根据中心极限定理可知,在大样本的条件下,近似服从标准正态分布,的的置信区间为。 而中总体的方差是未知的,用样本方差来代替,置信区间为。 由题意知道,,而且样本量为,代入可以求得 。将它们代入上面的式子可得该市居民日用电量的95%置信区间为。 下一步计算样本量。绝对误差限和相对误差限的关系为。 根据置信区间的求解方法可知 根据正态分布的分位数可以知道,所以。也就是。 把代入上式可得,。所以样本量至少为862。 解:总体中参加培训班的比例为,那么这次简单随机抽样得到的的估计值的方差,利用中心极限定理可得在大样本的条件下近似服从标准正态分布。在本题中,样本量足够大,从而可得的的置信区间为。

而这里的是未知的,我们使用它的估计值。所以总体比例的的置信区间可以写为,将代入可得置信区间为。 解:利用得到的样本,计算得到样本均值为,从而估计小区的平均文化支出为144.5元。总体均值的的置信区间为,用来估计样本均值的方差。 计算得到,则,,代入数值后计算可得总体均值的95%的置信区间为。 解:根据样本信息估计可得每个乡的平均产量为1 120吨,该地区今年的粮食总产量的估计值为(吨)。 总体总值估计值的方差为,总体总值的的置信区间为,把 代入,可得粮食总产量的的置信区间为。 解:首先计算简单随机抽样条件下所需要的样本量,把带入公式,最后可得。 如果考虑到有效回答率的问题,在有效回答率为70%时,样本量应该最终确定为。 解:去年的化肥总产量和今年的总产量之间存在较强的相关性,而且这种相关关系较为稳定,所以引入去年的化肥产量作为辅助变量。于是我们采用比率估计量的形式来估计今年的化肥总产量。去年化肥总产量为。利用去年的化肥总产量,今年的化肥总产量的估计值为吨。 解:本题中,简单估计量的方差的估计值为=37.17。 利用比率估计量进行估计时,我们引入了家庭的总支出作为辅助变量,记为。文化支出属于总支出的一部分,这个主要变量与辅助变量之间存在较强的相关关系,而且它们之间的关系是比较稳定的,且全部家庭的总支出是已知的量。 文化支出的比率估计量为,通过计算得到,而,则,文化支出的比率估计量的值为(元)。 现在考虑比率估计量的方差,在样本量较大的条件下,,通过计算可以得到两个变量的样本方差为,之间的相关系数的估计值为,代入上面的公式,可以得到比率估计量的方差的估计值为。这个数值比简单估计量的方差估计值要小很多。全部家庭的平均文化支出的的置信区间为,把具体的数值代入可得置信区间为。 接下来比较比估计和简单估计的效率,,这是比估计的设计效应值,从这里可以看出比估计量比简单估计量的效率更高。 解:利用简单估计量可得,样本方差为,,样本均值的方差估计值为。 利用回归估计的方法,在这里选取肉牛的原重量为辅助变量。选择原重量为辅助变量是合理的,因为肉牛的原重量在很大程度上影响着肉牛的现在的重量,二者之间存在较强的相关性,相关系数的估计值为,而且这种相关关系是稳定的,这里肉牛的原重量的数值已经得到,所以选择肉牛的原重量为辅助变量。 回归估计量的精度最高的回归系数的估计值为。现在可以得到肉牛现重量的回归估计量为,代入数值可以得到。 回归估计量的方差为,方差的估计值为,代入相应的数值,,显然有。在本题中,因为存在肉牛原重量这个较好的辅助变量,所以回归估计量的精度要好于简单估计量。 第3章 3.1 解:在分层随机抽样中,层标志的选择很重要。划分层的指标应该与抽样调查中最关心的调查变量存在较强的相关性,而且把总体划分为几个层之后,层应该满足:层内之间的差异尽可能小,层间差异尽可能大。这样才能使得最后获得的样本有很好的代表性。对

抽样技术与应用期末复习题

一、选择题 1、 分层抽样的特点是() A 、层内差异小,层间差异大 B 、层间差异小,层内差异大 C 、层间差异小 D 、层内差异大 2、下面的表达式中错误的是() A 、∑=1h f B 、∑=n n h C 、∑=1h W D 、∑=1h N 3、各省电脑体育彩票中奖号码的产生属于() A 、随意抽样 B 、判断抽样 C 、随机抽样 D 、定额抽样 4、抽样调查的根本功能是() A 、获取样本资料 B 、计算样本指标 C 、推断总体数量特征 D 、节约费用 5、最优分配(opt V )、比例分配(prop V )的分层随机抽样与相同样本量的简单随 机抽样(srs V )的精度之间的关系式为() A 、srs prop opt V V V ≤≤ B 、srs opt prop V V V ≤≤ C 、srs opt prop V V V ≥≥ D 、opt prop srs V V V ≤≤ 6、我们想了解学生的视力状况,准备抽取若干学校若干班级的学生进行测试, 则() A 、抽样单位是每一名学生 B 、调查单位一定是每一名学生 C 、调查单位可以是班级 D 、调查单位是学校 7、在分层抽样中,当样本容量n 固定时,能够使得估计量的方差)(st y V 达到最 小的分配方式是() A 、比例分配 B 、等额分配 C 、随机分配 D 、Neyman 分配 8、概率抽样与非概率抽样的根本区别是() A 、是否能确保总体中的每个单位都有完全相同的概率被抽中 B 、是否能确保总体中的每个单位都有事先已知或可以计算的非零概率被抽中 C 、是否能减少调查性误差 D 、是否能计算和控制抽样误差 9、在抽样的总误差中,属于一致性的误差有() A 、变量误差与估计量偏差 B 、估计量偏差与抽样误差 C 、变量误差与抽样误差 D 、非抽样误差与估计量偏差 10、简单随机抽样、系统抽样、按比例分配的分层抽样三者之间的共同点是() A 、将总体分成几部分,然后按事先确定的规则在各部分抽取 B 、每个个体单元被抽到的可能性都相等 C 、一旦选定了第一个样本单元,则其余所有样本单元即可完全确定 D 、三者没有共同点

抽样技术练习题及答案

1.请列举一些你所了解的以及被接受的抽样调查。 2.抽样调查基础理论及其意义; 3.抽样调查的特点。 4.样本可能数目及其意义; 5.影响抽样误差的因素; 6.某个总体抽取一个n=50的独立同分布样本,样本数据如下: 567 601 665 732 366 937 462 619 279 287 690 520 502 312 452 562 557 574 350 875 834 203 593 980 172 287 753 259 276 876 692 371 887 641 399 442 927 442 918 11 178 416 405 210 58 797 746 153 644 476 1)计算样本均值y与样本方差s2; 2)若用y估计总体均值,按数理统计结果,y是否无偏,并写出它的方差表达式; 3)根据上述样本数据,如何估计v(y)? 4)假定y的分布是近似正态的,试分别给出总体均值μ的置信度为80%,90%,95%,99%的(近似)置信区间。

一判断题 1 普查是对总体的所有单元进行调查,而抽样调查仅对总体的部分单元进行调查。 2 概率抽样就是随机抽样,即要求按一定的概率以随机原则抽取样本,同时每个单元被抽中的概率是可以计算出来的。 3 抽样单元与总体单元是一致的。 4 偏倚是由于系统性因素产生的。 5 在没有偏倚的情况下,用样本统计量对目标量进行估计,要求估计量的方差越小越好。 6 偏倚与抽样误差一样都是由于抽样的随机性产生的。 7 偏倚与抽样误差一样都随样本量的增大而减小。 8 抽样单元是构成抽样框的基本要素,抽样单元只包含一个个体。 9 抽样单元可以分级,但在抽样调查中却没有与之相对应的不同级的抽样框。 10 总体目标量与样本统计量有不同的意义,但样本统计量它是样本的函数,是随机变量。 11 一个抽样设计方案比另一个抽样设计方案好,是因为它的估计量方差小。 12 抽样误差在概率抽样中可以对其进行计量并加以控制,随着样本量的增大抽样误差会越来越小,随着n越来越接近N,抽样误差几乎可以消除。 13 抽样误差越小,说明用样本统计量对总体参数进行估计时的精度越低。 14 样本量与调查费用呈现线性关系,但样本量与精度却呈非线性关系。 15 精度和费用也是评价抽样设计方案优劣的两条准则。 16 简单随机抽样时每个总体单元都有非零的入样概率,但每个总体单元的入样概率是不同的。 17 当总体N很大时,构造一个包含所有总体单元名单的抽样框是有局限性的,这也是简单随机抽样的局限性。 18 设N=872,n=10。利用随机数字表抽取一个简单随机样本如下:128 157 506 455 127 789 867 954 938 622 19 设N=678 n=5 利用随机数字表抽取一个简单随机样本如下:556 485 098 260 485 20 在实际工作中,如果抽样比接近于1时,人们会采用全面调查 二填空题 1 抽样比是指( ),用( )表示。 2 偏倚为零的估计量,满足( ),称为( )。 3 简单随机抽样的抽样误差等于( )。 4 简单随机抽样时重复抽样的抽样误差等于( ) 5 抽样时某一总体单元在第m次被选入样本的概率是( ) 6 简单随机抽样时总体单元被选入样本的概率是( ) 7 某一样本被选中概率是( )。 8 大数定理是指( )的规律性总是在大量( )的观察中才能显现出来,随着观察次数( )的增大,( )影响将互相抵消而使规律性有稳定的性质。 9 中心极限定理证明了当( )增大时,观察值的均值将趋向于服从( ),即不论( )服从什么分布,在观察值足够多时其均值就趋向( )分布。 10 抽样调查的核心是估计问题,选择估计量的标准是( ) ( ) ( )。 三简答题

抽样技术_第三版_全部课后答案

第二章习题 判断下列抽样方法是否是等概的: (1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。 (2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64. (3)总体20000~21000,从1~1000中产生随机数r 。然后用r+19999作为被抽选的数。 解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。第二,每个单元被抽中的概率是已知的,或者是可以计算的。第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。 因此(1)中只有1~64是可能被抽中的,故不是等概的。(2)不是等概的【原因】(3)是等概的。 抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同 为了合理调配电力资源,某市欲了解50000户居民的日用电量,从中简单随机抽取了300户进行,现得到其日用电平均值=y (千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。如果希望相对误差限不超过10%,则样本量至少应为多少 解:由已知可得,N=50000,n=300,5.9y =,2062=s

1706366666206*300 50000300 1500001)()?(222=- =-==s n f N y N v Y V 19.413081706366666(==)y v 该市居民用电量的95%置信区间为 [])(y [2 y V z N α±=[475000±*] 即为(,) 由相对误差公式 y ) (v u 2y α≤10% 可得%10*5.9206*n 50000 n 1* 96.1≤- 即n ≥862 欲使相对误差限不超过10%,则样本量至少应为862 某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。随机抽取了两百名学生进行调查,得到P=,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。 解析:由已知得:10000=N 200=n 35.0=p 02.0==N n f 又有:35.0)()(===∧p p E p E 0012.0)1(1 1)(=---=∧p p n f p V 该大学所有本科学生中暑假参加培训班的比例95%的置信区间为: ])()([2 ∧ ∧±P V Z P E α 代入数据计算得:该区间为[,] 研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表: 编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8 100 18 180

抽样技术简答题及答案.doc

1 抽样技术各类简答题参考答案 习题一 1.请列举一些你所了解的以及被接受的抽样调查。 略 2. 抽样调查基础理论及其意义; 答:大数定律,中心极限定理,误差分布理论,概率理论。 大数定律是统计抽样调查的数理基础,也给统计学中的大量观察法提供了理论和数学方面的依据;中心极限定理说明,用样本平均值产生的概率来代替从总体中直接抽出来的样本计算的抽取样本的概率,为抽样推断奠定了科学的理论基础;认识抽样误差及其分布的目的是希望所设计的抽样方案所取得的绝大部分的估计量能较好的集中在总体指标的附近,通过计算抽样误差的极限是抽样误差处于被控制的状态;概率论作为数学的一个分支而引进统计学中,是统计学发展史上的重要事件。 3.抽样调查的特点。 答:1)随机抽样;2)以部分推断总体;3)存在抽样误差,但可计算,控制;4)速度快、周期短、精度高、费用低;5)抽样技术灵活多样;6)应用广泛。 4.样本可能数目及其意义; 答:样本可能数目是在容量为N的总体中抽取容量为n的样本时,所有可能被抽中的不同样本的个数,用A表示。 意义:正确理解样本可能数目的概念,对于准确理解和把握抽样调查误差的计算,样本统计量的抽样分布、抽样估计的优良标准等一系列理论和方法问题都有十分重要的帮助。 5. 影响抽样误差的因素; 答:抽样误差是用样本统计量推断总体参数时的误差,它属于一种代表性误差,在抽样调查中抽样误差是不可避免的,但可以计算,并且可以被控制在任意小的范围内;影响抽样误差的因素:1)有样本量大小,抽样误差通常会随着样本量的大小而增减,在某些情形下,抽样误差与样本量大小的平方根成反比关系;2)所研究现象总体变异程度的大小,一般而言,总体变异程度越大则抽样误差可能越大;3)抽样的方式方法,如放回抽样的误差大于不放回抽样,各种不同的抽样组织方式也常会有不同的抽样误差。 在实际工作中,样本量和抽样方式方法的影响是可以控制的,总体变异程度虽不可以控制,但却可通过设计一些复杂的抽样技术而将其影响加以控制。 习题二 三简答题 1 概率抽样与非概率抽样的区别 答:概率抽样是指在抽取样本单元时,每个总体单元有一个非零的入样概率,并且样本单元的抽取应遵循一定的随机化程序。 2 普查与抽样调查的区别 答:普查是对总体的所有单元进行调查;抽样调查仅对总体中的部分单元进行调查。

《抽样技术》试题(一)

《抽样调查》试卷D 一、判断改错 1.在抽样调查的实践中,为降低抽样误差,可以考虑缩小总体方差或扩大样本量。() 2.欲对一批成品的合格率进行抽样调查,已知在前两次的全面调查中,其 合格率分别为p 1=90%、p 2 =80%,则本次调查应根据p 1 确定样本量。() 3.在总体容量充分大时,放回抽样和不放回抽样的估计误差相差无几。() 4.整群抽样可以被理解为是第一阶段抽样比为100%时的一种特殊的两阶段抽样。() 5.分层抽样可以被理解为是第一阶段抽样比为100%时的一种特殊的两阶段抽样。() 6.比估计与回归估计优于简单估计的条件是调查变量与辅助变量间的相关系数大于1/2。() 7.二重分层抽样在效果上优于普通分层抽样。()8.当总体方差未知时,可用样本方差代替以确定必要样本量。()9.抽样分布就是指样本的分布。()10.利用随机数表既可以实施等概率抽样,也可以实施不等概率抽样。() 二、简述题 1.试述抽样调查的误差及其种类; 2.试述怎样分层才能有效提高精度; 3.找一个完整的抽样框通常是不容易的。在下述调查中可以试用什么样的

抽样框? (1)调查一个大城市中卖皮箱的商店; (2)调查失落在公共汽车上的东西的种类; (3)调查去年被蛇咬过的人数; (4)调查估计每周家庭成员用于看电视的总时数。 三、应用题 请将下述按由小到大顺序排列的20个单位标志值调整为按顺逆交替方式排列,并以k=2为起点等距抽选出4个单位组成样本,然后与在原排序方式下按上述要求所抽选的等距样本进行比较,看其在抽样误差方面有什么变化。 21 21 28 29 30 32 32 32 34 35 35 36 37 38 40 45 46 46 48 50

相关主题
文本预览
相关文档 最新文档