当前位置:文档之家› 抽样技术论文

抽样技术论文

抽样技术论文
抽样技术论文

分层抽样中各层样本量的分配问题研究

姓名:马艳

学院:数学科学学院

班级:08(7)班

学号:08213203

【摘要】近代和现代统计分析方法中,抽样法是最重要,最常用的方法之一。不论在工业生产过程的质量控制、农产量调查,还是居民生活水平等方面,抽样法都显示了它的重要作用。在经常使用的抽样组织方式中,分层随机抽样以抽样误差小,抽样效果好的特点被广泛的应用于经济、资源、人口等多个方面,然而在分层随机抽样中,样本量在各层中的不同分配方式会对估计量的精度产生一定的影响。各层样本容量的确定是决定分层随机抽样效果高低、花费费用多少的关键。本文主要是通过介绍几种确定样本容量分配方法进一步加深对分层随机抽样方法的理解与应用。

【关键字】分层随机抽样分配样本容量费用

一、引言

在经济调查、市场调研实践、人口调查等统计抽样分析方法中,分层随机抽样以其效率相对高,费用相对少,精度高,方法灵活等优点而被人们所广泛的应用,成为近代统计分析方法中最重要,最常用的方法之一。分层随机抽样样本容量的确定可以说是:假若总的样本容量n固定,接下来的问题就是如何把这n个样本合理的分配到各层中去。在分层随机抽样中,样本量在各层中的不同分配方式会对估计量的精度产生一定的影响,这一方面是由于层的规模大小不同或在总体中所占的份额不同,另一方面是因为各层的层内方差2

S不同,所有

h

这些都会影响估计量的精度。因此,样本容量的分配关系到抽样调查的准确性以及抽样样本估计量的精度,因此从理论上来说研究分层抽样中各层样本量的分配问题对于抽样技术这门课程来说变得尤为重要。

二、问题的提出

(一)分层随机抽样中层样本量分配的重要性

分层抽样也叫做类型抽样,它是实际工作中最常用,最重要的抽样技术之一。分层抽样是在抽样之前,先将总体按一定的标志划分为若干个层,然后在各层内分别独立的进行抽样。由此所得到的样本就成为分层样本,分层所抽的样本也是互相独立的。如果每层中的抽样都是简单随机的,则这种抽样就成为分层随机抽样。分层抽样的实质就是在各层间做全面的调查,而在各层内做抽样调查。因此,分层抽样的误差只与各层内的差异有关,而同各层间的差异无关。所以,为了能有效的降低抽样误差,提高抽样效果,在分层抽样时要遵循“尽可能使层内差异小,而使层间差异大”的原则,同时要使分层的结果既无重复又无遗漏。

在分层抽样中,解决层样本容量的分配问题,既是实施分层抽样调查的前提,又是保证抽样精度和估计误差尽可能小的关键因素。在分层随机抽样中考虑层中样本容量的分配问题就是要考虑在进行分层随机抽样调查中调查的精度和调查费用的多少的问题。即如何分配才能在费用一定时使总的精度和各层估计精度达到最高;在分层随机抽样中考虑层中样本容量的分配问题就是要考虑数据的处理问题,即如何分配才能使调查数据的处理工作更加简洁,也使估计量及其方差的确定形式更为简单明了;在分层随机抽样中考虑层中样本容量的分配问题就是要考虑各层的样本容量的大小问题,即将总体样本量n 各分多少到各层中去。因此对于抽样调查者来说,若要保证抽样调查费用尽可能的低,抽样调查精度尽可能的高,则就要处理好对分层抽样中各层样本容量的分配问题。所以说分层随机抽样中层样本量分配问题在抽样技术研究中非常重要。

(二)国内外对该问题的研究简述

对于分层抽样中各层样本量的分配问题的研究由来已久,早在二十世纪五十年代,W.G.科克伦就在他的著作《抽样技术》中讲述了关于分层随机抽样各层样本容量的最优分配方法;在1985年,L K ish ?出版的《抽样调查》一书中也介绍了分层抽样中的“元素的按比例抽样”和“不按比例抽样或最优分配”,但是这些内容都不够系统。上世纪九十年代末至本世纪初,中国的统计专家们也陆续出版了一些有关抽样技术的教材或著作,都有对国外分层抽样中层样本容量的分配方法的系统阐述。

基于上面对分层随机抽样的方法特点以及分层随机抽样中层样本容量的分配问题的重要性的分析介绍,下面重点介绍几种确定层样本容量多少的方法,既包括单变量情况下的也包括多变量情况下的。本文的立足点就是通过介绍几种确定样本容量分配方法进一步加深对分层随机抽样方法的理解与应用。

三、单变量情况下样本量在各层的分配

我们由前面知道,在考虑分层抽样中层样本容量的分配问题时要考虑抽样时的费用以及抽样的精度,基于这些问题的考虑总样本量n 在各层中的分配方法有以下两大种: (一)比例分配

在分层抽样中,若各层的抽样比都相同,即h f f =,则称总样本量在各层中的分配为按比例分配(prop:proportional allocation )。此时

h

h

n n

N N =

(h=1,2,…..L )即共有L 层

其中h n 为每层的样本量,h N 为每层的总量,n

为分层抽样抽得的样本总量,

N 为总

的样本量。

该种方法最早是由Bowley 于1926年提出的。由式

h h

n n N N

=

可以看出,任何一层中

的样本被抽中的概率均为h f f =,由此可见,比例分配的分层抽样是一种等概率抽样。这种样本也成为自加权样本。因为我们可以从下面的比例分配情况下总体均值Y 与总体总值Y 的估计量的表达式可以看出:

总体均值Y 的估计量的表达式为:

1

1

1

11

11

(

)h

h

n n L

L

L

h prop h

h hi

hi

h h i h i h

n y W

y y

y y n

n n

======

=

?=

=∑∑

∑∑∑

总体总值Y 的估计量的表达式为:

11

1

?h

n L

prop

prop hi

h i N

N Y N y y

y y n

n

f

=====

=

∑∑ 因此按比例分配的分层随机样本,估计量的形式特别简单而且它还有一个很优良的性质就是估计量还是无偏的,可以大大简化调查以后的数据处理问题,特别是对于大规模的多变量调查,自加权样本的优点就更明显了。

比例分配法是在实际工作中最常用的方法。由于它所抽取的样本容量考虑了各层的合理权重h W ,使得综合计算的样本指标能切合实际情况,增强了抽样估计的效果。

(二)最优分配

1、一般情形

在分层随机抽样中,对于给定的费用,使估计量的方差()st V y 达到最小,或者对于给定的估计量方差V ,使得总费用达到最小的各层样本量的分配就称为最优分配(opt:optimum allocation )。由于考虑了费用因素,所以这种方法又被称为经济分配法。

由上述定义可以看出,在最优分配当中,不仅要考虑抽样调查的精度,而且把费用也纳入了考虑的范围之内,这在实际的抽样调查工作中是相当重要的。对于该种分配方法,一个值得考虑的问题就是费用函数该如何定义,在这里为了研究的方便,主要选择费用函数为线性的。即总费用函数为:

01

L

T h

h

h C c c

n ==+

其中,T C 为总费用;0c 为与样本量无关的固定费用;h c 为在第h 层中抽取一个单元的平均费

用。

从总费用函数的公式01

L

T h h h C c c n ==+

中可以看出,只有1

L

h h h c n =∑是与各层样本量

h

n 有关的费用。最优分配的目标是同时权衡费用和方差两个指标,在方差给定时使费用尽

可能的小,或在费用给定时使方差尽可能的小。因此利用Cauchy-Schwarz 不等式,可以得出(1)在给定方差()st V y 的情况下,使得总费用最小的层样本量的个数的确定公式为:

1

1

2

1

((/

/L

L

h h

h h h h L

h

h h W S W S n V W

S N

===?=

+

∑∑∑

(2)在给定总费用T C 的情况下,使得方差()st V y 最小的层样本量的个数的确定公式为;

01

1

()(/

L

T h h h L

h

h h C c W S n W

S ==-?=

∑∑

最优分配的结果表明:h n 与h N ,h S

成反比。从而得出下面的行动准则:倘若(1)第h 层所含有的单元数较多;(2)第h 层内部单元的差异程度较大;(3)第h 层每个样本所需的费用较低,则对第h 层需要抽取一个含量较多的样本。

2、特殊情形—内曼最优分配

上面所讨论的最优分配是一般情况下的最优分配,如果假定各层的单位抽样费用相等,即h c c =,那么费用函数就变为0T C c cn =+ 。此时分配

h n n

的表达式将大大的简化:

1

1

h

h h

h h

L

L

h

h

h

h

h h n W S N S n

W

S N

S ===

=

∑∑

这种形式的分配就被称为内曼最优分配,简称为内曼分配。又称适度法,该种方法是最优分配的一个特例。

事实上,这一结论早在1923年就由俄国学者楚波罗给出了证明,但一直没有引起注意,直到1934年内曼重新给出它的证明,它才逐渐引起人们的重视,因此这种形式的最优分配常被称为内曼最优分配。

内曼最优分配法在考虑各层合理权重的情况下,又使抽样方差减小到可能范围,这种分配方法在使用时比比例分配法又前进了一步。

(三)最优分配与比例分配的精度比较

分层随机抽样中,依照定义,最优分配时估计量的精度比比例分配时估计量的精度高,但比例分配是自加权的,计算比较方便。而内曼分配考虑到层权和各层变异程度的因素,会使抽样精度大大提高,两者各有优点。但是在实际工作中具体选择哪种分配方法,则此时要对两种方法的估计量的精度进行一下比较。

我们知道比例分配时估计量的方差为: 2

2

2

111()prop st f V y S

S S n

n

N

-=

=

?-

?

而内曼分配时估计量的最小方差为:

2

2

11()()L

opt st h h h

V y W S S n

N

=

-

?∑

因此:222

11()()()()0L L

prop st

opt st h h h h h h

V y V y S W S W S S n n ??-=-=-≥????∑∑ 若诸h S 很接近,则比例分配与内曼最优分配的精度相差无几。只有当各层的h S 相差较大时,最优分配比比例分配在精度上才有较大的得益。因此,在设计抽样方案时,可依已有的信息对各层的h S 的离散程度加以分析,以决定是采用比例分配还是最优分配。

特别地,如果各层的容量、层内差异大小及层内平均每单元的抽样费用十分接近时,也可直接按等额方法分配总样本量。此时h n n L

=

(四)实际抽样中分配方法的选取原则

内曼分配是一般最优分配的特例,按比例分配又是内曼分配的特例,所以,一般最优分配是样本容量分配的通用规则。由于不同的分配规则引起的层样本容量不同,产生的抽样效果也会有差别,所以如果分配方式不当,就会引起抽样效果的损失。选取分配方法,应该考虑具体的调查目的,调查目的的不同,样本容量的选取规则也有差别。

1、调查目的是取得总体特定值的情况

在这种情况下,分层实际上是为了改进这些特定值估计量的效率。现实中采用分层抽样大多数是为了达到这一目的。

在实际工作中,比例分配法最常用。由于它所抽取的样本容量考虑了各层的合理权重,

使得综合计算的样本指标能切合实际情况,并且操作实施方便,在不要求费用等因素时很实用。若在给定的费用下,使估计量的方差()st V y 达到最小,或者在给定的估计量方差V 下,使得总费用达到最小,则使用一般最优分配。内曼最优分配法在考虑各层合理权重的情况下,又使抽样方差减小到可能范围,这种分配方法在使用时比比例分配法又前进了一步,而且它是一般最优分配法的特殊情况,即对于每个抽样单元来说抽样时所花费用都相等。

2、调查目的是进行各层之间的比较

一般来说,这种比较最好是在有相同相对标准误的层样本估计量之间进行,应该用相同的样本容量,除非总体方差或单位调查费用在层间变化很大。在后一种情况下,应使分配的各层样本容量与层总体标准差成正比,与层平均费用的平方根成反比,这样会使总体层与层之间差的平均方差达到最小。

3、调查目的是既要估计整个总体也要估计层特定值的情况

在这种调查结果对总体和各层(即子总体)都需要的情况下,样本容量的分配应视主次而定。如果调查的主要目的是估计整个总体,那最优分配是适当的,但如果求得的各层的统计量更重要,那么,不论从提高层估计精度还是从使层与层更容易比较来讲,就必须做一些特定的样本容量分配,以便在这两个目的之间做一些妥协。

四、多变量情况下样本量在各层的分配

一次抽样调查中调查项目或指标可能不止一个。因此,往往总样本量对某个指标的最优分配不一定也是对其它指标的最优分配,有时会出现相互矛盾的情况。因此对于一个含有多变量的调查来说,需要找到一种折中的分配方案。

(一)比例分配

在分层随机抽样中,当一项调查含有多个指标时,最简单的一种样本量的分配方式就是比例分配。由于比例分配并不涉及具体的指标,并且此时总体总量和总体均值的估计都是自加权的,不但形式简单,而且数据处理也相对容易,并且在多数情况下都能得到比较令人满意的结果,所以此时这种分配方式是可取的。

(二)各指标最优分配平均法

该方法的基本思想是先在众多的指标中,选择最重要的K 个,分别按最优分配原则计算出各层应分配的样本量jh n ,然后求其平均值:

1

1K

h jh

j n n K

==

由于各指标之间一般具有较高的相关性,因此,各指标的最优分配结果悬殊不会太大。

考虑到在计算最优分配时还受到h S 估计误差的影响,因此,在实际中这样处理就可以了。

(三)查特吉(Chatterjee )折中方法(1967年)

假定经过挑选后,有K 个主要指标,jh n 为第j 个指标在第h 层按最优分配的样本量,n 为第h 层应分配的样本量,查特吉提出折中的办法是:

h n n

=

查特吉法与平均法的结果很接近,它们都是在诸jh n 中进行折中。若jh n 间相差很大,不能明显的折中,此时,需建立一些准则来确定各层样本量的分配。

(四)耶茨(Yates )方法

这种方法应用于有一个特定目的的调查,这种调查中由于估计量给定的误差所引起的损失是可以用钱或效用来衡量的。把总的预期损失L 看作估计量的方差的线性函数:

,1

()

K

j

j st j L a

V y ==

则可进一步经过变换,推导出结论为:

1

(/

h h

h h n n

W

A ==∑,

1

1

1(/L

L

h h h h W A n W A L

===

∑,

h A =

其中:2jh

S

是第j 个指标在第h 层的方差;j a 为系数;,j st y 是第j 个指标的总体均值估计量。

由于比例分配的样本是自加权的,因此,其估计量及其方差的确定形式都较最优分配时

更为简便。但如果各层的因子/

h S 之间差异很大时,最优分配将会比比例分配更为有

效。然而,由于方差对于分配中发生的小的甚至是中等的变动并不敏感,因此,基什(L K ish ?)

认为在实际中(1)除非各层的因子/h S 之间有实质性的差异,一般不要采用最优分配。否则最优分配多出的效益可能会被加权和特别细致工作的额外花费所抵消。一般来说,

要好几倍的差异才值得做最优分配。若/

h S 的几个值大致相等,就要用比例分配。(2)

最优分配往往不是估计比例值的经济方法,因为比例的标准差等于

,它们对于

0.1到0.9之间变动的h P 值是不敏感的。(3)应用最优分配时,在实践上要避免使抽样比成为复杂的分数。(4)很多潜在的效益常常只需使用一些不同的抽样比就可以得到。有时只用两个抽样比就可以取得大部分的效益,对绝大多数元素采用一个低抽样比,而对一个只包含大元素的特殊层则采用一个高抽样比。有时,甚至可使这些特殊层能被当然的选入样本(即使其抽样比为1),以完全排除它对抽样误差的影响。

【参考文献】

[]1金勇进,杜子芳,蒋研.抽样技术[]M .北京:中国人民大学出版社,2008.

[]2冯士雍,倪加勋,邹国华.抽样调查理论与方法[]M

.北京:中国统计出版社,1998.

[]3倪加勋.抽样调查[]M .大连:东北财经大学出版社,1994. []4????美W.G.科克伦.抽样技术[]M .张尧庭译.北京:中国统计出版社,1985. []5谢邦昌.抽样调查的理论及其应用方法[]M .北京:中国统计出版社,1998.

抽样技术期末试卷

抽样技术期末试卷

一、选择题(每题2分,共20分) 1.抽样调查的根本功能是( ) A. 获取样本资料 B. 计算样本资料 C . 推断总体数量特征 D. 节约费用 2.概率抽样与非概率抽样的根本区别是( ) A.是否能保证总体中每个单位都有完全相同的概率被抽中 B.是否能保证总体中每个单位都有事先已知或可以计算的非零概率被抽中 C.是否能减少调查误差 D.是否能计算和控制抽样误差 3. 与简单随机抽样进行比较,样本设计效果系数Deff >1表明( ) A.所考虑的抽样设计比简单随机抽样效率低 B.所考虑的抽样设计比简单随机抽样效率高 C.所考虑的抽样设计与简单随机抽样效率相同 D.以上皆对 4.优良估计量的标准是() A.无偏性、充分性和一致性 B.无偏性、一致性和有效性 C. 无误差性、一致性和有效性 D. 无误差

性、无偏性和有效性 4.某乡欲估计今年的小麦总产量进行调查,已知去年的总产量为12820吨,全县共123个村,抽取13个村调查今年的产量,得到63.118=y 吨,这些村去年的产量平均为21.104=x 吨。试采用比率估计方法估计今年该地区小麦总产量( ) A.12820.63 B.14593.96 C.12817.83 D.14591.49 6.抽样标准误差的大小与下列哪个因素无关( ) A .样本容量 B .抽样方式、方法 C .概率保证程度 D .估计量 7.当β为某一特定常数时,比率估计量可看成是比率估计量的特例,此时该常数值为( ) A.1 B.0 C.x y D.x 8.抽样标准误差与抽样极限误差之间的关系是( ) A.θ θ )?(SE = ? B. )?(θ tSE =? C. θ θ )?(tSE = ? D. t SE )?(θ = ? 9.应用比率估计量能使估计精度有较大改进的前提条件是调查变量与辅助变量之间大致成

抽样技术与应用期末复习题

1、 分层抽样的特点是() A 、层内差异小,层间差异大 B 、层间差异小,层内差异大 C 、层间差异小 D 、层内差异大 2、下面的表达式中错误的是() A 、∑=1h f B 、∑=n n h C 、∑=1h W D 、∑=1h N 3、各省电脑体育彩票中奖号码的产生属于() A 、随意抽样 B 、判断抽样 C 、随机抽样 D 、定额抽样 4、抽样调查的根本功能是() A 、获取样本资料 B 、计算样本指标 C 、推断总体数量特征 D 、节约费用 5、最优分配(opt V )、比例分配(prop V )的分层随机抽样与相同样本量的简单随 机抽样(srs V )的精度之间的关系式为() A 、srs prop opt V V V ≤≤ B 、srs opt prop V V V ≤≤ C 、srs opt prop V V V ≥≥ D 、opt prop srs V V V ≤≤ 6、我们想了解学生的视力状况,准备抽取若干学校若干班级的学生进行测试, 则() A 、抽样单位是每一名学生 B 、调查单位一定是每一名学生 C 、调查单位可以是班级 D 、调查单位是学校 7、在分层抽样中,当样本容量n 固定时,能够使得估计量的方差)(st y V 达到最 小的分配方式是() A 、比例分配 B 、等额分配 C 、随机分配 D 、Neyman 分配 8、概率抽样与非概率抽样的根本区别是()

A 、是否能确保总体中的每个单位都有完全相同的概率被抽中 B 、是否能确保总体中的每个单位都有事先已知或可以计算的非零概率被抽中 C 、是否能减少调查性误差 D 、是否能计算和控制抽样误差 9、在抽样的总误差中,属于一致性的误差有() A 、变量误差与估计量偏差 B 、估计量偏差与抽样误差 C 、变量误差与抽样误差 D 、非抽样误差与估计量偏差 10、简单随机抽样、系统抽样、按比例分配的分层抽样三者之间的共同点是() A 、将总体分成几部分,然后按事先确定的规则在各部分抽取 B 、每个个体单元被抽到的可能性都相等 C 、一旦选定了第一个样本单元,则其余所有样本单元即可完全确定 D 、三者没有共同点 11、下面哪种样本量分配方式属于比例分配?() A 、N n N n h h = B 、h L h h h h h h h c S N c S N n n ∑==1 C 、∑==L h h h h h h S N S N n n 1 D 、∑==L h h h h h h S W S W n n 1 12、整群抽样中的群的划分标准为() A 、群的划分尽可能使群间的差异小,群内的差异大 B 、群的划分尽可能使群间的差异大,群内的差异小 C 、群的划分尽可能使群间的差异大,群内的差异大 D 、群的划分尽可能使群间的差异小,群内的差异小 13、群规模大小相等时,总体均值 的简单估计量为() A.∑∑===n i M j ij y nM Y 111?

应用抽样技术期末复习题

抽样调查 一、选择题 1.抽样调查的根本功能是( C ) A. 获取样本资料 B. 计算样本资料 C . 推断总体数量特征 D. 节约费用 2.概率抽样与非概率抽样的根本区别是( B ) A.是否能保证总体中每个单位都有完全相同的概率被抽中 B.是否能保证总体中每个单位都有事先已知或可以计算的非零概率被抽中 C.是否能减少调查误差 D.是否能计算和控制抽样误差 3. 与简单随机抽样进行比较,样本设计效果系数Deff >1表明( A ) A.所考虑的抽样设计比简单随机抽样效率低 B.所考虑的抽样设计比简单随机抽样效率高 C.所考虑的抽样设计与简单随机抽样效率相同 D.以上皆对 4.优良估计量的标准是( B ) A.无偏性、充分性和一致性 B.无偏性、一致性和有效性 C. 无误差性、一致性和有效性 D. 无误差性、无偏性和有效性 5.某乡欲估计今年的小麦总产量进行调查,已知去年的总产量为12820吨,全县共123个村,抽取13个村调查今年的产量,得到63.118=y 吨,这些村去年的产量平均为21.104=x 吨。试采用比率估计方法估计今年该地区小麦总产量( B ) 抽样标准误差的大小与下列哪个因素无关( C ) A .样本容量 B .抽样方式、方法 C .概率保证程度 D .估计量 7.抽样标准误差与抽样极限误差之间的关系是( B ) A.θ θ )?(SE = ? B.)?(θtSE =? C.θθ)?(tSE =? D.t SE )?(θ=? 8.应用比率估计量能使估计精度有较大改进的前提条件是调查变量与辅助变量 之间大致成( A )关系 A.正比例 B.反比例 C.负相关 D.以上皆是 9.能使)2(1)(2 22YX X Y lr S S S n f y V ββ-+-=达到极小值的β值为( B ) A.YX X Y S S S ? B.2X YX S S C.2Y YX S S D.X YX S S 2 10.( B ) 是总体里最小的、不可再分的单元。 A.抽样单元 B.基本单元 C.初级单元 D.次级单元 11. 下面哪种抽样方法是最简单的概率抽样方法( A )。 A.简单随机抽样 B.分层随机抽样 C.系统抽样 D.整群抽样 12. 下面关于各种抽样方法的设计效应,表述错误的是( B )。 A.简单随机抽样的deff=1 B.分层随机抽样的deff ﹥1 C.整群随机抽样的deff ﹥1 D.机械随机抽样的deff ≈1 13. 假设考虑了有效回答率之外所有其他因素后的初始样本量为400,而预计有

抽样技术习题.doc

1.请列举一些你所了解的以及被接受的抽样调查。 2.抽样调查基础理论及其意义; 3.抽样调查的特点。 4.样本可能数目及其意义; 5.影响抽样误差的因素; 6.某个总体抽取一个n=50的独立同分布样本,样本数据如下: 567 601 665 732 366 937 462 619 279 287 690 520 502 312 452 562 557 574 350 875 834 203 593 980 172 287 753 259 276 876 692 371 887 641 399 442 927 442 918 11 178 416 405 210 58 797 746 153 644 476 1)计算样本均值y与样本方差s2; 2)若用y估计总体均值,按数理统计结果,y是否无偏,并写出它的方差表达式; 3)根据上述样本数据,如何估计v(y)? 4)假定y的分布是近似正态的,试分别给出总体均值μ的置信度为80%,90%,95%,99%的(近似)置信区间。

一判断题 1 普查是对总体的所有单元进行调查,而抽样调查仅对总体的部分单元进行调查。 2 概率抽样就是随机抽样,即要求按一定的概率以随机原则抽取样本,同时每个单元被抽中的概率是可以计算出来的。 3 抽样单元与总体单元是一致的。 4 偏倚是由于系统性因素产生的。 5 在没有偏倚的情况下,用样本统计量对目标量进行估计,要求估计量的方差越小越好。 6 偏倚与抽样误差一样都是由于抽样的随机性产生的。 7 偏倚与抽样误差一样都随样本量的增大而减小。 8 抽样单元是构成抽样框的基本要素,抽样单元只包含一个个体。 9 抽样单元可以分级,但在抽样调查中却没有与之相对应的不同级的抽样框。 10 总体目标量与样本统计量有不同的意义,但样本统计量它是样本的函数,是随机变量。 11 一个抽样设计方案比另一个抽样设计方案好,是因为它的估计量方差小。 12 抽样误差在概率抽样中可以对其进行计量并加以控制,随着样本量的增大抽样误差会越来越小,随着n越来越接近N,抽样误差几乎可以消除。 13 抽样误差越小,说明用样本统计量对总体参数进行估计时的精度越低。 14 样本量与调查费用呈现线性关系,但样本量与精度却呈非线性关系。 15 精度和费用也是评价抽样设计方案优劣的两条准则。 16 简单随机抽样时每个总体单元都有非零的入样概率,但每个总体单元的入样概率是不同的。 17 当总体N很大时,构造一个包含所有总体单元名单的抽样框是有局限性的,这也是简单随机抽样的局限性。 18 设N=872,n=10。利用随机数字表抽取一个简单随机样本如下:128 157 506 455 127 789 867 954 938 622 19 设N=678 n=5 利用随机数字表抽取一个简单随机样本如下:556 485 098 260 485 20 在实际工作中,如果抽样比接近于1时,人们会采用全面调查 二填空题 1 抽样比是指( ),用( )表示。 2 偏倚为零的估计量,满足( ),称为( )。 3 简单随机抽样的抽样误差等于( )。 4 简单随机抽样时重复抽样的抽样误差等于( ) 5 抽样时某一总体单元在第m次被选入样本的概率是( ) 6 简单随机抽样时总体单元被选入样本的概率是( ) 7 某一样本被选中概率是( )。 8 大数定理是指( )的规律性总是在大量( )的观察中才能显现出来,随着观察次数( )的增大,( )影响将互相抵消而使规律性有稳定的性质。 9 中心极限定理证明了当( )增大时,观察值的均值将趋向于服从( ),即不论( )服从什么分布,在观察值足够多时其均值就趋向( )分布。 10 抽样调查的核心是估计问题,选择估计量的标准是( ) ( ) ( )。 三简答题

抽样技术简答题及答案

抽样技术各类简答题参考答案 习题一 1.请列举一些你所了解的以及被接受的抽样调查。 略 2. 抽样调查基础理论及其意义; 答:大数定律,中心极限定理,误差分布理论,概率理论。 大数定律是统计抽样调查的数理基础,也给统计学中的大量观察法提供了理论和数学方面的依据;中心极限定理说明,用样本平均值产生的概率来代替从总体中直接抽出来的样本计算的抽取样本的概率,为抽样推断奠定了科学的理论基础;认识抽样误差及其分布的目的是希望所设计的抽样方案所取得的绝大部分的估计量能较好的集中在总体指标的附近,通过计算抽样误差的极限是抽样误差处于被控制的状态;概率论作为数学的一个分支而引进统计学中,是统计学发展史上的重要事件。 3.抽样调查的特点。 答:1)随机抽样;2)以部分推断总体;3)存在抽样误差,但可计算,控制;4)速度快、周期短、精度高、费用低;5)抽样技术灵活多样;6)应用广泛。 4.样本可能数目及其意义; 答:样本可能数目是在容量为N的总体中抽取容量为n的样本时,所有可能被抽中的不同样本的个数,用A表示。 意义:正确理解样本可能数目的概念,对于准确理解和把握抽样调查误差的计算,样本统计量的抽样分布、抽样估计的优良标准等一系列理论和方法问题都有十分重要的帮助。 5. 影响抽样误差的因素; 答:抽样误差是用样本统计量推断总体参数时的误差,它属于一种代表性误差,在抽样调查中抽样误差是不可避免的,但可以计算,并且可以被控制在任意小的范围内;影响 抽样误差的因素:1)有样本量大小,抽样误差通常会随着样本量的大小而增减,在某 些情形下,抽样误差与样本量大小的平方根成反比关系;2)所研究现象总体变异程度 的大小,一般而言,总体变异程度越大则抽样误差可能越大;3)抽样的方式方法, 如放回抽样的误差大于不放回抽样,各种不同的抽样组织方式也常会有不同的抽样误 差。 在实际工作中,样本量和抽样方式方法的影响是可以控制的,总体变异程度虽不可以 控制,但却可通过设计一些复杂的抽样技术而将其影响加以控制。 习题二 三简答题 1 概率抽样与非概率抽样的区别 答:概率抽样是指在抽取样本单元时,每个总体单元有一个非零的入样概率,并且样本单元的抽取应遵循一定的随机化程序。 2 普查与抽样调查的区别 答:普查是对总体的所有单元进行调查;抽样调查仅对总体中的部分单元进行调查。 3何谓抽样效率,如何评价设计效果? 答:两个抽样方案的抽样方差之比为抽样效率。当某个估计量的方差比另一估计量的方差小时,则称方差小的估计量效率比较高,因方差的大小与样本容量有直接的关系,因此比

应用抽样技术期末试卷

一、选择题(每题2分,共20分) 1.抽样调查的根本功能是( ) A. 获取样本资料 B. 计算样本资料 C . 推断总体数量特征 D. 节约费用 2.概率抽样与非概率抽样的根本区别是( ) A.是否能保证总体中每个单位都有完全相同的概率被抽中 B.是否能保证总体中每个单位都有事先已知或可以计算的非零概率被抽中 C.是否能减少调查误差 D.是否能计算和控制抽样误差 3. 与简单随机抽样进行比较,样本设计效果系数Deff >1表明( ) A.所考虑的抽样设计比简单随机抽样效率低 B.所考虑的抽样设计比简单随机抽样效率高 C.所考虑的抽样设计与简单随机抽样效率相同 D.以上皆对 4.优良估计量的标准是( ) A.无偏性、充分性和一致性 B.无偏性、一致性和有效性 C. 无误差性、一致性和有效性 D. 无误差性、无偏性和有效性 5.某乡欲估计今年的小麦总产量进行调查,已知去年的总产量为12820吨,全县共123个村,抽取13个村调查今年的产量,得到63.118=y 吨,这些村去年的产量平均为21.104=x 吨。试采用比率估计方法估计今年该地区小麦总产量( ) A.12820.63 B.14593.96 C.12817.83 D.14591.49 6.抽样标准误差的大小与下列哪个因素无关( ) A .样本容量 B .抽样方式、方法 C .概率保证程度 D .估计量 7.当β为某一特定常数时,比率估计量可看成是比率估计量的特例,此时该常数值为( ) A.1 B.0 C. x y D.x 8.抽样标准误差与抽样极限误差之间的关系是( ) A.θ θ )?(SE = ? B.)?(θtSE =? C.θθ)?(tSE =? D.t SE )?(θ=?

抽样技术期末论文分析

盐城师范学院 抽样调查技术与技能期末论文 题目: 《系统抽样与其他抽样的方法的联系,以及不同抽样方法的效果》 姓名: 崔亚楠 二级学院: 数学科学学院专业: 统计学 班级: 统计学131班学号: 13213205 成绩评定:

引言 1、申明 为处理方便起见,以下只讨论系统抽样,且总是假定N是n的整数倍,即N=nk的情形。在这一情况之下,直线和圆形等距抽样的结果一致,样本量一样,尤其关键的是这可以保证各个单元的入样概率都相等。 2、符号说明 为了方便讨论,将总体的N个单元(实际上是抽样框的N个抽样单元)排列成k行n列,如表1所示。 各符号的含义如下: 总体单元数:N 样本单元数:n Y-+ 第r行第j列的单元变量值:(1) j k r

第r 行对应变量的总体均值 :r Y ?,r Y ?=(1)11j k r n j Y n -+=∑ 第j 列对应的变量的总体均值 :j Y ?,j Y ?=(1)1 1j k r k r Y k -+=∑ 注意表1中主区(上下左右去掉一行或者一列剩余的部分)共有k 行n 列,显然每行都是系统抽样的一个可能样本,所以系统抽样可以看做按简单随机抽样方式(由随机起点的抽法以及牵一发动全身的特性所决定)从k 行中抽取一行,每行被抽中的等概率都等于1/k 这种说法与第2章里关于简单随机抽样为从所有(等概率的)可能样本中随机抽出一个样本的第一种定义是吻合的。 如果表1中的第r 行第j 列的单元变量值改记为rj Y ,则 (1)rj j k r Y Y -+=, r=1,2,…,n; j=1,2,…,n 则表1的内容就将变成表2。 这一变换将导致一系列令人兴奋的结果:如果将每一行的单元视为群,总体由k 个群组成,每个群的大小都是n ,则系统抽样可以看成从k 个群中随机抽取

应用抽样技术期末复习题

抽样调查 一、选择题 1.抽样调查的根本功能是( C ) A. 获取样本资料 B. 计算样本资料 C . 推断总体数量特征 D. 节约费用 2.概率抽样与非概率抽样的根本区别是( B ) A.是否能保证总体中每个单位都有完全相同的概率被抽中 B.是否能保证总体中每个单位都有事先已知或可以计算的非零概率被抽中 C.是否能减少调查误差 D.是否能计算和控制抽样误差 3. 与简单随机抽样进行比较,样本设计效果系数Deff >1表明( A ) A.所考虑的抽样设计比简单随机抽样效率低 B.所考虑的抽样设计比简单随机抽样效率高 C.所考虑的抽样设计与简单随机抽样效率相同 D.以上皆对 4.优良估计量的标准是( B ) A.无偏性、充分性和一致性 B.无偏性、一致性和有效性 C. 无误差性、一致性和有效性 D. 无误差性、无偏性和有效性 5.某乡欲估计今年的小麦总产量进行调查,已知去年的总产量为12820吨,全县共123个村,抽取13个村调查今年的产量,得到63.118=y 吨,这些村去年的产量平均为21.104=x 吨。试采用比率估计方法估计今年该地区小麦总产量( B ) A.12820.63 B.14593.96 C.12817.83 D.14591.49 6.抽样标准误差的大小与下列哪个因素无关( C ) A .样本容量 B .抽样方式、方法 C .概率保证程度 D .估计量 7.抽样标准误差与抽样极限误差之间的关系是( B ) A.θθ )?(SE =? B.)?(θtSE =? C.θθ)?(tSE =? D.t SE )?(θ=? 8.应用比率估计量能使估计精度有较大改进的前提条件是调查变量与辅助变量之间大致成( A )关系 A.正比例 B.反比例 C.负相关 D.以上皆是 9.能使)2(1)(222YX X Y lr S S S n f y V ββ-+-=达到极小值的β值为( B ) A.YX X Y S S S ? B.2X YX S S C.2Y YX S S D.X YX S S 2 10.( B ) 是总体里最小的、不可再分的单元。 A.抽样单元 B.基本单元 C.初级单元 D.次级单元 11. 下面哪种抽样方法是最简单的概率抽样方法( A )。 A.简单随机抽样 B.分层随机抽样 C.系统抽样 D.整群抽样 12. 下面关于各种抽样方法的设计效应,表述错误的是( B )。 A.简单随机抽样的deff=1 B.分层随机抽样的deff ﹥1 C.整群随机抽样的deff ﹥1 D.机械随机抽样的deff ≈1

抽样技术试题

第四章抽样技术概述 班级:姓名:成绩 一、填空题:(21分) 1、抽样调查是一种()调查,它是从所研究客观现象的总体中,按照()抽取()进行调查,以从这一部分单位调查的结果,来()所研究总体的相应数据。 2、随机原则是指在总体中抽取样本单位时,完全排除()意识,保证总体中()单位都有被抽中的同等可能性原则。 3、抽样调查是以()数据推断的()数据。 4、抽样调查产生的(),可以计算并控制, 5、从全及总体中抽取样本单位有()和()两种方法。 6、一般说,不重复抽样的抽样误差()重复抽样的抽样误差。 7、抽样平均误差就是抽样平均数(或抽样成数)与总体平均数(或总体成数)的()。它反映抽样平均数(或抽样成数)与总体平均数(或总体成数)的()。 8、影响抽样误差的主要因素有()、()、()、()。 9、利用样本统计量估计总体参数,通常运用()和()两种方法。 10、点估计是直接用()估计总体参数的推断方法。点

估计不考虑()及()。 11、置信区间反映了参数估计的精确程度,区间愈小,估计就愈();而置信度则反映了总体参数落在置信区间内的( ),置信度愈高,则估计的把握程度就()。 12、影响样本容量大小的因素主要有五种:()、()、()、()、()。 13、区间估计是用样本统计量估计总体参数时,用一个区间范围的值作为总体参数的估计值,并注明总体参数落在这们一个区间的可能性,或称()。我们称这一区间为()。 14、对于简单随机重复抽样,若其他条件不变,则当误差范围缩小一半,抽样单位数必须()倍。若误差范围扩大一倍,则抽样单位数为原来的()。 二、单项选择题:(14分) 1、随机抽样的基本要求是严格遵守() A.、准确性原则B、随机性原则C、代表性原则D、可靠性原则。 2、抽样调查的主要目的是() A.、广泛运用数学的方法B、计算和控制抽样误差C、修正普查的资料D、用样本统计量推算总体参数。 3、在抽样调查中() A.、既有登记性误差,也有代表性误差B、既没有登记性误差,也没有代表性误差C、只有登记性误差,没有代表性误差D、、

《抽样技术》第四版习题答案

第2章 2.1 解:()1 这种抽样方法是等概率的。在每次抽取样本单元时,尚未被抽中的编号 为1~64的这些单元中每一个单元被抽到的概率都是 1100 。 ()2这种抽样方法不是等概率的。利用这种方法,在每次抽取样本单元时,尚未被抽中 的编号为1~35以及编号为64的这36个单元中每个单元的入样概率都是2 100 ,而尚未被抽中的编号为36~63的每个单元的入样概率都是 1100 。 ()3这种抽样方法是等概率的。在每次抽取样本单元时,尚未被抽中的编号为20 000~ 21 000中的每个单元的入样概率都是 1 1000 ,所以这种抽样是等概率的。 2.3 解:首先估计该市居民日用电量的95%的置信区间。根据中心极限定理可知,在大 _ y E y y -= 近似服从标准正态分布, _ Y 的195%α-=的置信区 间为y z y z y y α α??-+=-+? ?。

而()2 1f V y S n -= 中总体的方差2S 是未知的,用样本方差2s 来代替,置信区间 为,y y ?? -+???? 。 由题意知道,_ 2 9.5,206y s ==,而且样本量为300,50000n N ==,代入可以求得 _ 21130050000 ()2060.6825300 f v y s n --= =?=。将它们代入上面的式子可得该市居民日用电量的95%置信区间为7.8808,11.1192????。 下一步计算样本量。绝对误差限d 和相对误差限r 的关系为_ d rY =。 根据置信区间的求解方法可知 _ ___ 11P y Y r Y P αα? ???-≤≥-?≤≥-???? 根据正态分布的分位数可以知道1P Z αα??? ≤≥-???? ,所以()2_2rY V y z α?? ?= ??? 。也就是2 _2 _2 22 /221111r Y r Y S n N z S n N z αα?? ?????? ????? ???-=?=+ ? ????? ?? ???? 。 把_ 2 9.5,206,10%,50000y s r N ====代入上式可得,861.75862n =≈。所以样本量至少为862。 2.4 解:总体中参加培训班的比例为P ,那么这次简单随机抽样得到的P 的估计值p 的方差()()111f N V p P P n N -= --, 在大样本的条件下近 似服从标准正态分布。在本题中,样本量足够大,从而可得P 的195%α- =的置信区间为 2p z p z αα?-+?。 而这里的()V p 是未知的,我们使用它的估计值

抽样技术期末试卷

一、选择题(每题2分,共20分) 1.抽样调查的根本功能是( ) A. 获取样本资料 B. 计算样本资料 C . 推断总体数量特征 D. 节约费用 2.概率抽样与非概率抽样的根本区别是( ) A.是否能保证总体中每个单位都有完全相同的概率被抽中 B.是否能保证总体中每个单位都有事先已知或可以计算的非零概率被抽中 C.是否能减少调查误差 D.是否能计算和控制抽样误差 3. 与简单随机抽样进行比较,样本设计效果系数Deff >1表明( ) A.所考虑的抽样设计比简单随机抽样效率低 B.所考虑的抽样设计比简单随机抽样效率高 C.所考虑的抽样设计与简单随机抽样效率相同 D.以上皆对 4.优良估计量的标准是( ) A.无偏性、充分性和一致性 B.无偏性、一致性和有效性 C. 无误差性、一致性和有效性 D. 无误差性、无偏性和有效性 4.某乡欲估计今年的小麦总产量进行调查,已知去年的总产量为12820吨,全县共123个村,抽取13个村调查今年的产量,得到63.118=y 吨,这些村去年的产量平均为21.104=x 吨。试采用比率估计方法估计今年该地区小麦总产量( ) A.12820.63 B.14593.96 C.12817.83 D.14591.49 6.抽样标准误差的大小与下列哪个因素无关( ) A .样本容量 B .抽样方式、方法 C .概率保证程度 D .估计量 7.当β为某一特定常数时,比率估计量可看成是比率估计量的特例,此时该常数值为( ) A.1 B.0 C. x y D.x 8.抽样标准误差与抽样极限误差之间的关系是( ) A.θ θ )?(SE = ? B.)?(θtSE =? C.θθ)?(tSE =? D.t SE )?(θ=? 9.应用比率估计量能使估计精度有较大改进的前提条件是调查变量与辅助变量之间大致成( )关系

社会调查研究与方法期末考试试题

社会调查研究与方法测试题(一) 一、填空题(每空2分,共34分) 1、社会调查研究方法的理论基础是____________和____________。 2、社会调查研究的基本特征:第一;第二,系统性;第三;第四,实证性;第五。 3、社会调查研究的对象:首先是社会的基本要素,主要是、人口和;另外还有形形色色、种类繁多的具体对象,主要是个人、、社会组织、阶级和阶层、民族、社区、社会行为、等。 4、社会调查研究的基本理论及其理论基础有和。 5、变量间的相互关系是指两个或两个以上变量之间相联系的性质,主要有和_____。 6、概念的具体化和操作化的过程大致分为四个阶段:概念的形成、、选择测量指标、。 7、根据抽取对象的具体方式,抽样可以归纳为与两大类。 二、名词解释(每小题4分,共16分) 1、社会调查研究 2、因果关系 3、测量的信度与效度 4、概率抽样

二、简答题(每小题6分,共24分) 1、社会调查研究有哪些类型? 2、什么是概念间的相关关系? 3、抽样的特点是什么? 三、论述题(共26分) 1、怎样选择社会调查研究的课题?(10分) 2、如何制定社会调查研究的总体方案?(10分)

3、怎样检验测量的信度?(6分)

社会调查研究与方法测试题(二) 一、填空题(每空2分,共32分) 1、问卷调查方法的特点是____________和____________。 2、问卷调查的关键工作是____________。 3、一般访谈是指访谈时要有一套完整的____________,访谈人只需____________和____________即可,无须探讨式的相互商洽。 4、深度访谈是希望通过访谈发现一些____________,此类访谈主要适用于____________研究。 5、社会观察是指有目的地用____________或____________搜集人们各种行为数据资料的方法。 6、文献法的显著特点有:、、。 7、实验法一般包括三个组成部分:自变量与;与对照组(也叫控制组);前测与。 二、名词解释(每小题4分,共20分) 1、文献法 2、问卷法 3、深度访谈法 4、结构式观察法

抽样技术期末试卷word精品

一、选择题(每题2分,共20分) 1?抽样调查的根本功能是( ) A. 获取样本资料 B.计算样本资料 C .推断总体数量特征 D. 节约费用 2?概率抽样与非概率抽样的根本区别是 ( ) A. 是否能保证总体中每个单位都有完全相同的概率被抽中 B. 是否能保证总体中每个单位都有事先已知或可以计算的非零概率被抽中 C. 是否能减少调查误差 D. 是否能计算和控制抽样误差 3. 与简单随机抽样进行比 较,样本设计效果系数 Deff >1表明( ) A. 所考虑的抽样设计比简单随机抽样效率低 B. 所考虑的抽样设计比简单随机抽样效率高 C. 所考虑的抽样设计与简单随机抽样效率相同 D. 以上皆对 4?优良估计量的标准是( ) A.无偏性、充分性和一致性 B.无偏性、一致性和有效性 C.无误差性、一致性和有效性 D.无误差性、无偏性和有效性 4?某乡欲估计今年的小麦总产量进行调查, 已知去年的总产量为 12820吨,全县共123个村, 抽取13个村调查今年的产量,得到y =118.63吨,这些村去年的产量平均为 乂 =104.21吨。 试采用比率估计方法估计今年该地区小麦总产量( ) A.12820.63 B.14593.96 C.12817.83 D.14591.49 6 ?抽样标准误差的大小与下列哪个因素无关( ) A .样本容量 B .抽样方式、方法 C .概率保证程度 7?当1为某一特定常数时,比率估计量可看成是比率估计量的特例 A.1 B.0 C.) D. X X 8. 抽样标准误差与抽样极限误差之间的关系是 ( ) 代一也 B ?一tSEE C-轄 D .估计量 ,此时该常数值为(

《抽样技术复习题》

《抽样技术》期末复习 1、设计效应(Deff ) 答:设计效应(deff )是由基什提出的,用来对不同抽样方法进行比较,其定义为:srs V(y)deff V (y) =,其中srs V (y)为不放回简单随机抽样简单估计量的方差;V(y)为某个抽样设计在同样样本量条件下估计量的方差。设计效应的定义就是将某个抽样设计的估计量的方差与同样样本量条件下的不放回简单随机抽样简单估计量的方差进行比较。如果deff < 1,则所考虑的抽样设计比简单随机抽样的效率高;反之,如果deff > 1,则所考虑的抽样设计比比简单随机抽样的效率低。 deff 对复杂抽样时确定样本量有很大作用,在一定精度条件下,简单随机抽样所需的样本量n '比较容易得到,如果可以估计复杂抽样的deff ,那么复杂抽样所需的样本量为: n = n deff '?。 2、概率抽样 答:概率抽样也称随机抽样。概率抽样就是使总体中的每一个单位都有一个已知的、不为零的概率进入样本的抽样方法。 具体说来,概率抽样具有以下几个特点:(1)按一定的概率以随机原则抽取样本。(2)每个单元被抽中的概率是已知的,或是可以计算出来的。(3)当用样本对总体目标量进行估计时,要考虑到该样本(或每个样本单元)被抽中的概率。也就是说,估计量不仅与样本单元的观测值有关,也与其入样概率有关。 概率抽样最主要的优点是,可以依据调查结果计算抽样误差,从而得到对总体目标量进行推断的可靠程度。从另一方面讲,也可以按照要求的精确度,计算必要的样本单元数目。 因此,概率抽样可以排除调查者的主观影响,抽选出较其他方法更具代表性的样本。 3、非抽样误差 答:非抽样误差是指除了抽样误差以外的,由于各种原因引起的误差。同抽样误差相

抽样技术与应用期末复习题

一、选择题 1、 分层抽样的特点是() A 、层内差异小,层间差异大 B 、层间差异小,层内差异大 C 、层间差异小 D 、层内差异大 2、下面的表达式中错误的是() A 、∑=1h f B 、∑=n n h C 、∑=1h W D 、∑=1h N 3、各省电脑体育彩票中奖号码的产生属于() A 、随意抽样 B 、判断抽样 C 、随机抽样 D 、定额抽样 4、抽样调查的根本功能是() A 、获取样本资料 B 、计算样本指标 C 、推断总体数量特征 D 、节约费用 5、最优分配(opt V )、比例分配(prop V )的分层随机抽样与相同样本量的简单随 机抽样(srs V )的精度之间的关系式为() A 、srs prop opt V V V ≤≤ B 、srs opt prop V V V ≤≤ C 、srs opt prop V V V ≥≥ D 、opt prop srs V V V ≤≤ 6、我们想了解学生的视力状况,准备抽取若干学校若干班级的学生进行测试, 则() A 、抽样单位是每一名学生 B 、调查单位一定是每一名学生 C 、调查单位可以是班级 D 、调查单位是学校 7、在分层抽样中,当样本容量n 固定时,能够使得估计量的方差)(st y V 达到最 小的分配方式是() A 、比例分配 B 、等额分配 C 、随机分配 D 、Neyman 分配 8、概率抽样与非概率抽样的根本区别是() A 、是否能确保总体中的每个单位都有完全相同的概率被抽中 B 、是否能确保总体中的每个单位都有事先已知或可以计算的非零概率被抽中 C 、是否能减少调查性误差 D 、是否能计算和控制抽样误差 9、在抽样的总误差中,属于一致性的误差有() A 、变量误差与估计量偏差 B 、估计量偏差与抽样误差 C 、变量误差与抽样误差 D 、非抽样误差与估计量偏差 10、简单随机抽样、系统抽样、按比例分配的分层抽样三者之间的共同点是() A 、将总体分成几部分,然后按事先确定的规则在各部分抽取 B 、每个个体单元被抽到的可能性都相等 C 、一旦选定了第一个样本单元,则其余所有样本单元即可完全确定 D 、三者没有共同点

抽样技术简答题及答案.doc

1 抽样技术各类简答题参考答案 习题一 1.请列举一些你所了解的以及被接受的抽样调查。 略 2. 抽样调查基础理论及其意义; 答:大数定律,中心极限定理,误差分布理论,概率理论。 大数定律是统计抽样调查的数理基础,也给统计学中的大量观察法提供了理论和数学方面的依据;中心极限定理说明,用样本平均值产生的概率来代替从总体中直接抽出来的样本计算的抽取样本的概率,为抽样推断奠定了科学的理论基础;认识抽样误差及其分布的目的是希望所设计的抽样方案所取得的绝大部分的估计量能较好的集中在总体指标的附近,通过计算抽样误差的极限是抽样误差处于被控制的状态;概率论作为数学的一个分支而引进统计学中,是统计学发展史上的重要事件。 3.抽样调查的特点。 答:1)随机抽样;2)以部分推断总体;3)存在抽样误差,但可计算,控制;4)速度快、周期短、精度高、费用低;5)抽样技术灵活多样;6)应用广泛。 4.样本可能数目及其意义; 答:样本可能数目是在容量为N的总体中抽取容量为n的样本时,所有可能被抽中的不同样本的个数,用A表示。 意义:正确理解样本可能数目的概念,对于准确理解和把握抽样调查误差的计算,样本统计量的抽样分布、抽样估计的优良标准等一系列理论和方法问题都有十分重要的帮助。 5. 影响抽样误差的因素; 答:抽样误差是用样本统计量推断总体参数时的误差,它属于一种代表性误差,在抽样调查中抽样误差是不可避免的,但可以计算,并且可以被控制在任意小的范围内;影响抽样误差的因素:1)有样本量大小,抽样误差通常会随着样本量的大小而增减,在某些情形下,抽样误差与样本量大小的平方根成反比关系;2)所研究现象总体变异程度的大小,一般而言,总体变异程度越大则抽样误差可能越大;3)抽样的方式方法,如放回抽样的误差大于不放回抽样,各种不同的抽样组织方式也常会有不同的抽样误差。 在实际工作中,样本量和抽样方式方法的影响是可以控制的,总体变异程度虽不可以控制,但却可通过设计一些复杂的抽样技术而将其影响加以控制。 习题二 三简答题 1 概率抽样与非概率抽样的区别 答:概率抽样是指在抽取样本单元时,每个总体单元有一个非零的入样概率,并且样本单元的抽取应遵循一定的随机化程序。 2 普查与抽样调查的区别 答:普查是对总体的所有单元进行调查;抽样调查仅对总体中的部分单元进行调查。

抽样技术期末考试必背公式

需要掌握的公式 1. 均方误差 = 方差 +偏倚的平方 MSE (θ?)= V (θ?)+ B 2(θ?) 2. 如果u α是标准正态分布的双侧分位数(Z α/2) ?()d u S αθ= 3.简单随机抽样的简单估计量 总体均值的简单估计 ∑===n i i y n y Y 11? 总体总量的简单估计 ∑=?=?=i y n N y N Y N Y ?? 总体成数的简单估计 n a p P ==? 总体某种特征单元总数的简单估计 Np A =? 4. 总体均值的置信度为1-α的近似置信区间为 ,y u s y u s αα??-+????? 5.成数的正态近似置信区间 p u p u α α?-+?? (没有进行连续性修正) 6. 成数的样本方差 pq n n s 12-= 7. 给定精度要求为估计量y 的绝对误差限d 是确定样本量 N n n n d S u 002 01n += ?? ? ??=α 8.对分层随机抽样: h h st st h h st st y N y N Y y W y Y ∑==∑==??

9. 比例分配 n W n h h ?= 9. 不考虑费用的最优分配,也叫奈曼分配 n S W S W n h h h h h ?∑= 10. 线性费用函数下最优分配: n C S W C S W n h h h h h h h ?∑=// 11. 整群抽样总体(样本)均值:+群间方差公式 M y n y y Y i ===? 12. 整群抽样设计效应 22() 1(1)()b C srs S V y deff M V y S ρ==≈+- 13.比估计量 x y R =? X x y X R Y R ?==?? X x y X R Y R ?==?? 14. 回归估计——差估计β0=1 d d d d y N Y x X y y Y =-+==?? 15.回归估计——样本回归系数b 2?) ()(?x yx lr lr lr lr s s b y N Y X x b y x X b y y Y ==--=-+==

《抽样技术》试题(一)

《抽样调查》试卷D 一、判断改错 1.在抽样调查的实践中,为降低抽样误差,可以考虑缩小总体方差或扩大样本量。() 2.欲对一批成品的合格率进行抽样调查,已知在前两次的全面调查中,其 合格率分别为p 1=90%、p 2 =80%,则本次调查应根据p 1 确定样本量。() 3.在总体容量充分大时,放回抽样和不放回抽样的估计误差相差无几。() 4.整群抽样可以被理解为是第一阶段抽样比为100%时的一种特殊的两阶段抽样。() 5.分层抽样可以被理解为是第一阶段抽样比为100%时的一种特殊的两阶段抽样。() 6.比估计与回归估计优于简单估计的条件是调查变量与辅助变量间的相关系数大于1/2。() 7.二重分层抽样在效果上优于普通分层抽样。()8.当总体方差未知时,可用样本方差代替以确定必要样本量。()9.抽样分布就是指样本的分布。()10.利用随机数表既可以实施等概率抽样,也可以实施不等概率抽样。() 二、简述题 1.试述抽样调查的误差及其种类; 2.试述怎样分层才能有效提高精度; 3.找一个完整的抽样框通常是不容易的。在下述调查中可以试用什么样的

抽样框? (1)调查一个大城市中卖皮箱的商店; (2)调查失落在公共汽车上的东西的种类; (3)调查去年被蛇咬过的人数; (4)调查估计每周家庭成员用于看电视的总时数。 三、应用题 请将下述按由小到大顺序排列的20个单位标志值调整为按顺逆交替方式排列,并以k=2为起点等距抽选出4个单位组成样本,然后与在原排序方式下按上述要求所抽选的等距样本进行比较,看其在抽样误差方面有什么变化。 21 21 28 29 30 32 32 32 34 35 35 36 37 38 40 45 46 46 48 50

通信原理期末考试试题及答案二

1、已知某数字传输系统传送二进制码元的速率为1200B/s ,码元等概率出现,该系统的信息速率为 1200bit/s ;若该系统改成传送16进制信号码元,码元等概率出现,码元速率为2400B/s ,则这时的系统信息速率为 9600bit/s 。 2、已调波00()5cos cos 5sin sin m m s t t t t t ωωωω=?±?是 SSB 调幅方式。其调制信号f(t)为5cos m w t ,载波C(t)=0cos w t 。解调时,相干载波为0cos w t 时,可解调恢复原信号。 3、同步技术包括 载波同步 、 码元同步 、 群同步 、 网同步 。 4、4个独立信源的最高频率分别为1 kHz 、1 kHz 、2 kHz 、2 kHz ,采用时分复用方式进行传输,每路信号均采用8位二进制数PCM 编码。该系统中满足抽样定理的最小抽样频率为4KHz ,一帧中包含 4 路抽样信号集,每个时隙占有的时间宽度为 62.5微秒 ,每个码元宽度为 7.8125微秒 ,码元传输速率为 128Kb/s 。 5、PSK 系统的基带调制信号码型为 双极性非归零 码型,波形为 方波 ,PSK 信号相当于模拟调制的 DSB 或 相位 调制方式,传输带宽为 2Rb 。 二、选择题(每题3分,共计30分。) 1.真正客观地反映数字通信系统有效性的指标是(C ) A.数据传信速率R B.符号速率N C.频带利用率η D.以上三项均可 2.满足抽样定理时低通型信号的抽样频率应选为(D ) A.f s ≥f m B.f s =2f m C.f s <2f m D.f s ≥2f m 3.均匀量化是(D ) A.大小信号的量化间隔相同 B.量化区内均分N 等分 C.所有的量化误差相同 D.大小信号的量化间隔相同和量化区内均分N 等分 4.编码码位数l 越大,则(A ) A.量化误差越小,信道利用率越低 B.量化误差越大,信道利用率越低 C.量化误差越小,信道利用率越高 D.量化误差越大,信道利用率越高 5.A 律13折线编码器输出的码型是(A )

抽样技术A卷答案

抽样技术A 卷答案 一、单项选择题(本大题共5道小题,每题2分,共10分) 下列各题A)、B )、C )、D )四个选项中,只有一个选项是正确的。 1.下面四个关系式中哪一个是正确的?(A ) A.()() ()2 MSE x V x B E x =+ B.()V x =() MSE x +()2 B E x C.()MSE x =()V x +() B E x D.()2 B E x =()MSE x +()V x 2.(B )是总体里最小的、不可再分的单元。 A.抽样单元 B.基本单元 C.初级单元 D.次级单元 3.下面哪种抽样方法是最简单的概率抽样方法(A )。 A.简单随机抽样 B.分层随机抽样 C.系统抽样 D.整群抽样 4.抽样比的计算公式为(B )。 A.() ()11f n N =-- B.f n N = C.()1f n N =- D.()f N n N =- 5.关于简单随机抽样的核心定理,下面表达式正确的是(A )。 A.() 21f V y S n -= B.()211f V y S n -=- C.()21V y S n = D.() 2 1f V y s n -= 6. 下面关于各种抽样方法的设计效应,表述错误的是(B )。 A.简单随机抽样的deff=1 B.分层随机抽样的def f ﹥1 C.整群随机抽样的def f ﹥1 D.机械随机抽样的def f ≈1 7.假设考虑了有效回答率之外所有其他因素后的初始样本量为400,而预计有效回答率为80﹪,那么样本量则应定为(B )。 A.320 B.500 C.400 D.480 8.在要求的精度水平下,不考虑其他因素的影响,若简单随机抽样所需要的样本量为300,分层随机抽样的设计效应deff=0.8,那么若想达到相同的精度,分层随机抽样所需要的样本量为(C )。 A.375 B.540 C.240 D.360 9.分层抽样设计效应满足(B )。 A.1deff = B.1deff C.1deff ≈ D.1deff 10.下面哪种样本量分配方式属于比例分配?(A ) A. h h n n N N = B.h n n = 1 h h N S =∑ C. h n n =1 h h L h h h N S N S =∑ D. h n n =1 h h L h h h W S W S =∑ 二、多项选择题(每题3分,共15分) 下列各题A )、B )、C )、D )、E )五个选项中,至少有两个答案是正确的 11.常用的构造估计量的方法有(AC )。

相关主题
文本预览
相关文档 最新文档