当前位置:文档之家› 《社会调查研究方法》 第六章 抽样

《社会调查研究方法》 第六章 抽样

《社会调查研究方法》 第六章 抽样
《社会调查研究方法》 第六章 抽样

《社会调查研究方法》第六章抽样在社会研究中,最常见的总体是由社会中

的某些个人组成的,这些个人便是构成总体

的元素,比如,当我们对某省大学生的择业

倾向进行研究和探讨时,该省所有在校大学

生的集合就是我们研究的总体,而每一个在

校大学生便是构成总体的元素。又比如,

我们打算研究某城市居民的家庭生活质量,

那么,该市所有的居民家庭就构成我们研究

的总体,而其中的每一户家庭都是这个总体

中的一个元素。

样本(sample)就是从总体中按一定方式

抽取出的一部分元素的集合。或者说,一个

样本就是总体的一个子集。比如,从某省总

数为12.8万人的大学生总体中,按一定方

式抽取出1 000名大学生进行调查,这1 000名大学生就构成该总体的一个样本(当然,从一个总体中可以抽取出若干个不同的样

本)。在社会研究中,资料的收集工作往往

是在样本中完成的。

明白了总体和样本的概念,再来理解抽样

的概念就十分容易了。

。比如,从3 000名工人所构成的总体中,按一定方式抽取200名工人的过程;或者从1 000户家庭构成的总体中,

按一定方式抽取一个由100户家庭构成的样

本的过程,都叫做抽样。

。比如,上面所举的例子中,单个的大学

生既是构成某省12.8万名大学生这一总体

的元素,又是我们从总体中一次直接抽取出

1000名大学生的样本时所用的抽样单位;但

是,当我们从这一总体中一次直接抽取出40个班级,而以这40个班级中的全部学生(假定正好1000名)作为我们的样本时,抽样单

位(班级)与构成总体的元素(学生)就不是一样的了。

。比如,从一所中学的全体学

生中,直接抽取200名学生作为样本,那么,

这所中学全体学生的名单就是这次抽样的

抽样框;如果是从这所中学的所有班级中抽

取部分班级的学生作为调查的样本,那么,

此时的抽样框就不再是全校学生的名单,而

是全校所有班级的名单了。因为此时的抽样

单位已不再是单个的学生,而是单个的班级

了。

。在统计中最常见的总体值是某一变量的平均值,比如,某市待业青年的平均年龄、

某厂工人的平均收入等等,它们分别是关于

某市待业青年这一总体在年龄这一变量上

的综合描述,以及某厂工人这一总体在收入

这一变量上的综合描述。需要说明的是,总

体值只有通过对总体中的每一个元素都进

行调查或测量才能得到。

。样本值是从样本的所有元素中计算出来的,它是相应的总体值的估计量。比如,样

本的平均值就是通过对样本中的每一个元

素进行调查或测量后计算出来的,它是相应

的总体平均值的估计量。抽样的目的之一,

就是要通过这些样本值去估计和推断各种

总体值。由于从一个相同的总体中可以根据

不同的抽样设计得到若干个不同的样本,所

以,从每一个样本中所得到的估计量,都只

是总体的许多个可能的估计量中的一个。抽

样设计的目标,就是尽可能使所抽取的样本

的估计量接近总体的参数值。

从抽样的定义中不难看出,抽样主要涉及和处理有关总体与部分之间的关系问题。

实际上,抽样早就在人们的日常认识活

动中发挥着这种作用。抽样的基本思想或基本逻辑早就被人们自觉或不自觉地运用着。比如厨师在做菜时,常常从一大锅汤中舀一勺汤尝一尝,以便知道整锅汤的味道如何;顾客在买米时,往往先从一大袋米中随手抓一把看看,便知道这批米的质量好不好;医生只要从病人身上抽取很少的一点血液,便可以了解病人全部血液的各种情况。当然,抽样方法更广泛地应用在各种形式的社

会科学研究、自然科学研究,以及生产、销售等经济活动中。例如,对社会热点问题进行民意测验、对不同水稻品种的产量进行估计、对各种商品的质量进行检验或评比,都少不了抽样方法的运用和帮助在社会研究中,抽样主要解决的是对象的选取问题,即如何从总体中选出一部分对象作为总体的代表的问题。本章一开始我们就说过,一项社会研究若能对总体中的全部个体都进行了解,那当然是很好的。但实际上广大研究人员常常会在时间、经费、人力等方面遇

到难题,甚至陷入困境,从而不得不在庞大

的总体与有限的时间、人力、经费之间寻求

平衡。

可以说,抽样方法是架在

研究者十分有限的人力、财力、时间与庞杂、

广阔、纷繁、多变的社会现象之间的一座桥

梁。有了它的帮助,研究者可以方便地从较

小的部分达到很大的整体。

为了综合地说明抽样所具有的神话般的

作用,我们来看一个实际的例子。

1984年11月,罗纳德?里根以59%比4l%的优势当选为美国新一任总统。

正式投票选举的前夕,一些政治民意测验

机构就已根据他们抽样的结果预言了里根

的胜利。表6—1就是美国的一些全国性的

民意测验机构在10月底或11月初所作出的预测结果与实际投票结果的比较。

表6-1 1984年美国总统选举预测与实际

结果比较(%)

从表6—1中可以看出,尽管各种民意测

验的结果互不相同,但是,他们一方面都正

确地预言了谁将获胜;另一方面,他们所预

言的结果基本上都是紧紧围绕在实际投票

结果的周围。那么,在将近1亿的美国选民中,他们究竟调查了多少人就得到这种结果

的呢?他们的调查对象还不到2 000人!这就是抽样所具有的力量和效率。

根据抽取对象的具体方式,我们把抽样分

为各种不同的类型。从大的方面看,各种抽

样都可以归为两大类。这是两种有着本质区别的抽样类型。

。本章的大部分内容将主要涉及概率抽样的方法,因为它

是目前用得最多、也是最有用处的抽样类

型。而对于非概率抽样方法的介绍只占很小

的篇幅。

在概率抽样与非概率抽样这两大类中,还

可细分出若干不同的形式,具体情况见图6

—1。

除了上述几种类型外,实际研究中还有

典型调查、重点调查和个案调查,均属于非

概率抽样的范畴。在第五节再做介绍。

为了理解概率抽样的原理或逻辑,我们需

要对社会群体的同质性与异质性作一点探

讨。社会中由不同的个人所组成的各种各样

的群体、组织、阶层等等,经常构成社会研

究中的总体。如果某个总体中的每一个成员

在所有方面都相同,那么,我们说这个总体

具有百分之百的同质性,在这种情况下,抽

样也就没有必要了。因为只要了解了一个个

体,就可以了解到整个总体的情况。这当然

只是一种十分极端的例子。

。“世上没有两片完全相同的

树叶”,现实社会中更没有两个完全相同的

人。

。而概率样本所要反映的正是总体本身所具有的那种内在的异质性结构。

抽样的最终目的在于通过对样本的统计

值的描述来相对准确地勾画出总体的面貌。

概率抽样的方法可以帮助我们实现这一目

标,并且可以对这种勾画的准确程度作出估

计。随机抽取是这一过程的关键。

。而且,任何一个个体的入选与否,与其他个体毫不相

关,互不影响。或者说,每一个个体的抽取

都是相互独立的,是一种随机事件。为了理

解事件的随机性与事件发生的概率之间的

关系,最好的例子也许是投掷硬币。

对于投掷硬币的结果(总体)来说,只有正面和反面(个体)两种可能。每次投掷硬币相

当于一次抽样过程(从两种可能性中抽取一

种);这种抽样是随机的(两种可能性都可能出现,且出现的机会均等);尽管一次具体的随机抽样(一次投掷)只会有一种结果,或

者说出现某一种情况(正面或反面)的概率为100%;但是若干次不同的抽样的结果,

却总是趋向于两种情况出现的次数各为

50%——即趋向于两种不同结果本身所具

有的概率,或者说趋向于总体内在结构中所

蕴涵的随机事件的概率。这个例子告诉我

们,在各种随机事件的背后,存在着事件发

生的客观概率,正是这种概率决定着随机事

件的发展变化规律。概率抽样之所以能够保

证样本对总体的代表性,其原理就在于它能

够很好地按总体内在结构中所蕴涵的各种

随机事件的概率来构成样本,使样本成为总

体的缩影。

在讨论概率抽样的问题时,应对有关

的问题略作说明。

严格地说,由于研究者在实际抽样中所做

的基本上都是不放回抽样,因而并没有完全

满足抽样的独立性要求。这种独立性要求指

的是:任何一个元素的抽取都不会影响到其

他元素被抽取的概率(这一要求是本书后面

几章中讨论的统计检验所必须依据的假

定)。然而,只要总体相对于样本来说要大

得多,我们就可以忽略这种不放回抽样所产

生的微小改变。因为事实上对于一个相当大

的总体来说,缺少一个元素可以说基本上并

不改变总体中其他众多元素被抽中的概率,

同样的,即使将抽中的元素放回总体中,它

也基本上不会有第二次被抽取的机会。

为了更好地理解概率抽样的原理,有必要

对抽样分布作一简要介绍(更为详细的介绍

可参见各种概率统计教材)。抽样分布是根

据概率的原则而成立的理性分布,它显示

出:从一个总体中不断抽取样本时,各种可

能出现的情况。

我们先来看一个总体为10个个案的平均

数抽样分布。假如这10个人参加工作的年

限分别为6、7、8、9、10、11、12、13、14、15年,那么这一总体中的成员平均参加工作

年限为10.5年。如果我们从总体中随机抽

取一个人作为样本来估计总体的平均数,那

么这种样本的估计可能是6年到15年。全部可能的10个“样本”所得到的估计值可

用图6—2表示。

图6—2 容量为1的样本的抽样分布

这时,抽取任一1个样本的年龄与总体的

实际平均年龄的最大误差为4.5年。

当样本容量为2时我们总共可以抽取45

2

=10×10个不同的样本(根据组合公式计算C9/1×2=45)。这些样本的平均数范围是从

6.5年到14.5年,但其中会产生一些相同

的平均数。比如6年和14年、7年和13年、8年和12年、9年和11年这四个样本的平

均数都是10年。图6—3中,10年那一列的四个点即是这四个样本的平均数。这45个样本的平均数分布如图6—3所示。

图6—3 容量为2的样本的抽样分布

这时,抽取任一组2个样本的年龄与总体

的实际平均年龄的最大误差为4年。

当样本容量增至3时,我们就会得到120个样本(C3

=10× 9×8/1×2×3=120)。这10

些样本的平均数范围是从7年到14年,其中相同的平均数更多。全部样本的平均数分

布如图6—4。

图6—4 容量为3的样本的抽样分布

这时,抽取任一组3个样本的年龄与总体

的实际平均年龄的最大误差为3.5年。

当样本容量继续增大(越来越接近总体的

l/2时),样本平均数的分布会进一步发生变

化。

。从图6—5、图6—6中,我们可以很清楚地看到这种变化(它们分别是样本容量为4和5时的分布)。

图6—5 容量为4的样本的抽样分布

图6—6 容量为5的样本的抽样分布

在概率统计中,有一个对抽样分布十分

有用的“中心极限定理”。这一定理指出:

在一个含有N个元素且平均数为μ、标准差

为σ的总体中,抽取所有可能含有n个元素的样本(根据组合计算全部可能的样本数目n

=N!/(N-n)!n!。若用X,X,…,Nl2为m=C

X。来分别表示这m个样本的平均数,那么,

样本平均数X的分布将是一个随n愈大而愈i

趋于具有平均数μ和标准差σ/?n的正态分布。

这一定理说明:当n足够大时(通常假定大于30),无论总体的分布如何,其样本

平均数所构成的分布都趋于正态分布。它的

形状如图6—7。

这种抽样分布具有的特点,因而其平均数、众数和中位数都相同。这即

是说,图6—6中的μ既是抽样分布的平均

数,也是次数最多的值(众数),而且其两边的样本数相同(即中位数)。还可以证明,全

部样本平均数的平均数正好等于总体的平

均数,即有( )小而全部样本平均数

的标准差(称为标准误差或标准误,记为SE)则等于总体标准差除以而,即

(SE= ) (证明从略)

图6--7 正态分布图

更为重要的是,由于平均数的抽样分布

是正态分布,其平均数的次数就是正态曲线

下的面积。而根据概率统计理论,正态分布

曲线下的任何部分的面积是可以用数学方

法推算的。因此,任何两个数值之间的样本

平均数次数所占的比例是可以求得的。比

如,有68.26%的样本平均数在,u?SE这两个数值的范围内;类似的,大约有95%的样本统计值落在总体参数值正负两个标准误

范围内,即SE;99.9%的样本统计值将落在

总体参数值正负三个标准误范围内,即 ?3SE。在实际应用中,人们更多的是采用

下列几个数字:

有90%落在μ?l.65SE之间;

有95%落在μ?l.96SE之间;

有98%落在μ?l.33SE之间;

有99%落在μ?l.58SE之间。

从反面来考虑这一结论,我们就会有以

下推论:对于任何一次随机抽样来说,其样

本的统计值落在总体参数值正负1.65个标

准误之间的概率是90%;落在总体参数值正

负1.96个标准误之间的概率是95%……我们正是在这种意义上来说明(或把握程度,如90%、95%等等)与(估计范围)之间的关系。

虽然不同的抽样方法具有不同的操作

要求,但它们通常都要经历这样几个步骤。

界定总体就是在具体抽样前,首先对从

中抽取样本的总体范围与界限作明确的界

定。这一方面是由抽样的目的所决定的。因

为抽样虽然只对总体中的一部分个体实施,

但其目的却是为了描述和认识总体的状况

与特征,是为了发现总体中存在的规律性,

因此必须事先明确总体的范围;另一方面,

界定总体也是达到良好的抽样效果的前提

条件。如果不清楚明确地界定总体的范围与

界限,那么,即使采用严格的抽样方法,也

可能抽出对总体严重缺乏代表性的样本来。

在这方面最为著名的例子是1936年美国总统大选的民意测验。总统选举投票前,

《文摘》杂志寄出1000万张询问投票倾向

的明信片,然后依据收回的200万份结果极其自信地预测共和党候选人兰登将以领先

15%的得票率战胜民主党候选人罗斯福而

当选总统。然而,选举结果使预测者们大失

所望:获胜者不是兰登,而是罗斯福,并且

其得票率反超过兰登20%! 《文摘》杂志的

声誉一扫而光,不久就因此而关了门。

是什么原因导致《文摘》杂志的预测失

败了呢?除了抽样方法上的非随机性以及邮

寄方式上的原因外,对抽取样本的总体缺乏

清楚的认识和明确的界定也是极为重要的

原因。因为它当时抽样所依据的并不是美国

全体已登记的选民名单,而是依据电话号码

簿和汽车登记簿来编制抽样框,再从这些号

码中进行抽取的。这样一来,那些没有家庭

电话和私人汽车的选民就被排除在其抽样

的总体之外了。而在当时,由于1933年开始的美国经济大萧条的影响,一方面大量人

口滑落到下等阶层,另一方面,此时的劳动

阶层选民希望选个民主党人当总统,因而很

多人出来投票。结果,这些未被抽到民意测

验中的较穷的选民压倒多数地投了罗斯福

的票,使《文摘》杂志的预测遭到惨败。

这一实例告诉我们,要有效地进行抽样,必须事先了解和掌握总体的结构及各方

面的情况,并依据研究的目的明确地界定总

体的范围。样本必须取自明确界定后的总

体,样本中所得的结果,也只能推广到这种

最初已作出明确界定的总体范围中。

这一步骤的任务就是依据已经明确界定的总体范围,收集总体中全部抽样单位的

名单,并通过对名单进行统一编号来建立起

供抽样使用的抽样框。例如,如果我们要在

某大学进行一项该校大学生职业观的抽样

调查,那么,第一步是要先对总体进行界定。

比如说,本次调查的总体是该大学所有在读

的全日制本科生和研究生。这样,该校那些

专科生、夜大生以及其他一些不符合上述界

定的学生就被排除在总体之外。而制定抽样

框这一步的工作,就是要收集全校各系所有

在读本科生及研究生的花名册,并按一定的

顺序将全部花名册上的名单统一编号,形成

一份完整的、既无重复又无遗漏的总体成员

名单,即抽样框,从而为下一步抽取样本打

下基础。

需要注意的是,当抽样是分几个阶段、

在几个不同的抽样层次上进行时,则要分别

建立起几个不同的抽样框。比如,为了解某

市小学生的学习情况,需要从全市500所小

学中抽取10所小学,再从每所抽中的小学中抽取3个班级,最后从每个抽中的班级中

抽取10名小学生。那么,就要分别收集并

排列全市500所小学的名单、每所抽中的小学里所有班级的名单,以及每个抽中的班级

中所有学生的名单,形成三个不同层次的抽

样框。

从前面有关抽样类型的介绍中,我们已

经了解到具体的抽样方法有好几种。

而从后面几节对这些方法的介绍中我们

将会看到,各种不同的抽样方法都有自身的特点和适用范围。因此,对于具有不同研究目的、不同范围、不同对象和不同客观条件的社会研究来说,所适用的抽样方法也不一样。这就需要我们在具体实施抽样之前,依据研究的目的要求、依据各种抽样方法的特点,以及其他有关因素来决定具体采用哪种抽样方法。除了抽样方法的确定以外,还要根据要求确定样本的规模以及主要目标量的精确程度。

实际抽取样本的工作就是在上述几个

步骤的基础上,严格按照所选定的抽样方法,从抽样框中抽取一个个的抽样单位,构成样本。依据抽样方法的不同,以及依据抽样框是否可以事先得到等因素,实际的抽样工作既可能在研究者到达实地之前就完成,也可能需要到达实地后才能完成。即既可能先抽好样本,再下去直接对预先抽好的对象进行调查或研究;也可能一边抽取样本一边

就开始调查或研究。

例如,若在一所大学中抽取200名学生进行调查,当这所学校的学生总数不是很

大,且很容易弄到全校学生的花名册时,就

可以事先从这份花名册中(即抽样框中)抽取出200名学生的名单;然后等其他准备工

作均已做好,正式开始调查时,再按照事先

已抽好的名单找到这200名学生进行调查。

但当研究的总体规模较大。且抽样是采取多

阶段方式进行时,就得边抽样边调查了。比

如,前述的某市小学生学习情况的课题项

目。虽然500所小学中全体学生的名单并非

完全不能弄到,但其数量实在太大,实际抽

样也十分麻烦。这时往往采取多阶段抽样的

方法。那么,从500所小学中随机抽取10所小学的工作可以事先完成,而从每所抽中

的小学中抽取3个班级,以及从每个抽中的

班级中抽取10名小学生的工作,则往往是

到了实地(即具体小学)后再进行的。

到实地进行抽样时,往往是直接由调查

员按预先制定好的操作方式或具体方法执

行。比如,要抽取居民家庭时,往往是先抽

好居委会,然后制定出具体操作方式:“楼

房按单元抽,一个单元抽一户;平房按排抽,

一排抽一户;两种抽样都采取简单随机抽样的方法,每个调查员随身带20 张写好号码的小纸片装在口袋中,摸到什么

号码就抽取所对应的家庭。”这样,调查员

就可以一边抽样一边调查了。

一般情况下,样本的抽出并不是抽样过

程的结束。完整的抽样过程还应包括样本抽

出后对样本进行的评估工作。所谓样本评

估,就是对样本的质量、代表性、偏差等等

进行初步的检验和衡量,其目的是防止由于

样本的偏差过大而导致的失误。评估样本的

基本方法是:将可得到的反映总体中某些重

要特征及其分布的资料与样本中的同类指

标的资料进行对比。若二者之间的差别很

小,则可认为样本的质量较高,代表性较大;

反之,若二者之间的差别十分明显,那么样

本的质量和代表性就一定不会很高。举例来

说,如果我们从一所有4 000名学生的大学

中抽取200名学生作为样本,同时,我们从

学校有关部门那里得到下列统计资料:全校

男生占学生总数的78%,女生占22%;本省学生占64%,外省学生占36%;那么,我们可以对抽出的200名学生进行这两方面

分布情况的统计。假定样本得到的结果为:

男生占76%,女生占24%;本省学生占67%,外省学生占33%。两相对比,不难发现二者

之间的差距很小,它在一定程度上说明,样

本的质量和代表性较高。从这样的样本中得

到的结果就能较好地反映和体现总体的情

况。当然,用来进行对比的指标越多越好,

各种指标对比的结果越接近越好。

在进行抽样设计时,应遵循一定的原

则。美国著名的抽样专家科什(Kish)教授在其名著《调查抽样》中提出了一个优秀的抽

样设计所应该满足的四条标准。这四条标准

也可以说是进行抽样设计时所应遵循的四

条原则。它们是:

(1)目的性原则;

(2)可测性原则;

(3)可行性原则;

(4)经济性原则。

。以研究的问题为出发点,从最

有利于研究资料的获取,以及最符合研究的

目的等因素来考虑抽样方案和抽样方法的

设计。

。在研究中通常用标准误来表

示。这是统计推断必需的基础,是样本结果

与未知的总体值之间客观、科学的桥梁。通

常,只有概率样本在客观上才是可测的,即

概率样本可以计算出有效的估计值或抽样

变动的近似值。但是,概率抽样也并不自动

保证可测性。比如,从一个具有周期性变化

的总体中选出一个系统样本,就不能保证这

种可测性。

。它意味着研究者所设计的方案能够预料实际抽样过程中可能出现的各种问题,并设计了处理这

些问题的方法。由于在理论上设计抽样方案

和在实际中执行这一方案是两码事,因而可

行性是抽样设计的一条重要标准。

。这种资源主要包括研究的经费、时间、人力等等。

由于这四条标准相互之间存在着一定的

制约关系,甚至会相互冲突,因而在实际设计中,常常存在这样的情况,即研究者很难设计出一个在上述四个原则上同时达到最大值的抽样方案。在更多的情况下,实际的抽样设计就成为研究者在这四条标准中进行取舍和保持平衡的过程。比如说,如果要加强抽样方案的可测性,研究者就应该尽可能加大样本的容量;然而在这样做的时候,却同时又意味着增加抽样所需的资源。这就使得抽样设计的经济性原则进一步减弱。相对而言,这四条标准中,目标定向原则和可行性原则是首要的。抽样设计要服务于研究的目标,这是设计的出发点和基本目的。而可行性则是设计方案得以实现的前提和保证。研究者应该在优先考虑这两条标准的基础上,去进一步增加方案的可测性,同时减少方案所需的资源。

概率抽样是按照概率原理进行的,它要

求样本的抽取具有随机性。前面已经提到,概率抽样有若干种不同的形式,每一种具体的形式有着各自不同的特点。

而在研究中对不同抽样方式的选择将涉

及研究问题的性质、完善的抽样框的获得、

研究经费的多少、样本精确性的要求,以及

资料的收集方法等因素。下面我们就结合这

些因素,对常用的几种概率抽样方法逐一进

行介绍。

简单随机抽样(simple random

sampling)又称纯随机抽样,是概率抽样的

最基本形式。它是按等概率原则直接从含有

N个元素的总体中随机抽取n个元素组成样本(N>n)。常用的办法类似于抽签,即把总

体的每一个单位都编号,将这些号码写在一

张张小纸条上,然后放人一容器如纸盒、口

袋中,搅拌均匀后,从中任意抽取,直到抽

够预定的样本数目。这样,由抽中的号码所

代表的元素组成的就是一个简单随机样本。

比如,某系共有学生300人,系学生会打算采用简单随机抽样的办法,从中抽取出

60人进行调查。为了保证抽样的科学性,他

们先从系办公室那里得到一份全系学生的

名单,然后给名单中的每个学生都编上一个

号(从001到300)。抽样框编好后,他们又

用300张小纸条分别写上001,002,…,300的号码。他们把这300张写好不同号码的小

第六章抽样调查习题答案

第六章抽样调查习题答案 一、单项选择题 1、 C 2、 A 3、 D 4、 D 5、C 6、 D 7、 C 8、 A 9、 D 10、A 11、 D 12、C 13、B 14、 A 15、A 16、 B 17、 B 18、D 19、 A 20、A 21、 A 22、 D 23、 D 24、 B 25、A 二、判断题 1、CD 2、AE 3、BCD 4、ABDE 5、ABD 6、AB 7、ABCD 8、AC 9、ABCD 三、判断题 1、× 2、√ 3、√ 4、√ 5、√ 6、× 7、√ 8、× 9、√10、√11、×12、√13、√14、×15、× 16、√17、√18、× 四、填空题 1、随机、部分、总体 2、计算、控制 3、重复、不重复 4、大于 5、点估计、区间估计 6、增加到4倍、减少三分之二、 减少四分之三7、大样本、小样本8、正、反 五、复习思考题 1、影响抽样误差的主要因素有哪些? 答:影响抽样误差大小的因素主要有: (1)总体单位的标志值的差异程度。差异程度愈大则抽样误差愈大,反之则愈小。 (2)样本单位数的多少。在其他条件相同的情况下,样本单位数愈多,则抽样误差愈小。 (3)抽样方法。抽样方法不同,抽样误差也不相同。一般说,重复抽样比不重复抽样,误差 要大些。 (4)抽样调查的组织形式。抽样调查的组织形式不同,其抽样误差也不相同,而且同一组织 形式的合理程度也会影响抽样误差。 2、什么是抽样调查?它有哪些特点? 答:抽样调查是根据部分实际调查结果来推断总体标志总量的一种统计调查方法,属于非 全面调查的范畴。它是按照科学的原理和计算,从若干单位组成的事物总体中,抽取部分样 本单位来进行调查、观察,用所得到的调查标志的数据以代表总体,推断总体。 (1)只抽取总体中的一部分单位进行调查。

第六章抽样调查练习及答案

第六章抽样调查 一、填空题 1.抽选样本单位时要遵守原则,使样本单位被抽中的机会。 2.常用的总体指标有、、。 3.在抽样估计中,样本指标又称为量,总体指标又称为。 4.全及总体标志变异程度越大,抽样误差就;全及总体标志变异程度越小, 抽样误差。 5.抽样估计的方法有和两种。 6.整群抽样是对被抽中群内的进行的抽样组织方式。 7.误差分为和代表性误差;代表性误差分为________和偏差;偏差是 ____________________________,也称为________________。 8.简单随机抽样的成数抽样平均误差计算公式是:重复抽样条件下:; 不重复抽样条件下:。 9.误差范围△,概率度t和抽样平均误差 之间的关系表达式为。 10.抽样调查的组织形式有:。 二、单项选择题 1.所谓大样本是指样本单位数在( )及以上 A 30个 B 50个 C 80个D100个 2.抽样指标与总体指标之间抽样误差的可能范围是( )

A 抽样平均误差 B 抽样极限误差 C 区间估计范围 D 置信区间 3.抽样平均误差说明抽样指标与总体指标之间的( ) A 实际误差 B 平均误差 C 实际误差的平方 D 允许误差 4.是非标志方差的计算公式( ) A P(1-P) B P(1-P)2 C )1(P P D P 2(1-P) 5.总体平均数和样本平均数之间的关系是( ) A 总体平均数是确定值,样本平均数是随机变量 B 总体平均数是随机变量,样本平均数是确定值 C 两者都是随机变量 D 两者都是确定值 6.对入库的一批产品抽检10件,其中有9件合格,可以( )概率保证合格率不低于80%。 A 95.45% B 99.7396 C 68.27% D 90% 7.在简单随机重复抽样情况下,若要求允许误差为原来的2/3,则样本容量( ) A 扩大为原来的3倍 B 扩大为原来的2/3倍 C 扩大为原来的4/9倍 D 扩大为原来的2.25倍 8.根据抽样调查得知:甲企业一等品产品比重为30%,乙企业一等品比重为50% 一等品产品比重的抽样平均误差为 ( ) A 甲企业大 B 两企业相同 C 乙企业大 D 无法判断 9.是非标志的平均数是( ) A -P)1P( B P(1-P) C p D (1-P)2 10.重复抽样的误差一定( )不重复抽样的误差。

第六章 样本及抽样分布.

第六章样本及抽样分布 §1总体与样本 从理论上讲,对随机变量进行大量的观测,被研究的随机变量的概率特征一定能显现出来,可是实际进行的观测次数只能是有限的,有时甚至是少量的。因此,我们关心的问题就是怎样有效地利用收集到的有限的资料,尽可能地对被研究的随机变量的概率特征作出精确而可靠的结论. 我们把被研究的对象的全体称为总体(或母体),而把组成总体的各个元素称为个体。代表总体的指标是一个随机变量,所以总体就是指某个随机变量可能取的值的全体。 从总体中抽取一个个体,就是对代表总体的随机变量进行一次试验(或观测),得到的一个试验数据(或观测值)。从总体中抽取一部分个体,就是对随机变量进行若干次试验(观测)。 从总体中抽取若干个个体的过程称为抽样。抽样结果得到的一组试验数据(观测值),称为样本(或子样);样本中所含个体的数量称为样本容量。 从总体中抽取样本,一般总是假设满足下述两个条件: (1)随机性为了使样本具有充分的代表性,抽样必须是随机的,应使总体中的每一个个体都有同等的机会被抽取到,通常可以用编号抽签的方法或利用随机数表来实现。 (2)独立性各次抽样必须是相互独立的,即每次抽样的结果既不影响其它各次抽样的结果,也不受其它各次抽样结果的影响。 这种随机的、独立的抽样方法称为简单随机抽样,由此得到的样本称为简单随机样本。 例如,从总体中进行放回抽样,显然是简单随机抽样,得到的样本就是简单随机样本。 从有限总体(即其中只含有有限多个个体的总体)中,进行不放回抽样,虽然不是简单随机抽 样,但是若总体容量很大而样本容量较小(,则可以近似地看作是放回抽样,因而也就可以近似地看作是简单随机抽样,得到的样本可以近似地看作是简单随机样本。 今后,凡是提到抽样与样本,都是指简单随机抽样与简单随机样本。 从总体中抽取容量为n的样本,就是对代表总体的随机变量随机地、独立地进行n次试验(观测),每次试验的结果可以看作是一个随机变量,n次试验的结果就是n个随机变量 。 这些随机变量相互独立,并且与总体服从相同的分布。设得到的样本观测值分别是 ,

第六章-抽样调查

第六章 抽样调查 一、单项选择题 1.随机抽样的基本要求是严格遵守( ) ①准确性原则;②随机原则;③代表性原则;④可靠性原则。 2.抽样调查的主要目的是( ) ①广泛运用数学的方法; ②计算和控制抽样误差; ③修正普查的资料; ④用样本指标来推算总体指标。 3.抽样总体单位亦可称( ) ①样本; ②单位样本数; ③样本单位; ④总体单位。 4.反映样本指标与总体指标之间抽样误差可能范围的指标是( ) ①样本平均误差; ②抽样极限误差; ③可靠程度; ④概率程度。 5.在实际工作中,不重复抽样的抽样平均误差的计算,采用重复抽样的公式的场合是( ) ①抽样单位数占总体单位数的比重很小时; ②抽样单位数占总体单位数的比重很大时; ③抽样单位数目很少时; ④抽样单位数目很多时。 6.在其他条件不变的情况下,抽样单位数目和抽样误差的关系是( ) ①抽样单位数目越大,抽样误差越大; ②抽样单位数目越大,抽样误差越小; ③抽样单位数目的变化与抽样误差的数值无关; ④抽样误差变化程度是抽样单位数变动程度的2 1。 7.用简单随机抽样(重复抽样)方法抽取样本单位,如果要使抽样平均误差降低50%,则样本容量需扩大到原来的( ) ①2倍; ②3倍; ③4倍; ④5倍。 8.事先将全及总体各单位按某一标志排列,然后依固定顺序和间隔来抽选调查单位的抽样组织形式,被称为( ) ①分层抽样;②简单随机抽样;③整群抽样;④等距抽样。 9.全及总体按其各单位标志性质不同,可以分为( ) ①有限总体和无限总体; ②全及总体和抽样总体; ③可列无限总体和不可列无限总体;④变量总体和属性总体。 10.抽样指标是( ) ①确定性变量; ②随机变量; ③连续变量; ④离散变量。 11.用考虑顺序的重置抽样方法,从4个单位中抽选2个单位组成一个样本,则样本可能数目为( ) ①1642=; ②10!3!2!5=; ③12!2!4=; ④6!2!2!4=。 12.无偏性是用抽样指标估计总体指标应满足的要求之一,无偏性是指( ) ①样本平均数等于总体平均数; ②样本成数等于总体成数; ③抽样指标等于总体指标; ④抽样指标的平均数等于总体指标。 13.抽样平均误差就是抽样平均数(或抽样成数)的( ) ①平均数;②平均差;③标准差;④标准差系数。

第六章样本及抽样分布

第六章样本及抽样分布 【授课对象】理工类本科二年级 【授课时数】4学时 【授课方法】课堂讲授与提问相结合 【基本要求】1、理解总体、个体和样本的概念; 2、了解经验分布函数和直方图的作法,知道格林汶科定理; 3、理解样本均值、样本方差和样本矩的概念并会计算; 4、理解统计量的概念,掌握几种常用统计量的分布及其结论; 5、理解分位数的概念,会计算几种重要分布的分位数。 【本章重点】样本均值、样本方差和样本矩的计算;抽样分布——2 分布,t分布,F分布;分位数的理解和计算。 【本章难点】对样本、统计量及分位数概念的理解;样本矩的计算。 【授课内容及学时分配】 §6.0 前言 前面五章我们研究了概率论的基本内容,从中得知:概率论是研究随机现象统计规律性的一门数学分支。它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计规律性;而我们下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应用十分广泛的一门数学分支。所不同的是数理统计是以概率论为理论基础,利用观测随机现象所得到的数据来选择、构造数学模型(即研究随机现象)。其研究方法是归纳法(部分到整体)。对研究对象的客观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提供理论依据和建议。数理统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点研究参数估计和假设检验。 §6.1 随机样本 一、总体与样本 1.总体、个体 在数理统计学中,我们把所研究的全部元素组成的集合称为总体;而把组成总体的每个

元素称为个体。 例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是个体;在研究我校男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每个男大学生就是个体。 但对于具体问题,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几项数量指标X (可以是向量)和该数量指标X 在总体的分布情况。在上述例子中X 是表示灯泡的寿命或男大学生的身高和体重。在试验中,抽取了若干个个体就观察到了X 的这样或那样的数值,因而这个数量指标X 是一个随机变量(或向量),而X 的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。由于我们关心的正是这个数量指标,因此我们以后就把总体和数量指标X 可能取值的全体组成的集合等同起来。 定义1:把研究对象的全体(通常为数量指标X 可能取值的全体组成的集合)称为总体;总体中的每个元素称为个体。 我们对总体的研究,就是对相应的随机变量X 的分布的研究,所谓总体的分布也就是数量指标X 的分布,因此,X 的分布函数和数字特征分别称为总体的分布函数和数字特征。今后将不区分总体与相应的随机变量,笼统称为总体X 。根据总体中所包括个体的总数,将总体分为:有限总体和无限总体。 例1:考察一块试验田中小麦穗的重量: X =所有小麦穗重量的全体(无限总体);个体——每个麦穗重x 对应的分布: +∞<<σμσ π= ≤= ≤ξ=?∞ -σμ-- x N dt e x 重量x P x F x t 0) ,(~21 }{)(22)(2 2总麦穗数 的麦穗数 例2:考察一位射手的射击情况: X =此射手反复地无限次射下去所有射击结果全体; 每次射击结果都是一个个体(对应于靶上的一点) 个体数量化???=未中射中 01x 1在总体中的比例p 为命中率 0在总体中的比例p -1为非命中率 总体X 由无数个0,1构成,其分布为两点分布),1(p B p X P p X P -====1}0{,}1{ 2.样本与样本空间 为了对总体的分布进行各种研究,就必需对总体进行抽样观察。

@2-第6章 统计量及其抽样分布 练习题

第六章 统计量及其抽样分布 练习题 一、填空题(共10题,每题2分,共计20分) 1.简单随机抽样样本均值X 的方差取决于_________和_________,要使X 的标准差降低到原来的50%,则样本容量需要扩大到原来的_________倍。 2. 设1217,,,X X X L 是总体(,4)N μ的样本,2S 是样本方差,若2()0.01P S a >=, 则a =____________。 3.若(5)X t :,则2X 服从_______分布。 4.已知0.95(10,5) 4.74F =,则0.05(5,10)F 等于___________。 5.中心极限定理是说:如果总体存在有限的方差,那么,随着_________的增加,不论这个总体变量的分布如何,抽样平均数的分布趋近于_____________。 6. 总体分布已知时,样本均值的分布为_________抽样分布;总体分布未知,大样本情况下,样本均值的分布为_________抽样分布。 7. 简单随机样本的性质满足_________和_________。 8.若(2,4)X N :,查分布表,计算概率(X 3)P ≥=_________。若(X )0.9115P a ≤=,计算a =_________。 9. 若12~(0,2),~(0,2),X N X N 1X 与2X 独立,则2212X X +()/2服从______分布。 10. 若~(16,4)X N ,则5X 服从___________分布。 二、选择题(共10题,每题1分,共计10分) 1.中心极限定理可保证在大量观察下 ( ) A . 样本平均数趋近于总体平均数的趋势 B . 样本方差趋近于总体方差的趋势 C . 样本平均数分布趋近于正态分布的趋势 D. 样本比例趋近于总体比例的趋势

《社会调查研究方法》 第六章 抽样

《社会调查研究方法》第六章抽样在社会研究中,最常见的总体是由社会中 的某些个人组成的,这些个人便是构成总体 的元素,比如,当我们对某省大学生的择业 倾向进行研究和探讨时,该省所有在校大学 生的集合就是我们研究的总体,而每一个在 校大学生便是构成总体的元素。又比如, 我们打算研究某城市居民的家庭生活质量, 那么,该市所有的居民家庭就构成我们研究 的总体,而其中的每一户家庭都是这个总体 中的一个元素。 样本(sample)就是从总体中按一定方式 抽取出的一部分元素的集合。或者说,一个 样本就是总体的一个子集。比如,从某省总 数为12.8万人的大学生总体中,按一定方 式抽取出1 000名大学生进行调查,这1 000名大学生就构成该总体的一个样本(当然,从一个总体中可以抽取出若干个不同的样 本)。在社会研究中,资料的收集工作往往 是在样本中完成的。 明白了总体和样本的概念,再来理解抽样 的概念就十分容易了。 。比如,从3 000名工人所构成的总体中,按一定方式抽取200名工人的过程;或者从1 000户家庭构成的总体中,

按一定方式抽取一个由100户家庭构成的样 本的过程,都叫做抽样。 。 。比如,上面所举的例子中,单个的大学 生既是构成某省12.8万名大学生这一总体 的元素,又是我们从总体中一次直接抽取出 1000名大学生的样本时所用的抽样单位;但 是,当我们从这一总体中一次直接抽取出40个班级,而以这40个班级中的全部学生(假定正好1000名)作为我们的样本时,抽样单 位(班级)与构成总体的元素(学生)就不是一样的了。 。比如,从一所中学的全体学 生中,直接抽取200名学生作为样本,那么, 这所中学全体学生的名单就是这次抽样的 抽样框;如果是从这所中学的所有班级中抽 取部分班级的学生作为调查的样本,那么, 此时的抽样框就不再是全校学生的名单,而 是全校所有班级的名单了。因为此时的抽样 单位已不再是单个的学生,而是单个的班级 了。 。在统计中最常见的总体值是某一变量的平均值,比如,某市待业青年的平均年龄、 某厂工人的平均收入等等,它们分别是关于 某市待业青年这一总体在年龄这一变量上 的综合描述,以及某厂工人这一总体在收入

第六章 抽样方法

第六章抽样方法 6.2 非概率抽样 非概率抽样是用一种主观的(非随机的)方法从总体中抽选单元。由于不需要完整的抽样框,非概率抽样是一种快速、简单且节省的获得数据的方法。使用非概率抽样的问题是,我们不清楚能否通过样本对总体进行推断,原因是用非概率抽样从总体中抽选单元的方式可能会导致较大的偏差。例如,在非概率抽样中访员经常主观地决定哪些单元入样。由于访员倾向于选择总体中那些最容易接触到和最友好的单元,使总体中很大一部分单元完全没有被抽中的机会,而这些单元与被抽中的单元可能有系统差异。非概率抽样不仅会使调查结果出现偏差,而且由于带有选择平均单元和排除极端值的倾向,将错误地减少总体中明显的变异性。 由于非概率抽样抽取样本有倾向性,我们不可能计算出各个单元的人样概率,从而无法得到可靠的估计值及其抽样误差估计值。此时若能对总体进行推断,必须假定样本对总体有代表性。而这通常需要假定总体指标服从某个模型,或是均匀地或是随机地分布的。由于抽选存在偏差,做这种假定的风险很大。 非概率抽样经常被市场研究人员作为一种省钱快速的方法来代替概率抽样。但是由于有上述问题,它并不是概率抽样的一种有效的替代方法。那么,为什么还要费神来讨论非概率抽样呢?这是因为非概率抽样能用在下面几个方面的研究中: - 用来形成一种想法; - 作为设计开发概率抽样调查的初始步骤; - 在后续步骤中帮助理解概率抽样调查结果。 比如,非概率抽样能在调查的早期就提供非常有价值的信息。它也可用在探索性或诊断性研究中,以了解人们的态度、信仰、动机和行为,或分析概率抽样调查的结果。有时,非概率抽样是唯一可行的选择?例如,在医学实验中,采用志愿者抽样可能是取得数据的唯一途径。 非概率抽样常被用于抽选参加焦点座谈和深人访问的个人。在加拿大统计局,非概率抽样被用来测试在人口普查调查表中所使用的问题,以确保所问的问题和使用的概念对被调查者是清楚的。如果认为问题的内容会引起争议,则在最有可能有争议的地方抽选一个子总体。如果能通过焦点座谈使问题能被这些人接受,则它们就会在任何地方都能被接受。 非概率抽样的优点是: - 快速简便。一般而言,非概率样本能被很快抽出并进行调查:到外面去,向在街上遇到的前一百个人问问题,这很容易做到; - 费用相对较低。非概率样本的地理分布一般不广,因此,访员的旅费较低; - 不需要任何抽样框; - 非概率抽样对探索性研究和调查的设计开发很有用。 非概率抽样的缺点是: - 对总体进行推断,需要对样本的代表性做很强的假定。做这样的假定通常有很大的风险。如果要对总体进行推断,必须使用概率抽样; - 由于不可能确定总体单元的人样概率,故不可能得到可靠的估计值以及抽样误差估计值。 下面几小节将介绍五种不同的非概率抽样方法:随意抽样,志愿者抽样,判断抽样,配额抽样,及修正的概率抽样。 6.2..1 随意抽样 单元的抽选以无目的、随意的方式进行,几乎没有或完全没有计划。随意抽样假定总体

6第六章样本及抽样分布自测题及答案

第六章 自测题 时间:120分钟 一、单项选择题 (每题5分,共25分) 1. 设总体2(,)X N μσ , 其中μ已知,2σ未知, X 1, X 2, …, X n 是来自总体X 的简单随机样 本,则下列表达式中不是统计量的是( ) (A) 11n i i X n =∑ (B) 1min{}i i n X ≤≤ (C) 21 n i i X μσ=-∑() (D) 2 11n i i X n μ=-∑() 2. 设随机变量X 和Y 都服从标准正态分布,则 ( ) (A) X +Y 服从正态分布;(B) X 2+Y 2服从χ2分布; (C) X 2和Y 2都服从χ2分布;(D) X 2/Y 2服从F 分布。 3. 设二维随机变量(X , Y )服从二维正态分布N (μ1, μ2, σ12, σ22, ρ) (ρ≠0),则( ) (A) 2X +Y 服从正态分布;(B) X 2+Y 2服从χ2分布; (C) X -Y 不服从正态分布;(D) X 2/Y 2服从F 分布. 4.设X 1, X 2, …, X 11是来自正态总体2 (0,)X N σ 的简单随机样本,102 211,10i i Y X ==∑,则下 列选项正确的是( ) (A)22(1)X χ ; (B) 22 (10);Y χ (C) 11 (10);X t Y (D) 2112(10,1).X F Y 5. 设总体X 和Y 相互独立且都服从正态分布2(,)N μσ,,X Y 分别是来自总体X 和Y 容量为n 的样本均值, 则当n 固定时, 概率{}P X Y σ->的值随着σ的增大而( ) (A)单调增大; (B) 单调减小; (C)保持不变; (D) 增减不定. 二、填空题 (每题5分,共15分) 1. 设随机变量2110012...,X N X X ~(,),,是取自X 的样本,X 为样本均值, 已知 (0,1),Y aX b N =+ 则a ,b 的值为( ). 2. 设总体X 服从正态分布)2,0(2 N ,而1521,,,X X X 是来自总体的简单随机样本,则随 机变量 ) (22 152112 10 21X X X X Y ++++= 服从( )分布,参数为( ).

(完整版)样本及抽样分布

第六章样本及抽样分布 【基本要求】1、理解总体、个体和样本的概念; 2、理解样本均值、样本方差和样本矩的概念并会计算; 3、理解统计量的概念,掌握几种常用统计量的分布及其结论; 4、理解分位数的概念,会计算几种重要分布的分位数。 【本章重点】样本均值、样本方差和样本矩的计算;抽样分布——2 分布,t分布, F分布;分位数的理解和计算。 【本章难点】对样本、统计量及分位数概念的理解;样本矩的计算。 【学时分配】4学时 【授课内容】 §6.0 前言 前面五章我们研究了概率论的基本内容,从中得知:概率论是研究随机现象统计规律性的一门数学分支。它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计规律性;而我们下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应用十分广泛的一门数学分支。所不同的是数理统计是以概率论为理论基础,利用观测随机现象所得到的数据来选择、构造数学模型(即研究随机现象)。其研究方法是归纳法(部分到整体)。对研究对象的客观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提供理论依据和建议。数理统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点研究参数估计和假设检验。 §6.1 随机样本 1

一、总体与样本 1.总体、个体 在数理统计学中,我们把所研究的全部元素组成的集合称为总体;而把组成总体的每个元素称为个体。 例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是个体;在研究我校男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每个男大学生就是个体。 但对于具体问题,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几项数量指标X(可以是向量)和该数量指标X在总体的分布情况。在上述例子中X是表示灯泡的寿命或男大学生的身高和体重。在试验中,抽取了若干个个体就观察到了X的这样或那样的数值,因而这个数量指标X是一个随机变量(或向量),而X的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。由于我们关心的正是这个数量指标,因此我们以后就把总体和数量指标X可能取值的全体组成的集合等同起来。 定义1:把研究对象的全体(通常为数量指标X可能取值的全体组成的集合)称为总体;总体中的每个元素称为个体。 我们对总体的研究,就是对相应的随机变量X的分布的研究,所谓总体的分布也就是数量指标X的分布,因此,X的分布函数和数字特征分别称为总体的分布函数和数字特征。今后将不区分总体与相应的随机变量,笼统称为总体X。根据总体中所包括个体的总数,将总体分为:有限总体和无限总体。 例1:考察一块试验田中小麦穗的重量: X=所有小麦穗重量的全体(无限总体);个体——每个麦穗重x 2

《市场调查》:第六章 抽样调查理论及方法

一、抽样调查(Sampling Survey)意义 抽样调查为科学研究方法中重要技术之一,是指就所要研究的某特定现象之母群体中,依随机原理抽取一部份作为样本(Sample),以为研究母群体(Population)之依据。将样本研究结果,在抽样信赖水准内,推算母群体可能特性以为决策之参考。 抽样调查之优点: 1.利用抽样技术及机率理论,可获得既定精确估计值,以代表母群体特征。 2.节省调查人力,物力,时间及经费。 3.经由少数优秀人员施予特殊训练及配合特殊设备,施行调查,可得较深入且正确调查结果。 故在实地市场调查中,抽样调查为一不可或者之工具。 抽样调查基本目的乃在信息之搜集作成结论,以供决策参考。有效抽样调查应具有准则有下: 1.有效原则 抽样调查应该(1)符合调查目的之需要,(2)所获信息价值应超过所支付成本。 2.可测量原则 抽样的正确程度必须能够测量,否则抽样调查就失去意义。 3.简单原则 抽样调查必须保持简单性要求。俾使抽样调查顺利进行,以避免不必要之节外生枝。 二、抽样调查的基本术语 1母群体(Population) 在调查研究中,调查研究对象的集合体。调查台北市中学生,则在台北市上课之54所中学生总数,便是调查研究之母群体。 2抽样架构(Sampling frame) 整体抽样单位的详细名单,以供抽样之用。例如以台北市医师为抽样单位,则台北市医师公会名册,便是抽样架构。如果以学校班级为抽样单位,则学校60班班级名册便是抽样构架。 抽样架构有三种型态: 具体的抽样架构:每一个抽样单位名字皆列成表册,可以直接按表册名字抽取样本。 抽象的抽样架构:没有抽样单位之名册,只要符合调查之条件就有被抽样之可能。例如在百货公司举行消费者抽样,随然没有抽样名册,但是抽样架构却冥冥中隐约出现。 阶段式抽样架构:在采用分段抽样中,依抽样阶段之不同,产生不同之抽样架构。 3抽样单位(Sampling unit) 在抽样架构上排列的名单之个别单位。例如台北市每一医师即为一抽样单位。在上例中,每一班级都是抽样单位。 4元素( Element ) 指接受调查的最小单位,通常是指人。上例中,班上每一位学生既为元素。 5样本(Sample) 从抽样架构中抽出取来的抽样单位总和。例如百事可乐抽出350家庭做测试称为样本。从台北市医师公会抽出90名医生作调查,称为样本。 6精确度(Precision)与准确度(Validity) 精确度乃用以衡量估计值精确可依赖的程度,如在物价统计中,经济家若认为物价如上升0.02将影向经济决策,则精确度即须订在0.02。

6-2 第六章 抽 样(习题解答)

第六章抽样 一、辨析题 1、一般来说,任意抽样技术适用于正式的实际调查。 错误。适用于非正式的探测性调查,或调查前的准备工作。 2、一般说来,总体中各单位之间标志值的变异程度越大,需要抽样的样本数目越多;反之,需要抽样的样本数目越少。 正确 3、分层最佳抽样法指的是等比例分层抽样。 错误。这是非比例分层抽样。 4、一般而言,抽样的样本占总体的比例同抽样误差成反向关系,即抽样比例越大,抽样误差相对越小。 正确 5、抽样误差是随机抽样调查中必然发生的代表性误差,所以平均误差是不可避免的。而且,这种误差一般包括了技术性误差,即调查工作中的误差。 错误。这种误差一般不包括技术性误差即调查工作中的误差。 6、总体单位之间标志变异程度越大,抽样误差越大;反之则越

小。 正确 7、样本单位数目越多,抽样误差越大,反之则越小。 错误。样本单位数目越多,抽样误差越小,反之则大。 8、一般来说,简单随机抽样比分层、分群抽样误差大,不重复抽样比重复抽样误差大。 错误。重复抽样比不重复抽样误差大。 9、点值估计是考虑了抽样误差,直接以样本指标作为总体指标的估计值,作近似的估计。 错误,不考虑抽样误差。 二、名词解释 1、抽样调查 抽样调查也称为抽查,是指从调查总体中抽选出一部分要素作为样本,对样本进行调查,并根据抽样所得的结果推断总体的一种专门性的调查活动。 2、抽样 抽样是指在抽样调查时采用一定的方法,抽选具有代表性的样本,以及各种抽样操作技巧和工作程序等的总称。 3、随机抽样 随机抽样又称为概率抽样或机率抽样,是对总体中每一个体都给予平等的抽取机会的抽样技术。在随机抽样的条件下,每个个体抽中或抽不中完全凭机遇,

样本与抽样分布

样本与抽样分布 Corporation standardization office #QS8QHH-HHGX8Q8-GNHHJ8

第六章样本与抽样分布 §数理统计的基本概念 一.数理统计研究的对象 例:有一批灯泡,要从使用寿命这个数量指标来看其质量,设寿命用X 表示。 (1)若规定寿命低于1000小时的产品为次品。此问题是求P(X £1000)=F(10000),求F(x) (2)从平均寿命、使用时数长短差异来看其质量,即求E(x)、D(x)。 要解决二个问题

1.试验设计抽样方法。 2.数据处理或统计推断。 方法具有“从局部推断总体”的特点。 二.总体(母体)和个体 1.所研究对象的全体称为总体,把组成总体的每一个对象成员(基本单元)称为个体。 说明: (1)对总体我们关心的是研究对象的某一项或某几项数量指标(或属性指标)以及他们在整体中的分布。所以总体是个体的数量指标的全体。

(2)为研究方便将总体与一个 X对应 (等同)。 a.总体中不同的数量指标的全体, 即是的全部取值。 b. X的分布即是总体的分布情 况。 例:一批产品是100个灯泡,经测 试其寿命是: 1000小时 1100小时 1200小时 20个30个 50个 X 1000 1100

1200 P 20/100 30/100 50/100 (设X表示灯泡的寿命)可知的分布 律, 就是总体寿命的分布,反之亦然。 常称总体X,若~F(x),有时也用 F(x)表示一个总体。 (3)我们对每一个研究对象可能要观 测两个或多个数量指标,则可用多 维随机向量(X,Y,Z, …)去描述总 体。 2.总体的分类

习题六 样本及抽样分布

习题六 样本及抽样分布 一、填空题 1.设来自总体X 的一个样本观察值为:2.1,5.4,3.2,9.8,3.5,则样本均值 = 4.8 ,样本方差 =22.716; 2.在总体~(5,16)X N 中随机地抽取一个容量为 36 的样本,则均值X 落在4与6之间的概率 = 0.9332 ; 3. 设某厂生产的灯泡的使用寿命2~(1000,)X N σ (单位:小时),抽取一容量为9的样本,得到940,100x s ==,则(940)P X <= ; 4.设127,,...,X X X 为总体2 ~(0,0.5)X N 的一个样本,则7 21(4)i i P X =>=∑ 0.025 ; 5.设126,,...,X X X 为总体~(0,1)X N 的一个样本,且cY 服从2χ分布,这里, 22123456()()Y X X X X X X =+++++,则c =1/3 ; 6.设随机变量,X Y 相互独立,均服从2(0,3)N 分布且129,,...,X X X 与129,,...,Y Y Y 分别是来自总体,X Y 的简单随机样本,则统计量U =服从参数为 9 的 t 分布。 7.设1234,,,X X X X 是取自2~(0,2)X N 正态总体的简单随机样本且 22!234(2)(34),Y a X X b X X =-+-,则a = 0.05 ,b = 0.01 时,统计量Y 服从 2χ分布,其自由度为 2 ; 8.设总体 X 服从正态分布2~(0,2)X N ,而1215,,...,X X X 是来自总体的简单随机 样本,则随机变量 22 110 22 1115...2(...) X X Y X X ++=++ 服从 F 分布,参数为 10,5 ; 9.设随机变量2 1 ~()(1),,X t n n Y X >= 则~Y F(n,1) ; 10.设随机变量~(,)X F n n 且()0.3P X A >=,A 为常数,则1 ()P X A > = 0.7

第六章 抽样调查

第六章 抽样调查 第一节 抽样调查的意义及基本概念 一、抽样调查的意义 抽样调查(随机抽样):按照随机原则从总体中抽取一部分单位进行观察,并运用数理统计的 原理,以被抽取的那部分单位的数量特征为代表,对总体作出数量上的推断分析。 二、抽样调查的适用范围 抽样调查方法是市场经济国家在调查方法上的必然选择,和普查相比,它具有准确度高、 成本低、速度快、应用面广等优点。 一般适用于以下范围: 1. 实际工作不可能进行全面调查观察,而又需要了解其全面资料的事物; 2. 虽可进行全面调查观察,但比较困难或并不必要; 3. 对普查或全面调查统计资料的质量进行检查和修正; 4. 抽样方法适用于对大量现象的观察,即组成事物总体的单位数量较多的情况; 5. 利用抽样推断的方法,可以对于某种总体的假设进行检验,判断这种假设的真伪,以决 定取舍。 三、抽样调查的基本概念 (一) 全及总体和抽样总体(总体和样本) 全及总体:所要调查观察的全部事物。 总体单位数用N 表示。 抽样总体:抽取出来调查观察的单位。 抽样总体的单位数用n 表示。 n ≥ 30 大样本 n < 30 小样本 (二) 全及指标和抽样指标(总体指标和样本指标) 全及指标:全及总体的那些指标。 抽样指标:抽样总体的那些指标。 x X p P 所谓,就是用抽样指标来推断全及指标。 是用抽样平均数推断全及平均数,从而推断 总体标志总量是用抽样成数推断全及成数,从而推断总推断一体 二单位总量 22 s s σσ????? 在抽样调查中应用的总体指标和样本指标还有: 方差:总体方差、样本方差标准差:总体标准差、样本标准差 第二节 抽样调查的组织形式 通常有以下四种组织形式: 一、 简单随机抽样(纯随机抽样) 即从总体单位中不加任何分组、排队,完全随机地抽取调查单位。 随机抽选可有各种不同的具体做法,如: 1.直接抽选法;

相关主题
文本预览
相关文档 最新文档