第五章抽样技术和方法
- 格式:ppt
- 大小:340.50 KB
- 文档页数:57
第5章抽样(8学时)第一节抽样的意义与作用一、抽样的概念1.总体总体(population)通常与构成它的元素共同定义:总体是构成它的所有元素的集合,元素则是构成总体的最基本单位。
2.样本样本(sample)就是从总体中按一定方式抽取出的—部分元素的集合。
或者说一个样本就是总体的一个子集。
3.抽样明白了总体和样本的概念,再来理解抽样的概念就十分容易了。
所谓抽样(sampling),指的是从组成某个总体的所有元素的集合中,按一定的方式选择或抽取一部分元素(即抽取总体的一个子集)的过程,或者说,抽样是从总体中按一定方式选择成抽取样本的过程。
4.抽样单位抽样单位(sampling unit)就是一次直接的抽样所使用的基本单位。
抽样单位与构成总体的元素有时是相同的,有时又是不同的。
5.抽样框抽样框(sampling frame)又称做抽样X围,它指的是一次直接抽样时总体中所有抽样单位的。
6.参数值参数值(parameter)也称为总体值,它是关于总体中某一变量的综合描述,或者说是总体中所有元素的某种特征的综合数量表现。
在统计中最常见的总体值是某一变量的平均值,7.统计值统计值(statistic)也称为样本值,它是关于样本中某一变量的综合描述,或者说是样本中所有元素的某种特征的综合数量表现。
样本值是从样本的所有元素中计算出来的,它是相应的总体值的估计量。
二、抽样的作用在社会研究中,抽样主要解决的是对象的选取问题,即如何从总体中选出一部分对象作为总体的代表的问题。
本章一开始我们就说过,一项社会研究若能对总体中的全部个体都进行了解,那当然是很好的。
但实际上广大研究人员在时间、经费、人力等方面遇到难题,甚至陷入困境,从而不得不在庞大的总体与有限的时间、人力、经费这二者之间寻求平衡。
以现代统计学和概率论为基础的现代抽样理论,以及不断发展、不断完善的各种抽样方法.正好适应了社会研究的发展和应用的需要,成为社会研究知识体系中必不可少的一部分内容。
第5章等概率整群抽样到目前为止,我们假定所有抽样程序中的总体是实现给定的,我们要做的就是从这个给定的总体中抽取一个合适的样本,而这些样本中包含一定的单元。
但单元要被很好的定义并非易事,甚至再总体被很好定义的时候也是如此。
列举单元的方法多种多样,并且我们所选取的单元很可能包含了更小的单元。
假定我们想调查包含10000户家庭的某个社区中拥有自行车的住户数目,那么我们可以做一个样本容量为400个家庭的简单随机抽样,我们也可以把这个社区分为500个街区,每个街区20户家庭,然后从这个500个街区中随机的抽取20个街区作为样本。
后者实际上就是一个整群抽样。
500个街区称为初级抽样单位(PSU)或群。
街区中的家庭称为次级抽样单位(SSU)。
通常,SSU也是总体的元素。
这个有400个家庭构成的整群抽样样本的精度不及简单随机抽样样本;因为一些街区主要是由一些拥有自行车的住户构成,而一些街区的住户主要是由退休人员构成(不拥有自行车)。
处于同意街区的20户家庭并不能想随机样本的20户家庭一样反映整个社区的多样性。
因此,整群样本中的每一个观测单元所提供的信息少于随机样本。
但是,调查同一街区的20户家庭比随机调查整个社区的20户家庭要便宜很多,容易很多,因此,整群样本中,每一单元所取得的信息多于SRS中每一单元所获得的信息。
在整群抽样中,总体中的个体元素仅仅当它所属的群被抽样时它才被入样。
这个入样的群(抽样单元PSU)不同于观测单元(SSU),并且在计算整群抽样样本的标准误时,两者的容量被考虑。
为什么使用整群抽样?1、构造一个列举所有观测单元的抽样框可能就是困难、昂贵或不可能的。
我们不可能列出某一区域内所有蜜蜂或某一商场的所有顾客:就算我们能列举出北部某针叶林的所有树木或某一城市中的所有个人,但其耗时且昂贵。
2、总体在地域上分布广泛或者误群是自然产生的,如家庭或学校。
若目标总体是美国所有护理所的居民,则调查入样的某个护理所的全体居民比调查SRS中的等量居民要便宜很多:在SRS的护理所居民调查中,你可能不得不为了调查一个居民而去拜访他所在的护理所。