概率抽样调查
- 格式:docx
- 大小:12.67 KB
- 文档页数:4
第四部分统计——第二十五章抽样调查本章重点:1.抽样调查基本概念(总体、样本、样本量、总体参数、样本统计量与抽样框),概率抽样和非概率抽样,抽样调查一般步骤,抽样调查中的误差来源(抽样误差、非抽样误差、抽样框误差、无回答误差、计量误差)等。
2.几种基本概率抽样方法:简单随机抽样、分层抽样、系统抽样、整群抽样和多阶段抽样。
3.估计量的性质(无偏性、有效性和一致性),样本量的影响因素。
知识点一、抽样调查基本概念(一)抽样调查基本概念1.总体:即调查对象的全体,调查总体必须是明确的而不能是模糊的。
【示例】:研究全国钢铁企业盈利状况,所有钢铁企业是总体。
样本:总体的一部分,它由从总体中按一定原则或程序抽出的部分个体所组成。
【示例】:选取了20家钢铁企业是样本。
样本量:样本中包含的入样单位的个数。
【示例】:20。
2.抽样框:供抽样所用的所有抽样单元的名单,是抽样总体的具体表现。
【示例】:工商局注册的20家企业。
3.总体参数:变量的数字特征,根据总体中所有单位的数值计算的。
【示例】:所有钢铁企业盈利总额,所有钢铁企业盈利均值。
4.样本统计量:根据样本中各单位的数值计算的,是对总体参数的估计,因此也称为估计量。
常用的样本统计量:样本均值,样本比例、样本方差等。
【示例】:20家企业盈利总额,20家企业盈利均值。
【例题·单选题】(2016年)北京市旅游管理部门要通过抽样调查了解2015年北京市常驻居民出境旅游总消费金额,该抽样调查的总体参数是2015年北京市()。
A.所有常住居民旅游总消费金额B.被调查的常住居民出境旅游总消费金额C.被调查的每一位常驻居民出境旅游消费金额D.所有常住居民出境旅游总消费金额『正确答案』D『答案解析』本题考查抽样调查基本概念。
总体参数是我们所关心变量的数字特征,它是根据总体中所有单位的数值计算的。
【例题·单选题】(2015年)在某市随机抽取2000家企业进行问卷调查,并据此调查有对外合作意向的企业,该抽样调查中的总体是()。
几种抽样调查方法比较数理统计是用概率论的思想,方法去解决实际问题.在实际问题中出现的总的研究对象,我们称为总体,其分布一般是未知的,所以,首先要对总体进行抽样,以获取总体的有关信息——样本,再利用这些信息对总体进行分析.对于如何选取样本这个问题,经过人们不断的尝试、试验,渐渐地就有了“抽样论”,“试验设计”的发展.1895年,Kiaer在国际统计学(ISI)最早提出了“代表性抽样”的概念,后来经过Neyman、Hansen和Mahalanobis等人的杰出贡献,抽样调查理论与方法在过去的一百年间,已经取得了很大发展.从概率抽样方法的发展和完善到收集信息与控制误差方面日益复杂的方法的应用,抽样调查已经取得了很大的进步.特别是近几十年来,在实践中实施的大型调查所涌现出的关于抽样设计和数据分析的难题,更是推动了理论研究的发展.在现实生活中,有很多实际问题将会用到数理统计的知识,它会有效地帮助我们分析和论证,从而得到我们需要的信息.为了更加有效地应用这些知识,就需要在总体中选取一个最合适的样本来为我们服务.从这个方面来说,样本的选取方法就成了一个至关重要的问题.只有找一个最简洁又具有代表性的样本,才能获得隐藏在数据背后的真相.本文主要介绍抽样调查理论,以及抽样调查的几种方法,并通过举例子介绍对比这几种方法.最后,本文又对抽样调查的这几种方法做了简单的总结和比较,显示了抽样调查理论在我们的生活中无处不在的强大生命力.一、基本概念1.抽样调查.它是一种非全面调查,它是从全部调查研究对象中,抽选一部分单位进行调查,并据以对全部调查研究对象作出估计和推断的一种调查方法.2.总体与样本.总体是我们所研究(调查)的对象的全体.例如在全国儿童情况调查中,全国所有0—14岁的儿童就构成调查的总体.调查的目的是为了得到有关这个总体的某些数据.例如全国儿童总数、每个年龄男女儿童的平均身高和平均体重等.这些有关总体的指标就是调查的目标量.如果进行一次对全国儿童的普查,对每个儿童都进行有关指标的调查,就可以获得这些总体目标量的数据,当然这实际上是很难做到的,为此我们按某种方法只从总体中抽取一部分进行调查,这一部分儿童就构成样本.根据这些样本数据就可以对总体目标量进行估计.3.概率抽样.抽取样本是抽样调查中的一个重要方法.最常用且最科学的方法是进行概率抽样,也称随机抽样.其优点是能保证样本的代表性,避免人为的误差,而且它可以对抽样误差进行估计,从而可以获得估计的精度.为了抽样便利,使概率抽样能够实施,通常将总体划分成互不重叠且又穷尽的若干个部分,每个部分称为一个抽样单元.4.误差与精度.抽样调查中有两类误差,一类是由于调查中获得的原始数据不正确,抽样框有缺陷,或在调查中由于种种原因无法得到按方案的全部样本数据等等,这类误差统称为非抽样误差;另一类误差是由于抽样引起的,即用样本估计总体所产生的误差,称为抽样误差.抽样误差通常用估计量的均方误差、标准差(或方差)等来表示.抽样误差越小,调查的精度就越高,精度的另一种表示方法是给出总体目标量的置信区间,即以一定的置信度(也用概率表示,例如95%)表示总体目标量落在一定的范围内.在相同的置信度下,置信区间长度愈短,精度就愈高.二、抽样调查的优缺点1.优点:①经济性好,实效性强,适应面广,准确性高;②调查单位少,代表性强,所需调查人员少;③抽选的调查样本数量经过科学的计算确定的,有可靠的保证;④抽样调查的误差,是在调查前就可以根据调查样本数量和总体中各单位之间的差异程度进行计算,并控制在允许范围以内,调查结果的准确程度较高.2.缺点:①所抽取样本是否具有代表性是抽样调查的关键;②具有不稳定性,有所偏差,存在一定的误差率;③抽样调查也存在调查的误差和偏误问题.通常误差有两种:一种是工作误差(也称登记误差或调查误差),一种是代表性误差(也称抽样误差).三、抽样调查的特点抽样调查的本质特点是以部分来说明或代表总体.它是按照科学的原理和计算,从若干单位组成的事物总体中,抽取部分样本单位来进行调查、观察,用所得到的调查标志的数据以代表总体,推断总体.四、基本的抽样方法1.简单随机抽样设一个总体的个体数为N.如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的机会相等,就称这样的抽样为简单随机抽样.简单随机抽样是系统抽样和分层抽样不可或缺的基础,如何实施简单随机抽样有两种常用方法:抽签法和随机数表法.用抽签法抽取样本过程中,每一个个体被抽到的机会是均等的,这也是一个样本是否具有良好的代表性的关键前提.没有每个个体机会均等,就没有样本的公平性和合理性.同抽签法抽取样本一样,用随机数表法抽取样本的过程中,关键也是要保证每一个剩余个体被抽到的机会是均等的,这就要求:随机数表的确是随机产生的,不含人为因素在内;在选择随机数表中开始位置和方向时,也要保证随机性,如果在看过随机数表后再使用,所抽取的样本就失去了公平性,也就没有实际意义了.对于简单随机抽样需要注意:①它是不放回抽样;②它是逐个地进行抽取;③它是一种个体机会均等的抽样;④简单随机抽样适用于总体中的个体数不多的情况.生活中有许多用抽签法或类似抽签法的案例,如彩票摇奖、电视节目中电话号码抽奖、纳税凭证抽奖等.抽样时也要防止出现貌似合理的抽样方法,如到某星级宾馆问卷调查客人的收入情况来推断该地区的人均收入,或每隔一周到某一路口调查当地车流量等等.2.系统抽样当总体中的个体数较多时,可将总体平均分成几个部分,从每个部分抽取一个个体,得到所需的样本,这样的抽样方法称为系统抽样.从总体中抽取一个样本来估计总体,样本的抽取是否公平合理固然重要,样本抽取的方法是否经济可行也是十分重要的.面对容量很大的总体,抽取的样本容量显然不可太小,此时采用简单随机抽样是不经济也不可行的,这种情况下采用系统抽样也就更为合理可行.系统抽样以简单随机抽样为基础,通过将容量很大的总体分组,只需在某一个组内用简单随机抽样方式来抽取一个个体,然后在一定规则下就能抽取出全部样本,在保证公平客观的前提下简化抽样过程.对于系统抽样需要注意:①系统抽样适用于总体中的个体数较多的情况,它与简单随机抽样的联系在于:将总体均分后的每一部分进行抽样时,采用的是简单随机抽样;②与简单随机抽样一样,系统抽样是等可能抽样,它是客观的、公平的;③总体中的个体数恰好能被样本容量整除时,可用它们的比值作为系统抽样的间隔;当总体中的个体数不能被样本容量整除时,可用简单随机抽样先从总体中剔除少量个体,使剩下的个体数能被样本容量整除再进行系统抽样.3.分层抽样一般地,当总体由差异明显的几部分组成时,为了使样本更客观地反映总体情况,常将总体中的个体按不同的特点分成层次比较分明的几部分,然后按照各部分所占的比例实施抽样,这种抽样方法叫做分层抽样,其中所分成的各个部分叫做层.分层抽样同样是以简单随机抽样为基础的一种抽样方式,对于容量较大、个体差异不明显的总体通常采用系统抽样方法,但对于许多容量较大、个体差异较大且明显分成几部分的总体,系统抽样虽然保证公平性和客观性,但样本还是不具有良好的代表性,这时就考虑用分层抽样的方法来抽取样本.对于分层抽样需要注意:①分层抽样适用于总体由差异比较明显的几个部分组成的情况,是等可能抽样,它也是客观的、公平的;②分层抽样是建立在简单随机抽样或系统抽样的基础上的,由于它充分利用了已知信息,使样本具有较好的代表性,而且在各层抽样时可以根据情况采用不同的抽样方法,因此在实践中有着非常广泛的应用.五、简单例子Eg1. 某校高一年级有20个班,每班有50名学生.为了了解高一学生的视力状况,从这1000人中抽取一个容量为100的样本进行检查,应该怎样抽样?由分析可得,本例抽取方式可能有:1)以班级为单位,在每个班级内采用随机抽样方法来获取5人样本,最后汇总形成100人的所需样本;2)在班级抽样时,可以将50人按学号分成10组,分别由每组随机抽出一个个体来组成10人样本.这两种抽样方式,虽然总体工作量还是大,但每个班级的每个小组的工作量却很小,也基本能保证样本的公平性.主要因为参与抽样的人多了,易受到人为因素影响.如果在某个班级由学号分成的10个小组中任取一个小组来,采用随机抽样的方式抽出一名学生,其他小组直接抽出与这位学生学号个位数一致的学生,最后在其余班级中找出与该班级学号一致的学生共同组成样本.从而,系统抽样方法为:先将容量较大的总体平均分成容量较小的几个小组,在某一个小组内用简单随机抽样的方法来抽取一定个体,再按一定规则从其他小组抽出同样数量的个体,最后组成样本.这样,使得整个抽样过程大大简化.这个简单的例子说明:当样本容量过大时,应该采用系统抽样的方法,既可简化工作量,又能够简单快速的得到人们想要的结果.Eg2. 某单位在岗职工共624人,为了调查工人用于上班途中的时间,决定抽取10%的工人进行调查.如何采取抽样方法完成这一抽样?由分析可得,因为此样本容量过多,符合系统抽样的要求,且能简化工作量,因此我们采用系统抽样的方法. 根据系统抽样的步骤,由于624的10%约为62,624不能被62整除,为了保证“等距”分段,应剔除4人,得到如下解法:1)将624名职工用随机方式进行编号;2)从总体中剔除4人(剔除方法可用随机数表法),将剩下的620名职工重新编号(分别为000,001,002,……,619),并分成62段;3)在第一段000,……,009这十个编号中用简单随机抽样确定起始号码i0;4)将编号为i0,i0+10,……,i0+610的个体抽出,组成样本.如果只采用最简单的随机抽样,由于不知道应该抽取多少的个体才会使构成的样本具有代表性,会产生很多不必要的误差,所以在这种情况下,采用系统抽样会更好一点.需要注意的是,系统抽样适合于容量较大而差异不太大的总体,而现实生活中,许多总体的容量非常庞大,甚至不可数,如测量某一棉田中棉株的平均高度,测量某一路口在某一时段的车流量等,这时用简单随机抽样已无法完成抽样,那么可以用系统抽样的方法.测量某一棉田中棉株的平均高度,其样本的抽取可采用如下方式:先确定所要测量的样本容量大小(n),测量这块棉田中所有行的长度之和(S),然后从第一行第一株开始,每隔S/(n-1)距离就测一株棉花的高度,也就能得到全部样本的高度.测量某一路口在某一时段的车流量,其样本采集可用类似方式:每隔3天(从测量的第一天开始,在第1,4,7,……天测量),测量n次后,就可获得一个容量为n的样本.在确定时间间隔时,要考虑如下因素:车流量变化一般以周为周期,还受季节气候的影响.上述两个例子表明在使用抽样方法时,为了使结果客观、合理、公平,应该把系统抽样,简单随机抽样以及分层抽样结合起来,而不是单独使用其中一种,他们三者之间是相互辅助,相互渗透的关系. Eg3.某电视台在因特网上就观众对某一节目的喜爱程度进行调查,参加查的总人数为12000人,其中? 对于这个问题可以有以下三种解法:①采用简单随机抽样方法,其总体容量为12000. 可以随机抽取60人进行调查.②采用系统抽样方法,其总体容量为12000.依照系统抽样的步骤,可先把这12000人编号00000到11999;再每200人分为一组编号零零一组到二零零组;从每组中分别随机抽取一个个体;抽取的这60个个体就组成了一个样本;对这组样本进行调查.③采用分层抽样方法,其总体容量为12000.“很喜爱”占2415/12000,应取60×2415/12000≈12人;“喜爱”占4567/12000,应取60×4567/12000≈23人;“一般”占3926/12000,应取60×3926/12000≈20人;“不喜爱”占1072/12000,应取60×1072/12000≈5人.因此,采用分层抽样的方法在“很喜爱”、“喜爱”、“一般”、“不喜爱”的人中分别抽取12人、23人、20人和5人.然后对这组样本进行调查.根据上面的分析解答,由于样本容量过多,采用简单的随机抽样会使问题不具有代表性,所以不适合采用简单随即抽样;而由于持有不同态度的人差异较大,进行系统抽样的话,因喜爱此节目的人较多,使得在这种情况下选取的样本不具有公平和等概率性,所以也不适合采用系统抽样方法;采用分层抽样,得到的样本既具有代表性,又具有公平性和随机性,是最适合的抽样方法.六、小结系统抽样是对于样本容量较大而相互之间差距不是很大的总体比较好,它包括抽样和估计两个环节;而分层抽样是对于样本容量较大且差距较明显的总体比较适合,他包括分层、抽样和估计三个环节.简单随机抽样是系统抽样和分层抽样得以进行的基础.在很多问题中,应该把三者结合起来,才会达到更好的效果.它们之间是相辅相成,相互影响的,只有把这三者结合起来,才能使抽样调查的技术走向前进.样本的抽取是否得当对研究总体来说十分关键,掌握正确的抽样方法是十分重要的.抽样调查是根据数理统计理论建立起来的一种科学的统计调查方法.它虽然是非全面调查,但它的目的却在于取得反映总体情况的信息资料,因而,也可起到全面调查的作用.抽样调查在人类活动的许多领域,特别是在社会经济领域中有着广泛的应用.我国目前还处在抽样调查理论和技术发展相对落后的阶段,仅仅是在国外研究的基础上稍加改进.但是我相信,在我国相关人士的努力下,我国在这方面一定会奋起直追,研究出新的适合我国国情的抽样调查理论新方法.参考文献:[1] 盛骤概率论与数理统计[M] 北京高等教育出版社 2008[2] 夏宁茂新编概率论与数理统计[M] 上海华东理工大学出版社 2005[3] 赵雪慧抽样调查理论与方法的最新进展[J] 北京系统与信息论坛 2003.9[4] 克拉美H 统计学数学方法(魏宗舒等译)[J] 上海上海科学技术出版社 1966[5] 费史M 概率论于数理统计(王福保译)[J] 上海上海科学技术出版社 1962[6] 郝向东浅谈系统抽样与分层抽样[J] 北京统计与信息论坛 1996:04[7] Greg Dickman Business Statistics[J] Nelson 1998[8] F S Hillier Introduction to Management Science[J] McGraw-Hill Companies Inc 2001[9] B Efron Bootstrap Methods:Another Look at the Jackknife[J] Annals of statistics 1979:25-26[10]R Musil,M Baur,W Pfister Testing Practices for the AC Breakdown Voltage “Testing ofInsulation Liquids”[J] IEEE Electrical Insulation Magazine 1995:21-26[11]E.L.Lehmann Nonparametrics:Statistical Methods Based on Ranks[J]美国Holden-Day公司 1975[12]Fisher R A Theory of Statistical Estimation Proceedings of the Cambridge PhilosophicalSociety 1925(22):710-715[13]Barr D R Darling D A A.Kolmogorov-Smirnov Test for Gensored Samples[J] Technometrics1973(15):739-757[14]Kaziol J A Byar D P Percentage Points of the Asymptotic Distributions of one and two SamplesK-S Statistics for Truncated or Censored Date[J] Technometrics 1975(17):507-510 [15]Finklestein J M,Schafer R E Improved Goodness of Fit Tests[J] Biometrika 1971(58):641-645。
抽样调查的类型概率抽样:依据概率论的基本原理,按照随机原则进行,避免抽样过程中的人为误差。
非概率抽样:依据研究者的主观意愿、判断、是否方便等抽取对象,误差较大,样本代表性无法保证。
简单随机抽样系统抽样概率抽样分层抽样整群抽样多阶段抽样抽样方法偶遇抽样非概率抽样判断抽样定额抽样滚雪球抽样非概率抽样方法1、偶遇抽样/方便抽样/自然抽样“碰到谁就选谁”。
这种抽样方式表面上看与简单随机抽样一样。
实则不然。
因为它不能保证总体中的每一个元素都有同样的被抽取机会。
那些最先碰到、最容易碰到、最方便碰到的对象具有比其他对象大得多的机会被抽中。
因此,不能用偶遇抽样得到的样本来推论总体。
在人大东门过街天桥上拦截过往人群而开展的各式调查,以及在当代商场拦截顾客而进行的有关化妆品、服装等各式商品的调查,都属于这样的抽样。
来自这种抽样的结果,当然,也不能用来推论“全国”、“北京市”,哪怕是“人大附近”的任何群体的情况。
有些话题因为比较敏感、涉及隐私等原因,很多人不愿意接受调查。
但总会有一些人比较“积极”,“志愿”配合,接受调查。
这种调查,也属于方便调查,其结果也不能用于推断总体。
这种抽样方式常常用来作为试验问卷的手段。
2、判断抽样/目标抽样/立意抽样/主观抽样研究者依据自己研究的目标和主观的分析来选择和确定研究对象的抽样方法。
这种抽样首先要确定抽样标准。
比如,为了体现某个群体的先进性,我们在调查时刻意去收集这个群体中那些特别先进的成员进行调查。
由于标准的确定带有较大的主观性,故,用这种方法得到结果与研究者的经验、对研究对象的熟悉程度等有较大关系。
所得结果不能用于推论总体。
我们过去十分熟悉的“典型调查”,实际上属于这种主观调查。
这种抽样方式可以用来作为试验问卷的手段;还常用来对总体中的次级集合进行比较研究:比如,要对“左派”和“右派”进行对比分析,可以选择一个被认为是“左派”的群体,和一个被认为是“右派”的群体,对该两群体的成员进行抽样调查。
抽样调查方法有哪些抽样调查是社会科学研究中常用的一种数据收集方法。
它通过从总体中选择一部分样本,对这些样本进行观测、测量和调查,再通过统计分析来推断全体的特征和规律。
抽样调查方法有很多种类,下面将对一些常见的抽样调查方法进行详细介绍。
1. 简单随机抽样:简单随机抽样是指从总体中随机抽取样本,使得每个个体被选中的概率是相等的。
这种方法适用于总体的特征均匀分布、个体之间相互独立的情况。
2. 分层抽样:分层抽样是将总体划分为若干个层次,然后在各个层次上进行抽样。
这种方法可以保证不同层次的特征和规律都能得到充分的反映。
例如,我们想要对某个城市的人口进行调查,可以先按照不同的年龄、性别、职业等因素进行划分,然后在每个层次上进行抽样。
3. 整群抽样:整群抽样是将总体划分为若干个群体,然后随机抽取其中的几个群体作为样本。
这种方法适用于群体内部的个体相似度较高,而群体之间差异较大的情况。
例如,我们想要对一个大学的学生进行调查,可以先将学生按照不同的学院或专业划分成若干个群体,然后随机抽取其中的几个群体作为样本。
4. 系统抽样:系统抽样是指将总体中的个体按照一定的规则进行编号,然后按照一定的间隔选取个体作为样本。
这种方法适用于总体个体的编号规律存在一定规则的情况。
例如,我们想要对某个学校的学生进行调查,可以将学生按照学号进行编号,然后按照一定的间隔选取样本。
5. 效率抽样:效率抽样是指根据样本的费用、时间等成本因素,选择一个相对较小的样本,但能够尽可能准确地反映总体特征和规律。
例如,我们想要对某个公司的员工进行调查,由于采访每个员工都需要一定的时间和成本,可以通过一些方法(如分层、整群等)选择一个相对较小的样本,以降低调查成本。
6. 随意抽样:随意抽样是指根据研究者的主观意愿随意选择样本。
这种方法一般不具备统计学意义,但在一些探索性研究和个别案例分析时,可以作为一种初步收集数据的方法。
例如,我们想要对某个商场的顾客进行调查,可以通过观察和询问商场内的顾客进行随意抽样。
市场抽样调查按规模大小成比例的概率抽样,简称为PPS抽样,它是一种使用辅助信息,从而使每个单位均有按其规模大小成比例的被抽中概率的一种抽样方式。
其抽选样本的方法有汉森-赫维茨方法、拉希里方法等。
PPS抽样是指按概率比例抽样,属于概率抽样中的一种。
是指在多阶段抽样中,尤其是二阶段抽样中,初级抽样单位被抽中的机率取决于其初级抽样单位的规模大小,初级抽样单位规模越大,被抽中的机会就越大,初级抽样单位规模越小,被抽中的机率就越小。
就是将总体按一种准确的标准划分出容量不等的具有相同标志的单位在总体中不同比率分配的样本量进行的抽样。
PPS抽样的目的和设定选择一个具体的统计抽样方式需要:(1)、从样本得出的结论能反映审计者的测试目的;(2)、设定的方式要和会计总体的特性相匹配。
PPS抽样是设计用来为审计者找出审计的总体中存在错误的货币数量(包括夸大和缩小错误)。
审计人员在决定采用PPS抽样方式之前,应该确定设定的模式是不是适用被测试的会计总体。
采用PPS抽样方式有两个条件:l、会计总体中错误率应较小(小于10%),并且会计总体中至少要包含2000个项目,并使用泊松概率分布去评估样本;2、任何项目中的错误量不能超过该项目的会计帐面值。
如果设定的PPS抽样方式适用于会计总体测试并使用方式得出的结论符合审计目标,那么审计人员应考虑采用PPS抽样。
PPS抽样的基本概况PPS抽样变种于属性抽样,用于找出在会计总体中全体货币量的错误数。
不像传统的属性抽样方法那样着眼于会计总体的物理单元(发票、支票),PPS抽样的着眼点在货币单元。
假设抽样审计被审单位有5000个独立的往来帐,会计总体值为¥100,000的帐簿,审计人员将用货币单元取代5,000个物理单元作为抽样体单位。
当一个独立的货币数被抽选出来考核j并不是这个货币数本身被测试。
实质上它的作用是一个钩子,把它所在的那个完整的项目(物理单元)拖出来,让审计人员去测试。
象第二章讨论的那样,为此审计人员必须累加全体的货币数。
概率抽样调查
概率抽样方法 (probability sampling)
概率抽样调查 1
概率抽样又称几率抽样、可能率抽样,在实践中受到人们的普遍重视和广泛应用。
概率抽样以概率论和数理统计为基础。
首先按照随机性原则选取调查样本,使调查人群中的每一个女儿都有被选中的可能性,即被选为样本的概率相同,机会均等。
定量市场调查中的概率抽样是指在调查总体样本中的每个单位都具有同等可能性被抽中的机会。
概率抽样调查 2
概率抽样的基本原则是:样本量越大,抽样误差就越小,而样本量越大,则成本就越高。
根据数理统计规律,样本量增加呈直线递增的情况下(样本量增加一倍,成本也增加一倍),而抽样误差只是样本量相对增长速度的平方根递减。
因此,样本量的设计并不是越大越好,通常会受到经济条件的制约。
概率抽样调查 3
概率抽样之所以能够保证样本对总体的代表性,其原理就在于它能够很好的按总体内在结构中所蕴含的各种随机事件的概率来构成样本,使样本成为总体的缩影。
概率抽样调查 4
⑴ 概率抽样包括以下几个方面的优点:
•调查者可获得被抽取的不同年龄、不同层次的人们的信
息;
例如,在一项使用概率抽样法的调查中,如果有 5 %的被访者给出了某种特定回答,那么,调查者就可以以此百分比再结合抽样误差,推及总体情况。
⑵ 另一方面,概率抽样也有一些弊病:
•在大多数案例中,同样规模的概率抽样的费用要比非概
率抽样高;
•必须遵守的抽样计划执行程序会大量增加收集资料的时
间。
概率抽样调查 5
概率抽样调查 5是:
随机性——总体中的所有个体都有同样被抽出的机会。
可行性——抽样的方法在实际中是可实施的。
信息性——抽得的样本尽可能反映出分析时所期望的各种信息。
概率抽样调查 6
概率抽样包括简单随机抽样(也称简单随机抽样)、系统抽样(等距抽样)、分层随机抽样(类型抽样)和整群随机抽样。
概率抽样调查 7
抽样分为概率抽样和非概率抽样,两者在抽样调查中都是不可或缺的。
概率抽样也称随机抽样,概率抽样就是使总体中的每一个单位都有一个已知的、不为零的概率进入样本的抽样方法。
具体说来,概率抽样具有以下一些特点:(1)概率抽样是以随机原则为基础的;(2)概率抽样必须通过一定的随机化程序来实现.关于概率抽样的程序和方法,我们稍后即要讲到;
(3)概率抽样的抽样误差是可计算和可控制的。
因此,概率抽样可以排除调查者的主观影响,抽选出较其他方法更具代表性的样本。
概率抽样是基于概率论中的大数定律。
一个随机事件的发生是随机的、偶然的,结果是无法提前预测的,但随机现象并不是绝对没有规律的,大量重复的随机现象会表现出一定的规律性。
举个例子,一枚硬币向上抛,数字面可能是向上,也可能是向下,但抛上千次,就会发现向上和向下的次数几乎相等,抛的次数越多,向上和向下的次数越接近。
非概率抽样是指抽样时不遵循随机原则,而是按照研究人员的主观经验或其他条件来抽取样本的一种抽样方法,也就是说在抽样时,总体单元的入样概率事先未知,入样与否与研究人员的经验和主观意志有很大关系。
因此,非概率抽样在应用时更需研究人员具备深厚的背景知识与相关经验。
非概率抽样与概率抽样最大的区别,在于前者不是按照一定的随机原则抽取样本,而后者则是遵循一定的随机原则,因此理论上概率抽样要比非概率抽样更为严谨,概率抽样的结果明显优于非概率抽样。
但是二者之间也存在着一些联系,如便利抽样同简单随机抽样、判断抽样同不等概率抽样等,在抽样方法实施上有一定的相似性。
由于实际中的调查没有一个能严格匹配于经典教科书的概率抽样方法,因此实际应用中通常将
两者结合使用,非概率抽样是对概率抽样的一个很好的补充。
另外,除了上面的两种方法外,还有配额调查,它主要是选取一群特定数目的满足特定条件的被调查者的抽样方法。
在实际应用中,以上方法常常混合使用。
[1]
非概率抽样的优缺点:
非概率抽样具有以下几个优点:
(1)非概率抽样比概率抽样的费用低。
非概率抽样的这一特点对那些精确性要求不高,只注重方向性的调查有相当大的吸引力,如试探性调查。
(2)一般来讲,非概率抽样实施起来要比概率抽样用的时间少。
(3)如果合理使用非概率抽样,也能产生有代表性的抽样结果。
但是,非概率抽样也有缺点:
(1)不能估计出抽样误差。
(2)调查者不知道抽样指标代表总体指标的程度。
(3)非概率抽样的结果不能用来推断总体指标。
[2]
参考文献
1.↑ 教育部高等学校管理科学与工程类学科教学指导委员
会组编;胡培,王建琼主编.第二章统计数据的搜集与整
理管理统计学.高等教育出版社,2007年04月第1版.
2.↑ 许以洪,熊艳主编.第七章抽样调查技术市场调查与
预测.机械工业出版社,2010.07.。