第十一章 调查中的非抽样误差讲解
- 格式:ppt
- 大小:689.00 KB
- 文档页数:15
市场调查中非抽样误差的产生和控制摘要:非抽样误差直接与市场调查的准备阶段、抽样阶段、问卷设计阶段、实地访问阶段、统计处理阶段等各阶段的工作质量好坏存在密切的关联。
本文在具体分析这些阶段导致非抽样误差产生的工作情形后,提出了科学设计调查方案、重视对调查员的培训和管理、减少被调查者误差和做好调查资料的汇总工作等几方面控制非抽样误差的对策。
关键词:非抽样误差;调查方案;调查员;被调查者一、非抽样误差的产生非抽样误差产生的原因多种多样,尤其在实施调查过程中最为常见。
非抽样误差直接与调查的准备阶段、抽样阶段、问卷设计阶段、实地访问阶段、统计处理阶段等各阶段的工作质量好坏存在密切的关联。
1.准备阶段准备阶段是整个调查的起始阶段,准备阶段的主要任务是:确定调查任务,设计调查方案,组织调查队伍。
调查设计者首先要列出具体研究目标,从而确定所要研究的问题和识别研究的总体,最后明确调查任务并给整个调查活动一个纲领。
具体说来,设计调查方案包括调查指标的设计、调查总体方案的设计和调查方案可行性研究三方面的内容。
在本阶段可能产生误差的工作主要有:(1)调查设计者可能误解了主办者的目的意图,制定了错误方针,误导研究方向。
(2)目标总体与实际的调查总体不一致。
例如,进行电话访谈时,社区周边的居民用户电话号码可能没有列到电话号码簿中,另一些用户可能已经搬迁而导致电话为空号,因此目标总体和被调查总体出现一定的差异。
(3)调查设计者没有事先预先设定好调查的具体步骤和时间表、可能出现的问题以及未事先培训和挑选恰当的调查员,因而导致计量质量的下降。
(4)预算的限定。
任何调查都有费用,市场调查也同样。
并且由于市场调查的主办者一般都是企业,因此费用上的限制就更为明显。
如果资金短缺,只能缩小研究范围或进一步寻求资金。
上述第一点是调查设计者误解调查主办者的目的,这必然导致系统误差,使调查信度和效度下降。
第二点由于空号的原因,造成缺失值误差。
第三点由于没有预先设定调查步骤和很好的培训访问员,即没有制定标准化的市场调查结构,这样也会降低信度。
非抽样误差产生的原因及控制抽样调查是目前我国搜集统计资料的一种主要方法,但抽样调查的结果始终要受到抽样误差和非抽样误差的影响。
抽样误差是由于样本随机性引起的,根据样本数据计算的对总体目标量的估计是随样本而异的,由此产生的误差即是抽样误差。
抽样误差是不可避免的,其大小可以通过调查样本容量,改变抽样方式等加以控制。
非抽样误差是指除抽样误差以外。
由于各种原因引起的。
非抽样误差由于其产生的原因及其复杂且具有不易观测和非随机性等特点而难以控制。
两种误差构成了总方差,两者之间呈此消彼长的关系。
一般情况下同时减少两类误差是很困难的。
非抽样误差占据了很大的一部分,怎样通过降低非抽样误差,从而降低总方差,有着非常重要的现实意义。
一、非抽样误差分类自1902年K?皮尔逊首次讨论非抽样误差这个概念以来,在非抽样误差的分类上。
主要有以下几种:(一)希里1957年把非抽样误差分为3类:1、范围误差:指由于样本单位的遗漏或重复产生的误差。
2、确定误差:指在资料收集、编辑、编码和计算输入阶段所产生的样本单位特征值的测量误差和回答偏差。
3、替代误差:由于对缺失数据进行替代和(或)在最后估计阶段对缺失数据进行替代所产生的误差。
(二)科克伦把非抽样误差分为3类:1、对被抽选出的样本中的一些单位未能进行计量而产生的误差。
2、一个单位的计量误差。
3、对调查结果进行编辑、编码和汇总过程中产生的误差。
(三)戴伦纽斯1988年把非抽样误差按调查活动分为3类:1、资料搜集过程中产生的误差。
2、测量过程中产生的误差。
3、资料加工过程中产生的误差。
在我国比较常见的分类方式有两种:第一,按性质和处理方法不同分为抽样框误差、无回答误差和计量误差。
第二,按产生的环节不同分为设计误差、调查误差和汇总误差。
二、各类非抽样误差产生的原因1、调查设计过程中引起的误差设计阶段误差是由于这一阶段某些失误而导致调查结果产生的偏误,调查设计有两个主要环节,即调查设计和抽样设计。
非抽样误差又称“工作误差”。
指在调查过程中由于种种人为因素所造成的代表性误差及登记性误差的总称。
前者通常是指调查方案设计有缺陷,如题器或指标含义不清、有诱导性;调查员在实施调查中不遵守随机原则,有意多选较好或较差的单位,等等。
后者是指在记录、汇总、计算、抄写调查数据资料时所发生的差错。
人为因素所造成的代表性误差通常表现为一种系统性的偏差。
它与抽样误差由于随机地观察总体中的一部分单位所造成的样本统计量的波动而产生的代表性误差有着明显的不同。
抽样误差是围绕分布中心所表现出的没有方向性的非系统性的误差,工作误差则是稳定的、有方向性的系统性偏差。
避免非抽样误差的主要措施是:(一)严格遵守随机原则,规定应抽选作为样本的调查对象都必须一一调查,不能随便更换、减少或增加,避免有意多选较好或较坏的调查对象来达到自己原定要说明某个问题的目的;(二)搞好问卷设计,严守客观公正的原则,避免题器设计所产生的诱导性因素,并努力使调查项目所涉及的概念指标尽可能地操作化到清晰、明确、唯一的程度; (三)认真培训调查登记人员,做好一切必要的准备工作,尽量不发生填表、登记之类过程中的差错。
原因分析引起非抽样误差的原因很多,比如抽样框不齐全,访问员工作经验有限,被访者不配合访问而加以虚假的回答,问卷设计本身存在缺陷等等。
通常,在技术性调查中,会出现由于缺乏回答知识而产生的非抽样误差。
另外两种类型的非抽样误差是选择误差和数据处理误差。
当调查中包含不恰当的项目时,就会生产选择误差。
假设设计一个抽样调查,来描述有胡须的男人外观。
对“有胡须的男人”的理解,如果有些采访人员认为应包括有小胡子的男人,而其他采访人员则不这样认为,这样,调查的结果资料将有缺陷。
当有登记错误或输入错误时,就会出现数据处理误差。
如将调查表中的资料输入计算机时产生的错误,即为输入错误。
尽管在大多数的调查中,会出现一些非抽样误差,但通过周密的计划可使它们达到最小,这些计划包括注意保证抽样总体与目标总体的一致、遵循良好调查表的设计原则、培训采访人员等。
浅谈抽样调查中的非抽样误差[摘要]在统计实践中,由于调查经费和时间的限制,往往不可能采取全面调查,而只能采取抽样调查的方法,抽样调查过程中由于抽样总体的代表性及人为因素的影响,必不可少地会产生误差。
因此从理论上讲非抽样误差应该是可以避免的,但在实际工作过程中是很难做到的,本文主要谈非抽样误差产生的原因及应对的办法。
[关键字]抽样调查;分类;原因;对策1统计误差的分类统计误差即调查误差。
统计误差的来源是多方面的,按最简单的分类方法,误差分为抽样误差和非抽样误差。
抽样误差是由于抽样的随机性引起的,一般意义上来说是不可避免、难于消灭,只能加以控制的。
随着科学的进步,对于抽样误差的控制和测算,已发展出了非常深厚的理论体系。
而非抽样误差是指除抽样误差以外所有的误差总和,应该说非抽样误差的产生贯穿了调查的每一个环节,任何一个环节出错都有可能导致非抽样误差增加而使数据失真,某种程度上讲,非抽样误差决定着一项调查活动的成败。
非抽样误差是由于调查程序执行中的错误和不足引起的。
2非抽样误差产生的原因引起非抽样误差的原因很多,概括起来,主要有以下原因:2.1设计阶段引起的误差。
调查设计有两个主要环节,即调查方法设计与抽样设计。
设计误差主要有调查设计误差和抽样设计误差。
调查设计误差主要指问卷设计产生的误差。
在问卷调查中,由于问卷设计有缺陷、指标的概念和范围不明确等,造成调查员或被调查对象对调查目的理解上的偏差而提供不正确的信息。
抽样设计阶中的问题主要是抽样框的问题。
一个理想的抽样框所包含的单元应与总体单元完全一致,但是实际工作中使用的抽样框与真正应有的调查抽样框之间存在一定的偏差,它或包含了某些不属于我们调查对象的单元,或丢失了一些应该列入调查范围的调查对象。
2.2调查阶段产生的误差。
调查过程中产生误差的成因主要有:①调查员操作程序不规范,在调查中不按照规范要求进行操作,如没有按照事先预定好的步骤进行访问、没有完全按照问卷上的措辞进行访问、调查员为了得到答案对被调查者进行诱导;记录误差,即调查员在听、理解和记录被调查者回案时产生的误差,如被调查者对某问题还没有给出准确的答案时或调查员没有及时记录被调查者的回答时,调查员就根据自己的意识或理解填上答案;因调查员的访问技巧而产生的误差,典型的如开放题的答案,需要更多的信息时调查员没有进一步询问而产生的误差;调查员作弊造成的误差。
6sigma绿带知识串讲—非抽样误差非抽样误差:非抽样误差是相对抽样误差而言的,是指除抽样误差之外的,由其他原因引起的样本观察结果与总体真值之间的差异。
抽样误差是一种随机性误差,只存在于概率抽样中,非抽样误差则不同,无论是概率抽样、非概率抽样,还是在全面调查中,都有可能产生非抽样误差。
非抽样误差有以下几种类型:01.抽样计划清单误差在概率抽样中需要根据抽样计划清单抽取样本。
抽样计划清单是有关总体全部单位的名录,在地域抽样中,抽样计划清单可以是地图。
一个好的抽样计划清单应该是,抽样计划清单中的单位和研究总体中的单位有一一对应的关系。
02.回答误差回答误差是指被调查者在接受调查时给出的回答与真实情况不符。
导致回答误差的原因有多种,主要有理解误差、记忆误差和有意识误差。
(1) 理解误差。
不同的被调查者对调查问题的理解不同,每个人都按自己的理解回答,大家的标准不一致,由此造成理解误差。
(2) 记忆误差有时,调查的问题是关于一段时期内的现象或事实,需要被调查者回忆。
需要回忆的时间间隔越久,回忆的数据就可能越不准确。
缩短调查所涉及的时间间隔可以减少记忆误差。
(3)有意识误差。
当调查的问题比较敏感,被调查者不愿意回答,迫于各种原因又必须回答时,就可能会提供一个不真实的数字。
产生有意识误差的动因大致有两种一种是调查问题涉及个人隐私,被调查者不愿意告知,所以造假另一种是受利益驱动,进行数字造假。
有意识误差比记忆误差的危害要大。
03.无回答误差无回答误差是指被调查者拒绝接受调査,调査人员得到的是一份空白的答卷。
无回答也包括那些调查进行时被访者不在家的情况。
电话调查中,拨通后没有人接邮寄问卷调查中,地址写错,被调查者搬家,或被调查者虽然收到问卷却把1司卷遗忘或丢失,这些都可以视为调查中的无回答。
04.调查员误差这是指由于调査员的原因而产生的调查误差。
如调查员粗心,在记录调査结果时出现错误。
调查员误差还可能来自调查中的诱导,而调查员本人或许并没有意识到。
从非抽样误差看调查质量当调查描述的结果与事实出现差异,便产生了调查误差。
调查的数据质量与调查误差成反比关系。
调查误差主要包括:抽样误差和非抽样误差。
所以,调查质量与抽样误差和非抽样误差存在以下关系:调查质量=1/调查误差=1/(抽样误差+非抽样误差)。
可见,抽样误差和非抽样误差只要有一方或者双方同时增大,就会使得调查质量下降。
抽样误差是由于调查设计时有意识地只研究总体中的一部分,由部分推断总体,从而产生的误差,它是可以事先计算并加以控制的。
只要选定了抽样方法,就能根据相应的公式计算出误差值的大小;只要在经费许可的范围内,增加样本容量、改变抽样方法就能对它实现有效的控制。
专业调查人员,一般都会考虑抽样误差的控制,并在调查报告中加以说明。
除了抽样误差以外的其它所有调查误差都属于非抽样误差,通常指的是在调查程序发展和执行中出现的错误和不足,例如调查问卷的设计不完善、从样本单位获取信息失败、数据处理和分析错误等等。
非抽样误差的研究历史不是很长,发展进程比较缓慢。
国外虽然早在56 世纪初就关注到这个问题,但在其后的四十年左右时间里一直处在宣传阶段;76年代以后,一些学者才开始进行具体的专题研究,然而研究的进展依旧缓慢;直到86 年代末至今,研究的成果才逐渐增多,深度不断加强。
目前外国专家学者已经针对非抽样误差提出了一些优秀的研究理论和模型。
国外的调查人士在实践中也非常重视非抽样误差,在很多调查报告中都会专门介绍对它的控制情况。
我国学者从96 年代中期进入这个研究领域,近年来也取得了一些成果,但主要集中在分析和处理无回答问题方面。
因此,进一步做好非抽样误差的研究和控制工作,具有重大的学术价值和现实意义。
在我国调查行业,业界人士对非抽样误差的认识和控制工作做得不够,一个非常重要的原因在于,非抽样误差是难以计算和控制的。
它普遍存在于各种形式的调查中,可能发生在从计划、实施,直到数据处理的每一个调查环节。
大体来讲,非抽样误差主要有三种类型:抽样框误差、无回答误差和计量误差。
非抽样误差产生的原因及控制抽样调查是目前我国搜集统计资料的一种主要方法,但抽样调查的结果始终要受到抽样误差和非抽样误差的影响。
抽样误差是由于样本随机性引起的,根据样本数据计算的对总体目标量的估计是随样本而异的,由此产生的误差即是抽样误差。
抽样误差是不可避免的,其大小可以通过调查样本容量,改变抽样方式等加以控制。
非抽样误差是指除抽样误差以外。
由于各种原因引起的。
非抽样误差由于其产生的原因及其复杂且具有不易观测和非随机性等特点而难以控制。
两种误差构成了总方差,两者之间呈此消彼长的关系。
一般情况下同时减少两类误差是很困难的。
非抽样误差占据了很大的一部分,怎样通过降低非抽样误差,从而降低总方差,有着非常重要的现实意义。
一、非抽样误差分类自1902年K?皮尔逊首次讨论非抽样误差这个概念以来,在非抽样误差的分类上。
主要有以下几种:(一)希里1957年把非抽样误差分为3类:1、范围误差:指由于样本单位的遗漏或重复产生的误差。
2、确定误差:指在资料收集、编辑、编码和计算输入阶段所产生的样本单位特征值的测量误差和回答偏差。
3、替代误差:由于对缺失数据进行替代和(或)在最后估计阶段对缺失数据进行替代所产生的误差。
(二)科克伦把非抽样误差分为3类:1、对被抽选出的样本中的一些单位未能进行计量而产生的误差2、一个单位的计量误差。
3、对调查结果进行编辑、编码和汇总过程中产生的误差。
(三)戴伦纽斯1988年把非抽样误差按调查活动分为3类:1、资料搜集过程中产生的误差。
2、测量过程中产生的误差。
3、资料加工过程中产生的误差。
在我国比较常见的分类方式有两种:第一,按性质和处理方法不同分为抽样框误差、无回答误差和计量误差第二,按产生的环节不同分为设计误差、调查误差和汇总误差。
、各类非抽样误差产生的原因1、调查设计过程中引起的误差设计阶段误差是由于这一阶段某些失误而导致调查结果产生的偏误,调查设计有两个主要环节,即调查设计和抽样设计。