第十章非抽样误差及其控制
- 格式:ppt
- 大小:435.50 KB
- 文档页数:18
采样误差和非抽样误差的区别与处理在统计学中,我们经常会遇到两种类型的误差,即采样误差和非抽样误差。
这两种误差在数据分析和研究中起着重要的作用,正确地理解它们的区别,并采取相应的处理方法,对于保证研究的准确性和可靠性至关重要。
首先,我们来了解一下采样误差。
采样误差是由于从总体中选择样本而引入的误差。
当我们进行抽样调查或实验时,往往无法对整个总体进行研究,而只能从中抽取一部分样本进行研究。
由于样本的选择是随机的,因此样本与总体之间会存在差异。
这种差异就是采样误差。
采样误差的大小取决于多个因素,包括样本容量、样本选择方法和总体特征等。
通常情况下,样本容量越大,采样误差越小,因为大样本更能代表总体的特征。
此外,合理选择样本的方法也可以降低采样误差的大小。
例如,使用简单随机抽样、分层抽样或系统抽样等方法,可以确保样本具有代表性。
然而,除了采样误差之外,我们还需要考虑非抽样误差。
非抽样误差是指除了采样过程中引入的误差之外的其他误差来源。
这些误差可能来自于调查设计、数据收集、数据处理和数据分析等环节。
非抽样误差的存在可能导致结果的偏差和不准确性。
非抽样误差的处理需要根据具体情况进行。
首先,我们应该在研究设计阶段尽可能减少非抽样误差的产生。
合理设计调查问卷、合理选择调查对象和采用标准化的数据收集方法,都可以降低非抽样误差的大小。
其次,在数据处理和分析过程中,我们需要注意非抽样误差的影响,并采取相应的纠正措施。
例如,通过加权处理或使用回归分析等方法,可以对非抽样误差进行修正。
此外,我们还可以利用多种方法来评估和控制非抽样误差。
例如,通过进行重复测量或使用多个独立的数据源,可以检验结果的一致性和可靠性。
同时,我们还可以进行敏感性分析,评估不同的假设和方法对结果的影响。
这样可以帮助我们更好地理解非抽样误差的影响,并采取相应的措施进行处理。
总结起来,采样误差和非抽样误差是统计学中常见的两种误差类型。
采样误差是由于样本选择过程引入的误差,可以通过增加样本容量和合理选择样本方法进行减小。
市场调查中非抽样误差的产生和控制摘要:非抽样误差直接与市场调查的准备阶段、抽样阶段、问卷设计阶段、实地访问阶段、统计处理阶段等各阶段的工作质量好坏存在密切的关联。
本文在具体分析这些阶段导致非抽样误差产生的工作情形后,提出了科学设计调查方案、重视对调查员的培训和管理、减少被调查者误差和做好调查资料的汇总工作等几方面控制非抽样误差的对策。
关键词:非抽样误差;调查方案;调查员;被调查者一、非抽样误差的产生非抽样误差产生的原因多种多样,尤其在实施调查过程中最为常见。
非抽样误差直接与调查的准备阶段、抽样阶段、问卷设计阶段、实地访问阶段、统计处理阶段等各阶段的工作质量好坏存在密切的关联。
1.准备阶段准备阶段是整个调查的起始阶段,准备阶段的主要任务是:确定调查任务,设计调查方案,组织调查队伍。
调查设计者首先要列出具体研究目标,从而确定所要研究的问题和识别研究的总体,最后明确调查任务并给整个调查活动一个纲领。
具体说来,设计调查方案包括调查指标的设计、调查总体方案的设计和调查方案可行性研究三方面的内容。
在本阶段可能产生误差的工作主要有:(1)调查设计者可能误解了主办者的目的意图,制定了错误方针,误导研究方向。
(2)目标总体与实际的调查总体不一致。
例如,进行电话访谈时,社区周边的居民用户电话号码可能没有列到电话号码簿中,另一些用户可能已经搬迁而导致电话为空号,因此目标总体和被调查总体出现一定的差异。
(3)调查设计者没有事先预先设定好调查的具体步骤和时间表、可能出现的问题以及未事先培训和挑选恰当的调查员,因而导致计量质量的下降。
(4)预算的限定。
任何调查都有费用,市场调查也同样。
并且由于市场调查的主办者一般都是企业,因此费用上的限制就更为明显。
如果资金短缺,只能缩小研究范围或进一步寻求资金。
上述第一点是调查设计者误解调查主办者的目的,这必然导致系统误差,使调查信度和效度下降。
第二点由于空号的原因,造成缺失值误差。
第三点由于没有预先设定调查步骤和很好的培训访问员,即没有制定标准化的市场调查结构,这样也会降低信度。
非抽样误差产生的原因及控制抽样调查是目前我国搜集统计资料的一种主要方法,但抽样调查的结果始终要受到抽样误差和非抽样误差的影响。
抽样误差是由于样本随机性引起的,根据样本数据计算的对总体目标量的估计是随样本而异的,由此产生的误差即是抽样误差。
抽样误差是不可避免的,其大小可以通过调查样本容量,改变抽样方式等加以控制。
非抽样误差是指除抽样误差以外。
由于各种原因引起的。
非抽样误差由于其产生的原因及其复杂且具有不易观测和非随机性等特点而难以控制。
两种误差构成了总方差,两者之间呈此消彼长的关系。
一般情况下同时减少两类误差是很困难的。
非抽样误差占据了很大的一部分,怎样通过降低非抽样误差,从而降低总方差,有着非常重要的现实意义。
一、非抽样误差分类自1902年K?皮尔逊首次讨论非抽样误差这个概念以来,在非抽样误差的分类上。
主要有以下几种:(一)希里1957年把非抽样误差分为3类:1、范围误差:指由于样本单位的遗漏或重复产生的误差。
2、确定误差:指在资料收集、编辑、编码和计算输入阶段所产生的样本单位特征值的测量误差和回答偏差。
3、替代误差:由于对缺失数据进行替代和(或)在最后估计阶段对缺失数据进行替代所产生的误差。
(二)科克伦把非抽样误差分为3类:1、对被抽选出的样本中的一些单位未能进行计量而产生的误差。
2、一个单位的计量误差。
3、对调查结果进行编辑、编码和汇总过程中产生的误差。
(三)戴伦纽斯1988年把非抽样误差按调查活动分为3类:1、资料搜集过程中产生的误差。
2、测量过程中产生的误差。
3、资料加工过程中产生的误差。
在我国比较常见的分类方式有两种:第一,按性质和处理方法不同分为抽样框误差、无回答误差和计量误差。
第二,按产生的环节不同分为设计误差、调查误差和汇总误差。
二、各类非抽样误差产生的原因1、调查设计过程中引起的误差设计阶段误差是由于这一阶段某些失误而导致调查结果产生的偏误,调查设计有两个主要环节,即调查设计和抽样设计。
非抽样误差又称“工作误差”。
指在调查过程中由于种种人为因素所造成的代表性误差及登记性误差的总称。
前者通常是指调查方案设计有缺陷,如题器或指标含义不清、有诱导性;调查员在实施调查中不遵守随机原则,有意多选较好或较差的单位,等等。
后者是指在记录、汇总、计算、抄写调查数据资料时所发生的差错。
人为因素所造成的代表性误差通常表现为一种系统性的偏差。
它与抽样误差由于随机地观察总体中的一部分单位所造成的样本统计量的波动而产生的代表性误差有着明显的不同。
抽样误差是围绕分布中心所表现出的没有方向性的非系统性的误差,工作误差则是稳定的、有方向性的系统性偏差。
避免非抽样误差的主要措施是:(一)严格遵守随机原则,规定应抽选作为样本的调查对象都必须一一调查,不能随便更换、减少或增加,避免有意多选较好或较坏的调查对象来达到自己原定要说明某个问题的目的;(二)搞好问卷设计,严守客观公正的原则,避免题器设计所产生的诱导性因素,并努力使调查项目所涉及的概念指标尽可能地操作化到清晰、明确、唯一的程度; (三)认真培训调查登记人员,做好一切必要的准备工作,尽量不发生填表、登记之类过程中的差错。
原因分析引起非抽样误差的原因很多,比如抽样框不齐全,访问员工作经验有限,被访者不配合访问而加以虚假的回答,问卷设计本身存在缺陷等等。
通常,在技术性调查中,会出现由于缺乏回答知识而产生的非抽样误差。
另外两种类型的非抽样误差是选择误差和数据处理误差。
当调查中包含不恰当的项目时,就会生产选择误差。
假设设计一个抽样调查,来描述有胡须的男人外观。
对“有胡须的男人”的理解,如果有些采访人员认为应包括有小胡子的男人,而其他采访人员则不这样认为,这样,调查的结果资料将有缺陷。
当有登记错误或输入错误时,就会出现数据处理误差。
如将调查表中的资料输入计算机时产生的错误,即为输入错误。
尽管在大多数的调查中,会出现一些非抽样误差,但通过周密的计划可使它们达到最小,这些计划包括注意保证抽样总体与目标总体的一致、遵循良好调查表的设计原则、培训采访人员等。
浅谈抽样调查中的非抽样误差[摘要]在统计实践中,由于调查经费和时间的限制,往往不可能采取全面调查,而只能采取抽样调查的方法,抽样调查过程中由于抽样总体的代表性及人为因素的影响,必不可少地会产生误差。
因此从理论上讲非抽样误差应该是可以避免的,但在实际工作过程中是很难做到的,本文主要谈非抽样误差产生的原因及应对的办法。
[关键字]抽样调查;分类;原因;对策1统计误差的分类统计误差即调查误差。
统计误差的来源是多方面的,按最简单的分类方法,误差分为抽样误差和非抽样误差。
抽样误差是由于抽样的随机性引起的,一般意义上来说是不可避免、难于消灭,只能加以控制的。
随着科学的进步,对于抽样误差的控制和测算,已发展出了非常深厚的理论体系。
而非抽样误差是指除抽样误差以外所有的误差总和,应该说非抽样误差的产生贯穿了调查的每一个环节,任何一个环节出错都有可能导致非抽样误差增加而使数据失真,某种程度上讲,非抽样误差决定着一项调查活动的成败。
非抽样误差是由于调查程序执行中的错误和不足引起的。
2非抽样误差产生的原因引起非抽样误差的原因很多,概括起来,主要有以下原因:2.1设计阶段引起的误差。
调查设计有两个主要环节,即调查方法设计与抽样设计。
设计误差主要有调查设计误差和抽样设计误差。
调查设计误差主要指问卷设计产生的误差。
在问卷调查中,由于问卷设计有缺陷、指标的概念和范围不明确等,造成调查员或被调查对象对调查目的理解上的偏差而提供不正确的信息。
抽样设计阶中的问题主要是抽样框的问题。
一个理想的抽样框所包含的单元应与总体单元完全一致,但是实际工作中使用的抽样框与真正应有的调查抽样框之间存在一定的偏差,它或包含了某些不属于我们调查对象的单元,或丢失了一些应该列入调查范围的调查对象。
2.2调查阶段产生的误差。
调查过程中产生误差的成因主要有:①调查员操作程序不规范,在调查中不按照规范要求进行操作,如没有按照事先预定好的步骤进行访问、没有完全按照问卷上的措辞进行访问、调查员为了得到答案对被调查者进行诱导;记录误差,即调查员在听、理解和记录被调查者回案时产生的误差,如被调查者对某问题还没有给出准确的答案时或调查员没有及时记录被调查者的回答时,调查员就根据自己的意识或理解填上答案;因调查员的访问技巧而产生的误差,典型的如开放题的答案,需要更多的信息时调查员没有进一步询问而产生的误差;调查员作弊造成的误差。