浅谈统计调查及统计调查误差的种类
- 格式:docx
- 大小:16.70 KB
- 文档页数:3
统计学基础知识名词解释及简答题一、名词解释1、统计学统计学是一门阐明如何去采集、整理、显示、描述、分析数据和由数据得出结论的一系列概念、原理、原则、方法和技术的科学,是一门独立的、实用性很强的通用方法论科学。
2、指标和标志标志是说明总体单位属性或特征的名称。
指标是说明总体综合数量特征和数量关系的数字资料。
3、总体、样本和单位统计总体是统计所要研究的对象的全体,它是由客观存在的、具有某种共同性质的许多个体所构成的整体。
简称总体。
构成总体的个体则称为总体单位,简称单位。
样本是从总体中抽取的一部分单位。
4、统计调查统计调查是根据统计研究的目的和要求、采用科学的方法,有组织有计划的搜集统计资料的工作过程。
它是取得统计数据的重要手段。
5、统计绝对数和统计相对数反映总体规模的绝对数量值,在社会经济统计中称为总量指标。
统计相对数是两个有联系的指标数值之比,用以反映现象间的联系和对比关系。
6、时期指标和时点指标时期指标是反映总体在一段时期内累计总量的数字资料,是流量。
时点指标是反映总体在某一时刻上具有的总量的数字资料,是存量。
7、抽样估计和假设检验抽样估计是指根据所抽取的样本特征来估计总体特征的统计方法。
假设检验是先对总体的某一数据提出假设,然后抽取样本,运用样本数据来检验假设成立与否。
8、变量和变异标志的具体表现和指标的具体数值会有差别,这种差别就称为变异。
数量标志和指标在统计中称为变量。
9、参数和统计量参数是反映总体特征的一些变量,包括总体平均数、总体方差、总体标准差等。
统计量是反映样本特征的一些变量,包括样本平均数、样本方差、样本标准差等。
10、抽样平均误差样本平均数与总体平均数之间的平均离散程度称之为抽样平均误差,简称为抽样误差。
重复抽样的抽样平均误差为总体标准差的1/n。
11、抽样极限误差抽样极限误差是指样本统计量和总体参数之间抽样误差的可能范围。
我们用样本统计量变动的上限或下限与总体参数的绝对值表示抽样误差的可能范围,称为极限误差或允许误差。
谈谈对抽样调查方法及误差的理解通过对抽样调查理论与方法的学习,我对此知识有了更深一层的了解,下面是我的学习心得与总结。
抽样调查是根据部分实际调查结果来推断总体标志总量的一种统计调查方法,属于非全面调查的范畴。
它是按照科学的原理和计算,从若干单位组成的事物总体中,抽取部分样本单位来进行调查、观察,用所得到的调查标志的数据以代表总体,推断总体。
抽样调查为科学研究方法中重要技术之一,是指就所要研究的某特定现象之母群体中,依随机原理抽取一部份作为样本(Sample),以为研究母群体(Population)之依据。
将样本研究结果,在抽样信赖水准内,推算母群体可能特性以为决策之参考。
抽样调查之优点:1.利用抽样技术及机率理论,可获得既定精确估计值,以代表母群体特征。
2.节省调查人力,物力,时间及经费。
3.经由少数优秀人员施予特殊训练及配合特殊设备,施行调查,可得较深入且正确调查结果。
故在实地市场调查中,抽样调查为一不可或者之工具。
抽样调查基本目的乃在信息之搜集作成结论,以供决策参考。
有效抽样调查应具有准则有下:1.有效原则抽样调查应该(1)符合调查目的之需要,(2)所获信息价值应超过所支付成本。
2.可测量原则抽样的正确程度必须能够测量,否则抽样调查就失去意义。
3.简单原则抽样调查必须保持简单性要求。
俾使抽样调查顺利进行,以避免不必要之节外生枝。
针对抽样调查的方法,我们可以将其简单的分为两大类:1.随机抽样(Probability-Sampling),即在抽样时,母群体中每一个抽样单位被选为样本之机率相同。
随机抽样具有健全之统计理论基础,可用机率理论加以解释,是一种客观而科学的抽样方法,在市场调查中通常都用随机抽样。
2.非随时抽样(Non-Probabity-Sampling),在抽样时,抽样单位被选为样本之机率为不可知。
非机率抽样之种类,主要有四种:(1).便利抽样(Convenience Sampling)在样本之选择只考虑到接近样本或衡量便利。
统计误差成因及其对策分析作者:吴岩来源:《企业文化·中旬刊》2014年第04期摘要:统计误差产生的原因十分复杂,误差种类繁多,因而,统计误差的控制是一项非常复杂的工程。
为此,我们必须对统计误差的种类及产生原因进行全面深入的分析,并在此基础上建立一个具有标本兼治、防控结合的统计误差控制系统,以达到全面控制统计误差的目的。
关键词:统计;误差;成因;对策一、统计误差的成因1.统计设计误差。
此类误差是指统计的设计者和组织者对统计的目的、总体、总体单位,统计内容、统计指标、统计方法、统计制度等设计不完善、不科学而导致的。
产生这种现象的原因可能是多方面的,有可能设计者带有较强的主观意愿,对问题的设置存在有意无意的诱导、遗漏、顺序不当、文字晦涩难懂、方案设计不周、取样方法设计不当,估计方法设计偏差、保管设计差错等。
2.统计调查误差。
统计调差误差是指在统计调查阶段由于调查者和被调查者工作配合失误,导致调查结果不能绝对反映真实情况,我们将这种调查所得的统计数字和调查总体实际数量之间的差别成为统计调查误差。
根据产生误差的过错方可将其分为由调查者引起和被调查者引起;而根据误差的产生的性质将其分为登记误差和代表性误差。
2.1由调查者引起的登记误差往往来自于调查人自身素质不高、专业性不强,对问题的理解脱离了调查的目的,或者出于主观原因故意进行诱导,在调查过程中减少提问的问题、提问方式不当、结果记录错误等。
另外,调查者有意识的弄虚作假、虚报瞒报也会产生此类误差。
这种登记误差属于一种过失性误差,责任应由调查者负责。
由调查者引起的代表性误差成因较为复杂,在需要进行测量或者计量的调查过程中,不精确的测量或计量工具导致测量结果与实际结果偏差属于此类误差。
除此之外,代表性误差发生在非全面调查中。
非全面调查用总体中的一部分单位数据推断总体数量数据,因此在抽样过程中可能会产生两类误差:一是在随机抽取样本时破坏了随机原则,或者在重点或典型调查中缺少对重点和典型单位的定性分析;这样抽取出来的样本与真实数据相差较大。
统计学第一章1.什么是统计学?怎样理解统计学与统计数据的关系?答:统计学是一门收集、整理、显示和分析统计数据的科学。
统计学与统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法以致于统计学就失去了其存在意义。
2.简要说明统计数据的来源答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学实验,在社会经济管理领域,主要通过统计调查方式来获得,如普查和抽样调查。
间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得。
3.简要说明抽样误差和非抽样误差答:统计调查误差可分为非抽样误差和抽样误差。
非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。
抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。
4.答:(1)有两个总体:A品牌所有产品、B品牌所有产品(2)变量:口味(如可用10分制表示)(3)匹配样本:从两品牌产品中各抽取1000瓶,由1000名消费者分别打分,形成匹配样本。
(4)从匹配样本的观察值中推断两品牌口味的相对好坏。
第二章、统计数据的描述思考题1描述次数分配表的编制过程答:分二个步骤:(1)按照统计研究的目的,将数据按分组标志进行分组。
按品质标志进行分组时,可将其每个具体的表现作为一个组,或者几个表现合并成一个组,这取决于分组的粗细。
按数量标志进行分组,可分为单项式分组与组距式分组单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围(区间)作为一个组。
统计分组应遵循“不重不漏”原则(2)将数据分配到各个组,统计各组的次数,编制次数分配表。
2.解释洛伦兹曲线及其用途答:洛伦兹曲线是20世纪初美国经济学家、统计学家洛伦兹根据意大利经济学家帕累托提出的收入分配公式绘制成的描述收入和财富分配性质的曲线。
洛伦兹曲线可以观察、分析国家和地区收入分配的平均程度。
3. 一组数据的分布特征可以从哪几个方面进行测度?答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。
浅谈非抽样误差的控制摘要:在统计调查工作中,无论是全面调查还是抽样调查,都存在误差。
非抽样误差是指除抽样误差之外的,由其它原因所引起的误差。
非抽样误差广泛地存在于统计调查工作中,不但在抽样调查中存在,也存在于全面调查中。
现就非抽样误差分类及成因、控制办法进行了探讨。
关键词:非抽样误差;产生原因;分类;控制在统计调查工作中,无论是全面调查还是抽样调查,都存在误差。
误差可以分为抽样误差和非抽样误差。
抽样误差是指仅根据对总体的一部分而不是全部的调查来估计总体的特征所带来的误差,它仅存在于抽样调查中。
抽样误差的大小是可以计量的,并能够通过调整样本容量大小、抽样方式等手段进行控制。
非抽样误差是指除抽样误差之外的,由其它原因所引起的误差。
它广泛地存在于统计调查工作中,不但在抽样调查中存在,也存在于全面调查中。
由于非抽样误差产生的原因具有多样性和复杂性,所以抽样误差的测定和控制难度很大。
1 非抽样误差的种类自1902年K·皮尔逊首次讨论非抽样误差这个概念以来,在非抽样误差的分类上。
主要有以下几种:1.1希里1957年把非抽样误差分为三类(1)范围误差:指由于样本单位的遗漏或重复产生的误差。
(2)确定误差:指在资料收集、编辑、编码和计算输入阶段所产生的样本单位特征值的测量误差和回答偏差。
(3)替代误差:由于对缺失数据进行替代和(或)在最后估计阶段对缺失数据进行替代所产生的误差。
1.2科克伦把非抽样误差分为三类(1)对被抽选出的样本中的一些单位未能进行计量而产生的误差。
(2)一个单位的计量误差。
(3)对调查结果进行编辑、编码和汇总过程中产生的误差。
1.3戴伦纽斯1988年把非抽样误差按调查活动分为三类(1)资料搜集过程中产生的误差。
(2)测量过程中产生的误差。
(3)资料加工过程中产生的误差。
根据我国实际,我们可以把误差根据工作阶段,分为三类:一类是与调查设计有关的误差,即在调查设计阶段产生的误差;一类是在调查过程中产生的误差;一类是在数据整理过程中产生的误差。
统计调查方法主要包括篇一:统计调查方法与实务总复习统计调查方法与实务总复习考试题型:1、单项选择(每小题1分,共计20分)2、多项选择题(每小题2分,共计10分)3、名词解释(每小题4分,共计20分)4、简答题(每小题10分,共计30分)5、计算题(每小题10分,共计20分)第一章统计调查概述1.统计调查的涵义调查的概念有广义与狭义之分。
广义的调查是指任何有意地搜集信息的活动。
而狭义的调查是指任何有意且系统地搜集信息的活动。
与广义调查中的非狭义调查相比,狭义调查具有三个特点:即特写目标、科学方法和规范程序。
2.统计调查的作用——8个方面(1)可以沟通信息传递者和接受者之间的信息传递和交流;(2)可以认识和把握社会经济发展变化的规律;(3)可以为经营管理决策提供社会经济信息;(4)可以帮助企业开拓社会经济、开发新产品;(5)可以帮助企业提高社会经济竞争力;(6)可以充实和完善企业营销信息系统;(7)可以研究和预测人类的行为;(8)可以促使企业改善经营管理、提高经济效益。
3.统计调查的分类——3个角度的分类14.统计调查误差——概念及种类概念:调查所得数据与调查对象实际数量间的差异。
种类:1、抽样误差根据对总体的一部分的调查来估计总体特征所引起的误差。
在抽样调查中,样本只是总体的一部分,它对总体的代表性存在的局限,无论抽样方法多么科学,调查研究工作的控制如何严密,样本也不可能与总体完全吻合,抽样误差必然存在。
2、非抽样误差调查过程中除抽样以外的各种误差。
通常认为是由于调查程序执行中的错误与不足引起的。
但即使错误没有发生,调查结果与现实仍然存在差异。
如测量值与实际值之间的偏差。
其中,非抽样误差包括:(1)抽样框误差(2)无回答误差(3)计量误差(4)处理误差5.统计调查客体的种类、调查客体的属性和特征2(1)状态与事实——指调查客体的基本情况,可用一些客观指标来表示。
如年龄、职业、收入水平等。
自变量(2)态度与意见——调查客体的一种内在属性,是一种主观性变量。
初级统计师《专业知识》考点:抽样误差抽样平均误差是指所有可能出现的样本指数的标准差。
我们把抽样平均误差简称为抽样误差,并用希腊字母μ来表示。
1.抽样误差的概念(1)抽样误差统计误差:是指在统计调查中,调查资料与实际情况间的偏差。
即抽样估计值与被估计的未知总体参数之差.统计误差按产生来源分:登记误差和代表性误差登记误差:又称工作误差或调查误差,是指在调查过程中,由于各种主观或客观的原因而引起的误差。
调查范围越广,规模越大,误差的可能性就越大代表性误差:在抽样调查中,用样本推断总体所产生的误差。
抽样误差:指在遵循了随机原则的条件下,不包括登记误差和系统误差在内的,用样本指标代表总体指标而产生的不可避免的误差。
由于总体平均数、总体成数是唯一确定的,而样本平均数、样本成数是随机变量,因而抽样误差也是一个随机变量。
抽样误差越小,说明样本的代表性越高;反之,样本的代表性越低。
同时抽样误差还说明样本指标与总体指标的相差范围,因此,它是推断总体指标的依据。
抽样误差是统计推断所固有的,虽然无法避免,但可以运用数学公式计算。
因此,抽样误差也称为可控制的误差。
(2)影响抽样误差的因素①抽样单位的数目:数目越大,越接近总体。
②总体被研究标志的变异程度:抽样误差和总体标志的变异程度成正比变化。
③抽样方法的选择:不重复抽样比重复抽样的抽样误差小。
④抽样组织方式不同。
不同的抽样组织所抽中的样本,对于总体的代表性也不同。
2.抽样平均误差的计算(1)抽样平均误差的涵义抽样误差有抽样实际误差和抽样平均误差两种。
抽样实际误差是指某一次抽样结果所得到的样本指标与总体指标数值之差。
抽样实际误差不能用来概括一系列抽样结果可能产生的所有误差,因此为了用样本指标去推算总体指标,需要计算这些误差的平均数,即抽样平均误差,用它来反映抽样误差的平均水平。
抽样平均误差是指所有可能出现的样本指数的标准差。
我们把抽样平均误差简称为抽样误差,并用希腊字母μ来表示。
摘要:随着社会的发展,统计调查作为各信息的来源势必会越来越受到人们更多地关注,也势必会有越来越多的人参与到统计调查活动中来。
本文从统计调查的概念出发,通过对统计调查和其它调查的区别解释统计调查,并正确区分统计调查与非统计调查、理解统计调查的种类、统计调查误差的种类及其特征和产生的原因,这些问题是参与和搞好统计调查、提高统计调查质量的基本前提。
关键词:统计调查;误差;统计调查质量
一、统计调查的概念
统计调查不仅要有明确的调查对象,而且调查对象是由具有某一或某些共同特征的许多个体构成的总体,同时构成总体的个体数要足够地多,除此之外,还要求调查的个体单位数也要足够地多。
统计调查对构成总体的许多独立个体的调查不是目的,综合与提炼许多独立个体信息资料才是统计调查的真正目的。
因此,统计调查所获资料的真实、准确与否,直接取决于个体提供的信息资料是否真实、准确。
而统计个体之所以有可能提供不真实、不准确的个体信息资料,是因为统计个体担心一旦提供了个体真实、准确的信息资料可能会为自己、他人或相关部门带来不必要的麻烦。
不过,从统计调查的真实目的来看,统计个体的信息资料根本不是统计调查所关注的信息资料,个人信息资料只作为一种信息载体出现,仅起到显现总体一般属性或数量特征的作用———从对个体信息资料进行深入的加工、综合中提炼出总体的一般属性或数量特征。
二、统计调查的种类
众所周知,信息化时代信息的主体是统计信息,统计信息的获取建立在统计调查的基础之上。
统计调查搜集到的个体信息资料的真实、准确与否将直接影响信息化时代信息的质量。
统计调查获取个体信息资料的方式方法的不同决定了不同种类的统计调查获取个体信息资料质量的差异。
统计调查按是否对构成总体的全部个体进行调查,可以划分为全面统计调查与非全面统计调查两类。
全面统计调查指的是对构成总体的所有个体进行的调查,即要搜集总体中所有个体的个体信息资料的一种调查。
再按对总体中个体信息资料收集方式的不同,全面统计调查又可以划分为普查和全面统计报表两种。
普查通常通过调查员借助普查表直接向个体搜集其信息资料的一种调查方式。
非全面统计调查指仅从构成总体的全部个体中选取部分个体进行的调查。
非全面调查又因从全部个体中所选部分个体的方式不同,分为抽样调查和非抽样调查。
所谓抽样调查指从构成总体的所有个体中按照随机性原则选取部分个体的调查。
同时,抽样调查又根据随机性原则在具体使用上的差异可以将抽样调查划分为简单随机抽样、系统随机抽样、分层随机抽样、整群随机抽样以及多阶段随机抽样等。
另一方面,若从构成总体的所有个体单位中没有遵循随机性原则而选取部分个体单位进行调查,则这样的统计调查称之为非抽样调查。
生活中常用的非抽样调查主要有重点调查、典型调查和滚雪球调查等。
因此,无论在抽样调查的理论研究方面,还是在抽样调查的实际应用中,抽样调查正越来越受到人们的重视。
三、统计调查误差的种类及特征
1、统计调查误差的概念。
通常人们把由统计调查获取个体信息并综合得到的总体规律性与总体实际客观规律性之间的差异称之为统计误差。
这种统计误差反映在统计调查指标上,就是由调查个体所得总体指标数值与总体实际指标数值之间的差别。
2、登记性统计调查误差、特征及其产生的原因。
统计误差通常可以分为登记性统计误差和代表性误差两大类。
所谓登记性误差就是指由于调查者或被调查者的主观原因而导致调查所得总体指标与总体实际指标之间的差异。
登记性统计误差具有如下两大基本特征:一是登记性统计误差从理论上而言是可以完全避免的,但是,在实际统计调查中,登记性统计误差又不可避免。
二是登记性统计误差一旦产生,误差的大小又不可以计量。
从理论上来说,只要被调查者提供了真实、准确的个体信息资料,而且调查者能准确记录与整理分析这些个体信息资料,就可以避免登记性统计误差的产生。
事实上,统计总体中的个体可能会基于各种考虑或顾虑不愿提供真实、准确的个体信息资料。
根源在于被调查者可能根本不理解统计调查的真实目的,或者把统计调查混同于非统计调查。
在我国当前国民参与统计调查意识比较薄弱、基本统计常识比较缺乏以及保护统计个体信息资料的法律、法规还不健全的现实条件下,要避免这种登记性误差几乎是不可能的再者,即使调查总体中的个体主观想提供真实、准确的个体信息资料,但是由于被调查的个体缺少必要的数据记录,或没有相关数据,或个人信息资料记忆有误也可能无法提供真实、准确的个人信息资料。
如在我国农村居民年收支情况的调查中,有些农村居民不是不想告诉你某年收支的准确数据,而是有些农村居民从来就没有对自己的年收支核算过,也没有详细的收支记录。
另一方面,即使被调查的个体提供了真实、准确的个体信息资料,也可能因调查者数据记录不熟练、责任心不强造成记录错误,或者发生数据丢失以及分析、整理个体信息资料有误等,也会产生登记性统计误差。
最后,不论何种原因一旦导致了登记性误差的产生,登记性统计误差的大小是无法准确计量的。
这是因为被调查者提供的个体信息资料中不真实、不准确的程度有多大、调查记录中有多少差错、个体信息资料整理、分析中又有多大差错等,在实际统计调查中均是不可测度的。
综上所述,由于统计调查区别于非统计调查的特征之一就是要对构成总体的个体进行独立地调查,因此不管是全面统计调查还是非全面统计调查、不管是抽样调查还是非抽样调查都会产生登记性统计调查误差。
3、代表性统计误差、特征及产生的原因。
所谓代表性统计误差指仅对构成总体的所有个体中部分个体进行调查,且仅仅根据这部分个体提供的信息资料综合提炼出关于这部分个体的一般数量特征(如部分个体的均值),并据此对总体实际均值做出判断所产生的一种差异。
代表性统计误差可以根据它是来自抽样调查还是非抽样调查区分为抽样误差(也称随机误差)和系统性误差两类。
由抽样调查所产生的代表性误差称之为抽样误差,由非抽样调查所产生的代表性误差称为系统性统计误差。
抽样误差具有如下基本特征:从理论上来说抽样误差无法避免,但是,在实际抽样调
查中,抽样误差不仅可以采取一定手段加以防范和控制而且其大小也可以计算。
一方面,
代表性误差产生的根源在于构成总体的所有个体的普遍规律性不可能由其中的部分个体完
全显现,否则,它就违背了部分与整体的基本哲学关系。
另一方面,抽样调查从总体中选
取部分个体时,尽管确保了每一个个体都有同等被选中的可能性,使得所选中的部分个体
的构成与总体中所有个体的构成趋于一致,由此保证了选中的部分个体的数量特征能反映
总体中所有个体的数量特征。
然而,总体中的某个个体能否最终被选中又具有一定的随机性,从而使得所选中的部分个体数量特征又不能完全反映总体中所有个体的数量特征。
由
此表明,抽样误差不可避免。
数理统计关于抽样的原理已经表明:只要采用适当的方法对构成总体中的所有个体先
做适当的编排或分组,然后再遵循随机性原则抽选个体,就可以有效地降低抽样误差的大小。
即在样本容量一定的前提下,对同一现象总体分别采用分层随机抽样、系统随机抽样、整群随机抽样和简单随机抽样,其抽样误差是有显著差异的。
另外,在其他条件相同的情
况下,变重复抽样为不重复抽样也可以适当减小抽样误差。
系统性代表误差具有如下基本
特征:从理论上来说系统性代表误差是完全可以避免的,但是,系统性代表误差一旦产生
其大小又是不可计量的。
系统性代表误差产生的根源在于:在从构成总体的所有个体中选
取部分个体时没有遵循随机性原则,而是主观地、或部分主观地从总体中选取个体作为调
查单位。
因此,人们在实际统计调查中,如果能有意识地不受主观因素的影响、自觉地遵循随
机性原则抽选部分个体,就可以避免系统性误差的产生。
四、结语
随着我国社会、经济改革开放程度的不断深入和社会主义市场经济体系的不断完善,
社会各个阶层及个人对信息的种类、数量和质量的需求也在不断改变。
统计调查作为各种
信息的根本来源势必会越来越受到人们更多地关注,也势必会有越来越多的人参与到统计
调查活动中来。
通过分析不同调查现象总体的具体特征,根据统计调查的实际需要选择适
当的调查方式方法,分析各种统计调查误差产生的可能原因,就可以有针对性地采取必要
的手段防范某些统计调查误差的产生,从而实现在调查成本不变的情况下,有效地提高统
计调查的数据质量。