四种判别粗大误差准则的比较与讨论
- 格式:pdf
- 大小:869.88 KB
- 文档页数:4
粗大误差判别准则在H—ADCP流速关系率定中的应用比较【摘要】在现代流量测验过程中,声学多普勒流速剖面仪(Acoustic Doppler Current Profiler)简称为ADCP,因具有高效、经济、快速、精确的特点,得到广泛应用。
其中水平式ADCP(H-ADCP)则是通过测量代表流层的流速,进而推算得到断面流量。
因H-ADCP本身测验方法的限制,在代表流速关系率定时,存在粗大误差的可能,使得关系线偏离,最终导致流量测验准确度降低。
本文将以粗大误差判别的几种准则为切入点,分析和比较其在H-ADCP流速关系率定中的应用。
【关键词】流量测验;粗大误差;水平式ADCPA Comparative Investigation on Application of Gross Error Criterion in H-ADCP Calibration of Velocity RelationsAbstracts:In the process of contemporary discharge measurement,Acoustic Doppler Current Profiler (ADCP)has been widely applied,as it owns such features as high efficiency,low cost,rapid speed,and precise accuracy. Among which,Horizontal Acoustic Doppler Current Profiler (H-ADCP)can calculate the section flows by means of testing the velocity of representative flow layer. However,due to the limitation of the H-ADCP,the calibration of representative velocity relations shows the possibility of gross error,which leads to the departure of relations curve. In this case,the accuracy of discharge measurement will be diminished. This investigation will be carried out from the standards of gross error evaluation,and its application in H-ADCP calibration of velocity relations will be analyzed and compared.Keyword:Discharge Measurement;Gross Error;H-ADCP1、引言声学多普勒流速剖面仪(Acoustic Doppler Current Profiler)简称为ADCP,它利用多普勒效应原理进行流速测量。
粗大误差四种判别准则的比较粗大误差是指在测量过程中,偶尔产生的某些不应有的反常因素造成的测量数值超出正常测量误差范围的小概率误差。
含有粗大误差的数据会干扰对实验结果的分析,甚至歪曲实验结果。
若不按统计的原理剔除异常值,而把一些包含较大正常误差但不属于异常值的数据舍弃或保留一些包含较小粗大误差的异常值,就会错估了仪器的精确等级。
因此,系统检验测量数据是否含有粗大误差是保证原始数据的可靠及其有关计算的准确的前提。
排除异常数据有四种较常用的准则,分别是拉伊达准则、格拉布斯准则、肖维勒准则和狄克逊准则。
每种判别准则都有其处理方法,导致用不同准则对异常值判别的结果有时会不一致。
目前异常值的剔除还没有统一的准则,本文综合判别粗大误差四种方法的特点,系统归纳各种准则的应用,以便更好地发现和判别含有粗大误差的数据。
1.四种判别粗大误差准则的特点1.1拉伊达准则拉伊达准则[4]是以三倍测量列的标准偏差为极限取舍标准,其给定的置信概率为99.73%,该准则适用于测量次数n>10或预先经大量重复测量已统计出其标准误差σ的情况。
Xi为服从正态分布的等精度测量值,可先求得它们的算术平均值 X、残差vi和标准偏差σ。
若|Xi- X|>3σ,则可疑值Xi含有粗大误差,应舍弃;若|Xi- X|≤3σ,则可疑值Xi为正常值,应保留。
把可疑值舍弃后再重新算出除去这个值的其他测量值的平均值和标准偏差,然后继续使用判别依据判断,依此类推。
1.2格拉布斯准则格拉布斯准则适用于测量次数较少的情况(n<100),通常取置信概率为95%,对样本中仅混入一个异常值的情况判别效率最高。
其判别方法如下:先将呈正态分布的等精度多次测量的样本按从小到大排列,统计临界系数G(a,n)的值为G0, 然后分别计算出G1、Gn:G1=( X-X1)/σ,Gn=(Xn- X)/σ (1)若G1≥Gn且G1>G0,则X1应予以剔除;若Gn≥G1且Gn>G0,则Xn应予以剔除;若G1<G0且Gn<G0,则不存在“坏值”。
粗大误差的剔除的四种准则粗大误差的剔除,哎呀,这可是个大话题,咱们平常做实验、搞研究的时候,常常会碰上那些“调皮捣蛋”的数据,它们就像小孩子一样,总爱跑偏。
今天咱们就聊聊,这四种准则,帮助我们把这些“捣乱分子”踢出局。
先说说第一种准则,大家都知道的——极端值法。
这一招就像是大排档里那些大菜,一眼就能看出来,放眼望去,如果某个数据跟其他的完全不搭调,就该打上“叉”了。
想象一下,大家都在吃水饺,结果你一上来就给大家端了个榴莲,这不就是极端值嘛,果断剔除,谁爱吃谁吃去。
再说说第二种准则,标准差法,听上去挺高大上的,其实也没啥,简单来说,就是把数据的波动性考虑进去。
数据之间要有个“家族感”,如果有某个数据孤零零的站在一边,距离其他数据太远,那可就得考虑是不是有问题了。
就像打麻将,四个人围着,突然你有个五个的牌,那肯定不对劲,哎哟,赶紧检查一下。
接着是第三种准则,啥?比值法,这个可以算是个“盲盒”玩法。
你得看看数据之间的比例关系,假如比例失衡,那就得好好瞅瞅了。
就像你跟朋友一起去喝酒,他喝了十瓶,你才喝了一口,那明显不对嘛,赶紧问问怎么回事。
最后一个,离群值法,名字听起来就很神秘,其实就是识别那些不合群的数据。
生活中总有些人,哪怕人群再热闹,他们的存在感也弱得可怜,像个隐形人。
数据也是一样,如果有某个数据跟大多数差得离谱,就得认真思考,究竟是数据出问题,还是测量的过程出了纰漏。
这四个准则,就像咱们生活中的小规则一样,大家都得遵守。
想想看,如果不把这些“糟心”的数据剔除掉,咱们的结论岂不是跟瞎子摸象一样,摸来摸去,根本不知道对不对。
这就好比大家一起去春游,结果你背了个五十斤的包,别的同学轻装上阵,结果到了目的地,你累得跟条狗似的,整场活动都没法好好玩儿了。
所以啊,剔除粗大误差,绝对是研究工作中的一门艺术,也是科学精神的体现,务必不能马虎。
说到底,数据就像一颗颗珍珠,得把那些不合适的剔除,才能串成一条闪闪发光的项链。
判别粗大误差的准则引言在测量和统计领域,精确度和准确度是非常重要的概念。
准确度是指测量结果与真实值之间的接近程度,而精确度是指多次测量结果之间的一致性。
然而,在实际应用中,由于各种原因,可能会出现误差,其中包括粗大误差。
粗大误差是指显著偏离真实值的异常观测值或数据点。
它可能由仪器故障、操作失误、环境变化等多种因素引起。
为了保证数据的可靠性和准确性,判别并排除这些粗大误差是必要的。
本文将介绍判别粗大误差的准则,并提供一些常用的方法和技术来检测和处理这些异常观测值。
判别粗大误差的准则1. 样本点与平均值之间的偏离程度判断一个样本点是否为粗大误差可以通过计算其与平均值之间的偏离程度来进行。
常用的方法有使用标准差或者残差来衡量。
•标准差:计算所有样本点与平均值之间的差异,并根据标准差的大小来判断是否为粗大误差。
一般来说,如果一个样本点与平均值之间的差异超过平均差异的两倍或三倍,就可以被视为粗大误差。
•残差:对于回归分析等情况,可以计算每个样本点的残差(观测值与拟合值之间的偏差),并根据残差的大小来判别是否为粗大误差。
通常情况下,如果一个样本点的残差超过平均残差的两倍或三倍,就可以被视为粗大误差。
2. 离群点检测离群点是指在数据集中与其他数据点明显不同的观测值。
离群点可能是由于异常情况、错误测量、记录错误等原因导致。
判别离群点可以使用以下方法:•离群因子(Outlier Factor):通过计算每个观测值周围其他观测值的密度来判断其是否为离群点。
如果一个观测值周围其他观测值的密度较低,则可以被认为是离群点。
•基于距离的方法:通过计算观测值与其他观测值之间的距离来判断其是否为离群点。
如果一个观测值与其他观测值之间的距离明显大于平均距离,则可以被认为是离群点。
•箱线图(Box Plot):通过绘制数据的箱线图来判断是否存在离群点。
箱线图展示了数据的四分位数和异常值,如果一个观测值超过上下四分位数的1.5倍或3倍,可以被视为离群点。
粗大误差四种判别准则的比较和应用
熊艳艳;吴先球
【期刊名称】《大学物理实验》
【年(卷),期】2010(023)001
【摘要】目前数据处理中异常值的剔除方法有多种,并没有统一的规范标准,分析了判别粗大误差的四种方法的特点,通过综合归纳给出了应用这些判别准则的建议.【总页数】3页(P66-68)
【作者】熊艳艳;吴先球
【作者单位】华南师范大学,广东广州510006;华南师范大学,广东广州510006【正文语种】中文
【中图分类】G642.423
【相关文献】
1.常用费歇判别准则的比较 [J], 周静芋;宋世德;郭满才
2.粗大误差判别准则在H-ADCP流速关系率定中的应用比较 [J], 陈澄;杨阳
3.四种判别粗大误差准则的比较与讨论 [J], 赵海霞;周少娜;肖化
4.基于支持向量的判别准则的比较 [J], 陈姣姣;范丽亚
5.基于粗大误差判别准则的测量列数据的处理与优化 [J], 唐伟;钟伟;段国艳
因版权原因,仅展示原文概要,查看原文内容请购买。
判断粗大误差的三个准则
判断粗大误差的三个准则包括:
1. 实质性误差:通过对数据进行验证和比对,确定是否存在实质性误差。
其中包括数值的偏离和异常值,以及与其他相关数据的不一致性。
2. 逻辑一致性:对数据进行逻辑分析,判断数据之间是否存在逻辑矛盾或不一致的情况。
例如,某个数据值远远超出合理范围,或者一个事件的发生时间在前后存在矛盾。
3. 内在规律性:根据统计原理和经验规律,对数据进行分析,判断数据是否符合预期的分布或趋势。
如果数据的分布与预期不符,或者存在异常的波动,可能存在粗大误差。
这三个准则可以帮助我们发现可能存在的粗大误差,并进行相应的修正和调整,以提高数据的准确性和可靠性。
粗大误差判断准则摘要: 当在测量数据中发现某个数据可能是异常数据时,一般不要不加分析就轻易将该数据直接从测量记录中删除,最好能分析出该数据出现的主客观原因。
判断粗大误差可从定性分析和定量判断两方面来考虑。
定性分析就是对测量环境、测量条...当在测量数据中发现某个数据可能是异常数据时,一般不要不加分析就轻易将该数据直接从测量记录中删除,最好能分析出该数据出现的主客观原因。
判断粗大误差可从定性分析和定量判断两方面来考虑。
定性分析就是对测量环境、测量条件、测量设备、测量步骤进行分析,看是否有某种外部条件或测量设备本身存在突变而瞬时破坏;测量操作是否有差错或等精度测量过程中是否存在其他可能引发粗大误差的因素;也可由同一操作者或另换有经验操作者再次重复进行前面的(等精度)测量,然后再将两组测量数据进行分析比较,或再与由不同测量仪器在同等条件下获得的结果进行对比,以分析该异常数据出现是否“异常”,进而判定该数据是否为粗大误差。
这种判断属于定性判断,无严格的规则,应细致和谨慎地实施。
定量判断,就是以统计学原理和误差理论等相关专业知识为依据,对测量数据中的异常值的“异常程度”进行定量计算,以确定该异常值是否为应剔除的坏值。
这里所谓的定量计算是相对上面的定性分析而言,它是建立在等精度测量符合一定的分布规律和置信概率基础上的,因此并不是绝对的。
下面介绍两种工程上常用的粗大误差判断准则。
1.拉伊达准则拉伊达准则是依据对于服从正态分布的等精度测量,其某次测量误差|Xi -X0|大于3σ的可能性仅为0.27%。
因此,把测量误差大于标准误差σ(或其估计值)的3 倍的测量值作为测量坏值予以舍弃。
由于等精度测量次数不可能无限多,因此,工程上实际应用的拉伊达准则表达式为(1)式中,Xk 为被疑为坏值的异常测量值;为包括此异常测量值在内的所有测量值的算术平均值;为包括此异常测量值在内的所有测量值的标准误差估计值;KL(=3)为拉伊达准则的鉴别值。
第五章粗大误差教学目标本章介绍在测量前或测量后发现粗大误差,如果无法发现并剔除粗大误差,则又如何在测量数据处理中去减小他对测量结果的影响。
通过本章的学习,读者在测量数据处理中知道如何发现并剔除粗大误差。
教学重点和难点§粗大误差产生的原因§ 3σ准则§格拉布斯准则§狄克逊准则§测量数据的稳健处理第一节粗大误差问题概述一、粗大误差对测量数据的影响可疑数据:在一列重复测量数据中,有个别数据与其他数据有明显差异,他可能是含有粗大误差(简称粗差)的数据。
异常值:确定混有粗大误差的数据⑴不恰当地剔除不含粗大误差的正常数据,会造成测量重复性偏好的假象。
⑵未加剔除含粗大误差的不正常数据,必然会造成测量重复性偏低的后果。
粗大误差的数值比较大,它会对测量结果产生的明显的歪曲,一旦发现含有粗大误差的测量值,应将其从测量结果中剔除。
二粗大误差产生的原因1、客观外界条件的原因:机械冲击、外界震动、电网供电电压突变、电磁干扰等测量条件意外地改变,引起仪器示值或被测对象位置的改变而产生粗大误差。
2、测量人员的主观原因测量者工作责任性不强,工作过于疲劳,对仪器熟悉与掌握程度不够等原因,引起操作不当,或在测量过程中不小心、不耐心、不仔细等,从而造成错误的读数或错误的记录。
3、测量仪器内部的突然故障若不能确定粗大误差是由上述两个原因产生时,其原因可认为是测量仪器内部的突然故障。
统计判断准则一、统计方法的基本思想给定一个显著性水平,按一定分布确定一个临界值,凡超过这个界限的误差,就认为它不属于随机误差的范畴,而是粗大误差,该数据应予以剔除测量数据含有随机误差和系统误差是正常现象,只要误差值不超过规定的允许值,所得测量结果就应该接受。
但是粗大误差超出了正常的误差分布范围,对测量结果造成歪曲,含有粗大误差的测量结果称为异常值。
二、粗大误差的防止与消除对于粗大误差,除了设法从测量结果中发现和鉴别而加以剔除外,更重要的是要加强测量者的工作责任心和以严格的科学态度对待测量工作;此外,还要保证测量条件的稳定,或者避免在外界条件发生变化时进行测量。