内弹道异常判决中的实时野值剔除方法
- 格式:pdf
- 大小:1.07 MB
- 文档页数:3
靶场外弹道数据处理中野值点剔除方法
卓宁
【期刊名称】《测试技术学报》
【年(卷),期】2008(022)004
【摘要】为了提高靶场数据处理精度,对已有的野值点剔除方法和最新进展进行了研究,从孤立型野值点和斑点型野值点两类野值点的产生角度出发,对适用于靶场外测数据处理中的剔野方法进行了理论研究和实验分析,通过仿真和比较各种方法的结果,得出不同的剔野方法在不同应用领域的优缺点,在相关行业具有较好的参考价值.
【总页数】5页(P313-317)
【作者】卓宁
【作者单位】中国人民解放军92941部队96分队,辽宁,葫芦岛,125001
【正文语种】中文
【中图分类】TJO12.3+6
【相关文献】
1.弹道跟踪数据野值剔除方法性能分析 [J], 侯博文;王炯琦;周萱影;李冬;何章鸣
2.基于最小二乘拟合的外弹道测量数据野值剔除方法 [J], 金学军
3.内弹道异常判决中的实时野值剔除方法 [J], 高冰
4.差分辅助中值滤波外弹道野值检测与剔除方法 [J], 孟庆海
5.靶场外弹道数据处理中的实时野值剔除算法 [J], 徐利娜;陈俊彪;穆高超
因版权原因,仅展示原文概要,查看原文内容请购买。
剔除异常值的方法拉依达准则法,肖维勒准则法,狄克逊准则法,罗马诺夫斯基(t检验)准则法,格拉布斯准则法(Grubbs)各类剔除异常值方法的比较。
1.拉依达准则法(3δ):简单,无需查表。
测量次数较多或要求不高时用。
是最常用的异常值判定与剔除准则。
但当测量次数《=10次时,该准则失效。
如果实验数据值的总体x是服从正态分布的,则式中,μ与σ分别表示正态总体的数学期望和标准差。
此时,在实验数据值中出现大于μ+3σ或小于μ―3σ数据值的概率是很小的。
因此,根据上式对于大于μ+3σ或小于μ―3σ的实验数据值作为异常值,予以剔除。
在这种情况下,异常值是指一组测定值中与平均值的偏差超过两倍标准差的测定值。
与平均值的偏差超过三倍标准差的测定值,称为高度异常的异常值。
在处理数据时,应剔除高度异常的异常值。
异常值是否剔除,视具体情况而定。
在统计检验时,指定为检出异常值的显著性水平α=0.05,称为检出水平;指定为检出高度异常的异常值的显著性水平α=0.01,称为舍弃水平,又称剔除水平(reject level)。
标准化数值(Z-score)可用来帮助识别异常值。
Z分数标准化后的数据服从正态分布。
因此,应用Z分数可识别异常值。
我们建议将Z分数低于-3或高于3的数据看成是异常值。
这些数据的准确性要复查,以决定它是否属于该数据集。
2.肖维勒准则法(Chauvenet):经典方法,改善了拉依达准则,过去应用较多,但它没有固定的概率意义,特别是当测量数据值n无穷大时失效。
3.狄克逊准则法(Dixon):对数据值中只存在一个异常值时,效果良好。
担当异常值不止一个且出现在同侧时,检验效果不好。
尤其同侧的异常值较接近时效果更差,易遭受到屏蔽效应。
4.罗马诺夫斯基(t检验)准则法:计算较为复杂。
5.格拉布斯准则法(Grubbs):和狄克逊法均给出了严格的结果,但存在狄克逊法同样的缺陷。
朱宏等人采用数据值的中位数取代平均值,改进得到了更为稳健的处理方法。
剔除测量数据中异常值的若干方法我说实话,剔除测量数据中的异常值这事儿,我一开始也是瞎摸索。
我试过好多种方法,在这条路上走得那叫一个坎坷。
我最先用的方法是简单的阈值法。
就是先确定一个大概的范围,如果测量值超过或者低于这个范围,就判定为异常值。
比如说,我测量一群人的身高,一般来说就是150 - 200厘米之间,要是出现了300厘米,那这不用想,肯定是异常值了。
但这个方法有个大问题,我发现有些数据虽然在这个所谓正常范围里,可就是感觉不对劲。
就像我有次测量数据在看似合理的范围内,但它就是跟其他大部分数据的规律不一样,硬留着就感觉会把整个分析结果带偏。
后来又试了箱线图法。
这箱线图你们知道吧,有点像给数据画个房子。
中间的箱子是中间50%的数据范围,上下的线啊就像是房子的屋檐。
那屋檐外面的数据就是异常值了。
操作起来也不是很难,但是对于波动比较大的数据啊,容易把其实是正常波动的大数据或者小数据误判为异常值。
我当时就怎么都调不好判断的界限,总觉得数据剔除得奇奇怪怪的。
还有一种3σ原则,这个理论依据倒是很科学。
就是假设数据服从正态分布,在这个分布里啊,大约百分之的数据都在均值±3倍标准差的范围内。
我当时想着这肯定靠谱啊。
结果实际操作的时候,发现要是数据不服从正态分布,那可就全都乱套了,本来不是异常的值都被当成异常值处理了。
我现在又想到一种方法,就是利用聚类的思想。
把那些数据看成一个个小群落,如果某个数据跟其他群落的距离都特别远,就把它当成异常值。
不过这个方法还在摸索阶段,目前发现数据量小的时候效果不是很好,懒得去找出相似群落之类的。
这些就是我在剔除测量数据异常值的摸索过程中用到的方法了,每个方法都有它的优缺点,你们要是有什么更好的想法也可以跟我说一说。
一种用于GPS数据处理中剔除野值的算法
朱荣生;施小成
【期刊名称】《中国惯性技术学报》
【年(卷),期】2000(008)002
【摘要】本文利用采样数据的变化率作为判断野值的依据,将正常数据的变化率都包含在一个随数据变化率而变化带宽的剔值带内,并可根据采样数据实时地调整该剔值带的宽度.用该算法可以对某些定位系统中GPS的信息数据进行处理,仿真结果表明它能很好地剔除GPS信息中的野值,以保证系统的定位精度.
【总页数】4页(P27-30)
【作者】朱荣生;施小成
【作者单位】华东船舶工业学院基础学科系,江苏镇江,212003;哈尔滨工程大学,哈尔滨,150001
【正文语种】中文
【中图分类】P228.4
【相关文献】
1.靶场外弹道数据处理中野值点剔除方法 [J], 卓宁
2.一种抗野值自适应滤波算法及在MEMS-SINS/GPS中应用 [J], 石静;缪玲娟;倪茂林
3.靶场外弹道数据处理中的实时野值剔除算法 [J], 徐利娜;陈俊彪;穆高超
4.一种具有野值预剔除的TTE时钟补偿算法 [J], 杨永强;周煦林;姚秦
5.GP-RBF网络应用于飞行器外测数据野值实时剔除 [J], 薛聿桢;张育林;袁建平
因版权原因,仅展示原文概要,查看原文内容请购买。
实验数据异常值的剔除方法说实话实验数据异常值的剔除这个事儿,我一开始也是瞎摸索。
我那时候就知道数据里有异常值不好,可怎么找出来,怎么剔除,完全没概念。
我试过很多方法呢。
最开始我就直接用肉眼看数据,觉得哪个数据特别离谱,就想把它当成异常值去掉。
比如说,我做一个测量物体长度的实验,大部分数据都在10厘米左右波动,突然有个20厘米的数据,我第一反应就是这肯定是异常值,就想直接把它剔除。
结果被实验室的老师批评了,老师说这样太主观了,可能20厘米这个数据是有特殊意义的,也许是在不同条件下产生的,不能仅凭感觉就剔除。
这算是我第一个失败的教训吧。
后来呢,我又学了一种方法叫3σ法则。
这个怎么理解呢,就好像你站在一堆数据的中间,然后数据像一群学生围绕着你。
大部分学生都离你不远,不在三倍标准差范围内的学生,那就是特殊的,或者说异常的。
这个标准差就像是大家离你的平均距离的一个衡量。
这个方法的步骤呢,就是先算出这组数据的平均值和标准差,然后看哪些数据不在平均值上下三倍标准差这个区间里,那些就是异常值。
不过这个方法也有局限性,它比较适合那种数据分布大致是正态分布的情况,要是数据分布很奇怪,那就不太好用了。
我还试过箱线图法来剔除异常值。
这就好比把数据都放在一个个盒子里,盒子有上限和下限,在盒子外面的数据就可能是异常的。
箱线图显示了数据的四分位数分布情况,把数据从小到大排序,然后算出下四分位数Q1和上四分位数Q3,然后根据公式算出上下限,小于下限或者大于上限的那些数据,就可以考虑当作异常值。
不过我在计算四分位数的时候不小心算错过一次,导致连正常数据都误判成异常值了。
以后再用这种方法的时候,计算的时候可千万要仔细啊。
还有一种方法就是Dixon准则,不过这个相对复杂点儿。
我到现在还不是很熟练,只知道大概的原理,就是根据数据的顺序统计量的比例关系来判定异常值。
如果有机会深入研究,应该会是个不错的剔除异常值的方法。
上面这些方法都要根据实际的数据情况来选择应用,可不能瞎用哦。
专利名称:一种时频融合的外弹道野点剔除方法专利类型:发明专利
发明人:谢超,崔俊峰,李鑫,成红艳,周俊相,梁静申请号:CN202010807530.2
申请日:20200812
公开号:CN114077716A
公开日:
20220222
专利内容由知识产权出版社提供
摘要:本发明公开了一种时频融合的外弹道野点剔除方法,包括以下步骤:(1)、外弹道数据多层小波分解;(2)、细分频率的3σ准则野值时间标定;(3)、对应标定时间的基于遥测信息的弹道数据矫正;(4)、多次重复步骤(1)~步骤(3),直至检测不到野值。
本时频融合的外弹道野点剔除方法是一种时频融合、能够提高野值修正精度且能够批量处理的野点剔除方法,有利于提高野值修正精度和修正效率。
申请人:中国人民解放军63729部队
地址:030000 山西省太原市漪汾街53号
国籍:CN
代理机构:太原景誉专利代理事务所(普通合伙)
代理人:马丽平
更多信息请下载全文后查看。