误差及数据处理基础理论知识综述
- 格式:docx
- 大小:31.84 KB
- 文档页数:17
误差分析与数据处理基础知识 不确定度 小结一.误差分类系统误差 偶然误差(随机误差) 粗差(过失误差)系统误差可以消除;粗差应该剔除; 偶然误差永远存在,不可避免。
因此,误差分析与数据处理基础知识,主要针对偶然误差分析。
二.多次等精度测量的主要内容对物理量x 进行多次等精度测量,得到一个测量列:),,,(n i x x x x 21; 近真值为算术平均值:nx x n i i /∑==1 测量列的标准偏差(简称标准差)为:∑=--=n i i x x x n 12)(11σ; 近真值即算术平均值的标准差为:n xx σσ=;测量的统计结果表达形式为:⎪⎩⎪⎨⎧⨯==±=%).()(1006830x E P x x x x x σσ单位意义:真值落在)(x x σ-到)(x x σ+的概率为68.3%。
这种结果形式中,置信概率P =0.683可以省略三.间接测量的主要内容1.误差传递公式如果),,( C B A f N =,则+∆∂∂+∆∂∂+∆∂∂=∆C C f B B f A A f N两个结论:① 和与差的绝对偏差,等于各直接测量量的绝对偏差之和。
② 积与商的相对偏差,等于各直接测量量的相对偏差之和。
2. 标准误差传递公式+⋅⎪⎭⎫ ⎝⎛∂∂+⋅⎪⎭⎫ ⎝⎛∂∂=2222B A NB f A f σσσ 两个结论:① 和与差的绝对偏差等于各直接测量量的绝对偏差的“方和根”。
② 积与商的相对偏差等于各直接测量量的相对偏差的“方和根”。
四.测量不确定度评定与表示的主要内容1.A 类不确定度x A x u σ=)(∑=--=n i i xx x n n n 12)()1(1σ2.B 类不确定度 k x u B ∆=)(; 式中∆为仪器误差。
通常仪器误差服从的规律可简单认为服从均匀分布,这种情况下常数k 取3。
即误差均匀分布的B 类不确定度3∆=)(x u B 3.总不确定度(即合成不确定度))()()(22x u x u x u B A C += 注意:通常先将各来源的标准不确定度划归入A 类评定和B 类评定,再计算总不确定度。
第二章 误差的基本性质与处理2-1.试述标准差 、平均误差和或然误差的几何意义。
答:从几何学的角度出发,标准差可以理解为一个从 N 维空间的一个点到一条直线的距离的函数;从几何学的角度出发,平均误差可以理解为 N 条线段的平均长度; 2-2.试述单次测量的标准差 和算术平均值的标准差 ,两者物理意义及实际用途有何不同。
【解】单次测量的标准差σ表征同一被测量n 次测量的测量值分散性的参数,可作为测量列中单次测量不可靠性的评定标准。
2n δσ++=算术平均值的标准差xσ-是表征同一被测量各个独立列算术平均值分散性的参数,可作为算术平均值不可靠性的评定标准xσ-=在n ,当测量次数n 愈大时,算术平均值愈接近被测量的真值,测量精度也愈高。
2-3试分析求服从正态分布、反正弦分布、均匀分布误差落在中的概率 【解】(1)误差服从正态分布时2222(2)(2)()P ed ed δδσσδδ--==引入新变量t:,t tδσδσ==,经变换上式成为: 22()2()20.41950.8484%t t P edt t -==Φ=⨯==⎰(2)误差服从反正弦分布时因反正弦分布的标准差为:σ=,所以区间[],,a a ⎡⎤=-⎣⎦,故:1()1aaP δπ+-==⎰(3) 误差服从均匀分布时因其标准差为:σ=,⎡⎤⎡⎤=⎢⎥⎣⎦⎣⎦,故111()20.8282%22P d a a δπ==⨯==⎰2-4.测量某物体重量共8次,测的数据(单位为g)为236.45,236.37,236.51,236.34,236.39,236.48,236.47,236.40,是求算术平均值以及标准差。
0.05(0.03)0.11(0.06)(0.01)0.080.070236.48236.43x +-++-+-+++=+=0.0599σ=0.0212x σ==2-5用別捷尔斯法、极差法和最大误差法计算2-4,并比较2-6测量某电路电流共5次,测得数据(单位为mA )为168.41,168.54,168.59,168.40,168.50。
误差理论与数据处理基础知识课程概述本课程是仪器类专业的专业基础课。
作为仪器类专业的学生,仪器设计的主线是设计合理的仪器原理方案、选择合适的器件、搭建可靠的测试系统以及进行准确的数据处理与误差分析,所以作为处理仪器测量结果和判断仪器性能的重要环节,本课程的学习将对引导学生灵活运用理论知识于实践环节起到重要的支撑作用。
通过本课程的学习,期望学生掌握误差分析的基本概念及意义,掌握测试系统静态测量及动态测量结果的误差分析与补偿算法,具有独立进行测量结果误差分析的能力,并能通过适当的误差补偿合理地改善测试系统的性能,最终具有初步改进测试系统设计的能力。
因此本课程是一门理论与实践紧密结合的综合性课程。
课程要求课程内容包括误差理论与数据处理两条主线。
误差理论要求掌握误差的基本概念,针对测量结果和测试系统能够进行针对性的误差分析,并对不确定度的基本概念有所了解;数据处理则要求掌握最小二乘法的基本思想,并能够将最小二乘法广泛应用到工程实践,对于动态测量结果的分析与处理则要求掌握随机分析的基本概念与方法。
课程最终希望学生能够灵活运用课程理论知识解决工程实践中出现的误差与数据处理问题。
课程总课时:48;每周4个课时,12周完成全部课程学习。
考核方式及成绩评定考核方式由平时成绩和考试成绩组成,平时成绩包括五次课堂测试、习题成绩和大作业的成绩,大作业就是学生自选科研题目,利用课程所授知识点完成题目当中涉及误差理论与数据处理的内容;考试成绩就是期末考试成绩。
百分制情况下,平时成绩和期末成绩比例为:60:40,即平时成绩为60分,期末考试成绩为40分。
平时成绩中:课堂测试成绩25分(每次5分,共5次),习题成绩20分,大作业成绩15分。
平时成绩和期末成绩比例根据每年的教学效果评价可以进行调整,调整方案在每年的授课环节结束后,由教学团队讨论后决定,并在新一轮授课前公示给学生。
误差理论与数据处理知识总结1、1研究误差的意义1、1、1研究误差的意义为:1)正确认识误差的性质,分析误差产生的原因,以消除或减小误差2)正确处理测量和试验数据,合理计算所得结果,以便在一定条件下得到更接近于真值的数据3)正确组织实验过程,合理设计仪器或选用仪器和测量方法,以便在最经济条件下,得到理想的结果。
1、2误差的基本概念1、2、1误差的定义:误差是测得值与被测量的真值之间的差。
1、2、2绝对误差:某量值的测得值之差。
1、2、3相对误差:绝对误差与被测量的真值之比值。
1、2、4引用误差:以仪器仪表某一刻度点的示值误差为分子,以测量范围上限值或全量程为分母,所得比值为引用误差。
1、2、5误差来源:1)测量装置误差2)环境误差3)方法误差4)人员误差1、2、6误差分类:按照误差的特点,误差可分为系统误差、随机误差和粗大误差三类。
1、2、7系统误差:在同一条件下,多次测量同一量值时,绝对值和符号保持不变,或在条件改变时,按一定规律变化的误差为系统误差。
1、2、8随机误差:在同一测量条件下,多次测量同一量值时,绝对值和符号以不可预定方式变化的误差称为随机误差。
1、2、9粗大误差:超出在规定条件下预期的误差称为粗大误差。
1、3精度1、3、1精度:反映测量结果与真值接近程度的量,成为精度。
1、3、2精度可分为:1)准确度:反映测量结果中系统误差的影响程度2)精密度:反映测量结果中随机误差的影响程度3)精确度:反映测量结果中系统误差和随机误差综合的影响程度,其定量特征可用测量的不确定度来表示。
1、4有效数字与数据运算1、4、1有效数字:含有误差的任何近似数,如果其绝对误差界是最末位数的半个单位,那么从这个近似数左方起的第一个非零的数字,称为第一位有效数字。
从第一位有效数字起到最末一位数字止的所有数字,不论是零或非零的数字,都叫有效数字。
1、4、2测量结果应保留的位数原则是:其最末一位数字是不可靠的,而倒数第二位数字应是可靠的。
一、误差1、量:描述现象、物体或物质的特性、其大小可用一个数和一个参照对象表示。
由定义可知,量是由一个纯数据和一个计量单位组成。
量可指一般概念的量或特定量。
其符号用斜体表示,一般概念的量如:长度l、质量m。
特定量如:长度为2m、质量为0.5g。
2、真值:与量的定义一致的量值。
如按照计量单位定义复现出来的量值为真值。
量的真值只能通过完善的测量才能获得,所以真值是无法测量到的,随着测量准确度的逐步提高,只能越来越接近真值。
但在实际应用时还需要使用真值,为此,人们常常将高等级的计量标准复现的量值作为下一级测量的约定真值;将有证标准物质的量值作为检测结果的约定真值。
3、被测量:拟测量的量。
为保证特定条件下的被测量值是单一的,应根据所需要的准确度及特定条件予以完整定义,如:1m长的铁棒需要测至微米级准确度,就必须说明所给定的温度和压力等,但要测到毫米级准确度就不需给定温度、压力和其他影响的值。
4、影响量:在直接测量中不影响实际被测的量、但会影响示值与测量结果之间关系的量。
原定义:不是被测量但对测量结果有影响的量。
如:a)测量某物体长度时测微计的温度(不包括物体本身的温度,因为物体的温度可以进入被测量的定义中);b)测量交流电压时的频率;科学是从测量开始的,对自然界所发生的量变现象的研究,常常需要借助于各式各样的试验与测量来完成。
由于认识能力的不足和科学水平的限制,试验中测得的值和它的客观真值并不一致,这种矛盾在数值上的表现即为误差。
误差公理:测量结果都具有误差,误差自始至终存在于一切科学实验和测量的过程之中。
由于我们的工作就是测量,所以就应该了解有关误差的知识。
5、测量误差:测得的量值减去参考量值。
根据定义误差表示两个量的差值,所以误差为带有正号或负号的量值,与测量结果一样的计量单位。
表示测量结果对真值的偏离量,以真值为参照点。
是一个确定的量值,所以误差值不能带有±号。
常用“Δ”或“δ”表示。
误差计算公式:测量误差Δ=测量结果—参考量值测量结果可以是:给出值、测得值、实验值、仪器示值、标称值、预置值、计算近似值等。
误差及数据处理基础理论知识综述2009-12-1 13:45:43误差及数据处理基础理论知识综述前言由于各行各业有各自的误差理论及数据处理理论,但基础理论都是一致的,大同小异。
现就在检验(测量)领域的误差理论及数据处理基础知识进行理论文字上的综述,尝试作一次理论上的探讨,与各位同仁共同学习和提高,如有不妥及错误之处请各位批评指正。
一、误差基础知识在各种测量领域,我们经常使用一些术语,例如测量误差、测量准确度和测量不确定度等来表示测量结果质量的好坏。
现我们从上述三个术语的定义出发,给出这些术语的基本概念,并指出它们之间的差别,以利于正确使用这些术语。
(一)测量结果测量结果的定义是“由测量所得到的赋予被测量的值”,因此测量结果是通过测量得到的被测量的最佳估计值。
由于任何测量都存在缺陷,因而通常测量结果并不等于真值。
完整表述测量结果时,必须给出其测量不确定度,必要时还应说明测量所处条件,或影响量的取值范围。
以便使用者可以正确地利用该测量结果。
测量结果可能是单次测量的结果,也可能是由多次测量所得。
对于前者,测得值就是测量结果;若为多次测量所得,则测得值的算术平均值才是测量结果。
因此在给出测量结果时,通常说明它是示值、未修正测量结果或已修正测量结果,同时还应表明它是否为几个值的平均。
测得值,有时也称为观测值,是指从一次观测中由测量仪器或量具的显示装置中所得到的单一值。
一般地说,它并不是测量结果。
测量结果是指对测得值经过恰当的处理(如按一定的规则确定并剔除测得值中的离群值)、修正(指必须加上由各种原因引起的必要的修正值或乘以必要的修正因子)或经过必要的计算而得到的最后提供给用户的量值。
因此测得值或观测值是测量中得到的原始数据,是测量过程的一个中间环节。
对于间接测量而言,测得值或观测值往往具有和被测量不同的量纲。
而测量结果则是整个测量的最后结果。
在不会引起混淆的情况下有时也将测得值称为测量结果。
(二)测量结果误差1、测量误差的定义测量误差的定义是:测量结果减去被测量的真值。
注:真值从理论上说,样品中某一组分的含量必然有一个客观存在的真实数值,称之为“真实值”或“真值”。
用“μ”表示。
但实际上,对于客观存在的真值,人们不可能精确的知道,只能随着测量技术的不断进步而逐渐接近真值。
实际工作中,往往用“标准值”代替“真值”。
标准值采用多种可靠的分析方法、由具有丰富经验的分析人员经过反复多次测定得出的结果平均值,是一个比较准确的结果。
实际工作中一般用标准值代替真值。
例如原子量、物理化学常数:阿佛伽得罗常数为6.02×10 等。
与我们实验相关的是将纯物质中元素的理论含量作为真实值。
(1)由于真值不能确定,实际上用的是约定真值。
(2)当有必要与相对误差相区别时,此术语有时称为测量的绝对误差。
注意不要与误差的绝对值相混淆,后者为误差的模。
根据误差的定义,测量误差是测量结果与被测量真值之差。
一个量的真值,是在被观测时本身所具有的真实大小,只有完善的测量才能得到真值。
任何测量都存在缺陷,完善的测量是不存在的,因此真值是一个理想的概念。
既然真值无法确切地知道,因此误差也无法确切地知道。
故在实际工作中,误差只能用于已知约定真值的情况,但此时还必须考虑约定真值本身的不确定度。
产生误差的原因是测量过程的缺陷,而测量过程的缺陷可能是由各种各样的原因引起的,因此测量结果的误差往往是由多个分量组成的。
误差与测量结果有关。
而测量结果只有通过测量才能得到,因此误差也只能通过测量得到。
通过分析评定的方法是无法得到误差的。
对于同一个被测量,当在重复性条件下进行多次测量时,可能得到不同的测量结果,因此这些不同测量结果的误差是不同的。
由定义还可知误差是两个值之差,因此误差表示的是一个差值,而不是区间。
当测量结果大于真值时误差为正值,当测量结果小于真值时误差为负值。
因此误差既不可能、也不应当以“±”号的形式出现。
测量误差常称为绝对误差,这是为区别于相对误差而言的。
相对误差定义为测量误差除以被测量的真值,实际上只能用测量误差除以被测量的约定真值,而在具体工作中则通常用测量结果来代替约定真值得到相对误差。
绝对误差的量纲与被测量的量纲相同,而相对误差是无量纲量,或者说其量纲为1。
2、误差的分类误差按其性质,可以分为系统误差和随机误差两类。
系统误差的定义为:在重复性条件下,对同一被测量进行无限多次测量所得结果的平均值与被测量的真值之差。
注:(1)如真值一样,系统误差及其原因不能完全获知。
(2)对测量仪器而言,其系统误差也称为测量仪器的偏移。
a.系统误差由定义可知,由于系统误差仅与无限多次测量结果的平均值有关,而与在重复性条件下得到的不同测量结果无关。
因此,在重复性条件下得到的不同测量结果应该具有相同的系统误差。
由于系统误差和真值有关,而真值是无法确切知道的,只能用约定真值代替,因而可能得到的只是系统误差的估计值,并具有一定的不确定度。
由于误差等于负的修正值,因此系统误差的不确定度就是修正值的不确定度。
不宜按过去的说法将系统误差分成已定系统误差和未定系统误差。
也不宜说未定系统误差按随机误差处理。
未定系统误差其实是不存在的,过去所说的未定系统误差从本质上说并不是误差,而是不确定度。
系统误差一般来源于影响量,它对测量结果的影响已经被识别并可以定量地进行估算。
这种影响称之为“系统效应”。
若该效应比较显著,也就是说如果系统误差比较大,则可在测量结果上加上修正值而予以补偿,得到修正后的测量结果。
b.随机误差随机误差的定义为:测量结果与在重复性条件下,对同一被测量进行无限多次测量所得结果的平均值之差。
注:(1)随机误差等于误差减去系统误差。
(2)因为测量只能进行有限次数,故可能确定的只是随机误差的估计值。
在无限多次测量结果的平均值中,已经不含有随机误差分量,故其只存在系统误差。
由于测量不可能进行无限多次,因而在测量结果中随机误差和系统误差分量都存在。
在重复性条件下得到的不同测量结果具有不同的随机误差,但有相同的系统误差。
1993年前,随机误差被定义为在同一量的多次测量过程中,以不可预知方式变化的测量误差分量。
这里所谓的不可预知分量是指在相同测量条件下的多次测量中,误差的符号及其绝对值变化不定的分量。
其大小用多次重复测量结果的实验标准差表示。
1993年后,随机误差是按其本质来定义的。
但由于该定义中涉及无限多次测量所得结果的平均值,因此与系统误差一样,能确定的同样只是随机误差的估计值。
随机误差一般来源于影响量的随机变化,故称之为“随机效应”。
正是这种随机效应导致了测量结果的分散性。
就单个测量结果而言,随机误差的符号和绝对值是不可预知的。
但就相同条件下多次测量结果而言,其总体上仍存在一定的规律性,称为统计规律性。
随机误差的统计规律性主要表现在下述三方面:随机误差的统计规律性:(1)对称性对绝对值相等而符号相反的误差,出现的次数大致相等。
也就是说,测得值以其算术平均值为中心对称地分布。
随机误差的统计规律性:(2)有界性指测得值的随机误差的绝对值不会超过一定的界限。
也就是说,不会出现绝对值很大的随机误差。
随机误差的统计规律性:(3)单峰性所有的测得值以其算术平均值为中心相对集中地分布,绝对值小的误差出现的机会大于绝对值大的误差出现的机会。
由于随机变量的数学期望值等于对该随机变量进行无限多次测量的平均值,因此也可以说,随机误差是指测量误差中数学期望值为零的误差分量,而系统误差则是指测量误差中数学期望值不为零的误差分量。
根据定义,误差、系统误差和随机误差均表示两个量值之差,因此随机误差和系统误差也都应该具有确定的符号,同样也不应当以“±”号的形式出现。
由于随机误差和系统误差都是对应于无限多次测量的理想概念,而实际上无法进行无限多次测量,只能用有限次测量的结果作为无限多次测量结果的估计值,因此可以确定的只是随机误差和系统误差的估计值。
误差经常用于已知约定真值的情况,例如经常用示值误差来表示测量仪器的特性。
3、误差、随机误差和系统误差之间的关系由误差、随机误差和系统误差的定义可知:误差= 测量结果-真值=(测量结果-总体均值)+(总体均值-真值)= 随机误差+系统误差或测量结果= 真值+误差= 真值+随机误差+系统误差由此可知,误差等于随机误差和系统误差的代数和。
既然误差是一个差值,因此任何误差的合成,不论随机误差或系统误差,都应该采用代数相加的方法。
这一结论与我们过去常用的误差合成方法不一致。
过去在对随机误差进行合成时,通常都采用方和根法。
两者的区别在于随机误差定义的改变。
1993年之前,随机误差用多次重复测量结果的实验标准差表示,因此当时随机误差用一个“区间”来表示。
1993年国际上对“随机误差”一词的定义作了原则性修改后,随机误差表示测量结果与多次测量所得结果的平均值(即总体均值)之差,因此随机误差已不再表示一个“区间”,而是表示测量结果与总体均值之差。
并且测量结果是真值、系统误差和随机误差三者的代数和。
由于误差、随机误差和系统误差都是两个量值之差,因此不论它们是否能确切地知道,任何误差的合成都应该采用代数相加的方法,而不能采用过去常用的方和根法合成。
过去人们常常会误用“误差”这一术语。
例如,通过经典的误差分析方法给出的结果往往是被测量值不能确定的范围,而不是真正的误差值。
按定义,误差与测量结果有关,即不同的测量结果有不同的误差。
合理赋予被测量的每一个值各有其自己的误差,而并不存在一个共同的误差。
也有人将误差分为四类:系统误差、随机误差、漂移和粗差。
但主要还是前面两类。
漂移是由不受控的影响量的系统影响所引起的,常常表现为时间效应或磨损效应。
因此漂移可以用单位时间内的变化或使用一定次数后的变化来表示。
从实质上来说,漂移是一种随时间或随使用次数而变化的系统误差。
测量结果中还可能存在粗差,粗差是由测量过程中不可重复的突发事件所引起的。
电子噪声或机械噪声可以引起粗差。
产生粗差的另一个经常出现的原因是操作人员在读数和书写方面的疏忽以及错误地使用测量设备。
必须将粗差和其他几种误差相区分,粗差是不可能再进一步描述的。
粗差既不可能被定量地描述,也不能成为测量不确定度的一个分量。
由于粗差的存在,使测量结果中可能存在异常值。
在计算测量结果和进行测量不确定度评定之前,必须剔除测量结果中的异常值。
在测量过程中,如果发现某个测量条件不符合要求,或者出现了可能影响到测量结果的突发事件,可以立即将该数据从原始记录中剔除,并记录下剔除原因。
在计算测量结果和进行不确定度评定时,异常值的剔除应通过对数据作适当的检验,并按一定的规则进行。
无论随机误差或系统误差,所有的误差从本质上来说均是系统性的。
如果发现某一误差是非系统性的,则主要是因为产生误差的原因没有找到,或是对误差的分辨能力不够所致,因此,可以说随机误差是由不受控的随机影响量所引起的。