第二章误差分析及数据处理方法
- 格式:doc
- 大小:586.50 KB
- 文档页数:28
第二章误差和分析数据的处理第一节误差及其产生的原因定量分析的任务是准确测定试样中各组分的含量,因此必须使分析结果具有一定的准确度。
不准确的分析结果将会导致生产上的损失、资源上的浪费和科学上的错误结论。
在定量分析中,由于受到分析方法、测量仪器、所用试剂和分析人员主观条件等方面的限制,故使测定的结果不可能和真实含量完全一致;即使是分析技术非常熟练的分析人员,用最完善的分析方法、最精密的仪器和最纯的试剂,在同一时间,同样条件下,对同一试样进行多次测定,其结果也不会完全一样。
这说明客观存在着难于避免的误差。
因此,人们在进行定量分析时,不仅要得到被测组分的含量,而且必须对分析结果进行评价,判断分析结果的准确性(可靠程度),检查产生误差的原因,采取减小误差的有效措施,从而不断提高分析结果的准确程度。
分析结果与真实结果之间的差值称为误差。
分析结果大于真实结果,误差为正;分析结果小于真实结果,误差为负。
一、误差的分类根据误差的性质与产生的原因,可将误差区分为系统误差和偶然误差两类。
(一)系统误差系统误差(systematic error)也叫可定误差(determination error),它是由某种确定的原因引起的,一般有固定的方向(正或负)和大小,重复测定可重复出现。
根据系统误差的来源,可区分为方法误差、仪器误差、试剂误差及操作误差等四种。
(1)方法误差:由于分析方法本身的缺陷或不够完善所引起的误差。
例如,在质量分析法中,由于沉淀的溶解或非被测组分的共沉淀;在滴定分析法中,由于滴定反应进行不完全,干扰离子的影响,测定终点和化学计量点不符合等,都会产生这种误差。
(2)仪器误差:由于所用仪器本身不够准确或未经校正所引起的误差。
例如,天平两臂不等长,砝码、滴定管刻度不够准确等,会使测定结果产生误差。
(3)试剂误差:由于试剂不纯和蒸馏水中含有杂质引入的误差。
(4)操作误差:由于操作人员的习惯与偏向而引起的误差。
例如,读取滴定管的读数时偏高或偏低,对某种颜色的变化辨别不够敏锐等所造成的误差。
第二章实验数据误差分析和数据处理第一节实验数据的误差分析由于实验方法和实验设备的不完善,周围环境的影响,以及人的观察力,测量程序等限制,实验观测值和真值之间,总是存在一定的差异。
人们常用绝对误差、相对误差或有效数字来说明一个近似值的准确程度。
为了评定实验数据的精确性或误差,认清误差的来源及其影响,需要对实验的误差进行分析和讨论。
由此可以判定哪些因素是影响实验精确度的主要方面,从而在以后实验中,进一步改进实验方案,缩小实验观测值和真值之间的差值,提高实验的精确性。
一、误差的基本概念测量是人类认识事物本质所不可缺少的手段。
通过测量和实验能使人们对事物获得定量的概念和发现事物的规律性。
科学上很多新的发现和突破都是以实验测量为基础的。
测量就是用实验的方法,将被测物理量与所选用作为标准的同类量进行比较,从而确定它的大小。
1.真值与平均值真值是待测物理量客观存在的确定值,也称理论值或定义值。
通常真值是无法测得的。
若在实验中,测量的次数无限多时,根据误差的分布定律,正负误差的出现几率相等。
再经过细致地消除系统误差,将测量值加以平均,可以获得非常接近于真值的数值。
但是实际上实验测量的次数总是有限的。
用有限测量值求得的平均值只能是近似真值,常用的平均值有下列几种:(1) 算术平均值 算术平均值是最常见的一种平均值。
设1x 、2x 、……、n x 为各次测量值,n 代表测量次数,则算术平均值为nx n x x x x ni in ∑==+⋅⋅⋅++=121(2-1)(2) 几何平均值 几何平均值是将一组n 个测量值连乘并开n 次方求得的平均值。
即n nx x x x ⋅⋅⋅⋅=21几(2-2)(3)均方根平均值 nxnxx x x ni in∑==+⋅⋅⋅++=1222221均(2-3)(4) 对数平均值 在化学反应、热量和质量传递中,其分布曲线多具有对数的特性,在这种情况下表征平均值常用对数平均值。
设两个量1x 、2x ,其对数平均值21212121lnln ln x x x x x x x x x -=--=对(2-4)应指出,变量的对数平均值总小于算术平均值。
第二章误差分析和数据处理方法2.1测量与误差1、测量物理实验不仅要定性观察各种物理现象,更重要的是找出有关物理量之间的定量关系。
为此就需要进行测量。
测量指的是将待测的物理量与一个选来作为标准的同类量进行比较的过程。
通过比较得出它们的倍数关系,进而认识待测量的一些未知属性。
可以认为测量就是一种研究方法。
选作标准的同类量称为单位。
倍数称为测量数值。
由此可见,一个物理量的测量值等于测量值与单位的乘积。
一个物理量的大小是客观存在的,选择不同的单位,相应的测量数值就有所不同。
单位越大,测量数值愈小,反之亦然。
测量可分为两类。
一类是直接测量。
如用尺量长度,以表计时间,天平称质量,温度计量温度等;另一类是间接测量,是根据直接测量所得的数据,根据一定的公式,通过运算,得出所需要的结果,例如直接测出单摆的长度ι和周期,应用公式g=4π2ι/T2,求出重力加速度g。
在物理的测量中,绝大部分是间接测量,但直接测量是一切间接测量的基础。
不论直接测量或间接测量,都需要满足一定的实验条件,按照严格的方法及正确地使用仪器,才能得出应有的结果。
因此,在实验过程中,一定要明白实验的目的,正确地使用仪器,细心地进行操作、读数和记录,以达到巩固理论知识和加强实验技能训练的目的。
2.误差物理量在客观上有着确定的数值,称为真值。
然而在实际测量时,由于实验条件、实验方法和仪器精度等的限制或者不够完善,以及实验人员技术水平和经验等原因,使得测量值与客观存在的真值之间有一定的差异。
测量值x与真值T x的差值称为测量误差δ,简称误差。
即δ= x - T x任何测量都不可避免地存在误差,所以,一个完整的测量结果应该包括测量值和误差两个部分。
既然测量不能得到真值,那么怎样才能最大限度地减小测量误差并估算出这误差的范围呢?要回答这些问题,首先要了解误差产生的原因及其性质。
测量误差按其产生原因与性质可分为系统误差、随机误差和过失误差三大类。
(1)系统误差系统误差的特点是有规律的,测量结果都大于真值,或小于真值。
或在测量条件改变时,误差也按一定规律变化。
系统误差的产生有以下几个方面:1)由于测量仪器的不完善、仪器不够精密或安装调整不妥,如刻度不准、零点不对、砝码未经校准、天平臂不等长、应该水平放置的仪器未放水平等。
2)由于实验理论和实验方法的不完善,所引用的理论与实验条件不符,如在空气中称质量而没有考虑空气浮力的影响,测微小长度时没有考虑温度变化使尺长的改变,量热时没有考虑热量的散失,测量电压时未考虑电压表内阻对电压的影响,标准电池的电动势未作温度校正等。
3)由于实验者生理或心理特点、缺乏经验等而产生误差。
例如有些人习惯于侧坐斜视读数,眼睛辨色能力较差等,使测量值偏大或偏小。
减小系统误差是实验技能问题,应尽可能采取各种措施将它减小到最低程度。
例如将仪器进行校正,改变实验方法或者在计算公式中列入一些修正项以消除某些因素对实验结果的影响,纠正不良习惯等。
能否识别或降低系统误差与实验者的经验和实际知识有密切的关系。
学生在实验过程中要逐步积累这方面的感性知识,结合实验的具体情况对系统误差进行分析和讨论。
因在设计实验仪器和实验原理时,系统误差已被减小到最小程度,所以大学物理实验课中不要求学生对实验系统进行修正。
(2)随机误差(又称偶然误差)在相同条件下,对同一物理量进行重复多次测量,即使系统误差减小到最小程度之后,测量值仍然出现一些难以预料和无法控制的起伏,而且测量值误差的绝对值和符号在随机地变化着。
这种误差称为随机误差。
随机误差主要来源于人们视觉、听觉和触角等感觉能力的限制以及实验环境偶然因素的干扰。
例如温度、湿度、电源电压的起伏、气流波动以及振动等因素的影响。
从个别测量值来看,它的数值带有随机性,似乎杂乱无章。
但是,如果测量次数足够多的话,就会发现随机误差遵循一定的统计规律,可以用概率理论估算它。
(3)过失误差在测量中还可能出现错误,如读数错误、记录错误、估算错误、操作错误等因素引起的误差,称为过失误差。
过失误差已不属于正常的测量工作范畴,应当尽量避免。
克服错误的方法,除端正工作态度,严格工作方法外,可用与另一次测量结果相比较的办法发现纠正,或者运用异常数据剔除准则来判别因过失而引入的异常数据,并加以剔除。
3、正确度、精密度和准确度正确度、精密度和准确度是评价测量结果优劣的三个述语。
测量结果的正确度是指测量值与真值的接近程度。
正确度高,说明测量值接近真值程度好,即系统误差小。
可见,正确度是反映测量结果系统误差大小的述语。
测量结果的精密度是指重复测量所得结果相互接近的程度。
精密度高,说明重复性好,各个测量误差的分布密集,即随机误差小。
可见,精密度是反映测量结果随机误差大小的术语。
测量结果的准确度是指综合评定测量结果重复性与接近真值的程度。
准确度高,说明精密度和正确度都高。
可见,准确度反映随机误差和系统误差的综合效果。
在实验中系统误差已被减小到最小程度,所以,误差计算主要是估算随机误差,因此往往不再严格区分精密度和准确度,而泛称精度。
4、绝对误差、相对误差和百分差误差的表示形式,有绝对误差和相对误差之分。
绝对误差±Δx表示测量结果x 与真值x T 之间的差值以一定的可能性(概率)出现的范围,即真值以一定可能性(概率)出现在x x ∆-至x x ∆+区间内。
仅仅根据绝对误差的大小还难以评价一个测量结果的可靠程度,还需要看测量值本身的大小,为此引入相对误差的概念。
相对误差%100⨯∆≈∆=xx T x E x 表示绝对误差在整个物理量中所占的比重,一般用百分比表示。
例如,一长度测量值是1000米,而绝对误差为1米。
另一长度测量值为100厘米,而绝对误差为1厘米。
后者的相对误差为1%,前者的相对误差为0.1%,所以,前者较后者更可靠。
如果待测量有理论值或公认值,也可用百分差表示测量的好坏。
即 百分差%1000⨯''-=x x x E 公认值公认值测量值绝对误差、相对误差和百分差通常只取1~2位数字来表示。
2.2 随机误差的高斯分布与标准误差随机性是随机误差的特点。
也就是说,在相同条件下,对同一物理量进行多次重复测量,每次测量值的误差时大时小,对某一次测量值来说,其误差的大小与正负都无法预先知道,纯属偶然。
但是,如果测量次数相当多的话,随机误差的出现仍服从一定的统计规律。
根据实验情况的不同,随机误差出现的分布规律有高斯分布(即正态分布)、t 分布、均匀分布以及反正弦分布等等。
按大纲要求,仅介绍随机误差的高斯分布。
1.高斯分布的特征和数学表述遵从高斯分布规律的随机误差具有下列四大特征:(1)单峰性 绝对值小的误差出现的可能性(概率)大,大误差出现的可能性小。
(2)对称性 大小相等的正误差和负误差出现的机会均等,对称分布于真值的两侧。
(3)有界性 非常大的正误差或负误差出现的可能性几乎为零。
(4)抵偿性 当测量次数非常多时,正误差和负误差相互抵消,于是,误差的代数和趋向于零。
高斯分布的特征可以用高斯分布曲线形象地表示出来,见图2-2-1(a )。
横坐标为误差δ,纵坐标为误差的概率密度分布函数)(δf 。
根据误差理论可以证明函数的数学表述式为:22221)(σδσπδ-=e f (2-2-1)测量值的随机误差出现在δ到δ+d δ区间内的可能性(概率)为f(δ)d δ,即图2-2-1(a)中阴影线所包含的面积元。
上式中的σ是一个与实验条件有关的常数,称为标准误差。
其量值为n n i in ∑=∞→=12lim δσ式中,n 为测量次数,各次测量值的随机误差为i δ,1=i ,2,3,…n。
可见标准误差是将各个误差的平方取平均值,再开方得到,所以,标准误差又称为均方根误差。
2.标准误差的物理意义由式(2-2-1)可知,随机误差正态分布曲线的形状取决于σ值的大小,如图(2-2-1)b 所示。
σ值愈小,分布曲线愈陡峭,峰值)(δf 愈高,说明绝对值小的误差占多数,且测量值的重复性好,分散小;反之,σ值愈大,曲线愈平坦峰值愈低,说明测量值的重复性差,分散性大。
标准误差反映了测量值的离散程度。
由于f(δ)d δ是测量值随机误差出现在小区间(δ,δ+d δ)的可能性(概率),那么,测量值误差出现在区间(-σ,σ)内的可能性(概率)就是⎰-=<<-=σσδδσδσd f P )()( %3.6821222==--⎰δσππδσσd e这说明对任意一次测量,其测量值误差出现在σ-到σ区间内的可能性(概率)为68.3%。
也就是说,假如我们对某一物理量在相同条件下进行了1000次测量,那么,测量值误差可能有683次落在σ-到σ区间内。
注意标准误差的统计意义,它并不表示任一次测量值的误差就是±σ,也不表示误差不会超出±σ的界限。
标准误差只是一个具有统计性质的特征量,用以表征测量值离散程度的一个特征量。
3.极限误差与上述相仿,同样可以计算,在相同条件下对某一物理学量进行多次测量,其任意一次测量值的误差落在-3σ到3σ区域之间的可能性(概率)。
其值为⎰-=-σσδδσσ33)()3,3(d f P%7.992122233==--⎰δσππδσσd e也就是说,在1000次测量 中,可能有3次测量值的误差绝对值会超过3σ。
在通常的有限次测量情况下,测量次数很少超过几十次,因此测量值的误差超出±3σ范围的情况几乎不会出现,所以把3σ称为极限误差。
在测量次数相当多的情况下,如出现测量值的误差的绝对值大于3σ的数据,可以认为这是由于过失而引起的异常数据而加以剔除。
但是,对于测量次数较少的情况,这种判别方法就不可靠,而需要采用另外的判别准则。
2.3 近真值—算术平均值尽管一个物理量的真值是客观存在的,然而,即使对测量值已进行了系统误差的修正,也会由于随机误差的存在,企图得到真值的愿望仍不能实现。
那么,是否能够得到一个测量结果的最佳值,或者说得到一个最接近真值的数值(近真值)呢?这个近真值又如何来求得?根据随机误差具有抵偿性的特点,误差理论可以证明,如果对一个物理量测量了相当多次,那么算术平均值就是接近真值的最佳值。
设在相同条件下对一个物理量进行了多次测量,测量值分别为1x ,2x ,3x ,…,n x ,各次测量值的随机误差分别为1δ,2δ,3δ,…,n δ,并用T x 表示该物理量的真值。
根据误差的定义有1δ =1x -T x , 2δ=2x -T x ,3δ=3x -T x ,…,n δ=n x -T x将以上各式相加,得x n i i n i i nT x -=∑∑==11δ或 x ni i n i i T x n n -=∑∑==1111δ (2-3-1) 用x 代表算术平均值,即∑==+++=n i i n x nx x x n x 1211)(1 (2-3-2)式(2-3-1)可改写为 x n i i T x n -=∑=11δ(2-3-3)根据随机误差的抵偿性特征,当测量次数n 相当多时,由于正、负误差相互抵消,各个误差的代数和趋近于零,即0lim 1=∑=∞→n i i n δ于是有 x T x →由此可见,测量次数愈多,算术平均值接近真值的可能性愈大。