第二章 误差及分析数据的统计处理
- 格式:doc
- 大小:245.00 KB
- 文档页数:18
第二章误差和分析数据的处理第一节误差及其产生的原因定量分析的任务是准确测定试样中各组分的含量,因此必须使分析结果具有一定的准确度。
不准确的分析结果将会导致生产上的损失、资源上的浪费和科学上的错误结论。
在定量分析中,由于受到分析方法、测量仪器、所用试剂和分析人员主观条件等方面的限制,故使测定的结果不可能和真实含量完全一致;即使是分析技术非常熟练的分析人员,用最完善的分析方法、最精密的仪器和最纯的试剂,在同一时间,同样条件下,对同一试样进行多次测定,其结果也不会完全一样。
这说明客观存在着难于避免的误差。
因此,人们在进行定量分析时,不仅要得到被测组分的含量,而且必须对分析结果进行评价,判断分析结果的准确性(可靠程度),检查产生误差的原因,采取减小误差的有效措施,从而不断提高分析结果的准确程度。
分析结果与真实结果之间的差值称为误差。
分析结果大于真实结果,误差为正;分析结果小于真实结果,误差为负。
一、误差的分类根据误差的性质与产生的原因,可将误差区分为系统误差和偶然误差两类。
(一)系统误差系统误差(systematic error)也叫可定误差(determination error),它是由某种确定的原因引起的,一般有固定的方向(正或负)和大小,重复测定可重复出现。
根据系统误差的来源,可区分为方法误差、仪器误差、试剂误差及操作误差等四种。
(1)方法误差:由于分析方法本身的缺陷或不够完善所引起的误差。
例如,在质量分析法中,由于沉淀的溶解或非被测组分的共沉淀;在滴定分析法中,由于滴定反应进行不完全,干扰离子的影响,测定终点和化学计量点不符合等,都会产生这种误差。
(2)仪器误差:由于所用仪器本身不够准确或未经校正所引起的误差。
例如,天平两臂不等长,砝码、滴定管刻度不够准确等,会使测定结果产生误差。
(3)试剂误差:由于试剂不纯和蒸馏水中含有杂质引入的误差。
(4)操作误差:由于操作人员的习惯与偏向而引起的误差。
例如,读取滴定管的读数时偏高或偏低,对某种颜色的变化辨别不够敏锐等所造成的误差。
第2章误差及分析数据的统计处理2.1 有效数字及其运算规则2.1.1有效数字指在分析工作中实际能测到的数字,它包括所有的准确数字和最后一位可疑数字。
在有效数字中, 只有最后一位数是不确定的,可疑的。
有效数字位数由仪器准确度决定,它直接影响测定的相对误差。
在科学实验中,对于任一物理量的测定,其准确度都是有一定限度的,例如:读取滴定管的刻度,甲得到23.43ml,乙得到23.42ml,丙得到23.44ml,这些四位数字中,前三位都是很准确的,第四位是估读出来的,所以稍有差别,称为可疑数字,但是它并不是臆造的,这4位数字都是有效数字。
有效数字就是实际能测到的数字,其位数的多少,反映测量的精确程度。
1.零的作用:在1.0008中,“0” 是有效数字;在0.0382中,“0”定位作用,不是有效数字;在0.0040中,前面3个“0”不是有效数字,后面一个“0”是有效数字。
在3600中,一般看成是4位有效数字,但它可能是2位或3位有效数字,分别写3.6×103,3.60×103或3.600×103较好。
注意:1.单位变换不影响有效数字的位数。
例如:1.0L=1.0×103ml ,不能写成1000ml2. pH ,pM ,lgc ,lgK 等对数值,有效数字的位数取决于小数部分(尾数)位 数,因整数部分代表该数的方次。
如pH=11.20,有效数字的位数为两位。
3. 有效数字的位数,直接与测定的相对误差有关。
例:测定某物质的含量为0.5180g ,即0.5180±0.0001g 相对误差%02.0%10051801±=⨯±=Er课堂练习:一、下列数据包括几位有效数字:(1)0.0330 (2)10.030(3)0.01020(4)8.7×10-5(5)PKa=4.74(6) PH=10.00二、见课后题第11页11题2.1.2 有效数字的运算规则2.1.2.1有效数字的修约规则在处理数据过程中,涉及到的各测量值的有效数字位数可能不同,因此需要按下面所述的计算规则,确定各测量值的有效数字位数,有效数字确定后,就要将它后面多余的数字舍弃,此过程称为“数字修约”。
分析化学第六版课后答案_(思考题和习题全)第二章:误差及分析数据的统计处理思考题1.正确理解准确度和精密度,误差和偏差的概念。
答:准确度是测定平均值与真值接近的程度,常用误差大小来表示,误差越小,准确度越高。
精密度是指在确定条件下,将测试方法实施多次,所得结果之间的一致程度。
精密度的大小常用偏差来表示。
误差是指测定值与真值之差,其大小可用绝对误差和相对误差来表示。
偏差是指个别测定结果与几次测定结果的平均值之间的差别,其大小可用绝对偏差和相对偏差表示,也可以用标准偏差表示。
2.下列情况分别引起什么误差?如果是系统误差,应如何消除?(1)砝码被腐蚀;(2)天平两臂不等长;(3)容量瓶和吸管不配套;(4)重量分析中杂质被共沉淀;(5)天平称量时最后一位读数估计不准;(6)以含量为99%的邻苯二甲酸氢钾作基准物标定碱溶液。
答:(1)引起系统误差,校正砝码;(2)引起系统误差,校正仪器;(3)引起系统误差,校正仪器;(4)引起系统误差,做对照试验;(5)引起偶然误差;(6)引起系统误差,做对照试验或提纯试剂。
3.用标准偏差和算术平均偏差表示结果,哪一种更合理?答:用标准偏差表示更合理。
因为将单次测定值的偏差平方后,能将较大的偏差显著地表现出来。
4.如何减少偶然误差?如何减少系统误差?答:在一定测定次数范围内,适当增加测定次数,可以减少偶然误差。
针对系统误差产生的原因不同,可采用选择标准方法、进行试剂的提纯和使用校正值等办法加以消除。
如选择一种标准方法与所采用的方法作对照试验或选择与试样组成接近的标准试样做对照试验,找出校正值加以校正。
对试剂或实验用水是否带入被测成分,或所含杂质是否有干扰,可通过空白试验扣除空白值加以校正。
5.某铁矿石中含铁39.16%,若甲分析得结果为39.12%,39.15%和39.18%,乙分析得39.19%,39.24%和39.28%。
试比较甲、乙两人分析结果的准确度和精密度。
解:计算结果如下表所示由绝对误差E可以看出,甲的准确度高,由平均偏差d和标准偏差可以看出,甲的精密度比乙高。
第二章误差及分析数据的统计处理§2-1 定量分析中的误差定量分析的任务是准确测定试样中组分的含量。
但是,即使是技术很熟练的分析工作者,用最完善的分析方法和最精密的仪器,对同一样品进行多次测定,其结果也不会完全一样。
这说明客观上存在着难以避免的误差。
因此,我们在进行定量测量时,不仅要得到被测组分的含量,而且还应对分析结果作出评价,判断其准确性(可靠程度),找出产生误差的原因,并采取有效的措施,减少误差。
一、误差的表示:从理论上说,样品中某一组分的含量必有一个客观存在的真实数据,称之为“真值”。
测定值(x)与真实值(T)之差称为误差(绝对误差)。
误差 E = X - T误差的大小反映了测定值与真实值之间的符合程度,也即测定结果的准确度。
测定值> 真实值误差为正测定值< 真实值误差为负分析结果的准确度也常用相对误差表示。
相对误差E r = E / T×100%= (X-T) / T×100%用相对误差表示测定结果的准确度更为确切。
二、误差的分类根据误差的性质与产生原因,可将误差分为:系统误差、随机误差和过失误差三类。
(一)系统误差系统误差也称可定误差、可测误差或恒定误差。
系统误差是由某种固定原因引起的误差。
1、产生的原因(1)方法误差:是由于某一分析方法本身不够完善而造成的。
如滴定分析中所选用的指示剂的变色点与化学计量点不相符;又如分析中干扰离子的影响未消除等,都系统的影响测定结果偏高或偏低。
(2)仪器误差:是由于所用仪器本身不准确而造成的。
如滴定管刻度不准(1ml刻度内只有9个分度值),天平两臂不等长等。
(3)试剂误差:是由于实验时所使用的试剂或蒸馏水不纯造成的。
例如配制标准溶液所用试剂的纯度要求在99.9%;再如:测定水的硬度时,若所用的蒸馏水含Ca2+、Mg2+等离子,将使测定结果系统偏高。
(4)操作误差:是由于操作人员一些主观上的原因而造成的。
比如,某些指示剂的颜色由黄色变到橙色即应停止滴定,而有的人由于视觉原因总是滴到偏红色才停止,从而造成误差。
2、特点:(1)单向性:使测定结果系统偏高或系统偏低,其大小也有一定规律;(2)重现性:当重复测量时,它会重复出现;(3)可测性:一般说来,产生系统误差的具体原因都是可以找到的,因此也就能够设法加以测定,从而消除它对测定结果的影响。
(二)随机误差(偶然误差)随机误差又称为偶然误差、不定误差、不可测误差。
1、产生的原因随机误差是由于由某些无法控制和避免的偶然因素造成的。
比如,分析过程中环境温度、湿度和气压的微小波动,仪器性能的微小变化等;又如天平和滴定管最后一位读数的不确定性等。
这些偶然因素都会使分析结果产生波动造成误差。
随机误差的特点是其大小和方向都不固定。
因此无法测量,也不可能加以校正。
2、随机误差的正态分布规律随机误差的出现表面极无规律,忽大忽小,忽正忽负,但在同样条件下进行多次测定,则可发现随机误差的分布符合正态分布曲线。
以u = σμ-x的值为横坐标(x为测定值,μ为总体平均值,σ标准偏差),误差出现的概率为纵坐标,得到测定次数无限多时,随机误差正态分布曲线(p12,图2-2)。
曲线与横坐标之间所夹面积的总和为具有各种大小误差的测定值出现的几率的总和,为100%。
由数值计算的方法可计算出x-µ=-σ至x-µ=σ区间内,即u = ±1时,曲线所包围的面积为68.3%,即测定值落在µ±σ区间内几率(置信度)为68.3%,而测定值落在µ±2σ区间内(即u = ±2)几率(置信度)为95.5%,测定值落在µ±3σ区间内(即u = ±3)几率(置信度)为99.7%,即误差大于3σ的几率仅为0.3%(一千次测量中误差大于3σ的只有3次)。
随机误差的正态分布曲线也具有一定特点:(1)、对称性:大小相等的正负误差出现的机会(即几率)相等,而且彼此对称,因而可以互相补偿,使误差的总和为零。
这点可以说明为什么多次测定的平均值更接近真实值。
(2)、单峰性:小误差出现的几率大,大误差出现的几率小,个别特大误差出现的几率极少。
误差有明显的集中趋势,误差分布曲线只有一个峰值。
实验证明,在测定次数较少时,随机误差随测定次数的增加而迅速减小,当测定次数大于10时,误差已减小到不很显著的数值。
所以适当增加平行测定次数可以减小偶然误差,但过分增加并无太大意义。
反而要消耗更多的时间和试剂。
一般分析实验平行测定4~6次已足够,学生验证性实验只需平行测定2~3次即可。
(三)过失误差这种误差不同于上面讨论的两类误差,它是由于操作者粗心大意或操作失误造成的。
在分析工作中应避免这类误差的发生。
三、偏差(一)、偏差、平均偏差、相对平均偏差前已指出:误差是测定值与真实值之间的差值。
在实际工作中,往往并不知道真实值,一般是用多种方法进行多次平行分析所得到的平均值代替真实值,将某次测定结果与其平均值的差值称为偏差。
偏差d i = X i(个别测定结果)-x(平均值)因此,偏差与误差不同,不能直接衡量测量的准确度的高低,它反映测量结果的符合程度,即精密度的高低。
准确度 误差,精密度 偏差。
精密度通常用偏差、平均偏差、相对平均偏差或标准偏差的大小来度量。
平均偏差 ∑=+++=nd nd d d d i n (21)x x d x x d x x d n n -=-=-= ,,2211相对平均偏差 %100%⨯=Xdd r 从平均偏差和相对平均偏差的定义式可以看出:平均偏差和相对平均偏差都为正值。
显然,平行测定的数据相互越接近,平均偏差或相对平均偏差就越小,说明分析的精密度越高;反之,平行测定的数据越分散,平均偏差或相对平均偏差就越大,说明分析的精密度越低。
(二)标准偏差在引出标准偏差之前,先看下列例题:例:用碘量法测定某铜合金中的铜的百分含量如下,求两批数据的平均偏差。
第一批测定结果及第二批测定结果:(见下表)从这两批数据的个别测定值的偏差来看,第二批较分散,因为其中有两个较大的偏差(上角标*者)。
所以用平均偏差反映不出这两批数据的好坏。
从表中第三列的计算可以看出:将偏差平方后再加和,所得结果分别为0.72、0.99,清楚看出两批数据的差异。
总体标准偏差(均方根偏差)n)-(2i X ∑=μσµ为无限多次测定的平均值,称为总体平均值。
即μ=∞→x n lim显然,在校正系统误差的情况下,µ即为真值。
在一般的分析工作中,只做有限次测量,此时的标准偏差表达式为: 标准偏差(样本标准差)S =1(2--∑n x x i)式中n-1称为独立偏差数,也称为自由度。
采用偏差的平方求和来计算,可以使大偏差能更显著地反映出来,更好地反映测定数据的精密度。
例如:上例中S 1=0.28 ,S 2=0.33,可见第一批数据的精密度好。
书上P9,例1的例子的计算也可说明标准偏差比平均偏差能更灵敏地反映出数据的精密度。
在许多情况下也使用相对标准偏差 (亦称变异系数)来说明数据的精密度。
相对标准偏差RSD (变异系数CV)(‰)⨯=X S 1000‰四、 准确度和精密度准确度和精密度的关系可以下例予以说明:铁含量(%)测定结果示意图甲乙 丙 丁36.00 36.50 37.00 37.50 38.00上图为甲乙丙丁四人分析同一标准试样中铁含量的结果。
甲所得结果的准确度精密度均好,结果可靠。
乙测得的精密度很好,但准确度太低,说明它的测定存在较大的系统误差。
丙测定的准确度与精密度都很差,结果当然不可靠。
丁测定的精密度很差,但其平均值却很接近真值。
但并不能说丁的分析结果很可靠,因为丁的平均值接近真值只是由于较大的正负误差恰好相互抵消才形成的。
丁如果少取一次测定值或多做一次测定,都会显著影响其平均值的大小。
可见,高精密度是获得高准确度的必要条件,准确度高的一定要求精密度高。
但是精密度高的却不一定准确度高,只有消除了系统误差之后,精密度高,准确度才高。
五、置信度与μ的置信区间我们先看下面表达式的意义:ntsx ±=μ这个式子表明:真实值µ可能存在于ntsx ±这个区间之中,此区间称为置信区间。
决定置信区间大小的t 值,对应着一定的置信概率,这个置信概率称为置信度,也即真值位于该置信区间内的把握。
由P14表2-2的t 值表可以看出:t 值与置信度及测定次数n 有关。
首先,当测定次数相同时,置信度越大,t 值越大,则置信区间就较宽,测量的精确度下降。
反之,置信度越小,t 值越小,置信区间就越窄。
此时尽管置信区间的准确度提高了,但其可靠性却降低了(见P15,例3)。
置信区间的准确性与可靠性是两个相互矛盾、相互制约的因素,为了兼顾这两个方面,通常都将置信度定为90%或95%。
在相同置信度下,n 越大,置信区间就越小,平均值与真值就越接近,测定的准确性就越高。
但当n 大于20后,t 值的变化不大,再增加测定次数对提高测定结果的准确度已经没有什么意义了。
测定次数n 对分析结果准确度的影响可见下例: 例:分析Fe%,x =39.16%, S=0.05%, n=5 求:(1)置信度为95%时平均值的置信区间 解:先查表找出相应的t 值,查表 776.2t =06.016.3916.39505.0776.2±=±=±=⨯nstx μ(2)如果置信区间为(39.16±0.05)%,问至少测定几次? 由05.0nts x =±=n s t μ 所以105.005.005.0===s n t 当 n = 2,414.1=n ,t=12.706 n = 3,732.1=n ,t=4.303 n = 4,2=n , t=3.182 n = 5,=n 2.236,t=2.776 n = 6,=n 2.449,t=2.571, 1≈nt所以至少需平行测定六次,才能使置信区间为(39.16±0.05)% 书上P15,例4也说明了适当增加测定次数可使置信区间显著减小,提高分析结果的准确性。
六、有限次测定中随机误差的t 分布曲线t = s x μ-(与u 相比,用s 代替σ)t 分布曲线如P14,图2-3。
t 分布曲线的特点:(1)t 与u 的区别在于用有限次测量的标准偏差S 代替了总体标准偏差σ。
(2)在不同的自由度f(f=n-1)下,t 分布曲线具有不同的形状。
f 对t 分布的影响实质上反映的是测量次数n 对t 分布的影响,即当测量次数n 不同时,有限次测量值的分布也不同。
只有当测量次数n 趋于无穷大时,即∞→f 时,s 才趋于σ,t 分布曲线才与标准正态分布曲线完全吻合,因此也可以把标准正态分布看成是t 分布的一个特例。