平均值的精密度和置信区间
- 格式:ppt
- 大小:603.51 KB
- 文档页数:60
平均值的置信区间什么是置信区间?统计学家经常必须从样本数据推断总体数据的特征。
在这个过程中,一个单独的样本本身代表的是总体的一部分,因此不能仅仅依靠简单地描述样本来了解总体。
这就是置信区间的意义所在。
置信区间是总体平均值的一个估计值,因此是样本平均值的范围。
平均值的置信区间是一种用来估计某个总体参数范围的工具。
换句话说,它是一个实数区间,可能包含某个待估计参数的真实值。
例如,如果我们根据样本数据计算出来的平均值是12,那么我们可能会使用置信区间来推断总体平均值的真实值(假设总体符合正态分布)。
这个置信区间告诉我们,在一定置信度下,总体平均值可能位于某个范围内,例如11至13之间。
在置信区间的范围内,我们可以以某一个概率推测待估计参数的真实值。
但是,由于我们只能够进行样本数据的抽样,因此我们无法知道总体的真实情况,也无法肯定某个置信区间是否覆盖了总体真实值。
因此,置信区间只是一个通过样本数据估计总体数据的工具,不能对总体答案的正确性做出绝对保证。
置信区间的理论基础置信区间的关键是$t$分布。
$t$分布是概率论和统计学中的一个重要分布。
在统计推断中,为计算总体平均值的置信区间而被广泛使用。
$t$分布是由William S. Gossett发明的,是在样本量较小、总体标准差未知的情況下针对总体平均值的推断所采用的一种概率分布。
当样本容量较少时,总体标准差通常被视为不知道。
此时,如果使用普通的$z$分布进行推断,则推断的误差非常大。
而当样本容量较大时,通常可以将总体标准差视为已知。
这时,我们可以使用$z$分布进行推断。
但是,如果我们无法确认总体标准差,却需要进行总体平均值的推断,那么我们就可以使用$t$分布。
$t$分布与正态分布不同,它没有一个固定的标准差。
相反,它的标准差是根据样本数据中的方差估计得出的。
与正态分布相比,$t$分布的曲线更高、更平,它的尾部比正态分布更粗、更长。
在样本容量较小(小于30)时,$t$分布对总体平均值的估计要比正态分布更准确。
统计学基础----置信度与置信区间[原创2006-08-06 21:27:49]置信度与置信区间如何确定测定数据的可靠程度?数据的可信程度与偶然误差的存在及出现的几率有着直接关系。
对于不含系统误差的无数个测定数据,其误差分布可用正态分布曲线(高斯曲线)来表征。
以(x-μ)为横坐标,误差出现的频率y为纵坐标,误差正态分布曲线如图所示。
曲线的形状受总体标准偏差σ控制,越小,曲线又高又窄,表明数据精密度好。
σ 的数值等于曲线上的拐点到对称轴的距离,曲线的峰高等于1/[σ(2π)1/2]。
正态分布曲线与横轴所包围的面积代表了大小误差出现的概率(可由高斯方程积分获得)。
由数据可见,偶然误差出现在m ±3σ范围内的几率高达99.7%。
置信度是指人们所做判断的可靠性,所测数据的可信程度,在数值上与几率相等。
对于分析化学来讲:置信度:以测量值为中心,在一定范围内,真值出现在该范围内的几率。
置信区间:在某一置信度下,以测量值为中心,真值出现的范围。
t =(X - m )/s平均值的置信区间可表示为:s 有限次测定的标准偏差;t 值表一、平均偏差平均偏差又称算术平均偏差,用来表示一组数据的精密度。
平均偏差:优点:简单;缺点:大偏差得不到应有反映。
二、标准偏差S=标准偏差又称均方根偏差。
标准偏差的计算分两种情况:1.当测定次数趋于无穷大时标准偏差:μ 为无限多次测定的平均值(总体平均值);即:当消除系统误差时,μ即为真值。
2.当有限测定次数时标准偏差:相对标准偏差(变异系数):用标准偏差比用平均偏差更科学更准确.例: 两组数据1.X-X:0.11, -0.73, 0.24, 0.51,-0.14, 0.00, 0.30, -0.21,n=8 d1=0.28 S1=0.382.X-X:0.18,0.26,-0.25,-0.37,0.32 ,-0.28,0.31,-0.27n=8 d2=0.28 S2=0.29可见:d1=d2,而:S1>S2三、平均值的标准偏差m 个n 次平行测定的平均值:由统计学可得上列m 个数据的标准偏差(平均值的标准偏差)SX与n 次平行测定的标准偏差S 之间的关系:由SX/S — n 关系曲线:当n 大于5以后,曲线变化趋缓;当n 大于10以后,曲线变化不大。
第二章误差和分析数据处理•2.1 测量值的准确度和精密度•2.2 提高分析结果准确度的方法(自学)•2.3 有效数字及其运算规则•2.4 有限量测量数据的统计处理•2.5 相关分析和回归分析(自学)§2.1 测量值的准确度和精密度误差(Error) : 测量值与真值之差。
➢真值T (True value)某一物理量本身具有的客观存在的真实值。
真值是未知的、客观存在的量。
在特定情况下认为是已知的:1、理论真值(如化合物的理论组成)(如,NaCl中Cl的含量)2、计量学约定真值(如国际计量大会确定的长度、质量、物质的量单位等等)3、相对真值(如高一级精度的测量值相对于低一级精度的测量值)(例如,标准样品的标准值)误差分类•系统误差(Systematic error)—某种固定的因素造成的误差方法误差、仪器误差、试剂误差、操作误差•随机误差(Random error)—不定的因素造成的误差仪器误差、操作误差系统误差与随机误差的比较项目系统误差随机误差产生原因固定因素,有时不存在不定因素,总是存在分类方法误差、仪器与试剂误差、主观误差环境的变化因素、主观的变化因素等性质重现性、单向性(或周期性)、可测性服从概率统计规律、不可测性影响准确度精密度消除或减小的方法校正增加测定的次数系统误差的校正•方法系统误差——方法校正•主观系统误差——对照实验校正(外检)•仪器系统误差——对照实验校正•试剂系统误差——空白实验校正如何判断是否存在系统误差?E a = x –x T 相对误差x <x T 为负误差,说明测定结果偏低x >x T 为正误差,说明测定结果偏高误差越小,分析结果越接近真实值,准确度也越高x -x T x T x T E r = ——= ————常用%表示Ea 绝对误差 误差的表示:对一B 物质客观存在量为T 的分析对象进行分析,得到n 个个别测定值x 1、x 2、x 3、••• x n ,对n 个测定值进行平均,得到测定结果的平均值,那么:个别测定的误差为:T x i -测定结果的绝对误差为:T x E a -=测定结果的相对误差为:%100⨯=TE E a r 平均值偏差(deviation): 单次测量值与测量平均值之差。
Analytical chemistryErrors and data treatment(2)二、有效数字及运算法则2非测量所得的自然数测量次数、样品份数 计算中的倍数反应中的化学计量关系 各类常数测量所得的数字测量值数据计算的结果3数字位数应与分析方法的准确度及仪器测量的精度相适应4有效数字: 分析工作中实际能测得的数字1. 有效数字(significant figure)☐在记录测量数据时,只保留一位可疑数(欠准数)☐只有数据的末尾数欠准,误差是末位数的±1个单位☐有效数字位数反映了测量和结果的准确程度,决不能随意增加或减少5m ◇分析天平(称至0.1mg):12.8228g (6),0.2348g (4) , 0.0600g (3)◇千分之一天平(称至0.001g): 0.235g (3)◇1%天平(称至0.01g): 4.03g (3), 0.23g (2)◇台秤(称至0.1g): 4.0g (2), 0.2g (1)V ☆滴定管(量至0.01mL):26.32mL (4), 3.97mL (3)☆容量瓶:100.0mL (4),250.0mL (4)☆移液管:25.00mL (4);☆量筒(量至1mL或0.1mL):25mL (2), 4.0mL (2)重量分析和滴定分析允许的误差一般在±0.2%之内,各测量数据应保留四位有效数字,注意计算结果的有效数字位数6☐数字1~9均为有效数字☐数字前0不是有效数字,其他数字之间的0计入有效数字: 0.0304(3)☐数字后的0,在小数中,计入有效数字位数:0.03400(4)☐数字后的0,在整数中,含义不清楚时, 最好用指数形式表示: 1000 (1.0×103, 1.00×103, 1.000 ×103)☐很小的数字,也可以用指数形式表示,但有效数字位数需保持不变:0.000018 → 1.8 ×10-5☐变换单位时,有效数字位数需保持不变:0.0038g→3.8mg ☐数据的第一位数≥8的,可多计一位有效数字,如9.35×104(4), 95.2%(4), 8.65(4)☐对数的有效数字位数按小数部分数字的位数计,其整数部分的数字只代表原值的幂次,如pH=10.28(2), 则[H +]=5.2×10-11有效数字位数72. 有效数字运算中的修约规则尾数≤4时舍; 尾数≥6时入尾数=5时, 若后面无数,或后面数为0, 舍5成双;若5后面还有不是0的任何数皆入四舍六入五成双例下列值修约为四位有效数字0.3247 40.3247 6 0.3247 50.3248 50.3248 500.3248 510.32470.32480.32480.32480.32480.32498禁止分次修约0.57490.570.5750.58×9运算时可多保留一位有效数字进行5.3527+2.3+0.054+3.355.35+2.3+0.05+3.35=11.0511.010标准限度值0.03%测定值0.033%修约标准偏差对标准偏差的修约,应使准确度降低统计检验时,标准偏差可多保留1-2位数参与运算表示标准偏差和RSD时,一般取两位有效数字与标准限度值比较时不修约×不合格0.03%0.2130.2211加减法:结果的绝对误差应不小于各项中绝对误差最大的数。