误差及其表示方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
误差及其表示方法
误差——分析结果与真实值之间的差值( > 真实值为正,< 真实值为负)
一. 误差的分类
1. 系统误差(systermaticerror )——可定误差(determinateerror)
(1)方法误差:拟定的分析方法本身不十分完善所造成;
如:反应不能定量完成;有副反应发生;滴定终点与化学计量点不一致;干扰组分存在等。
(2)仪器误差:主要是仪器本身不够准确或未经校准引起的;
如:量器(容量平、滴定管等)和仪表刻度不准。
(3)试剂误差:由于世纪不纯和蒸馏水中含有微量杂质所引起;
(4)操作误差:主要指在正常操作情况下,由于分析工作者掌握操作规程与控制条件不当所引起的。如滴定管读数总是偏高或偏低。
特性:重复出现、恒定不变(一定条件下)、单向性、大小可测出并校正,故有称为可定误差。可以用对照试验、空白试验、校正仪器等办法加以校正。
2. 随机误差(randomerror)——不可定误差(indeterminateerror)
产生原因与系统误差不同,它是由于某些偶然的因素所引起的。
如:测定时环境的温度、湿度和气压的微小波动,以其性能的微小变化等。
特性:有时正、有时负,有时大、有时小,难控制(方向大小不固定,似无规律)
但在消除系统误差后,在同样条件下进行多次测定,则可发现其分布也是服从一定规律(统计学正态分布),可用统计学方法来处理
系统误差——可检定和校正
偶然误差——可控制
只有校正了系统误差和控制了偶然误差,测定结果才可靠。
二. 准确度与精密度
(一)准确度与误差(accuracy and error)
准确度:测量值(x)与公认真值(m)之间的符合程度。
它说明测定结果的可靠性,用误差值来量度:
绝对误差 = 个别测得值 - 真实值
(1)
但绝对误差不能完全地说明测定的准确度,即它没有与被测物质的质量联系起来。如果被称量物质的质量分别为1g和0.1g,称量的绝对误差同样是0.0001g,则其含义就不同了,故分析结果的准确度常用相对误差(RE%)表示:
(2)
(RE%)反映了误差在真实值中所占的比例,用来比较在各种情况下测定结果的准确度比较合理。
(二)精密度与偏差(precision and deviation)
精密度:是在受控条件下多次测定结果的相互符合程度,表达了测定结果的重复性和再现性。用偏差表示:1. 偏差
绝对偏差: (3)
相对偏差: (4)
2. 平均偏差
当测定为无限多次,实际上〉30次时:
总体平均偏差 (5)
总体——研究对象的全体(测定次数为无限次)
样本——从总体中随机抽出的一小部分
当测定次数仅为有限次,在定量分析的实际测定中,测定次数一般较小,<20次时:
平均偏差(样本) (6)
相对平均偏差 (7)
用平均偏差表示精密度比较简单,但不足之处是在一系列测定中,小的偏差测定总次数总是占多数,而大的偏差的测定总是占少数。因此,在数理统计中,常用标准偏差表示精密度。
3. 标准偏差
(1)总体标准偏差
当测定次数大量时(>30次),测定的平均值接近真值此时标准偏差用s表示:
(8)
(2)样本标准偏差
在实际测定中,测定次数有限,一般n<30 ,此时,统计学中,用样本的标准偏差S来衡量分析数据的分散程度:
(9)
式中(n-1)为自由度,它说明在n次测定中,只有(n-1)个可变偏差,引入(n-1),主要是为了校正以样本平均值代替总体平均值所引起的误差
即 (10)
而S ?s
(3)样本的相对标准偏差——变异系数
(11)
(4)样本平均值的标准偏差
(12)
此式说明:平均值的标准偏差按测定次数的平方根成正比例减少
4. 准确度与精密度的关系
精密度高,不一定准确度高;
准确度高,一定要精密度好。
精密度是保证准确度的先决条件,精密度高的分析结果才有可能获得高准确度;
准确度是反映系统误差和随机误差两者的综合指标。
误差的统计概念
一. 随机误差的正态分布
1. 正态分布
随机误差的规律服从正态分布规律,可用正态分布曲线(高斯分布的正态概率密度函数)表示:
(13)
式中:y—概率密度;m—总体平均值;s—总体标准偏差。
正态分布曲线依赖于m和s两个基本参数,曲线随m和s的不同而不同。为简便起见,使用一个新变数(u)来表达误差分布函数式:
(14)
u的涵义是:偏差值(x-m)以标准偏差为单位来表示。
变换后的函数式为:
(15)
由此绘制的曲线称为“标准正态分布曲线” 。因为标准正态分布曲线横坐标是以s为单位,所以对于不同的测定值m及s,都是适用的。
图1:两组精密度不同的测定值图2:标准正态分布曲线
的正态分布曲线
“标准正态分布曲线”清楚地反映了随机误差的分布性质:
(1)集中趋势当x=m时(u=0),,y此时最大,说明测定值x集中在m附近,或者说,m是最可信赖值。(2)对称趋势曲线以x=m这一直线为对称轴,表明:
正负误差出现的概率相等。大误差出现的概率小,小误差出现的概率大;很大误差出现的概率极小。在无限多次测定时,误差的算术平均值极限为0 。
(3)总概率曲线与横坐标从-μ到+μ在之间所包围的面积代表具有各种大小误差的测定值出现的概率的总和,其值为1(100%)
(16)
用数理统计方法可以证明并求出测定值x 出现在不同u 区间的概率(不同u 值时所占的面积)即x 落在
m±us区间的概率:
置信区间置信概率
u = ± 1.00x = m± 1.00 s68.3%
u = ± 1.96x = m± 1.96 s95.0%
u = ± 3.00x = m± 3.00 s99.7%
二. 有限数据随机误差的t 分布
在实际测定中,测定次数是有限的,只有和S,此时则用能合理地处理少量实验数据的方法—t分布
1. t分布曲线(实际测定中,用、S 代替m、s)
t分布曲线与标准正态分布曲线相似,纵坐标仍为概率密度,纵坐标则是新的统计量t
(17)
无限次测定,u一定?P就一定;
有限次测定:t一定?P随n (自由度)不同而不同。
不同的n值及概率所对应的t值,已有统计学家计算出来,可由有关表中查出。
2. 平均值的置信区间
应用t分布估计真值范围,考虑的符号时,则可得到如下关系式:
m = x ±tP,nS(18)
同样,对于样本平均值也存在类似的关系式:
(19)
此式表示的是在一定概率下,以样本平均值为中心的包括真值在内的取值范围,即平均值的置信区间。称为置信区间界限。
此式表明:平均值与真值的关系,即说明平均值的可靠性。
平均值的置信区间取决于测定的精密度、测定次数和置信水平(概率)。(分析工作中常规定为 95%)
测定精密度越高(S小),测定次数越多(n大),置信区间则越小,即平均值越准确。
分析数据的处理
一. 有效数字及其运算规则
1. 有效数字的意义和位数
(1)有效数字:所有准确数字和一位可疑数字(实际能测到的数字)
(2)有效位数及数据中的“ 0 ”
1.0005,五位有效数字
0.5000,31.05% 四位有效数字