化学分析测量误差,不确定度评定和数据处理
化学分析测量误差、不确定度评定和数据处理
一、化学分析测量误差
1.测量及其分类
1.1 测量就是将待测量与选作计量标准的同类量进行比较得出其倍数的过程。倍数值称为待测量的数值,选作的计量标准称为单位,因此,表示一个被测对象的测量值必须包括数值和单位。
1.2 根据测量方式测量分为直接测量和间接测量。
直接测量:可直接从仪器或量具上直接读出待测量大小的测量。例如:用天平称取样品的质量;从滴定管上读取溶液体积等。
间接测量:待测量的量值是由若干个直接测量量值经过一定的函数关系运算才获得,这样的测量称为间接测载量。
1.3根据测量条件是否相同测量又可分为等精度测量和不等精度测量。
在相同条件下进行的一系列测量是等精度测量。例如:同一个人,使用同一仪器,采用同样方法,对同一待测量连续进行多次重复测量,此时应该认为每次测量的可靠程度都相同,故称为等精度测量。这样一组测量值称为测量列。应该指出:重复测量必须是重复进行测量整个操作过程,而不是仅仅为重复读数。
在对某一被测量进行多次测量时测量条件完全不同或部分不同则各次测量结果的可靠程度自然也不同的一系列测量称为不等精度测量。例如,对同一待测量连续进行多次重复测量时,选用的仪器不同,或测量方法不同,或测量人员不同等,都属于不等精度测量。处理不等精度测量的结果时,根据每个测量的“权重”进行“加权平均”。事实上,在化学分析测试中,保持测量条件完全相同的多次测量是极其困难的,但条件变化对测试结果影响不大时,仍可认为这种测量为等精度测量,等精度的误差分析和数据处理比较容易,所以将绝大多数的化学分析测量都采用等精度测量。
2.误差及其分类
2.1 (量的)真值
与给定的特性量定义一致的值称为真值。
量的真值只有通过完善的测量才有可能获得,真值按其本性是不确定的,与给定的特性量定义一致的值不一定只有一个。
2.2 (测量)误差
测量结果减去被测量的真值称为(测量)误差。
误差之值只取一个符号非正即负。因为它是指与真值之差值常称为绝对误差。绝对误差是一个有量纲的数值,它表示测量值偏离的程度。绝对误差除以真值称为相对误差。相对误差是一个无量纲的量,常常用百分比来表示准确度的高低。
2.3 误差的分类
正常的测量误差,按其产生的性质,一般可分为系统误差、随机误差和过失误差。这种划分及其相应的概念,虽然与现在广泛采用的描述测量结果的不确定度概念之间不一定存在简单的对应关系,甚至有些概念可能还是不太严格的,但是作为思维和理解基础还是应该了解的。
2.3.1 系统误差:在相同条件下,对同一量进行多次测量时,误差的大小恒定,符号总偏向一方或误差按照某一确定的规律变化,称为系统误差。系统误差的来源有以下几个方面:
2.3.1.1 仪器误差:由于仪器本身的缺陷或没有按照规定条件使用仪器而造成的,如温度计零刻度不在冰点、天平不等臂等。
2.3.1.2 理论误差:由于实验方法本身不完善或测量所依据的理论公式本身的近似性而造成的。
2.3.2.3 环境误差:由于环境影响和没有按规定的条件使用仪器引起的。
2.3.2.4 个人误差:由于观测者本人生理或心理特点造成的。
系统误差的特征是具有确定性和方向性,或者都偏大,或者都偏小。系统误差一般应通过校准测量仪器、改进实验装置和实验方案、对测量结果进行修正等方法加以消除或尽可能减小。实验结果是否正确,往往在于系统误差是否已被发现和尽可能消除,因此系统误差不能轻易放过。
2.3.2 随机误差:在同一量的多次测量过程中,绝对值和符号以不可预知的方式变化着的误差分量称为随机误差,随机误差也称为偶然误差。随机误差是实验中各种因素的微小变化引起的,主要有:
2.3.2.1 实验装置的变动性。如仪器精度不高,稳定性差,测量示值变动等;
2.3.2.2 观察者本人在判断和估计读数上的变动性。主要指观察者的生理分辨本领、感官灵敏度、手的灵活程度及操作熟练程度等带来的误差;
2.3.2.3 实验条件和环境因素的变动性如气流、温度、湿度等微小的、无规则的起伏变化,电压的波动等引起的误差。
这些因素的共同影响使测量结果围绕测量的平均值发生涨落变化,这些变化量就是各次测量的随机误差。就随机误差而言是没有规律的,当测量次数足够多时,随机误差服从统计分布规律,可以用统计学的方法估算。
2.3.3 过失误差实验中,由于实验者操作不当,或粗心大意,例如看错刻度、看错数字、记错数字或计算错误等都会使测量结果明显地被歪曲,严格地讲,过失误差应叫做错误,它可以通过实验者的主观努力来克服。
根据前面所说的三种类型的误差性质,过失应叫做错误,错误不是误差,它可以通过实验者的主观努力加以克服,要及时发现并在数据处理时予以剔除。而系统误差和随机误差是客观的,不可避免的,只能通过实验条件的改善和实验方法的改进予以减小,它们是由客观环境和个人感官的局限决定的。
3.随机误差的分布规律与特性
随机误差的出现,就某一测量值而言是没有规律的,但对同一量进行多次测量时,则发
现随机误差的出现服从某种统计规律。理论和实践证明,等精度测量中,当测量次数
n 很大时(理论上n →∝),测量列的随机误差多接近正态分布。标准化的正态分布如图
1.1所示。服从正态分布的随机误差符合如下特征:
3.1 单峰性 绝对值小的误差比绝对值大的误差出现的概率大:
3.2 对称性 绝对值相等的正误查和负误差出现的概率相等;
3.3 有界性 在一定的测量条件下,绝对值很大的误差出现的概率趋于零;
3.4 抵偿性 随机误差的算术平均值随着测量次数的增加而趋向于零。也就是说,随着测量次数的增加,测量列的算术平均值越来越趋近于真值。因此增加测量次数,可以减小随机误差的影响。抵偿性是随机误差最本质的特征。
4. 测量的精密度、正确度和准确度
4.1 精密度 在规定的条件下,独立测试结果间的一致程度。也就是各次测量结果之间彼此接近的程度。它是对随机误差的描述,随机误差小,测量的精密度就高。精密度的度量时,通常以不精密度表达,其量值用测试结果的标准差来表示。标准差用贝塞尔公式求得:
()()12--=∑n x x x S i
ik ik ()()
()
()
1--==∑n n x x n x S x S i ik ik i 4.2 正确度 由大量测量结果得到的平均数与接受参照值间的一致的程度。它是对系统误差的描述,他反映系统误差对测量结果的影响程度。系统误差小,测量的正确度就高。
4.3 准确度 各测试结果之间的接近程度和总体平均值与参照值间一致的程度。它包括了精密度和正确度两方面的含义。它反映随机误差和系统误差对测量结果的综合影响程度。只有随机误差和系统误差都非常小,才能说测量的准确度高。
1.1
图1.2所示的打靶情况,比较形象地理解精密度、正确度和准确度三者的区别。
图1.2 精密度、正确度和准确度三者的区别
4.4 平均值
4.4.1 平均值是最佳估计值在日常分析工作中,经常进行两次重复测定,取其平均值报出结果,这是比较合适的。对于要求更高的测定,则要多次测定,然后取其平均值作为最后的测定结果。
多次测定的平均值比单次测定更可靠,测定次数越多,所得平均值更可靠,这是为人们公认的常识的问题,我们也可以从数理上的最小二乘法的基本原理来证明平均值就是多次测定结果中的最可信赖值。
最小二乘法的基本原理用文字叙述是:在具有等精密度的许多测定结果中的最可信赖值(或称最佳值,即出现概率最高的值)是当各测定值的残差的二乘方之和为最小所求得的那个数值。
4.4.2 平均值的误差平均值与真值之差称为误差。以x表示平均值,μ表示真值,δ表示平均值的误差,则
δ=x-μ
通过演算,用下式表达平均值误差
δ
X =1/ n Σδ
I
上式表明,测定平均值的误差等于从各测定值误差求平均值。当测定次数趋于无限大时,正负
误差相互抵消, Σδ
I
趋于零,也就是说,平均值的误差为零,或者说平均值等于真值。如果测定次数是有限次数,则平均值存在一定误差。
由上述可知,增加测定次数可以提高测定结果的精密度,但实际上增加测定次数是有限的,图1.3表示平均值的误差与测定次数的关系。
由曲线可以看出,开始增加测定次数时,平均值的误差减少很快,在N>5以后,开始变
慢;N>10以上时变化不明显。这充分说明在日常工作中,重复测定3—4次对测定的精密度最有效,一般没有必要测定10次以上。
4.4.3 平均值的置信界限平均值的可靠性是相对的,仅仅报一个平均值不能明确地说明
测定的可靠性,如果求得平均值的标准偏差,报告以x±S
X
来表示结果,这就好一些,因为它还
能说明平均值的标准差要使所有测定值落在x±S
X
范围内有多大的机会呢?由误差的概率分布知道,测定结果落在这个范围内的概率是68%,也就是通常称作置信水平,在分析化学中,
一般都按95%的置信水平来要求,即x±2S
。
X
图1.3 平均值的误差与测定次数的关系
二、测量误差与测量不确定度
前面我们阐述了误差的概念,了解了什么是系统误差、随机误差和过失误差。但由前面所说,误差本身就是不确定的。根据误差的定义,真值是一个理想概念,实际上是不可能准确地知道,因而测量误差也是不可能确切获知。,量子效应的存在,排除了唯一真值的存在。
实际工作中,正是由于不知道被测量的真值,所以才去进行测量,故误差经常是不知道的。过去不确定度曾用“表征被测量真值所处量值范围的评定”定义,这是与误差相连的定义,但误差也是一个理想的概念,不便操作,而分散性可用贝塞尔公式等计算,故不确定度用分散性定义是合理的。过去经常评定的测量误差,实际上是指测量不能肯定的程度,故实际是为不确定度。过去评定误差为标准差等于多少,应改为标准不确定度等于多少,过去评定误差为三倍标准差等于多少,应改为扩展不确定度。
测量不确定度是经典的误差理论发展和完善的产物。不确定度一词是1953年Beers在《误差理论导引》一书中提出的,从1963年NBS的埃森哈特建议采用“不确定度”到1993年由国际标准化组织(ISO)、国际电工委员会(IEC)、国际计量委员会(CIPM)、国际法制计量组织(OIML)等国际权威组织正式发布了《测量不确定度指南》(Guide to the Expression of Uncertainty in Measurnement,简称GUM),对测量不确定度的评定与表示方法作出了明确的规定,历时30年。
1996年,中国计量科学研究院制定了测量不确定度技术规范,1999年国家质量技术监督局发布了JJF 1059《测量不确定度评定与表示》技术规范(简称规范),从易于理解、便于操作、利于过渡出发,原则上等同采用了GUM的基本内容,它是我国不确定度评定及其应用的基础规范,是评定与表示不确定度的通用规则,适用于各种准确度等级的测量领域。
在科学研究和生产中,在商业贸易、医疗环保中,进行了大量的测量工作,其测量结果如何,都要用不确定度来说明。在经济全球化的今天,测量不确定度评定与表示方法的统一,
乃是科技交流和国际贸易的迫切要求,具有重要的现实意义。
现在GUM在全世界的推广和执行已经达到一个新的水平,它的应用和推广已经成为当今科技界、质量技术监督部门各类认可机构和认证机关的关注焦点,同时也成为化学分析学术界讨论的热点。实验室工作中,GB/T 15481-2000(ISO 17025-2000)《检测和校准实验室能力的通用要求》(ISO 已出2005年版本)、CNAL/AC 01-2005《检测和校准实验室能力认可准则》及CNAL/AC 11-2002《测量不确定度政策》(现有2006年版本)等技术标准中对测量不确定度的评定和表示均有明确的要求。该标准指出:“当不确定度与检测结果的有效性或与应用有关,或客户的指定中有要求,或当不确定度影响到对规范限度的符合性时,检测报告中还需要包括有关不确定度的信息。”在认可实验室的技术能力时,必须要求校准实验室和开展自校准的检测实验室制定测量不确定度评定程序并将其用于所有类型的校准工作,必须要求检测实验室制定与检测工作特点相适应的测量不确定度评定程序,并将其用于不同类型的检测工作。
测量误差与测量不确定度的主要区别见表2.1
表2.1 测量误差与测量不确定度的主要区别
我们应该明白,GUM和JJG 1059技术规范的发布和实施,不是对长期沿用“测量误差”的否定,而是误差理论与时俱进的发展。一切检测测试工作都存在误差,如果检测测试结果都是真值,那么就没有误差的存在。没有误差就没有误差的分散,也就没有估计分散的标准差,当然也就没有现在提出的测量不确定度了。应当指出,不确定度概念的引入并不意味着“误差”一词放弃使用,实际上误差仍可用于定性地描述理论和概念的场合。我们没有必要将误差理论改为不确定度理论,或将误差源改为不确定度源。某些术语,如误差分析和不确定度分析等都是可以并存的,可以保留原来的名称。总之,它们是两个不同的概念,不能等同,不能混淆,两者在计量学中各有其确切的定义。
三、化学成分量的溯源性
1. 溯源性的概念
溯源性是测量结果或计量标准量值的属性,它使测量结果或计量标准的量值,通过连续比较链,以给定的不确定度与国家或国际标准联系起来。上述溯源性定义说明了:
1.1溯源性是一切有效的计量标准和测量结果的根本属性;
1.2对每个测量结果或计量标准的量值估计出总的不确定度;
1.3国家或国际权威计量机构必须研究建立国家或国际计量基准,并建立物理量、化学
成分量、工程特性量和其它测量领域有关的溯源链及维持溯源链的组织系统。
2. 化学成分量的溯源体系
2.1 化学成分量的溯源链可用图
3.1表示。图3.1表示出两个并存的溯源链,右侧适用于复杂基体物质中化学成分的量的溯源,左侧适合物质纯度高和简单物系中化学成分的溯源。2.2 溯源链连续性溯源链是连续的比较链。连续性是溯源性的关键,然而由于化学分析测量过程复杂,影响因素多,发生间断溯源链、失去连续性的机率大。当实验室对某一样品中
某一化学成分量进行测试时,一般都经过图3.2的测量流程。流程中的每一步骤均引入系统误差、随机误差,甚至可能发生过失误差。若忽视了任一不应忽视的误差则使溯源链断裂,得出不可靠的结果。因而需运用计量学和化学测量的质量保证技术避免过失误差,发现、消
除或校正固定方向的系统误差;研究和估计每一步骤的B类不确定度;根据观测列数据计算A类不确定度;根据整个分析过程的B类不确定度、A类不确定度和所用标准物质量值的不确定度,估计出测量结果的总不确定度。
图 3.2 一般化学成分测量流程
在日常分析测量中,通常用标准偏差和双样平行差表达测量结果的准确度,这是建立在同时存在下面情况的几个假设:
2.2.1 被测样品的化学成分十分均匀、稳定,取样方案和取样过程无任何失误,样品能真实代表总体,取样误差可以忽略不计;
2.2.2 样品处理过程(如溶解沉淀分离富集等)未引起被测成分量的污染和损失,回收率接近100%,分析测量的空白值可以忽略不计;
2.2.3 分析仪器性能经检定示值误差可以忽略不计;标准物质与被测试液组成匹配消除了基体效应与干扰物的影响;所用标准物质的不确定度足够小;合理设计校准与测量程序,正确制备和使用工作曲线,已将误差随机化;
2.2.4 在测量过程中,无过失误差;
2.2.5 观测数据符合统计规律并按有效数字修约规则处理数据表达结果;
2.2.6 n次重复测量属独立测量,即从取样开始的全过程,过程的B类不确定度已反映到观测数据中。
上述几个假设都同时成立时,则图3.2中的△
1~△
3
,U
1
~U
8
都可忽略不计,T
2、
T
1、
T
均无
显著差异,只有在这种情况下,才能断定测量结果的真值T
,以a概率落入X ± t·S/n范
围内,这样的结果才具有溯源性,否则应对U
1~U
8
评定不确定度,与测量结果标准差合成为
总标准不确定度u
c ,用X ± k·u
c
表达测量结果的置信区间。
3. 化学成分量的溯源性体系的基本要素
通过化学成分的溯源链来实现化学成分的测量结果在不同时间、不同空间的可比性和一致性,有赖于:
3.1 建立国家和国际化学成分量的溯源体系和运行;
3.2 化学成分量的溯源链,是化学成分量的溯源体系的科学基础,不同层次而又互相联系的组织机构,是化学成分量的溯源体系的组织保证;
3.3 协调一致的技术规范或法规是化学成分量溯源体系的技术条件。
通过以上的论述,就明白了为什么要强调采样、制样、正确选择方法、十分重视技术人员素质、仪器的定期检定、校准、保证必要的环境条件,为什么要建立国家实验室认可制度。
四、化学测量不确定度的评定
1.基本术语
1.1 (测量)不确定度[uncertainty of measurement]
用以表征合理赋予被测量之值的分散性,与测量结果相联系的参数。
上述定义的意思是不确定度就是合理地对被测量进行多次的测量所得到结果的分散性,分散性的含义就是一个量值区间,也就是说测量结果在这一区间出现,而不是一个定值,这样的区间是以某一概率(如95%或99%)包括可能得到的结果。定义中“与测量结果相联系”的表述,“相联系”,确切地说,即“与……在一起”,因此,测量不确定度和测量结果在一起,用以表明在给定条件下,对被测量值进行测量时,测量结果可能出现的区间。如果不确定度报告只给出u
c
或U,而不给出测量结果是不严密的。
1.2标准不确定度(Standard uncertainty)
以标准偏差表示的测量不确定度,标准不确定度记为u 。
1.3 不确定度A类评定(Type A evaluation of uncertainty)
用观测列进行统计分析方法,来评定标准不确定度。
1.4不确定度B类评定(Type B evaluation of uncertainty)
用不同于观测列进行统计分析所作的方法,来评定标准不确定度。
1.5合成标准不确定度(Combined Standard uncertainty)
当测量结果是若干个其他量的值求得时,按其他各量的方差或(和)协方差算得的标准不
确定度。测量结果y的合成标准不确定度记为u
c (y),可简写为u
c
或u(y)。它是测量结果
标准差的估计值。
1.6扩展不确定度(Expanded uncertainty)
也称为范围不确定度或展伸不确定度。在INC—1中,也曾称为总不确定度(Overall uncertainty)。它是确定测量结果区间的量,合理赋予被测量之值的分布的大部分可望含于该区间。扩展不确定度记为U。
1.7相对扩展不确定度
扩展不确定度除以测量结果的绝对值y (y≠0)
1.8 包含因子(coverage factor)
为求得扩展不确定度,对合成标准不确定度所乘的数字因子。包含因子也称范围因子,记为k。
1.9 自由度(degrees of freedom)
求不确定度所用总和中的项数与总和的限制条件数之差,记为。
1.10 置信水准(levl of confidence)
对扩展不确定度确定的测量结果区间,包含合理赋予被测量值的分布的概率。置信水准也被称为包含概率、置信概率,记为p。
1.11 准确度(accuracy of measurerment)
测量准确度是测量结果与测量真值之间一致的程度。由于测量准确度与真值相连,真值是一个理想概念,故测量准确度也是一个理想概念,它无法按上述定义操作。
准确度是一个定性的概念,不是定量概念,定量表示宜用不确定度,准确度不能与数字相连,因此只能说准确度高或低,与数字相连只能用不确定度。如两个实验室测量某一铁矿石的全铁,其相对扩展不确定度为1%和0.1%,不能说一个实验室的测量结果的准确度1%,另一个实验室的测量结果的准确度是0.1%,因1%大于0.1%,就说前一个实验室的准确度高于后一个实验室的准确度,这样说正好与事实相反。
1.12(测量仪器的)最大允许差[maximum permissible error (of a measuring
instrument)]
最大允许差也称极限允许差、容许误差、容差,它定义为技术规范、规程等对给定测量仪器所容许的误差极限值。
最大允许差是对一种型号产品仪器规定的容许范围,此种型号的任一台仪器的误差都应在此容许范围内,若对一台具体仪器,经校正后已知其误差,并将此误差反号作为修正值修正示值时,则用仪器测量所得的结果应考虑修正值的不确定度。若只知道仪器的最大容许差,则在评定测量结果的不确定度时,可将测量仪器的最大允许差作为B类评定分量的变化半范围或扩展不确定度。若认为误差在最大允许误差所定范围中心波动大于边界波动时,为服从三角分布的随机变量,则将它除以6可得该分量的标准不确定度。
1.13 最佳测量能力(best measurement capability)
为用于定义、实现或再现某一量值单位的近理想的测量标准,或为测量某量值而设计的测量仪器,当实施它们接近日常的校准或检测时,一个实验室在其认可范围内能达到的最小不确定度,称为最佳测量能力。
也就是说,每一个检测实验室的每种检测项目,当检测处于理想状态(设备人员环境方法试样等处于理想受控状态)时,所评定出的测量不确定度应该是最小的。这就是每一个检测实验室的每种检测项目的最佳测量能力。表述实验室的能力时,一般采用最佳测量能力。
2. 不确定度评定程序
化学分析测量结果不确定度评定程序如图4.1所示:
图 4.1 化学分析测量结果不确定度评定程序
3. 标准不确定度的A 类评定
单次测量不确定度评定方法(基本情况)
3.1 贝塞尔法
()()12--=
∑n x x x S i ik ik ()()
()
()1--==∑n n x x n x S x S i ik ik i
式中:S (x ik )-单次测定的标准不确定度;X ik -测定结果;X i -测定结果平均 值;
S (x i )—测定结果平均值的标准不确定度;n -测定次数。
3.2 最大残差法
S(x i k )=C n max|X i k - X i |
式中:Cn -最大残差法系数;X ik -测定结果;X i -测定结果平均值;
max|X i k - X i |-测定结果残差最大值的绝对值;n -测定次数。
表4.1 最大残差法系数Cn
n
2 3 4 5 6 7 8 9 10 11 12 Cn
1.77 1.02 0.83 0.74 0.68 0.64 0.61 0.59 0.57 0.51 0.48
此法用于测量需要考虑测量值与平均值之差的情况
3.3 极差法
S(x
i k )=(maxX
ik
- minX
ik
)/d
n
式中:maxX
ik -测定结果列中的最大值;minX
ik
-测定结果列中的最小值;
d
n
-极差法系数;n—测定次数。
表4.2 极差法系数d
n
表
n23456789101520
D
n
1.13 1.69
2.06 2.33 2.53 2.70 2.85 2.97
3.08 3.47 3.73
此法用于测量需要考虑最大值与最小值之差的情况.
4标准不确定度的B类评定
4.1 B类评定信息可根据以下几条
4.1.1有关仪器和材料的一般知识;
4.1.2仪器制造说明书;
4.1.3校准或其他报告提供的数据;
4.1.4手册提供的参考数据的不确定度。
4.2 B类评定有如下方法
4.2.1 倍数法
当给出的不确定度U(x
j )为估计标准差的k
j
倍时,标准不确定度为:
(x
j )=U(x
j
) / k
j
4.2.2 正态分布法
当x
j
为受到多个独立量影响且影响大小相近的值,则可视为服从正态分布:
4.2.2.1如给出的不确定度U(x
j )对应的置信水平为0.95,0.99,0.997,则将U(x
j
)除以
1.96,
2.58,3,即可得到相应的标准不确定度u(x
j
);
4.2.2.2如x
j , 在 [x
j
-a, x
j
+a] 的概率为0.5, 则u(x
j
)=1.5a;
4.2.2.3如x
j , 在 [x
j
-a, x
j
+a] 的概率为0.68≈2 / 3, 则u(x
j
)= a。
正态分布情况的置信水准(置信概率)p与包含因子k
p
间的关系见表4.3:
表4.3 正态分布情况下置信水准p与包含因子k
p
间的关系p(%)5068.27909595.459999.73
k
p
.671 1.645 1.9602 2.5763 4.2.3 均匀分布法
当x
j 在[x
j
-a,x
j
+a]内各处出现的机会相等,而在区间外不出现,则x
j
服从均匀分
布,于是