能力验证结果的统计处理和能力评价指南-CNAS
CNAS-GL02:2014《能力验证结果的统计处理和能力评价指南》

CNAS-GL02:2014
第 6 页 共 20 页
a)理想情况下,如果指定值由参加者公议确定,应当有确定该指定值正确度和 检查数据分布的程序。例如,可采用将指定值与一个具备专业能力的实验室得到的参 考值进行比较等方法确定指定值的正确度。 通常, 正态分布是许多数据统计处理的基础。 正态分布的特点是单峰性、 对称性、 有界性和抵偿性。作为一个能力验证计划的结果,由于参加者的测试方法、测试条件 往往各不相同,而且能力验证结果的数量也是有限的,所以在许多情况下能力验证的 结果呈偏态分布。对能力验证的结果只要求近似正态分布,尽可能对称,但分布应当 是单峰的,如果分布中出现双峰或多峰,则表明参加者之间存在群体性的系统偏差, 这时应研究其原因,并采取相应的措施。例如,可能是由于使用了产生不同结果的两 种检测方法造成的双峰分布。在这种情况下,应对两种方法的数据进行分离,然后对 每一种方法的数据分别进行统计分析。 数据直方图或核(Kernel)密度图可以显示结果 的分布情况。 b) 应当有依据不确定度来判断指定值是否可接受的准则。 在 GB/T 28043 和 IUPAC 国际协议中给出了该准则, 该准则是基于限定指定值不确定度对能力评定的影响而建 立的,即:准则限定了由于指定值的不确定度而使参加者得到一个不可接受的评估结 果的可能性。 4.4 能力统计量的计算 4.4.1 定量结果 4.4.1.1 能力验证结果通常需要转化为能力统计量, 以便进行解释和与其他确定的目 标作比较。其目的是依据能力评定准则来度量与指定值的偏离。所用统计方法可能从 不做任何处理到使用复杂的统计变换。 注:“能力统计量”也称为“性能统计量”。 4.4.1.2 能力统计量对参加者应是有意义的。因此,统计量应适合于相关检测,并在 某特定领域得到认同或被视为惯例。 4.4.1.3 按照对参加者结果转化由简至繁的顺序,定量结果的常用统计量如下: a)差值 D ,由(1)式计算:
CNAS-GL02:2014 能力验证结果的统计处理和能力评价指南.

CNAS—GL02能力验证结果的统计处理和能力评价指南Guidance on Statistic Treatment of Proficiency Testing Results and Performance Evaluation中国合格评定国家认可委员会目次前言 (2)1 范围 (3)2 规范性引用文件 (3)3 术语和定义 (3)4 统计处理和能力评价 (4)附录A检测能力验证计划常用稳健统计方法 (11)附录B能力验证计划结果示例 (14)附录C测量审核结果的评定 (20)前言本文件为能力验证结果的统计处理和能力评价提供指南。
本文件依据GB/T 27043《合格评定能力验证的通用要求》制订,同时参考了GB/T 28043《利用实验室间比对进行能力验证的统计方法》。
GB/T 28043给出了能力验证统计方法的更详细指南,使用本文件时,可同时参考GB/T 28043。
本文件为CNAS-GL02《能力验证结果的统计处理和能力评价指南》的第二版,代替CNAS-GL02:2006《能力验证结果的统计处理和能力评价指南》。
与CNAS-GL02:2006相比,文件的主要变化如下:——增加前言、目次、术语和定义。
——增加定性计划和半定量计划指定值的确定方法和能力评价方法。
——增加对明显错误结果的处理方法。
——增加定量计划能力评定标准差的确定方法。
——增加'z比分数和 比分数两个能力统计量。
——增加以能力比分数的平均值评价参加者能力可能存在的问题。
——增加长期监测能力的方法。
——附录A调整为检测计划常用稳健统计方法,增加稳健统计方法算法A和算法S,原数据分布的内容移至正文,相关示例移至附录B。
——附录B调整为能力验证计划结果示例,包含检测和校准能力验证计划结果示例。
对校准能力验证计划,以200 mg砝码校准能力验证计划结果,代替1伏直流电压标准实验室间比对结果,并增加制作结果图示的新方法。
能力验证结果的统计处理和能力评价指南1范围1.1 本文件为能力验证结果的统计处理和能力评价提供指南。
能力验证结果的统计处理和能力评价指南

能力验证结果的统计处理和能力评价指南能力验证是一种常见的、客观的测试方法,用于衡量和评估某个人的能力水平。
为了有效地统计处理和评估能力验证结果,准确识别能力水平,本文旨在提供一套能力验证结果的统计处理和能力评价指南。
一、数据收集在统计处理和评估能力验证结果之前,需要首先收集足够多的数据。
具体而言,可以从不同的源收集数据,比如在线答题、现场测试、调查问卷等。
从样本数量上来看,测试人数越多,可信性越高,而这些数据的统计处理结果也将更加准确。
二、数据处理收集到的原始数据需要进行处理,以确保准确性。
比如,在处理和统计能力验证结果之前,需要对原始数据进行清理,消除干扰因素,提取正确格式的数据,以便进行下一步分析。
三、统计分析统计分析是能力验证结果的深入分析,它可以帮助我们明确不同能力水平的分布情况、定义标准分数和等级、识别评分点等。
常用的统计分析方法有数据的描述性统计分析、频率分布曲线统计分析、人数计算和极端值处理等。
四、能力评价能力评价是一种定性和定量的分析方法,可以对试验者的表现进行综合评估和识别评价等级。
具体而言,根据试验者的能力水平,可以划分出6个评价等级:优秀、良好、合格、及格、不及格、不合格。
五、数据可视化数据可视化是将统计数据以图表的形式展示出来,以便让更多的人更容易理解。
对于能力验证结果数据,可以采用直方图、柱状图、饼图等形式,可以清晰地展示试验者能力水平的状况,以便更好地评估能力。
六、结论以上是本文提出的一套能力验证结果的统计处理和能力评价指南,包括数据收集、数据处理、统计分析、能力评价、数据可视化等步骤,旨在帮助读者更好地统计处理和评估能力验证结果。
通过本文提出的指南,可以更准确地明确能力验证结果,为企业的招聘、培训、考核工作提供参考,从而更有效地运用该信息,提升管理水平。
CNAS—GL02 能力验证结果的统计处理和能力验证评价指南

CNAS—GL02能力验证结果的统计处理和能力评价指南(试用)中国合格评定国家认可委员会二〇〇六年六月能力验证结果的统计处理和能力评价指南(试用)1.目的与范围1.1 本指南对CNAS能力验证结果的统计处理和根据统计处理结果对实验室进行能力评价的方法提供了指南。
1.2本指南适用于CNAS的能力验证活动以及将结果应用于CNAS认可的能力验证活动。
2.引用文件ISO/IEC 指南43-1:1997《利用实验室间比对的能力验证——能力验证计划的建立和运作》(GB/T15483.1,IDT)APLAC PT001 《检测实验室间的比对》APLAC PT002 《校准实验室间的比对》《NATA 能力验证指南》ISO 5725:1994 1-6 《测量方法和结果的准确度(正确度和精密度)》3.统计处理3.1统计设计3.1.1能力验证的结果可以以多种形式出现,并构成各种统计分布。
分析数据的统计方法应与数据类型及其统计分布特性相适应。
无论使用哪一种方法对参加者的结果进行评价,一般应包括以下几方面内容:a)确定指定值;b)计算能力统计量;c)评价能力;d)在某些情况下需预先确定被测样品的均匀性和稳定性。
3.1.2 在统计设计中应考虑下列事项及其相互影响:a) 所涉及测试的精密性和正确性;b) 在要求的置信水平下检出参加者之间的最小差异;c) 参加者的数量;d) 待检样品的数目和对每一被测样品进行重复检测/测量的次数。
在校准能力验证计划中,应考虑比对的周期;e) 估算指定值所使用的程序,及识别离群值所使用的程序;f) 校准能力验证计划中,参考实验室必须能够给出优于参加者的测量不确定度(应尽量选择拥有国家基标准的实验室)。
3.1.3 在缺乏4.1.2 a)的可靠信息时,可能有必要组织一次先导性实验室间比对(协同试验),以获得该信息。
3.2指定值及其不确定度的确定3.2.1确定指定值的方法有多种,下面是最常用的几种。
按不确定度增加的顺序(多数情况下如此)排列如下:a)已知值——其结果由特定样品配制(如制备、稀释)时确定。
能力验证的两个结果评价参数

能力验证的两个结果评价参数作者:唐倩来源:《科技与创新》2014年第03期摘要:能力验证是利用实验室间比对确定实验室的校准/检测能力或检查机构的检测能力。
能力验证活动包括能力验证计划、实验室间比对和测量审核。
作为评价实验室技术能力的重要手段之一,能力验证活动越来越得到重视,能力验证结果的统计评价方法也越来越受到关注。
通过概述能力验证在评价实验室技术能力中的重要地位,着重讨论了En值和稳健Z比分数这两个结果评价参数,经过分析给出了详细的评价结果,为保证能力验证计划的顺利进行提供了参考。
关健词:能力验证;En值;Z比分数中图分类号:TB9 文献标识码:A 文章编号:2095-6835(2014)03-0023-021 概述能力验证计划是为保证实验室在特定检测、测量或校准领域的能力而设计和运作的实验室比对。
CNAS将能力验证作为评价实验室技术能力的重要手段之一,与现场评审构成了互为补充的两种能力评价技术。
只要存在可获得的能力验证,合格评定机构初次申请认可的每个子领域应至少参加过一次能力验证且获得满意结果;只要存在可获得的能力验证,获准认可合格评定机构应满足CNAS 能力验证领域和频次要求且获得满意结果。
对CNAS 能力验证领域和频次表中未列入的领域(子领域),只要存在可获得的能力验证,获准认可合格评定机构在每个认可周期内应至少参加一次。
下面将讨论两个最常用的结果评价参数En值及稳健Z比分数。
2 En值CNAS-GL02为CNAS 能力验证结果的统计处理和根据统计处理结果对实验室进行能力评价的方法提供了指南,它包括检测实验室间能力验证计划和校准实验室间能力验证计划的结果处理方法等。
对于校准实验室间的能力验证计划(也称为测量比对计划)结果的统计设计,常采用国际上普遍接受的En值来进行评价。
En值又称归一化偏差,为各实验室比对结果与参考值的差值与该值的不确定度之比。
按下式计算:En值并不表明哪个实验室的结果最接近参考值,只表明其测量结果是否符合对实验室要求的不确定度。
能力验证结果的统计处理和能力评价指南

能力验证结果的统计处理和能力评价指南随着社会科学技术的发展,能力验证分析变得越来越重要。
为了更好地评估能力,有必要研究如何进行统计处理,进而形成基于数据的评估指南。
本文旨在提供一种有用的、有效的方法来统计处理能力验证结果,以及根据测试结果进行能力评估的指南。
首先,在统计处理能力验证结果之前,应该先对受测者的测试结果进行有效的检查。
一般来说,在提及数据质量时,都会提到检验受测者有无作弊行为或其他异常,但是还可以进一步考察受测者答题的正确率等其他信息。
同时,受测者的基本信息也应当及时更新,以便准确分析受测者当前的能力水平。
之后,就可以开始统计处理能力验证结果了。
统计处理一般会包括测试数据的汇总、检验数据的完整性和一致性、描述性统计处理(如平均数、标准差等)以及比较性统计处理(如t-test、Z-test等)等。
统计处理的结果将为后面的能力评估提供有效的数据支持。
最后,本文就提出了如何采用基于数据的方法进行能力评估的指南。
首先,根据统计分析结果,从受测者的能力验证结果中提取出相关的数值背景,如胜率、题量、正确率等。
其次,根据这些背景,可以结合某个能力的具体要求来确定受测者的能力水平。
最后,可以根据受测者的实际能力水平来建立合理的能力评估的标准,以便更好地衡量和预测受测者的能力。
综上所述,本文从统计处理能力验证结果入手,提出了一种有效的方法来统计处理能力验证结果,以及根据测试结果进行能力评估的指南。
本文为社会科学技术领域的发展提供了一种新颖、有效的思路,旨在更好地指导和评估能力。
总之,本文研究了能力验证结果的统计处理和能力评价指南,这给社会科学技术的发展提供了有益的思路,也能够更好地指导和评估能力。
未来,还有许多研究可以进行,以探索更加有效的能力评估方法来指导受测者的发展。
CNASGL《能力验证结果的统计处理和能力评价指南》

CNASGL《能力验证结果的统计处理和能力评价指南》《能力验证结果的统计处理和能力评价指南》是中国国家认可委员会(CNAS)发布的一份指南,旨在提供对能力验证结果的统计处理方法和能力评价指导。
本指南的内容包括能力验证结果的统计处理和能力评价的相关概念、步骤和方法。
首先,本指南阐述了能力验证的定义和目的,即通过验证实验来评估实验室或检测机构的测量技术的准确性和可靠性。
接下来,指南介绍了能力验证的基本步骤,包括建立验证方案、选择参与实验的实验室或检测机构、制定实验方案和报告,以及对实验结果进行统计处理和评价。
在对能力验证结果进行统计处理时,本指南推荐使用统计方法来计算各参与实验者的准确度、可重复性、恢复能力等指标。
其中,准确度是指实验结果与真实值之间的接近程度,可通过计算偏离度来评估;可重复性是指重复测量同一样品的结果之间的一致性,可通过计算标准差来评估;恢复能力则是指实验结果受到外界干扰或变化的能力,可通过计算偏离度和回归系数来评估。
在能力评价方面,本指南提供了不同的方法和指标,如Z值、可信区间、能力指数等,用于评估实验室或检测机构的能力水平。
这些指标可用于比较不同实验室或检测机构之间的性能差异,以及评估实验室或检测机构的准确性、可靠性和适用性。
最后,本指南还介绍了能力验证结果的报告和使用方法。
报告内容应包括实验步骤、数据处理方法、结果分析和能力评价等,同时还应注明验证的范围、限制和不确定度。
而能力验证结果的使用方法则包括用于评估实验室或检测机构的质量管理体系、确定测量方法和标准、并指导实验室或检测机构的改进措施和培训需求等。
综上所述,《能力验证结果的统计处理和能力评价指南》是一份对实验室和检测机构进行能力验证、统计处理和评价的重要指南。
它提供了一系列的方法和指标,以帮助实验室或检测机构评估其测量技术的准确性和可靠性,从而提高质量管理水平和客户满意度。
实验室能力验证实施办法

实验室能力验证实施办法第一章总则第一条为保证规范、有效地开展实验室能力验证活动,根据水利部《关于加强水质监测质量管理工作的通知》(水文[2010]169号),制定本办法。
第二条本办法所称的能力验证,是指利用实验室间指定检测数据的比对,确定实验室从事特定测试活动的技术能力。
第三条本办法适用于水利系统各级监测机构实验室能力验证的组织、运作、纠正措施和结果利用等活动。
第二章组织管理第四条水利部水文局负责组织水利系统水质监测实验室能力验证活动,并按规定向中国合格评定国家认可委员会(英文缩写:CNAS)报送有关材料。
第五条水利部水环境监测评价研究中心(以下简称:部中心)受水利部水文局的委托,负责编制实验室能力验证计划,组织实施能力验证活动。
第六条各级监测机构应积极参加水利系统水质监测能力验证活动。
水利工程管理单位直属的水质检测实验室,可以根据条件和需要,自愿申请参加。
第三章能力验证工作程序第七条水利部水文局下达实验室能力验证计划,组建专家组,按《利用实验室间比对的能力验证第1部分:能力验证计划的建立和运作(GB/T 15483.1)》的有关要求,编制能力验证计划实施方案。
第八条部中心作为实验室能力验证计划的实施机构,根据专家组编制的能力验证计划实施方案,编制作业指导书,制备能力验证样品,并按《能力验证样品均匀性和稳定性评价指南(CANS-GL03)》要求进行样品均匀性和稳定性检验。
第九条专家组负责审核实施机构起草的作业指导书和制备的能力验证样品。
审核通过后,方可启动能力验证计划。
第十条各级监测机构根据要求,自愿报名参加能力验证计划。
一般应在考核前两周向部中心提交《水利系统水质监测能力验证报名表》。
第十一条部中心向所有参加能力验证的监测机构及时寄送《能力验证样品接收状态确认表》、《能力验证试验结果报告单》和能力验证测试样品。
第十二条参加能力验证的监测机构收到能力验证样品后,应尽快进行测试,并在规定时间内上报结果报告单等材料。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
CNAS—GL002能力验证结果的统计处理和能力评价指南Guidance on Statistic Treatment of Proficiency Testing Results and Performance Evaluation中国合格评定国家认可委员会目次前言 (2)1 范围 (3)2 规范性引用文件 (3)3 术语和定义 (3)4 统计处理和能力评价 (4)附录A检测能力验证计划常用稳健统计方法 (11)附录B能力验证计划结果示例 (14)附录C测量审核结果的评定 (20)前言本文件为能力验证结果的统计处理和能力评价提供指南。
本文件依据GB/T 27043《合格评定能力验证的通用要求》制订,同时参考了GB/T 28043《利用实验室间比对进行能力验证的统计方法》。
GB/T 28043给出了能力验证统计方法的更详细指南,使用本文件时,可同时参考GB/T 28043。
能力验证结果的统计处理和能力评价指南1范围1.1 本文件为能力验证结果的统计处理和能力评价提供指南。
1.2 本文件适用于CNAS的能力验证,也可为其他机构组织能力验证提供参考。
2规范性引用文件下列文件中的条款通过引用而成为本文件的条款。
以下引用的文件,注明日期的,仅引用的版本适用;未注明日期的,引用文件的最新版本(包括任何修订)适用。
CNAS-RL02 能力验证规则CNAS-GL03 能力验证样品均匀性和稳定性评价指南GB/T 27043 合格评定能力验证的通用要求(ISO/IEC 17043,IDT)GB/T 28043 利用实验室间比对进行能力验证的统计方法(ISO 13528,IDT)GB/T 6379 测量方法与结果的准确度(正确度和精密度)(ISO 5725,IDT)ISO/IEC 指南98-3 测量不确定度第3部分:测量不确定度的表示指南ISO/IEC 指南99:2007 国际计量学词汇基础和通用概念及相关术语IUPAC 技术报告分析化学实验室能力验证国际协议3术语和定义CNAS-RL02、GB/T 27043、GB/T 28043、ISO/IEC 指南99界定的术语和定义适用于本文件。
为方便使用,重复列出以下术语和定义:3.1实验室间比对 interlaboratory comparison按照预先规定的条件,由两个或多个实验室对相同或类似的物品进行测量或检测的组织、实施和评价。
3.2能力验证 proficiency testing利用实验室间比对,按照预先制定的准则评价参加者的能力。
3.3指定值 assigned value对能力验证物品的特定性质赋予的值。
3.4能力评定标准差standard deviation for proficiency assessment根据可获得的信息,用于评价能力验证结果分散性的度量。
注1:标准差只适用于比例尺度和定距尺度的结果。
注2:并非所有的能力验证计划都根据结果的分散性进行评价。
3.5 z比分数 z-score由能力验证的指定值和能力评定标准差计算的实验室偏倚的标准化度量。
注:z比分数有时也称为z值或z分数。
3.6离群值 outlier一组数据中被认为与该组其他数据不一致的观测值。
注:离群值可能来源于不同的总体,或由于不正确的记录或其他粗大误差的结果。
3.7稳健统计方法 robust statistical method对给定概率模型假定条件的微小偏离不敏感的统计方法。
3.8 测量审核 measurement audit一个参加者对被测物品(材料或制品)进行实际测试,其测试结果与参考值进行比较的活动。
注:测量审核是对一个参加者进行“一对一”能力评价的能力验证计划。
4统计处理和能力评价4.1 总则能力验证的结果可以以多种形式出现,并构成各种统计分布。
分析数据的统计方法应与数据类型及其统计分布特性相适应。
分析这些结果时,应根据不同情况选择适用的统计方法。
各种情况下优先使用的具体方法,可参见GB/T 28043。
对于其他方法,只要具有统计依据并向参加者进行了详细描述,也可使用。
无论使用哪一种方法对参加者的结果进行评价,一般包括以下几方面内容:a)指定值的确定;b)能力统计量的计算;c)能力评定。
必要时,考虑能力验证物品的均匀性和稳定性对能力评定的影响。
能力验证物品均匀性和稳定性的评价方法见CNAS-GL003《能力验证样品均匀性和稳定性评价指南》、GB/T 28043和IUPAC技术报告。
4.2 统计设计4.2.1应根据数据的特性(定量或定性,包括顺序和分类)、统计假设、误差的性质以及预期的结果数量,制定符合计划目标的统计设计。
在统计设计中应考虑下列事项:a)能力验证中每个被测量或特性所要求或期望的准确度(正确度和精密度)以及测量不确定度;b)达到统计设计目标所需的最少参加者数量;当参加者数量不足以达到目标或不能对结果进行有意义的统计分析时,应将评定参加者能力的替代方法的详细内容提供给参加者;c)有效数字与所报告结果的相关性,包括小数位数;d)需要检测或测量的能力验证物品数量,以及对每个能力验证物品或每项测定的检测、校准或测量的重复次数;e) 用于确定能力评定标准差或其它评定准则的程序;f) 用于识别和(或)处理离群值的程序;g) 只要适用,对统计分析中剔除值的评价程序;h) 只要适当,与设计相符的目标和能力验证轮次的频率。
4.2.2 在缺少统计设计所需的可靠信息时,可通过开展先期实验室间比对来获得。
4.3指定值及其不确定度的确定4.3.1 指定值的确定有多种方法,以下列出最常用的方法。
在大多数情况下,按照以下次序,指定值的不确定度逐渐增大。
a)已知值——根据特定能力验证物品配方(如制造或稀释)确定的结果;b)有证参考值——根据定义的检测或测量方法确定(针对定量检测);c)参考值——根据对能力验证物品和可溯源到国家标准或国际标准的标准物质/标准样品或参考标准的并行分析、测量或比对来确定;d)由专家参加者确定的公议值——专家参加者(某些情况下可能是参考实验室)应当具有可证实的测定被测量的能力,并使用已确认的、有较高准确度的方法,且该方法与常用方法有可比性;e)由参加者确定的公议值——使用GB/T 28043和IUPAC国际协议等给出的统计方法,并考虑离群值的影响。
例如,以参加者结果的稳健平均值、中位值(也称为中位数)等作为指定值。
附录A给出了由参加者结果确定指定值的常用稳健统计方法。
4.3.2 对上述每类指定值的不确定度,可参照GB/T 28043等所描述的方法进行评定。
此外,ISO/IEC 指南98-3中给出了确定不确定度的其它信息。
4.3.3 指定值的确定应确保公平地评价参加者,并尽量使检测或测量方法间吻合一致。
只要可能,应通过选择共同的比对小组以及使用共同的指定值达到这一目的。
4.3.4 对定性数据[也称为“分类的”或“定名的”值]或半定量值[也称为“顺序的”值],其指定值通常需要由专家进行判断或由制造过程确定。
某些情况下,可使用大多数参加者的结果(预先确定的比例,如80%或更高)来确定公议值。
该比例应基于能力验证计划的目标和参加者的能力和经验水平来确定。
4.3.5 离群值可按下列方法进行统计处理:a)明显错误的结果,如单位错误、小数点错误、计算错误或者错报为其他能力验证物品的结果,应从数据集中剔除,单独处理。
这些结果不再计入离群值检验或稳健统计分析。
明显错误的结果应由专家进行识别和判断。
b)当使用参加者的结果确定指定值时,应使用适当的统计方法使离群值的影响降到最低,即可以使用稳健统计方法或计算前剔除离群值。
c)如果某结果作为离群值被剔除,则仅在计算总计统计量时剔除该值。
但这些结果仍应当在能力验证计划中予以评价,并进行适当能力评定。
4.3.6 需考虑的其他事项a )理想情况下,如果指定值由参加者公议确定,应当有确定该指定值正确度和检查数据分布的程序。
例如,可采用将指定值与一个具备专业能力的实验室得到的参考值进行比较等方法确定指定值的正确度。
通常,正态分布是许多数据统计处理的基础。
正态分布的特点是单峰性、对称性、有界性和抵偿性。
作为一个能力验证计划的结果,由于参加者的测试方法、测试条件往往各不相同,而且能力验证结果的数量也是有限的,所以在许多情况下能力验证的结果呈偏态分布。
对能力验证的结果只要求近似正态分布,尽可能对称,但分布应当是单峰的,如果分布中出现双峰或多峰,则表明参加者之间存在群体性的系统偏差,这时应研究其原因,并采取相应的措施。
例如,可能是由于使用了产生不同结果的两种检测方法造成的双峰分布。
在这种情况下,应对两种方法的数据进行分离,然后对每一种方法的数据分别进行统计分析。
数据直方图或核(Kernel)密度图可以显示结果的分布情况。
b )应当有依据不确定度来判断指定值是否可接受的准则。
在GB/T 28043和IUPAC 国际协议中给出了该准则,该准则是基于限定指定值不确定度对能力评定的影响而建立的,即:准则限定了由于指定值的不确定度而使参加者得到一个不可接受的评估结果的可能性。
4.4 能力统计量的计算4.4.1 定量结果4.4.1.1 能力验证结果通常需要转化为能力统计量,以便进行解释和与其他确定的目标作比较。
其目的是依据能力评定准则来度量与指定值的偏离。
所用统计方法可能从不做任何处理到使用复杂的统计变换。
注:“能力统计量”也称为“性能统计量”。
4.4.1.2 能力统计量对参加者应是有意义的。
因此,统计量应适合于相关检测,并在某特定领域得到认同或被视为惯例。
4.4.1.3 按照对参加者结果转化由简至繁的顺序,定量结果的常用统计量如下:a )差值D ,由(1)式计算:D x X =- (1)式中:x 为参加者结果;X 为指定值。
b )百分相对差%D ,由(2)式计算:()%100x X D X -=⨯ (2)c )z 比分数,由(3)式计算:ˆx X z σ-= …………………(3) 式中:ˆσ为能力评定标准差。
ˆσ可由以下方法确定: —— 与能力评价的目标和目的相符,由专家判定或法规规定(规定值);—— 根据以前轮次的能力验证得到的估计值或由经验得到的预期值(经验值); —— 由统计模型得到的估计值(一般模型);—— 由精密度试验得到的结果;—— 由参加者结果得到的稳健标准差、标准化四分位距、传统标准差等。
具体方法参见附录A 和GB/T 28043等。
d )'z 比分数,由式(4)计算:22ˆ/)('X u X x z +-=σ (4)式中: X u 为指定值的标准不确定度。
注1:当指定值的确定未用到参加者的结果时,可用式(4)来计算。
注2:'z 比分数有时也称作'z 分数或'z 值。