秒表测时法—数据处理:格拉布斯准则剔除异常值

合集下载

试论计量测试中异常数据剔除的措施

试论计量测试中异常数据剔除的措施

试论计量测试中异常数据剔除的措施发表时间:2018-09-18T16:18:06.730Z 来源:《基层建设》2018年第25期作者:陈佩茹[导读] 摘要:对测量数据进行判断和处理是计量测试工作的重要组成部分,需要剔除其中的异常数据,从而保证最终测试结果的可靠性。

深圳供电局有限公司广东省深圳市 518133摘要:对测量数据进行判断和处理是计量测试工作的重要组成部分,需要剔除其中的异常数据,从而保证最终测试结果的可靠性。

本文首先对计量测试中异常数据的产生原因进行简单分析,进而研究其剔除方法,包括拉依达准则法、格拉布斯准则法、狄克逊准则法、肖维勒准则法等,并结合具体实例进行应用分析。

关键词:计量测试;异常数据;剔除方法前言:计量测试工作对数据准确性有较高要求,完成一项计量测试工作后,会得到大量数据,需要对其进行整理和分析,准确筛选出其中存在的异常数据,否则将会对最终的测量结果产生较大影响。

同时,对数据进行评判也是检验仪器状态的主要方法,在实际应用过程中具有重要意义。

由于计量测试在实际生产中应用广泛,相关研究也受到了高度重视,并形成多种异常数据判断准则,可以有效剔除异常数据。

一、计量测试中异常数据的产生原因计量测试仪器均属于高精密仪器,受外部环境影响较大,可能在外部环境发生变化时,导致测量结果出现较大偏差。

另一方面,如果仪器自身存在故障,也会导致测量结果不准确。

因此,在实际的计量测试工作中,异常数据普遍存在,需要在完成测量后,剔除异常数据,确保结果的准确性。

计量测试中的异常数据产生原因主要包括:(1)测试过程中仪器受到震动影响,比如机械振动或人力作用等;(2)仪器供电电压不稳定,或在测试中受到电磁干扰,导致仪器出现故障问题,产生较大的结果偏差;(3)测试操作人员缺乏操作经验,在测试过程中未按规定流程进行测试;(4)仪器自身存在零件松动、元件损坏等缺陷问题,操作人员无法正常测量,即使能够测出结果也会存在较大偏差[1]。

格拉布斯法(Grubbs)检验法

格拉布斯法(Grubbs)检验法

格拉布斯法(Grubbs)检验法▲概述:一组测量数据中,如果个别数据偏离平均值很远,那么这个(这些)数据称作“可疑值”。

如果用统计方法—例如格拉布斯(Grubbs)法判断,能将“可疑值”从此组测量数据中剔除而不参与平均值的计算,那么该“可疑值”就称作“异常值(粗大误差)”。

本文就是介绍如何用格拉布斯法(Grubbs)判断“可疑值”是否为“异常值”。

▲测量数据:例如测量10次(n =10),获得以下数据:8.2、5.4、14.0、7.3、4.7、9.0、6.5、10.1、7.7、6.0。

▲排列数据:将上述测量数据按从小到大的顺序排列,得到4.7、5.4、6.0、6.5、7.3、7.7、8.2、9.0、10.1、14.0。

可以肯定,可疑值不是最小值就是最大值。

▲计算平均值x -和标准差s :x -=7.89;标准差s =2.704。

计算时,必须将所有10个数据全部包含在内。

▲计算偏离值:平均值与最小值之差为7.89-4.7=3.19;最大值与平均值之差为14.0-7.89=6.11。

▲确定一个可疑值:比较起来,最大值与平均值之差6.11大于平均值与最小值之差3.19,因此认为最大值14.0是可疑值。

1)(2--=∑n x x s▲计算G i值:G i=(x i-x-)/s;其中i是可疑值的排列序号——10号;因此G10=( x10-x-)/s=(14.0-7.89)/2.704=2.260。

由于x10-x-是残差,而s是标准差,因而可认为G10是残差与标准差的比值。

下面要把计算值G i与格拉布斯表给出的临界值G P(n)比较,如果计算的G i值大于表中的临界值G P(n),则能判断该测量数据是异常值,可以剔除。

但是要提醒,临界值G P(n)与两个参数有关:检出水平α(与置信概率P有关)和测量次数n(与自由度f有关)。

▲定检出水平α:如果要求严格,检出水平α可以定得小一些,例如定α=0.01,那么置信概率P=1-α=0.99;如果要求不严格,α可以定得大一些,例如定α=0.10,即P=0.90;通常定α=0.05,P=0.95。

格拉布斯法异常值判断

格拉布斯法异常值判断

格拉布斯法异常值判断标准化工作室编码[XX968T-XX89628-XJ668-XT689N]格拉布斯法—判断(2009-04-0716:38:20) 标签:?▲概述:一组测量数据中,如果个别数据偏离平均值很远,那么这个(这些)数据称作“可疑值”。

如果用统计方法—例如格拉布斯(Grubbs)法判断,能将“可疑值”从此组测量数据中剔除而参与平均值的计算,那么该“可疑值”就称作“(粗大误差)”。

本文就是介绍如何用格拉布斯法判断“可疑值”是否为“”。

▲测量数据:例如测量10次(n=10),获得以下数据:8.2、5.4、14.0、7.3、4.7、9.0、6.5、10.1、7.7、6.0。

▲排列数据:将上述测量数据按从小到大的顺序排列,得到4.7、5.4、6.0、6.5、7.3、7.7、8.2、9.0、10.1、14.0。

可以肯定,可疑值是最小值就是最大值。

▲计算平均值x-和标准差s:x-=7.89;标准差s=2.704。

计算时,必须将所有10个数据全部包含在内。

▲计算偏离值:平均值与最小值之差为7.89-4.7=3.19;最大值与平均值之差为14.0-7.89=6.11。

▲确定一个可疑值:比较起来,最大值与平均值之差6.11大于平均值与最小值之差3.19,因此认为最大值14.0是可疑值。

▲计算G i值:G i=(x i-x-)/s;其中i是可疑值的排列序号=(x10-x-)/s=(14.0-7.89)/2.704=2.260。

由于x10-x-——10号;因此G10是残差,而s是标准差,因而可认为G10是残差与标准差的比值。

下面要把计算值G i与格拉布斯表给出的临界值G P(n)比较,如果计算的G i值大于表中的临界值G P(n),则能判断该测量数据是,可以剔除。

但是要提醒,临界值G P(n)与两个参数有关:检出水平α(与置信概率P有关)和测量次数n(与自由度f有关)。

▲定检出水平α:如果要求严格,检出水平α可以定得小一些,例如定α=0.01,那么置信概率P=1-α=0.99;如果要求严格,α可以定得大一些,例如定α=0.10,即P=0.90;通常定α=0.05,P=0.95。

格拉布斯法(Grubbs)检验法

格拉布斯法(Grubbs)检验法

格拉布斯法(Grubbs)检验法▲概述:一组测量数据中,如果个别数据偏离平均值很远,那么这个(这些)数据称作“可疑值”。

如果用统计方法—例如格拉布斯(Grubbs)法判断,能将“可疑值”从此组测量数据中剔除而不参与平均值的计算,那么该“可疑值”就称作“异常值(粗大误差)”。

本文就是介绍如何用格拉布斯法(Grubbs)判断“可疑值”是否为“异常值”。

▲测量数据:例如测量10次(n =10),获得以下数据:8.2、5.4、14.0、7.3、4.7、9.0、6.5、10.1、7.7、6.0。

▲排列数据:将上述测量数据按从小到大的顺序排列,得到4.7、5.4、6.0、6.5、7.3、7.7、8.2、9.0、10.1、14.0。

可以肯定,可疑值不是最小值就是最大值。

▲计算平均值x -和标准差s :x -=7.89;标准差s =2.704。

计算时,必须将所有10个数据全部包含在内。

▲计算偏离值:平均值与最小值之差为7.89-4.7=3.19;最大值与平均值之差为14.0-7.89=6.11。

▲确定一个可疑值:比较起来,最大值与平均值之差6.11大于平均值与最小值之差3.19,因此认为最大值14.0是可疑值。

▲计算G i 值:G i =(x i -x - )/s ;其中i 是可疑值的排列序号——10号;因此G 10=( x 10-x - )/s =(14.0-7.89)/2.704=2.260。

由于 x 10-x -是残差,而s 是标准差,因而可认为G 10是残差与标准差的比值。

下面要把计算值G i 与格拉布斯表给出的临界值G P (n )比较,如果计算的G i 值大于表中的临界值G P (n ),则能判断该测量数据是异常值,可以剔除。

但是要提醒,临界值G P (n )与两个参数有关:检出水平α (与置信概率P 有关)和测量次数n (与自由度f 有关)。

▲定检出水平α:如果要求严格,检出水平α可以定得小一些,例如定α=0.01,那么置信概率P =1-α=0.99;如果要求不严格,α可以定得大一些,例如定α=0.10,即P =0.90;通常定α=0.05,P =0.95。

格拉布斯法Grubbs检验法

格拉布斯法Grubbs检验法

格拉布斯法Grubbs 检验法▲概述:一组测量数据中;如果个别数据偏离平均值很远;那么这个这些数据称作“可疑值”..如果用统计方法—例如格拉布斯Grubbs 法判断;能将“可疑值”从此组测量数据中剔除而不参与平均值的计算;那么该“可疑值”就称作“异常值粗大误差”..本文就是介绍如何用格拉布斯法Grubbs 判断“可疑值”是否为“异常值”.. ▲测量数据:例如测量10次n =10;获得以下数据:8.2、5.4、14.0、7.3、4.7、9.0、6.5、10.1、7.7、6.0..▲排列数据:将上述测量数据按从小到大的顺序排列;得到4.7、5.4、6.0、6.5、7.3、7.7、8.2、9.0、10.1、14.0..可以肯定;可疑值不是最小值就是最大值.. ▲计算平均值x -和标准差s :x -=7.89;标准差s =2.704..计算时;必须将所有10个数据全部包含在内..▲计算偏离值:平均值与最小值之差为7.89-4.7=3.19;最大值与平均值之差为14.0-7.89=6.11..▲确定一个可疑值:比较起来;最大值与平均值之差6.11大于平均值与最小值之差3.19;因此认为最大值14.0是可疑值..▲计算G i 值:G i =x i -x - /s ;其中i 是可疑值的排列序号——10号;因此G 10= x 10-x - /s =14.0-7.89/2.704=2.260..由于 x 10-x -是残差;而s 是标准差;因而可认为G 10是残差与标准差的比值..下面要把计算值G i 与格拉布斯表给出的临界值G P n 比较;如果计算的G i 值大于表中的临界值G P n ;则能判断该测量数据是异常值;可以剔除..但是要提醒;临界值G P n 与两个参数有关:检出水平α 与置信概率P 有关和测量次数n 与自由度f 有关..▲定检出水平α:如果要求严格;检出水平α可以定得小一些;例如定α=0.01;那么置信概率P =1-α=0.99;如果要求不严格;α可以定得大一些;例如定α=0.10;即P =0.90;通常定α=0.05;P =0.95..▲查格拉布斯表获得临界值:根据选定的P 值此处为0.95和测量次数n 此处为10;查格拉布斯表;横竖相交得临界值G 9510=2.176..▲比较计算值G i 和临界值G 9510:G i =2.260;G 9510=2.176;G i >G 9510..1)(2--=∑n x x s▲判断是否为异常值:因为G i>G9510;可以判断测量值14.0为异常值;将它从10个测量数据中剔除..▲余下数据考虑:剩余的9个数据再按以上步骤计算;如果计算的G i>G959;仍然是异常值;剔除;如果G i<G959;不是异常值;则不剔除..本例余下的9个数据中没有异常值..对异常值及统计检验法的解释■测量过程是对一个无限大总体的抽样:对固定条件下的一种测量;理论上可以无限次测量下去;可以得到无穷多的测量数据;这些测量数据构成一个容量为无限大的总体;或者换一个角度看;本来就存在一个包含无穷多测量数据的总体..实际的测量只不过是从该无限大总体中随机抽取一个容量为n例如n=10的样本..这种样本也可以有无数个;每个样本相当于总体所含测量数据的不同随机组合..样本中的正常值应当来自该总体..通常的目的是用样本的统计量来估计总体参量..总体一般假设为正态分布..■异常值区分:样本中的正常值应当属于同一总体;而异常值有两种情况:第一种情况异常值不属于该总体;抽样抽错了;从另外一个总体抽出一个一些数据;其值与总体平均值相差较大;第二种情况异常值虽属于该总体;但可能是该总体固有随机变异性的极端表现;比如说超过3σ的数据;出现的概率很小..用统计判断方法就是将异常值找出来;舍去..■犯错误1:将本来不属于该总体的、第一种情况的异常值判断出来舍去;不会犯错误;将本来属于该总体的、出现的概率小的、第二种情况的异常值判断出来舍去;就会犯错误..■犯错误2:还有一种情况;不属于该总体但数值又和该总体平均值接近的数据被抽样抽出来;统计检验方法判断不出它是异常值;就会犯另外一种错误..■异常值检验法:判断异常值的统计检验法有很多种;例如格拉布斯法、狄克逊法Q法、偏度-峰度法、拉依达法、奈尔法等等..每种方法都有其适用范围和优缺点..■格拉布斯法最佳:每种统计检验法都会犯犯错误1和错误2..但是有人做过统计;在所有方法中;格拉布斯法犯这两种错误的概率最小;所以推荐使用格拉布斯法..■多种方法结合使用:为了减少犯错误的概率;可以将3种以上统计检验法结合使用;根据多数方法的判断结果;确定可疑值是否为异常值..■异常值来源:测量仪器不正常;测量环境偏离正常值较大;计算机出错;看错;读错;抄错;算错;转移错误..。

用格拉布斯准则判断异常数据教学内容

用格拉布斯准则判断异常数据教学内容

1-pc n 5% 1%
1-pc n 5% 1%
表 2-1 格拉布斯检验法 g 值 3 4 5 6 7 8 9 10 11 12 1.15 1.46 1.67 1.82 1.94 2.03 2.11 2.18 2.23 2.29 1.15 1.49 1.75 1.94 2.10 2.22 2.32 2.41 2.48 2.55 13 14 15 16 17 18 19 20 2.33 2.37 2.41 2.44 2.47 2.50 2.53 2.56 2.61 2.66 2.70 2.74 2.78 2.82 2.85 2.85
仅供学习与交流,如有侵权请联系网站删除 谢谢5四、可供选择的仪器与设备
1. 微机
一台
2. C 语言集成开发环境或其它高级语言开发环境
五、实验预习要求
熟悉有关异常数据处理的的基本知识,掌握格拉布斯检验法检验异常数据 的基本方法。
仅供学习与交流,如有侵权请联系网站删除 谢谢3
精品资料
六、实验报告要求
1. 简述实验目的、原理、方法、步骤。 2. 列出全部实验数据,记录实验结果(计算机屏幕显示内容)。 3. 画出程序流程图。
用格拉布斯准则判断 异常数据
精品资料
用格拉布斯准则判断异常数据
一、实验目的
1.通过实验加深对格拉布斯准则的理解。 2.掌握实验中异常数据的处理方法。
二、实验要求
用 C 语言或其它高级语言编写一程序,输入一组测量数据(9~15 个,程序 可设定),根据格拉布斯准则判断有无异常数据。如有,则剔除异常数据并重 新计算,直到无异常数据为止。具体要求如下:
2. 格拉布斯检验法
格拉布斯检验法是在未知总体标准偏差 的情况下,对正态样本或接近

格拉布斯法(Grubbs)检验法【范本模板】

格拉布斯法(Grubbs)检验法【范本模板】

格拉布斯法(Grubbs)检验法▲概述:一组测量数据中,如果个别数据偏离平均值很远,那么这个(这些)数据称作“可疑值”。

如果用统计方法—例如格拉布斯(Grubbs)法判断,能将“可疑值"从此组测量数据中剔除而不参与平均值的计算,那么该“可疑值”就称作“异常值(粗大误差)".本文就是介绍如何用格拉布斯法(Grubbs)判断“可疑值"是否为“异常值"。

▲测量数据:例如测量10次(n =10),获得以下数据:8。

2、5.4、14。

0、7.3、4.7、9.0、6。

5、10。

1、7.7、6。

0。

▲排列数据:将上述测量数据按从小到大的顺序排列,得到4.7、5.4、6.0、6.5、7。

3、7.7、8。

2、9.0、10。

1、14。

0.可以肯定,可疑值不是最小值就是最大值。

▲计算平均值x -和标准差s :x —=7.89;标准差s =2。

704。

计算时,必须将所有10个数据全部包含在内。

▲计算偏离值:平均值与最小值之差为7。

89-4。

7=3.19;最大值与平均值之差为14。

0-7.89=6。

11。

▲确定一个可疑值:比较起来,最大值与平均值之差6。

11大于平均值与最小值之差3.19,因此认为最大值14。

0是可疑值。

▲计算G i 值:G i =(x i -x — )/s ;其中i 是可疑值的排列序号——10号;因此G 10=( x 10-x — )/s =(14.0-7.89)/2。

704=2。

260。

由于x 10-x —是残差,而s 是标准差,因而可认为G 10是残差与标准差的比值。

下面要把计算值G i 与格拉布斯表给出的临界值G P (n )比较,如果计算的G i 值大于表中的临界值G P (n ),则能判断该测量数据是异常值,可以剔除.但是要提醒,临界值G P (n )与两个参数有关:检出水平α (与置信概率P 有关)和测量次数n (与自由度f 有关)。

▲定检出水平α:如果要求严格,检出水平α可以定得小一些,例如定α=0。

剔除异常值的方法

剔除异常值的方法

剔除异常值的方法拉依达准则法,肖维勒准则法,狄克逊准则法,罗马诺夫斯基(t检验)准则法,格拉布斯准则法(Grubbs)各类剔除异常值方法的比较。

1.拉依达准则法(3δ):简单,无需查表。

测量次数较多或要求不高时用。

是最常用的异常值判定与剔除准则。

但当测量次数《=10次时,该准则失效。

如果实验数据值的总体x是服从正态分布的,则式中,μ与σ分别表示正态总体的数学期望和标准差。

此时,在实验数据值中出现大于μ+3σ或小于μ―3σ数据值的概率是很小的。

因此,根据上式对于大于μ+3σ或小于μ―3σ的实验数据值作为异常值,予以剔除。

在这种情况下,异常值是指一组测定值中与平均值的偏差超过两倍标准差的测定值。

与平均值的偏差超过三倍标准差的测定值,称为高度异常的异常值。

在处理数据时,应剔除高度异常的异常值。

异常值是否剔除,视具体情况而定。

在统计检验时,指定为检出异常值的显著性水平α=0.05,称为检出水平;指定为检出高度异常的异常值的显著性水平α=0.01,称为舍弃水平,又称剔除水平(reject level)。

标准化数值(Z-score)可用来帮助识别异常值。

Z分数标准化后的数据服从正态分布。

因此,应用Z分数可识别异常值。

我们建议将Z分数低于-3或高于3的数据看成是异常值。

这些数据的准确性要复查,以决定它是否属于该数据集。

2.肖维勒准则法(Chauvenet):经典方法,改善了拉依达准则,过去应用较多,但它没有固定的概率意义,特别是当测量数据值n无穷大时失效。

3.狄克逊准则法(Dixon):对数据值中只存在一个异常值时,效果良好。

担当异常值不止一个且出现在同侧时,检验效果不好。

尤其同侧的异常值较接近时效果更差,易遭受到屏蔽效应。

4.罗马诺夫斯基(t检验)准则法:计算较为复杂。

5.格拉布斯准则法(Grubbs):和狄克逊法均给出了严格的结果,但存在狄克逊法同样的缺陷。

朱宏等人采用数据值的中位数取代平均值,改进得到了更为稳健的处理方法。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

秒表测时法——数据处理:根据格拉布斯准则剔除异常值
——宋楠
使用秒表测时法来确定某一作业单元(工序、工步或操作、动作,下同)的时间消耗,我们一般要针对该作业单元现场实测多个周期,由此获得一组测时数据(实测时间原始值),然后运用统计方法对这一组数据作出适当处理,并依据处理结果(实测时间有效值)来确定该作业单元时间消耗的一个代表值(实测时间代表值),最后通过工时评定对该代表值加以修正,才能获得该作业单元的正常作业时间(Tz),以之为基础加上必要的宽放就可以最终获得标准工时[(T=Tz(1+k)]。

运用统计方法对一组测时数据进行“适当处理”的步骤大体有四:
1)判断这组数据(整体)是否稳定——否则需要重新测时;
2)判断每个数据(个体)是否正常——否则需要予以剔除;
3)判断数据组剩余时间值的数量(或者说测时次数)是否足够——否则需要进行补测;
4)确定数据组的代表值——确定这一组实测时间的代表值,即该作业单元时间消耗的实测代表值。

通常取各剩余时间值的平均数(或中位数或众数)。

注意此时数据组中的数据是通过前三步骤处理后的余留数据,其个数不一定与原始数据组的时间值个数相同,既可能因剔除了异常值而减少了,也可能由于补测而增多了。

在上述数据处理过程中,时间数据的转化情况示意如下:
现场实测:实测时间原始值(一组,整体可能不稳定、个体可能有异常且数量可能不足)
数据处理:A.实测时间有效值(一组,与原始数据的个数不一定相同)
B.实测时间代表值(一个)
工时评定:正常作业时间(一个)
“适当处理”的第二个步骤(判断每个数据是否正常,亦即剔除异常值)的所用方法,目前我国劳动定额的相关资料主要介绍了拉伊达准则(三倍标准差法),这种方法简单方便,无需查表,适合测量次数较多因而测时数据服从正态分布的情况。

当测量次数较少
(n=20-100)时,拉依达准则可靠性下降,这时可以采用格拉布斯准则。

当测量次数更少(n 为10次以下)时,测时数据将更接近t分布而不是正态分布,相应可以采用罗曼诺夫斯基准则。

本文谨介绍格拉布斯准则剔除异常值的完整步骤。

在一组测时数据中,如果个别(或少数)数据(即时间值,下同)偏离这组数据的中心(由平均值确定)很远,而呈现出较大的离群倾向,那么可以暂时视之为该数据组中的“可疑值”(可能属于异常的时间值)。

如果进一步用统计方法能将该“可疑值”从该组数据中
剔除,那么该“可疑值”就确实是该组数据中的“异常值”——不应允许它或它们(一个或几个时间值)继续作为数据组成员参与后续处理或数据组代表值的计算。

我们可将一组测时数据按照从小到大的次序进行排列,得到一个升序数列,若该组测时数据之中存在有异常值,必然位于这个升序数列的两侧处。

这样,对于任意一组测时数据,其可能存在的异常值的分布,可以归纳为下述三种情形:
1)仅有异常小值(不一定唯一),异常值位于升序数列左侧;
2)仅有异常大值(不一定唯一),异常值位于升序数列右侧;
3)既有异常小值又有异常大值(也不一定仅仅各一),异常值位于升序数列两侧。

现假定对某工序的某一作业要素进行秒表测时,获得了一组共十个实测时间值:8.2、5.4、14.0、7.3、4.7、9.0、6.5、10.1、7.7、6.0(min),假定数据组的稳定性合乎要求,现采用格拉布斯法判断并剔除其中可能的异常值的步骤如下:
1.对数据组作升序排列,得:
4.7、
5.4、
6.0、6.5、
7.3、7.7、
8.2、
9.0、10.1、14.0。

可以肯定,初步的可疑值位于数列的两侧,不是最小值(左侧的4.7)就是最大值(右侧的14.0)。

2.计算数据组的平均值µ和标准差σ:
1)平均值:µ =(4.7+5.4+...+14.0)/10=7.89;
2)标准差:σ = 2.704
3.计算可疑数据的偏离值——以平均值为基准:
1)最大值与平均值之差:14.0-7.89=6.11
2)平均值与最小值之差:7.89-4.7=3.19
4.确定一个可疑值——具有最大偏离值的数据:
∵ 6.11 > 3.19
∴最大值14.0是可疑值。

注:这里先将偏离值较大者作为最可能的异常值,还只是怀疑而已,还需经过下面的定量判断才能确认。

此外,如果偏离值较小者也是异常值,或者数列两端以内还存在有异常值,按照下面的步骤,并不会放过。

5.计算G i值——公式:G i=残差/标准差=(Xi-µ)/σ,亦即等于残差与标准差的比值。

G10=(X10-µ)/σ=(14.0-7.89)/2.704=2.260
其中i是可疑值在升序数列中的排列序号,本例为第10号数据14.0,i=10。

然后把计算值G i与格拉布斯表(见附表)所给出的临界值G P(n)比较,如果计算的G i 值大于表中的临界值G P(n),则能判断该测时数据是异常值而应予剔除。

但是临界值G P(n)与两个参数有关:检出水平α(与置信概率P有关)和测时次数n (与自由度f有关)。

6.确定检出水平α:
要求严格的话,检出水平α可以定小一些,例如定α=0.01,那么置信概率P=1-α
=0.99;
要求宽松的话,检出水平α可以定大一些,例如定α=0.10,那么置信概率P=0.90;
通常可定α=0.05,P=0.95。

7.查格拉布斯表明确临界值:
根据选定的P值(此处为0.95)和测时次数n(此处为10),查格拉布斯表,得临界值G95(10)=2.176。

8.比较计算值G i和临界值G95(10),作出判断:
∵ G10=2.260 > G95(10)=2.176
∴测时值14.0为异常值;
∴应该将14.0从10个测时数据中剔除。

9.继续判断剩余数据中可能的异常值:
数列剔除最大值14.0之后的剩余数据(还有九个),仍然是一个升序数列,只是右端的最大值变更了:
4.7、
5.4、
6.0、6.5、
7.3、7.7、
8.2、
9.0、10.1
此数列最小值仍为左侧的第1号数4.7,最大值变更为右侧的第9号数10.1。

对此数列重复以上步骤,例如经过步骤2-4,确定第9号数据为新的可疑值,再延续步骤5-8,如果计算的G9>G95(9),那么9号数据也属异常而应予剔除;如果计算的G9<G95(9),则9号数据不属异常值。

依此循环判断处理,结果在去掉14.0之后剩余的九个数据中,没有再发现异常值,倘使剩余数据数量已经足够(亦即适当处理的第三步符合要求),那么这九个剩余数据就是对这一作业单元进行秒表测时的实测时间有效值,就可以放心地使用它们来确定作业单元的实测时间代表值(亦即适当处理的第四步,如下述)。

10.根据有效数据确定代表值:
采用算术平均法(也可用众数法、中位数法等)来确定该组测时数据的代表值,则有
实测时间代表值 = 实测时间有效值之和/实测时间有效值的个数
=(4.7+5.4+6.0+6.5+7.3+7.7+8.2+9.0+10.1)/9
= 7.21(min)
注:本实测时间代表值还需经过工时评定,方可得到作业单元的正常作业时间Tz,例如假设工时评定系数为1.1,则正常作业时间Tz应为
Tz = 7.21 X 1.1 = 7.93(min)
附:格拉布斯表——临界值G P(n)。

相关文档
最新文档