化学检验工技师考试1

第一章
第一章分析数据的数理统计

通过本章学习,学员能掌握在化学检验中常用的分析数据的集中趋势及分散程度的表示方法,了解分析数据的置信度和置信区间的概念,学会对分析数据中的可疑数据进行正确取舍,为进行质量检验建立理论基础。
第一节 测量值的集中趋势的表示方法
一、 算术平均值和总体平均值
设样本容量为n,则样本的算术平均值(简称平均值)用表示
二、 中位数(XM)
将一组测量数据按大小顺序排列,中间一个数据即为中位数XM。
第二节 数据分散程度的表示方法
一、 平均偏差
计算平均偏差时,先计算各次测定对于平均值的偏差。
二、 标准偏差
1.标准偏差
标准偏差又称为均方根偏差。
例1 用酸碱滴定法测定某混合物中乙酸含量,得到下列结果:10.48%、10.37%、10.47%、10.43%、10.40%。计算单次分析结果的平均偏差、相对平均偏差、标准偏差。
解 根据数据可以得出
平均偏差 =1n??mi=1di=0.18%5=0.036%
表1-1 两组测量数据
2.小样本测定标准偏差的计算
 假定一组测定值x1、x2…xn,其平均值为,按照式(1?7)计算标准偏差s比较麻烦,而且计算平均值时会带来数字取舍误差,此时可用下列等效式进行计算
例2 用例1中原测定结果的含量计算其标准偏差。
解 为避免数字过多,减少计算麻烦,分析结果同减去10.00%。这种处理方法将不影响标准偏差的计算(处理后数据见表1-2)。
根据式(1?8)得
表1-2 处理后的数据
三、平均值的标准偏差
样本平均值是一个非常重要的统计量,通常以此来估计总体平均值μ。
图1-1 平均值的标准偏差与测量次数的关系






图1-1 平均值的标准偏差与测量次数的关系
例3 某铝合金试样中铝的质量分数的测定值为:1.62%,1.60%,1.30%,1.22%,计算平均值的标准偏差。
解 =1.44% s=0.20%
===0.10%
第三节 置信度与平均值的置信区间
一、随机误差的正态分布
 在分析检验中,对一个样品进行多次重复测定,由于随机误差的存在,各次测定值总是在一定范围内波动,这些测量数据一般符合正态分布规律,故通常可按这种规律进行数据处理。


图1-2 两组精密度不同的测量
值的正态分布图
1)x=μ时,y值最大,此即分布曲线的最高点。
2)曲线以x=μ这一直线为其对称轴,说明正误差和负误差出现的概率相等。
3)当x趋向于-∞或+∞时,曲线以x轴为渐近线,说明小误差出现的概率大,大误差出现的概率小,出现很大误差的概率极小,趋近于零。
4)根据式(1-11),得到x=μ时的概

率密度为
y(x=μ)=1/σ(1?12)
二、t-分布曲线
正态分布是无限次测量数据的分布规律,而通常的分析测试只进行3~5次测定,是小样本实验,因而无法求得总体平均值μ和总体偏差σ,只能用样本标准偏差s和样本的平均值来估计测量数据的分散情况,而用s代替σ时,必然引起误差。

图1-3 t-分布曲线
表1-3 ?值表(双边)
三、置信水平与平均值的置信区间
将定义t的公式改写成为
例4 测定某物质中SiO2的质量分数,得到下列数据(%):28.62,28.59,28.51,28.48,28.52,28.63。计算置信度分别为90%、95%和99%时总体平均值的置信区间。
解 求得=28.56,s=0.06 ,已知n=6 f=n-1=5
查表1?3,置信度为90%时,t0.10,5=2.02。
第四节 可疑数据的取舍及分析方法可靠性检验
一、可疑数据的取舍
在重复多次测定时,如出现特大或特小的离群值,亦即为可疑值时,又不是由明显的过失造成的,就要根据随机误差分布规律决定取舍。
1.Q检验法
当测定次数为3≤n≤10时,根据所要求的置信度,按照下列步骤,检验可疑数据是否应弃去。
1)将各数据按递增的顺序排列:x1,x2,…,xn。
2)求出最大值与最小值之差:xn-x1。
3)求出可疑数据与其最邻近数据之间的差:xn-xn-1或x2-x1。
4) 求出Q=-/-或Q=-/-。
5)根据测定次数n和要求的置信度,查表1-4,得Q表。
6)将Q与Q表相比,若Q>Q表,则舍去可疑值,否则应予以。
表1?4 舍弃可疑数据的Q值(置信度90%和95%)
表1-4 舍弃可疑数据的Q值(置信度90%和95%)
2.4检验法
二、分析方法的显著性检验
在实际分析检验中,我们常使用标准方法与自己所用的分析方法进行对照试验,然后用统计学方法检验两种分析结果是否存在显著性差异,若存在显著性差异而又肯定测定过程没有错误,可以认定自己所用方法有不完善之处,即存在较大的系统误差,在统计学上,这种情况称为两批数据来自不同总体。
1.t-检验法
(1)平均值与标准值的比较 这种检验通常是要确定一种分析方法是否存在较大的系统误差。
t计=×(1?15)
例5 用一新分析方法对某含铁标准物质进行分析,已知该铁标准试样的标准值为1.06%,对其10次测定的平均值为1.054%,标准偏差为0.009%,取置信度95%,判断此新分析方法是否存在较大的系统误差。
解 已知μ=1.06%,=1.054%,s=0.009%
根据公式t计=× 求得
(2)两组数据平均值的比较 实际分析工作中常需要对两种分析方法,两个不同实验室或两个不同的操作者的分析结果进行比较。
sP=(1?16)

6 甲、乙两个分析人员用同一分析方法测定合金中的Al的质量分数,他们测定次数、所得结果的平均值及各自的标准偏差分别为甲: n=4 1=15.1 s1=0.41
解 根据式(1-16)、式(1-17)得
sP==0.37
2.F-检验法
F?检验法用于检验两组数据的精密度,即标准偏差s是否存在显著性差异。
例7 同一含铜的样品,在两个实验室,分别测定5次的结果见表1-5。
表1?5 两组实验数据表
表1-5 两组实验数据表
解 选择显著性水平为0.1。
s大=0.00148 s小=0.00084
*第五节 工作曲线的线性回归
一、工作曲线的一元线性回归方程
在分析测试中经常遇到处理两个变量之间的关系。
例8 工作曲线由(1,3.0)、(3,4.0)、 (8,6.0)、 (10,7.0)、 (13,8.0)、(15,9.0)、(17,10.0)、(20,11.0)等八点组成,求出该工作曲线的截距b与斜率m值。
解 作表1-6。
表1?6 数据处理结果表
表1-6 数据处理结果表
二、一元线性回归方程在分析测试中的应用
1.相关系数
相关系数用来作为两个变量之间相关关系的一个量度。

图1-4 典型的相关图线
2.工作曲线法精密度提高的途径
提高精密度有如下途径:
1)增加工作曲线的点数n。
2)增加未知样品的测定次数。
3)增大工作曲线的斜率m。

复习题
1.如何表述算术平均值和总体平均值?
2.什么是中位值?有什么意义?
3. 标准偏差与平均偏差有什么区别与联系?
4. 什么是正态分布曲线?在统计学中有什么意义?
5. 什么是t-分布曲线?正态分布曲线与t-分布曲线有何不同?
6. 什么是置信度和置信区间?对分析数据的处理有什么意义?
7. 如何用t-检验法检验分析方法的显著性差异?
8. 如何用F-检验法判断这两组所测数据的精密度?
9.如何计算一元线性回归方程中的相关系数?相关系数有什么意义?
10.两位分析人员对同一含铁的样品用分光光度法进行分析,得到两组分析数据,要判断两个分析结果的精密度有无显著性差异,应该用下列方法中的哪一种:
 A.Q检验法 B.F?检验法 C.格鲁布斯(Grubbs)法 D.t?检验法
11.若要判断两分析人员的分析结果之间是否存在系统误差,则应该用下列方法中的哪一种:
A.Q检验法 B.F?检验法 C.F?检验法加t?检验法 D.t?检验法
12.某铁矿石中铁的质量分数为39.19%,若甲分析结果是39.12%,39.15%,39.18%,乙分析结果是39.18%,39.23%,39.25%。
13.某试样经分析测得一组分的质量分数为:41.24%,41.27%,41.23%,41.26%。
14.一试样中铬的质量分数测得结果为:1.12%,1.15%,1.11%,1.16%,1.12%,试计

算标准偏差、相对标准偏差和分析结果的置信区间(置信度为95%)。
15.石灰石中铁的质量分数测定结果为:1.61%,1.53%,1.54%,1.83%。
16.有一试样,测得分析结果为:35.10%,34.86%,34.92%,35.36%,35.11%,34.77%,35.19%,34.98%。


相关文档
最新文档