第二章 分析化学中的数据处理
分析化学中的数据处理

分析化学中的数据处理分析化学中的数据处理是指针对实验数据进行整理、统计、分析和解释的一系列过程。
对数据进行适当的处理能够提取出更有意义的信息,从而为后续的研究和实验提供有效的支持。
下面将从数据处理的步骤、常用方法和应用领域等方面进行详细展开。
数据处理的步骤通常包括数据整理、数据检查、数据统计和数据分析等过程。
首先,数据整理是将实验数据进行归类、清理和排序的过程,以便后续的操作和分析。
其次,数据检查是指对数据进行质量控制,包括检查数据的完整性、准确性和可靠性等方面。
第三,数据统计是指对数据进行一定分组、计数和总结等统计分析的过程,从而得到特定指标和特征的统计结果。
最后,数据分析是指对统计结果进行解释和推理,从而得出一定的结论和判断。
在实际的数据处理中,常用的方法包括描述统计方法、回归分析方法、因子分析方法和聚类分析方法等。
描述统计方法主要用于对数据的中心趋势、离散程度和分布特征等进行描述和总结,常用的统计指标包括均值、中位数、标准差等。
回归分析方法主要用于研究两个或多个变量之间的关系,可通过拟合线性或非线性模型进行分析。
因子分析方法则用于确定一组变量之间的潜在关系,并提取出影响变量的主成分。
而聚类分析方法则用于对一组数据进行分类和归类,以找出相似性较高的样本或因素。
分析化学中的数据处理广泛应用于样品分析、光谱分析、色谱分析和电化学分析等领域。
在样品分析中,数据处理可以帮助提取出目标物质的浓度或含量信息,并估计分析结果的可靠性和准确性。
在光谱分析中,数据处理可以对光谱数据进行寻峰、峰面积计算和谱图解析等,以获得有关物质结构和组成的信息。
在色谱分析中,数据处理可以用于峰识别、峰分离和峰面积计算等,从而确定样品中的目标物质和杂质。
在电化学分析中,数据处理可以用于电流-电位曲线的拟合和分析,以确定反应的机理和动力学参数。
2第二章、分析化学中的数据处理2

X
样本容量为n的一组测量数据的算数平均值 X 为:
3 中位数(median) Xm
一组测量数据按大小顺序排列,中间一个数据即 为中位数Xm。当测量值的个数为偶数时,中位数 为中间相邻两个测量值的平均值。
4.误差(error):测定结果(X)与真实值(XT)之间的 差值称为误差(E)
Ei = Xi - XT Xi > XT , Ei >0 Xi > XT , Ei >0 ,正误差 ,负误差
例:A、B、C、D四个分析人员对同一铁标样 (WFe=37.40%)中的铁含量进行测量,结果如图示,比 较其准确度和精密度? A、精密度低,准确度低 B、精密度高,准确度低 C、精密度高,准确度高 D、精密度低,准确度高
但不可靠
准确度与精密度的关系
1.精密度好是准确度好的前提; 2.精密度好不一定准确度高
x
i 1
n
i
x 100%
nx
8.标准偏差:s
s
x x
n i 1 i
2
n 1
9.相对标准偏差:RSD
s RSD 100% x
10. 极差(range) (R) 一组数据中有Xmax 和 Xmin 两值之差,又称全距或范围 误差(range error) R = Xmax - Xmin 11.相对极差(relative range):R/ X ×100%
• 2、精密度(precision) 精密度表征几次平行测量值相互符合 程度。精密度的高低用偏差来衡量。平行 测定所得数据间差别越小,则分析结果的 精密度越高。(Precicion is measure of the reproducibility)
• 3、精密度与准确度的关系(the relationship of precision and accuracy) 精密度高, 准确度不一定高,因为此时可能存 在较大的系统误差,例如P43图3-1中的 “乙”。 准确度高,一定要求精密度高,精密度是保证 准确度的先决条件, 精密度低说明所测结 果不可靠,自然失去了衡量准确度的前提
第二节分析化学中的数据处理

1. 概念:一个数据中所有确定的数字再加一位不定数字。
确定的数字:指某一量经多次测定的结果,总是固定不变 的数字。 例如:三次称量Na2CO3 (g)为0.3561、0.3562、0.3560 有效数字的最后一位可疑数字,可能有±1个单位的误差
二、有效数字的位数
质量 分析天平(称至0.1 mg): 12.8218 g (6)、0.2338 g (4)、0.0500 g (3)
4、相对误差或标准偏差只需保留1~2位
5、化学平衡计算中,平衡浓度一般保留2位有效数字
6、分析结果的一般表示法,
组分含量>10%, 要求4位 (化学分析)
组分含量1%~10% 要求3位 (仪器分析)
<1%
2位
7、改变单位不能任意改变有效数字的位数
19.82 mL (4)
0.01982 L (4)
四、运算规则:计算结果中只能有一位可疑数字
d 1 n | d | 1 n | x x |
n i1
n i1
相对平均偏差 d 100 % x
例如:测定NaCl试样中氯的质量分数,6次测量值分别为 0.6012,0.6018,0.6030,0.6045,0.6020018 0.6030 0.6045 0.6020 0.6037 6
举例
1.0008 0.1000 0.0382
54 0.05 3600
43181 10.98% 1.98×10-10 0.0040 2×105
3/2
5位 4位 3位 2位 1位 不确定
数据中“0”是否为有效数字
(1)只起到定位作用,不算,
例如: 0.0382,
0.05
(2) 作为普通的数字使用,算,
分析化学2第二章 分析化学中的误差和数据处理

误差的客观性: 误差是客观的,是不以人的意志而改变的。
根据误差的性质与产生的原因,可将误差 分为系统误差、偶然误差两类。
三、系统误差和随机误差
1.系统误差
也叫可测误差,它是由于分析过程中某 些经常发生的、比较固定的原因所造成的。 系统误差的性质是:
一、 有效数字
4.与实验有关的注意点
(2)称量仪器 分析天平即万分之一天平(称至0.1mg): 12.8212g, 0.2338g,1.4562g,0.0561g 千分之一天平(称至0.001g): 0.234g,1.356g,10.324g 百分之一天平(称至0.01g): 1.26g,0.23g,14.26g 台秤(称至0.1g):4.0g,0.5g,16.8g
X>XT,误差为正值,表示测定结果偏高; X<XT,误差为负值,表示测定结果偏低。
E越小,表示测定结果与真实值越接近, 准确度越高;反之,E越大,准确度越低。
可见,误差的大小是衡量准确度高低的尺度。
二、准确度和精密度
2. 精密度
在实际工作中,真实值通常是不知道的,因此
无法求出分析结果的准确度,所以不得不用另一种
使用相对平均偏差表示分析结果的好坏比较简 单,但这个方法有不足之处,因为在一系列的测 定中,小偏差的测定总是占多数,而大偏差的测 定总是占少数,按总的测定次数求相对平均偏差 所得的值偏小,大偏差得不到充分的反映。所以 相对平均偏差在数理统计上一般不采用。
近年来,在分析化学的教学中,越来越广泛地 采用数理统计方法来处理各种测定数据。
方式来判断分析结果的好坏。这种方法是:在相同
的条件下重复测定多次,然后计算n次测定结果的
分析化学:第二章_误差和分析数据处理二

化学分析
第二章 误差和分析数据处理
4
• 对于很小的数字,可用指数形式表示。例如,离 解常数Ka=0.000018,可写成Ka=1.8×10-5;很大的 数字也可采用这种表示方法。例如2500L,若为 三位有效数字,可写成2.50×103L。
• 例如,0.0121×25.64×1.0578=0.328,其中,有 效数字位数最少的0.0121相对误差最大,故计 算结果应修约为三位有效数字。
化学分析
第二章 误差和分析数据处理
11
• 3. 百分数表示 • 高含量组分(>10%),保留四位有效数字; • 中含量组分(1~10%),保留三位有效数字; • 低含量组分(<1%),保留两位有效数字。 • 4. 其他运算 • 乘方或开方,结果的有效数字位数不变,
化学分析
第二章 误差和分析数据处理
19
3.正态分布曲线规律:
• (1) x=μ时,y值最大,体现了测量值的集中趋 势。说明误差为零的测量值出现的概率最大。 大多数测量值集中在算术平均值的附近。
• (2) 曲线以x=μ这一直线为其对称轴,说明绝对 值相等的正、负误差出现的概率相等。
• (3) 当x趋于-∞或+∞时,曲线以x轴为渐近线。 即小误差出现概率大,大误差出现概率小。
化学分析
第二章 误差和分析数据处理
5
• 对pH、pM、lgc、lgK等对数值,其有效数字的
位数仅取决于小数部分数字的位数,整数部分 只说明其真数的方次。如pH=11.02,即[H+]= 9.6×10-12mol/L,其有效数字为两位而非四位。
分析化学第二章误差与分析数据处理

根据待测组分的性质和含量选择合适的分析 方法。
空白实验
通过扣除空白值来减小误差。
标准化样品分析
使用标准样品对实验过程进行质量控制。
回收率实验
通过添加已知量的标准物质来评估分析方法 的准确性。
04
有效数字及其运算规则
有效数字的定义与表示
01
有效数字是指测量或计算中能够反映被测量大小的部分数字 ,其位数与被测量的精密度有关。
数据统计
计算平均值、中位数、众数等统计量,以反映数据的集 中趋势和离散程度。
实验结果的评价与表达
误差分析
计算误差、偏差、相对误差 等,评估实验结果的可靠性
。
1
精密度与偏差
通过多次重复实验,评估实 验结果的精密度和偏差。
置信区间
根据实验数据,计算结果的 置信区间,反映结果的可靠 性。
结果表达
选择合适的单位和量纲,将 实验结果以表格、图表等形 式表达,便于分析和比较。
02
表示有效数字时,需保留一位不确定位,采用指数或修约的 形式表示。
03
有效数字的表示方法:科学记数法(a x 10^n)或一般表示法。
有效数字的运算规则
加减法
以小数点后位数最少的数字为标准,对 其他数字进行修约,然后再进行运算。
乘方和开方
运算结果的有效数字位数与原数相同。
乘除法
以有效数字位数最少的数为标准,对 其他数字进行修约,然后再进行运算。
THANKS
准确度检验
通过标准物质或标准方法对比,检验分析结 果的准确性。
线性检验
验证测量系统是否符合线性关系,确保数据 在一定范围内准确可靠。
范围检验
评估分析方法在一定浓度或含量范围内的适 用性。
分析化学中的数据处理

2019/9/23
7
平均值相同, 精密度不同
2019/9以u表示,令
u
=
x μ σ
得 y=
1
u2
e2
2π
对其进行积分: p 1 .eu2 /2.du 1
2019/9/23
11
u检验:在无系统误差的情况下,检验±u (或单边)范围 内分析结果(或随机误差)出现的概率。
用单次测量值:μ= x±uσ
用平均量值:
x u x u
x
n
并且u检验适用于已知的正态分布方程N(μ,σ2 )
例题p58 8
2019/9/23
12
例题:某炼铁炉中铁水含C量符合正态分布方程( 4.55∽0.1082 ) 现对某日一炉铁水分析5次4.28 4.43 4.42 4.35 4.30, 如果 分析正常(无系统误差),问这炉铁水是否合格(p=95%)
2
说明:(1) 正态分布曲线与横坐标-∞到+∞之间所夹面积, 代表所有数据出现的几率总和其值等于1
(2) 若改变积分区间,可得围成的不同面积。
2019/9/23
9
随机误差在某一区间出现的概率,可以取不同的u值进行积分. 68.3%
-∞ -3 -2 -1 0 1 2 3 +∞
u
=
x μ σ
n
∞
x μ 正态分布 u = σ
2019/9/23
14
t分布曲线与正态分布曲线相似, t分布曲线下一定区间内的积 分面积就是该 区间内随机误差或测量值出现的概率, t分布曲 线不仅随t值改变还与f有关。
分析化学中的数据处理

第二章误差与数据处理1.测定某样品中的含氮量,六次平行测定的结果是20.48%,20.55%,20.58%,20.60%,20.53%,20.50%。
(1)计算这组数据的平均值、中位数、极差、平均偏差、标准偏差、变异系数和平均值的标准偏差。
(2)若此样品是标准样品,含氮量为20.45%,计算以上测定的绝对误差和相对误差。
2. 测定试样中CaO的质量分数时,得到如下结果:35.65%、35.69%、35.72%、35.60%。
问:(1)统计处理后的分析结果应如何表示?(2)比较95%和90%置信度下总体平均值的置信区间。
3. 根据以往的经验,用某一种方法测定矿样中锰的含量的标准偏差(即δ)是0.12%。
现测得含锰量为9.56%,如果分析结果分别是根据一次、四次、九次测定得到的,计算各次结果平均值的置信区间(95%置信度)。
4. 某人测定一溶液浓度(mol·L-1),获得以下结果:0.2038、0.2042、0.2052、0.2039。
第三个结果应否弃去?结果应如何表示?测定了第五次,结果为0.2041,这时第三个结果可以弃去吗?(置信度为90%)5. 在不同温度下对某试样作分析,所得结果(%)如下:10℃: 96.5, 95.8, 97.1, 96.037℃: 94.2, 93.0, 95.0, 93.0, 94.5试比较两组结果是否有显著差异。
(置信度为95%)6. 某分析人员提出了测定氯的新方法。
用此法分析某标准样品(标准值为16.62%),四次测定的平均值为16.72%,标准差为0.08%。
问此结果与标准值相比有无显著差异(置信度为95%)。
7. 标定0.1 mol·L-1; HCl,欲消耗HCl溶液25 mL左右,应称取基准物多少克?从称量误差考虑能否达到0.1%的准确度?若改用硼砂为基准物,结果又如何?8. 下列各数含有的有效数字是几位?9. 按有效数据计算下列结果:(1) 213.64 + 4.4 + 0.324410. 某人用络合滴定返滴定法测定样品中铝的百分含量。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 在实际分析测定中,测定次数一般不多, n<20,而总体平均值又不知道。一般是用 抽样的方法对样品进行测定。只能用样本 标准偏差反映该组数据的分散程度。
样本标准偏差
• 当测定次数非常多时,测定次数n与自
由度(n-1)的区别就变小, x 。
例如: 1.0008, 0.0040
三、其它需注意的事项:
1、数字后的0含义不清楚时, 最好用指数形式表示 例:1000 1.0×103 (2)、1.00×103 (3)、1.000×103 (4)
2、自然数可看成具有无限多位数(如倍数关系、分数关系); 常数亦可看成具有无限多位数
3、对数与指数的有效数字位数按尾数计( pH, pKa) 例:10-2.34 (2);pH=11.02 (2),则[H+]=9.5×10-12 (2)
又称变异系数CV (coefficient of variation)
CV s 100% x
例:重铬酸钾法测得铁的百分含量为:20.03%, 20.04%, 20.02%, 20.05%和20.06%。计算分 析结果的平均值,标准偏差和相对标准偏差。
解:
x x i 20.03 20.04 20.06 20.04(%)
由操作者、仪器、方法的 由操作者、仪器、方法的
偏差造成
不确定性造成
原则上可以认识且可减小 不可消除,但可通过仔细的
(部分甚至全部)
操作而减小
由平均值与真值之间的不一 可通过在平均值附近的分散
致程度辨认
度辨认
影响准确度
影响准确度、精密度
以平均值和真值之间的差值 定量
通过精密度的大小定量
2.2 有效数字
•即
lim (x i x)2 (xi )2
n n 1
n
此时,s。
比较 d 、d / x 、s的异同
例:测消毒剂H2O2的含量,KMnO4标准液的体积为 第1组:25.98, 26.02, 26.02, 25.98, 25.98, 25.98, 26.02,26.02
(三)准确度与精密度的关系
准确且精密 不准确但精密 准确但不精密 不准确且不精密
1.精密度是保证准确度的先决条件; 2.精密度高,不一定准确度高.
二、分析测试中误差的产生及减免办法 1. 系统误差(systematic error)或称可测误差
具单向性、数值大小基本固定、重现性,为可测误差。
方法误差: 溶解损失、终点误差-用其它方法校正 仪器误差: 刻度不准、砝码磨损-校准(绝对、相对) 试剂误差: 不纯-空白实验 操作误差: 洗涤、称量(操作粗心、马虎引起的误差称失误) 主观误差: 颜色观察、读数
4、相对误差或标准偏差只需保留1~2位
5、化学平衡计算中,平衡浓度一般保留2位有效数字
6、分析结果的一般表示法,
组分含量>10%, 要求4位 (化学分析)
组分含量1%~10% 要求3位 (仪器分析)
<1%
2位
7、改变单位不能任意改变有效数字的位数
19.82 mL (4)
0.01982 L (4)
四、运算规则:计算结果中只能有一位可疑数字
举例
1.0008 0.1000 0.0382
54 0.05 3600
43181 10.98% 1.98×10-10 0.0040 2×105
3/2
5位 4位 3位 2位 1位 不确定
数据中“0”是否为有效数字
(1)只起到定位作用,不算,
例如: 0.0382,
0.05
(2) 作为普通的数字使用,算,
2. 正态分布规律
• 1) 测量值分布的集中趋势()
• x =时,y值最大,此即分布曲线的最高点。
• 大多数测量值集中在算术平均值的附近,或 者说算术平均值是最可信赖值或最佳值。
• 它能很好地反映测定的集中趋势。
2) 测量值分布的分散趋势()
x=时的概率密度
y
1
2
乘以dx就是测量值落在dx范围内的概率。 • 越小,y越大,测量值分布越集中。 • 越大,y越小,测量值分布越分散。
d 100% x
d 1 n | d | 1 n | x x |
n i1
n i1
相对平均偏差 d 100 % x
例如:测定NaCl试样中氯的质量分数,6次测量值分别为 0.6012,0.6018,0.6030,0.6045,0.6020,0.6037
x 0.6012 0.6018 0.6030 0.6045 0.6020 0.6037 6
第二章 分析化学中的数据处理
2.1 准确度和精密度 2.2 有效数字 2.3 有限实验数据的统计处理 2.4 提高分析结果准确度的方法
2.1误差的产生及表示方法
一、关于误差的一些基本概念
(一)单次测定值与真值的关系
1、准确度 测定结果(x)与真实值(xT)之间相符的程度
绝对误差 E x xT
s可以反映出较大偏差的存在及测定次数的影响
二、随机误差的正态分布
1.正态分布(高斯分布)
测量值的分布(x分布) 以测量值x为横坐标,测量值的概率密度函数f(x)
为纵坐标所做的曲线。
f(x) σ
1 2π
exp
1 2
x σ
μ
2
f(x):测量值的概率密度函数;
n
5
s
x
2 i
1 n
(
xi )2
n 1
2008.009 2008.008 0.016(%) 5 1
CV s 100% 0.016100% 0.080%
x
20.04
总体标准偏差 • 计算总体标准偏差时,对单次测定的偏差
平方作用:
(1) 避免单次测定偏差相加时正负抵销
一、有效数字
1. 概念:一个数据中所有确定的数字再加一位不定数字。
确定的数字:指某一量经多次测定的结果,总是固定不变 的数字。 例如:三次称量Na2CO3 (g)为0.3561、0.3562、0.3560 有效数字的最后一位可疑数字,可能有±1个单位的误差
二、有效数字的位数
质量 分析天平(称至0.1 mg): 12.8218 g (6)、0.2338 g (4)、0.0500 g (3)
3) 正误差和负误差出现的概率相等
正态分布曲线以 x= 这一直线为其对称 轴。 4) 小误差出现的概率大,大误差出现的概 率小 出现很大误差的概率极小,趋近于零。因 为当x趋向于-或+时,曲线以x轴为渐 近线。
3. 随机误差的区间概率
从以上的概率的计算结果看,
1)分析结果落在 3范围内的概率达 99.7%,即误差超过3的分析结果是很 少的,只占全部分析结果的0.3%。
X:测量值;
:总体平均值(真实值);
:无限次测量的标准偏差;
(x μ) σ
:以标准偏差作为单位偏差;
exp:2.718,e的指数式
正态分布曲线 y σ=1
σ=2
µx 0 x-µ
• 正态分布曲线呈钟形对称,两头小,中 间大。
• 分布曲线有最高点,通常就是总体平均 值的坐标。
• 分布曲线以值的横坐标为中心,和 是正态分布的两个基本参数。
x1 26.00 d1 0.02 s1 0.021 n1 8
第2组:25.98, 26.02, 25.98, 26.02
x2 26.00 d2 0.02 s2 0.023 n2 4
第3组:26.01, 26.02, 25.96, 26.01
x3 26.00 d3 0.02 s3 0.027 n3 4
千分之一天平(称至0.001 g):0.234 g (3) 百分之一天平(称至0.01 g):4.03 g (3)、0.23 g (2) 台秤(台式天平)(称至0.1 g): 4.0 g (2)、 0.2 g (1) 体积 滴定管(量至0.01 mL):26.32 mL (4)、3.97 mL (3) 容量瓶:100.0 mL (4)、250.0 mL (4) 移液管:25.00 mL (4) 量筒(量至1 mL或0.1 mL):25 mL (2)、4.0 mL (2)
0.6027
d 0.0015,0.0009,0.0003,0.0018,0.0007,0.0010
d 0.0015 0.0009 0.0003 0.0018 0.0007 0.0010 6
0.0010
d 0.0010 100 % 0.17% x 0.6027
数。(与小数点后位数最少的数一致) 例:50.1 + 1.46 + 0.5812 =?
50.1 1.46 + 0.5812 52.1412 52.1
±0.1 ±0.01 ±0.0001
±0.1
50.1 1.5 + 0.6 52.2 52.2
乘除法:结果的相对误差应与各因数中相对误差最大的 数相适应。(即与有效数字位数最少的一致)
对照实验:标准方法、标准样品、标准加入
2、随机误差(random error)、偶然误差,
不可避免,服从统计规律 既影响准确度又影响精密度 增加测定次数可减少偶然误差
3、过失(mistake)
由粗心大意引起,完全可以避免的;必须重做实验!
随机误差和系统误差的最显著的特征
系统(可测)误差
随机(不可测)误差
Er 0.1% 1%
(二)单次测定值与平均值的关系 1、算术平均值(简称平均值):数据的集中趋势