最常见的近红外光谱的预处理技术的综述

最常见的近红外光谱的预处理技术的综述
最常见的近红外光谱的预处理技术的综述

最常见的近红外光谱的预处理技术的综述

smund Rinnan,Frans van den Berg,S?ren Balling Engelsen 摘要:预处理在近红外(NIR)光谱数据处理化学计量学建模中已经成为不可分割的一部分。预处理的目的是消除光谱中物理现象在为了提高后续多元回归、分类模型或探索性分析。最广泛使用的预处理技术可以分为两类:散射校正方法和光谱间隔方法。综述和比较了算法的基础理论和当前的预处理方法以及定性和定量的后果的应用程序。其目的是提供更好的NIR 最终模型的建立,在此我们通过对光谱的预处理基本知识进行梳理。

关键词:乘法散射校正;近红外光谱法;标准化;诺里斯威廉姆斯推导;预处理;Savitzky-Golay 平滑;散射校正;光谱导数;标准正态变量;综述

1.引言

目前为止,没有能够优化数据来进行代替,但是经过适当的数据收集和处理将会起到优化效果,对光谱数据进行预处理是最重要的一步(例如最优化之前叠层建模),常用的方法有主成分分析(PCA)和偏最小二乘法(PLS)。在大量的文献中,多变量光谱应用食品、饲料和医药分析,比较不同的预处理的结果研究模型的预测结果是不可分割的组成部分。近红外反射/透射率(NIR / NIT)光谱的光谱技术,到目前为止最多被使用的和最大的多样性在预处理技术,主要是由于入非线性光散射的光谱可以引起显著影响。由于类似规模的波长的电磁辐射和粒子大小的近红外光谱在生物样品,近红外光谱技术是一种不被广泛使用是由于存在散射效应(包括基线转变和非线性),这将会影响样品光谱的结果的记录。然而,通过应用合适的预处理,可以很大程度上消除这些影响。

在应用研究中,比较了几乎完全不同的定标模型(定量描述符和相应关系)。几乎没有出现评估的差异和相似性的报道。替代技术即修正的含义(例如,谱描述符数据)在研究中很少被讨论。本文旨在讨论建立了预处理方法对近红外光谱和模型之间的关系,更具体地说,这些技术都是对应独立的响应变量,所以我们只讨论方法,不需要一个响应值。我们同时关注预处理工艺理论方面的和实际效果,这种方法适用于近红外光谱/ NIT光谱。

对固体样品,干扰系统的差异主要是因为光散射的不同和有效路径长度的不同。这些不受欢迎的变化常常构成了样本集的总变异的主要部分,可以观察到得转变基线(乘法效应)和其他现象称为非线性。一般来说,近红外光谱反射率测量的一个示例将测量普及性的反映和镜面反射辐射(镜面反射)。镜面反射通常由仪表设计和几何的采样最小化,因为它们不含任何化学信息。这个diffusively反射的光,这反映在广泛的方向,是信息的主要来源在近红外光谱。然而,diffusively反射光将包含信息的化学成分不仅示例(吸收)而且结构(散射)。主要的形式的光散射(不包括能量转移与样品)瑞利和洛伦兹米氏。两者都是过程中电磁辐射是分散的(例如,通过小粒子,泡沫,表面粗糙度,水滴,晶体缺陷,microorganelles、细胞、纤维和密度波动)。

当粒子尺寸大于波长,因为通常情况下,NIR光谱,是主要的洛仑兹米氏散射。相比之下,瑞利散射,是各向异性,洛伦兹米氏散射依赖的形状散射粒子和不强烈波长依赖性。

对生物样品,散射特性是过于复杂,所以软或自适应补偿,光谱预处理技术,正如我们近红外光谱在本文中进行讨论,要求删除散射从纯粹的、理想的吸收光谱。

显然,预处理不能纠正镜面反射率(直接散射),自谱不包含任何精细结构。光谱主要由镜面反射率应该总是被移除之前为离群值多元数据分析,因为他们仍将是局外人,甚至在预处理。图1显示了一组13好蔗糖和样品不同粒径加一坏蔗糖的例子展示如何(极端)镜面反射率表现比正常的光谱。

图1还演示了总体布局的大多数数据在本文中。上部的图,一个条形图显示了主成分得分值第一主成分(PC)后的样本集数据意味着定心[1]。下面部分显示预处理效果的数据集(或

者,在这种情况下,任何预处理)。相关系数r的平方值之间的酒吧和一个选定的参考变量包含(在本例中,已知的平均粒径的13蔗糖样本)。蔗糖的数据集,这种关系应该是低,例如,当假设散射是一种阻碍粒子始发;尽可能小的信息的粒度应该保持在正确的预处理。

图1近红外光谱的13蔗糖和样品不同粒径(最小的粒子在底部,最大的顶部;粒子尺寸范围在20 - 540 lm。黑色的光谱显示了一个镜面反射率蔗糖样本。酒吧是分数值第一主成分的13个蔗糖样品主成分分析模型在完整的光谱。

一个示例数据的预处理蔗糖中可以看到图2,其中也包含一个其实的一个示例数据预处理的蔗糖中可以看到图2,其中也包含一个其实

从现在起,在这篇文章中,我们将演示效果不同的预处理技术在小果胶数据集只包含7个样品有不同程度的酯化(%德;范围在0 - 93%)[2]。这些样品测定近红外光谱反射率模式在光谱范围1100 - 2500海里(收集每2海里区间;图3)。我们提供相应的第一因素PCA样本得分后作为一个条形图意味着定心,连同集中吸光度值在波长2244纳米。我们选择这个峰值,因为它在理论上应该描述% DE完美。对于本文,我们假设信息在光谱相联系的果胶粒子大小和形状应该被预处理技术,条形图应该显示一个线性行为与%德。

为了说明预处理的影响在量化,我们使用数据取自克里斯腾森et al。[3]。他们研究了一组32杏仁蛋白软糖混合物,基于不同的食谱,九个不同的数据都在互联网上可用的(www。模型的生活ku dk)。所有的杏仁蛋白软糖样品测定了六种不同的近红外光谱仪器和化学参考分析了水分和糖含量。在构建一个定量的回归模型,重要的是要打扫预测数据从非系统性散射变化,因为他们可以产生重大影响的预测模型的性能和模型的复杂性或吝啬。在本文中,我们使用请预测这种定量响应信息[4]。

2.预处理方法

图 2上图:数据被一个二阶蔗糖乘法散射校正;底:相应的标准差每个波长,虚线是原始/未加工的数据(见图1),固体是预处理的数据。

最广泛使用的预处理技术在近红外光谱法(在两个反射和透射模式)可以分为两类:scattercorrection 方法和光谱衍生品。

第一群散射校正预处理方法包括乘法散射校正(MSC),逆MSC ,扩展MSC(EMSC),扩展逆MSC ,de 趋势,标准正态变量(SNV)和标准化。

图 3生/未加工的光谱,7果胶样本。蓝线是一个示例有0%程度的果胶酯化(DE),红色的线是一个样本93%德。打开条指示主成分分析(PCA)评分值在第一个PC 为完整的光谱,意味着定心,关闭了酒吧后的光谱值在波长2244纳米。

光谱推导集团是为代表的两种技术在本文中:诺里斯威廉姆斯(NW)衍生品和Savitzky-Golay(SG)多项式导数过滤器。这两种方法都使用一个平滑的光谱导数计算之前,以减少有害的影响,传统的信噪比有限差分衍生品会。

预处理步骤的目标可以三种:

1) 提高后续探索性分析

2) 提高后续叠层校正模型(力数据服从兰伯特啤酒法律);或者,

3) 提高后续的分类模型。

朗伯比尔定律(方程(1))是经验对近红外光谱/ NIT 和显示成线性关系,吸收光谱和浓度(s)的成分(s):

10log ()A T l c λλ=-=ε?? (1)

其中A λ作为吸光度,λε依赖波长的摩尔吸光系数,l 代表光通过容器有效的路径长度,是c

成分的浓度。朗伯比尔定律严格有效的只有纯透射系统没有散射。在反射率测量,方程(1)是重新定义在类比透射率的测量为:

10log ()A R l c λλ=-?ε??

其中,R 是反射率。

选择合适的预处理应该总是被认为是相对于连续建模阶段。例如,如果数据集的兴趣不遵守法律,额外因素兰伯特啤酒或组件在请回归通常可以弥补这一理想的行为的光谱预测

[5]。的缺点包括额外的因素是提高模型的复杂性,反过来,最有可能减少对未来预测的模型的鲁棒性。所有的预处理技术的目标减少变化降低数据以增强特性寻求在光谱,常常一个线性(简单的)关系现象(比如,一个成分)的兴趣。通过使用一个合适的预处理技术,这可以实现,但总是有危险的应用了错误的类型或应用太严重的预处理,将移除有价值的信息。正确的选择的预处理是很难评估模型验证之前,但是,一般来说,执行几个预处理步骤是不可取的,作为最低要求,预处理应保持或降低复杂性的有效模型。

图4 样品光谱(蓝色的点)密谋反抗一个选定的参考光谱。标量修正条款发现随着拦截和边坡的黑色线条,就是发现从最小二乘回归适合通过所有的点。

3. 散射校正

根据散射校正方法,我们考虑三个预处理的概念:硕士,SNV 和标准化。这些技术是为了减少(物理)可变性样本之间由于散射。所有三个也调整基线样本之间的变化。

3.1MSC

乘法散射(或者,在一般情况下,信号)校正(MSC)可能是最广泛使用的预处理技术对近红外光谱(紧随其后SNV 和派生)。MSC 其基本形式是由Martens 首次引入等人1983年[6],并进一步阐述了通过Geladi 等人1985年[7]。MSC 背后的概念是,工件或缺陷(如,不良的

散射效应)将被删除的数据矩阵之前,数据建模。MSC 包含两个步骤:

1) 估计的校正系数(加法和乘法的贡献。

0,1org ref ref X b b X e =+?+ (2)

2) 校正记录的光谱

,1,1org corr ref ref ref X b e X X b b -==+(3)

其中:org X 代表近红外光谱仪器对一个原样品进行光谱测量,ref X 代表参考光谱用于预处理的整个数据集,e 是降低的一部分的 org X ,corr X 代表了修正后的光谱,其中 0b 和,1ref b 都是标量参数,这在每个样品中具有不同的代表含义,这个在图4中进行说明,对每个标量参数进行了解释。

在大多数应用中,平均频谱的校准设置用作参考光谱。然而,一个通用参考光谱也可以应用。在最初的论文Martens et al 。[6],这是建议只使用那些部分光谱轴,不包括相关信息(基线)。而这使得好的光谱意义上说,很难确定这些地区在实践中,特别是在近红外光谱测量,信号从不同的化学成分是强烈重叠和相关,很少或根本没有真正的基线是发现。这是为什么,在大多数情况下,整个频谱用于查找标量校正参数在MSC 。图5演示了应用程序的标准MSC 对果胶的数据。光谱特征的果胶粉是守恒的,而背景偏移和斜坡基本上是删除(与图3)。的线性关系光谱和%德是不错,但它并不完美。

图5数据预处理的乘法散射校正用一阶校正对平均频谱。

基本形式的MSC 已经扩展成更复杂的扩展(8 - 12)通常被称为EMSC 。这个扩展包括二阶多项式拟合参考光谱,拟合的一个基线的波长轴,和利用先验知识从光谱的兴趣或光谱干扰物。在本文中,所有这些替代品被称为MSC 为简单起见,因为他们可以总结为一个单一的方程:

22,1,21,,,,,https://www.360docs.net/doc/582078531.html, ref ref known known X X X X X b e ??=λ,λ+??(4)

其中,λ代表依赖波长轴的修正向量,,1known X 包含先验知识包括了想要/不必要的光谱信息(比如一个已知的光谱干扰的物种)。方程(4)可以轻易地扩大到包括任何其他任何具有适当意义的修正。b 代表了一组标量(校正系数)给出了方程(5)。

0,1,2,1,2,1,2,,,,,,...ref ref known known b b b b b b b b λλ??=??(5)

其中:0b 偏差校正

,1ref b 是根据th i 的修正

,1b λ改正对我

,1known b 是对th i 校正订单波长轴依赖, ,1known b 是纠正第i 已知信息吗

相比方程(2),它可以观察到方程(4)只是一个高阶扩张之一的想法。在本文中,1known X 将不再做进一步的讨论,因为,在很多实际情况,参考光谱对想要的和不必要的成分并没有现成可用的。参考校正是最常用的方法只有一个一阶多项式。即使没有数学限制扩大到高阶增加,有通常没有光谱参数这样做(除了也许如果重要的瑞利散射是出现在短的波长区域。

图6显示了结果的一个二阶多项式校正的果胶数据。修正条款用于二阶多项式参考校正只是发现了拟合二阶(二次)多项式的点在图4。只有边际改进取得了比一阶修正在图5。

波长轴的依赖是最常包括作为一个二阶多项式拟合的波长轴的光谱。当没有参考校正包括在内,这个简单的波长配件也的名义光谱de 趋势[13],它可以被视为一个基线校正。重要的是要注意,包括波长依赖性在完整的校正方程(4)而不是让它作为一个单独的步骤会导致一个较小的矫正效果。这是由于一个矩阵求逆操作同时执行所有的校正参数在MSC ,不同的修正会相互影响的最小二乘法拟合准则。当一个波长的依赖是独立决定只有波长轴(而不是参考光谱)影响的校正,这将导致一个趋平加工谱。这个效果可以看出通过比较无花果。7和8。

正如前面提到的,更加复杂的修正(比如,高阶多项式或其他转换的波长依赖性)可以很容易地纳入MSC 。Thennadil 和马丁[12]建议使用对数值的波长,因为这是更多的声音来判断光谱。然而,区别使用对数变换的波长与使用一个一阶多项式校正是最小的,使这两个方法相同的所有实用目的。

彼得森指出,et al 。[9],这是一个相当简单的过程,应用逆版本的MSC ,称为逆信号校正(ISC)[14]。估计的校正参数,b 系数,发现以类似的方式来定期MSC :

22,1,21,,,,,...ref org org known known X X X X X b e ??=λ,λ+??(6)

请注意,xorg 和xref 已经交换了地方比方程(4)。一个利用(扩展)ISC(EISC)是简单的修正方程:

22,1,21,,,,,...corr org org known known X X X X X b ??=λ,λ??(7)

图6乘法散射校正的光谱使用二阶参考校正对平均频谱。

在ISC和EISC,无论是估计的校正系数和校正本身中执行可以被描述为一个前进的方式,使它能方便包括附加的条款和/或参考信号[9]。前面提到的矩阵求逆操作所需的参数估计在MSC可以很容易地成为数字坏脾气的如果它包括高阶多项式参考更正。这是一个论点支持ISC。然而,假设,ISC最小二乘法拟合,误差在记录的光谱(纠正)小于误差为参考光谱。在大多数实际应用,参考是平均谱计算样本数据集从n的(例如,校准设置)。预期的噪音水平数量级这个引用是小于个人光谱(忽略了偏见由于散射差别集)。这是一个反对ISC,因为一个小错误在光谱预处理将会影响到更大的程度比最初的MSC。

图8 乘法散射校正(MSC)与一个一阶多项式参考校正对平均频谱,其次是一个单独的MSC与二阶多项式波长校正(去趋势)。

主要的挑战是定义一个合适的MSC参考光谱。正如前面提到过的,这是最经常设置为普通的校准光谱。加拉格尔等人[15]提供了一个天然的变化来MSC通过包含一个加权方案在预处理步骤。提出了两个选择:

1)使用一个预定义的权向量的波长轴向

2)迭代搜索最优权重向量

迭代的解决方案是通过给低体重发现变量或波长与高残留差异的原始数据和修正的解决方案。权重的计算将继续,直到区别两个后续的迭代修正光谱小于假定数据中噪声水平。不幸的是,这个相当简单直接的方法并不总是适合近红外光谱数据,自蔓延在更高的波长范围通常表明更分散,应该更正而不是权重小。图9显示了权重。用于最终的修正给强调到shortwavelength地区,而长波长区域并不有助于校正在所有。

另一个建议寻找参考校正在MSC都暗示了Windig et al。——所谓的糊涂MSC[16]。这种方法发现平均频谱从msc修正数据集。接下来,MSC是多次重复更新参考光谱的平均数据集的纠正在每次迭代中步骤。

图10显示了结果的糊涂MSC应用到果胶数据集——在这种情况下的表现非常类似于呆头呆脑的MSC单纯的MSC。在呆头呆脑的MSC,可以遵循增加模型的统计信息,然后停止在收敛(两个迭代步骤通常是足够的)。叠加在图10的变化参考光谱从原始光谱的平均值。

3.2标准正态变量(SNV)

SNV 预处理可能是第二个最散射校正的应用方法NIR / NIT 数据[13]。在本文中,规范化(也称为对象明智的标准化)的光谱将检查在同一个小节由于明显的相似性两个原则。SNV 的基本格式和正常化修正与传统MSC :

图9加权乘法散射校正,基于迭代重量的决心。绿线显示了最终的权向量(任意规模的贡献)。

1org corr X a X a -=(8)

对于SNV ,a0是平均值的样品光谱需要修正的同时,为标准化,a0设置等于零。对于SNV ,a1是标准偏差的样品光谱。

图11演示了SNV 校正的果胶的数据集。对于正常化,不同的向量规范可以用于比例因子a1,最常见的是总金额的绝对值的元素的向量(城市街区或出租车规范)或的平方根之和的平方元素(欧几里得的规范)。其他选项,有时也用正最大吸光度变量和正常化向着单一选定波长。这两个最后选项应该小心使用,因为他们可以有不良影响后续分析在例嘈杂的数据。

图12显示了效果。欧几里得的正常化,迄今为止最常用的正常化,果胶的数据集。 这个信号校正背后的概念SNV 和标准化是相同的MSC 除了常见的参考信号不是必需的。相反,每个观察自己处理,孤立于剩下的设置。缺乏需要一个共同的参考可能是一个实际的优势。

因为SNV 和归一化不涉及一个最小二乘方拟合在他们的参数估计,他们可以敏感嘈杂的条目谱。相反,使用平均值和标准偏差作为校正参数,有人可能会考虑使用更健壮的等价物这些统计的时刻。郭et al 。[17]建议使用中等或意味着内部的四分位范围和标准偏差的内

部四分位数估计为a0,a1,分别命名为“方法”健壮的正常变量”。这将是特别合适的情况下光谱很模糊(如。在超快的在线近红外光谱的应用程序,在强劲的措施将会更受散射噪声(例如,波长选择性反射颗粒的液体流)]。鲁棒估计的影响他们演示郭et al 。[17]对于模拟和实际数据。

正如已经讨论了Dhanoa et al 。[18],有一个明显的相似性SNV 和MSC 。这种关系可以通过以下简单的近似提出:

msc SNV X X X s X ≈?+(9) 其中:X s 一般的标准偏差的光谱,X 大意味着在所有的光谱,都发现了从原始/未修正的光谱(参见图13)。

图10呆头呆脑的乘法散射校正与一个一阶参考校正。绿线显示了最终的,差别开始参考光谱(任意规模的贡献)。

图11标准正态变量修正光谱

图12欧几里得规范归一化光谱

图1 3 标准正态变量之间的关系和乘法散射校正。蓝色的和红色的线条代表的趋势线估计在图4。

作为方程(9)表明,MSCandSNV 相似到简单的旋转和抵消校正。对于本文中使用果胶数据,相关的SNV 预处理数据(图11)和基本MSC 修正数据(图5)是0.9995后意味着中心。换句话说,MSC 和SNV 是相同的对于大多数实际应用。

4. 导数光谱

衍生品有能力清除两个添加剂和乘法效应在光谱和已经被用于分析光谱学了几十年。这个概念表明在无花果。14对于一个简单的高斯峰添加了基线和基线加上乘法效应。第一个衍生品只删除基线;二阶导数删除两个基线和线性趋势。在本文中,我们将讨论两种不同的方法:SG 和西北。两个派生技术使用平滑为了不降低信噪比的修正光谱太多。

最基本的方法,推导是有限的差异:一阶导数是估计为区别两个后续光谱测量分;二阶导数是然后估计通过计算连续两个点之间的区别的一阶导数光谱:

1'i i i x x x -=-(10)

111''''2i i i i i i x x x x x x --+=-=-?+(11)

4.1诺里斯威廉姆斯推导

西北推导是一个基本的方法,以避免噪音通胀开发在有限的差异。这种技术是在1983年提出诺里斯[19]和阐述了通过诺里斯和威廉姆斯在1984年[20]作为一种方法来计算导数近红外/ NIT 光谱。西北派生包含两个步骤(见图15):

1. 平滑的光谱,平均在一个给定的点的数量是执行:

,1

,121m o g i j m smooth x x m ?+=-=+∑(12)

其中,m 中的点数平滑窗口围绕电流测量的点i

2. 对于一阶求导,以区别两个平滑值与一个给定他们之间缺口大小(大于零);对二阶求导,

采取两倍的平滑值点我和平滑值在一个间隙距离两边:

图14派生的影响在添加剂(绿色)和添加剂加上乘法(红色)的影响。蓝色光谱是光谱没有任何补偿,黑色虚线是零线。

,,,,,'''2i smooth i gap smooth i gap

i smooth i gap smooth i smooth i gap x x x x x x x +--+=-=-?+(13)

可以看到从方程(13),实际的推导模仿一个有限差分(方程(10)和(11))。通过应用一个平滑之前的计算,通过引入一个缺口大小的问题,降低信噪比降低。

在文学、NW 推导往往是紧随其后的正常化修正光谱。诺里斯和威廉姆斯[20]提出了规范化光谱强度相当于在一个选定的波长,但更复杂的归一化方法可以使用。使用一个缺口很难捍卫在近红外光谱。这个概念经常使用的一个缺口,如果有一个(固定)频率分量在数据,大小的地方缺口将对应于两峰之间的距离值的信号。然而,在光谱学,有通常没有这样的背景频率的贡献。西北的衍生作品由于高度的co 变异和平滑的近红外光谱和不一定由于光谱推理(见图16)。

一个有趣的注意在西北存在推导几个设置(组合的差距和平滑窗口),给相同的估计导数。再见。数,三分的差距有五个平滑等于一个四点平滑与一个缺口大小的三个;类似地,一个threepoint 平滑有缺口的七是一样的sixpoint 平滑与一个缺口大小的三个。这可以推广到m 点平滑与一个缺口大小的k 等于一个k 1点平滑和一个缺口大小的m 。

4.2Savitzky-Golay 推导

Savtizky 和戈利(SG)[21]推广一个方法推导的数值一个向量,包括一个平滑的一步。为了找到导数在中心点我,一个多项式拟合在一个对称窗口的原始数据(参见图17)。当参数对

于这个多项式计算,任何顺序的导数的这个函数可以很容易地发现分析,这个值随后被用作导数估算出这个中心点(参阅图。18)。这个操作是应用于所有分光谱顺序。点的数目用来计算多项式(窗口大小)和程度的拟合多项式都决定要做,。最高的衍生物,可以确定取决于学位的多项式拟合过程中使用(即一个三阶多项式可用于估计的三阶导数)。

图15估计的一阶导数,诺里斯威廉姆斯。支持率窗口用于平滑,和一个缺口大小3应用于派生。

我们注意到有一个内在的冗余的层次结构SG推导。对于每个派生,随后的两多项式适合将给相同的估计的系数。第一导数,一个一级多项式和二级多项式将给出同样的答案(如将第三和第四度)。对二阶导数,第二和第三等级的多项式将给出同样的答案(如将第四和第五度),等。当这个方法是首先引入了Savitzky和戈利[21],它仍然是计算繁琐的计算参数的估算导数。出于这个原因,作者报道一组表列值几个不同类型的衍生品和多项式组合。然而,错误在他们的第一篇文章介绍了,Steinier et al。[22]发表一个修正和扩展版本的原始表。这些餐桌是后来甚至进一步扩大,发狂[23]。然而,随着现代计算机,不再有任何真正的需要为这些表。

原始形式的NW,SG推导使用对称窗口平滑,要求数据点的数量在每一边的中心点是相同的。因此,忽视一些点技术在每一端在预处理。为NW推导,点的数目失去了数等于分用于平滑加上差距的大小减去一个。对于SG推导,点的数目失去了数等于分用于平滑减一。因此吸收更多的点NW推导比SG推导。如果谱向量是长(即超过500点),这个问题不重要,但是,对于较短的光谱(例如,二极管阵列仪器),这个损失的波长可能是重要的。

天天p和舍伍德在1980年[24]和[25]天呀在1990年提出一个解决方案,包括使用一个基于非对称多项式拟合的终端窗口。在实践中,这意味着米的第一个得分谱估计从2 m + 1

第一分光谱,和一个类似的估计去年米点。然而,这样的解决方案将介绍,显然工件精度的衍生品随距离中心点(m + 1)。此外,估计的端点并不拥有内在的冗余提到:没有两个后续的SG多项式秩序配件将给相同的估计。此外,估计的潜孔导数相等的所有端点如果谱是平滑的潜孔秩序多项式。

NW推导类似于有限的差异,但引入了平滑和缺口大小为counteractions在估计衍生物光谱保持信号-噪音比例。这两个步骤在NW派生或多或少是独立的。然而,SG推导使用更多的常见的过滤技术来估算导数光谱,而不是使用有限差分方法,适合一个多项式通过一系列的点来维持一个可接受的信噪比。一般来说,NW,SG派生不给相同的估计。唯一的一双设置,让相同的结果是三个平滑分两,SG使用一阶多项式配合,在西北气隙的大小等于1。然而,更复杂的(和现实)设置为SG和/或NW自动导致(稍微)不同的推导的结果。

图16诺里斯威廉姆斯二阶导数使用9点平滑和一个缺口大小的3。

5.间隔和联合版本

提到的预处理技术迄今为止,只有估计的衍生品是由一个移动窗操作,只有一个本地部分(窗口)的光谱用于任何时间估计校正。然而,所有其他的方法同样能够在一个窗口明智的方式执行。

伊萨克松和科瓦尔斯基[26]建议这详尽分析,并将其命名为分段MSC(PMSC)。Andersson[27]预处理方法相比替代两个版本的PMSC:移动窗或当地的预处理(划分成几部分波长轴和执行预处理在每一个部分分别)。

这个移动窗版本的预处理技术获得了一些利益,从近红外光谱的社区,可能是因为正确的选择的窗口大小是至关重要的,它是远离琐碎要正确做到这点。过小窗口会导致引进大型

工件在纠正光谱和降低信噪比。然而,更大的窗口的大小,较小的完整和移动窗之间的区别预处

图17估计的,Savitzky-Golay一阶导数。支持率窗户,一个二阶多项式是用来平滑理(见图19)。本地窗口预处理是有用的,尤其是在记录的情况下测量光谱从视觉范围或短波近红外光谱的中期红外范围。在这个宽光谱区,几个不同的散射问题并存,和光谱应该相应的分割,执行单独的散射纠正在不同的部分。然而,由于这不是本质上不同于在区域划分光谱的预处理方法,应用独立,我们不讨论它进一步。

使用预处理方法的组合是丰富的文学,原则上,任何序列的预处理是可能的。然而,以下简单的规则可以作为最初的指导方针。

1)散射校正(除了标准化)应该被执行之前,分化。这些技术都是设计用于修正原始光谱,从未被认为是修正一个分化或基线纠正谱。

2)可以使用规范化的两端校正,尽管它是容易评估正常化的影响如果是任何其它操作之前执行。

3)SNV之间的基本差异与随后的消除趋势和MSC与参考和基线校正是,在MSC,同时应用两个修正,而不是连续的。因此,通常会给一个较小的MSC基线校正比SNV加德趋势。

4)其次是SNV执行de趋势并不推荐Barnes et al。[13],基于以上原因,不推荐进行消除趋势第一。

6.一个定量的例子

图18Savitzky-Golay 估计的二阶导数使用9分和一个二阶多项式的平滑。

现在我们将应用所有的预处理方法的讨论到一个定量分光任务涉及32杏仁蛋白软糖样品测量六非常不同的光谱分析仪作为预测变量两种不同的响应变量:水分和糖含量。这些数据来自一项由克里斯腾森et al 。[3]。图20显示了一个,光谱集。对于一个总结的数据,见表1。在这里,我们展示了pls 回归模型,建立所有的六个近红外光谱仪器,和响应分别(所谓的PLS1模型[5])。

杏仁糖近红外光谱数据集是不同的预处理技术处理本文中描述的。除了设置用于理论部分,一些更极端的参数设置进行估算,以显示分段MSC 使用合理的选择的重要性。没有样本被看成是例外,因为所有样本表现不错在最初的探索性分析。引导错误估计[28]被用作验证方法。共有1000引导图纸进行每种组合的数据集、引用和预处理。同一套图纸是用于所有数据集,除了仪器1,只有十五32样品进行了测量。0.632引导估计的预测误差进行了计算见方程(14),按照Wehrens et al 。[28]

0.3680.632f f f RMSE RMSE RMSEP =?+?(14)

其中f RMSE 预测误差估计并且f RMSE 和f RMSEP 一般的校准(样本每一个引导得出选择)和预测(不是每一个样本选择引导画)错误在所有引导图纸。最优数量的因素,f ,是决定基于0.632引导估计,选择第一个最低或的地方RMSEf 曲线作为函数的因素变得平缓(RMSEf 曲线的斜率是常数)。

近红外光谱分析及其应用简介

近红外光谱分析及其应用简介 1、近红外光谱分析及其在国际、国内分析领域的定位 近红外光谱分析是将近红外谱区(800-2500nm)的光谱测量技术、化学计量学技术、计算机技术与基础测试技术交叉结合的现代分析技术,主要用于复杂样品的直接快速分析。近红外分析复杂样品时,通常首先需要将样品的近红外光谱与样品的结构、组成或性质等测量参数(用标准或认可的参比方法测得的),采用化学计量学技术加以关联,建立待测量的校正模型;然后通过对未知样品光谱的测定并应用已经建立的校正模型,来快速预测样品待测量。 近红外光谱分析技术自上世纪60年代开始首先在农业领域应用,随着化学计量学与计算机技术的发展,80年代以来逐步受到光谱分析学家的重视,该项技术逐渐成熟,90年代国际匹茨堡会议与我国的BCEIA等重要分析专业会议均先后把近红外光谱分析与紫外、红外光谱分析等技术并列,作为一种独立的分析方法;2000年PITTCON 会议上近红外光谱方法是所有光谱法中最受重视的一类方法,这种分析方法已经成为ICC(International Association for Cereal Science and Technology国际谷物科技协会)、AOAC(American Association of Official Analytical Chemists美国公职化学家协会)、AACC (American Association of Cereal Chemists美国谷物化学家协会)等行业协会的标准;各发达国家药典如USP(United States Pharmacopoeia美国药典)均收入了近红外光谱方法;我国2005年版的药典也将该方法收入。在应用方面近红外光谱分析技术已扩展到石油化工、医药、生物化学、烟草、纺织品等领域。发达国家已经将近红外方法做为质量控制、品质分析和在线分析等快速、无损分析的主要手段。 我国对近红外光谱技术的研究及应用起步较晚,上世纪70年代开始,进行了近红外光谱分析的基础与应用研究,到了90年代,石化、农业、烟草等领域开始大量应用近红外光谱分析技术,但主要是依靠国外大型分析仪器生产商的进口仪器。目前国内能够提供完整近红外光

Matlab预处理近红外光谱

Matlab预处理近红外光谱1. 微分处理光谱 一阶微分公式: x i,1st= x i?x i+g 二阶微分公式: x x ,2xx = x x+x x+x?2x x x2 式中,x x是谱图数据中i波数下的透过率,g为窗口宽度 一阶导数MATLAB代码: X1st=diff(X,1);%X 为输入光谱矩阵,X1st 为输出一阶导数光谱矩阵 二阶导数MATLAB代码: X2st=diff(X,2); %X 为输入光谱矩阵,X2st 为输出二阶导数光谱矩阵 2. 多元散射校正处理谱图 (1)计算平均光谱: x????x ,x =∑ x x ,x x x=1 x (2)一元线性回归: x x=x x x????+x x (3)多元散射校正:

x x (xxx)= (x x?x x) x x 公式中X表示n×p维定标光谱数据矩阵,n为样品数,p为波点数。x????表示所有样品的原始近红外光谱在各个波长点处求平均值所得到的平均光谱矢量,x x是1×p维矩阵,表示单个样品光谱矢量,x x和x x分别表示各样品近红外光谱x x与平均光谱X进行一元线性回归后得到的相对偏移系数和平移变量。I代表第i 个样本,j代表第j个波数。 MATLAB代码如下: me=mean(X); [m,~]=size(X); for i=1:m, p=polyfit(me,X(i,:),1); Xmsc(i,:)=(X(i,:)- p(2)*ones(1,n))./(p(1)*ones(1,n)); End 代码中输入光谱矩阵为 X,输出光谱矩阵为 Xmsc。3. 标准正态变量变换(SNV) x x ,xxx = x?x √∑ (x x,x?x x)2 x x=x (x?1)

红外与近红外光谱常用数据处理算法

一、数据预处理 (1)中心化变换 (2)归一化处理 (3)正规化处理 (4)标准正态变量校正(标准化处理)(Standard Normal Variate,SNV)(5)数字平滑与滤波(Smooth) (6)导数处理(Derivative) (7)多元散射校正(Multiplicative Scatter Correction,MSC) (8)正交信号校正(OSC) 二、特征的提取与压缩 (1)主成分分析(PCA) (2)马氏距离 三、模式识别(定性分类) (1)基于fisher意义下的线性判别分析(LDA) (2)K-最邻近法(KNN) (3)模型分类方法(SIMCA) (4)支持向量机(SVM) (5)自适应boosting方法(Adaboost) 四、回归分析(定量分析) (1)主成分回归(PCR) (2)偏最小二乘法回归(PLS) (3)支持向量机回归(SVR)

一、数据预处理 (1) 中心化变换 中心化变换的目的是在于改变数据相对于坐标轴的位置。一般都是希望数据集的均值与坐标轴的原点重合。若x ik 表示第i 个样本的第k 个测量数据,很明显这个数据处在数据矩阵中的第i 行第k 列。中心化变换就是从数据矩阵中的每一个元素中减去该元素所在元素所在列的均值的运算: u ik k x x x =- ,其中k x 是n 个样本的均值。 (2) 归一化处理 归一化处理的目的是是数据集中各数据向量具有相同的长度,一般为单位长度。其公式为: 'ik x = 归一化处理能有效去除由于测量值大小不同所导致的数据集的方差,但是也可能会丢失重要的方差。 (3)正规化处理 正规化处理是数据点布满数据空间,常用的正规化处理为区间正规化处理。其处理方法是以原始数据集中的各元素减去所在列的最小值,再除以该列的极差。 min() 'max()min() ik ik k k x xk x x x -= - 该方法可以将量纲不同,范围不同的各种变量表达为值均在0~1范围内的数据。但这种方法对界外值很敏感,若存在界外值,则处理后的所有数据近乎相等。 (4) 标准化处理(SNV )也称标准正态变量校正 该处理能去除由单位不同所引起的不引人注意的权重,但这种方法对界外点不像区间正规化那样的敏感。标准化处理也称方差归一化。它是将原始数据集各个元素减去该元素所在列的元素的均值再除以该列元素的标准差。 ';ik k ik k k x x x S S -==

近红外光谱分析原理

近红外光(Near Infrared,NIR)是介于可见光(VIS)和中红外光(M IR)之间的电磁波,按ASTM(美国试验和材料检测协会)定义是指波长在780~2526nm范围内的电磁波,习惯上又将近红外区划分为近红外短波(780~1100nm)和近红外长波(1100~2526nm)两个区域。 近红外光谱属于分子振动光谱的倍频和主频吸收光谱,主要是由于分子振动的非谐振性使分子振动从基态向高能级跃迁时产生的,具有较强的穿透能力。近红外光主要是对含氢基团X-H(X=C、N、O)振动的倍频和合频吸收,其中包含了大多数类型有机化合物的组成和分子结构的信息。由于不同的有机物含有不同的基团,不同的基团有不同的能级,不同的基团和同一基团在不同物理化学环境中对近红外光的吸收波长都有明显差别,且吸收系数小,发热少,因此近红外光谱可作为获取信息的一种有效的载体。近红外光照射时,频率相同的光线和基团将发生共振现象,光的能量通过分子偶极矩的变化传递给分子;而近红外光的频率和样品的振动频率不相同,该频率的红外光就不会被吸收。因此,选用连续改变频率的近红外光照射某样品时,由于试样对不同频率近红外光的选择性吸收,通过试样后的近红外光线在某些波长范围内会变弱,透射出来的红外光线就携带有机物组分和结构的信息。通过检测器分析透射或反射光线的光密度,就可以确定该组分的含量。

近红外光谱分析技术包括定性分析和定量分析,定性分析的目的是确定物质的组成与结构,而定量分析则是为了确定物质中某些组分的含量或是物质的品质属性的值。与常用的化学分析方法不同,近红外光谱分析法是一种间接分析技术,是用统计的方法在样品待测属性值与近红外光谱数据之间建立一个关联模型(或称校正模型,Calibration Mode l)。因此在对未知样品进行分析之前需要搜集一批用于建立关联模型的训练样品(或称校正样品,Calibration Samples),获得用近红外光谱仪器测得的样品光谱数据和用化学分析方法(或称参考方法,Reference method)测得的真实数据。 其工作原理是,如果样品的组成相同,则其光谱也相同,反之亦然。如果我们建立了光谱与待测参数之间的对应关系(称为分析模型),那么,只要测得样品的光谱,通过光谱和上述对应关系,就能很快得到所需要的质量参数数据。分析方法包括校正和预测两个过程: (1)在校正过程中,收集一定量有代表性的样品(一般需要80个样品以上),在测量其光谱图的同时,根据需要使用有关标准分析方法进行测量,得到样品的各种质量参数,称之为参考数据。通过化学计量学对光谱进行处理,并将其与参考数据关联,这样在光谱图和其参考数据之间建立起一一对应映射关系,通常称之为模型。虽然建立模型所使

近红外光谱技术在药物分析中的应用

近红外光谱技术在药物分析中的应用 1·前言 近红外光谱分析技术是分析化学领域迅猛发展的高新分析技术,越来越引起国内外分析专家的注目,在分析化学领域被誉为分析“巨人”,它的出现可以说带来了又一次分析技术的革命。 近红外(NIR)谱区是人类认识最早的非可见光谱区,波长范围在0.75—2.5 m之间,用波数表示时则在13330—4000cm-1之间。由于近红外的吸收谱带复杂,谱峰重叠,信号弱,在分析上难以应用,长期以来没有受到人们的重视。近十多年来,随着近红外仪器的改良,新的光谱理论和光度分析方法的建立,特别是计算机技术和化学计量学的广泛应用和迅速发展,使近红外光谱技术成为目前发展最快、最引人注目的分析技术,并以其简单快速、实时在线、无损伤无污染分析等特点,在复杂物质的分析上得到广泛应用。在包括制糖和制药的许多与化学分析和品质管理有关的行业中的应用前景极其广阔。 关于近红外光谱技术在制药行业中应用的文献报道越来越多,显示了近红外光谱技术在制药领域中越来越受到人们的重视。近红外光谱分析具有的快速实时、操作简单、无损伤测定、不受样品状态影响的特点很符合药物分析的要求。因此,在制药业中原料药的分析、药物制剂中水分、有效成分的分析、药物生产品质的过程控制等方面近红外光谱技术得到了十分广泛的应用。 2·光谱介绍 近红外光是介于可见光和中红外光之间的电磁波,根据ASTM(美国试验和材料检测协会)定义是指波长在780~2526nm范围内的电

磁波,习惯上又将近红外区划分为近红外短波(780~1100nm)和近红外长波(1100~2526nm)两个区域。 近红外光谱属于分子振动光谱的倍频和主频吸收光谱,主要是由于分子振动的非谐振性使分子振动从基态向高能级跃迁时产生的,具有较强的穿透能力。近红外光主要是对含氢基团X-H(X=C、N、O)振动的倍频和合频吸收,其中包含了大多数类型有机化合物的组成和分子结构的信息。由于不同的有机物含有不同的基团,不同的基团有不同的能级,不同的基团和同一基团在不同物理化学环境中对近红外光的吸收波长都有明显差别,且吸收系数小,发热少,因此近红外光谱可作为获取信息的一种有效的载体。近红外光照射时,频率相同的光线和基团将发生共振现象,光的能量通过分子偶极矩的变化传递给分子;而近红外光的频率和样品的振动频率不相同,该频率的红外光就不会被吸收。因此,选用连续改变频率的近红外光照射某样品时,由于试样对不同频率近红外光的选择性吸收,通过试样后的近红外光线在某些波长范围内会变弱,透射出来的红外光线就携带有机物组分和结构的信息。通过检测器分析透射或反射光线的光密度,就可以确定该组分的含量。 3·近红外光谱技术在制药业中的应用 3·1 原料和活性组分的测定 药物加工过程中第一步就是原料的鉴定,其质量的好坏直接决定后续加工过程的成败于否,而同一类型的原料中多变因素主要是湿度和颗粒大小,近红外光谱在湿度测定中的灵敏度及其适于固体表面的表征的特性,使他能够很快地得到样品的湿度和颗粒大小的信息,然

最常见的近红外光谱的预处理技术的综述

最常见的近红外光谱的预处理技术的综述 smund Rinnan,Frans van den Berg,S?ren Balling Engelsen 摘要:预处理在近红外(NIR)光谱数据处理化学计量学建模中已经成为不可分割的一部分。预处理的目的是消除光谱中物理现象在为了提高后续多元回归、分类模型或探索性分析。最广泛使用的预处理技术可以分为两类:散射校正方法和光谱间隔方法。综述和比较了算法的基础理论和当前的预处理方法以及定性和定量的后果的应用程序。其目的是提供更好的NIR 最终模型的建立,在此我们通过对光谱的预处理基本知识进行梳理。 关键词:乘法散射校正;近红外光谱法;标准化;诺里斯威廉姆斯推导;预处理;Savitzky-Golay 平滑;散射校正;光谱导数;标准正态变量;综述 1.引言 目前为止,没有能够优化数据来进行代替,但是经过适当的数据收集和处理将会起到优化效果,对光谱数据进行预处理是最重要的一步(例如最优化之前叠层建模),常用的方法有主成分分析(PCA)和偏最小二乘法(PLS)。在大量的文献中,多变量光谱应用食品、饲料和医药分析,比较不同的预处理的结果研究模型的预测结果是不可分割的组成部分。近红外反射/透射率(NIR / NIT)光谱的光谱技术,到目前为止最多被使用的和最大的多样性在预处理技术,主要是由于入非线性光散射的光谱可以引起显著影响。由于类似规模的波长的电磁辐射和粒子大小的近红外光谱在生物样品,近红外光谱技术是一种不被广泛使用是由于存在散射效应(包括基线转变和非线性),这将会影响样品光谱的结果的记录。然而,通过应用合适的预处理,可以很大程度上消除这些影响。 在应用研究中,比较了几乎完全不同的定标模型(定量描述符和相应关系)。几乎没有出现评估的差异和相似性的报道。替代技术即修正的含义(例如,谱描述符数据)在研究中很少被讨论。本文旨在讨论建立了预处理方法对近红外光谱和模型之间的关系,更具体地说,这些技术都是对应独立的响应变量,所以我们只讨论方法,不需要一个响应值。我们同时关注预处理工艺理论方面的和实际效果,这种方法适用于近红外光谱/ NIT光谱。 对固体样品,干扰系统的差异主要是因为光散射的不同和有效路径长度的不同。这些不受欢迎的变化常常构成了样本集的总变异的主要部分,可以观察到得转变基线(乘法效应)和其他现象称为非线性。一般来说,近红外光谱反射率测量的一个示例将测量普及性的反映和镜面反射辐射(镜面反射)。镜面反射通常由仪表设计和几何的采样最小化,因为它们不含任何化学信息。这个diffusively反射的光,这反映在广泛的方向,是信息的主要来源在近红外光谱。然而,diffusively反射光将包含信息的化学成分不仅示例(吸收)而且结构(散射)。主要的形式的光散射(不包括能量转移与样品)瑞利和洛伦兹米氏。两者都是过程中电磁辐射是分散的(例如,通过小粒子,泡沫,表面粗糙度,水滴,晶体缺陷,microorganelles、细胞、纤维和密度波动)。 当粒子尺寸大于波长,因为通常情况下,NIR光谱,是主要的洛仑兹米氏散射。相比之下,瑞利散射,是各向异性,洛伦兹米氏散射依赖的形状散射粒子和不强烈波长依赖性。 对生物样品,散射特性是过于复杂,所以软或自适应补偿,光谱预处理技术,正如我们近红外光谱在本文中进行讨论,要求删除散射从纯粹的、理想的吸收光谱。 显然,预处理不能纠正镜面反射率(直接散射),自谱不包含任何精细结构。光谱主要由镜面反射率应该总是被移除之前为离群值多元数据分析,因为他们仍将是局外人,甚至在预处理。图1显示了一组13好蔗糖和样品不同粒径加一坏蔗糖的例子展示如何(极端)镜面反射率表现比正常的光谱。 图1还演示了总体布局的大多数数据在本文中。上部的图,一个条形图显示了主成分得分值第一主成分(PC)后的样本集数据意味着定心[1]。下面部分显示预处理效果的数据集(或

红外光谱仪的应用

红外光谱仪的应用 (陕西科技大学材料科学与工程学院西安任莹莹710021) 摘要:傅里叶转换红外光谱(FTIR)是一种用来获得吸收,射出光电导性或固体,液体或气体的拉曼散射的仪器。本文将从红外光谱仪的使用原理,样品制备,结果分析等几个方面对红外光谱仪进行介绍。 关键字:FTIR,原理,样品制备,结果分析 The Application of Infrared Spectrometer (School of Materials Science and Engineering, Shaanxi University of Science and Technology, Xi’an Ren yingying 710021) Abstract:Fourier transform infrared spectroscopy (FTIR) is a kind of instrument, which is used to get absorbed, penetrate photoconductivity or solid, liquid or gas Raman scattering. This article from the principle of the use of infrared spectrometer, sample preparation, the analysis of several aspects, such as the infrared spectrometer is introduced. Key words: FTIR, principle, sample preparation, analysis of the results 一、原理 红外线是波长介于可见光和微波之间的一段电磁波。红外光又可依据波长范围分成近红外、中红外和远红外三个波区,其中中红外区(2.5—5μm;4000—400cm-1)能很好地反映分子内部所进行的各种物理过程以及分子结构方面的特征,对解决分子结构和化学组成中的各种问题最为有效,因而中红外区是红外光谱中应用最广的区域,一般所说的红外光谱大都是指这一范围。 红外光谱法实质上是一种根据分子内部原子间的相对振动和分子转动等信息来确定物质分子结构和鉴别化合物的分析方法。当一束具有连续波长的红外光通过物质,物质分子中某个基团的振动频率和红外光的频率一样时,分子就吸收能量由原来的基态振动能级跃迁到能量较高的振动能级,分子吸收红外辐射后发生振动和转动能级的跃迁,该处波长的光就被物质吸收。将分子吸收红外光的情况用仪器记录下来,就得到红外光谱图。红外光谱图通常用波长(λ)或波数(σ)为横坐标,表示吸收峰的位置,用透光率(T%)或者吸光度(A)为纵坐标,表示吸收强度。如图1,辛烷的红外光谱图,纵坐标为透过率,横坐标为波长λ(μm )或波数(cm-1)。

现代近红外光谱分析仪工作原理

现代近红外光谱分析仪工作原理 现代近红外光谱分析仪工作原理 2011年02月08日 20世纪90年代初,外国厂商开始在我国销售近红外光谱分析仪器产品,但在很长时间内,进展不大,其原因主要是:首先,近红外光谱分析要求光谱仪器、光谱数据处理软件(主要是化学计量学软件)和应用样品模型结合为一体,缺一不可。但被分析样品会由于样品产地的不同而不同,国内外的样品通常有差异,因此,进口仪器的应用模型一般不适合分析国内样品。如果自己建立模型,就需要操作人员了解和熟悉化学计量学知识和软件,而外商在中国的代理机构缺乏这方面的专业人才,不能有效地根据用户的需要组织培训,因此,用户对这项技术缺乏全面了解,影响到了它的推广使用。其次,进口仪器价格昂贵,售后技术服务费用也往往超出大多数用户的承受能力。 现代近红外光谱分析技工作原理 近红外光谱主要是由于分子振动的非谐振性使分子振动从基态向高能级跃迁时产生的。近红外光谱记录的是分子中单个化学键的基频振动的倍频和合频信息,它常常受含氢基团X-H(X-C、N、O)的倍频和合频的重叠主导,所以在近红外光谱范围内,测量的主要是含氢基团X-H振动的倍频和合频吸收。 由于倍频和合频跃迁几率低,而有机物质在NIR光谱区为倍频与合频吸收,所以消光系数弱,谱带重叠严重。因此从近红外光谱中提取有用信息属于弱信息和多元信息,需要充分利用现有的光机技术、电子技术和计算机技术进行处理。计算机技术主要包括光谱数据处理和数据关联技术。光谱数据处理是消除仪器因素(灯及测量方式等)环境因素(如温度等)和样品物态(如颜色、形态等)等对光谱的影响。常采用的方法有平滑、微分、基线漂移扣减、多元散射校正(MSC)和有限脉冲响应滤波(FIR)等也可以用小波变换来进行部分处理。数据关联技术主要是化学计量学方法。化学计量学的发展使多组分分析中多元信息处理理论和技术日益成熟,解决了近红外光谱区重叠的问题。通过关联技术可以实现近红外光谱的快速分析。在近红外光谱的应用中我们所关心的是被测样品的组成或各种物化性质,因此,如何提取这些有用信息是近红外光谱分析的技术核心。现在的许多研究与应用表明,

近红外光谱分析技术及发展前景

近红外光谱分析技术及发展前景 陈丽菊 刘 巍 近红外光(near infrared,N IR)是介于可见光(VL S)和中红外光(M IR)之间的电磁波,美国材料检测协会(ASTM)将波长780~2526nm的光谱区定义为近红外光谱区。近红外光谱主要应用两种技术获得:透射光谱技术和反射光谱技术。透射光谱波长一般在780~1l00nm范围内;反射光谱波长在1100~2526nm范围内。近红外光谱区(N IR)是由赫歇尔(Herschel)在1800年发现的。卡尔?诺里斯(Karl Norris)等人首先用近红外光谱区测定谷物中的水分、蛋白质。但是由于分子在该谱区倍频和合频吸收弱,且谱带重叠严重,难以分析和鉴定,以致N IR分析技术的研究曾一度陷入低谷,甚至处于停滞。20世纪80年代,随着计算机技术、仪器硬件的迅速发展,以及化学计量学方法在解决光谱信息提取和消除背景干扰方面取得的良好效果,使得近红外分析技术不仅用于农产品、食品和生物科学,而且还应用到石油化工、烟草、纺织、环保等行业。 近红外光谱分析的原理 近红外光谱是由于分子振动能级的跃迁(同时伴随转动能级跃迁)而产生的。近红外分析技术是依据被检测样品中某一化学成分对近红外光谱区的吸收特性而进行定量检测的一种方法。它记录的是分子中单个化学键的基频振动的倍频和合频信息,它的光谱是在700~2500nm范围内分子的吸收辐射。这个事实与常规的中红外光谱定义一样,吸收辐射导致原子之间的共价键发生膨胀、伸展和振动。中红外吸收光谱中包括有C-H键、C-C键以及分子官能团的吸收带。然而在N IR测量中显示的是综合波带与谐波带,它是R-H分子团(R是O、C、N和S)产生的吸收频率谐波,并常常受含氢基团X-H(C-H、N-H、O-H)的倍频和合频的重叠主导,所以在近红外光谱范围内,测量的主要是含氢基团X-H振动的倍频和合频吸收。使用N IR技术是因为它与样品相互作用时输出的能量效率比中红外光更为实用。N IR的辐射源(仪器上的灯)要比用在中红外的能量高得多,而且它的检测器也具有更高检测效率。这些因素意味着N IR仪器的信噪比值远高于中红外仪器。较高的信噪比意味着样品的观测时间可比中红外仪器短得多。近红外辐射对于样品的穿透性也较高,因此样品的前处理常较中红外简单。近红外光谱根据其检测对象的不同分成近红外透射光谱(N IT)和近红外反射光谱(N IR)两种。N IT是根据透射光与入射光强的比例关系来获得在近红外区的吸收光谱。N IR根据反射光与入射光强的比例获得在近红外光谱区的吸收光谱。近红外分析技术是综合多学科(光谱学、化学计量学和计算机等)知识的现代分析技术,使用包括N IR 分析仪、化学计量学光谱软件和被测物质的各种性质或浓度分析模型成套近红外分析技术等。经过对这种模型的校正,就可以根据被测样品的近红外光谱,快速计算出各种数据。建立被测样品成分的模型时,主要用到的校正方法有多元线性回归法(ML R)、主成分分析法(PCA)、偏最小二乘法(PL S)、人工神经网络法(ANN)。 近红外光谱分析方法的特点 近红外光谱分析方法有下列特点。 可采用光学方法进行。鉴于近红外具有较大的散射效应和较强的穿透性,近红外光谱的分析方法比较独特,可根据样品物态和透光能力的强弱采用透射、漫反射和散射等多种测谱技术进行物质检测。 近红外光子的能量比可见光低,不会对人体造成伤害,而且整个分析过程不会对环境造成任何污染,属于绿色分析技术。 近红外分析技术可在数分钟内完成多项参数的测定,分析速度可提高上百倍,分析成本可降低数十倍。用于传输近红外辐射光的光纤可长达200m, 新结构的固态电子和光电子器件。半导体低维结构已成为推动整个半导体科学技术迅猛发展的主要动力。低维材料不同于自然界中的物质,具有各种量子效应和独特的光、电、声、力、化学和生物性能,在未来的各种功能器件的应用中将发挥重要作用,并随理论和技术的发展得到更加广泛的应用。 (上海市东华大学理学院应用物理系 200051) ? 1 ?现代物理知识

红外光谱技术

红外光谱技术 学号:1211050126 姓名:徐健榕 班级:12110501

摘要 红外光谱作为一门先进的技术,已经在各个领域得到了广泛的应用,。本文主要了解红外光谱分析的历史发展、现状分析、研究应用及其应用成果。 关键词:红外光谱历史应用成果 一、红外光谱的历史发展 真正意义上对光谱的研究是从英国科学家牛顿(Newton) 开始的.1666 年牛顿证明一束白光可分为一系列不同颜色的可见光, 而这一系列的光投影到一个屏幕上出现了一条从紫色到红色的光带.牛顿导入"光谱" (spectrum)一词来描述这一现象.牛顿的研究是光谱科学开端的标志. 从牛顿之后人类对光的认识逐渐从可见光区扩展到红外和紫外区.红外辐射是18世纪末,19世纪初才被发现的。1800年英国物理学家赫谢尔(Herschel)用棱镜使太阳光色散,研究各部分光的热效应,发现在红色光的外侧具有最大的热效应,说明红色光的外侧还有辐射存在,当时把它称为“红外线”或“热线”。这是红外光谱的萌芽阶段。由于当时没有精密仪器可以检测,所以一直没能得到发展。过了近一个世纪,才有了进一步研究并引起注意。 1892年朱利叶斯(Julius)用岩盐棱镜及测热辐射计(电阻温度计),测得了20几种有机化合物的红外光谱,这是一个具有开拓意义的研究工作,立即引起了人们的注意。1905年库柏伦茨(Coblentz)测得了128种有机和无机化合物的红外光谱,引起了光谱界的极大轰动。这是红外光谱开拓及发展的阶段。到了20世纪30年代,光的二象性、量子力学及科学技术的发展,为红外光谱的理论及技术的发展提供了重要的基础。不少学者对大多数化合物的红外光谱进行理论上研究和归纳、总结,用振动理论进行一系列键长、键力、能级的计算,使红外光谱理论日臻完善和成熟。尽管当时的检测手段还比较简单,仪器仅是单光束的,手动和非商化的,但红外光谱作为光谱学的一个重要分支已为光谱学家和物理、化学家所公认。这个阶段是红外光谱理论及实践逐步完善和成熟的阶段。20世纪中期以后,红外光谱在理论上更加完善,而其发展主要表现在仪器及实验技术上的发展:①1947年世界上第一台双光束自动记录红外分光光度计在美国投入使用。这是第一代红外光谱的商品化仪器;②20世纪60年代,采用光栅

近红外光谱(NIR)分析技术的应用

近红外光谱(NIR)分析技术的应用 近红外光谱分析是近20年来发展最为迅速的高新技术之一,该技术分析样品具有方便、快速、高效、准确和成本较低,不破坏样品,不消耗化学试剂,不污染环境等优点,因此该技术受到越来越多人的青睐。 一、近红外光谱的工作原理 有机物以及部分无机物分子中各种含氢基团在受到近红外线照射时,被激发产生共振,同时吸收一部分光的能量,测量其对光的吸收情况,可以得到极为复杂的红外图谱,这种图谱表示被测物质的特征。不同物质在近红外区域有丰富的吸收光谱,每种成分都有特定的吸收特征。因此,NIR能反映物质的组成和结构信息,从而可以作为获取信息的一种有效载体。 二、近红外光谱仪的应用 NIR分析技术的测量过程分为校正和预测两部分(如图一所示),(1)校正:①选择校正样品集,②对校正样品集分别测得其光谱数据和理化基础数据,③将光谱数据和基础数据,用适当的化学计量方法建立校正模型;(2)预测:采集未知样品的光谱数据,与校正模型相对应,计算出样品的组分。由此可知,建立一个准确的校正模型是近红外光谱分析技术应用中的重中之重。 图一 2.1定标建模

2.1.1 为什么要建立近红外校正模型 2.1.1.1 建立近红外校正模型的最终目标是获得一个长期稳定的和可预测的模型。 2.1.1.2 近红外光谱分析是间接的(第二手)分析方法,所以①需要定标样品集;②利用定标样品集的参比分析数据与近红外光谱建立校正模型;③近红外分析准确度与参比方法数据准确度高度相关;④近红外分析精度一般优于参比方法分析精度。 2.1.2 模型的建立与验证步骤 2.1.2.1 扫描样品近红外光谱 准确扫描校正样品集中各个样品规范的近红外光谱:为了克服近红外光谱测定的不稳定性的困难,必须严格控制包括制样、装样、测试条件、仪器参数等测量参数在内的测量条件。利用该校正校品集建立的数学模型,也只能适用于按这个的测量条件所测量光谱的样品。 2.1.2.2 测定样品成分(定量) 按照标准方法(如饲料中的粗蛋白GB/T6432、水分GB/T6435、粗脂肪GB/T6433)准确测定样品集中每个样品的各种待测成分或性质(称为参考数据)。这些值测定的精确度是近红外光谱运用数学模型进行定量分析精确度的理论极限。 2.1.2.3 建立数据对应关系 通过2.1.2.1所得光谱与2.1.2.2所得不同性质参数的参考数据相关联,使光谱图和其参考数据之间形成一一对应映射的关系,从而建立一个带参考数据的光谱文件。 2.1.2.4 剔除异常值 2.1.2.3建立的光谱文件中,样品参考值与光谱有可能由于各种随机的原因而有较严重的失真,这些样品的测定值称为异常值。为保证所建数学模型的可靠性,在建立模型时应当剔除这些异常值。 2.1.2.5 建立模型 选择算法、确定模型的参数、建立、检验与评价数字模型:常用的算法有逐步回归分析、偏最小二乘法、主成分回归分析等。这些算法的基本思想

红外光谱测试法

红外光谱测试法 红外光谱 (Infrared Spectroscopy, IR) 的研究始于 20 世纪初,自1940 年红外光谱仪问世,红外光谱在有机化学研究中广泛应用。新技术(如发射光谱、光声光谱、色红联用等)出现,使红外光谱技术得到发展。 原理 当一束具有连续波长的红外光通过物质,物质分子中某个基团的振动频率或转动频率和红外光的频率一样时,分子就吸收能量由原来的基态振(转)动能级跃迁到能量较高的振(转)动能级,分子吸收红外辐射后发生振动和转动能级的跃迁,该处波长的光就被物质吸收。所以,红外光谱法实质上是一种根据分子内部原子间的相对振动和分子转动等信息来确定物质分子结构和鉴别化合物的分析方法。将分子吸收红外光的情况用仪器记录下来,就得到红外光谱图。红外光谱图通常用波长(λ)或波数 (σ)为横坐标,表示吸收峰的位置,用透光率(T%)或者吸光度(A)为纵坐标,表示吸收强度。 当外界电磁波照射分子时,如照射的电磁波的能量与分子的两能级差相等,该频率的电磁波就被该分子吸收,从而引起分子对应能级的跃迁,宏观表现为透射光强度变小。电磁波能量与分子两能级差相等为物质产生红外吸收光谱必须满足条件之一,这决定了吸收峰出现的位置。 红外吸收光谱产生的第二个条件是红外光与分子之间有偶尔作用,为了满足这个条件,分子振动时其偶极矩必须发生变化。这实际上保证了红外光的能量能传递给分子,这种能量的传递是通过分子振动偶极矩的变化来实现的。并非所有的振动都会产生红外吸收,只有偶极矩发生变化的振动才能引起可观测的红外吸收,这种振动称为红外活性振动;偶极矩等于零的分子振动不能产生红外吸收,称为红外非活性振动。 应用 红外光谱对样品的适用性相当广泛,固态、液态或气态样品都能应用,无机、有机、高分子化合物都可检测。此外,红外光谱还具有测试迅速,操作方便,重复性好,灵敏度高,试样用量少,仪器结构简单等特点,因此,它已成为现代结构化学和分析化学最常用和不可缺少的工具。红外光谱在高聚物的构型、构象、力学性质的研究以及物理、天文、气象、遥感、生物、医学等领域也有广泛的应用。 红外吸收峰的位置与强度反映了分子结构上的特点,可以用来鉴别未知物的结构组成或确定其化学基团;而吸收谱带的吸收强度与化学基团的含量有关,可用于进行定量分析和纯度鉴定。另外,在化学反应的机理研究上,红外光谱也发挥了一定的作用。但其应用最广的还是未知化合物的结构鉴定。 红外光谱不但可以用来研究分子的结构和化学键,如力常数的测定和分子对称性的判据,而且还可以作为表征和鉴别化学物种的方法。例如气态水分子是非线性的三原子分子,它的v1=3652厘米、v3=3756厘米、v2=1596厘米而在液态水分子的红外光谱中,由于水分子间的氢键作用,使v1和v3的伸缩振动谱带叠

近红外光谱分析技术发展和应用现状

摘?要?近红外光谱是目前国际公认的最有应用价值的分析技术之一,它在国民经 济中日益发挥着越来越重要的作用。本文主要介绍近5年国内外近红外光谱分析技术的发展及应用现状,并对我国在这一技术方向的研发提出建议。关键词?近红外光谱 化学计量学 在线分析 快速分析 现场分析 Abstract Near infrared spectroscopy (NIR) has been recognized as one of the most valu-able application technologies, which is playing more and more important roles in national economy. In this paper, the research and application status of near infrared spectroscopy analytical technology in the past five years both home and abroad are introduced, and the NIR research and development suggestions for our country are proposed in detail. Key words Near infrared spectroscopy Chemometrics On-line analysis Rapid analysis On-site analysis 近红外光谱分析技术发展和应用现状 The research and application status of near infrared spectroscopy analytical technology 引?言? 从1800年英国科学家赫歇耳(W Herschel )发现近红外光,到1881年英国天文学家阿布尼(W Abney )和E R Festing 用Hilger 光谱仪拍摄下48个有机液体的近红外吸收光谱(700~1100nm ),发现近红外光谱区(NIR )的吸收谱带均与含氢基团有关,到1968年美国农业部的工程师K Norris 博士将近红外光谱用于农产品的快速分析,到1974年瑞典化学家S Wold 和美国华盛顿大学的B R Kowalski 教授创建化学计量学学科(Chemometris ),唤醒现代近红外光谱技术这个沉睡的分析“巨人”,到上世纪80年代末光纤在光谱中的应用,推动在线近红外光谱技术的应用和发展,到本世纪之初微机电系统(MEMS )技术使NIR 仪器越来越小型化,到近些年近红外光谱化学成像(NIR Chemical Imaging )技术的兴起和应用,现代近红外光谱分析技术走过200余年的发展历程,近红外光谱从光谱中的垃圾箱(因其宽且重叠严重的谱带而无法通过传统方法进行分析应用),发展成为当前很多领域不可或缺的一种分析手段[1~7]。 在这200余年尤其是近20年的发展过程中,近红外 光谱仪器得到不断改进和完善,针对不同样品类型的测量附件也逐渐完备、化学计量学算法日趋普及,近红外光谱技术在工业(尤其是大型流程工业)应用中的优势逐渐被人们所认识,迅速被应用到实验室快速分析、现场分析以及在线分析中,为企业带来丰厚的效益。更为重要的是,在一些行业近红外光谱技术成为促进技术进步(例如生产工艺的改革)以及提高科学管理(例如保证产品质量)的重要手段之一,已成为现代优化操作和控制系统中的一个重要组成部分。 国内外已有较多文献对近红外光谱技术(包括仪器、光谱成像、化学计量学算法与软件、应用等)做详尽的综述[8~13],本文主要介绍近5年国内外近红外光谱分析技术的发展及应用现状,并对我国在这一技术方向的研发提出建议。 1?国际NIR 技术和应用现状 1.1?技术现状 近红外光谱分析技术是由光谱仪、化学计量学软件和校正模型3部分构成的,在线分析系统往往还包括取样与预处理、数据通讯等部分。 褚小立1?袁洪福2Chu?Xiaoli 1?Yu?Hongfu 2 (1.石油化工科学研究院?北京?100083;2.北京化工大学?北京?100029) (1.Research Institute of Petroleum Processing, Beijing, 100083; 2.Beijing University of Chemical Technology, Beijing 100083)

近红外光谱分析技术的应用及其局限性

近红外光谱分析技术的应用及其局限性   李子存1史永刚2宋世远2 1 后勤工程学院基础部,重庆400016  2 后勤工程学院油料应用工程实验中心,重庆400016    摘要:文章介绍了近红外光谱及其分析技术,指出近红外光谱分析方法的建立有赖于化学计量学的应用和参照标准方法,并对近红外光谱分析技术的局限性作了表述。  关键词:近红外光谱分析,化学计量学,局限性      1.前言 近红外谱区早在1800年被发现,50年代出现了商品近红外光谱仪,定量和定性分析的应用早于目前我们更熟悉的红外(即中红外)光谱,但是,近红外光谱吸收较红外光谱弱,谱带重叠多,受当时在光谱仪性能和信息提取技术条件的限制,近红外光谱分析技术应用不多,在中红外光谱分析技术快速发展期间,几乎被人们遗忘。直到1950年,Norris早期使用近红外光谱和多元线性回归分析进行测定水分、蛋白和脂肪含量取得的研究结果,才激励人们对近红外光谱分析技术进行不断地研究。随着计算机技术的高度发展和化学计量学(Chemometrics)学科诞生,近红外与之结合产生了现代近红外光谱分析技术,尤其是近十年来,近红外在仪器、软件和应用技术上获得了高度发展,以高效和快速的特点异军突出,焕发了青春,倍受人们的关注1。  近红外光谱主要是含X—H(X=C、N、O)基团的样品在中红外区域基频振动的倍频和合频吸收,范围为700-2500mn。与传统分析方法相比,近红外光谱分析技术对于提高分析工作效率,具有划时代的意义。由于近红外光谱仪除消耗少量电能外,不需消耗任何试剂、标准物质和设备零件,被测样品量仅为几毫升,极为经济。一台近红外光谱仪用于控制分析,可以替代多种多台分析仪器,可以节省大量设备费用、操作费用和维护费用、大量人力和物力,以及大量时间。近红外光谱分析具有如下特点: 不需要大量的试药、溶剂,安全性高; 前处理技术简单,量测过程迅速;分析方式简易;同一样本可以重复量测;可以同时量测同一样本内各种不同成分;机型小,可以携带至现场作业;适用固态、粉粒态、半固态、液态等各种样本。  由于近红外光谱分析技术的方便性,原理日趋成熟。1979年美国谷物学会首先将“用近红外光谱分析蛋白质含量”定为学会标准法(AACC method,39-10)。  目前,研究人员不需要对近红外光谱原理有所了解,就能利用厂商提供的设备创造出一系列论文,因此近红外光谱仪器又被称为“论文制造者”。  - 1 -

近红外光谱

近红外光谱在果蔬品质无损检测中的应用研究进展 摘要 本论文介绍了近红外光谱无损检测机理,近红外光谱在果实品质的定量分析和定性分析的研究概况,并对近红外光谱对果实品质无损检测存在问题及前景做了简单的分析。 关键词 无损检测;近红外光谱;内部品质;果蔬 1 引言 1.1 果蔬无损检测研究概况 果蔬品质主要是指果蔬形态、颜色、密度、硬度以及含糖量、水分、酸度、病变等。果蔬品质检测技术作为保障果蔬质量、提升产品市场竞争力的一种手段,可以分为有损检测和无损检测两种。有损检测一般需要借助传统的化学分析测定方法或是现代仪器分析方法( 如高效液相色谱分析、气相色谱分析、质谱分析等) ,测定过程比较烦琐、人力物力耗费大、检测成本非常高。无损检测又称为非破坏性检测,是利用果蔬的物理性质,如力学性质、热学性质、电学性质、光学性质和声学性质等,在获取样品信息的同时保证了样品的完整性,检测速度较传统的化学方法迅速,且能有效地判断出从外观无法获得的样品内部品质信息。目前,果蔬品质与安全的无损检测技术主要包括: 光谱分析技术、光谱成像技术、机器视觉技术、介电特性检测技术、声学特性及超声波检测技术、力学检测技术、核磁共振检测技术、生物传感器技术、电子鼻与电子舌技术等等。针对不同的检测对象和检测指标,这些无损检测技术各具优势。 1.2 近红外光谱无损检测研究概况 近红外光谱分析( Near Infrared Spectroscopy,NIR) 技术是近十年来发展最为迅速的高新分析技术之一,以其快速、简便、高效等优势已被人们认识和接受,并且其应用范围也由谷物、饲料扩展到食品和果蔬等领域。水果是重要的农产品,消费者在选购水果时对于内部品质如口感、糖度和酸度等极为看重。而近红外光谱分析技术将其用于水果内部品质检测具有快速、非破坏性、无需前处

近红外光谱分析技术的数据处理方法

引言 近红外是指波长在780nm~2526nm范围内的光线,是人们认识最早的非可见光区域。习惯上又将近红外光划分为近红外短波(780nm~1100nm)和长波(1100 nm~2526 nm)两个区域.近红外光谱(Near Infrared Reflectance Spectroscopy,简称NIRS)分析技术是一项新的无损检测技术,能够高效、快速、准确地对固体、液体、粉末状等有机物样品的物理、力学和化学性质等进行无损检测。它综合运用了现代计算机技术、光谱分析技术、数理统计以及化学计量学等多个学科的最新研究果,并使之融为一体,以其独有的特点在很多领域如农业、石油、食品、生物化工、制药及临床医学等得到了广泛应用,在产品质量分析、在线检测、工艺控制等方面也获得了较大成功。近红外光谱分析技术的数据处理主要涉及两个方面的内容:一是光谱预处理方法的研究,目的是针对特定的样品体系,通过对光谱的适当处理,减弱和消除各种非目标因素对光谱的影响,净化谱图信息,为校正模型的建立和未知样品组成或性质的预测奠定基础;二是近红外光谱定性和定量方法的研究,目的在于建立稳定、可靠的定性或定量分析模型,并最终确定未知样品和对其定量。 1工作原理 近红外光谱区主要为含氢基团X-H(X=O,N,S,单健C,双健C,三健C等)的倍频和合频吸收区,物质的近红外光谱是其各基团振动的倍频和合频的综合吸收表现,包含了大多数类型有机化合物的组成和分子结构的信息。因为不同的有机物含有不同的基团,而不同的基团在不同化学环境中对近红外光的吸收波长不同,因此近红外光谱可以作为获取信息的一种有效载体。近红外光谱分析技术是利用被测物质在其近红外光谱区内的光学特性快速估测一项或多项化学成分含量。被测样品的光谱特征是多种组分的反射光谱的综合表现,各组分含量的测定基于各组分最佳波长的选择,按照式(1)回归方程自动测定结果:组分含量=C0+C1(Dp)1+C2(Dp)2+…+Ck(Dp)k(1)式中:C0~k为多元线性回归系数;(Dp)1~k为各组分最佳波长的反射光密度值(D=-lgp,p为反射比)。该方程准确的反映了定标范围内一系列样品的测定结果,与实验室常规测定法之间的标准偏差SE为:SE=[Σ(y-x)2/(n-1)]1/2(2)式中:x表示实验室常规法测定值,y表示近红外光 谱法测值,n为样品数。 2光谱数据的预处理 仪器采集的原始光谱中除包含与样品组成有关的信息外,同时也包含来自各方面因素所产生的噪音信号。这些噪音信号会对谱图信息产生干扰,有些情况下还非常严重,从而影响校正模型的建立和对未知样品组成或性质的预测。因此,光谱数据预处理主要解决光谱噪音的滤除、数据的筛选、光谱范围的优化及消除其他因素对数据信息的影响,为下步校正模型的建立和未知样品的准确预测打下基础。常用的数据预处理方法有光谱数据的平滑、基线校正、求导、归一化处理等。 2.1数据平滑处理 信号平滑是消除噪声最常用的一种方法,其基本假设是光谱含有的噪声为零均随机白噪声,若多次测量取平均值可降低噪声提高信噪比。平滑处理常用方法有邻近点比较法、移动平均法、指数平均法等。 2.1.1邻近点比较法 对于许多干扰性的脉冲信号,将每一个数据点和它旁边邻近的数据点的

相关文档
最新文档