近红外光谱分析技术的数据处理方法
近红外光谱数据预处理

近红外光谱数据预处理
近红外光谱数据预处理是将原始光谱数据进行清洗、校正和转换,以提高数据质量并使其适合后续数据分析和建模。
下面是一些常见的近红外光谱数据预处理步骤:
1. 背景处理:处理光谱中的背景噪声。
可以通过采集背景光谱并从样本光谱中减去背景光谱来实现。
2. 光谱对齐:将不同样本的光谱对齐,以确保它们从同样的起点和终点开始。
这可以通过插值或者使用标准光谱进行校准来实现。
3. 波长选择:选择感兴趣的波长范围。
有时,只有特定的波长信息是有用的,可以通过删除不必要的波长来减小数据集的维度。
4. 数据平滑:使用平滑算法(如Savitzky-Golay算法)来降低数据中的噪声,并提高光谱的光滑性。
5. 数据标准化:对光谱数据进行标准化,使得不同样本的数值范围一致。
常用的标准化方法包括最大最小值标准化、均值方差标准化等。
6. 数据去噪:对光谱数据进行去噪处理,例如使用小波变换或者降噪算法(如小波阈值降噪)。
7. 数据降维:对光谱数据进行降维处理,以减少数据的维度和特征数量。
常见的降维方法包括主成分分析(PCA)和偏最小二乘回归(PLS)等。
8. 数据插补:对存在缺失值或异常值的数据进行插补或处理,以填补数据空缺或修复异常值。
以上是一般常见的近红外光谱数据预处理步骤,具体的预处理方法可以根据数据的特点和需求进行选择和调整。
近红外光谱分析的原理技术与应用

近红外光谱分析的原理技术与应用引言近红外光谱分析是一种非破坏性、快速、准确的分析技术,广泛应用于食品、医药、化妆品、环境监测等领域。
本文将介绍近红外光谱分析的原理、技术和应用。
近红外光谱分析的原理近红外光谱分析利用物质吸收或反射近红外光时产生的特征光谱来分析物质的成分和性质。
近红外光谱分析主要基于以下两个原理:1.分子振动吸收原理:物质中的化学键振动会引起近红外光的吸收,吸收峰的位置与化学键的特异性有关。
2.红外光与物质的相互作用原理:物质吸收了红外光后,其分子内部发生改变,从而产生特征的近红外光谱。
近红外光谱分析的技术近红外光谱分析的技术主要包括光源、光谱仪和数据处理三个方面。
光源常用的光源有白炽灯、光电二极管和激光等。
其中白炽灯发射连续谱,适用于宽波长范围的分析;光电二极管具有快速响应和高稳定性,常用于近红外光谱分析仪器;激光具有较高的亮度和窄的波长范围,适用于特定波长范围的分析。
光谱仪常用的光谱仪有分光镜、光栅和红外线摄像机等。
分光镜通过将近红外光谱聚焦到光栅上,并通过旋转光栅来选择不同波长光线;光栅则将不同波长的光线分散成不同的角度形成光谱;红外线摄像机可通过感应近红外光谱并将其转换成数字信号。
数据处理近红外光谱分析的数据处理通常包括预处理、特征提取和模型建立等步骤。
预处理常用的方法有光谱校正、光谱平滑和光谱标准化等;特征提取可使用主成分分析、偏最小二乘回归等方法;模型建立则可以采用多元回归分析、支持向量机等模型进行建立。
近红外光谱分析的应用近红外光谱分析在多个领域具有广泛应用,以下为几个常见的应用示例:•食品质量检测:近红外光谱分析可用于检测食品中的营养成分、添加剂和污染物等,以保证食品的安全和质量。
•药物分析:近红外光谱分析可用于药品的成分分析、质量控制以及伪药的鉴定等。
•化妆品分析:近红外光谱分析可用于分析化妆品中的成分、性质和质量,以确保产品的合规性和安全性。
•环境监测:近红外光谱分析可用于监测土壤、水质和大气中的污染物,以帮助保护环境和预防环境污染。
红外与近红外光谱常用数据处理算法

一、数据预处理(1)中心化变换(2)归一化处理(3)正规化处理(4)标准正态变量校正(标准化处理)(Standard Normal Variate,SNV)(5)数字平滑与滤波(Smooth)(6)导数处理(Derivative)(7)多元散射校正(Multiplicative Scatter Correction,MSC)(8)正交信号校正(OSC)二、特征的提取与压缩(1)主成分分析(PCA)(2)马氏距离三、模式识别(定性分类)(1)基于fisher意义下的线性判别分析(LDA)(2)K-最邻近法(KNN)(3)模型分类方法(SIMCA)(4)支持向量机(SVM)(5)自适应boosting方法(Adaboost)四、回归分析(定量分析)(1)主成分回归(PCR)(2)偏最小二乘法回归(PLS)(3)支持向量机回归(SVR)一、数据预处理 (1) 中心化变换中心化变换的目的是在于改变数据相对于坐标轴的位置。
一般都是希望数据集的均值与坐标轴的原点重合。
若x ik 表示第i 个样本的第k 个测量数据,很明显这个数据处在数据矩阵中的第i 行第k 列。
中心化变换就是从数据矩阵中的每一个元素中减去该元素所在元素所在列的均值的运算:u ik k x x x =- ,其中k x 是n 个样本的均值。
(2) 归一化处理归一化处理的目的是是数据集中各数据向量具有相同的长度,一般为单位长度。
其公式为:'ik x =归一化处理能有效去除由于测量值大小不同所导致的数据集的方差,但是也可能会丢失重要的方差。
(3)正规化处理正规化处理是数据点布满数据空间,常用的正规化处理为区间正规化处理。
其处理方法是以原始数据集中的各元素减去所在列的最小值,再除以该列的极差。
min()'max()min()ik ik k k x xk x x x -=-该方法可以将量纲不同,范围不同的各种变量表达为值均在0~1范围内的数据。
近红外光谱数据预处理

近红外光谱数据预处理
近红外光谱数据预处理是指对采集到的近红外光谱数据进行一系列处理步骤,以提高数据质量和可用性的过程。
常见的近红外光谱数据预处理方法包括:
1. 线性基线校正:校正光谱中的基线漂移,消除光谱测量仪器的非线性响应或实验环境的干扰。
2. 报告点切割:将光谱数据切割为固定的报告点,加快后续处理的速度。
一般会选择在谱段中平均分配报告点,或者根据特定的光谱信息选择报告点。
3. 扣除散射信号:由于样品中的散射现象会引起近红外光谱的背景干扰,可以通过采用光谱散射校正方法,如标准正交校正(SOC)、多元散射校正 (MSC)、小波变换等,来减少散射信号对近红外光谱的影响。
4. 多元校正方法:包括正交偏最小二乘法 (OPLS)、主成分分析 (PCA)、典型相关分析 (CCA)等,在光谱数据中提取主要变化信息和样品之间的相关性。
5. 去噪处理:对光谱数据进行平滑或降噪处理,以减少随机噪声对数据的影响,常见方法包括移动平均、中值滤波、小波去噪等。
6. 数据标准化:通过线性或非线性变换,将光谱数据转化为均值为0、标准差为1的标准正态分布数据,有助于消除不同样
品之间测量尺度的差异。
7. 去除异常值:通过统计分析方法,检测并移除光谱数据中的异常值,能够减少异常值对后续分析的干扰。
这些预处理方法可以根据具体的实验目的和数据特点进行选择和组合使用,以提取出光谱数据中的有用信息,减少噪声和干扰,进而进行进一步的数据分析和建模。
_近红外光谱解析实用指南_

_近红外光谱解析实用指南_近红外光谱解析是一种非常常用的分析技术,可用于定性和定量分析。
本指南旨在向读者介绍近红外光谱解析的基本原理、仪器设备、样品制备和数据分析方法。
一、基本原理近红外光谱是指在800至2500纳米波长范围内的光谱。
近红外光谱的原理是利用样品中分子振动和拉伸产生的光谱吸收特征来推测样品的成分和属性。
这些光谱特征是由于化学键振动、倾角、水合作用等引起的。
二、仪器设备近红外光谱仪是近红外光谱解析的关键设备。
现在市场上常见的仪器一般采用光栅技术,具有高分辨率和高精度。
仪器的重要参数包括光源、光路、检测器和光谱仪。
选择合适的仪器要考虑样品类型、分析要求和预算。
三、样品制备样品制备对于近红外光谱解析至关重要。
样品制备的目的是使样品以均匀、透明、薄膜形式呈现在仪器上。
常用的样品制备方法包括将样品粉碎后与固体粉末混合,或将液体样品稀释后滴在红外透明基底上。
四、数据分析方法近红外光谱解析的数据处理过程包括光谱校正、预处理、模型建立和模型验证等步骤。
首先,需进行光谱校正,如仪器平滑、波长校准和零点校准等。
接下来,进行样品的预处理,包括去噪、光谱标准化和特征选择等。
然后,构建合适的模型,可以采用主成分分析、偏最小二乘法或支持向量机等方法。
最后,进行模型验证和检验,评估模型的准确度和鲁棒性。
近红外光谱解析的应用非常广泛,涉及农业、食品、化学、药品、生物医学等领域。
它可以用于农产品质量检测、食品成分分析、药品质量控制等。
近红外光谱解析具有快速、非破坏性、准确度高等优点,因此备受研究者和工程师的青睐。
总结起来,近红外光谱解析是一种有效的分析技术,具有广泛的应用前景。
通过正确选择仪器设备,合理制备样品,以及采用科学的数据处理方法,可以实现准确、快速和可靠的分析结果。
希望本指南能够为读者提供有关近红外光谱解析的基本知识和实用指导。
近红外光谱分析技术的数据处理方法

近红外光谱分析技术的数据处理方法数据处理方法主要包括光谱预处理、特征提取和模型建立三个步骤。
光谱预处理是指在进行特征提取和模型建立之前对光谱数据进行预处理,主要目的是去除噪声、修正谱线偏移、提高曲线分辨率等。
常见的光谱预处理方法有:1. Baseline Correction(基线校正):光谱图中常常存在基线漂移现象,可以通过多种方法进行校正,如直线基线校正、多项式基线校正、小波基线校正等。
2. Smoothing(平滑):常用的平滑方法有移动平均、中值平滑、高斯平滑等,可以去除谱图中的高频噪声。
3. Normalization(归一化):归一化可以将不同光谱样本之间的强度差异消除,常用的归一化方法有最小-最大归一化、标准差归一化等。
特征提取是指通过对预处理后的光谱数据进行降维或选择重要信息,提取出有效的特征用于模型建立。
常见的特征提取方法有:2. Partial Least Squares (PLS, 偏最小二乘法):通过将多个预测变量与原始的输出变量进行线性组合,找到最佳的方向,实现数据降维并提取有效特征。
3. Variable Selection(变量选择):通过对预处理后的光谱数据进行相关性分析、F检验、t检验等方法,筛选出与目标变量相关性较高的变量。
模型建立是指根据预处理后的光谱数据和与之对应的标准参照值,通过建立适当的数学模型,实现定量或定性的分析与检测。
常见的模型建立方法有:1. Partial Least Squares Regression(PLSR, 偏最小二乘回归):通过与已知样本值的相关数据分析,建立起预测模型。
2. Support Vector Machine (SVM, 支持向量机):通过寻找最佳的分割超平面,将样本划分到不同的类别中。
3. Artificial Neural Networks (ANN, 人工神经网络):通过多层神经网络对光谱数据进行训练和拟合,实现预测与分析。
近红外光谱技术鉴定霉变稻谷

近红外光谱技术鉴定霉变稻谷近红外光谱技术鉴定霉变稻谷近红外光谱技术是一种非破坏性且快速的分析方法,广泛应用于农产品品质检测和鉴定。
在鉴定霉变稻谷方面,可以通过以下步骤进行。
第一步:样品准备首先,需要从不同来源的稻谷样品中随机选择一些健康的和受霉变的样品。
为了减少结果的偏差,应该选择具有代表性的样品,并且每个样品应该有多个复制品。
然后,将样品进行干燥处理,以确保其在光谱测试期间的稳定性和一致性。
将样品均匀分成小份,以便进行后续的测试。
第二步:仪器设置接下来,需要准备近红外光谱仪器,并进行适当的设置。
确保光谱仪器处于正确的工作状态,并校准仪器以获得准确的光谱数据。
校准通常涉及使用已知浓度的标准品进行验证,以建立样品与光谱特征之间的关系。
第三步:光谱扫描将已经准备好的稻谷样品放置在光谱仪器的采样室中。
通过选择合适的波长范围和光谱采集参数,启动光谱扫描过程。
此过程中,仪器将记录每个样品的光谱数据。
第四步:数据处理获取光谱数据后,需要对数据进行预处理和处理。
预处理包括去除噪声、消除基线漂移等。
然后,可以应用统计学和化学模型等方法对数据进行分析和处理。
通常使用主成分分析、偏最小二乘法等技术,以提取特征信息和区分不同样品之间的差异。
第五步:模型建立和验证根据已有的光谱数据和对应的样品分类信息,建立模型来鉴定霉变稻谷。
可以使用监督学习方法,如支持向量机、逻辑回归等,通过训练模型来建立光谱与样品分类之间的关系。
然后,使用未知样品数据对模型进行验证和测试,以评估其准确性和可靠性。
第六步:结果解读通过模型验证,可以得到关于样品是否为霉变稻谷的结果。
根据模型的输出结果,可以对样品进行分类,将其鉴定为健康的或受霉变的稻谷。
同时,还可以通过分析模型的特征重要性等指标,了解光谱数据中与霉变相关的特征信息。
总结:近红外光谱技术是一种有效的方法,用于鉴定霉变稻谷。
通过样品准备、仪器设置、光谱扫描、数据处理、模型建立和验证等步骤,可以获得准确的鉴定结果。
近红外检测实验报告

一、实验目的本次实验旨在通过近红外光谱法,利用近红外光谱仪对样品进行定量和定性分析,掌握近红外光谱分析的基本原理和实验技术,提高对样品成分、结构和性质的认识。
二、实验原理近红外光谱法是一种利用近红外光区(750-2500nm)的电磁波对物质进行检测的方法。
该波段的电磁波具有较长的波长,能够穿透样品,与样品中的分子振动、转动和电子跃迁相互作用,从而产生特征光谱。
根据样品的光谱特征,可以实现对样品的定量和定性分析。
三、实验仪器与试剂1. 仪器:海能Unity近红外光谱仪SpectraStar2500XL1、近红外光谱仪专用样品池、数据处理软件。
2. 试剂:实验样品、标准品、溶剂。
四、实验步骤1. 样品准备:将实验样品和标准品分别称量,按照一定比例混合,加入适量的溶剂,制成待测溶液。
2. 光谱采集:将待测溶液倒入样品池,置于近红外光谱仪中,采集光谱数据。
3. 数据处理:利用数据处理软件对采集到的光谱数据进行预处理,包括基线校正、平滑、一阶导数等操作。
4. 定量分析:根据标准品的光谱数据,建立定量分析模型,对实验样品进行定量分析。
5. 定性分析:根据实验样品的光谱特征,与标准品的光谱数据进行比对,判断实验样品的成分和结构。
五、实验结果与分析1. 定量分析结果:根据建立的定量分析模型,对实验样品进行定量分析,结果如下:样品名称 | 定量结果(%) | 相对误差(%)--------|--------------|--------------样品1 | 85.2 | 1.2样品2 | 78.6 | 1.5样品3 | 90.1 | 1.12. 定性分析结果:根据实验样品的光谱特征,与标准品的光谱数据进行比对,得出以下结论:样品1:含有成分A、B、C,结构较为复杂。
样品2:含有成分A、B,结构较为简单。
样品3:含有成分A、B、C、D,结构较为复杂。
六、实验讨论1. 近红外光谱法具有快速、简便、非破坏性等优点,适用于多种样品的定量和定性分析。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
引言近红外是指波长在780nm~2526nm范围内的光线,是人们认识最早的非可见光区域。
习惯上又将近红外光划分为近红外短波(780nm~1100nm)和长波(1100 nm~2526 nm)两个区域.近红外光谱(Near Infrared Reflectance Spectroscopy,简称NIRS)分析技术是一项新的无损检测技术,能够高效、快速、准确地对固体、液体、粉末状等有机物样品的物理、力学和化学性质等进行无损检测。
它综合运用了现代计算机技术、光谱分析技术、数理统计以及化学计量学等多个学科的最新研究果,并使之融为一体,以其独有的特点在很多领域如农业、石油、食品、生物化工、制药及临床医学等得到了广泛应用,在产品质量分析、在线检测、工艺控制等方面也获得了较大成功。
近红外光谱分析技术的数据处理主要涉及两个方面的内容:一是光谱预处理方法的研究,目的是针对特定的样品体系,通过对光谱的适当处理,减弱和消除各种非目标因素对光谱的影响,净化谱图信息,为校正模型的建立和未知样品组成或性质的预测奠定基础;二是近红外光谱定性和定量方法的研究,目的在于建立稳定、可靠的定性或定量分析模型,并最终确定未知样品和对其定量。
1工作原理近红外光谱区主要为含氢基团X-H(X=O,N,S,单健C,双健C,三健C等)的倍频和合频吸收区,物质的近红外光谱是其各基团振动的倍频和合频的综合吸收表现,包含了大多数类型有机化合物的组成和分子结构的信息。
因为不同的有机物含有不同的基团,而不同的基团在不同化学环境中对近红外光的吸收波长不同,因此近红外光谱可以作为获取信息的一种有效载体。
近红外光谱分析技术是利用被测物质在其近红外光谱区内的光学特性快速估测一项或多项化学成分含量。
被测样品的光谱特征是多种组分的反射光谱的综合表现,各组分含量的测定基于各组分最佳波长的选择,按照式(1)回归方程自动测定结果:组分含量=C0+C1(Dp)1+C2(Dp)2+…+Ck(Dp)k(1)式中:C0~k为多元线性回归系数;(Dp)1~k为各组分最佳波长的反射光密度值(D=-lgp,p为反射比)。
该方程准确的反映了定标范围内一系列样品的测定结果,与实验室常规测定法之间的标准偏差SE为:SE=[Σ(y-x)2/(n-1)]1/2(2)式中:x表示实验室常规法测定值,y表示近红外光谱法测值,n为样品数。
2光谱数据的预处理仪器采集的原始光谱中除包含与样品组成有关的信息外,同时也包含来自各方面因素所产生的噪音信号。
这些噪音信号会对谱图信息产生干扰,有些情况下还非常严重,从而影响校正模型的建立和对未知样品组成或性质的预测。
因此,光谱数据预处理主要解决光谱噪音的滤除、数据的筛选、光谱范围的优化及消除其他因素对数据信息的影响,为下步校正模型的建立和未知样品的准确预测打下基础。
常用的数据预处理方法有光谱数据的平滑、基线校正、求导、归一化处理等。
2.1数据平滑处理信号平滑是消除噪声最常用的一种方法,其基本假设是光谱含有的噪声为零均随机白噪声,若多次测量取平均值可降低噪声提高信噪比。
平滑处理常用方法有邻近点比较法、移动平均法、指数平均法等。
2.1.1邻近点比较法对于许多干扰性的脉冲信号,将每一个数据点和它旁边邻近的数据点的值进行比较可以测得其存在。
如果与邻近点的数值相差太大,超过给定的阈值,便可认为该数据是一个脉冲干扰,并通过邻近数据点的平均值来取代这一数据点值,就可以把这一干扰脉冲去掉,这样不影响信号的其它部分。
在这一数据点处理过程中,需注意选择调节参数,也就是考虑邻近数据点值,以及判断一个数据点和邻近数据点之间不同的阈值。
这个阈值一般定义为噪音测量偏差的倍数,以免把必要的有用信号去掉。
这一方法有时也称为邻近点平滑法,也叫做单点平滑法。
2.1.2移动平均法由于平滑是通过对信号进行平均而减小噪音,因而多点平滑效果更好。
移动平均法是多点平滑中最简单的一种。
先选择在数据序列中相邻的奇数个数据点,这奇数个数据点即构成一个窗口。
计算在窗口内奇数个数据点的平均值,然后用求得的平均值代替奇数个数据点中的中心数据点的数据值,这样我们就得到了数据平滑后的一个新的数据点。
接着去掉窗口内的第一个数据点,并添加上紧接着窗口的下一个数据点,形成移动后的一个新窗口,其中的总数据个数不变。
同样地,用窗口内的奇数个数据点求平均值,并用它来代替窗口中心的一个数据点.如此移动并平均直到最后。
2.1.3指数平均法指数平均法是计算在一个具有m个数据点的移动窗口中的各数据点的加权平均.在窗口的最后一个点p1即为要平滑的点,它的权重最大,而前面的每个点分配到的权重依次递减。
权重系数由平滑时间常数为T的指数函数e-ji (j标志i前面第j个点,即j=-(m-1),-(m-2),…,-1,0(要平滑的点i 的j=0)的形状来决定。
p1后点的权重为0,这一过滤函数是用点i前面的点对第i个数据点进行平滑。
这一过程和用电子RC滤波器(阻容滤波器)的实时平滑类似。
由于该平滑函数是不对称的,故在平滑后的数据中引入了单向失真,这一点也和实时RC滤波器一样。
除了获得期望的信噪比降低外,指数平均的结果是峰的最大值下降,同时发生移动。
由于用平滑常数T对峰值进行指数平滑和具有时间常数Tx=T的仪器测量该峰的效果相同,因此T和峰宽比值函数的强度下降值从实验测量和理论计算都可得到。
2.2基线校正由于仪器背景、样品粒度和其它因素的影响,近红外分析中常常出现基线漂移和倾斜现象。
采用基线校正可有效地消除这些影响。
操作时可选用峰谷点扯平、偏移扣减、微分处理和基线倾斜等方法,其中最常用的是一阶微分和二阶微分,但在微分处理时,要注意微分级数和微分数据点的选择。
2.3数据求导处理近红外分析中,对于样品不同组分之间的相互干扰导致吸收光谱谱线重叠的现象,可采用求导的方法进行处理。
其中常用的是一阶导数和二阶导数。
一阶导数表示为:yi′=yi+g-yi-g二阶导数表示为:yi″=yi+2g-2yi+yi-2g式中:g为光谱间隔,大小可视具体情况设定。
对光谱求导一般有两种方法:直接差分法和Savitzky Golay求导法。
对于分辨率高、波长采样点多的光谱,直接差分法求取的导数光谱与实际相差不大,但对于稀疏波长采样点的光谱,该方法所求的导数则存有较大误差,这时可采用Savitzky Golay卷积求导法计算。
2.4归一化处理用于消除光程变化或样品稀释等变化对光谱产生的影响。
有三种光谱归一化方法:最小/最大归一化、矢量归一化、回零校正。
其中常用的是矢量归一化,它是先计算出光谱的y平均值,再用光谱减去该平均值,这样光谱的中值为零,计算所有的y值的平方和,然后用光谱除以该平方和的平方根,结果光谱的矢量归一化是1。
回零校正是将光谱减去最小的y值,使得最小y值变为0。
3近红外光谱分析常用的数据处理方法样品的近红外光谱包含了物质的组成和结构信息。
而物质质量参数(如成分含量)也与其组成结构相关。
应用化学计量学方法对两者进行关联,就可确定这两者间的定性或定量关系,即定标模型。
建立定标模型后,只要测出未知样品的近红外谱,根据标模型就可以预测样品的质量参数。
近红外光谱分析常用的计量方法有:主成分分(PrincipalComponentAnalysis,PCR),偏最小二乘法(PartialLeast Squares,PLS)和人工神经网络法(ArtificialNeural Network,ANN)等。
它们都是常用的化学计量学方法,有着各自的优点和局限。
3.1主成分分析法(PCR)主成分分析法是使用最为广泛的线形降维方法之一,该方法概念简单易懂,实现算法高效,因而在许多降维处理中应用都很广泛。
主成分分析法将方差的大小作为衡量信息量多少的标准,认为方差越大提供的信息越多,反之提供的信息就越少。
其基本思想是通过线形变换保留方差大、含信息多的分量,丢掉信息量少的方向,从而降低数据的维数。
降维后每个分量是原变量的线形组合,因此,主成分分析方法本质上是一种线形降维的方法。
其计算步骤一般分为以下四步:1)对原始数据样本集合进行标准化处理。
2)计算标准化后的数据矩阵的协方差矩阵,并对其进行正交分解,得出主成分分量。
3)计算各主成分的累计贡献量,根据要求的贡献率阈值选取主成分。
4)针对选取的主成分建立主成分方程,计算主成分值。
PCR把原自变量映射为含绝大部分信息的少数潜变量,再用线性的最小二乘确定这些潜变量系数,建立潜变量和因变量的回归方程后再转换为原自变量和因变量的回归方程。
其压缩自变量的效率极高,但其映射过程和因变量无关,因而其预测精度也难达到很高。
3.2偏最小二乘法(PLS)偏最小二乘法(Partial least squares regression,简称PLS)将因子分析和回归分析结合的方法,很好地解决了许多以往用普通多元线性回归难以解决的问题。
用近红外光谱数据来预测样品的组成含量时,作为解释变量的近红外反射光谱的波长有几百个甚至几千个,往往超过了样本的个数,造成多重相关,难用普通的多元线性回归方法来建立稳健、精度较高的数学模型。
PLS通过因子分析将光谱(多维空间数据,维数相当于波长数目)压缩为较低维空间数据,其方法是将光谱数据向协方差最大方向投影,将原近红外光谱分解为多种主成分光谱,不同近红外光谱的主成分分别代表不同组分和因素对光谱的贡献,通过对主成分的合理选取,去掉代表干扰组分和干扰因素主成分,选用有用的主成分参与回归。
为了建立由各因素构成的数据矩阵X与由各目标构成的数据矩阵Y之间的关系,其中X包含p个变量,Y包含pi个变量,样本数为m,用PLS方法处理时,首先将X矩阵作为双线性分解,即X=TPT种化学计量学方法而言,它们都有各自的优缺点。
因此,将各种方法联合使用,相互取长补短,将是今后发展的方向。