基于自编码网络流形学习的毛竹笋不溶性膳食纤维含量红外光谱建模
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
据进行有效的非线性降维 ,可从 高维 光谱 向量 中提取 有用信
息 、准确 反映光谱与理化性质之间的关系 。
流 形 学 习能 有 效 地 发现 嵌 入 在 高 维数 据 中 的非 线 性 流形
结构 ,能解决高维光谱数 据 的非 线性降 维问题 。目前 ,针 对 红外 光谱数据进行 流形 学习非线性降维的建模 方法研究 已见
c o n t e n t ,I DF l C ) [ 。 ] 的 NI R 和 MI R 回 归 模 型 ,并 对 AN - P L S
d i n g , L L E ) 方法结合偏最小二乘( p a r t i a l l e a s t s q u a r e s , P L S )
第3 3 卷 , 第6 期 2 0 1 3年 6月
光
谱
学
与
光
谱
分
析
V o 1 . 3 3 , N o . 6 , p p 1 5 1 2 — 1 5 1 6
J u n e ,2 0 1 3
S p e c t r o s c o p y a n d S p e c t r a l An a l y s i s
定性 映 射 ,同样 也 无 法 给 出相 应 的逆 映 射 ,因 此 只适 用 于 原
始的训练光谱数据 集 而不 能有效 运用 于新 出现 的光 谱数据 集 ,限制 了其在红外光谱 预测建模 方面 的应 用能力 。自编码 网络 ( a u t o e n c o d e r n e t wo r k , AN) _ 3 ] 是2 0 0 6 年 Hi n t o n 提 出 的
方法建立的 回归 模型 与其 他常用 数据 预处 理方 法结 合 P L S 及单独用 P L S建立 的回归模型对毛竹笋 I DF C预测的结果进
行 比较 分 析 , 验证 A P L S建 模 方 法 的有 效 性 。
法对 NI R数 据进 行非线性 降维和建模研究『 2 ] 等 。但是 ,L L E
红外光谱技术结合 AN - P L S建模 , 可实现 毛竹 笋中不溶性膳食纤维含量 的准确测量 。
关键词 毛竹笋 ; 不溶性膳食纤维 ; 近红外光谱 ;中红外 光谱 ;自编码 网络 ;流形学 习 文献标识码 : A D O I :1 0 . 3 9 6 4 / j . i s s n . 1 0 0 0 — 0 5 9 3 ( 2 0 1 3 ) 0 6 — 1 5 1 2 — 0 5 在低维结构 , 并不能给出高维空间中数 据点到低维 空间 的确
少量 文献 报 道 , 包括利用局部线性嵌入 ( 1 o c a l l y l i n e a r e mb e d -
以毛竹笋为具体对象 , 获取 NI R和 MI R数据 , 利用 AN - P L S 建立 毛竹 笋 中不 溶性 膳 食纤 维 含量 ( i n s o l u b l e d i e t a r y f i b e r
的优势 。 因此 , 拟 结 合 AN 流 形 学 习 和 P L S研 究 一 种 红 外 光 谱 的 非 线 性 建 模 方 法 — — AN _ P L S 。AN - P L S先 用 AN 对 红 外 光 谱 进 行 非 线 性 降维 处 理 , 再利用 P L S建 立 回归 模 型 。文 章 将
基 于 自编码 网络流 形 学 习的毛竹 笋 不溶 性膳 食 纤维 含 量红 外光 谱 建模
余 心 杰 , 殷姣姣h 。 ,于 欣 , 何 勇
1 .浙 江 大 学 宁 波 理 工 学 院 , 浙 江 宁波 3 1 5 1 0 0
பைடு நூலகம்
2 .浙 江大学生物系统工程与食品科学学 院,浙江 杭州 3 1 0 0 5 8 3 .太 原科技大学 ,山西 太原 0 3 0 0 2 4
中图分类号 : 06 5 7 . 3
引 言
红外光谱分析 中的近红 ̄ b ( n e a r i n f r a r e d , NI R) 和中红外 ( mi d - i n f r a r e d ,MI R ) 等光谱数据是 由不同波长下 的吸光度组 成 的一个 高维 向量 。由于光谱测量服从 B e e r - L a mb e r t定律 , 使得 光谱 数据 与 样 品理化 性 质之 间基 本满 足线 性 关 系。同 时, 光谱测量 中的非单 色光 、杂散光 、温度 等多种 因素会 导 致光谱偏离该定律 , 从而使光谱数据与待测理 化性质之 间又 有一定的非线性关系¨ 1 ] 。因此 ,红外光谱 数据是具 有非 线性 特性的高维数据 , 在建立红外光 谱的多元 校正模 型时 ,对数
一
种流形学 习非线性降维方法 。 该方法可通 过训练具有 多个
中 间层 的 双 向深 层 神 经 网络 将 高 维 数 据 转 换 成 低 维 嵌 套 ,并
给出输入 的高维数据 与低维嵌套之 间的双 向映射 ,可有效地 发现高维数据 有意义的低维 流形结构 、克服传 统流形学 习方 法非双向映射的缺点[ 4 ] , 在红外光谱数据处理 方面具有很 大
摘
要
提 出了一种结合 自编码 网络 ( A N) 流形 学 习和偏 最i ] , -乘( P L S ) 法 的红 外光谱 建模方法 AN - P L S 。
AN _ P L S 方法 首先用 A N算法对红外光谱数据进行 非线性降维 , 再结 合 P L S建立 回归模 型 。利用该方 法建 立 了毛竹笋 中不溶性膳食 纤维含量的近红外 光谱 和中红外光谱 回归模 型。结 果表 明,用 A N- P L S方法 建立 的 回归模型 ,比用其他 常用光谱数据预处理方法结合 P L S及用单独 P L S 算 法建立的模型具有更小 的预测均 方根误差 R MS E P和更 高的决定 系数 R ,因此 , AN — P L S 具有较优 的建模 与预测能力 , 利用 近红外光谱 和中