专利名称:基于多尺度回归的红外光谱定量分析方法和装置的制作方法
技术领域:
本发明涉及了一种红外光谱定量分析方法和装置,特别是基于多尺度回归的红外 光谱定量分析方法和装置。
背景技术:
由于光谱仪得到的光谱信号中既含有有用信息,同时也叠加着其它各种随机误差 (背景和噪声)。因此,在利用偏最小二乘回归方法进行定量分析时,很难得到预测精度较高 的模型。针对提高偏最小二乘回归模型的预测精度这一问题,大量的研究工作已被开展, 目前主要包括光谱预处理方法和变量筛选方法研究,这些方法已经成功地用于光谱背景校 正、噪声消除、无信息变量的消除。然而在利用上述方法进行信息提取时,常会面临有用信 息提取不充分或提取的信息中包含有噪声的问题。因此,需要发明一种不需要对光谱信息 进行提取,而是通过将光谱包含的信息进行分类,然后对分类后的光谱信息分别进行建模 预测,最后对各个不同类的光谱信息的模型结果进行集成,这样既可以避免光谱信息提取 的不准确,又可以提高光谱模型对最终结果的预测准确率。小波变换已经成功地应用于光谱信号的预处理中,包括数据压缩、平滑滤噪、基线 校正、重叠信号解析以及分析图象处理等领域。与其它预处理方法不同,小波变换具有“时 频优势”。通过小波变换处理,一条光谱信号可以被分成不同频率的几个子信号,对这些子 信号进行重构后,重构光谱所包含的信息几乎与原始光谱完全相同。最后,通过对不同频率 下的重构子光谱信号分别建模预测,并对预测结果进行集成。在本专利中,发明了一种基于小波分解与重构结合偏最小二乘回归方法的红外光 谱定量分析方法和装置。克服了单一模型方法对光谱信息提取的难点,在分析复杂的光谱 数据时,利用本发明中的方法和装置可以直接利用各尺度下重构光谱建立多个偏最小二乘 子模型,这些子模型因子数可以依据子光谱包含的信息量更加灵活有效地进行选择,达到 充分提取各个尺度下的有用信息的目的。
发明内容
在应用红外光谱分析技术对待测组分进行快速分析过程中,为了解决光谱信息提 取的不准确的问题。本发明提供了一种基于多尺度回归的红外光谱定量分析方法和装置。 该方法和装置充分利用的小波变换的多分辨分析的特点,实现了红外光谱信息的充分利用 和合理分配。实现上述技术方案的装置包括经数据信号线相连的光谱仪、预处理器、小波分解 与重构处理器、偏最小二乘回归模型集成器。所述的红外光谱包括中红外和近红外光谱,即波长范围为780 nm - 50000 nm。所述的预处理器采取中心化和矢量归一化对光谱仪采集的原始信号进行处理。所述的小波分解与重构处理器,具体包含的处理步骤如下首先,在小波分解过程 中,需要对分解尺度和小波基两个参数进行设定;其次对分解后各尺度下的近似或细节光谱成分进行重构,这样就把原始的光谱信号数据阵变换为与原始光谱信号数据阵维数相同 的几个子光谱信号数据阵。所述的偏最小二乘回归模型集成器,其具体操作如下分别对经小波分解与重构 处理器处理后得到的子光谱信号数据阵建立相应的偏最小二乘回归子模型(在每一个子模 型中,主成分数可以选择不同的数值),利用已建立的子模型分别对测试集样品指标进行预 测,分别得到相应的预测结果;最后对每一个子模型的预测结果进行加权,得到最终的样品 指标的预测值。通过比较不同分解尺度和小波基下,模型的预测均方根误差(Root Mean Square Error of Prediction, RMSEP)值,确定合适的分解尺度、小波基和模型参数并保 存,用于后续新样品红外光谱的预测分析。由于本发明采用以上的技术方案,得到以下效果
通过小波分解和重构变换,实现了多模型的构建,克服了单模型方法对光谱信号信息 提取的困难;通过对不同子模型单独确定因子数,实现了有效信息的充分提取,提高了红外 光谱分析模型的预测精度和稳健性。
图1多尺度回归的红外光谱定量分析方法和装置示意图; 图2近红外光谱图3多尺度偏最小二乘回归方法操作示意图; 图4分解尺度对多尺度偏最小二乘回归方法的影响 图5小波分解与重构处理器操作示意图; 图6红外光谱模型的预测值和参考值的相关图。
具体实施例方式具体实施方式
结合下面实施实例进行说明。以梨的近红外光谱为例,对梨内部的 糖度指标进行多尺度回归模型的构建。图1为多尺度回归的红外光谱定量分析方法和装置示意图,图2为近红外光谱图, 光谱范围为750 -1800 nm,每条光谱包括1051个数据点。将所有样品按照2:1的比例划分 为校正集和测试集。将所有样品进行小波分解,分解时我们这里选择db4小波基,分解尺度从1到20, 图3所示为多尺度偏最小二乘回归方法操作示意图,从图中可以看出光谱经小波分解重构 后,得到一系列与原始光谱维数相同的子光谱信号矩阵,所有的子光谱图谱差异较大,每一 个子光谱矩阵包含的有用信息也存在差异。因此建模时,原始光谱只能选择一个主成分数, 而多尺度偏最小二乘回归方法可以对子光谱矩阵选取不同的主成分数,使得信息提取更加 灵活充分。图4所示为分解尺度对多尺度偏最小二乘回归方法的影响,图中虚线表示采用传 统偏最小二乘回归方法的预测均方根误差,实线表示测试集的预测均方根误差随小波分解 尺度的变化曲线,从图中可知,当采用5尺度小波分解重构时,测试集的预测均方根误差最 小。从而可以确定小波分解与重构处理器的分解尺度和小波基。图5所示为小波分解与重构处理器操作示意图。对图中各个子光谱信号矩阵分别建立校正模型,相应的主成分数分别为7、4、5、3、2、4,而不经小波分解与重构处理器进行处 理时,模型的主成分数为4,可见采用多尺度偏最小二乘回归分析方法更利于光谱信息的提 取。图6所示为红外光谱多尺度偏最小二乘回归模型预测值和参考值的相关图。从图 中可知,得到了较好的预测结果。本发明的效果是通过采用多尺度偏最小二乘回归方法对红外光谱进行定量分 析,有助于提取不同频率下光谱信号的有用信息,得到更加准确、稳定的预测结果。因此,该 发明的方法和装置有望成为一种十分有应用前景的红外光谱分析方法。
权利要求
1.基于多尺度回归的红外光谱定量分析方法和装置,其特征在于包括数据信号线相 连的光谱仪、预处理器、小波分解与重构处理器、偏最小二乘回归模型集成器;所述的红外光谱包括中红外和近红外光谱,即波长范围为780 nm - 50000 nm ; 所述的预处理器采取中心化和矢量归一化对光谱仪采集的原始信号进行处理。
全文摘要
本发明涉及基于多尺度回归的红外光谱定量分析方法和装置,包括数据信号线相连的光谱仪、预处理器、小波分解与重构处理器、偏最小二乘回归模型集成器;所述的红外光谱包括中红外和近红外光谱,即波长范围为780nm-50000nm。通过小波分解和重构变换,实现了多模型的构建,克服了单模型方法对光谱信号信息提取的困难;通过对不同子模型单独确定因子数,实现了有效信息的充分提取,提高了红外光谱分析模型的预测精度和稳健性。
文档编号G01N21/27GK102135496SQ20101060135
公开日2011年7月27日 申请日期2010年12月23日 优先权日2010年12月23日
发明者郝勇 申请人:华东交通大学