山东科威数控机床有限公司铣床官方网站今天是:2025-04-30切换城市[全国]-网站地图
推荐产品 :
推荐新闻
技术文章当前位置:技术文章>

一种可见-近红外光谱无损判别的方法

时间:2023-06-12    作者: 管理员

一种可见-近红外光谱无损判别的方法
【专利摘要】本发明公开一种可见-近红外光谱无损判别的方法。本发明提出的基于光谱预处理模型筛选、波长模型筛选、光谱判别分析参数筛选的集成算法,综合了去噪、数据降维、特征提取、分类识别等方面的功能。经过随机抽样检验,取得了高精度的光谱识别效果,显示了可见-近红外漫反射光谱应用于转基因甘蔗育种筛查的可行性。为研发转基因甘蔗叶无损判别技术和相关专用光谱仪器设计提出有效的解决方案。本发明的方法无需试剂、无损、准确;且方便、快捷,节约成本;是一种有潜力的便于应用的检测工具。
【专利说明】一种可见-近红外光谱无损判别的方法

【技术领域】
[0001] 本发明属于农作物育种筛查的无损检测【技术领域】,具体涉及一种可见-近红外光 谱无损判别的方法。

【背景技术】
[0002] 我国是甘蔗制糖大国,蔗糖产量居世界第三位。甘蔗的附加值较高,除制糖外,还 用于造纸及燃料乙醇的生产等。甘蔗多生长在高温高湿地区,容易受到多种有害生物的威 胁,其中虫害尤为严重。随着现代农业生物技术的发展,转基因技术在甘蔗研究上的应用逐 渐开展,甘蔗转基因育种日益受到重视。目前,将含有抗虫基因(Bt)和抗除草剂基因(Bar) 导入甘蔗中以对现有甘蔗优良品种进行遗传改良,可有效提高甘蔗抗虫和抗除草剂能力。 在转基因甘蔗育种时,必须判定所导入的外源基因是否在甘蔗植株成功表达。目前的基因 筛查方法主要是分子生物学的检测技术,其方法复杂,需要使用多种生化试剂,并要求较高 的专业操作技能,不能满足现代大规模生产的需要。
[0003] 近红外(NIR)是介于可见(Vis)和中红外之间的电磁波,主要反映的含氢基团 X-H(如C-H、N_H、〇-H等)振动的倍频和合频吸收,在快速、实时、无损检测方面具有明显优 势,已成功应用于农业、食品、石油化工、生物医学等领域。转基因与非转基因甘蔗叶的蛋白 质分子存在差异,含有大量的氢基团X-H,因此,NIR光谱具有分析甘蔗基因变异信息的方 法基础,可望用于无损检测。农作物植株的无损检测具有明显的应用优势,同时是方法学的 难点所在。因为农作物(如甘蔗叶片)具有复杂组分,它的光谱包含有多种噪音干扰,要求 采用先进的化学计量学、计算机模式识别方法进行光谱分析。目前还未见有相关应用研究 成果报道。


【发明内容】

[0004] 为了克服现有技术的缺点与不足,本发明的目的在于提供一种可见-近红外光谱 无损判别的方法。
[0005] 本发明的另一目的在于提供一种可见-近红外光谱无损判别具Bt和Bar基 因甘蔗叶的方法。建立一种基于可见-近红外(Vis-NIR)光谱的对于具Bt和Bar基 因甘蔗叶的无损判别方法。首先,采用适当的光谱预处理方法消除光谱噪音,如采用 Savitzky-G〇lay(SG)模型的筛选;其次,对光谱波长模型进行优化,达到提取信息的目的, 如采用移动窗口(MW)方式的连续型筛选方法;然后,采用光谱判别分析方法(如有监督的 PLS-DA,PCA-LDA方法、无监督的PCA-HCA方法等)进行判别分析,根据判别效果优选模型参 数。通过上述三方面的方法集成,建立高效识别转基因与非转基因甘蔗叶样品的方法。为 研发转基因甘蔗叶无损判别技术和相关专用光谱仪器设计提出有效的解决方案。
[0006] 本发明的目的通过下述技术方案实现:一种可见-近红外光谱无损判别的方法, 包括如下步骤:
[0007] (1)测试样品,得到光谱数据和样品类别的测定结果;把全部样品随机分为建模 集和检验集;
[0008] (2)光谱预处理模型的筛选:在所测得的光谱波段中,对所有光谱分别进行不同 模式的SG平滑预处理,得到SG平滑光谱;
[0009] (3)在所得的SG平滑光谱基础上,建立基于主成分分析(PCA)和线性判别分析 (LDA)的定标预测模型,计算预测样品的识别准确率?_1?(:;
[0010] (4)根据P_REC的值筛选最优SG平滑模式;
[0011] (5)用最优SG平滑模式对所有样品光谱进行预处理,进行波长模型筛选,进一步 建立优化波长模型,然后采用光谱判别分析方法,计算识别准确率P_REC ;根据最大P_REC 值获得全局最优模型,建立可见-近红外光谱无损判别的方法。
[0012] 步骤(1)中所述的建模集包括定标集和预测集;
[0013] 步骤⑵中所述的光谱波段为400?2498nm ;
[0014] 步骤(2)中所述的SG平滑的参数包括导数阶数d、多项式次数p和平滑点数m;
[0015] 所述的d优选为0、1、2、3、4或5 ;
[0016] 所述的p优选为2、3、4、5或6 ;
[0017] 所述的m优选为5?51之间的奇数;
[0018] 步骤(5)中所述的波长模型筛选的方法包括连续型波长模型,准连续型波长模型 和离散型波长模型;
[0019] 所述的连续型波长模型优选用移动窗口(MW)方式的连续型筛选方法;
[0020] 步骤(5)中所述的波长模型的参数包括起点波长I和波长个数N ;
[0021] 所述的 I 为 I e {400,402, · · ·,2498};
[0022] 所述的 N 为 N e {1,2, · · ·,50} U {60,70, · · ·,200} U {220,240, · · ·, 860} U {1050};
[0023] 步骤(5)中所述的光谱判别分析方法,包括有监督的光谱判别分析方法和无监督 的光谱判别分析方法;
[0024] 所述的有监督的光谱判别分析方法包括PLS-DA,PCA-LDA等;
[0025] 所述的无监督的光谱判别分析方法包括PCA-HCA等;
[0026] 具体地,一种可见-近红外光谱无损判别具Bt和Bar基因甘蔗叶的方法,包括如 下步骤:
[0027] (1)测试样品,得到可见-近红外漫反射光谱数据和样品类别的测定结果;把全部 样品随机分为建|吴集和检验集;
[0028] (2)光谱预处理模型的筛选:在所测得的光谱波段中,对所有光谱分别进行不同 模式的SG平滑预处理,得到SG平滑光谱;
[0029] (3)在所得的SG平滑光谱基础上,建立基于主成分分析(PCA)和线性判别分析 (LDA)的定标预测模型,计算预测样品的识别准确率?_1?(:;
[0030] (4)根据P_REC的值筛选最优SG平滑模式;
[0031] (5)用最优SG平滑模式对所有样品光谱进行预处理,进行波长模型筛选,进一步 建立优化波长模型,然后采用光谱判别分析方法,计算识别准确率P_REC ;根据最大P_REC 值获得全局最优模型,建立高效识别转基因与非转基因甘蔗叶样品的方法。
[0032] 步骤(1)中所述的建模集包括定标集和预测集;
[0033] 步骤⑵中所述的光谱波段为400?2498nm ;
[0034] 步骤(2)中所述的SG平滑的参数包括导数阶数d、多项式次数p和平滑点数m ;
[0035] 所述的d优选为0、1、2、3、4或5 ;
[0036] 所述的p优选为2、3、4、5或6 ;
[0037] 所述的m优选为5?51之间的奇数;
[0038] 步骤⑷中所述的最优SG平滑模式的参数为d = 1,p = 3, m = 25 ;
[0039] 步骤(5)中所述的波长模型筛选的方法包括连续型波长模型,准连续型波长模型 和离散型波长模型;
[0040] 所述的连续型波长模型优选用移动窗口(MW)方式的连续型筛选方法;
[0041] 步骤(5)中所述的波长模型的参数包括起点波长I和波长个数N ;
[0042] 所述的 I 为 I e {400,402, · · ·,2498};
[0043] 所述的 N 为 N e {1,2, · · ·,50} U {60,70, · · ·,200} U {220,240, · · ·, 860} U {1050};
[0044] 步骤(5)中所述的光谱判别方法,包括有监督的光谱判别分析方法和无监督的光 谱判别分析方法;
[0045] 所述的有监督的光谱判别分析方法包括PLS-DA,PCA-LDA等;
[0046] 所述的无监督的光谱判别分析方法包括PCA-HCA等;
[0047] 步骤(5)中所述的全局最优模型的参数为d = 1,p = 3, m = 25, I = 768nm,N = 28〇
[0048] 本发明相对于现有技术具有如下的优点及效果:
[0049] (1)本发明提出的基于光谱预处理模型筛选、波长模型筛选、光谱判别分析参数筛 选的集成算法,综合了去噪、数据降维、特征提取、分类识别等方面的功能。经过随机抽样检 验,取得了高精度的光谱识别效果,显示了可见-近红外(Vis-NIR)漫反射光谱应用于转基 因甘蔗育种筛查的可行性。
[0050] (2)本发明的方法无需试齐?、无损、准确;且方便、快捷,节约成本;是一种有潜力 的便于应用的检测工具。

【专利附图】

【附图说明】
[0051] 图1是456个甘蔗叶样品的光谱图。
[0052] 图2是对应于不同起点波长I和波长个数Ν的预测识别准确率P_REC的结果图; 其中,图2(a)是不同起点波长I的预测识别准确率P_REC的结果图;图2(b)是不同波长个 数N的预测识别准确率P_REC的结果图。
[0053] 图 3 是最优模型(d = l,p = 3,m = 25,1 = 768,Ν = 28,Ρ(^-Ρ(:3)的检验效果的 结果图。

【具体实施方式】
[0054] 下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限 于此。
[0055] 以下材料在文献"台湾省新台糖(R0C)甘蔗品种介绍.广西农业科 学.1998,5:229-233"中公开:新台糖1号〇?0(:1)、新台糖2号〇?(0)、新台糖3号〇?(0)、 新台糖4号(R0C4)、新台糖20号(R0C20)和新台糖22号(R0C22)。
[0056] 以下材料在文献"甘蔗新品种粤糖00-236配套栽培技术研究.甘蔗糖 业· 2006, 01:1-5, 40" 中公开:粤糖 00-236 号。
[0057] 实施例1
[0058] 本实施例以甘蔗叶的可见-近红外(Vis-NIR)光谱漫反射光谱为例,说明本发明 所提出的基于可见-近红外光谱无损判别具Bt和Bar基因甘蔗叶的方法,包括如下步骤:
[0059] 1.实验材料、仪器和测量方法
[0060] (1)材料:
[0061] 转基因甘蔗材料:以新台糖20号(R0C20)、新台糖22号(R0C22)和粤糖00-236号 为受体的三个品种含有Bt基因和Bar基因的转基因甘蔗株系,共306个(阳性)。
[0062] 非转基因甘蔗材料:新台糖1号(R0C1)、新台糖2号(R0C2)、新台糖3号(R0C3)、 新台糖4号(R0C4)、新台糖20号(R0C20)、新台糖22号(R0C22)和粤糖00-236号共7个 品种的非转基因甘蔗株系,共150个(阴性)。在转基因甘蔗叶样品育种时,采用ELISA方 法对其蛋白质表达进行检测确认,所用试剂盒为美国Agdia公司的BT-CrylAb/lAc试剂盒, 操作按说明书,测试用美国Bio-rad公司的iMark酶标仪。
[0063] 所述的以新台糖20号、新台糖22号和粤糖00-236号为受体的三个品种含有Bt 基因和Bar基因的转基因甘蔗株系的获得方法,参照文献"基因枪法获得转crylAc基因甘 蔗的研究.热带亚热带植物学报.1998, 19(2) : 142-148"中的转基因方法。
[0064] 其中,Bt基因为crylAc基因,植物表达载体pGreen II 0229质粒源自John Innes Centre,该质粒中带有可表达抗膦丝菌素(PPT)和除草剂Basta活性的bar基因。从而,获 得以新台糖20号、新台糖22号和粤糖00-236号为受体的三个品种含有Bt基因和Bar基 因的转基因甘蔗株系。
[0065] (2)样品:
[0066] 取田间种植,处于伸长期甘蔗的+1叶样品共456个,其中具有Bt基因和Bar基因 的转基因甘蔗叶样品(阳性)306个,非转基因甘蔗叶样品(阴性)150个。将样品洗净晾 干,去除叶脉,剪为3?4cm的段,取同一样品的4?6片叶片用于光谱检测。
[0067] (3)仪器与测量方法:
[0068] 光谱仪器为XDS Rapid Content?型近红外光栅光谱分析仪(丹麦F0SS公司)和 圆形漫反射样品附件。光谱扫描范围400?2498nm(包含全近红外区和部分可见光区); 波长间隔2nm ;400?1100U100?2498(nm)波段分别用硅(Si)、硫化铅(PbS)探测器。 [0069] 将样品平铺于圆形漫反射附件中,使叶片完全覆盖光谱仪的探测区域(光斑区)。 每个样品测量三次,三次光谱的均值作为样品光谱数据。实验温度、湿度分别为25土1°C、 46±1% RH。
[0070] 2.定标、预测、检验框架和样品划分体系
[0071] 采用一种严谨的定标、预测、检验框架和样品划分体系。拟从全体样品中随机抽取 部分作为检验样品,它们不参与建模过程;其余的作为建模样品,进一步被划分为定标、预 测集。最后,采用随机选取的不参与建模的检验样品对优选的模型进行检验。
[0072] 本实验采用国际上著名的Kennard-Stone(K-S)划分方法,来划分定标、预测集。 κ-s方法的优点是通过设计适当的算法从全部样品中挑选出一个具有均匀性、能够充分代 表整个样品空间的样品子集作为定标集,使得模型具有客观性和代表性。
[0073] 为了使定标、预测和检验样品集都应包含非转基因(阴性)、转基因(阳性)甘 蔗叶样品,因此采用上述方法,分别将阴性、阳性样品划分到定标集(阳性100个,阴性50 个)、预测集(阳性100个,阴性50个)和检验集(阳性106个,阴性50个)。
[0074] 3.光谱预处理模型的筛选
[0075] 本实验采用国际上著名的Savitzky-Golay (SG)平滑方法,进行光谱预处理。SG方 法能够通过平滑、求导的方式克服光谱数据的基线漂移、倾斜以及高阶噪音干扰,具有多参 数、多模式、适用范围广的优点。
[0076] SG平滑的参数包括导数阶数d(d = 0, 1,2, 3, 4, 5)、多项式次数p(p = 2, 3, 4, 5, 6) 和平滑点数m (5?25之间奇数)。把光谱区间的m个连续点作为一个窗口,用多项式对 窗口内的光谱数据进行最小二乘拟合,确定多项式系数,然后计算窗口中心波长的SG平滑 值。通过窗口移动,得到原光谱的SG平滑谱。
[0077] 考虑到4阶、5阶导数的绝对值偏小,光谱信息损耗过大,故d = 4, 5的SG平滑模 式不作为本文筛选范围。另一方面,考虑到有些实际测量体系可能需要更多的平滑点数,t匕 如测量数据波长间隔小的情形,相邻波长点的数据过于相似,点数少的平滑效果往往不够 好。为了拓宽应用范围,本文将平滑点数m从原有的5?25之间奇数扩充为5?51之间 的奇数。计算所有平滑模式的平滑系数,共264个平滑模式用于本例的筛选。
[0078] 4.连续、准连续、离散型波长模型的筛选
[0079] 波长模型的筛选是光谱信息提取的关键,包括连续、准连续、离散型三大类。本实 验采用国际上著名的移动窗口方式的连续型筛选方法。该方法以N个连续波长的光谱数据 作为一个窗口,通过移动窗口(改变起点波长I)和改变窗口的大小(波长个数N)的方式, 在整个光谱区域内,按照非转基因(阴性)、转基因(阳性)甘蔗叶样品的光谱判别效果进 行筛选。
[0080] 本实施例中选取部分可见光区和全部近红外区(400?2498nm)作为波长筛选范 围,波长间隔2nm,波长个数(N)为1050个,光谱图如图1所示。
[0081] 本实验的具体参数设置如下:I e {400,402, · · ·,2498},N e {1,2, · · ·, 50} U {60,70, · · · ,200} U {220,240, · · · ,860} U {1050}。
[0082] 5.光谱判别分析模型
[0083] 光谱判别分析方法主要分为有监督和无监督两类,有监督的光谱判别方法如 PLS-DA、PCA-LDA等,无监督的光谱判别方法如PCA-HCA等。本实验采用国际上著名的 PCA-LDA 方法。
[0084] (l)PCA
[0085] 选取主成分的个数取决于主成分的累计方差贡献率,通常使用前三个主成分能够 代表原始变量所能提供的绝大部分信息。为了便于模式识别,采用前三个主成分两两组 合的两维主成分模型。具体过程如下:(1)基于定标集光谱的吸光度矩阵进行主成分分析 (PCA),计算相应的载荷矩阵和主成分得分矩阵;(2)选取贡献率最大的前三个主成分(PCp PC 2、PC3),两两组合构成三个主成分平面(并作0-1归一化),即PCi-PQ平面、PQ-PQ平面、 PC2-PC3平面;(3)基于预测集光谱的吸光度矩阵和得到的(定标)载荷矩阵,计算预测集样 品的主成分得分矩阵,并投影到三个主成分平面。
[0086] (2) LDA
[0087] LDA是一种有监督的模式识别方法,它基于样品的转基因类型(阴性、阳性)进行 训练,得到判别模型。本文在PCA分析的基础上进行LDA判别分析,具体过程如下:(1)在每 个主成分平面上,基于定标样品的转基因类型进行线性判别分析,确定最优分类线;(2)基 于得到的预测样品的主成分值和最优分类线,对预测样品的类型(阴性、阳性)进行识别; (3)参照预测样品的真实类型,计算识别率,再根据识别率大小确定最优的主成分组合。
[0088] 6.模型评价指标
[0089] (1)计算所有平滑模式对应的SG平滑谱,对于每个SG平滑谱,分别进行PCA分析, 进一步分别建立PCA-LDA判别模型。
[0090] 计算预测样品的识别准确率(Recognition rate,记为P_REC)如下:
[0091]

【权利要求】
1. 一种可见-近红外光谱无损判别的方法,其特征在于包括如下步骤: (1) 测试样品,得到光谱数据和样品类别的测定结果;把全部样品随机分为建模集和 检验集; (2) 光谱预处理模型的筛选:在所测得的光谱波段中,对所有光谱分别进行不同模式 的SG平滑预处理,得到SG平滑光谱; (3) 在所得的SG平滑光谱基础上,建立基于PCA和LDA的定标预测模型,计算预测样品 的识别准确率P_REC ; (4) 根据P_REC的值筛选最优SG平滑模式; (5) 用最优SG平滑模式对所有样品光谱进行预处理,进行波长模型筛选,进一步建立 优化波长模型,然后采用光谱判别分析方法,计算识别准确率P_REC ;根据最大P_REC值获 得全局最优模型,建立可见-近红外光谱无损判别的方法。
2. 根据权利要求1所述的方法,其特征在于: 步骤(1)中所述的建模集包括定标集和预测集; 步骤(2)中所述的光谱波段为400?2498nm。
3. 根据权利要求1所述的方法,其特征在于:步骤(2)中所述的SG平滑的参数包括导 数阶数d、多项式次数p和平滑点数m ; 所述的d为0、1、2、3、4或5 ; 所述的P为2、3、4、5或6 ; 所述的m为5?51之间的奇数。
4. 根据权利要求1所述的方法,其特征在于: 步骤(5)中所述的波长模型的参数包括起点波长I和波长个数N ; 所述的 I 为 I e {400,402, · · ·,2498}; 所述的 N 为 N e {1,2, · · ·,50} U {60,70, · · ·,200} U {220,240, · · ·, 860} U {1050}。
5. 根据权利要求1所述的方法,其特征在于:步骤(5)中所述的光谱判别分析方法,包 括有监督的光谱判别分析方法和无监督的光谱判别分析方法; 所述的有监督的光谱判别分析方法包括PLS-DA,PCA-LDA ; 所述的无监督的光谱判别分析方法包括PCA-HCA。
6. -种可见-近红外光谱无损判别具Bt和Bar基因甘蔗叶的方法,包括如下步骤: (1) 测试样品,得到可见-近红外漫反射光谱数据和样品类别的测定结果;把全部样品 随机分为建模集和检验集; (2) 光谱预处理模型的筛选:在所测得的光谱波段中,对所有光谱分别进行不同模式 的SG平滑预处理,得到SG平滑光谱; (3) 在所得的SG平滑光谱基础上,建立基于PCA和LDA的定标预测模型,计算预测样品 的识别准确率P_REC ; (4) 根据P_REC的值筛选最优SG平滑模式; (5) 用最优SG平滑模式对所有样品光谱进行预处理,进行波长模型筛选,进一步建立 优化波长模型,然后采用光谱判别分析方法,计算识别准确率P_REC ;根据最大P_REC值获 得全局最优模型,建立高效识别转基因与非转基因甘蔗叶样品的方法。
7. 根据权利要求6所述的方法,其特征在于: 步骤(2)中所述的SG平滑的参数包括导数阶数d、多项式次数p和平滑点数m ; 所述的d为0、1、2、3、4或5 ; 所述的P为2、3、4、5或6 ; 所述的m为5?51之间的奇数。
8. 根据权利要求6所述的方法,其特征在于:步骤(4)中所述的最优SG平滑模式的参 数为 d = 1,p = 3, m = 25。
9. 根据权利要求6所述的方法,其特征在于:步骤(5)中所述的波长模型的参数包括 起点波长I和波长个数N ; 所述的 I 为 I e {400,402, · · ·,2498}; 所述的 N 为 N e {1,2, · · ·,50} U {60,70, · · ·,200} U {220,240, · · ·, 860} U {1050}。
10. 根据权利要求6所述的方法,其特征在于:步骤(5)中所述的全局最优模型的参数 *d=l,p = 3,m=25,I = 768nm,N = 28。
【文档编号】G01N21/31GK104215591SQ201410498422
【公开日】2014年12月17日 申请日期:2014年9月25日 优先权日:2014年9月25日
【发明者】潘涛, 肖青青, 郭昊淞, 陈洁梅, 史本山 申请人:暨南大学

  • 专利名称:一种系统时间偏差辅助多模卫星导航方法技术领域:本发明涉及卫星导航技术领域,尤其是一种系统时间偏差辅助多模卫星导航方法。背景技术:多模卫星导航技术是指把两种或两种以上的卫星导航系统以适当的方式组合在一起,利用其性能上的互补特性,以获
  • 专利名称:基于云计算的城市地下排水管网监测系统的制作方法技术领域:本实用新型涉及一种监测系统,尤其涉及一种基于云计算的城市地下排水管网监测系统。背景技术:城市排水系统是城市建设、环境保护、防洪排涝的重要基础设施,建立城市排水管网水位信息监测
  • 专利名称:基于mems技术的变压器油中溶解气体定量检测装置的制作方法技术领域:本实用新型涉及一种电力变压器油中溶解气体检测装置,尤指一 种基于MEMS技术的变压器油中溶解气体检测装置。背景技术:变压器油中溶解气体分析已被世界各国公认为是监测
  • 专利名称:可检测人体的节能型壁扇的制作方法技术领域:本实用新型涉及一种可检测人体的节能型壁扇,属于家电技术领域。 背景技术:壁扇属于传统简单电器,在一些场所,比如医院、会议室、商场等场所应用很广泛。 但是,壁扇几乎没有什么智能功能,在使用者
  • 专利名称:一种椭圆套筒式钢丝绳张力检测装置的制作方法技术领域:本实用新型涉及一种椭圆套筒式钢丝绳张力检测装置,尤其适用于圆股钢丝绳的张力检测。背景技术:钢丝绳作为提升、牵引、承载机构的关键组成部分,广泛应用于矿井提升、桥梁悬吊、架空索道等场
  • 专利名称:机械钻机绞车扭矩检测装置的制作方法技术领域:本实用新型属石油工程钻井装备技术领域,涉及一种扭矩检测装置,尤其涉及一种机械钻机绞车扭矩检测装置。背景技术:石油钻井用机械钻机通常配备3台柴油机,通过链条并车箱或联动机并车之后驱动绞车、
山东科威数控机床有限公司
全国服务热线:13062023238
电话:13062023238
地址:滕州市龙泉工业园68号
关键词:铣床数控铣床龙门铣床
公司二维码
Copyright 2010-2024 http://www.ruyicnc.com 版权所有 All rights reserved 鲁ICP备19044495号-12