专利名称:一种素片干燥过程的定性分析方法
技术领域:
本发明属于药物制剂领域,具体涉及一种素片干燥过程的定性分析方法。
背景技术:
直接压制而成的片剂,若其药物性质不稳定、有不良气味、对胃有刺激,或易被胃 液破坏等,通常还需要在其表面上包一层辅料,使片内药物与外界隔离,从而进一步保证片 剂质量。在药物制剂领域中,通常将未覆盖包衣层的片剂称为素片。素片的含水量是影响片剂质量的重要因素之一。对于糖衣片,如果素片含水量过 高,则水分容易渗入到粉衣层,糖衣片由内向外逐步渗透吸湿,糖衣层潮解易造成隔离作用 减弱,甚至发生吸潮霉变或胀片爆裂的现象。如果素片水分过少,则素片的硬度会较差,在 滚转时易引起素片的破碎或片粉的脱落。如果素片的水分分布不均勻,则会造成糖衣层的 局部隔离层潮解,进而导致出现花斑现象。因此,在素片干燥过程中及时监测其含水量是十分必要的。目前,素片水分测定的 药典方法为干燥失重法,该方法的分析时间较长,且具有破坏性,不适用于工业现场的在线 分析。而近红外光谱技术能够无损快速地测定素片的含水量,可用于快速检测。曾有文献 报道过,运用近红外光谱技术来控制样本水分取得了较满意的结果。但是,现有技术并没有提供关于工业现场在线分析素片含水量的任何方法,也没 有提供关于在素片干燥过程中在线监测和/或反馈其含水量是否合格的任何方法。
发明内容
发明目的为了解决上述技术问题,并实现在素片干燥过程中在线监测和/或反馈其含水量 是否合格的目的,本发明提供了一种素片干燥过程的定性分析方法。技术方案为了实现上述目的,本发明提供了一种素片干燥过程的定性分析方法,该方法包 括以下步骤(1)采集光谱提供素片含水量合格与不合格的批量样本,采集各样本的近红外 光谱数据,其中所述近红外光谱数据均为全波长数据,即NIR光谱扫描范围为4,000 10,OOOcnr1 ;(2)变量筛选使用主成分分析法对全部样本的近红外光谱数据进行波段的选 择,筛选出与素片水分相关性大的波段;(3)光谱预处理对步骤(2)中所选出波段的光谱数据进行预处理,以增强有效信 号并提高信噪比;(4)选取训练集样本使用KS法选取步骤⑶中所有近红外光谱数据中的一部分 作为训练集样本,将上述数据中的另一部分作为预测集样本;(5)建立并评价定性模型使用步骤(4)中训练集样本的数据通过支持向量机(SVM)法建立定性模型,然后使用上述定性模型对步骤(4)中的预测集样本进行含水量监 测,以此评价所建的定性模型;和(6)使用上述定性模型对其它素片样本的含水量进行监测。具体地,在上述变量筛选步骤(步骤(2))中,使用主成分分析法进行光谱波段的 选择。主成分分析法是将原始指标重新组合成一组新的互相无关的综合指标(主成分)来 代替原始指标,同时根据实际需要从中选取几个尽可能保留原始指标的信息、且互不相关 的主成分的过程。确定主成分的个数是其中的关键环节。本发明提供的方法采用交叉验证 准确率来考察模型性能。随着主成分个数的增加,模型的交叉验证准确率增大,当主成分个 数达到一定数值时,模型的交叉验证准确率达到最大值。选择与这些主成分相关的波段作 为建模波段,不仅可以剔除不相关的波段,并且可以大大简化模型,从而实现压缩变量的目 的,并提高模型的学习精度与预测能力。在该步骤中,选择波段的依据是NIR谱图上既包括有用信息也包括干扰信息,全 谱建模由于干扰信息的存在不仅使运算时间增加,同时还会使定性模型的预测精度降低。 优选的波段就是那些包含大量丰富的有用信息,而噪音等干扰信息影响较小的波段。主成 分分析法的原理是对全谱建立主成分模型,选出特征信息量最丰富且对两组样本的区分度 最大的波段。在上述光谱预处理步骤(步骤(3))中,对不同的预处理方法进行了优化组合,并 对预测结果进行比较,最终确定预处理方法选自标准化法、均值中心化法、多元散射校正法 及其组合中。例如,可以是其中的一种或者两种及两种以上的组合。优选为标准化法与多 元散射校正法的组合。在上述选取训练集样本步骤(步骤(4))中,使用KS法进行训练集样本的选择。即 将所有的样本都看作训练集候选样本,用每个样本的自变量计算样本之间的欧氏距离,在 选择下一个候选样本进入训练集之前要求被选入的样本与已经选入训练集的样本之间的 欧氏距离最大,并基于此选取部分样本作为训练集样本,使之与作为预测集的剩余部分样 本有相同的或相近的空间分布。与随机选取法相比,KS法选取的训练集更具代表性,有利 于得到外推能力更强的模型。优选地,取所有样本的2/3作为训练集样本,1/3作为预测集 样本。在上述建立并评价定性模型步骤(步骤(5))中,支持向量机(SVM)法的核函数为 径向基核函数;其中,使用k折交叉验证准确率来确定径向基核函数的惩罚因子C和参数 Y。优选地,使用网格搜索法结合k折交叉验证准确率来确定径向基核函数的惩罚因子C 和参数Y。SVM法以训练误差作为优化问题的约束条件,置信范围值最小化作为优化目标, 即采用结构风险最小化准则的学习方法,提高了模型的泛化能力。有益效果本发明提供的方法通过结合近红外光谱、主成分分析法和支持向量机法等方法快 速建立了素片含水量定性模型,实现了对素片含水量合格与否的快速评价,并且监测准确 率基本达到了工业生产的要求。相对于传统方法或经验判断,本发明提供的定性分析方法 能够实现在素片干燥过程中快速、无损、可靠、准确地在线监测和/或反馈其含水量是否合 格的目的。本发明提供的方法以支持向量机(SVM)法为建模基础,结合KS法以保证总体样本的广泛性与代表性,结合主成分分析法以保证各个样本的有效性与合理性,并通过对光谱 的预处理进一步降低无关信息的干扰,最终获得预测能力良好的模型。
图1为本发明实施例1的步骤(1)中各乳块消素片样本的近红外原始光谱图;图2-1为本发明实施例1的步骤(2)中前六个主成分与吸收波长之间的相互关系 的图;图2-2为本发明实施例1的步骤(2)中后六个主成分与吸收波长之间的相互关系 的图;图3-1为本发明实施例1的步骤(3)中优选波段的近红外原始光谱图;图3-2为图3-1中的光谱经标准化法处理后样本的近红外光谱图;图3-3为图3-1中的光谱经均值中心化法处理后样本的近红外光谱图;图3-4为图3-1中的光谱经多元散射校正法处理后样本的近红外光谱图;图3-5为图3-1中的光谱经多元散射校正-标准化法处理后样本的近红外光谱 图;图3-6为图3-1中的光谱经多元散射校正-均值中心化法处理后样本的近红外光 谱图;图4为本发明实施例1的步骤⑷中经KS法选取的训练集样本和预测集样本在 主成分空间的分布情况示意图,其中1为训练集样本,2为预测集样本;图5-1为本发明实施例1的步骤(5)中经网格搜索后的计算结果示意图;图5-2为本发明实施例1的步骤(5)中使用支持向量机法建立定性模型的参数C 和Y的优化过程示意图;以及图5-3为本发明实施例1的步骤(5)中乳块消素片在干燥过程中的含水量分布 图,其中〇表示未干燥样品的含水量, 表示样品干燥65min后的含水量;□表示样品干燥 150min的含水量,V表示样品干燥235min的含水量,★'表示样品干燥360min的含水量。
具体实施例方式本发明提供的定性分析方法可以应用于各种不同的药物制剂中所包括的素片,并 且不受包衣类型(如糖衣或薄膜包衣)的限制。下文,将以乳块消素片(中成药)为例,举例说明本发明提供的定性分析方法。应 该理解,下述优选实施方式只是对本发明进行的例证性说明,并不会限制本发明。实施例11 仪器Antaris傅立叶变换近红外光谱仪(美国Thermo Nicolet公司制造)配有InGaAs 检测器、积分球漫反射采样系统、Result操作软件和TQ Analyst V6光谱分析软件。2NIR扫描条件采用积分球漫反射采样系统,NIR光谱扫描范围4,OOOcnT1 10,OOOcnT1 ;扫描次 数32 ;分辨率ScnT1 ;以内置背景为参照。3数据处理及软件
本实施例使用主成分分析法选择波段,对光谱进行适当的预处理,使用KS法选取 训练集样本和预测集样本,并使用SVM法建立近红外光谱的定性模型,使用训练集k折交叉 验证(k-fold cross-validation)准确率来确定径向基核函数的参数Y和惩罚因子C,模 型的学习精度和预测能力分别用训练集交叉验证准确率和预测集交叉验证准确率进行考 察。其中,所述训练集交叉验证准确率是这样获得的将训练集分为k份,其中k-Ι份作为 训练数据集,训练得到模型,而另外的1份作检验,计算准确率;这样重复η次,选取准确率 最高的模型,该准确率即为训练集交叉验证准确率,此值表征的是模型拟合的好坏。本实施例使用的是台湾大学林智仁教授编制的支持向量机软件libsvm-2. 89 (参 JAL, Chih-Chung Chang, Chih-Jen Lin, LIBSVM -.a library forsupport vector machines, 2001, http://www. csie. ntu. edu. tw/ cjlin/libsvm),PCA 工具包使用的是由N0rgaard 等人提供的网络共享(http://www. models, kvl. dk/source/iToolbox/),SPXY 法由 Galvao提供(参见,Roberto Kawakami Harrop Galvao, Mario Cesar Ugulino Araujo, Gledson Emidiojose,et al. A method for calibration and validation subset partitioning [J], Talanta, 2005,67 :736_740),采用 MATLAB 7. 1 软件工具(Mathwork Inc.)计算。步骤(1)采集光谱由“北京中医药大学药厂”提供210个乳块消素片样本。使用Antaris傅立叶变换近红外光谱仪采集上述各样本的近红外光谱数据,全部 样本的数据如图1所示。如图1所示,各样本的原始光谱图严重重叠,无法直接区分出合格 和不合格样本,需要进一步的数据分析。步骤⑵变量筛选本发明使用主成分分析法,以原始光谱数据为输入数据,以交叉验证准确率为指 标,筛选出与素片含水量相关的变量。下表1给出了主成分分析的结果,前两个主成分的方差贡献率达到95%以上,可 以很好地表征原始光谱的整体信息,但其建模效果却不理想。究其原因,样本之间的差异主 要是由于水分和水分相关的性质引起的,但也存在部分差异来自于其它性质,如化学成分 的含量。从图2-1中可以看出,第一个主成分与所有波长点关系均较为密切,故可能是因为 包含了很多干扰信息,造成交叉验证准确率较低。进行主成分分析时,仅是针对光谱数据进行的分析,不考虑因变量的影响,这增加 了出现较大偏差的风险。采用主成分分析法处理数据,减少了测量噪声和共线性的信息,但 没能把专属于目标性质的信息有效地提取出来。为了能够获得仅与水分或含水量有关的光 谱信息,对12个主成分与吸收波长之间的关系做了进一步的分析。水分是影响样本光谱信 号的首要因素,波长与主成分的相关系数越大,其与水分有关的可能性越大。从图2-1和 2-2中可以看出,与12个主成分相关系数最大的波长是4004 ^STcnr1JUS 4126CHT1, 4250cm-1,4319 4339CHT1,4405 4493CHT1,4921 4925CHT1,4933cm-1,4936cm-1,4952cm-1, 5064 5238CHT1,5762 5789CHT1,6977 7035CHT1,这些波长是影响综合指标的主要因素, 用上述波段建模,交叉验证准确率达到94. 29%。与文献报道(《近红外光谱解析实用指南》, Practical Guide tolnterpretive Near-Infrared Spectroscopy,Jerry Workman,Ji.禾口 Lo i s Weyer编著,褚小立、许育鹏、田高友译,化学工业出版社,2009年10月,57 62页)相比,5064 5238cm-1和6977 7035cm-1可能属于水分的响应区,仅以5064 5238cm-1 和6977 7035cm—1建模,交叉验证准确率88. 10%,其它的波段有助于提高分类的准确性, 故推测可能反映的是受水分影响的性质的信号。
表1 各样本的近红外原始光谱主成分分析的结果
权利要求
一种素片干燥过程的定性分析方法,该方法包括以下步骤(1)采集光谱提供素片含水量合格与不合格的批量样本,采集各样本的近红外光谱数据,其中所述近红外光谱数据均为全波长数据;(2)变量筛选使用主成分分析法对全部样本的近红外光谱数据进行波段的选择,筛选出与素片水分相关性大的波段;(3)光谱预处理对步骤(2)中所选出波段的光谱数据进行预处理,以增强有效信号并提高信噪比;(4)选取训练集样本使用KS法选取步骤(3)中所有近红外光谱数据中的一部分作为训练集样本,将上述数据中的另一部分作为预测集样本;(5)建立并评价定性模型使用步骤(4)中训练集样本的数据通过支持向量机法建立定性模型,然后使用上述定性模型对步骤(4)中的预测集样本进行含水量监测,以此评价所建的定性模型;和(6)使用上述定性模型对其它素片样本的含水量进行监测。
2.根据权利要求1所述的方法,其中,在步骤(3)中,所述预处理的方法选自标准化法、 均值中心化法、多元散射校正法及其组合中。
3.根据权利要求2所述的方法,其中,在步骤(3)中,所述预处理的方法为标准化法与 多元散射校正法的组合。
4.根据权利要求1所述的方法,其中,在步骤(4)中,使用KS法选取步骤(3)中所有近 红外光谱数据中的2/3作为训练集样本,上述数据中的另1/3作为预测集样本。
5.根据权利要求1所述的方法,其中,在步骤(5)中,所述支持向量机法的核函数为径 向基核函数。
6.根据权利要求5所述的方法,其中,使用k折交叉验证准确率来确定径向基核函数的 惩罚因子C和参数Y。
7.根据权利要求6所述的方法,其中,使用网格搜索法结合k折交叉验证准确率来确定 径向基核函数的惩罚因子C和参数Y。
全文摘要
本发明属于药物制剂领域,具体涉及一种素片干燥过程的定性分析方法。本发明提供的方法通过结合近红外光谱、主成分分析法和支持向量机法等方法快速建立了素片含水量定性模型,实现了对素片含水量合格与否的快速评价,并且监测准确率基本达到了工业生产的要求。相对于传统方法或经验判断,本发明提供的定性分析方法能够实现在素片干燥过程中快速、无损、可靠、准确地在线监测和/或反馈其含水量是否合格的目的。
文档编号G01N21/25GK101957311SQ201010281770
公开日2011年1月26日 申请日期2010年9月13日 优先权日2010年9月13日
发明者乔延江, 史新元, 宰宝禅 申请人:北京中医药大学