山东科威数控机床有限公司铣床官方网站今天是:2025-05-06切换城市[全国]-网站地图
推荐产品 :
推荐新闻
技术文章当前位置:技术文章>

用于靶向细胞(系)选择的快速方法

时间:2025-05-06    作者: 管理员

专利名称:用于靶向细胞(系)选择的快速方法
用于靶向细胞(系)选择的快速方法本发明涉及用于预测样品细胞的细胞培养性能数据的方法、用于分离所述细胞的方法和用于预测样品细胞的细胞培养性能数据的装置。根据现有技术,用于分离具有所需制造性质的重组哺乳动物细胞系的方法在来源和分离具有所需特征的特异性组合的能力两方面有所不足。例如,Adrichem等人(Anal.Chem., 1998, 70, 923-930)公开了通过基质辅助激光解吸/电离质谱法(MALDI质谱法)研究培养上清液中的蛋白质图谱和哺乳动物细胞。所述MALDI质谱法可用于通过监控已分泌至培养基中或位于细胞溶解产物中的蛋白质进行蛋白质分析(protein profiling)。MALDI质谱法可检测的质量范围为16000至几十万道尔顿,优选由几百至几千道尔顿。由此获得的结果与标准SDS-PAGE电泳法互补。因此,这些方法可用于例如监控表达IgG型抗体的杂交瘤细胞的大规模培养。Zhang 等人(J.Am.Soc.Mass Spectrom., 2006, 17, 490-499)公开了 使用MALD1-T0F和LC-ES1-MS/MS质谱法识别哺乳动物细胞系。其描述了 MALD1-T0F质谱法可以直接由单细胞进行有效的肽分析。LC-ES1-MS/MS分析可以在胰蛋白酶消化样品细胞后提供有用的序列信息。人们发现该分析产生了独特和可再现的MALD1-MS图谱,这可用作识别和区分测得的不同细胞系的指纹特征。但是,在清晰可见的MS峰基础上,通过肉眼比较获得的MS谱以区分三种不同的哺乳动物细胞类型。或者,Zhang等人示范了一种不同的技术——液相色谱法后接着进行电喷雾电离-串联质谱法的结合(LC-ESI MS/MS),为此必须消化该样品——也可用于阐明蛋白质组特性差异。Feng等人(Rapid Commun.Mass Spectrom., 2010, 24, 1226-1230)公开了使用基质辅助激光解吸/电离飞行时间(MALD1-T0F)进行高/低产CHO细胞的快速表征。其中公开的方法能够通过使用两种统计方法(即主成分分析(PCA)和线性偏最小二乘法(PLS))分析该MALD1-T0F图谱,在相同规模下在相同培养基中生产时区分高产和低产细胞。特别地,Feng等人的方法能够区别以相同规模(即低规模下生长)生产重组蛋白质IFN-Y的不同细胞系之间的生产率数据。根据Feng等人,这种方法有可能用于预测细胞生产率。所用线性PLS的用处来自于分析具有许多变量的数据的能力,所述数据与寻找给定规模的细胞系亚族有关。如上所述,现有技术的方法(尤其是Feng等人的方法)仅教导了通过统计程序(即PLS和PCA)分析的MALD1-T0F数据可用于在给定的培养规模下区分低产和高产细胞。但是,现有技术未能教导当未知细胞仍在培养基中以低量培养时,预测这些细胞在放大规模的后期阶段(特别是在大体积生物反应器中)的细胞特征的方法。特别是已知的PCA和PLS的统计学程序产生的数据不足以用作精确和可靠地预测放大规模的后期阶段的细胞特性的基础。在早期阶段表达蛋白质特定平衡的细胞系可以在这一阶段表现出例如高生产率,但是在放大规模至生物反应器阶段后,这种生产率会因不同的因素而下降,所述因素尤其是剪切力、体积效应、不同的发酵罐类型或格式、培养参数,例如PH,以及气体控制的细胞密
度差异等。
因此,需要能够快速筛选处于细胞系发展早期并仅在小体积中培养的大量细胞系的方法,该方法能够预测在给定和所需培养规模(特别是生物反应器规模,这意味着大体积规模)下所述细胞的生长和特定的生产特性,例如提高的体积生产率。由此,本发明所解决的技术问题在于提供克服上述难题的方法,特别是提供一种在放大规模的早期预测具有未知细胞特性的细胞的细胞培养(特别是生物反应器)性能的方法,该方法能够额外地节约时间并降低成本,并在大体积规模培养中和/或在高生产率条件下,特别是在生物反应器规模下对所述性能具有高的预测准确度。 通过本发明的独立权利要求解决该问题。由此,本发明提供了用于预测至少一种样品细胞的细胞培养性能数据的方法,优选为体外方法,所述方法包括以下步骤:a)提供至少一种样品细胞的探针(所述样品细胞的探针优选在小体积的培养基中培养)、来自标准细胞的细胞培养性能数据和来自标准细胞的原始标准MS (质谱法)数据,b)对所述至少一种样品细胞的探针施以MS分析以获得其原始样品MS数据,c)对所述原始标准和原始样品MS数据施以至少一种第一MS信号处理法以获得预处理过的标准和样品MS谱(profiles),并d)对来自步骤a)的标准细胞的细胞培养性能数据和步骤c)中获得的预处理过的样品与标准MS谱施以第二 MS信号处理法,所述第二 MS信号处理法优选包括施以基于PLS-DA(偏最小二乘法-判别分析)的比较评估的数据分析,由此预测所述至少一种样品细胞的细胞培养性能数据。本发明因此提供一种用于精确可靠地预测具有未知的细胞培养(优选生物反应器)性能数据的至少一种样品细胞的细胞培养(优选生物反应器)性能数据的有利方法,该方法能够节约时间并降低成本地预测特定细胞培养(优选生物反应器)性能数据,如细胞的生产率。本发明不仅提供此类有利的方法,还提供了通过所述方法制备,特别是分离的细胞,其中所述细胞特别由所需的细胞培养(优选生物反应器)性能数据,如高生产率来表征。此外,本发明提供了能够实施本发明方法的用于预测细胞培养性能数据的装置。与通常首先由96孔板放大规模至24孔板,随后至振荡培养瓶并最后至生物反应器规模的现有技术不同,本发明省略了在24孔板中和在振荡培养瓶中的培养步骤。在预测以低体积,例如在96孔板中培养的至少一种样品细胞的细胞培养(优选生物反应器)性能数据后,可以直接进行在生物反应器中的培养。根据本发明,该PLS-DA允许在一个变量的基础上分离非常特定的观察类别,使得使用PLS-DA克服了细胞系的生产率分级的问题,并可以预测它们在不同规模下的细胞培养(优选生物反应器)性能。在本发明的上下文中,该细胞培养性能数据优选为生物反应器性能数据。在本发明的上下文中,术语“至少一种样品细胞的探针”具有与术语“至少一种样品细胞的样品”相同的含义。在本发明的上下文中,术语“生物反应器性能数据”理解为是指当所述细胞在大体积条件和/或高生产率条件下,特别是在生物反应器中培养或繁殖时对于细胞行为与特性的平均数据。该生物反应器性能数据优选是个体和特定细胞的特定细胞产物(例如蛋白质,特别是抗体、抗体片段或融合抗体、抗生素)的生产率、培养要求、所述细胞的生长或寿命的数据。在优选的实施方案中,该细胞产物是蛋白质(特别是抗体)、肽、蛋白聚糖、糖蛋白、碳水化合物、脂质、抗生素或激素。术语“标准细胞”指的是具有已知的细胞培养性能数据的细胞,特别是在给定规模下,优选在大体积规模和/或在高生产率条件下,特别是在生物反应器规模下的已知特性和行为。这些已知特性可以通过现有技术的方法测量和分析。例如,细胞生产率可以通过ELISA(酶联免疫吸附剂测定)测定。在本发明的上下文中,术语“样品细胞”涉及具有至少一种未知的细胞培养性能数据(特别是细胞特性)的细胞。优选地,所述样品细胞的至少一种特性是已知的。在本发明的上下文中,术语“低体积培养基”指的是该培养基的体积为优选I微升至100升,优选I微升至90升,优选I微升至80升,优选I微升至70升,优选I微升至60升,优选I微升至50升,优选I微升至40升,优选I微升至30升,优选I微升至20升,优选I微升至10升,优选I微升至5升,优选I微升至4升,优选I微升至3升,优选I微升至2升,优选I微升至I升,优选I微升至0.5升,优选I微升至0.4升,优选I微升至0.3升,优选I微升至0.2升,优选I微升至0.1升,优选I微升至90毫升,优选I微升至80毫升,优选I微升至70毫升,优选I微升至60毫升,优选I微升至50毫升,优选I微升至40毫升,优选I微升至30毫升,优选I微升至20毫升,优选I微升至10毫升,优选I微升至5毫升,优选I微升至4毫升,优选I微升至3毫升,优选I微升至2毫升,优选I微升至I毫升,优选I微升至999微升,优选I微升至0.5毫升,优选I微升至0.4毫升,优选I微升至0.3毫升,优选I微升至0.2毫升,优选I微升至0.1毫升,优选I微升至50微升,优选I微升至40微升,优选I微升至30微升,优选I微升至20微升,优选I微升至10微升,优选20至90微升,优选20至80微升,优选20至70微升,优选20至60微升,优选20至50微升,优选20至40微升,优选20至30微升,优选30至70微升,优选30至60微升,优选30至50微升,优选30至40微升,优选10至100微升,优选10至90微升,优选10至80微升,优选10至70微升,优选10至60微升,优选10至50微升,优选10至40微升,优选10至30微升,优选10至20微升,优选40至60微升,优选40至50微升。在本发明的上下文中,术语“扩大规模的早期阶段”理解为在如上文定义的低体积培养基中培养细胞的时间点。在本发明的上下文中,术语“生物反应器”指的是能够包含用于制造至少一种所需细胞产物的细胞的容器,所述容器优选能够获得在所述所需细胞产物的生产速度和/或量方面的高生产率。在特别优选的实施方案中,该生物反应器是支持生物活性环境的装置或系统。在特别优选的实施方案中,本发明的生物反应器是适于工业和商业制造所述目标细胞产物的容器。在特别优选的实施方案中,此类容器能够创造适于以高生产率制造目标细胞产物的细胞培养条件。在特别优选的实施方案中,该生物反应器包含至少10升、至少20升、至少50升、至少100升、至少200升、至少300升、至少400升、至少500升、至少600升、至少700升、至少800升、至少900升、至少1000升、特别是至少2000升、至少3000升或至少4000升体积的培养基,其优选如本文中所用那样称为“大体积”或“大体积培养基”。在本发明的上下文中,用于两个元素之间的用语“和/或”意在描述由所述术语连接的两个元素以合并或择一方式提及。由此,用语“A和/或B”包括含义“A或B”和“A和B”,这意味着“A、B或二者的任一种”。由此,本发明提供一种方法,所述方法使得本领域技术人员能够预测至少一种样品细胞(尤其是至少一种细胞系)的特性,所述方法包括在第一步骤a)中提供培养在具有低体积和低细胞浓度(优选IO4至IO8个活细胞/毫升培养基)的培养基中的至少一种样品细胞的探针,标准细胞的细胞培养性能数据及其原始标准MS数据。随后在第二步骤中,通过质谱法对至少一种样品细胞进行分析。在第三步骤中,通过MS信号处理法处理所述至少一种样品细胞和标准细胞的原始MS数据,以便获得所述至少一种样品细胞和标准细胞的预处理过的MS谱。在第四步骤中,对来自标准细胞的细胞培养性能数据和预处理过的样品和标准MS谱施以统计方法,即PLS-DA,优选与PCA结合。该统计程序用于比较和评估样品细胞的预处理过的MS谱对标准细胞的预处理过的MS谱。在本发明的优选实施方案中,在步骤a)中提供至少一种样品细胞的样品以施以MS分析,以便在步骤b)中获得其原始样品MS数据。术语“至少一种样品细胞的探针”和术语“至少一种样品细胞的样品”指的是规定数量的样品细胞,即至少一种样品细胞。优选地,在步骤a)中在低体积培养基中提供该样品,并施以MS分析以获得其原始样品MS数据。在本发明的优选实施方案中,该细胞的浓度(优选在样品中)在完成培养后为IO4至108、IO5至107、特别是IO6至IO7个活细胞/毫升培养培养基。本发明能够预测在扩大规模的早期阶段培养的至少一种样品细胞的细胞培养(优选生物反应器)性能数据,例如生产率。本发明的方法允许快速开发例如高生产率细胞系,并由此降低治疗用蛋白质制造的成本和加速药物的开发。本方法提供新型筛选工具,用于优选在产物开发周期的早期,即在使用具有优选I至999微升体积的培养培养基的阶段识别,特别是在大规模生物反应器中,特别是在包含体积大于10升的培养培养基的生物反应器中具有所需性质(例如为高体积生产率)的细胞,优选细胞系。此外,本发明的方法改善了在研发早期发现具有特定细胞特性的细胞(尤其是细胞系)的可能性,所述特定细胞特性例如包含高产物生产率,优选至少I克/升、优选至少5克/升和最优选10克/升。除了识别有用的细胞(优选细胞系),该方法还可优选用于分离具有性质(例如治疗性蛋白质制造、尤其是单克隆抗体制造)改善的新的宿主细胞,优选细胞系。特别地,通过结合MS分析与PLS-D A的统计方法,优选通过结合PLS-DA与PCA(主成分分析),本发明的方法能够识别不同产物生产率水平的模式,以便以快速和(如果可用的话)自动方式由此预测不同规模下的生产率。在本发明的优选实施方案中,该细胞单位生产率,优选该细胞的高产物生产率为至少0.1克/升/小时,优选至少I克/升/小时,优选至少5克/升/小时,优选至少10
克/升/小时和最优选10克/升/小时。发现高生产率细胞(优选细胞系)的高可能性的前景在于减少在识别适于制造的细胞之前需要筛查的细胞(优选细胞系)的数量。通过减少筛查的细胞(优选细胞系)的数量,减少了所需的材料。因此,在细胞(优选细胞系)构造过程中需要较少的资源,并相伴生成较少的废料。更高生产细胞(优选细胞系)将减少供应该产品的市场需求所需的生物反应器培养的数量。本发明的方法能够减少生产过程的原材料需求,特别是成本,尤其是用作原材料和用于设备的清洁与卫生处理的水。在本发明的优选实施方案中,该细胞培养性能数据,优选该生物反应器性能数据反映了大体积下该细胞,优选该样品细胞和/或该标准细胞的性能。在本发明的优选实施方案中,该细胞培养(优选生物反应器)性能数据是细胞单位生产率、整体活细胞计数或细胞产物浓度,特别是细胞单位生产率、整体活细胞计数或细胞产物浓度数据。在特别优选的实施方案中,该细胞培养(优选生物反应器)性能数据是细胞单位生产率(qP)。在特别优选的实施方案中,该细胞培养(优选生物反应器)性能数据是整体活细胞计数数据(IVC)。在特别优选的实施方案中,该细胞培养(优选生物反应器)性能数据是细胞产物浓度数据。在本发明的优选实施方案中,该细胞产物浓度数据是细胞产物的效价(titre)数据。术语“效价”指的是通过滴定法测定的培养基(优选细胞培养基)的浓度,优选为在生物反应器中的浓度。在本发明的优选实施方案中,细胞生产稳定性方面的数据不被认为是细胞培养性能数据。在本发明的优选实施方案中,该样品细胞和/或标准细胞选自人细胞系、动物细胞系、植物细胞系、抗体、来自真菌的细胞、来自细菌的细胞、来自酵母的细胞和干细胞。在本发明的优选实施方案中,该样品细胞与该标准细胞均选自相同的细胞类型,尤其是相同的细胞系或细胞株。在本发明的优选实施方案中,该样品细胞是CHO细胞系,优选CHO-Kl细胞系,优选修饰过的CHO-Kl细胞系。在本发明的优选实施方案中,该标准细胞也为CHO细胞系,优选CHO-Kl细胞系(ATCC编号:CCL-61 ),优选修饰过的CHO-Kl细胞系。CHO-Kl细胞系是亲本CHO细胞系的亚克隆,其衍生自成年中国仓鼠的卵巢。CHO-Kl细胞因缺少合成脯氨酸的基因,在谷氨酸转化为谷氨酰胺Y-半醛的步骤中发生生物合成链中的阻断而需要脯氨酸。在本发明的优选实施方案中,至少一部分、优选所有的标准细胞与至少一种样品细胞相比表达不同的细胞产物,优选蛋白质,优选抗体。在本发明的优选实施方案中,至少一部分,优选所有标准细胞的细胞系构建(construction)不同于所述至少一种样品细胞的细胞系构建。在本发明的优选实施方案中,步骤b)中使用的MS分析选自MALD1-T0F、LC-ES1-MS (液相色谱-电喷雾电离-质谱法)和LC-ES1-MS/MS (偶联到具有电喷雾电离的串联质谱法的液相色谱法)。在本发明的优选实施方案中,步骤b)中使用的MS分析是MALD1-T0F。施以MALD1-T0F的样品细胞无需被例如胰蛋白酶消化,而是可以通过非常简单的细胞制备以完整形式嵌入到基质中。在本发明的优选实施方案中,步骤b)中使用的MS分析是LC-ES1-MS。LC-ES1-MS分析可以在生产率、生长和其它合意特性方面特别显著地区分细胞系。该LC-ES1-MS分析提供其他方面的信息。在本发明的优选实施方案中,通过选自MALD1-TOF、LC-ES1-MS和LC-ES1-MS/MS,优选MALD1-T0F的MS分析获得原始标准MS数据。在本发明的优选实施方案中,以根据设备具体参数(例如为设备依赖性的,具有或不具有质量抑制(mass suppression)和脉冲离子提取)优化的负或正反射模式或以正或负线性模式进行用于MALD1-TOF MS或LC-ES1-MS的离子化。在本发明的优选实施方案中,MALD1-T0F质谱仪设备的下列设定用于本发明的方法:极性:+ve抑制,于:IOOODa (道尔顿)范围:1000至 50000Da在本发明的优选实施方案中,在MALD1-TOF和LC-ES1-MS的MS分析过程中的质量抑制为低于500Da,优选低于IOOODa并最优选低于1500Da。在本发明的优选实施方案中,在MALD1-TOF和LC-ES1-MS的MS分析过程中的质量抑制为高于500Da,优选高于IOOODa并最优选高于1500Da。在本发明的优选实施方案中,在MALD1-TOF和LC-ES1-MS的MS分析过程中的检测范围为 200 至 lOOOOODa,优选 200 至 60000Da,优选 500 至 50000Da,优选 1000 至 lOOOOODa,1000 至 18000Da,优选 500 至 lOOOODa,最优选 200 至 8000Da。在本发明的优选实施方案中,在施以MS分析,优选施以MALD1-T0F之前洗涤至少一种样品细胞,优选用缓冲溶液洗涤。在本发明的优选实施方案中,在施以MS分析,优选施以MALD1-T0F之前单独用磷酸盐缓冲的盐水(PBS)洗涤至少一种样品细胞,或接着进行蔗糖水溶液洗涤步骤,所述蔗糖水溶液特别含有0.2至0.7M,优选0.3至0.5M,优选0.35M的蔗糖。在本发明的优选实施方案中,用于MALD1-T0F分析的基质是芥子酸(SA)。根据本发明,使用芥子酸(SA)作为MALD1-TOF MS分析基质提供具有特别宽的峰范围的有利光谱,所述范围优选高至70kDa,并且分辨率特别高。在本发明的另一实施方案中,2,5-二羟基苯甲酸(DHB)也可用作基质。在本发明的优选实施方案中,步骤b)中处理的至少一种样品细胞的探针包含不超过IX IO6个细胞,优选0.015 X IO6至0.0625 X IO6个细胞,特别为0.03 X IO6个细胞。在本发明的优选实施方案中,在低温下,例如在O至10°C、优选2至8°C、特别是在4°C下驯化(acclimatisation) I至5小时,优选I至4小时,特别是I至3小时后取MS谱,获得最佳的可再现性和信噪比较低的质谱。在本发明的优选实施方案中,对处于特定生长时间的样品细胞施以MS分析。优选的取样时间是细胞生长的中和/或末对数期。在本发明的优选实施方案中,通过选自基线校正、标准化、校准、过滤和裁剪的操作对步骤b)中获得的原始样品MS数据和/或步骤a)中提供的原始标准MS数据进行信号处理。在优选的实施方案中,用于步骤c)的第一 MS信号处理法选自基线校正、标准化、校准、过滤和裁剪。MS数据谱通常因例如MALDI基质中的化学噪音和离子过载的问题表现出可变基线。当使用数据分析技术比较MS特性时这是不合意的,因为它们使用距离矩阵测量谱图之间的相似性。因此,在本发明的优选实施方案中,该原始样品和/或标准MS数据通过基线校正操作进行信号处理。采用MS谱通常观察到的另一现象是离子强度的振幅变化。这是由多种因素导致的,所述因素例如样品制备中的变化或设备灵敏性的改变。因此,在本发明的优选实施方案中,通过标准化操作对该原始样品和/或标准MS数据进行信号处理。峰校准用于矫正观察到的M/Z值与真实的飞行时间之间的差异。这些误差通常因标定误差而产生,并可以以峰之间的系统偏移而观察到。因此,在本发明的优选实施方案中,通过峰校准操作对原始样品和/或标准MS数据进行信号处理。通过平滑化该信号(优选通过Savitzky-Golay滤波器)进行MS谱(profiles)的过滤。因此,在本发明的优选实施方案中,通过过滤操作对原始样品和/或标准MS数据进行信号处理。进行MS谱的裁剪以除去含有极少或不含有信息的信号部分。优选从MS谱中除去O至500m/z单位的范围。因此,在本发明的优选实施方案中,通过裁剪操作对原始样品和/或标准MS数据进行信号处理。在本发明的优选实施方案中,至少一种样品细胞的探针是再取样的。这种特定的优选工艺步骤允许对原始信号进行放大取样和减少取样,同时保留在该谱中所含信息,也就是说,改变测得的不同数据点的通道数量(amounts channels)。通常,在原始高分辨率MS信号被认为因电脑限制(如电脑内存不足)无法实施的情况下采用再取样。再取样还可用于产生一致的m/z范围,这有利于排列多个谱图。在本发明的优选实施方案中,至少一种样品细胞的样品增加取样至至少50,000,优选以解释m/z矢量(vector)的微小差异。在本发明的优选实施方案中,该原始标准和样品MS数据经肉眼分析。在本发明的优选实施方案中,对步骤c)中获得的预处理过的标准和样品MS谱进行光学分析,优选用于检测异常值并除去罕见的、有缺陷的预处理过的标准和样品MS谱。在优选的实施方案中,步骤c)中所用第一 MS信号处理法优选以下列次序包括以下步骤:原始标准和/或样品MS数据的再取样、基线校正、过滤、校准、肉眼分析和标准化。在本发明的优选实施方案中,具有在步骤d)中评估的预测细胞培养(优选生物反应器)性能数据的样品细胞在细胞培养(优选生物反应器)中培养,由此确定其细胞培养(优选生物反应器)性能数据。在本发明的优选实施方案中,步骤b)中获得的原始样品MS谱和样品细胞的证实的生物反应器性能数据用于步骤a)中作为标准细胞的标准MS数据和生物反应器性能数据。通过提供更高数量的来自具有已知细胞培养(优选生物反应器)性能数据的标准细胞的MS谱,该预测的可能性,优选可靠性,将更准确和可靠。在本发明的优选实施方案中,根据步骤⑷的PLS-DA模型需要两组不同的信息,即X-信息组(block)和y_信息组。在本发明的优选实施方案中,X信息组含有来自该方法的96DWP(深孔板)阶段所生成的预处理过的样品MS数据的信息。在本发明的优选实施方案中,各预处理过的样品MS数据作为样品处理,在特定m/z值范围记录的信号强度作为变量处理。在本发明的优选实施方案中,y信息组含有将各个预处理过的标准MS数据分配至类变量的信息。在本发明的优选实施方案中,y信息组含有优选与生物反应器规模的细胞系生产率的特定测量值相关的信息,即产物浓度、单位生产率或整体活细胞计数积分。在本发明的优选实施方案中,统计程序PLS-DA不用于区分稳定和不稳定的细胞系。在本发明的优选实施方案中,统计程序PLS-DA是本发明的方法中唯一使用的统计程序。在本发明的优选实施方案中,本发明的方法中用的统计程序仅为统计程序PLS-DA和PCA。优选地,在步骤d)中施以第二 MS信号处理法(包括基于PLS-DA的比较评估以预测至少一种样品细胞的细胞培养性能数据)之前,在步骤c)中在不使用统计分析(优选PLS)的情况下预处理该原始标准和原始样品MS数据。在本发明的优选实施方案中,使用X信息组数据,进行将原始变量转换至潜在变量空间中的PLS映射。这具有减少问题的维数,同时尽可能地描述原始数据中的变化性的效果。在本发明的优选实施方案中,该PLS-DA算法利用了 y信息组中的信息以贴合线性辨别边界,所述线性辨别边界基于储存在I信息组中的分类信息尽可能分离了 X信息组数据。如果在y信息组中仅存在两个描述的类别,单个判别边界(discrimination boundary)是足够的。在存在三个或多个类别的情况下,类别内样品应当与每个可得类别的类别外样品进行比较。在本发明的优选实施方案中,下列分类用于基于PLS-DA的比较评估以预测整体活细胞计数数据: 高>4500xl06个细胞X小时/毫升,.4500xl06个细胞x小时/毫升 > 中>3250xl06个细胞x小时/毫升,和 低〈3250x106个细胞X小时/毫升。在本发明的优选实施方案中,下列分类用于基于PLS-DA的比较评估以预测细胞单位生产率数据:.高 >2.35pg X 细胞 X 小时,.2.35pg X细胞x小时 > 中>1.75pg x细胞x小时,和.低〈1.75pg X 细胞 X 小时。在本发明的优选实施方案中,下列分类用于基于PLS-DA的比较评估以预测细胞产物浓度数据: 高>4克/升,和 低〈4 克 / 升本发明还涉及由细胞制造细胞产物的方法,所述细胞产物优选为蛋白质,该方法包括以下步骤:a)根据本发明的方法预测细胞培养性能数据,

b)识别具有所需细胞培养性能数据的样品细胞,c)培养步骤b)中识别的所述样品细胞,优选在大体积培养基中,和d)获得由步骤c)中的培养制造的该细胞产物,优选蛋白质。优选地,在制造细胞产物(优选蛋白质)的方法中,在步骤a)中预测其细胞培养性能数据的样品细胞在低体积培养基中培养。
此外,本发明提供了用于制备(特别是分离)具有所需细胞培养(优选生物反应器)性能数据的细胞的方法,其中实施预测至少一种样品细胞的细胞培养(优选生物反应器)性能数据的方法,并制备(优选分离)所述至少一种所需细胞。本发明提供了通过本发明的方法获得(特别是分离)的细胞。在本发明的优选实施方案中,分离的细胞的特征在于至少I克/升,优选至少5克/升,优选至少6、7、8、9或优选至少10克/升的蛋白质生产率。在本发明的优选实施方案中,分离的细胞的特征在于至少0.1克/升/小时,优选至少I克/升/小时,优选至少5克/升/小时,优选至少6、7、8、9或优选至少10克/升
/小时的蛋白质生产率。在本发明的优选实施方案中,分离的细胞的特征在于至少0.1克/升/小时/细胞,优选至少I克/升/小时/细胞,优选至少5克/升/小时/细胞,优选至少6、7、8、9或优选至少10克/升/小时/细胞的蛋白质生产率。本发明的技术问题还通过用于预测至少一种样品细胞的细胞培养(优选生物反应器)性能数据的装置而得到解决,所述装置适于提供细胞培养性能数据的预测,优选当提供至少一种样品细胞的探针时,所述装置包括:a)适于对至少一种样品细胞的探针施以MS (质谱)分析以获得其原始样品MS数据的设备,(b)适于对原始标准和原始样品MS数据施以至少一种第一 MS信号处理法以获得预处理过的标准和样品MS谱的设备,和(c)适于对来自标准细胞的细胞培养(优选生物反应器)性能数据和预处理过的样品与标准MS谱施以包括基于PLS-DA(偏最小二乘法-判别式分析)的比较评估的第二 MS信号处理法以预测样品细胞的生物反应器性能数据的设备。进一步优选的实施方案是从属权利要求的主题。通过下列实施例和附图进一步阐述本发明。

图1a和Ib显示了再取样至1000个数据点之前和之后的典型MS谱。图2a和2b显示了基线校正之前和之后的典型MS谱。图3a和3b显示了标准化之前和之后的典型MS谱。图4a和4b显示了 Savitzky-Golay平滑化之前和之后的典型MS谱。图5a和5b显示了裁剪带有极少或不带有信息的图谱区域之前和之后的典型MS
-1'TfeP曰。图6a、6b和38显示了使用原始MS谱(6a,38)与典型相关MS谱(6b)的PCl对PC2的得分图。图7a、7b和39显示了使用施以基线校正的MS谱(7a,39)与典型相关MS谱(7b)的PCl对PC2的得分图。图8a、8b和40显示了使用施以基线校正和标准化的MS谱(8a,40)与典型相关MS谱(8b)的PCl对PC2的得分图。图9a、9b和41显示了使用施以基线校正、标准化和裁剪的MS谱(9a,41)与典型相关MS谱(9b)的PCl对PC2的得分图。图10显示了 PLS_工具箱中的PLS-DA分析流程图。图1la和Ilb显示了 PLS工具箱中的PLS-DA输入对话框。图12显示了 PLS_工具箱中的PLS-DA类别组选择对话框。
图13显示了 PLS_工具箱中的PLS-DA数据再处理选项。图14显示了 PLS_工具箱中的PLS-DA交叉验证对话框。图15a至15d和42至45显示了各种PLS-DA得分图:(15a,42) 二变量得分图,(15b,43)Hotelling T2图,(15c,44)模型预测图和(15d,45)模型预测可能性(probability)图。图16a、16b、46 和 47 显示了 PLS-DA 负载图:(16a,46)潜在变量 I 和(16b,47)潜
在变量2。图17和48显示了 Y预测类别I的PLS-DA判定边界图。图18和49显示了 Y预测类别I的PLS-DA可能性图。图19a和19b显示了比较抗体生产细胞系CH02、42和52的LC-ES1-MS数据的PLS-DA 分析。图20显示了比较7种抗体生产CHO细胞系(2、42、52、75、106、144和164)的LC-ES1-MS数据的PLS-DA分析,其中样本分组为低于2克/升和高于2克/升。图21a和21b显示了用包含基线校正和标准化(21a)和包含再取样、基线校正、过滤、校准、肉眼分析和标准化(21b)的MS信号处理法预处理过的MS谱。图22显示了使用本发明的原始MS数据预处理的细胞系第I轮预测的Y预测图,所述预处理包括原始MS数据的再取样、基线校正、过滤、校准、肉眼分析和标准化和随后的PLS-DA模型化。图23显示了使用本发明的预处理的细胞系第I轮预测的LVl对LV2。图24显示了使用本发明的原始MS数据预处理的细胞系第2轮预测的Y预测图,所述预处理包括原始MS数据的再取样、基线校正、过滤、校准、肉眼分析和标准化和随后的PLS-DA模型化。图25显示了使用本发明的预处理的细胞系第2轮预测的LVl对LV2。图26显示了使用本发明的原始MS数据预处理的细胞系第3轮预测的Y预测图,所述预处理包括原始MS数据的再取样、基线校正、过滤、校准、肉眼分析和标准化和随后的PLS-DA模型化。图27显示了使用本发明的预处理的细胞系第3轮预测的LVl对LV2。图28显示了使用本发明的原始MS数据预处理的细胞系第4轮预测的Y预测图,所述预处理包括原始MS数据的再取样、基线校正、过滤、校准、肉眼分析和标准化和随后的PLS-DA模型化。图29显示了使用本发明的预处理的细胞系第4轮预测的LVl对LV2。图30显示了使用本发明的原始MS数据预处理的细胞系第5轮预测的Y预测图,所述预处理包括原始MS数据的再取样、基线校正、过滤、校准、肉眼分析和标准化和随后的PLS-DA模型化。图31显示了使用本发明的预处理的细胞系第5轮预测的LVl对LV2。图32显示了使用本发明的原始MS数据预处理的细胞系第3轮预测的IVC Y预测图,所述预处理包括原始MS数据的再取样、基线校正、过滤、校准、肉眼分析和标准化和随后的PLS-DA模型化。图33显示了使用本发明的原始MS数据预处理的细胞系第4轮预测的IVC Y预测图,所述预处理包括原始MS数据的再取样、基线校正、过滤、校准、肉眼分析和标准化和随后的PLS-DA模型化。图34显示了使用本发明的原始MS数据预处理的细胞系第5轮预测的IVC Y预测图,所述预处理包括原始MS数据的再取样、基线校正、过滤、校准、肉眼分析和标准化和随后的PLS-DA模型化。图35显示了使用本发明的原始MS数据预处理的细胞系第3轮预测的qP Y预测图,所述预处理包括原始MS数据的再取样、基线校正、过滤、校准、肉眼分析和标准化和随后的PLS-DA模型化。图36显示了使用本发明的原始MS数据预处理的细胞系第4轮预测的qP Y预测图,所述预处理包括原始MS数据的再取样、基线校正、过滤、校准、肉眼分析和标准化和随后的PLS-DA模型化。图37显示了使用本发明的原始MS数据预处理的细胞系第5轮预测的qP Y预测图,所述预处理包括原始MS数据的再取样、基线校正、过滤、校准、肉眼分析和标准化和随后的PLS-DA模型化。实施例1-细胞系生成(根据现有技术状态)使用含有用于表达模型鼠-人嵌合IgG4或IgGl抗体的基因优化(gene-optimised)重链和轻链基因的GS表达载体(Lonza) (Kalwy等人,Mol.Biotechnol2006, 34,151-156)生成重组的、表达抗体的GS-CHO细胞系。使用标准电穿孔法将该载体引入宿主细胞系CH0K1SV(CH0-K1的衍生物;Lonza)中,该转染混合物分布在八十个96孔板中。板在37°C下在潮湿的、含10%C02的空气气氛中保育。次日,向板中的细胞悬浮液中添加新鲜的培养基。培养基中的MSX(蛋氨酸亚氨基代砜)浓度使得各孔中的最终MSX浓度为50 μ Μ。在转染后大约3周,首先筛选板中的非谷氨酸依赖性转染子。分离的转染子菌落(各自识别为源自具有单一菌落的孔)经过典型细胞系构建策略(constructionstrategy)的所有评估阶段。使用V1-CELL 自动化细胞存活性分析仪(Beckman Coulter)测定培养物的细胞浓度。在125晕升振荡培养瓶中以2.0X IO5活细胞/晕升的目标细胞浓度和通常30晕升的最终体积安置培养物。细胞系在4天时间内连续继代培养。一旦在继代培养中达到可接受的细胞浓度,并在继代培养之间不再出现任何大幅度的活细胞浓度波动,即开始在悬浮液培养物中进行评估阶段。在第一次悬浮液评估(“批次”)后对细胞系进行分等级(rank)后,进行细胞系“批次进料”评估。对于批次进料评估,在第7天和第14天使用V1-CELL 自动化细胞存活性分析仪测定培养物的细胞浓度。在第3天进行进料A的推注添加,在第8和11天进行进料B的推注添加。在不同的天数下取培养物上清液的样品用于抗体浓度测
定。或者,可以用MACSQuant 分析仪进行细胞存活性分析。实施例2 -制备用于ALD1-TOF分析的样品细胞除非另行规定,所有试验在与实施例1 (第一段)中所述相同的培养条件下进行。在对样品探针(意指样品)施以MS分析之前,将细胞计数并计算提供合适数量细胞所需的培养物体积。在处理之前从培养器(96孔板)中移出细胞。所需体积的各样品转移至Eppendorf管,在Eppendorf微离心机(型号5417c,转子F-45-30-11)中以960rcf(3000rpm)离心5分钟,移除上清液。随后用I毫升PBS (磷酸盐缓冲盐水)通过轻柔地上下吹打以洗涤该细胞,随后如上离心。在指出的情况下,随后用I毫升0.35M的蔗糖洗涤细胞,并在如上所述的离心后移除上清液。此时细胞沉淀(pellets)可以储存(-80°C)以供将来进一步处理,或立即处理用于MS分析。在储存的情况下,冷冻细胞沉淀需要在使用前在解冻后平衡至室温。在基质缓冲液(40%乙腈,60%的0.P/oTFA)中制备20毫克/毫升芥子酸溶液,这形成了饱和溶液。该芥子酸溶液随后放置在超声水浴中15分钟,随后在Eppendorf 微离心机(型号 5417c,转子 F-45-30-11)中以 17900rcf (13000rpm)离心 5 分钟。随后向各样品中加入基质溶液(50微升),通过手工上下吹打该溶液使该细胞再悬浮。再悬浮后,将该细胞放置在4°C下最多数小时。在从4°C下取出时,通过轻柔地轻弹试管使该细胞再悬浮,随后I微升的各样品点样到384MTP磨光的钢MALDI TOF板(Bruker)上。令样品空气干燥,随后将该板放入MALDI TOF机器(Bruker Ultraflex)并分析样品。实施例3 -使用Dunn裂解缓冲液制备用于LC-ES1-MS分析的样品细胞样品收集:一系列的CHO细胞系在250毫升悬浮液细胞培养瓶中生长。使用V1-CELL 将细胞计数,将所需数量(IX IO6至0.015625X IO6)的细胞吸取到1.5毫升Eppendorf管中并在Eppendorf微离心机(型号5417c,转子F-45-30-11)中以960rcf离心5分钟并移除上清液。将沉淀在_80°C贮存备用。细胞裂解:将该沉淀解冻并重悬在400微升的Dunn裂解缓冲液(超纯脲9.5M,CHAPS2%, DTT1%)中,彻底振荡并在室温(RT)下培养I小时,在开始培养后30分钟进行简短振荡(vortex)。样品随后在985.6g下,优选1700rcf (相对离心力)下离心I分钟以除去细胞碎片并将上清液吸移至2毫升的Eppendorfs中。随后将50微升的样品用于丙酮沉淀。丙酮沉淀:将4:1的100%冰冷丙酮对样品的稀释液在_20°C下孵育I小时。稀释样品随后在8870.4g,优选17900rcf (相对离心力)下离心10分钟,移除上清液,并在空气中短暂地(不超过5分钟)干燥留下的沉淀。在溶液胰蛋白酶消化前,使用来自GE healthcare的2D净化试剂盒(产品代码80-6484-51)净化该样品。遵照与该试剂盒一起提供的手册的程序A。溶液中的胰蛋白酶消化:首先通过上下吹打样品以松脱沉淀并随后短暂振荡,由此将该沉淀重悬在50微升的8M脲和0.4M碳酸氢铵(NH4HCO3)中。在37 °C培养器中,通过添加2.5微升的在50mM的NH4HCO3中的IOOmM 二硫苏糖醇(DTT)化学还原该样品I小时。随后,通过在室温下避光添加5微升的在50mM的NH4HCO3中的IOOmM碘代乙酰胺将该样品烷基化15分钟。通过加入192.5微升HPLC级水,接着加入10微升0.25微克/微升修饰胰蛋白酶(PiOmega)将脲浓度稀释至〈2M。随后在37°C培养器中令胰蛋白酶消化过夜。随后用Savant speed vac (SCllOA)在低设定下干燥样品,并重悬在20微升的0.1%甲酸中,以8870.4g离心I分钟,将上清液移除,并将任何沉淀重悬,并在8870,4g,优选17900rcf (相对离心力)下再次离心I分钟,随后吸取到具有内管的带有螺旋盖的小瓶中,并在_80°C下冷冻直到通过LC-ES1-MS分析。实施例4-LC-ES1-MS 分析用于采用LC-ES1-MS(与 HPLC(Donex 或 Agilent)耦合的 ESI_MS ruker 或Waters))的分析的HPLC法显示在表I中,所述方法获得了适当的MS谱。
由LC-ES1-MS产生的文件随后由专有程序格式(Bruker或Waters)转化为通用标准(mzXML)(即使用CompassExport),并对所得文件和数据施以binning处理。该binning法(其是这种类型的MS数据分析的标准)允许通过排列来自不同(或相同)样品的多个ES1-MS数据组而对其进行比较,并包括将保留时间(从LC系统中的洗脱时间)和m/z范围(如ES1-MS中检测的离子的质荷比)分成等距间隔,例如,使用60秒的保留时间段(bin)和每段lm/z单位的质荷比段。表IHPLC梯度运行实例。35分钟梯度,整个运行中流速0.3微升/分钟,使用如下所示的多步骤梯度,用含有0.1%甲酸的缓冲液A和含有80%乙腈(ACN)和0.1%甲酸的缓冲液B。
时间缓冲液8的%流速(微JI7分钟}
O40.3
O40.3
10550.3
11900.3
16900.3
1740.3 35 4 0.3 实施例5 -数据分析规程方法25.1数据处理和软件开发在本实施例中,为了基于MS的细胞系筛选和生成,使用软件工具(在Windows界面上运行),该软件工具允许快速及跨规模地预测细胞系的生产率。其编译为MATLAB (2008b版本,参考),其使用MATLAB生物信息和统计工具箱以及PLS_工具箱(www.eigenvector, com)。软件应用开始于已经在不同培养条件和规模下生长的样品和标准细胞系的MS谱的可得性(availiability)。信号处理工具已应用于该MS谱以提取指示不同水平的生产产品的细胞系的独特的MS数据模式。5.2再取样MS谱使用MATLAB 生物信息工具箱的 “msresample” 功能(http: //tinyurl.com/msresample)进行MS谱的再取样。这允许对原始信号进行增加取样和减少取样,同时保存谱图中所含的信息。图1a和Ib显示了应用再取样之前和之后的典型96DWP谱。通常,在原始高分辨率MS信号被认为因电脑限制(如电脑内存不足)无法实施的情况下采用再取样。再取样还可用于产生一致的m/z范围,这有利于排列多个谱。当再取样MS谱必须小心,以避免将再取样的单位数设定得太低。这将导致信号的分辨率降低,并导致特征的损失。5.3MS谱的基线校正MS数据谱通常因例如MALDI基质中的化学噪音和离子过载的问题表现出可变基线。当使用数据分析技术比较MS谱时这是不合意的,因为它们使用距离矩阵测量谱之间的相似性。因此,优选的是在任何形式的信号比较分析之前消除这些效应。这使用MATLAB生物信息工具箱的 “msbackadj” 功能(http: //tinyurl.com/msbackadi)进行。图 2a 和 2b显示了应用基线校正之前和之后的典型96DWP谱的选择。当连续施加大量谱图预处理时,基线校正应当在减少取样之后和在校正标定值(calibration)之前使用,因为存在的噪音将对结果造成影响。5.4标准化采用MS谱通常观察到的另一现象是离子强度的振幅变化。这是由多种因素导致的,所述因素例如样品制备中的变化或设备灵敏性的改变。处理这些变化的标准程序是将MS曲线下的面积标准化至组(group)平均值(通常使用平均值或中位数)。这使用MATLAB生物信息工具箱的“msnorm”功能(http: //tinyurl.com/msnormal)进行。图3a和3b显示了应用曲线下面积标准化之前和之后的典型96DWP谱的选择。当连续施加大量谱图预处理时,样品的标准化应当在减去基线之后进行,因为由结晶基质引入的噪音元素将对结果造成影响。5.5MS 校准(Alignment)峰校准用于矫正观察到的M/Z值与真实的飞行时间之间的改变。这些误差通常因标定误差而产生,并可以以峰之间的系统偏移而观察到。这些不一致之处的校正可以使用MATLAB 生物信息工具箱的 “msalign” 功能(http://tinyurl.com/msalign)进行。校准谱图的一种方法是用具有已知谱图的物质掺杂该样品,并以此为基础校准该样品。但是,在未对样品进行添加的情况下,样品可以相对于谱图,如平均谱图来校准。5.6MS谱的过滤典型的MS谱含有信号与噪音的混合。使用Savitzky-Golay滤波器平滑化该信号可以有助于减少后继处理过程中信号的噪音成分的影响。Savitzky-Golay滤波器通常用于MS信号,因为它们使用高阶多项式以配合该曲线。这导致更好地保存信号中的特征,如峰高。该过程使用MATLAB生物信息工具箱的“mssgolay”功能(http: //tinyurl.com/mssgolay)进行。图4a和4b显示了应用Savitzky-Golay过滤之前和之后的典型96DWP谱的选择。5.7MS谱的裁剪进行MS谱的裁剪以除去含有极少或不含有信息的信号部分。这还允许将谱图分成子段。这使得能够分析该MS谱(profile)的特定区域,而不是分析整个谱图。图5a和5b显示了裁剪O至500m/z范围内的信号之前和之后的典型96DWP谱的选择。5.8比较预处理的效果为了证实对MS数据实施信号处理技术的效果,使用主成分分析(PCA)分析一组118细胞系(一式两份)。图6a、6b和38显示了 PCl对PC2的主成分得分图。该图描述了数据组中变化的两个主要来源。对原始MS谱应用基线校正导致在第一和第二主成分中观察到的散点数量减少。这可以在图7a、7b和39中观察到。基线校正仅能处理MALDI基质导致的信号中的噪音。优选使用标准化去除信号振幅的变化。图8a、8b和40显示了对该谱图组应用标准化的效果,其清楚地显示了在PCl (差异的主要来源)中观察到的改变的减少。最后施加的信号处理步骤是去除已知含有无用信息的信号部分。图9a、9b和41显示了去除在O至500m/z单位范围内MS谱中的数据点的效果,因为MALDI设定为不记录该范围内的强度。从该得分图可以清楚地看到,去除该数据没有观察到效果,因为该得分图与图8a、8b和40中观察到的相同。与仅用包括基线校正和标准化步骤的方法(图21a和21b)预处理的MS谱相比,在步骤c)中使用包括下列原始标准和/或样品MS数据的再取样、基线校正、过滤、校准、肉眼分析和标准化的步骤的第一信号处理法,该标准和样品MS谱看起来更平滑,在细胞系之间(across cell lines)的峰排列(peak align)更一致。对于其中制备2或3份细胞沉淀以便施以来自相同样品的MS分析的情况,所述方法还导致生物学重复的MS谱更为一致。优选地,尽管这些改善确以处理该样品所需时间延长(对大约400个谱图为大约2小时)为代价,但是这在细胞系构造过程中在模型化方法和预测/选择所述这些目标细胞系方面并非优选禁止的。实施例6-信号处理法26.1生产率矩阵的PLS-DA模型化PLS-DA是专门用于预测分类的多变量最小方差模型化的应用软件。在该实施例中所用的开发的MS指纹法利用了 PLS-DA的PLS_工具箱(由EigenvectorResearch, Inc (EVRI)发表)实施(www.eigenvector, com)。6.2 训练 PLS-DA 模型为了训练PLS-DA模型,需要两组不同的信息;x信息组和y信息组。在实施新细胞系构建的所述方法中,X信息组包含在该方法的96DWP阶段生成的谱图谱中的信息。各谱作为样品处理,将在特定m/z值范围内记录的信号强度作为变量处理。Y信息组包含将各训练样品分配至类变量的信息。在该实施例中,y字段含有涉及生物反应器规模下细胞系生产率的特定细胞培养数据的信息,即产物浓度、单位生产率或整体活细胞计数。使用X信息组数据,进行将原始变量转换至潜在变量空间中的PLS映射。这具有减少问题的维数,同时尽可能地描述原始数据中的变化性的效果。该PLS-DA算法利用了 y信息组中的信息以贴合线性辨别边界,所述线性辨别边界基于储存在y信息组中的分类信息尽可能分离了 X信息组数据。如果在y信息组中仅存在两个描述的类别,单个判别边界是足够的。在存在三个或多个类别的情况下,类别内样品应当与每个可得类别的类别外样品进行比较。6.3分析流程10显示了使用见于MATLAB PLS_工具箱中的算法的图形实现的建立PLS-DA模型所需操作的流程图。1.载入X数据-此按钮提示使用者将X信息组数据输入软件中。该“指纹”识别软件,ms_preproc,设计为充当信号处理与分析技术之间的界面,将该MS数据自动转化为PLS_工具箱所需工作格式并将变量作为变量“X信息组”存储到MATLAB工作区(图1la和Ilb)。2.载入类别(任选)-此按钮用于将y信息组数据输入到该软件中。但是,类别信息也可以储存在“X信息组”变量中(更多细节参见http j//wik1.eigenvector, com/index.php title=dataSet Object)。该ms_preproc软件将类别信息嵌入到“X信息组”变量中;因此,该步骤是任选的。3.选择类别组-此按钮提供给使用者选项,使其选择建立模型的类别组。图12显示了具有三个类别(高、中、低)的典型实例。该模型将计算添加到右侧栏中的类别的判别边界。4.选择预处理-此按钮可用于对谱图文件施用各种预处理技术(图13)。如果该步骤使用生物信息工具箱中的谱图预处理工具进行,该步骤的大部分是选择性的。但是,还涉及,数据预处理是在训练过程中分配的前可能性的问题。通过缺省,该算法假定选择各类别的可能性相等。有时情况与之不符,必须调整该值以反映真实的可能性。这通过改变“编辑(Edit) ”菜单的“选项(Options) ”选项下的“方法选项(Method Options (PLS-DA)) ”来实施。5.选择交叉验证-此按钮允许使用者在训练过程中进行交叉验证。该方法通常用于提供改善程度的结果的置信度并充当分类器性能的交叉检查。标准方法是保留一部分训练数据并使用这些训练数据测试分类器的性能。通常,用保留的不同部分的数据重复该过程。图14显示了可用于使用PLS_工具箱分配数据的方法(http://wik1.eigenvector,com/index.php title=Using_Cross_Validation)。6.构建模型-此按钮计算PLS潜在变量并放置该判别边界的最佳位置,以使训练数据组中正确分类的数量最大化。7.选择成分-一旦PLS-DA模型已经计算,此按钮变得可用。其产生图形以帮助使用者选择将保留在该PLS-DA模型中的潜在变量的数量。实现这一目的的另一方法是假定相对于I信息组解释的改变应在70-80%区域内以免过度配合该模型。8.检查(review)得分-此按钮允许存取大量与潜在变量得分相关的图。这些图可用于分析模型性能。图15a至15d和42至45显不了一些最有用的图;(a)双变量负载图,(b)Hotelling T2 图,(c)模型预测图和(d)模型预测图的相关可能性。9.检查负载-此按钮允许存取大量与潜在变量负载相关的图。这些图可用于识别对各潜在变量具有最显著影响的变量。这可用于识别最有可能影响区别判别的谱图信号的区域。10.载入测试数据-一旦建立模型,下一步是利用该模型预测不可见数据。按下此按钮向用户呈现图lla/b中所述相同的对话框。通过不将类变量分配至样品,测试数据也可以与步骤I中的原始X信息组数据一起载入。在步骤2过程中未被ms_preproc软件分配类别的样品自动视为测试数据。这些可视作如图16a、16b、46和47中分类为未知的样
品O11.使用模型-此按钮使测试数据与训练的PLS-DA模型相配。这允许使用者确定未知样品最有可能属于的类别。实施例7-施以MALD1-T0F的MS谱及其统计模型化例示的本段落重点在于在新细胞系生成过程中由MS分析数据建模获得的结果。图48、49、17和18显示了 BNCD模型获得的结果(数据基线校正、标准化并裁剪,且包括双份样品)。三角形(图17和18)和星形(图48和49)显示了 ‘高’类别(>4000毫克/升)的训练数据,星形(图17和18)和三角形(图48和49)显示了 ‘低’类别(彡3999毫克/升)的训练样品,没有细胞系ID编号的黑点(图17和18)和叉形(图48和49)代表类别数据未知的样品,而带有细胞系ID编号的点显示了落在分类边界上的样品(上方灰色虚线)。使用来自细胞系建构过程的处理过的信息,(i)可以建立包括数百个在细胞系生成过程中生成的MS数据的预测模型。基于该模型,核实预期产生不同量的MAb (>4000毫克/升;< 3999毫克/升)的细胞系的名单。表2中突出了几个细胞系,其可以在图48、49、17和18中识别。培养所述细胞系,并记录其效价值以测量该预测方法的性能(表2)。表2预测的高/低生产细胞系vs观察到的生产率
权利要求
1.用于预测至少一种样品细胞的细胞培养性能数据的方法,包括以下步骤: (a)提供至少一种样品细胞的样品、来自标准细胞的细胞培养性能数据和来自所述标准细胞的原始标准MS (质谱)数据, (b)对所述至少一种样品细胞的样品施以MS分析以获得其原始样品MS数据, (c)对所述原始标准MS数据和原始样品MS数据施以至少一种第一MS信号处理法以获得预处理过的标准MS谱和样品MS谱,和 (d)对来自步骤(a)的标准细胞的细胞培养性能数据和步骤(c)中获得的预处理过的标准MS谱与样品MS谱施以第二 MS信号处理法,所述第二 MS信号处理法包括基于PLS-DA(偏最小二乘法-判别分析)的比较评估,由此预测所述至少一种样品细胞的细胞培养性能数据。
2.根据权利要求1所述的方法,其中所述细胞培养性能数据是细胞单位生产率、整体活细胞计数或细胞产物浓度数据。
3.根据前述权利要求任一项所述的方法,其中所述细胞选自人细胞系、动物细胞系、植物细胞系、来自真菌的细胞、来自细菌的细胞、来自酵母的细胞和干细胞。
4.根据前述权利要求任一项 所述的方法,其中所述细胞是CHO细胞系、CHO-Kl细胞系或修饰过的CHO-Kl细胞系。
5.根据前述权利要求任一项所述的方法,其中步骤(b)中的所述MS分析是MALD1-TOF。
6.根据前述权利要求任一项所述的方法,其中施以步骤(b)的所述样品细胞的样品包含 0.015X IO6 至 0.0625X IO6 个细胞。
7.根据前述权利要求任一项所述的方法,其中在步骤(b)中获得的所述原始样品MS数据和步骤(a)中提供的所述原始标准MS数据通过以下操作进行信号处理,所述操作选自基线校正、标准化、校准、过滤和裁剪组成的组。
8.根据前述权利要求任一项所述的方法,其中对步骤(c)中获得的所述预处理过的标准MS谱和样品MS谱进行光学分析。
9.根据前述权利要求任一项所述的方法,其中在步骤(d)中评估的具有所述预测的细胞培养性能数据的样品细胞在细胞培养中培养以验证其细胞培养性能数据。
10.根据前述权利要求任一项所述的方法,其中步骤(b)中获得的所述原始样品MS谱和所述验证的样品细胞的细胞培养性能数据在步骤(a)中用作来自标准细胞的标准MS数据和细胞培养性能数据。
11.由细胞制造细胞产物的方法,包括以下步骤: a)根据权利要求1至10预测所述细胞培养性能数据, b)识别具有所需细胞培养性能数据的样品细胞, c)培养步骤b)中识别的所述样品细胞,和 d)获得由步骤c)中的培养而生产的细胞产物。
12.根据权利要求11所述的方法,其中在步骤a)中预测其细胞培养性能数据的样品细胞在小体积培养基中培养。
13.用于分离具有所需细胞培养性能数据的细胞的方法,其中实施前述权利要求任一项所述的方法,并分离所需细胞。
14.通过权利要求13所述的方法分离的细胞。
15.根据权利要求14所述的细胞,其特征在于其蛋白质生产率高于10克/升。
16.用于预测至少一种样品细胞的细胞培养性能数据的装置,包括下列技术特征: (a)适于对至少一种样品细胞的样品施以MS(质谱)分析以获得其原始样品MS数据的设备, (b)适于对原始标准MS数据和原始样品MS数据施以至少一种第一MS信号处理法以获得预处理过的标准MS谱和样品MS谱的设备,和 (c)适于对来自标准细胞的细胞培养性能数据和预处理过的样品与标准MS谱施以包括基于PLS-DA(偏最小二乘法-判别分析)的比较评估的第二 MS信号处理法以预测所述样品细胞的细胞培养性 能数据的 设备。
全文摘要
本发明涉及用于预测样品细胞的细胞培养性能数据的方法、用于分离所述细胞的方法和用于预测样品细胞的细胞培养性能数据的装置。
文档编号G01N33/68GK103189744SQ201180052286
公开日2013年7月3日 申请日期2011年10月27日 优先权日2010年10月27日
发明者迪特马尔·朗, 伊莱恩·B·马丁, 加里·A·蒙塔古, 克里斯托弗·J·奥马利, 特蕾西·S·罗特, 卡罗尔·M·特里, 简·F·波维, 克里斯托弗·M·斯梅尔斯, 安德鲁·J·拉赫尔 申请人:英国龙沙生物医药股份有限公司

  • 专利名称:光电寻焦器的制作方法技术领域:本发明涉及一种用于聚焦镜工作焦点位置的检测器件,特别是用于激光切割设备聚焦镜工作焦点位置的确定。背景技术:激光切割设备是通过聚焦镜将近似平行的激光光束汇聚成一极小的高能量点进行高精密的切割生产,一般焦
  • 专利名称:一种沥青薄膜盐蚀试验用样品的制备装置的制作方法技术领域:本实用新型涉及一种浙青薄膜盐蚀试验用样品的制备装置。背景技术:目前,随着沿海公路设施和跨海大桥的不断增多,沿海公路浙青路面和跨海大桥桥面浙青铺装等结构物长期经受海洋大气环境中
  • 专利名称:一种用高效液相色谱法快速测定尿中微量白蛋白的方法技术领域:本发明介绍的是测定尿中微量白蛋白的方法,具体涉及的是用高效液相色谱法快速测定尿中的微量白蛋白。背景技术:正常人尿液中存在着白蛋白,但含量很低,一般小于30mg24h尿液。当
  • 专利名称:液压活塞位置传感器的信号处理的制作方法技术领域:本发明涉及液压活塞。更具体地,本发明涉及用来检测活塞和液压缸之间相对位置的位置传感器。背景技术: 液压缸用在很多种应用中,例如重型设备,来移动大负载。按照传统,液压缸的控制是通过操作
  • 专利名称:一种伞具开闭测试仪的制作方法技术领域:本实用新型涉及一种检测机械,具体地说是一种伞具开闭测试仪。 背景技术:现有的伞具制作完毕后,需要进行一系列的测试,比如开闭测试等,检测伞具在开闭多少次后会折断。现有的伞具测试仪器基本以机械传动
  • 专利名称:一种数显硬度计的制作方法技术领域:本实用新型属于硬度计结构设计技术领域,具体涉及一种数显硬度计。 背景技术:目前,国内用于测量软橡胶、塑料、PVC、聚酯、氯丁橡胶、皮革、轮胎、聚硫橡胶、刚性合成材料、丙烯酸酯、树脂玻璃、印刷滚轴、
山东科威数控机床有限公司
全国服务热线:13062023238
电话:13062023238
地址:滕州市龙泉工业园68号
关键词:铣床数控铣床龙门铣床
公司二维码
Copyright 2010-2024 http://www.ruyicnc.com 版权所有 All rights reserved 鲁ICP备19044495号-12