专利名称:生物学分子的定量的制作方法
技术领域:
本申请涉及用于多肽鉴定和定量的分析技术。
背景技术:
多年以来,二维凝胶电泳(2D GE)一直是用于蛋白质混合物的分离和定量的标准方法。使蛋白质结合不同染料(染色),例如考马斯蓝,或者使用放射性标记,例如32P,使之有可能显现凝胶上的蛋白质斑点。对胶扫描后,使用光密度测定法测量斑点的“暗度”,并获得定量信息。二十世纪九十年代,质谱(MS)成为胶内消化后鉴定蛋白质的流行工具。尽管广泛使用,然而2D GE-MS在处理很大或很小的蛋白质、极端pI等级的蛋白质、膜和低丰度蛋白质时受到限制。染料的附着量与浓度不成正比,因此这种定量的可靠性仍然可疑。另外,一次2D凝胶电泳可能需要2天或更长时间,而且质谱前的染色和脱色还需要额外的时间。放射线照相术也是非常冗长的流程。最后,切下凝胶斑点,消化蛋白质,提取蛋白水解产物,并通过质谱分析每一个个别斑点,这些都是费时费力的步骤。
通过质谱对肽和蛋白质混合物的定量已经成为具有挑战性的分析问题,主要是因为共洗脱种类间的离子化抑制。为了解决这些问题,已采用稳定的同位素标记肽作为质谱的内部标准。这些化合物是诱人的标准,因为,虽然它们的分子量不同,但是它们的化学和物理特性(诸如层析保持时间和离子化效率)与它们的未标记对应物相似。这些技术避免了对2D GE和光密度测定法的需要,但是产生了完全不同的一组问题。可能难以实现用稀有的稳定同位素(如180)完全替代天然同位素(如160)以生成标准蛋白质混合物,这导致大量蛋白质分子中只有一部分预期原子得到了替代。稀有同位素标记试剂还是昂贵的,而且操作这些试剂需要额外的安全措施和技术。
发明概述本发明提供了用于相对定量生物学混合物中的分子的技术。一般而言,一方面,本发明提供了执行用于定量肽混合物中的肽中的技术的方法和装置,包括电脑程序。该技术包括接收包含多种肽的第一肽混合物,在一段时间里分离第一肽混合物所含多种肽中的一种或多种,在一段时间的特定时间对第一肽混合物中的一种或多种分离肽进行质荷分析,计算第一肽混合物中的一种或多种经过质量分析的肽的丰度,并通过比较计算得出的第一肽混合物中的一种或多种经过质量分析的肽的丰度与参照样品中一种或多种肽的丰度,计算第一肽混合物中的所述一种或多种经过质量分析的肽的相对量。所述参照样品对于第一肽混合物而言是外部的。
具体的实施方案可以包括一个或多个以下特色。接收包含多种肽的第一肽混合物可以包括消化第一多肽样品以生成第一肽混合物。该技术可以包括通过消化第二多肽样品来制备参照样品,由经过消化的第二多肽样品分离一种或多种肽,对由经过消化的第二多肽样品分离的肽进行质量分析,并计算第二多肽样品中的一种或多种经过质量分析的肽的丰度。计算第一肽混合物中的所述一种或多种经过质量分析的肽的相对量可以包括将计算得出的第一肽混合物中的一种或多种经过质量分析的肽的丰度与计算得出的第二多肽样品的一种或多种经过质量分析的相应肽的丰度进行比较。分离一种或多种肽可以包括通过液相层析分离该一种或多种肽。
分离一种或多种肽可以包括在特定时间分离液相层析洗脱液,而且对第一肽混合物的一种或多种分离肽进行质量分析可以包括对分离洗脱液中的一种或多种肽进行质量分析。
该技术可以包括鉴定第一肽混合物中的一种或多种肽。鉴定第一肽混合物中的一种或多种肽可以包括根据质量分析信息鉴定一种或多种分离肽。对一种或多种分离肽进行质量分析可以包括对由所述一种或多种分离肽中的肽衍生的离子进行片段化并对该离子的片段进行质量分析。鉴定第一样品中的一种或多种肽可以包括根据片段的质量分析信息搜索序列数据库。
计算一种或多种经过质量分析的肽的丰度可以包括根据肽的质量分析信息重建肽的层析峰。计算肽的丰度可以包括根据肽的重建层析峰面积计算肽的丰度。计算肽的丰度可以包括只使用位于特定时间重建层析图中阈值距离以内的层析峰计算肽的丰度。
计算所述一种或多种经过质量分析的肽的相对量可以包括将通过重建第一肽混合物的肽的层析峰面积计算得出的丰度与通过重建参照样品中的肽的层析峰面积计算得出的丰度进行比较。
该技术可以包括对计算得出的第一肽混合物的所述一种或多种经过质量分析的肽的丰度进行标准化。对计算得出的丰度进行标准化可以包括根据内部标准对计算得出的丰度进行标准化,该内部标准包括添加到第一多肽样品中的一种或多种肽。对计算得出的丰度进行标准化可以包括根据包含一种或多种肽的外部标准对计算得出的丰度进行标准化。
该技术可以包括根据质量分析鉴定第一肽混合物中的多种肽,其中计算一种或多种经过质量分析的肽的相对量包括计算每一种经鉴定肽的相对量。根据第一肽混合物中的一组肽的重建层析峰面积计算校准系数(这组肽中的每一种肽在多次实验中具有恒定的层析峰面积),并将校准系数应用于计算得出的每一种经鉴定肽的丰度,从而可以对计算得出的每一种经鉴定肽的丰度进行标准化。
可以在单次自动化实验中进行质量分析和计算步骤,以鉴定第一肽混合物中的每一种肽并计算其相对量。
进行质荷分析和计算步骤的所述一种或多种分离肽可以是天然存在的肽。参照样品中的所述一种或多种肽可以是天然存在的肽。对一种或多种分离肽进行质荷分析并计算一种或多种经过质量分析的肽的丰度可以包括对第一种混合物中的一种或多种任意肽进行质荷分析并计算丰度。可以这样执行该技术,使得分离、质荷分析、和计算步骤不局限于受试肽的特定氨基酸组成。
一般而言,另一方面,本发明提供了执行用于定量混合物中的一种或多种肽的技术的方法和装置,包括电脑程序。该技术包括消化蛋白质样品以生成肽混合物,使用液相层析分离肽混合物中的一种或多种肽,对一种或多种分离肽进行质量分析,根据肽的质谱鉴定一种或多种经过质量分析的肽,计算经鉴定肽的层析峰面积,根据计算得出的经鉴定肽的峰面积计算与相应肽对应的一种或多种蛋白质的层析峰面积,根据内部标准的层析峰面积对蛋白质的层析峰面积进行标准化,并通过比较该蛋白质的标准化层析峰面积与参照样品中的相应蛋白质的层析峰面积,确定一种或多种蛋白质的相对量。
一般而言,又一方面,本发明的特色是执行用于定量生物学样品中的一种或多种化合物的技术的方法和装置,包括电脑程序。该技术包括接收包含多种化合物的生物学样品,在一段时间里分离生物学样品所含多种化合物中的一种或多种,在一段时间的特定时间对生物学样品的一种或多种分离化合物进行质荷分析,计算生物学样品的一种或多种经过质量分析的化合物的丰度,并通过比较计算得出的生物学样品中一种或多种经过质量分析的化合物的丰度与参照样品中一种或多种化合物的丰度,计算生物学样品中一种或多种经过质量分析的化合物的相对量,所述参照样品对于生物学样品而言是外部的。
可以执行本发明以实现以下优势中的一项或多项。使用公开技术,可以将例如经过药物、营养素、毒素等处理的一组细胞中的蛋白质相对丰度与来自对照细胞组的蛋白质进行比较,从而找出受到试剂的影响而过度表达或表达不足的那些蛋白质。可以执行该技术来寻找并定量疾病标记或药物靶,和/或筛选潜在药物。可以执行所述技术以避免现有凝胶电泳方法中存在的对获得极端分子量和pI等级的蛋白质的限制。该技术不受样品含量或多肽性质、特定氨基酸等限制,而且可以对天然存在的蛋白质和肽执行。分析前不需要费时费力的样品标记。同样,不像同位素编码亲和标签(ICAT)或类似方法那样需要昂贵试剂来生成内部标准。该技术不限于包含特定氨基酸(诸如半胱氨酸)的蛋白质。可以比较无限数目的样品。在分开的实验中分析每份样品,而且,如果需要,每次可以参考相同的参照样品。样品和参照样品的实验是不同的实验。通过二维液相层析技术与串联质谱的联合,有可能鉴定掺入未知修饰的蛋白质以及具有相同分子量的不同蛋白质并定量。不需要对肽完全分离;相反,在使用本文所述技术时甚至肽的部分分离就可能足以进行定量。通过该技术的执行,可以在一个自动化步骤中鉴定混合物中的所有蛋白质。
下文附图和详述列出了本发明的一个或多个实施方案的细节。除非另有说明,本文所用所有技术和科学术语具有本发明所属领域普通技术人员通常理解的含义。将本文提及的所有发表物、专利申请、专利、和其它参考文献完整收入本文作为参考。如有冲突,以本说明书(包括定义)为准。本发明的其它特色和优势将通过详述、附图、和权利要求变得清晰。
附图简述
图1是流程图,例示了依照本发明的一个方面用于定量肽混合物中的肽的方法的一种执行方式。
图2是示意图,例示了依照本发明的一个方面定量肽混合物中的肽的可操作系统。
图3是更详细的流程图,例示了依照本发明的一个方面用于定量肽混合物中的肽的方法的一种执行方式。
图4例示了通过本发明一个方面的一种执行提供的五蛋白质混合物的典型离子层析图(序列“TGPNLHGLFGR”是SEQ ID NO25)。
图5A和5B例示了通过本发明一个方面的一次执行提供的典型片段化质谱及其解释(序列“TGPNLHGLFGR”是SEQ ID NO25)。
图6是依照本发明一个方面的一次执行重建的层析峰面积的实例(序列“TGPNLHGLFGR”是SEQ ID NO25)。
图7例示了依照本发明的一个方面重建的肌红蛋白肽和清蛋白肽离子的八份层析图。
图8例示了依照本发明一个方面的肌红蛋白消化物的校准曲线。
图9例示了依照本发明一个方面的细胞色素C的校准曲线。
图10(a)和(b)分别例示了依照本发明的一个方面用250和500fmol肌红蛋白强化的人血浆消化物的基峰离子层析图。
图10(c)和(d)分别例示了依照本发明的一个方面用250和500fmol肌红蛋白强化的人血浆中的经鉴定肌红蛋白肽的重建离子层析图。
图11例示了依照本发明的一个方面不同注入量的肌红蛋白的合并层析峰面积的变化。
不同图中的相同参考编号和名称指相同元素。
发明详述本发明提供了用于定量肽和蛋白质的方法和装置,包括电脑程序。参照图1,依照本发明的一个方面,定量肽混合物中的肽的方法100首先分离由蛋白质样品衍生的肽集合(步骤110)。对分离肽进行质量分析(步骤120)。将分离和质量分析信息用于计算混合物中一种或多种肽各自的丰度(步骤130)。通过比较计算得出的肽的丰度与计算得出的参照样品的丰度,计算指定肽的相对量(步骤140)。可以通过对参照样品执行步骤110至130来计算参照样品的丰度,正如下文将要更加详细描述的。可以对任何数目的样品重复方法100,从而可以对任意(即潜在无限)数目的样品彼此和与参照样品进行比较。在分开的实验中分析每份样品,而且,如果需要,各样品可以参考相同的参照样品。样品和参照样品实验是不同的实验。
在用于本说明书时,肽或多肽指包含两个或多个经肽(酰胺)键相连的氨基酸的聚合分子。在用于本说明书时,肽通常指亲本蛋白质或多肽的亚基,诸如通过酶的蛋白水解切割或者使用化学或物理手段生成的片段。肽和多肽可以是天然存在(如蛋白质或其片段)的或合成的。多肽还可以包括天然存在的氨基酸与非天然存在的氨基酸的组合。肽和多肽可以衍生自任何来源,诸如动物(如人)、植物、真菌、细菌、和/或病毒,而且可以得自细胞样品、组织样品、器官、体液、或环境样品,诸如土壤、水、和空气样品。多肽可以是膜结合的(即跨越脂双层或吸附于脂双层表面)。膜结合多肽可以结合例如质膜、细胞壁、细胞器膜、和病毒衣壳。多肽可以是细胞质的或细胞器的。多肽可以是细胞外的,存在于细胞间隙或体液(如血浆、和脊髓液)中。多肽可以是生物学催化剂、多种分子的转运蛋白或载体、细胞间和细胞内信号的受体、激素、以及细胞、组织和器官的结构元件。一些多肽是肿瘤标记。在用于本说明书时,蛋白质即多肽。
需要指出的是,在质谱领域中针对离子的“质量”常常使用缩略方式,尽管更准确的说是离子的质荷比,这才是真正测量的。出于方便,本说明书采用了此常用实践,并且频繁使用术语“质量”来指质荷比或由所述质荷比数学衍生的量。
图2例示了依照本发明的一个方面用于定量肽混合物中的肽的系统200的一种执行。系统200包括常规构造的一般用途可编程数字电脑系统210,它可以包括存储器和运行分析程序220的一个或多个处理器。电脑系统210连通质谱数据来源230,它可以是质谱仪,诸如LC-MS/MS质谱仪。或者/另外,可以由可与电脑系统210连通的数据库取出质谱数据。电脑系统210还偶联序列信息来源240,诸如氨基酸或核苷酸序列信息的公开数据库。系统200还可以包括输入设备诸如键盘和/或鼠标,和输出设备诸如显示器,以及常规的通讯硬件和软件,由此电脑系统210可以连接其它电脑系统(或质量分析仪230和/或数据库240),诸如通过网络。
图3更详细的例示了依照本发明一个方面的方法300的一种执行。消化将相对于参照样品进行定量的一种或多种蛋白质的实验样品,以生成肽混合物(步骤310)。样品可以是例如凝胶电泳斑点中所包含的只含一种或两种蛋白质的简单混合物;或者,样品可以是更复杂的蛋白质混合物-例如人血浆中所包含的蛋白质样品。样品可以衍生自任何来源,诸如动物(如人)、植物、真菌、细菌、和/或病毒,而且可以得自细胞样品、组织样品、体液、或环境样品,诸如土壤、水、和空气样品。实验样品中的一种或多种蛋白质的量、常常还有身份通常是未知的。可以使用已知技术利用多种蛋白水解酶中的任何种类或者使用已知化学或物理手段消化样品,包括添加的任何内部标准。
分离肽混合物(步骤320)。可以通过多种已知分离方法分离混合物,包括但不限于液相层析、气相层析、电泳、和毛细管电泳,它们可以单独或联合使用。可以根据具体实验和期望的分离选择分离的具体条件,包括例如介质和柱的类型、溶剂和流速。在一个实施方案中,使用反相毛细管柱经一维液相层析分离肽混合物。如果需要更复杂的分离,那么可以采用额外维数的液相层析,诸如二维液相层析,其中包括在强阳离子交换柱上进行的初步分离以及随后的反相毛细管柱层析。在一些情况中,可以进行分离从而由肽混合物分离出一种或多种个别肽,但这并不是必须的。然而,在使用本文所述技术时,甚至肽的部分分离可能就足以进行定量,因为分离过程中两种或多种肽的共洗脱应当不会干扰后续定量。这可能是相对于其它技术而言的重要优点,后者诸如使用UV检测的层析分离,它需要完全的峰分离以进行定量。一般而言,分离越好产生的最终结果将越好(即更好的相对定量信息)。
对分离肽进行质量分析(步骤330)。可以使用具有能够联合液相层析运行的MS和/或MS/MS能力以记录MS和MS/MS数据的任何质谱仪对分离肽进行质量分析。在特定执行中,质谱仪可以是离子捕获质谱仪、三联式四极质谱仪、q-TOF质谱仪、捕获-TOP质谱仪、FT-ICR质谱仪、PSD TOF质谱仪、TOF-TOF质谱仪、或环状捕获(orbitrap)质谱仪。对步骤320中分离的每一种肽或肽组合(如液相层析中的每一个峰)获得完全扫描质谱。然后对完全扫描质谱中的一种或多种离子获得MS/MS谱。
根据对肽生成的串联质谱鉴定一种或多种分离肽及其对应的蛋白质(步骤340)。可以通过将实验性的串联质谱与由数据库(诸如核苷酸或氨基酸序列的公开数据库)的序列信息衍生的理论片段化模式相联系来鉴定肽及其对应的蛋白质。例如,可以使用商品化数据库搜索引擎软件(诸如可以由加利福尼亚州圣何塞市Thermo Finnigan获得的TorboSEQUEST蛋白质鉴定软件)比较针对肽获得的串联质谱与针对序列信息数据库(诸如国家生物技术信息中心(NCBI)、GenBank/GenPept、PIR、SWISS-PROT和PDB数据库)中蛋白质(及其片段)鉴定的理论质谱,从而鉴定肽和蛋白质。也可以使用其它数据库搜索引擎,诸如Mascot、ProFound、SpectrumMill、RADARS、Sonar软件等。可以使用搜索引擎的拟合密切程度或关联评分结果来鉴定肽和蛋白质。
在本发明的一个方面,采用傅立叶变换和质量指纹图谱技术由完全质谱鉴定一种或多种分离肽及其对应的蛋白质。然后将经鉴定的所述一种或多种质量与公开数据库中的数据相匹配。
或者,可以使用从头测序技术对分离肽中的肽进行部分或完全测序,随后在公开数据库中定位由此生成的序列,从而鉴定肽和蛋白质。
然后将步骤330中获得的质谱用于计算经鉴定肽离子的丰度(步骤350)。可以根据在肽的质谱中测量得出的离子强度重建相应的经鉴定肽离子的层析图,从而由每一种经鉴定肽的峰面积计算离子丰度。可以由完全质谱或串联质谱测定峰面积。任选的是,可以将重建层析图和/或计算得出的峰面积图示给用户。
在一种执行中,只根据与鉴定时间紧密相邻的层析峰计算指定肽离子的丰度,以避免由并非特定蛋白质蛋白水解产物的种类生成的但具有相似m/z值的假峰。由此,例如,只能使用鉴定时间的预定阈值距离(即时间)内的峰。可以根据肽在特定层析图区域的典型洗脱时间来确定阈值,这取决于例如所采用的流速、分离技术、柱和分离介质,而且范围可以是由几秒钟到几分钟。消除假峰能够显著改进峰面积测量的精度。在一种执行中,可以使用商品化软件诸如可以由加利福尼亚州圣何塞市Thermo Finnigan获得的Xcalibur软件来计算经鉴定肽离子的峰面积。或者,可以根据峰高而非峰面积来计算离子丰度。
将指定蛋白质的所有经鉴定肽的峰面积加到一起以确定该蛋白质的重建峰面积(步骤360)。或者,可以将每一种经鉴定肽或多肽的峰面积直接与参照样品进行比较。
通过计算实验样品与参照样品中的肽或蛋白质的峰面积的比率来确定实验样品中的指定蛋白质的相对量(步骤370)。参照样品可以是由蛋白质或蛋白质混合物衍生的肽混合物。在一些执行中,预计参照样品包含具有期望获得定量信息的蛋白质。例如,参照样品可以是由已知来源(如健康受试者)采集的肽混合物(如细胞样品、组织样品、体液、等),而实验样品可以是由未知来源(如患病受试者)采集的相似混合物。在一种执行中,实验样品与参照样品基本相似,例如来自健康的活着的受试者的血浆样品与来自患病受试者的血浆样品,预计它们只因少数蛋白质而不同。可以由与图3所示和上文所述相似的顺序衍生参照样品的峰面积-即消化参照样品,分离蛋白质消化物,质量分析,肽鉴定,和层析图重建,以确定参照样品的肽和蛋白质的峰面积方法300可以重复多次(N)以提供多份样品的相对量,而所使用的参照少于N份。由此,例如,可以对在多种条件下采集的蛋白质混合物进行本文所述技术,以测定蛋白质在那些条件下的相对量。
相同样品中肽的峰面积在不同运行之间可能不同。这些差异可能是由多种实验依赖性参数引起的,诸如样品制备的差异(取样误差、不完全消化)或不精确的样品注入。尽管这些实验依赖性参数在任何指定实验中都是未知的,然而预计它们在一次运行中以相同方式影响所有蛋白质。由此可以对针对混合物中的每一种蛋白质计算得出的峰面积进行标准化以校准这些系统误差。
在一些执行中,可以将所有峰面积相对于已知蛋白质的峰面积进行标准化。样品可以包含内部标准。内部标准可以是并非样品中天然存在的而是添加到样品中担当标准化参照物的一种或多种蛋白质-例如以已知量添加到样品中的非天然蛋白质。或者,内部标准可以包括持家蛋白-即在样品来源的介质中通常以相对恒定的浓度存在的蛋白质。在这些情况中,可以将每一种蛋白质的峰面积相对于内部标准的峰面积进行标准化。或者,可以将每一种蛋白质的峰面积相对于混合物中的所有经鉴定蛋白质的总峰面积进行标准化。为了比较只有少数蛋白质浓度不同的相似样品,诸如经过不同药物处理的细胞培养物,可以将峰面积或比率针对明显趋势进行标准化。例如,如果特定实验中蛋白质的预期峰面积与计算峰面积之间的差异有可能是由于样品制备差异引起的,并且预计以相同方式影响一次运行中的所有蛋白质,那么可以根据在两次或多次实验中(或者在实验样品与参照样品之间)保持恒定的所有蛋白质的平均峰面积比率对峰面积进行标准化。可以通过计算峰面积比率的标准偏差(如中值标准偏差(median standarddeviation)),排除比率处于中值标准偏差以外的所有蛋白质,并再次计算其余蛋白质的比率的平均值(如中值),来排除在不同实验中以不同量存在的蛋白质(如需要相对定量信息的蛋白质)。在一种执行中,计算峰面积比率的对数值的标准偏差。在另一种执行中,使用比率的中值,因为它更不易受例外的影响,而且预计是广泛应用领域的最佳方法。也可以使用对峰面积进行标准化的其它已知方法。整个流程可以重复一次或多次以提高相对定量测量的精度。
在本发明的另一个方面,实验样品中的肽的相对定量可以提供实质性的绝对差异信息,因为肽的峰面积与其浓度之间存在线性关系。这将更详细的描述于实施例3、表4和图11。
可以在数字电子线路中或者在电脑硬件、固件、软件中或其联合中执行本发明的各个方面。可以作为电脑程序来执行本发明的一些或所有方面,即确实录入信息载体(如机器可读存储设备或传播信号)的电脑程序,它由数据处理设备(如可编程处理器、电脑、或多部电脑)运行或控制数据处理设备的运转。电脑程序可以书写成任何形式的编程语言,包括编译或解释语言,而且它可以采用任何形式,包括独立程序或者模块、组件、子程序、或适用于计算环境的其它单元。可以采用电脑程序而在一部电脑上或者在一处场所或遍布多处场所且通过通讯网络互相连接的多部电脑上执行。
可以由执行电脑程序的一个或多个可编程处理器来执行本发明的一些或所有方法步骤,从而通过操作输入数据和生成输出结果而执行本发明的功能。还可以通过特殊用途逻辑线路如FPGA(现场可编程门阵列)或ASIC(应用特异集成线路)来执行本发明的方法步骤和本发明的仪器。可以作为电脑控制的自动执行步骤与用户诸如科学家操作的手工执行步骤的联合来执行本发明的方法。
适用于执行电脑程序的处理器包括例如一般和特殊用途的微处理器,以及任何种类的数字电脑的任何一种或多种处理器。一般而言,处理器将由只读存储器或随机存取存储器或二者接收指示和数据。电脑的必需元件是用于执行指令的处理器和用于存储指令和数据的一个或多个存储设备。一般而言,电脑还将包括或操作性地偶联用于存储数据的一个或多个海量存储设备(如磁性、磁-光盘、或光盘)以接收或转移数据或二者兼之。适用于收录电脑程序指令和数据的信息载体包括所有形式的永久存储器,包括例如半导体存储设备,如EPROM、EEPROM、和闪存设备;磁盘,如内部硬盘或可移动盘;磁光盘;以及CD-ROM和DVD-ROM盘。可以在特殊用途逻辑线路中补充或掺入处理器和存储器。
为了提供与用户的交互作用,可以在具有显示设备与键盘和定点设备的电脑上执行本发明,显示设备用于向用户显示信息,如CRT(阴极射线管)或LCD(液晶显示)显示器,通过定点设备用户可以向电脑提供输入,如鼠标或轨迹球。其它种类的设备同样可用于提供与用户的交互作用。
下文实施例将进一步描述本发明,但只是例示性的,而且并非意欲限制权利要求中描述的发明范围。
实施例实施例1将公开的方法用于五种标准蛋白质的混合物-牛清蛋白、马血红蛋白、马铁蛋白、马细胞色素、和马肌红蛋白。前四种蛋白质维持恒定浓度(200fmol),而第五种蛋白质(肌红蛋白)的浓度则大幅变化。将蛋白质消化物的峰面积相对于清蛋白消化物的峰面积进行标准化。整个流程重复三次。三次测量后RSD为20%,对四种恒定浓度蛋白质消化物计算得出的峰面积是恒定的。第五种蛋白质(肌红蛋白)的相对峰面积随着浓度由10fmol升高至1000fmol显示线性增大。
样品制备五种蛋白质以冻干粉的形式购自Sigma公司(圣路易,密苏里州)牛清蛋白,A-7638;马血红蛋白,H-4632;马铁蛋白,A-3641;马肌红蛋白,M-0630;马细胞色素C,C-7752。溶剂和试剂购自以下不同供应商乙腈,目录编号015-1,Burdick & Jackson,马斯基根,密歇根州;水,目录编号4218-02,JT Backer,菲利浦斯勃格,新泽西州;甲酸,目录编号11670,EM Science,Gibbstown,新泽西州;碳酸氢铵,目录编号A-6141,Sigma;测序级经修饰胰蛋白酶,目录编号V5113,Promega,麦迪逊,威斯康星州;碘乙酸,目录编号35603和二硫苏糖醇(DTT),目录编号20290,均购自Pierce,罗克福德,伊利诺斯州。
如下制备蛋白质消化物的贮液。将每一种蛋白质溶于100mM碳酸氢铵缓冲液,并添加DTT进行还原。在用胰蛋白酶消化之前先用碘乙酸将半胱氨酸残基羧甲基化。烷基化步骤使半胱氨酸的分子量增加了58Da。将五种蛋白质消化物的贮液进一步稀释并混合在一起以制备肌红蛋白稀释系列,包括8种混合物。这些混合物的4μl注入等分试样分别包含1、5、10、50、100、200、500、和1000fmol肌红蛋白。每一种注入混合物中都存在200fmol清蛋白、血红蛋白、铁蛋白、和细胞色素C。将五种蛋白质的相同贮液用于制备细胞色素C稀释系列,包括8种混合物。在此系列中,每一种混合物中的细胞色素C的注入量是不同的,分别为1、5、10、50、100、200、500、和1000fmol。在此系列中,清蛋白、血红蛋白、铁蛋白、和肌红蛋白的浓度是恒定的,而且这些蛋白质每一种的注入量都是200fmol。
LC/MS/MSSurveyor HPLC系统(Thermo Finnigan公司,圣何塞,加利福尼亚州)包括自动取样器和高压泵。将肌红蛋白稀释系列的8个4μl等分试样和细胞色素C稀释系列的8个4μl等分试样置于以聚酯密封带(目录号236366,Nalge Nunc,内珀维尔,伊利诺斯州)覆盖的锥形底96孔板(目录号249946,Nalge Nunc)的孔中,然后插入维持于4℃的自动取样器中。依照以下流程在一天内分析所有16份样品。在连续三天内重复分析同一系列,因此来自各个稀释系列的每一种蛋白质混合物都分析了三次。将样品的4μl等分试样由孔底吸入自动取样器针头,并注入20μl样品环中。剩余环注满甲酸在水中的0.1%溶液(“溶剂A”)。在自动取样器针头中和在样品环中,将样品的4μl等分试样夹在两个1μl气泡之间。这种所谓的“无浪费注射”路径能够完全注入小量样品。注入后,关闭自动取样器的阀,并将来自环的样品直接加载到75μm ID×10cm毛细管HPLC柱上,它具有15μm电喷射尖端,装填BioBasic C18固定相,5μm颗粒,300A孔径(New Objective公司,剑桥,马萨诸塞州)。给毛细管柱加载2μl/min的溶剂A等度液流。为了梯度洗脱,将来自泵的50μl/min液流分流成流经柱的0.1μl/min液流。用0.1%甲酸在乙腈中的0-60%线性梯度(“溶剂B”)由柱洗脱肽。使用配备了纳米级电子喷射离子源的LCQ DECA离子捕获质谱仪(都购自Thermo Finnigan,圣何塞,加利福尼亚州)分析洗脱的肽。质谱仪以数据依赖性LC/MS/MS模式操作,其中前体离子选自先前的完全扫描质谱。对选定离子进行碰撞诱导解离,并将其m/z值在1分钟里动态排除进一步片段化。这种自动化分析特点能够在对复杂混合物的LC/MS/MS分析过程中进行多种肽的洗脱(常常是共洗脱)。
使用TurboSequest软件对串联质谱与由国家生物技术信息中心网页http//www.ncbi.nlm.nih.gov/Database/index.html下载的包含马和牛蛋白质的4400种序列的数据库的相关性进行分析。使用通过TurboSequest算法得出的三种相关系数的统一评分(评分=(10000×DelCn2)+Sp)×Xcorr)进一步总结来自相关性分析的输出文件,产生经鉴定肽和相应蛋白质的列表。
五种蛋白质消化物的混合物的典型离子层析图400显示于图4。在此混合物中,所有蛋白质以200fmol水平存在。在LC/MS/MS分析过程中,洗脱肽的完全扫描质谱之后继以串联质谱,在层析图上产生一系列波峰,其中完全扫描质谱与峰高度有关。在分离了单一前体峰并获得了MS/MS时,离子电流下降,在两个波峰之间产生波谷。为了定量测定峰面积,使用来自完全扫描质谱的前体离子强度-即如图4中所示,经过波峰顶端画一条平滑线使离子层析图上的峰平滑。所有经鉴定的消化产物都是在7分钟间隔中洗脱的。在这段时间里获得了大约300份光谱(即每份谱1.4秒钟),一半是MS,另一半是MS/MS。图4还显示了在第33.50分钟洗脱的消化产物的完全扫描MS谱410,以及m/z 585.1的前体离子的MS/MS谱420。后一份质谱中占优势的是b和y型片段,这是离子捕获中碰撞诱导解离的典型模式。使用TurboSequest软件将m/z 585.1的峰鉴定为细胞色素C肽TGPNLHGLFGR(SEQ ID NO25)2+离子。选择m/z 1168.6的峰用于下一个MS/MS扫描中进行片段化,并鉴定为相同肽的单电荷离子,从而确认了鉴定结果。
图5A显示了使用TurboSequest软件自动进行的典型片段化质谱及其解释的实例。该软件将实验性片段化质谱与来自蛋白质数据库的所有肽的理论片段化模式相关联,并报告扫描数目、电荷状态、(M+H)值、由TurboSequest产生的三个主要相关系数(即Xcorr、DeltaCn、Sp)、蛋白质名称、经鉴定的序列、和数个其它参数(图5B)。利用这些参数由假鉴定中过滤出真鉴定。
图4中整个洗脱系列(包括等摩尔混合物)的LC/MS/MS分析重复三次。总共34种肽鉴定为五种蛋白质的混合物的消化产物,包括16种来自清蛋白的肽、7种来自血红蛋白的肽、1种来自铁蛋白的肽、3种来自细胞色素C的肽、和5种肌红蛋白肽。这些肽中的许多种种表现为两种或多种电荷形式。在假定它可能是由带1个、2个、或3个电荷的前体离子产生的前提下,将每一份获得的串联质谱与数据库进行关联性分析三次。将细胞色素C肽TGPNLHGLFGR(SEQ ID NO25)的两种电荷形式在该肽的洗脱过程中进行碰撞诱导解离,以增加TurboSequest鉴定的额外置信度。总共61种离子鉴定为五种蛋白质的混合物的消化产物,或者说每一种肽大约两种离子形式。表1列出了经鉴定肽的序列、它们的电荷状态和m/z值、每一份MS/MS谱与由数据库衍生的理论片段化模式之间的交叉相关系数、以及经鉴定肽的名称及其在NCBI数据库中的gi编号。所有五种蛋白质在三个不同的日子里都得到了明确的鉴定。只有那些鉴定超过一次的肽包括在表1中。
表1
使用Xcalibur软件,应用来自相应完全扫描质谱的离子强度重建每一种经鉴定离子的层析峰面积。图6是细胞色素C肽TGPNLHGLFGR(SEQ ID NO25)2+离子的这种重建离子层析图的实例。此重建离子层析图是只使用m/z 585.1±0.5的质谱峰强度进行作图得到的。自动计算得出的峰面积值(AA值)显示于图6,其中峰面积以任意单位的离子强度乘以秒来报告。
尽管真正的细胞色素C肽在第33.50分钟以0.2分钟峰宽洗脱,然而层析图还显示在第31.66分钟的另一未鉴定峰。此假峰在重建离子层析图上出现,因为它的m/z值585.4接近(在±0.5Da以内)细胞色素C的经鉴定离子的m/z值。如下将此假峰排除在考虑之外。平均而言,层析峰在我们的30分钟0-60%梯度B的基部的宽度为0.2分钟(图6)。因此,只考虑在重建离子层析图上位于它们鉴定时间±0.2分钟以内的峰。这能够排除由并非经鉴定的胰蛋白酶消化产物的种类生成的但具有相似m/z值的假峰。相同规则可用于其它经鉴定离子。这能够显著改进峰面积测量的精度。
图7例示了m/z 748.6(1+)的肌红蛋白肽ALELFR(SEQ ID NO31)(表1中的标号31)和m/z 474.7(3+)、711.0(2+)、和1420.5(1+)的清蛋白肽SLHTLFGDELCK(SEQ ID NO15)(表1中的标号15)的离子的八份重建层析图。这两个峰均在洗脱时只重建第34分钟洗脱时间附近1分钟的小部分层析图。清蛋白浓度在所有八份层析图中都是200fmol,而肌红蛋白浓度则由1fmol至100fmol变化,如图所示。观察到肌红蛋白肽的重建层析峰面积随着肌红蛋白浓度渐增而线性增大,相对对清蛋白肽保持恒定浓度。尽管将重建层析图例示于图7,然而不需要真实展示重建层析图和/或计算的峰面积。
图8例示了与恒定量(200fmol)的清蛋白、血红蛋白、铁蛋白、和细胞色素C混合的肌红蛋白消化物(数量为1、5、10、50、100、200、500、和1000fmol)的校准曲线。y轴是相对于每一份LC/MS/MS数据文件中的清蛋白峰面积进行标准化并将不同日子里的三次测量进行平均的每一种蛋白质的蛋白质消化物峰面积。误差条显示了不同日子里的三个测量值的标准偏差(一个∑)。1fmol和5fmol肌红蛋白的相对标准偏差(RSD)值是60%以上,指示这些测量处于噪音水平。10fmol的RSD是36%,然后在稀释系列的较高浓度跌至15%以下,使得图上大多数数据点的RSD值低于20%。肌红蛋白(未显示)线性走势线的R2=0.9895值指示肌红蛋白消化物的相对峰面积在量由10fmol增至1000fmol时线性增大。对于混合物中以恒定水平存在的蛋白质消化物,在每一天里还测量了8次注入的可重复性,显示优于20%RSD。
对五种蛋白质的混合物重复同组24份LC/MS/MS分析和计算,其中改变细胞色素C的量(1、5、10、50、100、200、500、和1000fmol),并保持清蛋白、血红蛋白、铁蛋白、和肌红蛋白消化物恒定(200fmol)。在不同的日子里将8份LC/MS/MS分析系列重复三次。图9给出了细胞色素C的校准曲线。在图9中,每一个数据点是三次测量的平均值。在肌红蛋白系列中,1fmol和5fmol细胞色素C数据点的RSD很高,指示这些浓度的测量不可重复。10fmol数据点具有33%的RSD,此后可重复性提高至RSD低于20%。R2=0.994是细胞色素C(未显示)校准曲线的线性走势线的参数值。
实施例2将冻干的蛋白质样品(1mg人血清和1mg马肌红蛋白,Sigma-Aldrich,圣路易斯,密苏里州,美国)在1ml碳酸氢铵缓冲液(100mM pH8.5)和3μl DTT(1M,Sigma-Aldrich,圣路易斯,密苏里州,美国)中重溶。将混合物于37℃保温30分钟。为了烷化蛋白质,添加7μl碘乙酸(1M,溶于1M KOH,Sigma-Aldrich,圣路易斯,密苏里州,美国),并将混合物在黑暗中于室温继续保温30分钟。添加13μl DTT(1M)以淬灭碘乙酸。添加20μl胰蛋白酶(0.5mg/ml,Promega,麦迪逊,威斯康星州,美国)以消化还原且烷化的蛋白质。将混合物于37℃保温6小时,然后补加20μl胰蛋白酶(0.5mg/ml),并于37℃继续保温16小时。
将样品消化物的等分试样(如下文所示)置于96孔板的孔中。将板用塑料膜密封以减少蒸发,并置于Surveyor自动取样器中,在此维持于4℃并等待分析。Surveyor自动取样器具备不浪费的注入能力,使得注射体积可以低至1μl。首先以10μl/min的较高流速用3分钟时间将注入肽加载到小型反相肽捕获器聚(苯乙烯-二乙烯基苯)(Michrom Bioresources)上。分流后,由捕获器洗脱肽,随后在反相毛细管柱(Picofrit;5μm BioBasic C18,300A孔径;75μm×10cm;尖端15μm,New Objective)上用30分钟乙腈在0.1%含水甲酸中的0-60%线性梯度进行分离,流速为0.1μl/min。将Surveyor HPLC系统直接偶联Thermo Finnigan LCQ Deca XP离子捕获质谱仪,它配备了纳米级LC电子喷射离子化源。喷射电压是2.0kV,毛细管温度是150℃,并通过35个单位的碰撞能获得了离子捕获碰撞片段化谱。每一个完整质谱之后是三个最强峰的三个MS/MS光谱。启动动态排除。每份样品之后注入10μ1 0.1%含水甲酸进行分析以确保系统的正确平衡。
使用电脑程序Sequest自动鉴定肽和蛋白质,它将实验性的串联质谱与根据氨基酸序列由国家生物技术信息中心(NCBI)序列数据库获得的理论串联质谱相关联。通过联合由Sequest产生的所有三项相关系数的统一评分进一步评估肽鉴定。根据下面的公式计算评分评分=(10000×DelCn2)+Sp)×Xcorr。对于蛋白质,将每一种肽的评分加在一起,并通过将总评分除以肽的数目来计算标准化评分。只接受评分超过2000的肽。使用Xcalibur软件中的Genesis算法来检测峰和计算峰面积。
为了进一步评估用于复杂混合物的蛋白质剖析的定量方法,将人血清(大约1μg总蛋白质)与不同量的马肌红蛋白(250fmol和500fmol)混合,并分析这两种混合物。将胰蛋白酶消化肽在C18柱上用30分钟的0-60%乙腈梯度进行分离。层析图显示于图10。使用来自MS/MS谱和自动化搜索程序Sequest的片段化信息鉴定肽和蛋白质。所有的经鉴定蛋白质概述于表2。在两种样品中能够鉴定与20种不同蛋白质对应的总共56种肽。在两种样品中鉴定了相同的蛋白质,肽的覆盖范围只有微弱差异(数据未显示)。考虑到蛋白质注入量和用于肽分离梯度,在这项研究中鉴定到的肽以及相应地蛋白质的数目很少也就不令人惊讶的。这项研究的焦点不是鉴定样品中最大数目的肽,而是确保在一小段时间里洗脱所有的肽。在使用长达8小时的较长梯度且使用更多材料的类似实验中,可以鉴定超过300种蛋白质。
对于定量分析,由包括5种来自人血清的蛋白质(血清清蛋白、血清转铁蛋白、α-1-抗胰蛋白酶、Igγ4链C区和脱辅基脂蛋白A-1)和马肌红蛋白在内的这6种不同蛋白质选择总共16种肽。超过一种肽得到鉴定的所有蛋白质都包括在定量分析中。如上所述计算这些肽的峰面积,并比较两种样品。两种样品之间的唯一差异是马肌红蛋白的浓度。理论上,人蛋白质的峰面积应当是恒定的,而且只有马肌红蛋白的峰面积应当是变化的。
这次实验的结果概述于表3中。样品1(250fmol肌红蛋白)与样品2(500fmol肌红蛋白)的比较显示样品2的人肽峰面积都大致相同或较小(比率由1.04至0.69),而肌红蛋白肽都较高(比率由1.27至2.29)。将峰面积的比率相对于实验依赖性校准系数进行标准化。此校准系数是如下计算的,排除在中值(0.92)±标准偏差(0.42)以外的所有比率。计算剩余比率的平均值为0.87,并将所有峰面积比率相对于此系数进行标准化。人蛋白质浓度是恒定的,因此峰面积应当具有比率1。血清清蛋白经计算具有比率0.91,血清转铁蛋白经计算是1.05,抗胰蛋白酶经计算是0.84,Igγ4链C区经计算是0.95,而脱辅基脂蛋白A-1经计算是1.10。第二份样品中的肌红蛋白浓度是第一份样品中肌红蛋白浓度的两倍,因此峰面积比率应当是2。事实上,马肌红蛋白的峰面积经计算是1.91。峰面积的计算比率与峰面积的预期比率处于计算蛋白质的16%以内。这些结果确认了肽的峰面积可用于定量评估复杂混合物中的蛋白质。这种方法可用于检测不同样品之间蛋白质浓度的微小变化,并给出关于变化发生的比率的信息。
表2
表3
实施例3通过LC/MS/MS分析11份包含不同量(范围由10fmol至100pmol)的肌红蛋白消化物的等分试样,并计算五种选定肽的峰面积。实验重复三次以确保可重复性。峰面积随着注入肽浓度的升高而增大。在这个实验中,对峰检测的下限是10fmol,上限是100pmol。合并所有五种肌红蛋白肽的峰面积,并针对肌红蛋白的量作图。由10fmol至100pmol,峰面积与肌红蛋白浓度线性相关(r2=0.991),而且结果可重复。关于结果的概述显示于表4和图11。应当注意数值为0的峰面积(见表4)不能在对数刻度上显示,但是包括在线性回归中。
表4马肌红蛋白经过胰蛋白酶消化后的肌红蛋白蛋白水解片段的ESI-MS分析
上文就具体实施方案描述了本发明。其它实施方案属于下文权利要求的范围之内。例如,可以以不同顺序执行本发明的步骤,和/或进行联合,仍然实现期望结果。
另外,上文就与肽、多肽和蛋白质有关的实施方案描述了本发明,它们可以是天然存在的、合成的或其它方式生成的。显然,本文所述技术还可应用于其它物质,例如脂肪酸、DNA、RNA、寡核苷酸、有机或无机分子等。
序列表<110>Thermo Finnigan Corporation<120>生物学分子的定量<130>12671-007WO1<150>US 60/373,007<151>2002-04-15<160>47<170>FastSEQ for Windows Version 4.0<210>1<211>9<212>PRT<213>Bos taurus<400>1Ala Leu Lys Ala Trp Ser Val Ala Arg1 5<210>2<211>10<212>PRT<213>Bos taurus<400>2Glu Ala Cys Phe Ala Val Glu Gly Pro Lys1 5 10<210>3<211>16<212>PRT<213>Bos taurus<400>3Asn Glu Cys Phe Leu Ser His Lys Asp Asp Ser Pro Asp Leu Pro Lys1 5 10 15<210>4<211>17<212>PRT<213>Bos taurus<400>4Cys Cys Ala Ala Asp Asp Lys Glu Ala Cys Phe Ala Val Glu Gly Pro1 5 10 15Lys<210>5<211>11<212>PRT<213>Bos taurus<400>5His Leu Val Asp Glu Pro Gln Asn Leu Ile Lys
1 5 10<210>6<211>14<212>PRT<213>Bos taurus<400>6Tyr Asn Gly Val Phe Gln Glu Cys Cys Gln Ala Glu Asp Lys1 5 10<210>7<211>7<212>PRT<213>Bos taurus<400>7Tyr Leu Tyr Glu Ile Ala Arg1 5<210>8<211>13<212>PRT<213>Bos taurus<400>8Asp Asp pro His Ala Cys Tyr Ser Thr Val Phe Asp Lys1 5 10<210>9<211>15<212>PRT<213>Bos taurus<400>9Lys Val Pro Gln Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg1 5 10 15<210>10<211>12<212>PRT<213>Bos taurus<400>10Arg His Pro Glu Tyr Ala Val Ser Val Leu Leu Arg1 5 10<210>11<211>13<212>PRT<213>Bos taurus<400>11Leu Lys Pro Asp Pro Asn Thr Leu Cys Asp Glu Phe Lys1 5 10<210>12<211>14<212>PRT<213>Bos taurus
<400>12Val Pro Gln Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg1 5 10<210>13<211>10<212>PRT<213>Bos taurus<400>13Lys Gln Thr Ala Leu Val Glu Leu Leu Lys1 5 10<210>14<211>10<212>PRT<213>Bos taurus<400>14Leu Val Asn Glu Leu Thr Glu Phe Ala Lys1 5 10<210>15<211>12<212>PRT<213>Bos taurus<400>15Ser Leu His Thr Leu Phe Gly Asp Glu Leu Cys Lys1 5 10<210>16<211>9<212>PRT<213>Bos taurus<400>16Gln Thr Ala Leu Val Glu Leu Leu Lys1 5<210>17<211>15<212>PRT<213>Equus caballus<400>17Val Gly Gly His Ala Gly Glu Tyr Gly Ala Glu Ala Leu Glu Arg1 5 10 15<210>18<211>12<212>PRT<213>Equus caballus<400>18Asp Phe Thr Pro Glu Leu Gln Ala Ser Tyr Gln Lys1 5 10<210>19<211>16<212>PRT
<213>Equus caballus<400>19Thr Tyr Phe Pro His Phe Asp Leu Ser His Gly Ser Ala Gln Val Lys1 5 10 15<210>20<211>12<212>PRT<213>Equus caballus<400>20Phe Leu Ser Ser Val Ser Thr Val Leu Thr Ser Lys1 5 10<210>21<211>9<212>PRT<213>Equus caballus<400>21Ala Ala Val Leu Ala Leu Trp Asp Lys1 5<210>22<211>9<212>PRT<213>Equus caballus<400>22Met Phe Leu Gly Phe Pro Thr Thr Lys1 5<210>23<211>12<212>PRT<213>Equus caballus<400>23Leu Leu Gly Asn Val Leu Val Val Val Leu Ala Arg1 5 10<210>24<211>13<212>PRT<213>Equus caballus<400>24Gln Asn Tyr Ser Thr Glu Val Glu Ala Ala Val Asn Arg1 5 10<210>25<211>11<212>PRT<213>Equus caballus<400>25Thr Gly Pro Asn Leu His Gly Leu Phe Gly Arg1 5 10<210>26
<211>7<212>PRT<213>Equus caballus<400>26Met Ile Phe Ala Gly Ile Lys1 5<210>27<211>8<212>PRT<213>Equus caballus<400>27Glu Asp Leu Ile Ala Tyr Leu Lys1 5<210>28<211>6<212>PRT<213>Equus caballus<400>28Glu Leu Gly Phe Gln Gly1 5<210>29<211>8<212>PRT<213>Equus caballus<400>29Tyr Lys Glu Leu Gly Phe Gln Gly1 5<210>30<211>15<212>PRT<213>Equus caballus<400>30Val Glu Ala Asp Ile Ala Gly His Gly Gln Glu Val Leu Ile Arg1 5 10 15<210>31<211>6<212>PRT<213>Equus caballus<400>31Ala Leu Glu Leu Phe Arg1 5<210>32<211>15<212>PRT<213>Equus caballus<400>32His Gly Thr Val Val Leu Thr Ala Leu Gly Gly Ile Leu Lys Lys1 5 10 15
<210>33<211>14<212>PRT<213>Equus caballus<400>33His Gly Thr Val Val Leu Thr Ala Leu Gly Gly Ile Leu Lys1 5 10<210>34<211>16<212>PRT<213>Equus caballus<400>34Gly Leu Ser Asp Gly Glu Trp Gln Gln Val Leu Asn Val Trp Gly Lysl 5 10 15<210>35<211>8<212>PRT<213>人(Homo sapiens)<400>35Leu Cys Thr Val Ala Thr Leu Arg1 5<210>36<211>12<212>PRT<213>人<400>36Tyr Ile Cys Glu Asn Gln Asp Ser Ile Ser Ser Lys1 5 10<210>37<211>13<212>PRT<213>人<400>37Cys Cys Ala Ala Ala Asp Pro His Glu Cys Tyr Ala Lys1 5 10<210>38<211>15<212>PRT<213>人<400>38Lys Val Pro Gln Val Ser Thr Pro Thr Leu Val Glu Val Ser Thr1 5 10 15<210>39<211>10<212>PRT<213>人<400>39
Asp Gly Ala Gly Asp Val Ala Phe Val Lys1 5 10<210>40<211>14<212>PRT<213>人<400>40Ser Val Ile Pro Ser Asp Gly Pro Ser Val Ala Cys Val Lys1 5 10<210>41<211>10<212>PRT<213>人<400>41Ser Val Leu Gly Gln Leu Gly Ile Thr Lys1 5 10<210>42<211>10<212>PRT<213>人<400>42Leu Ser Ile Thr Gly Thr Tyr Asp Leu Lys1 5 10<210>43<211>11<212>PRT<213>Equus caballus<400>43Leu Phe Thr Gly His Pro Glu Thr Leu Glu Lys1 5 10<210>44<211>12<212>PRT<213>人<400>44Gly Pro Ser Val Phe Pro Leu Ala Pro Cys Ser Arg1 5 10<210>45<211>10<212>PRT<213>人<400>45Asn Gln Val ser Leu Thr Cys Leu Val Lys1 5 10<210>46<211>11<212>PRT<213>人
Thr His Leu Ala Pro Tyr Ser Asp Glu Leu Arg1 5 10<210>47<211>11<212>PRT<213>人<400>47Ala Thr Glu His Leu Ser Thr Leu Ser Glu Lys1 5 10
权利要求
1.用于对肽混合物中的一种或多种肽进行定量的方法,包括接收包含多种肽的第一肽混合物;在一段时间里分离第一肽混合物所含多种肽中的一种或多种;在该段时间的特定时间对第一肽混合物的一种或多种分离肽进行质荷分析;计算第一肽混合物中一种或多种经过质量分析的肽的丰度;并通过比较计算得出的第一肽混合物的一种或多种经过质量分析的肽的丰度与参照样品中的一种或多种肽的丰度,计算第一肽混合物中所述一种或多种经过质量分析的肽的相对量,所述参照样品对于第一肽混合物而言是外部的。
2.权利要求1的方法,其中接收包含多种肽的第一肽混合物包括消化第一多肽样品以生成该第一肽混合物。
3.权利要求2的方法,还包括通过消化第二多肽样品来制备参照样品;由经过消化的第二多肽样品分离一种或多种肽;对由经过消化的第二多肽样品分离的肽进行质量分析;并计算第二多肽样品中一种或多种经过质量分析的肽的丰度;其中计算第一肽混合物中所述一种或多种经过质量分析的肽的相对量包括比较计算得出的第一肽混合物中所述一种或多种经过质量分析的肽的丰度与计算得出的第二多肽样品中一种或多种经过质量分析的相应肽的丰度。
4.权利要求1的方法,其中分离一种或多种肽包括通过液相层析分离该一种或多种肽。
5.权利要求4的方法,其中分离一种或多种肽包括在特定时间分离液相层析洗脱液;且对第一肽混合物中的一种或多种分离肽进行质量分析包括对分离洗脱液中的一种或多种肽进行质量分析。
6.权利要求1的方法,还包括鉴定第一肽混合物中的一种或多种肽。
7.权利要求6的方法,其中鉴定第一肽混合物中的一种或多种肽包括根据质量分析信息鉴定一种或多种分离肽。
8.权利要求7的方法,其中对一种或多种分离肽进行质量分析包括对由所述一种或多种分离肽中的肽衍生的离子进行片段化并对离子的片段进行质量分析;且鉴定第一样品中的一种或多种肽包括根据片段的质量分析信息搜索序列数据库。
9.权利要求4的方法,其中计算一种或多种经过质量分析的肽的丰度包括根据肽的质量分析信息重建肽的层析峰。
10.权利要求9的方法,其中计算肽的丰度包括根据肽的重建层析峰面积计算肽的丰度。
11.权利要求10的方法,其中计算肽的丰度包括只使用位于特定时间的重建层析图中阈值距离以内的层析峰计算肽的丰度。
12.权利要求10的方法,其中计算所述一种或多种经过质量分析的肽的相对量包括比较通过重建第一肽混合物的肽的层析峰面积计算得出的丰度与通过重建参照样品中的肽的层析峰面积计算得出的丰度。
13.权利要求2的方法,还包括对计算得出的第一肽混合物的所述一种或多种经过质量分析的肽的丰度进行标准化。
14.权利要求13的方法,其中对计算得出的丰度进行标准化包括根据包含添加到第一多肽样品中的一种或多种肽的内部标准对计算得出的丰度进行标准化。
15.权利要求13的方法,其中对计算得出的丰度进行标准化包括根据包含一种或多种肽的外部标准对计算得出的丰度进行标准化。
16.权利要求2的方法,还包括根据质量分析鉴定第一肽混合物中的多种肽;其中计算一种或多种经过质量分析的肽的相对量包括计算每一种经鉴定肽的相对量。
17.权利要求16的方法,还包括根据第一肽混合物中的一组肽的重建层析峰面积计算校准系数,这组肽中的每一种肽在多次实验中具有恒定层析峰面积,并将该校准系数应用于计算得出的每一种经鉴定肽的丰度,从而对计算得出的每一种经鉴定肽的丰度进行标准化。
18.权利要求1的方法,其中在单次自动化实验中进行质量分析和计算步骤以鉴定第一肽混合物中的每一种肽并计算其相对量。
19.权利要求1的方法,其中进行质荷分析和计算步骤的所述一种或多种分离肽是天然存在的肽。
20.权利要求19的方法,其中参照样品中的所述一种或多种肽是天然存在的肽。
21.权利要求1的方法,其中对一种或多种分离肽进行质荷分析并计算一种或多种经过质量分析的肽的丰度包括对第一种混合物中的一种或多种任意肽进行质荷分析并计算丰度。
22.权利要求1的方法,其中分离、质荷分析、和计算步骤不受受试肽的特定氨基酸组成的约束。
23.定量混合物中的一种或多种肽的方法,包括消化蛋白质样品以生成肽混合物;使用液相层析分离肽混合物中的一种或多种肽;对一种或多种分离肽进行质量分析;根据肽的质谱鉴定一种或多种经过质量分析的肽;计算经鉴定肽的层析峰面积;根据计算得出的经鉴定肽的峰面积计算与相应肽对应的一种或多种蛋白质的层析峰面积;根据内部标准的层析峰面积对蛋白质的层析峰面积进行标准化;并通过比较蛋白质的标准化层析峰面积与参照样品中的相应蛋白质的层析峰面积,确定一种或多种蛋白质的相对量。
24.用于定量肽混合物中的一种或多种肽的装置,包括用于接收包含多种肽的第一肽混合物的手段;用于在一段时间里分离第一肽混合物所含多种肽中的一种或多种肽的手段;用于在该段时间的特定时间对第一肽混合物的一种或多种分离肽进行质量分析的手段;用于计算第一肽混合物的一种或多种经过质量分析的肽的丰度的手段;和用于通过比较计算得出的第一肽混合物的一种或多种经过质量分析的肽的丰度与参照样品中的一种或多种肽的丰度,计算第一肽混合物中一种或多种经过质量分析的肽的相对量的手段,所述参照样品对于第一肽混合物而言是外部的。
25.权利要求24的装置,其中用于计算丰度的手段和用于计算相对量的手段是相同的。
26.权利要求24的装置,其中用于进行质量分析的手段是离子捕获质谱仪、三联式四极质谱仪、四极飞行时间质谱仪、捕获飞行时间质谱仪、傅立叶变换离子回旋共振质谱仪、源衰变后飞行时间质谱仪、飞行时间-飞行时间质谱仪或环状捕获质谱仪。
27.权利要求24的装置,其中用于分离的手段包括液相层析、气相层析、电泳和毛细管电泳中至少其一。
28.权利要求27的装置,其中用于分离的手段包括至少二维分离。
29.权利要求24的装置,其中用于计算的手段包括电脑系统。
30.权利要求24的装置,还包括用于接收至少一种额外肽混合物的手段。
31.权利要求30的装置,其中所述至少一种额外肽混合物包括参照样品。
32.权利要求24的装置,其中用于计算丰度的手段还包括参考信息。
33.权利要求24的装置,其中用于进行质荷分析的手段和用于计算的手段被设置成对天然存在的肽进行质荷分析并计算丰度。
34.权利要求33的装置,其中用于计算的手段被设置成将计算得出的一种或多种经过质量分析的肽的丰度与参照样品中一种或多种天然存在的肽的丰度进行比较。
34.权利要求24的装置,其中用于进行质荷分析的手段和用于计算的手段被设置成对第一肽混合物中的一种或多种任意肽进行质荷分析并计算丰度。
35.权利要求24的装置,其中用于分离、质荷分析、和计算步骤的手段被设置成不依赖受试肽的特定氨基酸组成而对一种或多种肽进行分离、质荷分析并计算丰度。
36.用于定量第一肽混合物中的一种或多种肽的电脑可读介质上的电脑程序产品,包括可操作而引起可编程处理器执行以下操作的指示接收代表在一段时间里分离第一肽混合物所含多种肽的一种或多种的分离信息;接收在一段时间的特定时间对第一肽混合物的一种或多种分离肽的质荷分析信息;计算第一肽混合物的一种或多种经过质量分析的肽的丰度;并通过比较计算得出的第一肽混合物的一种或多种经过质量分析的肽的丰度与参照样品中的一种或多种肽的丰度,计算第一肽混合物的一种或多种经过质量分析的肽的相对量,所述参照样品对于第一肽混合物而言是外部的。
37.用于定量第一肽混合物中的一种或多种肽的电脑可读介质上的电脑程序产品,包括可操作而引起可编程处理器进行以下操作的指示接收代表在一段时间里分离第一肽混合物所含多种肽的一种或多种的分离信息;接收在该段时间的特定时间对第一肽混合物中一种或多种分离肽的质荷分析信息;根据肽的质荷分析信息鉴定一种或多种经过质量分析的肽;计算经鉴定肽的层析峰面积;根据计算得出的经鉴定肽的峰面积计算与相应肽对应的一种或多种蛋白质的层析峰面积;根据内部标准的层析峰面积对蛋白质的层析峰面积进行标准化;并通过比较蛋白质的标准化层析峰面积与参照样品中的相应蛋白质的层析峰面积,确定一种或多种蛋白质的相对量。
38.用于定量第一肽混合物中的一种或多种肽的装置,包括设置成执行以下运算的数字电路接收代表在一段时间里分离第一肽混合物所含多种肽中的一种或多种的分离信息;接收在该段时间的特定时间对第一肽混合物的一种或多种分离肽的质荷分析信息;计算第一肽混合物的一种或多种经过质量分析的肽的丰度;并通过比较计算得出的第一肽混合物的一种或多种经过质量分析的肽的丰度与参照样品中的一种或多种肽的丰度,计算第一肽混合物的一种或多种经过质量分析的肽的相对量,所述参照样品对于第一肽混合物而言是外部的。
39.权利要求31的装置,其中该装置包括可编程处理器,而且通过保存在存储器中的由处理器运行的指示来设置该装置。
40.用于定量第一肽混合物中的一种或多种肽的装置,包括设置成执行以下运算的数字电路接收代表在一段时间里分离第一肽混合物所含多种肽中的一种或多种的分离信息;接收在一段时间的特定时间对第一肽混合物的一种或多种分离肽的质荷分析信息;根据肽的质荷分析信息鉴定一种或多种经过质量分析的肽;计算经鉴定肽的层析峰面积;根据计算得出的经鉴定肽的峰面积计算与相应肽对应的一种或多种蛋白质的层析峰面积;根据内部标准的层析峰面积对蛋白质的层析峰面积进行标准化;并通过比较蛋白质的标准化层析峰面积与参照样品中的相应蛋白质的层析峰面积,确定一种或多种蛋白质的相对量。
41.权利要求41的装置,其中该装置包括可编程处理器,而且通过保存在存储器中的由处理器运行的指示来设置该装置。
42.用于定量生物学样品中的一种或多种化合物的方法,包括接收包含多种化合物的生物学样品;在一段时间里分离生物学样品所含多种化合物的一种或多种;在一段时间的特定时间对生物学样品的一种或多种分离化合物进行质荷分析;计算生物学样品中一种或多种经过质量分析的化合物的丰度;并通过比较计算得出的生物学样品的一种或多种经过质量分析的化合物的丰度与参照样品中的一种或多种化合物的丰度,计算生物学样品的一种或多种经过质量分析的化合物的相对量,所述参照样品对于生物学样品而言是外部的。
43.用于定量生物学样品中的一种或多种化合物的装置,包括设置成执行以下运算的数字电路接收包含多种化合物的生物学样品;在一段时间里分离生物学样品所含多种化合物的一种或多种;在一段时间的特定时间对生物学样品的一种或多种分离化合物进行质荷分析;计算生物学样品的一种或多种经过质量分析的化合物的丰度;并通过比较计算得出的生物学样品的一种或多种经过质量分析的化合物的丰度与参照样品中的一种或多种化合物的丰度,计算生物学样品的一种或多种经过质量分析的化合物的相对量,所述参照样品对于生物学样品而言是外部的。
全文摘要
本发明公开了用于对肽混合物中的肽进行定量的方法和装置,包括电脑程序产品。其中接收包含多种肽的肽混合物。在一段时间里由肽混合物分离一种或多种肽。对特定时间分离的一种或多种肽进行质荷分析,并计算一种或多种经过质量分析的肽的丰度。通过比较计算得出的肽的丰度与相对于第一肽混合物而言属外部的参照样品中一种或多种肽的丰度,计算所述一种或多种经过质量分析的肽的相对量。该技术可用于任意肽,无需使用不同的质量标记,而且可用于其它生物学分子,诸如核酸和小分子。
文档编号G01N30/88GK1692282SQ03813860
公开日2005年11月2日 申请日期2003年4月15日 优先权日2002年4月15日
发明者P·V·邦达尔科, T·A·沙尔特, D·H·彻里尤斯 申请人:萨莫芬尼根有限责任公司