专利名称:方法、阵列及其用途的制作方法
技术领域:
本发明涉及乳癌的预后方法以及用于该方法的生物标记物和阵列。
背景技术:
乳癌是西方世界最常见的肿瘤类型之一,其影响了十分之一以上的女性(I)。所有恶性诊断的四分之一是乳癌,从1990年后期以来全球的发生率持续增加,特别是45至70的年龄组,尽管在过去的几年期间发生率稍有所下降。该下降的一个解释是早期的筛选活动(乳房照相)和内分泌和抑制细胞的治疗改善了生存。尽管有所下降,乳癌仍然是在美国每天杀死超过100名的女性。而且,尽管早期检测和对乳癌分子基础的理解的改善,所有原发乳癌患者的大约30%将发生疾病的远端复发(即,转移)(2)。一旦转移性疾病发生,治愈的可能性非常有限,或者不存在。为了提供具有增加的效率和较低毒性的更好的治疗,必须基于肿瘤的临床和分子特征选择疗法。今天,使用传统的临床预报因子(climical predictor),例如组织学分级和淋巴结状态,仅有有限的可能性预测疾病的结果(3,4)。最近,使用大量不同基因的表达分析,基因组研究开启了鉴定无复发生存有关的预后不良的患者的可能性(5,6)。但是,尽管极大的努力,目前不可能使用简单的血液样本测试进行乳癌转移的风险评估,尽管最近在亲和蛋白质组学中的发展推进了癌症生物标记物领域(7-9)。血清是一个特别有价值的来源,因为其不仅仅对疾病的最初筛选有用,其也可以用于疗法效率的连续监测和分析,这与基于在手术时进行的测量的预报因子相反。因而,存在对乳癌预后的改善方法的需要,特别是,发生疾病远端复发(B卩,转移)的风险。在此背景下,本发明人现在开发了一种对乳癌预后的蛋白质组学的、基于血清的方法,并鉴别了一系列用于确定发生疾病的远端复发(即,转移)的风险的血清生物标记物。
发明内容
因而,在第一方面,本发明提供了一种用于受试者中乳癌预后的方法,其包括步骤(a)提供来自受试者的第一蛋白质组样本;(b)测量第一蛋白质组样本中选自表I所列的生物标记物的一个或多个生物标记物的量;(C)提供来自受试者的另外的(例如,第二)蛋白质组样本;(d)测量另外的蛋白质组样本中步骤(b)所测量的选自表I所列的生物标记物的一个或多个生物标记物的量;和(e)确定第一蛋白质组样本和另外的蛋白质组样本中一个或多个生物标记物的量之间的差异;
其中,第一蛋白质组样本和另外的蛋白质组样本代表受试者在不同天的蛋白质组组合物,且其中,第一和另外的(例如,第二)蛋白质组样本中一个或多个生物标记物的量之间的差异指示受试者中乳癌的复发和/或转移的风险。通过“乳癌的预后”,我们指确定受试者中乳癌复发的风险。这种风险可以表示为在特定期间内乳癌复发的可能性,例如在进行预后之日的一、两、三、四、五或十年内。应当理解在本发明的方法中被检测的受试者典型地是人。但是,本方法还可被用于动物例如驯养的或农场哺乳动物(例如,马、猪、牛、羊、狗或猫)的预后。本发明的方法中的步骤(a)和(C)包括提供来自待测受试者的第一和另外的蛋白质组样本。通过“蛋白质组样本”,我们指待测的受试者细胞表达的蛋白质样本。蛋白质组样本还可以包括其它的生物分子,或其成分或片段,其测量可以提供乳癌预后中有用的信息。例如,蛋白质组样本可以包括蛋白质或碳水化合物配基、或其抗原成分或片段。 在一个实施方式中,蛋白质组样本是可溶解的蛋白质组样本。优选地,步骤(a)和(C)中提供的蛋白质组样本是血液样本。在一个实施方式中,血液样本是未分级的(即,没有通过离心或任何其它方式将血液分成其组成部分)。在另一个实施方式中,血液样本是分级的。因而,蛋白质组样本可以是血清或血浆或可以源自血清或血浆。优选地,步骤(a)和/或(C)中提供的蛋白质组样本是血清或血浆样本,其源自待测受试者的血液样本。可以通过本领域公知的方法制备步骤(a)和(C)中提供的蛋白质组样本。本领域技术人员将理解样本可以是天然状态或被消化的形式,其取决于用于检测此处蛋白质的方法。在一个实施方式中,收集自个体的一个或多个样本是血液样本,其余的是血清样本。但是,优选的是,收集自个体的样本全部是血液样本或全部是血清样本。在步骤(a)和(C)中提供的蛋白质组样本代表受试者蛋白质组组合物。通过“代表受试者蛋白质组组合物”我们指蛋白质组样本体现在样本提供时受试者的真实蛋白质组组合物。蛋白质组样本可以是,例如,直接取自受试者的液体或组织样本,或这种样本的加工衍生物。在步骤(a)和(C)中提供的蛋白质组样本收集自不同天的受试者,因而其代表受试者在不同天的蛋白质组组合物。通过“代表受试者在不同天的蛋白质组组合物”,我们指每个另外的或进一步的样本代表在比提供在先的蛋白质组样本较晚的时间点的受试者的蛋白质组组合物。在一个实施方式中,为了提供一个或多个来自受试者的进一步的蛋白质组样本,以及为了测量在步骤(b)中测量的一个或多个生物标记物的量,重复步骤(c)和(d),其中一个或多个进一步的蛋白质组样本代表来自第一个和另外的蛋白质组样本的受试者在不同天的蛋白质组组合物。因而,可提供来自受试者的多个另外的蛋白质组样本,例如,第三、第四、第五、第六(等等)蛋白质组样本。应当理解提供的来自受试者的蛋白质组样本的数目可足以提供和/或确认和/或监测乳癌的预后。 在一个实施方式中,步骤(e )包括确定第一蛋白质组样本和另外的蛋白质组样本之间的生物标记物的量的对数改变。可以确定两个或更多蛋白质组样本间一个或多个生物标记物的存在和/或量中的对数改变。随时间的生物标记物的量的差异已知为“生物标记物速率”,并可以使用本领域公知的任何方法计算(例如,参见Makarov等人,2009, Ann. Rev.Med. ,60:139-151)。因而,生物标记物速率反映了生物标记物浓度(B卩,量)随着时间,而不是随着其绝对或静态浓度/量的改变的比。本发明方法的步骤(d)和(b)包括测量蛋白质组样本中选自表I所列的生物标记物的一个或多个生物标记物的量。通过“生物标记物”,我们指天然发生的生物分子、或其成分或片段,其测量可提供乳癌预后中有用的信息。例如,生物标记物可以是天然发生的蛋白或碳水化合物部分,或其抗原成分或片段。因而,可以测量载脂蛋白(Apolipoprotein)A4 (AP0A4)的量。可以测量载脂蛋白A4 (AP0A4)的量。可以测量布鲁顿酪氨酸激酶(Bruton’s tyrosine kinase)(BTK)的量。可以测量补体I酯酶抑制因子(Complement-lesterase inhibitor)(Cl酯酶抑制因子)的量。可以测量补体因子B(因子B)的量。可以测量⑶40的量。可以测量同源域转录因子(Homeodomaintranscription factor )CHX10 (CHXlO)的量。可以测量白介素-Ια (IL-la)的量。可以测量白介素_5 (IL-5)的量。可以测量白介素-6 (IL-6)的量。可以测量白介素-7 (IL-7)的量。可以测量白介素-9 (IL-9)的量。可以测量白介素-12 (IL-12)的量。可以测量白介素-13 (IL-13)的量。可以测量白介素-18 (IL-18)的量。可以测量TBCl结构域家族成员9 (KIAA0882)的量。可以测量Lewisx/⑶15的量。可以测量氧甾酮结合蛋白样3(oxysterol binding protein_like3) (0SBPL3)的量。可以测量单核细胞趋化蛋白一I(MCP — I)的量。可以测量唾液酸化Lewisx (Sialyl Lewisx)的量。可以测量肿瘤坏死因子一1β (TNF-β)的量。可以测量整联蛋白α — 10的量。可以测量β —半乳糖苷酶的量。可以测量⑶40配体的量。可以测量嗜酸粒细胞趋化因子(Eotaxin)的量。可以测量胰高血糖素样肽一 I受体(GLP — IR)的量。可以测量白介素一 I β的量。可以测量白介素一 3的量。可以测量白介素一 8的量。可以测量白介素一 10的量。可以测量白介素一 16的量。可以测量MCP — 4的量。可以测量肌间蛋白一 2 (ΜΥ0Μ2)的量。可以测量Rantes (无对应译文)的量。可以测量转化生长因子一 iKTGF-βΙ)的量。可以测量无义转录子3Β调节子(UPF3B)的量。可以测量白介素一 4的量。可以测量白介素一 Ira的量。在一个实施方式中,步骤(b)和步骤(d)包括测量表I (A)所列的各个生物标记物的量。在另一个实施方式中,步骤(b)和步骤(d)另外地或可替代地包括测量选自表I(B)所列的一个或多个生物标记物的量,例如2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18或全部19个选自表I (B)所列的生物标记物。
因而,本发明方法的一个实施方式中,在步骤(b)和步骤(d)中测量表I (A)和I(B)所列的全部生物标记物的量。在进一步的实施方式中,步骤(b)和步骤(d)另外地或可替代地包括测量表I (C)中另外地或可替代地一个或多个生物标记物的量,例如,另外地或可替代地2、3、4、5、6、7、8、9、10、11、12、13、14或全部15个表I (C)中的生物标记物。因而,在本发明方法的一个实施方式中,在步骤(b)和(d)中测量表I所列的全部生物标记物的量。典型地,使用各自能够结合表I所列的生物标记物的一个或多个第一结合试剂进行步骤(b)和步骤(d)。典型地,各第一结合试剂能够特异地结合来自表I所列的那些的不同生物标记物。但是,本领域技术人员将理解在与第一结合试剂结合的生物标记物中有一些重复。例如,两个或更多第一结合试剂可以结合相同生物标记物的不同表位(靶抗原的这种重复可作为本发明方法的有用的内部对照,以保证生物标记物测量是准确的)。优选地,使用两个或更多的能够结合表I所列的生物标记物的结合试剂进行步骤(b)和步骤(d)。当在步骤(b)和(d)中测量表I所列的生物标记物时,优选使用如实施例部分(下面)定义的结合试剂进行这种测量。但是,应当理解可以等同地使用对相关生物标记物具有特异性的任何其它结合试剂。在一个实施方式中,在步骤(a)中的来自受试者的第一蛋白质组样本代表个体肿瘤切除术前或后4周内受试者的蛋白质组组合物。典型地,来自个体的第一蛋白质组样本代表个体肿瘤切除术前4周的受试者蛋白质组组合物,例如,个体肿瘤切除术前3周、2周、I周、6天、5天、4天、3天、2天、I天或O天。优选地,来自个体的第一蛋白质组样本代表个体肿瘤切除术前I周内的受试者蛋白质组组合物。更优选地,来自个体的第一蛋白质组样本代表与个体肿瘤切除术同一天的受试者蛋白质组组合物。通过“肿瘤切除术”,我们指手术切除全部或部分肿瘤。但是,我们还包括任何其它主要的治疗方法。根据乳癌的阶段和类型,肿瘤切除术可不被用作主要的治疗方法或可次要于其它的治疗方法,例如放射治疗(即,放疗)、冷冻疗法、光动力学疗法、化疗、激素治疗和免疫疗法。在这些情况中,在王要的非手术治疗的起始和完成之间的起始、完成或中间期间可用作收集个体蛋白质组样本的参照点。因而,通过“个体的肿瘤切除术之前或之后”我们也包括主要治疗方法的起始和完成之间的起始、完成或中间期间之前或之后,其作为收集个体血清或血浆样本的可能参照点。在一个实施方式中,步骤(C)中提供的来自个体的另外的(例如,第二)蛋白质组样本代表在个体肿瘤切除术的3至9个月内的时间点上受试者的蛋白质组组合物,例如,从肿瘤切除术4至8个月内、5至7个月内或6个月。因而,来自个体的另外的蛋白质组样本可以代表个体肿瘤切除术40周内受试者的蛋白质组组合物,例如,在个体肿瘤切除术后39周、38周、37周、36周、35周、34周、33周、32周、31周、30周、29周、28周、27周、26周、25周、24周、23周、22周、21周、20周、19周、18周、17周、16周、15周、14周、13周、12周、11周、10周、9周、8周、7周、6周、5周、4周、3周、2周、或I周内。然而,典型地,另外的蛋白质组样本代表个体肿瘤切除术的6个月内的受试者蛋白质组组合物。
当重复步骤(C)和(d)时,一个或多个进一步的蛋白质组样本(即,第三、第四、第五、第六样本等)代表受试者肿瘤切除术的定期周年的受试者蛋白质组组合物。因而,另外的样本可以代表肿瘤切除术后每一个月或更多的时间间隔的受试者蛋白质组组合物,例如,每两个月、三个月、四个月、五个月、六个月、七个月、八个月、九个月、十个月、i^一个月、一年、两年、三年、五年或更久。但是,典型地,一个或多个进一步的蛋白质组样本代表肿瘤切除术的年度周年前或后8周内受试者的蛋白质组组合物,例如在个体肿瘤切除术的年度周年前或后的大约7周、6周、4周、3周、2周或I周内。因而,优选一个或多个进一步的蛋白质组样本代表在或大约在个体肿瘤切除术年度周年的受试者的蛋白质组组合物。但是,应当理解进一步的蛋白质组样本可以代表个体中肿瘤切除术后至少一年的受试者的蛋白质组组合物,例如个体肿瘤切除术后至少2年、3年、4年、5年、6年、7年、8年、9年、或至少10年。在一个实施方式中,肿瘤切除术是原发乳癌的肿瘤切除术。通过“原发乳癌”,我们指肿瘤位于癌症起始的器官或组织。在一个可替代的实施方式中,肿瘤切除术是继发乳癌肿瘤切除术。通过“继发乳癌”,我们指肿瘤位于与癌症起始不同的器官或组织(即,转移性肿瘤)。在进一步的实施方式中,向受试者施用或已经向受试者施用化疗和/或放疗。在一个实施方式中,步骤(b)和(C)包括个体的连续监测。通过“连续监测”,我们包括在不间断的、反复的基础上常规进行测量(即,以常规的短时间间隔,重复测量)。我们还包括在不间断的、非反复的基础上进行测量(即,实时测量)。可手工地进行连续监测,但优选通过自动(例如,基于计算机的)系统进行。在一个实施方式中,个体中乳癌复发的风险确定为乳癌复发的数值概率,例如,确定为给定期间内乳癌复发的百分比概率。但是,在一个可替代的实施方式中,个体中乳癌的风险确定为高风险或低风险。因而,将根据乳癌复发(即,转移)将待测个体分为“高风险”或“低风险”组。通过“高风险”,我们指个体具有至少72%的机会在个体肿瘤切除术(特别是,个体的原发肿瘤切除术)的3年复发乳癌。例如,在个体肿瘤切除术的3年,个体可能具有73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的机会复发乳癌。通过“低风险”,我们指在个体的肿瘤切除术的3年(特别地,个体的原发肿瘤切除术),个体具有最多15%的机会复发乳癌。例如,在个体肿瘤切除术的3年,个体可具有14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%、0· 5%、0· 25%,O. 1%、0· 01% 或 0% 的机会复发乳癌。一般而言,个体中乳癌复发的风险由至少O. 55的ROC AUC确定,例如由至少O. 60、
O.65,0. 70,0. 75,0. 80,0. 85,0. 90,0. 95,0. 96,0. 97,0. 98 的 ROC AUC 或由至少 O. 99 的 ROC
AUC0优选,个体中乳癌复发的风险由至少O. 85的ROC AUC确定。典型地,使用支持向量机(SVM)确定个体中乳癌复发风险,例如从http://cran.r-project.org/web/packages/el071/index.html (如 el0711. 5-24)获得的那些。但是,也可以使用任何适当的方法。 支持向量机(SVM)是用于分类和回归的一套相关监督学习方法。指定一套训练的例子,各标记为属于两个类别中的一个,SVM训练算法建立了一个模型来预测新的例子是否属于一个类别或另一个类别。直观地,SVM模型代表作为空间点的例子,例子经过绘图从而使得独立类别的例子被尽可能宽的明确缺口分隔开。然后将新的例子绘制到相同的空间,并根据其落入缺口的哪一侧来预测其所属的类别。更形式地,支持向量机在一个高的或无限的三维空间构成了一个超平面或一组超平面,其可被用于分类、回归或其它任务。直观地,通过到任何种类的最近训练数据点具有最大的距离(所谓的功能边缘)的超平面实现良好的分离,因为一般而言边缘越大,分类器(classifier)的概括误差越低。更多的关于SVM的信息参见例如Burges, 1998, Data Miningan (!Knowledge Discovery, 2:121 - 167。在本发明的一个实施方式中,在进行本发明的方法之前,使用来自指定到已知患者组的受试者(即,在给定期间内不复发乳癌的那些患者和在给定期间内复发乳癌的那些患者)的蛋白质组样本“训练” SVM。通过运行这种训练的样本,SVM能够学习哪种生物标记物谱与乳癌复发的风险相关。一旦训练过程完成,而后SVM能够所检测的蛋白质组样本是否是来自处于乳癌复发风险的受试者。 但是,这种训练程序可通过预先编程具有必要的训练参数的SVM而被省略。例如,基于表I (A)和I (B)所列的全部生物标记物的测量,可根据表2中详细的已知SVM参数确定受试者中乳癌复发的风险。本领域技术人员将理解,通过用适当选择的数据训练SVM机(B卩,在来自已知患者组的蛋白质组样本中的生物标记物测量)能够确定对于表I所列生物标记物的任何组合的合适SVM参数。在一个实施方式中,联合确定乳癌复发风险的至少一个其它方法确定乳癌复发的风险,例如联合与乳癌复发风险相关的一个或多个核酸表达谱。例如,可以使用如 van,t Veer 等人,2002, Nature, 415:530-536 和 / 或 Paik 等人,2004, N. Engl. J.Med. ,351:2817 - 2826中定义的核酸表达谱。可替代地或另外地,可联合传统的临床标记物确定乳癌复发的风险。通过“传统的临床标记物”,我们指基于临床特性例如绝经状态、雌激素受体状态、孕酮状态、导管/小叶类型、肿瘤大小、淋巴结阶段/状态和组织分级将患者分类为不同预后的组(与复杂的表达标志(signature)的表达相反)。使用传统临床标记物的预后指数的一个常规例子是诺丁汉预后指数(Nottingham Prognostic Index (NPI)),其来自多变量研究的回顾,能够(在某种程度上)预测患有乳癌的患者的生存。至于更多的信息,参见例如Ed6n等人,2004,EuropeanJournal ofCancer, 40(12):1837-1841。在进一步的实施方式中,能够结合表I中定义的生物标记物的一个或多个结合试剂包括或由抗体或其抗原结合片段组成。优选地,抗体或其抗原结合片段是单克隆抗体或其片段。更优选地,抗体或其抗原结合片段是重组抗体或其抗原结合片段。术语“抗体”包括任何合成的抗体、重组抗体或杂交抗体,例如但不局限于由免疫球蛋白轻和/或重链可变和/或恒定区的噬菌体展示产生的单链抗体分子,或在本领域技术人员公知的免疫分析形式中能够结合抗原的其它免疫相互作用分子。我们还包括抗体样结合试剂的使用,如亲和体(affibodies)和适体(aptamers)。获得对指定抗原(例如表I中的生物标记物)具有特异性的抗体或其抗原结合片段或衍生物的方法是本领域公知的。涉及保留其特异的结合位点的抗体片段的合成技术的总体回顾可见于 Winter&Milstein(1991)Nature349, 293-299 中。另外地或可替代地,一个或多个第一结合分子可以是适体(参见Collett等人2005, Methods37:4-15)。便利地,筛选抗体库(例如BioInvent International AB 的 n-CoDeR 库;参见 Carlsson& Soderlincl 2001, ExpertRevMolDiagn. 1:102-8)鉴定具有所需结合特异性的抗体、或其抗原结合片段或衍生物。因而,分子库例如抗体库(Clackson等人,1991,Nature352, 624-628 ;Marks 等人,1991,JMolBiol222 (3) : 581-97)、肽库(Smith, 1985,Science228 (4705) : 1315-7),表达的 cDNA 库(Santi 等人(2000)JMolBiol296 (2) : 497-508)、在抗体框外的其它支架上的库,例如亲和体(Gunneriusson等人,1999,Appl Environ Microbiol65 (9) : 4134-40)或基于适体的库(Kenan 等人,1999,Methods Mol Biolll8,217-31)可被用作来源,从其中选择用于本发明方法中的对给定基序特异的结合分子。可在原核细胞(Clackson等人,1991, op. cit. ;Marks 等人,1991, op. cit.)或真核细胞(Kieke 等人,1999, Proc NatlAcadSci USA, 96 (10) : 5651-6)中体内表达分子库,或在不涉及细胞的体外表达分子库(Hanes&Pluckthun, 1997,Proc NatlAcad Sci USA94 (10)
:4937-42; He&Taussig, 1997,Nucleic Acids Res25 (24) : 5132-4; Nemoto 等人,1997,FEBSLett, 414(2):405-8)。在使用基于蛋白的库的情况下,编码潜在结合分子的库的基因经常包裹于病毒中,且潜在结合分子展不在病毒表面(Clackson等人,1991,如前所述;Marks等人,1991,如前所述;Smith, 1985,如前所述)。也许最常用的展示系统是在其表面展示抗体片段的丝状噬菌体,抗体片段作为与曬菌体较小衣壳蛋白的融合蛋白而被表达(Clackson等人,1991,如前所述;Marks等人,1991,如前所述)。但是,其它适合的用于展示的系统包括使用其它病毒(EP39578)、细菌(Gunneriusson 等人,1999,如前所述;Daugherty 等人,1998, Protein Engll (9) :825-32 ;Daugherty 等人,1999,Protein Engl2(7):613-21)和酵母(Shusta 等人,1999,JMolBiol292(5):949_56)。另外,已经开发了在所谓的核糖体展示系统中利用多肽产物与其编码mRNA的链接(Hanes&Pluckthun, 1997,如前所述;He&Taussig, 1997,如前所述;Nemoto 等人,1997,如前所述)、或多肽产物与编码DNA的链接(参见,US专利号5,856,090和W098/37186)的
展示系统。抗体的可变重(Vh)和可变轻(')结构域参与抗原识别,抗原识别是早期蛋白酶消化实验所第一次认识的事实。进一步的确认由啮齿动物抗体的“人源化”发现。啮齿动物来源的可变结构域可被融合至人源的恒定结构域,从而得到的抗体保留啮齿动物亲代抗体的抗原特异性(Morrison 等人(1984)Proc. Natl. Acad. Sc1. USA81, 6851-6855)。抗原特异性由可变结构域赋予,其不依赖恒定结构域,这是从涉及均包含一个或多个可变结构域的抗体片段的细菌表达实验所获知的。这些分子包括Fab样分子(Better等人(1988) Science240, 1041) ;Fv 分子(Skerra 等人(1988) Science240, 1038);单链Fv (ScFv)分子,其中Vh和Vlj伙伴分子(partner)结构域通过柔韧的寡肽连接(Bird等人(1988) Science242, 423; Huston 等人(1988) Proc. Natl. Acad. Sc1. USA85, 5879)且单结构域抗体(dAbs)包含分离的V结构域(Ward等人(1989)Nature341, 544)。涉及合成保留其特异的结合位点的抗体片段的技术总体回顾可见于Winter&Mi I stein (1991)Nature349, 293-299。因而,抗体或抗原结合片段可选自完整的抗体、Fv片段(如单链Fv[SCFv]和二硫键Fv)、Fab样片段(如,Fab片段、Fab’片段和F(ab)2片段)、单可变结构域(如Vh和\结构域)和结构域抗体(dAbs,包括单和双形式,(即dAb —接头一 dAb))。通过“scFv分子”,我们指这样的分子,其中Vh和\伙伴分子结构域通过柔韧的寡肽连接。使用抗体片段而不是整个抗体的优点是多方面的。片段的较小尺寸可以导致改善的药理学特征,例如更好的实体组织穿透性。排除了整个抗体的效应子功能,例如补体结合。Fab、Fv, ScFv和dAb抗体片段均可以在大肠杆菌中表达并从其分泌,因而允许容易的生产大量所述片段。
整个抗体和F (ab’) 2片段是“二价的”。通过“二价”,我们指所述抗体和F (ab’) 2片段具有两个抗原结合位点。相反地,Fab、Fv、ScFv和dAb片段是单价的,仅具有一个抗原结合位点。抗体可以是单克隆抗体或多克隆抗体。适合的单克隆抗体可以通过已知的技术制备,例如 “MonoclonalAntibodies: Amanual oftechniques”,H Zola (CRC Press, 1988)和“Monoclonal Hybridoma Antibodies:Techniques and applications,,, J G R Hurrell (CRCPress, 1982)中公开的那些,二者均在此引作参考。当潜在结合分子选自库时,通常利用一个或多个具有明确基序的筛选肽。在设计筛选肽的基序时,可使用这样的氨基酸残基,其提供结构、降低的肽中柔韧性或带电荷的、极性的或疏水侧链,这允许与结合分子的相互作用。例如(i)脯氨酸可以稳定肽结构,由于其侧链既与α碳结合又与氮结合;(ii)苯丙氨酸、酪氨酸和色氨酸具有芳香侧链,是高度疏水的,而亮氨酸和异亮氨酸具有脂肪侧链,也是疏水的;(iii)赖氨酸、精氨酸和组氨酸具有碱性侧链,在中性pH下将带正电荷,而天冬氨酸和谷氨酸具有酸性侧链,在中性PH下将带负电荷;(iv)天冬氨酸和谷氨酸在中性pH下是中性的,但含有可以参与氢键的酰胺基;(V)丝氨酸、苏氨酸和酪氨酸侧链含有羟基,其可参与氢键。典型地,结合分子的选择可涉及分析结合至对应结合分子类型的点的阵列技术和系统的使用。因而,应当理解抗体或抗原结合片段可以选自完整的抗体、Fv片段(如,单链Fv和二硫键的Fv)、Fab样片段(如Fab片段、Fab’片段和F(ab)2片段)、单链可变结构域(如Vh和\结构域)和结构域抗体(如,包括单和双形式的dAbs (即dAb —接头一 dAb))。可选地,第一结合试剂可包括或由抗体样结合试剂,例如亲和体或适体组成。在一个实施方式中,一个或多个选自表I中定义的生物标记物被可检测的配基(moiety)标记。优选地,所有样本的有机分子被可检测分子标记。通过“可检测的配基”,我们包括允许直接或间接确定其存在和/或相对的量和/或位置(例如,阵列上的位置)的配基。合适的可检测配基是本领域公知的。优选地,可检测配基选自荧光配基;发光配基;化学发光配基;放射性配基;酶配基;配体配基或配体结合配基。例如,可检测配基可以是荧光的和/或发光的和/或化学发光的配基,当暴露于特异条件时,其可被检测。这种荧光配基可能需要暴露于特定波长和强度的辐射下(即,光),以引起荧光配基的激发,从而使其能够在可被检测的特定波长下发射可检测的荧光。可选地,可检测的配基可以是酶,其能够使底物(优选不能检测的)转化为可被目测的和/或被检测的可检测产物。适合的酶的例子在以下详细讨论,例如,涉及ELISA分析。在进一步的实施方式中,可检测配基可以是用于成像的放射性原子。适合的放射性原子包括用于闪烁法研究的99mTc和1231。其它便捷的可检测配基包括,例如,用于磁共振成像(MRI)的旋转标记,例如还是1231、m1、mIn、19F、13C、15N、170、钆、锰或铁。清楚地,将被检测的试剂(如,例如在此处描述的检测样本和/或对照样本中的一种或多种蛋白和/或用于检测选定蛋白的抗体分子)必须具有足够的适当的原子同位素,以便使可检测配基被便捷地检测。放射或者其它标记可以已知的方式整合至本发明方法的样本中存在的蛋白和/或本发明的结合试剂中。例如,如果结合试剂是多肽,其可以被生物合成或可以通过使用合适的氨基酸前体的化学氨基酸合成而被合成,所述合适的氨基酸前体包括,例如,代替氢的氟-19。标记,例如99mTc、1231、186RK 188Rh和111In,例如能通过结合配基中的半胱氨酸残基被连接。钇一 90能通过赖氨酸残基被连接。可使用I0D0GEN方法(Fraker等人(1978)Biochem. Biophys. Res. Comm. 80, 49-57)整合 123I。参考(“Monoclonal Antibodies inImmunoscintigraphy”,J-F Chatal, CRC Press, 1989)详细地描述了其它方法。用于将其它可检测配基(例如酶、荧光、发光、化学发光或放射性配基)缀合至蛋白的方法是本领域公知的。本领域技术人员将理解待检测样本中的蛋白可以被配基标记,该配基间接地辅助确定所述蛋白的存在、量和/或位置。因而,配基可构成多成分可检测配基中的一个成分。例如,待检测样本中的蛋白可以被生物素标记,其允许随后使用融合至或其它方式连接至可检测标记的链霉亲和素进行检测。在进一步的实施方式中,步骤(b)和/或步骤(d)使用阵列进行。阵列本身是本领域公知的。典型地,其由具有空间分隔(即,分离的)区(“点”)的线性或二维结构所形成,每个区具有有限的面(area),其在固体支持物的表面形成。阵列也可以是珠的结构,其中每个珠可通过分子码或颜色码进行识别,或在连续的流中被识另O。分析还能够顺次地进行,其中样本通过一系列的点,每一个点从溶液中吸收一类分子。典型地,固体支持物是玻璃或聚合物,最常使用的聚合物是纤维素、聚丙烯酰胺、尼龙、聚苯乙烯、聚氯乙烯或聚丙烯。固体支持物可以是管、珠、碟、硅片、微盘、聚偏二氟乙烯(PVDF)膜、硝化纤维膜、尼龙膜、其它有孔的膜、无孔膜(如,塑料、聚合物、有机玻璃、硅、其它)、多种聚合别针(pin)、或多种微滴定孔、或任何其它适合固定蛋白、多核苷酸和其它适当的分子和/或进行免疫分析的表面的形式。结合方法是本领域公知的,通常由将蛋白分子、多核苷酸等共价交联结合或物理吸收至固体支持物组成。可选地,可以应用通过亲和性标签或相似的构建体的探针亲和性偶联。通过使用本领域公知的技术,例如接触或非接触印刷、蒙版(masking)或影印石版术,可明确每个点的位置。综述参见Jenkins, R.E. , Pennington, S. R. (2001, Proteomics, 2, 13-29)和 Lal 等人(2002,DrugDiscovTodayl5;7(18Suppl):S143_9)。阵列可以是基于珠的阵列。典型地,阵列是基于表面的阵列,例如,巨阵列、微阵列或纳米阵列,优选抗体阵列或抗体微阵列。典型地,阵列是微阵列。通过“微阵列”,我们包括具有至少大约100/cm2 (优选至少大约1000/cm2)的分离区域密度的区域阵列的意思。微阵列中的区域具有典型的尺寸,如直径范围在大约10-250 μ m之间,且以大约相等的距离与其它区域分开。可选地,阵列可以是巨阵列或纳米阵列。一旦鉴定并分离了适合的结合分子(上面讨论的),本领域技术人员能够使用分子生物领域公知的方法制造阵列;参见下面的实施例。在另一个实施方式中,使用包含能够结合一个或多个第一结合试剂的第二结合试剂的分析进行步骤(b)和/或步骤(d),所述第二结合试剂具有可检测配基。对于第一结合试剂适合的第二结合试剂在上面详述了。因而,在待测样本中的目标蛋白可以首先用第一结合试剂进行分离和/或固定,然后用第二结合试剂确定所述蛋白的 存在和/或相对量。优选地,第二结合试剂是抗体或其抗原结合片段。方便地,抗体或其片段选自scFv ;Fab ;免疫球蛋白分子的结合结构域。适合的抗体和片段,以及制备其的方法在上面详述。可选地,第二结合试剂可以是抗体样结合试剂,如亲和体或适体。可选地,当在待检测样本中蛋白质上的可检测配基包括或由一组特异性结合对(如生物素)组成时,第二结合试剂可以包括或由特异性结合对的互补成员(如,链霉亲和素)组成。当使用检测分析时,优选可检测的配基选自荧光配基;发光配基;化学发光配基;放射配基;酶配基;配体配基或配体结合配基。用于本发明方法的适合的可检测配基的例子在上面描述了。用于检测血清或血浆蛋白的优选的分析包括酶联免疫吸附分析(ELISA)、放射免疫分析(RIA)、免疫放射量测量分析(IRMA)和免疫酶分析(IEMA),其包括使用单克隆和/或多克隆抗体的三明治分析。示例的三明治分析由David等人在美国专利号4,376,110和4,486,530中描述,在此引作参考。作为本领域技术人员公知的,在玻片上的细胞抗体染色可被应用于细胞实验室诊断检测中公知的方法中。因而,在一个实施方式中,分析是ELISA (酶联免疫吸附分析),其典型地包括使用提供有色反应产物的酶,通常在固相分析中。例如辣根过氧化物酶和磷酸酶的酶已被广泛地应用。放大磷酸酶反应的一个方法是使用NADP作为底物,产生NAD,其现在作为第二个酶系统的辅酶发挥作用。来自大肠杆菌(Escherichia coli)的焦磷酸酶提供了一个良好的缀合物,因为该酶不存在于组织中,是稳定的并提供好的反应发色。也能够使用基于酶(例如荧光素酶)的化学发光系统。常常使用与维生素生物素的缀合,因为其能够容易地通过其与酶联抗生物素蛋白或链霉亲和素的反应被检测到,其与酶联抗生物素蛋白或链霉亲和素高特异性且高亲和性地结合。在一个可选的实施方式中,用于蛋白检测的分析方便地是荧光测量分析。因而,第二结合试剂的可检测配基可以是荧光配基,例如Alexa荧光团(例如,Alexa-647)。优选地,抗体或其抗原结合片段是重组抗体或其抗原结合片段。在一个实施方式中,本发明第一方面的方法是体外方法。在一个可选的实施方式中,本发明的第一方面的方法是体内方法。本发明的第二方面提供了一种用于根据本发明的第一方面的方法中的阵列,该阵列包括一个或多个如上定义的第一结合试剂。优选地,阵列包括一个或多个能够结合表中生物标记物的结合试剂。更优选地,阵列包括能够结合表I (A)中生物标记物的结合试剂,最优选地,结合表I (a)中所有的生物标记物。另外地或可选择地,阵列可以包括一个或多个能够结合表I (B)中生物标记物的结合试剂,例如,表 I (B)中生物标记物的 2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18或19个。因而,优选阵列包括能够结合表I (A)和表I (B)所定义的每一个生物标记物的结合试剂。另外,阵列可以包括能够结合至表I (C)中所定义的一个或多个生物标记物的结合试剂,例如表I (C)中的生物标记物的2、3、4、5、6、7、8、9、10、11、12、13、14或15个。优选地,阵列包括能够结合表I (C)中所定义的每一个生物标记物的结合试剂。本领域技术人员将理解阵列可以包括能够结合选自上述生物标记物组的相同生物标记物的多种不同结合试剂。在一个实施方式中,结合试剂包括或由抗体或其抗原结合片段组成,例如,单克隆抗体或其片段。抗体或其抗原结合片段可以是重组抗体或其抗原结合片段。抗体或其抗原结合片段可选自完整的抗体、Fv片段(例如,单链Fv和二硫键Fv)、Fab样片段(如,Fab片段、Fab’片段和F(ab)2片段)、单可变结构域(如Vh和 '结构域)和结构域抗体(如包括单和双形式的dAbs,即dAb-接头-dAb)。优选地,抗体或抗原结合片段是单链Fv (scFv)o可选地,结合试剂可包括或由抗体样结合试剂,例如亲合体或适体组成。在一个实施方式中,结合试剂是固定的。但是,可选地,其是非固定的。在另一个实施方式中,针对表I (A)和/或I (B)和/或I (C)中所列的生物标记物的每一个,阵列包括或由至少2至10个不同的结合试剂(例如,不同的抗体)组成,例如至少2-3、2-4、2-5、2-6、2-7、2-8或2_9个针对每个生物标记物的不同结合试剂种类。因而,阵列可以包括或由至少3个针对每个生物标记物的不同结合试剂组成。适用于本发明方法中的阵列在上面详细讨论。本发明的第三方面提供了生物标记物体外作为用于确定受试者中乳癌复发和/或转移的风险的预后标记物的用途,所述生物标记物选自表I (A)中的生物标记物。在一个实施方式中,生物标记物与一个或多个选自表I (B)和/或I (C)中的生物标记物的另外生物标记物联合使用。该用途可以与来自(i)表I (A)和/表I (B);(ii)表I (A)和表I (C); (iii)表I (B)和表I (C);(iv)表I (A)、表I (B)和表I (C)的所有生物标记物联合,或例如,与来自表I (A)的生物标记物的I或2个、来自表I (B)的生物标记物的
1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18 或 19 个和 / 或来自表 I (C)的生物标记物的 1、2、3、4、5、6、7、8、9、10、11、12、13、14 或 15 个联合。方便地,用途包括或由3个或更多选自表I所定义的生物标记物组成,例如,选自表 I 定义的生物标记物的至少 4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37 或 38 个。优选,用途包括或由包括载脂蛋白A4(AP0A4)、ATP合成酶亚基β、线粒体(ΑΤΡ5Β)、布鲁顿酪氨酸激酶(ΒΤΚ)、补体I酯酶抑制因子(Cl酯酶抑制因子)、补体因子B (因子B)、⑶40、同源域转录因子CHXlO (CHX10)、白介素-1 a (IL-1 α )、白介素_5 (IL-5)、白介素_6 (IL-6)、白介素_7 (IL-7)、白介素-9(IL-9)、白介素-12 (IL-12)、白介素-13 (IL-13)、白介素-18 (IL-18)、TBCl 结构域家族成员9 (ΚΙΑΑ0882)、Lewisx/CD15、氧甾酮结合蛋白样3 (0SBPL3)、单核细胞趋化蛋白-1(MCP-1)、唾液酸化Lewis'肿瘤坏死因子-1 β (TNF-β )的生物标记物组成。本发明的第四方面提供了用于确定个体中乳癌复发风险的试剂盒,其包括或由以下组成(i) 一个或多个能够结合表I (A)和/或I (B)和/或I (C)所列的生物标记物的结合试剂;和( i i )用于进行本发明方法的说明书。在一个实施方式中,试剂盒进一步包括如上定义的一个或多个第二结合试剂。优选试剂盒还可以包括或由以下组成(iii)根据本发明第三方面的阵列;和( i V )用于进行本发明方法的说明书。在一个实施方式中 ,试剂盒包括能够结合表I (A)和/或I (B)中定义的各生物标记物的结合试剂,并且可另外地包括能够结合表I (C)中定义的一个或多个生物标记物的结合试剂。可选地,试剂盒可包括能够结合选自表I (A)和/或I (B)和/或I(C)中的生物标记物的相同生物标记物的多个不同结合试剂。在一个实施方式中,结合试剂包括或由抗体或其抗原结合片段组成,例如单克隆抗体或其片段。优选,抗体或其抗原结合片段是重组抗体或其抗原结合片段。
优选地,现在将描述体现本发明具体方面的非限制性实施例,其参照以下附图图1 :用于预测转移的乳癌的SVM分析。(A)手术后3-6个月收集的样本相较于手术时取得的相同样本的分析物水平。在阵列上鉴别的所有分析物中的差异输送到SVM,使用留一交叉校验程序(leave-one-out cross-validation procedure),所述 SVM 被训练将患者分类为将发生转移癌或不发生转移癌的类型。分析得出0. 88的R0CAUC。在热图中,表示了所有显示Wilcoxon P值〈O. 05的分析物,对于生物标记物速率,红色意味着增加以及绿色意味着降低。(B)相同的SVM分析,但使用比较取自手术时与手术后12个月的样本的分析物速率。该分析结果为0. 75的R0CAUC。图2:错误发现率和分析物速率的分析。(A)对于每种抗体鉴别了第二样本具有较高生物标记物信号的患者数。相应地分类抗体并作图(红色),最少数患者中具有增加的信号的抗体在左。然后随机重组第一和第二样本,对于一组随机的患者,与第一样本同样地处理第二样本,反之亦然。再次鉴别第“二”样本中具有较高信号的患者数,以实现分析的假阳性率(FPR)的评估。该过程重复10,OOO次。蓝色描述在随机重组数据集的排列期间对于每个抗体秩(rank)具有增加信号的患者的特定数目是多么常见;白色表明不存在,而深蓝色表明最常见。对于各抗体秩的平均值绘制成黄色线。从该分析表明第一和第二样本真实组合给出了一个结果,其明显不同于描述FPR的黄线,该不同不仅在于图的尾端,在中间更是如此,这表明了广泛的上调。分别表示在手术后第一个3-6月期间的(B)Lewis x;(C)IL-16 ;和(0)⑶40的速率图。这些分析物的信号速率对于最终发展为转移乳癌的患者清楚地为阳性。图3 :将患者分类为高或低乳癌复发风险的预验证。使用按照SupplementaryMaterials and Methods 中所述的后退消去(backward elimination)产生的(A)源自21个生物标记物标志的抗体阵列数据,在发现数据集中训练SVM,并在预验证数据集上验证。此分类的ROC AUC是O. 85; (B)使用常规的临床数据(黄色)训练SVM给出ROC AUC=O. 66,然而,21个生物标记物标志与常规临床参数的组合(红色)的结果为ROCAUC=O. 90,表明在阵列数据中的附加值。图4 :发现化疗对于我们的候选生物标记物标志不是一个混淆因子。对所有患者的SVM分度值(devision value)作图,用箭头表示在第一个3_6个月期间接受化疗的患者。当根据SVM分度值将患者分为风险组时,72%的患者处于高风险组(红色)后期发展成转移,仅15%处于低风险组(蓝色)。当将结果关联至给予辅助治疗的患者(黑色箭头)时,表明该因子不使分析偏岐,高风险和低风险组中分别为5/18和7/20。图5 :后退变量消去。为了降低用于分类的抗体数目,我们针对抗体组合了上述留一程序与后退消去方法。该方法也产生了抗体排序(ranking),其允许低秩被指定到随机关联的抗体。
具体实施例方式实施例简介为了定义与乳癌中肿瘤复发相关的预测性血清生物标记物,我们假定低冗余的免疫调节血清蛋白的解码模式能够揭示关于复发风险的重要信息。从而,利用领域状态中能够分析大量低冗余蛋白分析物的重组抗体阵列技术,仅使用微量的未分级血清(10),我们筛选了经过三年的时期收集的患者样本。样本收集自原发肿瘤切除术前的乳癌患者,然后,每6-12个月,获得多至5个样本/患者。通过分析速率,即,标记物随时间的改变,能够提取指示着发展成转移的患者风险的信息。该研究首次表明简单的血液样本包含了乳癌患者中全身肿瘤复发的预测信息,其在疗法选择中可以允许新的可能性。而且,在性能方面,其为源自原发手术时的临床预测因子带来了实质性的附加值。材料和方法样本和阵列分析从两个独立的患者群收集血清样本,标注为发现群和预验证群(表3)。在发现群中,样本收集自38位诊断为原发乳癌的患者。在外科手术前就诊期间(Lund UniversityHospital, Lund)收集书面的知情同意书,当时也收集了血清样本。当抽取血液样本时记录时间和日期。将血清储藏在-80° C,用系列代码标记以允许盲法分析。对于大部分患者,手术前就诊发生在手术前一周以内。在第一次随访(3-6个月)时第二次抽血,然后大约每12个月抽血,持续3年。该研究获得地区伦理委员会(Lund, Sweden)的许可。在预验证群中,如对发现群所述,从26位新的独立的乳癌患者抽取血清样本。不发展成远端复发的患者随访7年(表3)。重组抗体微阵列平台含有135种抗65种不同抗原的抗体,即为了保证质量,我们用了 2-5个抗大多数抗原的不同的抗体克隆(表4)。详细描述了微阵列分析,包括样本制备、抗体产生、阵列制造和归一化(IO、11)。为了能够使用传统的临床参数比较远端复发的预测,我们为每一个可利用的参数指定了数值,其中绝经前/绝经后状态、ER&PgR-阴性/阳性、导管/小叶型、以及淋巴结状态分别设定为-1或I。而且,组织分级1、II或III设定为_1、0或1,而肿瘤大小从-1至I连续地分级。然后使用传统的临床数据、或使用临床和微阵列数据的组合,在发现数据集上训练支持向量机(SVM)。使用支持向量机的数据分析利用限制成本设置为I的线性核,使用SVM将样本分类为属于两个定义组中的一个。为了避免过拟合的风险,没有试图调整它。针对每个患者,计算在手术时收集的样本信号间以及在术后3至6个月收集的样本信号间的对数差异,并使用留一交叉验证将所述差异用于训练和测试SVM分类器。使用发现群,通过选择在训练集中表现出最高组合区分能力的抗体,使此训练部分包括抗体子盘(sub-panel)的产生。应用交叉验证后退消去策略进行抗体的选择。使用该方法,我们编译了具有最高分值的21个抗体的列表(表I (A)和I (B)),并训练了最终SVM模型,现在称为冻结。源自该训练的SVM参数在表2中表示。在预验证期间, 使用上述冻结的SVM分类器中的分析物速率,分析和测试了来自26位新的独立乳癌患者(预验证群)的血清样本。样本制备使用之前优化的用于标记血清蛋白质组的规程,使血清样本生物素化(10)。如之前在(10)中所述,使用 EZ-Link Sulfo-NHS-LC-生物素(Pierce, Rockford, IL, USA)标记所有的血清样本。简言之,离心50 μ I血清等份,在PBS中按1:45稀释,得到最终蛋白质浓度为大约2mg/ml。然后加入Sulfo-NHS-生物素,至最终浓度为10禮,并在冰上孵育样本2小时。通过在4° C对PBS透析72小时除去未缀合的生物素。最后,将样本等分并在使用前保存于-20° C。重组抗体片段的生产和纯化使用n-CoDeR噬菌体展示文库(25 ),对抗65种抗原,主要对抗免疫调节因子,筛选135种人重组scFv抗体片段(表4)。使用标准操作程序,选择标准是严格的,以保证准确的抗体特异性。所有的scFv探针生产于IOOml大肠杆菌培养物中,并使用N1-NTA琼脂糖上的亲和层析(Qiagen, Hilden, Germany)从表达上清或胞质制备物中进行纯化。使用250mM咪唑进行洗脱,随后用PBS充分透析。通过测量在280nm下的吸光度,确定蛋白浓度,纯化的scFV保存在4 ° C下直至进一步使用。抗体微阵列的制造和加工
根据前述的优化设置(10、25)进行抗体微阵列的生产和处理。简言之,使用非接角虫打印机(Biochip Arrayerl, Perkin Elmer Life&Analytical Sciences, Wellesley,MA, USA)制造scFv微阵列,使用piezo技术,其沉积大约330pL/滴。通过在每个位置点2滴,排列scFv抗体,其中在分配第二滴前使第一滴干燥。固体支持物是黑色聚合物MaxiSorp微阵列玻片(NUNC A/S, Roskilde, Denmark),且各抗体以八个重复排列以保证足够的统计。为了有助于在以后定量期间的网格对齐,含有Alexa647缀合的链霉亲和素(2 μ g/ml)的一行被点为构成阵列的所有八个亚阵列中的首行。用5% (w/v)PBS中的脱脂奶粉(SemperAB, Sundbyberg, Sweden)过夜封闭玻片,然后放置于蛋白阵列工作站上(PAW)(PerkinElmerLife&Analytical Sciences),在工作台上,它们用含有 O. 05% 吐温-20 的 PBS(PBS-T)以60 μ Ι/min冲洗4分钟。而后,注射75 μ I样本并允许每15秒振动阵列,持续60分钟。在另外一次4分钟的洗涤后,用含有I μ g/mlAlexa-647缀合的链霉亲和素,和l%(w/V)脱脂奶粉和1%吐温20的350 μ I PBS孵育阵列60分钟。最后,在最后一次洗涤步骤后,在氮气气流下干燥阵列,并用共聚焦微阵列扫描仪(ScanArray Express, Perkin ElmerLife&Analytical Sciences),使用三种不同的扫描设置,在5 μ m分辨率下扫描。使用固定圆周的方法,ScanArray Express软件版本4. O (Perkin ElmerLife&Analytical Sciences)用于定量每个点的强度。减去局部的背景,补偿可能的局部缺陷,自动排除两个最高和最低的重复。在所有进一步的数据分析中,每个数据点代表来自剩余四个重复点的平均值。对于显示饱和信号的蛋白分析物,使用来自较低扫描设置的值。微阵列数据归一化 与用于DNA微阵列的归一化方法相似,使用半局(sem1-global)归一化方法进行数据集的芯片至芯片的归一化。为了找到比例因子(scaling factor) (7、11、27),计算每种抗体的变异系数(CV),对应于20个分析物,鉴定了所有样本中15%的抗体显示最小的CV值。通过公式Ni=Si/^计算归一化因子Ni,其中Si是每个样本20个分析物的信号强度的和,而μ是来自所有样本Si的平均值。为了归一化样本,样本中所有抗体的强度除以其归一化因子队。数据分析分类器校准和独立检验为了降低样本与样本的变异,t=0和t=3_6个月之间的蛋白质表达差异被用作SVM分类器的独立变量。使用N=38个样本以及初始地所有M=135变量,我们用留一程序训练并检验了 SVM。由于抗体数超过了样本数,我们需要消去那些对预测影响低的抗体,以避免由于随机关系而拟合至噪音。使用后退消去程序对每个留一样本进行消去。通过ROC (受试者工作特征)面积测量性能。然后将获自每种SVM模型的排序抗体列表融合至一致标志中。然后,后者与冻结SVM用在独立的检验集上,较详细地描述了不同的步骤,且完整程序总结在图5中。留一程序该程序的原则是,对于属于两类的N个样本,使用留一交叉验证训练和检验SVM,即在除了一个以外的所有样本上训练SVM,并使用剩余样本检验获得的模型。使用训练的SVM模型给检测样本指定一个分度值,并将检测样本放回训练集中,之后留下下一个样本用作检测样本。重复该程序,直到一旦使用所有其它样本作为训练集时,每一个样本都被指定一个分度值。所有样本的分度值用来产生ROC曲线,计算该曲线下的面积。获得的面积作为该样本集的预期面积的估计。后退变量消去为了减少用于分类的抗体数,我们针对抗体将上述留一程序与后退消去方法相结合。该方法也将产生抗体的排序,其目的在于将低秩指定到随机相关抗体。该方法描述于图5中,此处参照该图有步骤1-7。以M种抗体开始,产生M个数据集,其中每个数据集具有一种以恒定值代替的抗体,该恒定值是所述抗体在所有样本中的平均值(步骤I)。为了评价目前数据集中各抗体对于分类的重要性,对于M个数据集的每一个进行SVM留一程序(如上所述)。随后,使用SVM输出绘制M个ROC曲线,与原始的相比,鉴定出产生的ROC面积具有最少降低(可以是阴性)的数据集。鉴定在该数据中设定为恒定值的抗体并消去(步骤2)。现在,数据集含有M-1种抗体,且从而生成M-1个新数据集,都采用其平均值取代剩余抗体中的一个。使用恒定抗体,与SVM评估一起重复留一检验程序,实际上,消去携带最少信息的下一个抗体。继续该程序直到仅剩余一种抗体,得到数据集中当前样本分类中各抗体重要性的秩顺序(步骤3)。然后该信息可被用于建立任何所需长度的抗体子盘(步骤4)。为了评价这种抗体盘的预测能力,不可能以无偏离的方式使用相同样本检验新的模型。而且,随机相关的抗体仍可以获得高的秩。因而,增加了额外的留一环路(leave-one-out loop)(步骤5a),其中在后退消去程序起始前除去一个样本,因而该样本可用作检测样本(步骤5b)。重复这一最外面的环路,使得各样本作为一次检测集,且使剩余样本来产生抗体排序表。然后,将该排序表用于挑选具有最高秩的抗体子盘,训练单一 SVM模型,在检测样本上检验该模型。最外面的留一方法的结果是对于任何给定子盘长度的所有样本分度值的列表。使用给定大小的抗体子盘,相应的ROC面积作为性能的测试,其可被用于评价数据集中进行充分分类所需的抗体数。一致抗体标志后退消去程序得到了与样本数相同的抗体排序表的数。为了生成单一的排序顺序,基于消去回合中抗体平均生存为各抗体指定一个分数(步骤6),将来自每次运行的信息连接到一致列表中,其中具有最高平均生存的抗体被排序为最重要的。最后,使用具有最优分数的21种抗体训练新的SVM,在新的独立的数据集上检验该SVM (步骤7)。结果与肿瘤复发相关的血清生物标记物标志为了试图鉴定预期乳癌中远端复发的血清生物标记物标志,我们经过三年时间,收集了来自患有原发乳癌的患者的样本。通过比较来自原发手术时收集的样本的绝对血清蛋白(分析物)水平,没有成功地发现用于转移性疾病的有效分类器,如O. 54的曲线下ROC面积(AUC)所证实的(数据未显示)。因而,不是比较分析物的绝对水平,而是我们分析了速率,所述速率定义为每个分析物手术前抽取的第一血清样本和来自经过三年期间各患者的每个连续样本之间的对数改变。然后,我们输送SVM方向(即,向上或向下调节)以及随时间改变的幅度。使用手术后3-6个月收集的血清样本,分类器允许将患者分为高相对于低的肿瘤复发风险,其中ROC AUC为O. 88 (图1A)。因而,该基于生物标记物速率的方法,表明在数据集中有足够的信息来鉴定候选生物标记物标志,以及鉴定在三年内发展成远端肿瘤复发的高风险的组,所述候选生物标记物标志允许患者的分类。
采取相同的策略,但改为使用在手术后12个月收集的样本,我们发现相似的定量结果,但具有降低的预测能力,如O. 75的ROC AUC所表明的(图1B)。使用收集于24和36个月的样本不能进一步遵照该趋势,因为诊断为没有转移性疾病的患者群太小了,以至于不能够进行统计学上的相关分析。分析所有的分析物(图2A),表明在此期间转移患者增加的分析物速率清晰地过度表现,而对于非转移患者是相反的。当更详细地分析预测生物标记物标志时,表明Lewis X(p=0. 0005)、IL-16 (p=0. 002)和CD40 (p=0. 0003)在手术后第一个6个月期间最能区分复发与非复发乳癌患者,如通过Wilcoxon符号秩检验(Wilcoxon signed-rank test)所确定的。在图2B-D中,我们展示了这三种分析物的动力学,其中表明,对于在较后的时间点发生远端肿瘤复发的患者,手术后这些第一个月期间的显著增加更为常见。源自发现群的生物标记物标志的预验证为了检验源自38名患者的发现群的分类强度,使用后退消去策略,我们首先将分析物总数浓缩至21个对转移复发的分类最有贡献的非冗余生物标记物。第二个独立的患者群,命名为预验证群,由另外26名患者组成,其中50%在研究持续的3年期间发展为远端乳癌复发。按照发现群相同的程序,从26名新患者的每一位分析两个血清样本,第一个收集自初期肿瘤切除术时,第二个收集自3至6个月后。而后,使用我们的抗体微阵列平台处理52个样本,如上所述,确定各生物标记物的速率。分类器,由来自发现群的21个最起作用的生物标记物组成,允许在独立的预验证群中将患者分类为高相对于低风险的肿瘤复发,其中ROC AUC为O. 85 (图3)。注意到,先前确定的癌相关生物标记物标志与现在的21个生物标记物仅有30%的重叠(7、9、11)。因而,我们的预测标志并不反映通常的炎症反应(14)。辅助化疗对高或低风险组分类的影响为了检验如图1所示的分类是否依赖于发现群中患者所接受的疗法,我们分析了辅助化疗对高或低风险乳癌复发分类的影响。在图4中,用箭头表示在第一个3-6个月期间,所有患者和接受化疗的患者的SVM分度值。没有检测到接受个体化疗的患者的区分。当分析接受辅助内分泌治疗的患者时,得到相似的结果(结果未显示)。因而,对远端肿瘤复发的高和低风险的分类并不因具体的辅助疗法而偏倚。有趣的是,由于一些6个月后仍接受化疗的患者被分类属于高风险组,不能证明具体疗法的任何有益的效果。因而,基于源自我们的微阵列分析的分子描绘,这些患者可选择其它的治疗方案。分子生物标记物标志对常规诊断参数分子诊断学的能力有时被质疑,特别是与传统临床参数有关的(12),例如淋巴结状态、肿瘤大小、组织学分级以及雌激素受体(ER)和孕酮受体(PgR)状态。因而,有必要比较我们的血清预测因子和基于这些临床标记物的预测因子的性能。利用传统参数的组合,我们比较了它们和我们的显示O. 85的ROC AUC的血清生物标记物标志(图3A)。分别使用临床数据与临床和微阵列数据的组合,在发现数据集上训练两个另外的SVM模型。使用预验证群的患者检验模型,结果表示为ROC曲线。使用传统临床参数的预测因子的ROC AUC是O. 66。因而,当使用基于分析物速率的分子标志时,我们实现了显著改善的预测能力。注意到,当我们将传统临床参数和我们的21个生物标记物标志组合时,并使用二者作为风险分类的方法时,我们获得了 O. 90的ROC AUC (图3B)。结果,如Pearson相关性分析所表明的,两个不同的变量集并没有包含临床结果方面的重叠信息,这表明分析物速率与传统临床标记物具有非常弱的相关性(< O. 35)。这支持了以下事实,我们的蛋白血清方法包含了不存在于传统标记物的独特信息,这与在临床标记物和基因微阵列谱之间观察到的相关性相反(12)。为了进一步比较我们的数据与可获得的决策制定(dicision making)工具,我们调查了 Adjuvant online (www. adjuvantonline. com),其评估了乳癌中肿瘤复发的风险。在线输入患者年龄、ER状态、肿瘤分级、肿瘤大小和阳性淋巴结数,计算的每个患者十年内复发的风险被记录下来。然后,使用患者关于远端复发的真实结果,根据它们估计的风险,将患者分类,生成显示为O. 60AUC的R0C。尽管在我们的预验证群中无疾病随访时间是七年,这与我们的分析中基于传统临床参数给出的O. 66的AUC是一致的。讨论用局部区域疗法或通过增加系统化疗、激素或生物疗法治疗的乳癌患者,得到改善的临床结果,但是,也处于相当过度的治疗中,存在对患者的副作用和对保健护理提供者的成本。因而,需要预测参数将患者分为不同的风险组,其将有助于采取合理的治疗决定。而且,监测疾病进展和疗法效率的预测参数是非常合乎需要的,因为其允许根据患者选择辅助疗法,避免过度治疗。今天,具有疾病相同阶段的患者可具有对疗法完全不同的反应,以及完全不同的整体存活,意味着这样一个事实,传统参数不能准确地根据其临床需求对乳癌患者进行分类。但是,基因表达谱的最近进展获得了有前途的预测乳癌临床结果的成果(5、6),其预测保-乳手术后发生局部复发的风险(14),以及乳癌的早期诊断(15)。由于基于基因表达谱的乳癌临床结果的预测需要肿瘤的存在,基于基因的方法不允许初始肿瘤切除术后的持续疾病监测和治疗效率的评估。为了这个目的,优选的样本选择是血清,由于技术有限,使用传统的蛋白质组方法不能对其进行分析(16)。我们设计了重组抗体微阵列平台(21-23),其展现了高的灵敏度和再现性,并集中于与免疫系统相关的血清蛋白。最近这种亲和蛋白质组方法已经允许鉴定一些区分不同癌症指标和健康个体间的血清生物标记物标志(7、8、11),表明该平台的能力。试图研究短暂储存于血清中的信息能否被解读,并帮助管理乳癌,我们在全部64位患有原发乳癌的患者和全部几百例血清样本中筛选了与发生远端肿瘤复发风险相关的分子图谱(portrait)。通过比较经过三年期间收集的样本,使用静态分析物水平,我们不能解读血清蛋白质组的分子模式,这表明信号太弱、信号和可变向量平行而不是正交于可变向量、或不存在信号。但是,当分析分析物强度随时间的改变时,我们能够将患者分类为在研究期间内发展为转移乳癌的高和低风险组。很明显,如果患者属于高风险组,在第一个3-6个月期间,可辨别生物标记物分析强度的增加,对于低风险患者则相反。最早的临床蛋白质组研究受限于以下事实,仅一群患者被用于发现潜在的生物标记物,为了克服这个瓶颈,我们使用了第二个独立群来检测风险分类患者的能力。为了这个目的,我们首先使用无偏倚的后退消去策略,对用于预验证我们的候选生物标记物标志的分析物数目进行浓缩。其得到了最有区分力的标志,如果仅选择了具有最低P值的生物标记物,就不是这种情况了。在浓缩至21个标记物后,我们分析了检测群,并能够将患者分为发生转移乳癌的高和低风险,ROCAUC为O. 85。这种预测能力的降低是可预期的,因为生物标记物总是在其来自的数据集上表现得更好。仍然,O. 85的ROC AUC是第一个证明,证明了血清样本中含有的信息内容能够使用抗体微阵列而被解码,其为开发一种治疗乳癌患者更加个体化的方法铺路。值得注意的是,标志并不视为受到患者所接受的治疗的影响,如化疗并不影响患者的分类。此观察(图4)也证实了需要转移乳癌准确的预测,因为一些高风险组中的患者可以从其它辅助治疗中获益,正如一些低风险组中的患者可能被过度治疗了。为了具有临床影响,基于血清的生物标记物应该比传统预后标记物表现得更好,例如临床的(年龄)、组织病理的(组织学分级、淋巴结状态、肿瘤大小)和激素受体状态(ER、PgR) (14)。基于这些标记物的现有预校正的预测因子不能被直接地用于这种情况,因为典型地它们比我们的研究中涉及的那些假设了更长的复发时间,将不利于比较。因而,通过训练和盲法测试,使用这些标记物作为输入值的SVM,我们评估了传统参数的预测能力。我们证实了即使是由O. 66的ROC AUC代表的其组合能力,也显著低于我们的预验证的血清生物标记物标志。这支持了我们的假设,即血清中包含足够的信息,使用合适的技术(如疾病预测)可以被解码。有趣的是,当我们组合传统临床参数和我们的21个生物标记物标志时,预测能力增加得到了一个更加改善的O. 90的ROC AUC,这强烈地表明血清生物标记物提供了附加值。本分析基于65种不同的分析物(表4),并受本研究的启发,我们将设计扩展的乳癌芯片,其能够在更大的患者群中分析更多的血清蛋白,以进一步精炼生物标记物标志,从而提高其预测能力。在临床环境中,能够将患者分为发生乳癌远端复发低或高风险的生物标记物标志可以和与已经确诊的转移乳癌相关的生物标记物标志共同使用(11)。该标志(11)基于八个生物标记物,且已表明在来自本研究的独立检测群中给出O. 85的ROC AUC(数据未表明)。因而,一个潜在的临床应用可以是,在手术后第一次就诊(3-6个月)的患者中进行风险评估之后,与已建立的转移乳癌相关的标志能够被用于在几年中随访患者,并监测其分子血清图谱,以作为肿瘤复发的早期警告信号。当然这在比较前瞻性的研究中已被证实,但表明了在乳癌疗法中朝着更加个体化方法的一个潜在方式。总之,我们表明简单的血液测试包含足够的信息以允许在原发手术后,使用亲和性蛋白质组学,风险评估发生转移乳癌的可能性。参考文献1. Parkin DM, Bray Fj Ferlay J,Pisani P. Global cancer statistics, 2002. CACancer J Clin. 2005;55:74-108.2.Gonzalez-Angulo AM, Morales-Vasquez Fj Hortobagyi GN.Overview ofresistance to systemic therapy in patients with breast cancer. Adv Exp MedBiol.2007;608:1-22. 3. Eifel P,Axelson JA,Costa J et al. National Institutes of HealthConsensus Development Conference Statement: adjuvant therapy for breastcancer, Novemberl-3, 2000. J Natl Cancer Inst. 2001;93:979-89.4. Goldhirsch A,Ingle JNj Gelber RD. Et al Thresholds fortherapies!highlights from the St Gallen international expert consensus on theprimary therapy of early breast cancer 2009. Annals Oncol. 2009;20:1319—1329.5. van’t Veer LJ,Dai Hj van de Vijver MJj et al. Gene expression profilingpredicts clinical outcome ofbreast cancer. Nature2002;415:530-536.6. Paik S,Shak S,Tang G et al. A multigene assay to predictrecurrence of tamoxifen-treated,node-negative breast cancer.N.Engl.J. Med. 2004;351:2817-2826.7.1ngvarsson J,Wingren C,Carlsson A,et al. Detection of pancreaticcancer using antibody microarray-based serum protein profiling.Proteomics2008;8:2211-2219.8. Sanchez-Carbayo Mj Socci ND, Lozano JJ,Haab BBj Cordon-CardoC,Prohiling bladder canc er using targeted antibody array s.Am. J. Pathol. 2006; 168:93-103.9. Ellmark P,Ingvarsson J,Carlsson A,et al.1dentification of proteinexpression signatures associated with Helicobacter pylori infection andgastric adenocarcinoma using recombinant antibody microarrays. Mol.Cel1.Proteomics2006;5:1638-1646.10. Wingren Cj Ingvarsson Jj Dexlin Lj Szul D and Borrebaeck CAK. Design ofrecombinant antibody microarrays for complex proteome analysis:Choice of samplelabeling-tag and solid support. Proteomics2007;7:3055-3065.11. Carlsson A, Wingren Cj Ingvarsson J,et al. Serum proteome profilingof metastatic breast cancer using recombinant antibody microarrays.Eur.J. Cancer2008;44:472-480.12. Eden P,Ritz C,Rose C,Femo Mj Peterson C. "Good Old^clinical markershave similar power in breast cancer prognosis as microarray gene expressionprofilers. Eur J Cancer. 2004;40:1837-41.13. Nimeiis-Malmstrom Ej Krogh M,Malmstr5m P,et al. Gene expressionprofiling in primary breast cancer distinguishes patients developing localrecurrence after breast-conservation surgery, with or without postoperativeradiotherapy. Breast Cancer Res. 2008;10:1-11.14. Chelinska Mj Kowalewska M. Systemic inflammation as aconfoundingfactor in cancer biomarker discovery and validation.Nature2010;10;2.15. Sharma P,Sahni NS,Tibshirani R,et al. Early detection of breastcancer based on gene-expression patterns in peripheral blood.Breast CancerRes. 2005;7:634-44.16. Aebersold R,Mann M. Mass spectrometry-based proteomics.Nature2003;13:198-207.17.Ekins RP.Ligand assays: from electrophoresis to miniaturizedmicroarrays. Clin. Chem. 1998;44:2015-2030.
18. Zhu H, Snyder M. Protein chip technology. Curr Op in ChemBiol2003;7:55-63.19.Anderson NL,Anderson NG. The human plasma proteome: hi story,character,and diagnostic prospects. Mol. Cell. Proteomics2002;1:845-867.20. Borrebaeck CAKj Wingren C. Design of high-density antibodymicroarrays for disease proteomics: Key technologicalissues. JProteomics2009;72:928-935.21. Steinhauer Cj Wingren Cj MalmborgHager AC and Borrebaeck CAK.Single framework recombinant antibody fragments designed for protein chipapplications. Biotechniques2002;Supp1. :High-Throughput Proteomics:ProteinArrays :38-4522. Wingren C,Steinhauer Cj Ingvarsson J,et al. Microarrays based onaffinity-tagged scFv antibodies: sensitive detection of analyte in complexproteomes. Proteomics2005;5:1281-129123.Borrebaeck CAK and Wingren C. High-throughput proteomics usingantibody microarrays: an update. Expert Rev Mol Diagn. 2007;7:673-686.24. SoderlindE,Strandberg L,Jirholt P,et al. Recombining germline-derivedCDR sequences for creating diverse single-framework antibody libraries. NatBiotechnol2000;18:852-85625.1ngvarsson J,Larsson A,Sj oholm AG,et al. Design of recombinantantibody microarrays for serum protein profiling:targeting of complementproteins. J. Proteome Res. 2007; 6:3527-36.26. Hamelinck D,Zhou H,Li L,et al. Optimized normalization forantibody microarrays and application to serum—protein profiling. Mol CellProteomics2005;4:773-84.表I(A)核心生物标记物
权利要求
1.一种用于受试者中乳癌预后的方法,其包括步骤 Ca)提供来自受试者的第一蛋白质组样本; (b)测量第一蛋白质组样本中选自表I的生物标记物的一个或多个生物标记物的量; (c)提供来自受试者的另外的蛋白质组样本; Cd)测量另外的蛋白质组样本中步骤(b)所测量的一个或多个生物标记物的量; (e)确定第一蛋白质组样本和另外的蛋白质组样本中一个或多个生物标记物的量之间的差异; 其中,第一蛋白质组样本和另外的蛋白质组样本代表受试者在不同天的蛋白质组组合物, 且其中,第一和另外的蛋白质组样本中一个或多个生物标记物的量之间的差异指示受试者中乳癌的复发和/或转移的风险。
2.根据权利要求1的方法,其中为了提供一个或多个来自受试者的进一步的蛋白质组样本,以及为了测量其中在步骤(b)中测量的一个或多个生物标记物的量,重复步骤(C)和(d),其中一个或多个进一步的蛋白质组样本代表来自第一个和第二蛋白质组样本的受试者在不同天的蛋白质组组合物。
3.根据权利要求1或2的方法,其中蛋白质组样本是可溶的蛋白质组样本。
4.根据前述权利要求的任一项的方法,其中蛋白质组样本是血清或血浆样本,或源自血清或血浆样本。
5.根据前述权利要求的任一项的方法,其中蛋白质组样本源自血液样本。
6.根据权利要求5的方法,其中血液样本是未分级的。
7.根据前述权利要求的任一项的方法,其中步骤(b)包括测量来自表I(A)所列的生物标记物的一个或多个生物标记物的量,例如至少2个表I (A)所列的生物标记物。
8.根据前述权利要求的任一项的方法,其中步骤(b)包括测量来自表I(B)所列的生物标记物的一个或多个生物标记物的量,例如至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18或19个表I (B)所列的生物标记物。
9.根据权利要求8的方法,其中步骤(b)包括测量表I(B)所列的所有生物标记物的量。
10.根据前述权利要求的任一项的方法,其中步骤(b)包括测量来自表I(C)所列的生物标记物的一个或多个生物标记物的量,例如至少2、3、4、5、6、7、8、9、10、11、12、13、14或所有15个表I (C)所列的生物标记物。
11.根据权利要求10的方法,其中步骤(b)包括测量表I所列的所有生物标记物的量。
12.根据前述权利要求的任一项的方法,其中使用一个或多个能够结合表I所列的生物标记物的结合试剂进行步骤(b)和/或步骤(d)。
13.根据权利要求12的方法,其中一个或多个结合试剂各包括或由抗体或其抗原结合片段组成。
14.根据权利要求13的方法,其中抗体或其抗原结合片段是单克隆抗体或其片段。
15.根据权利要求13或14的方法,其中抗体或其抗原结合片段是重组抗体或其抗原结合片段。
16.根据权利要求12至15任一项的方法,其中抗体或抗原结合片段选自完整抗体、Fv片段(如,单链Fv和二硫键Fv)、Fab样片段(如Fab片段、Fab’片段和F(ab)2片段)、单可变结构域(如Vh和\结构域)和结构域抗体(如,包括单和双形式的dAbs,即dAb —接头一dAb)。
17.根据权利要求16的方法,其中抗体或抗原结合片段是单链Fv(scFv)。
18.根据权利要求12的方法,其中一个或多个结合试剂包括或由抗体样结合试剂,例如亲合体或适体组成。
19.根据权利要求12至18任一项的方法,其中一个或多个结合试剂是固定的。
20.根据前述权利要求的任一项的方法,其中使用阵列进行步骤(b)和/或步骤(d)。
21.根据权利要求20的方法,其中阵列是基于珠的阵列。
22.根据权利要求20的方法,其中阵列是基于表面的阵列。
23.根据权利要求20至22任一项的方法,其中阵列选自巨阵列、微阵列和纳米阵列。
24.根据前述权利要求的任一项的方法,其中分别在步骤(b)和/或步骤(d)之前处理步骤(a)和/或步骤(C)中提供的样本,从而用可检测配基标记样本中存在的任何生物标记物。
25.根据权利要求24的方法,其中可检测配基选自荧光配基;发光配基;化学发光配基;放射性配基;酶配基;配体配基或配体结合配基。
26.根据权利要求24或25的方法,其中可检测配基是生物素。
27.根据前述权利要求的任一项的方法,其中使用能够结合一个或多个生物标记物(或其上的可检测配基)的检测试剂进行步骤(b)和/或步骤(d)。
28.根据权利要求27的方法,其中检测试剂包括链霉亲和素。
29.根据权利要求27或28的方法,其中检测试剂包括可检测配基。
30.根据权利要求29的方法,其中可检测配基选自荧光配基;发光配基;化学发光配基;放射性配基;酶配基;配体配基或配体结合配基。
31.根据权利要求30的方法,其中可检测配基是荧光配基。
32.根据前述权利要求的任一项的方法,其中分别在步骤(b)和/或步骤(d)之前处理步骤(a)和/或步骤(C)中提供的样本,从而用生物素标记样本中存在的任何生物标记物,以及其中使用包含荧光可检测配基和链霉亲和素的检测试剂进行步骤(b)和/或步骤(d)。
33.根据前述权利要求的任一项的方法,其中第一蛋白质组样本和另外的蛋白质组样本,代表受试者在至少间隔7天的不同天的蛋白质组组合物,例如至少间隔14天、至少间隔21天、至少间隔28天或至少间隔35天。
34.根据前述权利要求的任一项的方法,其中步骤(a)中提供的第一蛋白质组样本代表受试者中乳癌肿瘤切除术前或术后大约4周内的时间点的受试者蛋白质组组合物。
35.根据权利要求34的方法,其中第一蛋白质组样本代表受试者中乳癌肿瘤切除术前大约4周的时间点的受试者蛋白质组组合物,例如,肿瘤切除术前的大约3周、2周、I周、6天、5天、4天、3天、2天、I天或O天。
36.根据权利要求34或35的方法,其中第一蛋白质组样本代表肿瘤切除术前大约I周的时间点的受试者蛋白质组组合物。
37.根据前述权利要求的任一项的方法,其中步骤(c)中提供的另外的蛋白质组样本代表受试者中乳癌肿瘤切除术后大约6个月内的时间点的受试者蛋白质组组合物,例如在肿瘤切除术后大约5个月、4个月、3个月、2个月或I个月内。
38.根据权利要求37的方法,其中另外的蛋白质组样本代表肿瘤切除术后3-6个月内的时间点的受试者蛋白质组组合物。
39.根据前述权利要求的任一项的方法,其中重复步骤(c)和步骤(d),从而提供进一步的蛋白质组样本以及其中测量其中的生物标记物水平,其中进一步的蛋白质组样本代表肿瘤切除术后每6至18个月,直至至少24个月的时间点的受试者的蛋白质组组合物。
40.根据权利要求39的方法,其中进一步的蛋白质组样本代表肿瘤切除术后每10至14个月的时间点的受试者的蛋白质组组合物,例如肿瘤切除术后每12个月。
41.根据权利要求39或40的方法,其中进一步的蛋白质组样本代表肿瘤切除术后直至至少2年的时间点的受试者蛋白质组组合物,例如肿瘤切除术后至少3年、4年、5年、6年、7年、8年、9年或至少10年。
42.根据权利要求41的方法,其中进一步的蛋白质组样本代表肿瘤切除术后直至至少3年的时间点的受试者蛋白质组组合物。
43.根据权利要求34至42任一项的方法,其中受试者中乳癌肿瘤切除术是原发乳癌肿瘤切除术。
44.根据权利要求34至42任一项的方法,其中受试者中乳癌肿瘤切除术是继发乳癌肿瘤切除术。
45.根据前述权利要求的任一项的方法,其中受试者将被施用或已经被施用了化疗和/或放疗。
46.根据前述权利要求的任一项的方法,其中步骤(e)包括确定第一蛋白质组样本和另外的蛋白质组样本之间生物标记物的量的对数改变。
47.根据前述权利要求的任一项的方法,其中受试者中乳癌复发和/或转移的风险确定为数值概率,例如,为确定的时间期间内乳癌复发和/或转移的百分比概率。
48.根据前述权利要求的任一项的方法,其中通过ROCAUC值所确定的方法预测准确性是至少O. 70,例如至少O. 75,0. 80或至少O. 85。
49.根据权利要求48的方法,其中通过ROCAUC值所确定的方法的预测准确性是至少O.80。
50.根据前述权利要求的任一项的方法,其中与用于确定乳癌复发和/或转移风险的至少一个进一步的方法组合来确定乳癌复发和/或转移的风险。
51.根据权利要求50的方法,其中与乳癌复发风险相关的一个或多个核酸表达谱进行组合来确定乳癌复发和/或转移的风险。
52.根据前述权利要求的任一项的方法,进一步包括测量一个或多个用于乳癌诊断或预后的传统临床标记物。
53.根据权利要求52的方法,其中一个或多个传统临床标记物选自绝经前/绝经后状态、雌激素受体和孕酮受体状态、导管/小叶类型、淋巴结状态、组织分级和肿瘤大小。
54.一种用于进行根据权利要求1至53任一项的方法的阵列,其包括能够结合表I所列的生物标记物的一个或多个结合试剂。
55.一种用于进行根据权利要求1至54任一项的方法的阵列,其包括一个或多个能够结合表I (A)所列的生物标记物的结合试剂,例如包括一个或多个能够结合表I (A)所列的生物标记物的2个的结合试剂的阵列。
56.根据权利要求54或55的阵列,其包括一个或多个能够结合表I(B)所列的生物标记物的结合试剂,例如包括一个或多个能够结合表I (B)所列的生物标记物的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18 或 19 个的结合试剂的阵列。
57.根据权利要求54至56任一项的阵列,其进一步包括能够结合表I(C)所列的一个或多个生物标记物的结合试剂,例如包括一个或多个能够结合表I (C)所列的生物标记物的2、3、4、5、6、7、8、9、10、11、12、13、14或15个的结合试剂的阵列。
58.根据权利要求54至57任一项的阵列,其包括一个或多个能够结合表I所列的生物标记物的每一个的结合试剂。
59.根据权利要求54至58任一项的阵列,其包括能够结合相同生物标记物的多个不同结合试剂。
60.根据权利要求54至59任一项的阵列,其中结合试剂包括或由抗体或其抗原结合片段组成。
61.根据权利要求60的阵列,其中抗体或其抗原结合片段是单克隆抗体或其片段。
62.根据权利要求60或61的阵列,其中抗体或其抗原结合片段是重组抗体或其抗原结合片段。
63.根据权利要求60至62任一项的阵列,其中抗体或抗原结合片段选自完整的抗体、Fv片段(如,单链Fv和二硫键Fv)、Fab样片段(如Fab片段、Fab’片段和F (ab) 2片段)、单可变结构域(如Vh和\结构域)和结构域抗体(如,包括单和双形式的dAbs,即dAb —接头一dAb) ο
64.根据权利要求63的阵列,其中抗体或抗原结合片段是单链Fv(scFv)。
65.根据权利要求54至59任一项的阵列,其中一个或多个结合试剂包括或由抗体样结合试剂,例如亲合体或适体组成。
66.根据权利要求54至65任一项的阵列,其中结合试剂是固定的。
67.选自表I的生物标记物的生物标记物作为体外用于确定受试者中乳癌复发和/或转移风险的预后标记物的用途。
68.根据权利要求67的用途,其中生物标记物与一个或多个选自表I(A)所列的生物标记物的另外的生物标记物组合,例如选自表I (A)和/或I (B)所列的生物标记物的I个或2个生物标记物,例如选自表I (B)所列的生物标记物的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17或18或19个生物标记物。
69.根据权利要求67或68的用途,其中生物标记物与表I(C)所列的所有生物标记物组合,例如选自表I (C)所列的生物标记物的1、2、3、4、5、6、7、8、9、10、11、12、13、14或15个另外的生物标记物。
70.根据权利要求67至69任一项的用途,其中生物标记物与表I所列的所有另外的生物标记物组合。
71.一种用于进行根据权利要求1至53任一项的方法的试剂盒,其包括一个或多个能够结合表I所列的生物标记物的结合试剂,例如,权利要求68或69定义的生物标记物的组八口 ο
72.根据权利要求71的试剂盒,其包括能够结合表I(A)和/或I (B)所列的定义的每一个生物标记物的结合试剂。
73.根据权利要求71或72的试剂盒,其进一步包括能够结合表I(C)所列的一个或多个生物标记物的结合试剂。
74.根据权利要求71至73任一项的试剂盒,其包括能够结合选自表I(A)和/或I(B )所列的生物标记物的相同生物标记物的多个不同结合试剂。
75.根据权利要求71至74任一项的试剂盒,其中结合试剂包括或由抗体或其抗原结合片段组成。
76.根据权利要求75的试剂盒,其中抗体或其抗原结合片段是单克隆抗体或其片段。
77.根据权利要求75或76的试剂盒,其中抗体或其抗原结合片段是重组抗体或其抗原结合片段。
78.根据权利要求75至77任一项的试剂盒,其中抗体或抗原结合片段选自完整抗体、Fv片段(如,单链Fv和二硫键的Fv)、Fab样片段(如Fab片段、Fab’片段和F(ab)2片段)、单可变结构域(如Vh和 '结构域)和结构域抗体(如,包括单和双形式的dAbs,即,dAb —接头一dAb)。
79.根据权利要求78的试剂盒,其中抗体或抗原结合片段是单链Fv(scFv)。
80.根据权利要求71至74任一项的试剂盒,其中一个或多个结合试剂包括或由抗体样结合试剂,例如亲合体或适体组成。
81.根据权利要求71至80任一项的试剂盒,其中结合试剂是固定的。
82.根据权利要求71至81任一项的试剂盒,进一步包括生物素。
83.根据权利要求71至82任一项的试剂盒,进一步包括能够检测生物素化的生物标记物存在的检测试剂。
84.根据权利要求71至83任一项的试剂盒,进一步包括用于进行根据权利要求1至53任一项方法的说明书。
85.一种参考说明书和附图基本上如此处描述的方法。
86.一种参考说明书和附图基本上如此处描述的阵列。
87.一种参考说明书和附图基本上如此处描述的生物标记物的用途。
88.一种参考说明书和附图基本上如此处描述的试剂盒。
全文摘要
本发明提供了一种用于受试者中乳癌预后的方法,其包括步骤(a)提供来自受试者的第一蛋白质组样本;(b)测量第一蛋白质组样本中选自列于表1中的生物标记物的一个或多个生物标记物的量;(c)提供来自受试者的另外的(如,第二)蛋白质组样本;(d)测量另外的蛋白质组样本中选自步骤(b)所测量的列于表1中的生物标记物的一个或多个生物标记物的量;和(e)确定第一蛋白质组样本和另外的蛋白质组样本中一个或多个生物标记物的量之间的差异;其中,第一蛋白质组样本和另外的蛋白质组样本代表受试者在不同天的蛋白质组组合物,且其中,第一和另外的(如,第二)蛋白质组样本中一个或多个生物标记物的量间的差异指示受试者中乳癌的复发和/或转移的风险。在进一步的实施方式中,步骤(b)包括测量表1(A)所列的每个生物标记物或表1中所列的所有生物标记物的量。另外地本发明提供了用于进行本发明方法的阵列,选自表1中的生物标记物的生物标记物作为用于确定受试者中乳癌复发和/或转移风险的预后标记物的用途,以及用于进行本发明方法的试剂盒,其包括一个或多个能够结合表1中所列生物标记物的结合试剂。
文档编号G01N33/574GK103038642SQ201180035844
公开日2013年4月10日 申请日期2011年6月9日 优先权日2010年6月11日
发明者C·A·K·博雷贝克, C·L·B·温格伦 申请人:伊缪诺维亚公司