专利名称:表征分析物的方法和设备的制作方法
技术领域:
本公开的方法和设备涉及分析物的分析,这些分析物包括但不限于蛋白质、多肽、肽、脂类和多糖。具体而言,这些方法和设备涉及蛋白质、多肽和/或肽的鉴定和/或测序。
背景技术:
分析物如蛋白质的鉴定和/或测序对于医学诊断学、法医学、毒理学、病理学、生物战、公共卫生和许多其它领域是至关重要的。鉴定一种具体病原体或试剂的能力可取决于对该病原体或试剂的一种或多种特定分析物特征的鉴定。在疾病过程、新陈代谢、生长和细胞分裂中所涉及的调节途径的鉴定可取决于对分析物的鉴定和/或测序。虽然目前大量研究涉及核酸或蛋白质的鉴定和/或测序,但其它分析物如糖类、多糖、脂类、脂肪酸等也具有重要性。这里公开的方法和设备集中于蛋白质、多肽和肽的鉴定和/或测序。然而,它们也用于分析其它类型的分析物。
基于Edman降解技术的现有蛋白质测序方法受到被测序蛋白质长度的限制。精确的序列确定被限制在每轮测序大约50到100个氨基酸残基。可以是上千氨基酸残基长度的更长蛋白质的测序要求切割成较小的片段和装配成重叠的短序列。该过程费力、昂贵、效率低且耗时,并且通常需要使用放射活性标记物和其它有害化学物质,这可带来安全和废物处理问题。
多种技术可用于鉴定蛋白质、多肽和肽。一般地,这些技术涉及抗体的结合和检测,所述抗体可以识别蛋白质上的一种或多种表位域(epitopic domain)。虽然基于抗体的蛋白质鉴定相当快速,但这些测试方法偶然地可以显示出不可接受的高水平的假阳性或假阴性结果,原因在于抗体与不同抗原的交叉反应性、靶分析物的低抗原性(导致该测试的低灵敏度)、抗体与各种表面的非特异性结合,等等。它们也需要制备可以识别个体蛋白质或肽的抗体。因此,它们不适合用于鉴定从前未被表征过的新的蛋白质。最近,质谱已被用于肽的鉴定和/或测序。可将蛋白质和多肽切割成较小片段,并通过质谱,鉴定这些片段的氨基酸组成。分析足够数目的重叠片段可以提供有关氨基酸序列的数据。该过程同样费力、昂贵并需要基本纯化待分析的蛋白质或肽。
在本领域中,存在着对适合于鉴定和/或测序分析物的方法和设备的需求,这些分析物包括以前未被鉴定或表征的蛋白质和肽。
附图简述 下面的附图形成本说明书的一部分,并被包括以进一步说明本公开方法和设备的某些方面。参照这些附图中一个或多个,结合此处所述的详细说明,可以更好地理解这些方法和设备。
图1是流程图,说明通过产生距离图(distance map)140,对蛋白质进行测序150和/或鉴定160的非限制性示例设备100(未按比例)和方法。
图2说明通过光检测,测序和/或鉴定蛋白质230的次级设备200(未按比例)的非限制性例子。
图3说明通过电检测,测序和/或鉴定蛋白质310的次级设备300(未按比例)的另一个非限制性例子。
图4显示在半胱氨酸残基上进行蛋白质标记的非限制性例子。
图5显示在赖氨酸、精氨酸和N-末端残基上进行蛋白质标记的非限制性例子。
图6显示在天冬氨酸、谷氨酸和C-末端残基上进行蛋白质标记的非限制性例子。
图7显示在丝氨酸和苏氨酸残基上进行蛋白质标记的非限制性例子。
图8显示四个不同类型核苷酸的拉曼光谱。每个不同类型的核苷酸具有特征拉曼发射峰。数据是在没有对核苷酸进行表面增强或标记的情况下收集的。
图9显示用荧光素共价标记的脱氧腺苷三磷酸(上曲线)和未标记dATP(下曲线)的500nM溶液的比较SERS光谱。dATP-荧光素从Roche Applied Science(Indianapolis,IN)获得。在荧光素标记的dATP中,检测到SERS信号的强烈增加。
图10说明1mM色氨酸的拉曼光谱,收集时间为1秒(上曲线)和0.1秒(下曲线)。
图11显示1mM半胱氨酸的拉曼光谱,收集时间为0.1秒。
图12示例1mM甲硫氨酸的拉曼光谱,收集时间为1秒。
图13说明1mM组氨酸的拉曼光谱,收集时间为1秒。
图14显示1mM苯丙氨酸的拉曼光谱,收集时间为1秒。
图15显示1mM精氨酸的拉曼光谱,收集时间为0.1秒。
图16显示1mM酪氨酸的拉曼光谱,收集时间为1秒(上曲线)和0.1秒(下曲线)。
图17显示1mM 5-氟色氨酸的拉曼光谱,收集时间为0.1秒。
图18说明1%胎牛血清的拉曼光谱,在铝板上干燥,收集时间为1秒。
图19显示100%全牛血清的拉曼光谱,收集时间为1秒。
图20显示0.1%全牛血清的拉曼光谱,收集时间为1秒。
图21显示通过血清蛋白质的胰蛋白酶消化而获得的各种片段的拉曼光谱。肽通过反相高压液相层析法(HPLC),在C18柱上被分离。
详细说明定义 如这里所使用,“一个(a)”或“一个(an)”指一个或多于一个的事项。
术语“蛋白质”、“多肽”和“肽”指氨基酸按线性方式装配而成的聚合物分子。这些术语之间的区别主要是长度的区别,肽的长度通常为约2到约25个氨基酸残基,多肽的长度为约10到约100个氨基酸残基,以及蛋白质的长度约50个残基或更长。这些术语重叠,并且本领域技术人员会了解,在下面的公开内容提到蛋白质或多肽或肽的地方,术语包括任何长度的聚合物。在本说明书使用术语“蛋白质”的地方,理解为该术语也包括“多肽”和/或“肽”。也考虑,将被分析的蛋白质可以包括天然存在的氨基酸残基、修饰的氨基酸残基、衍生化的氨基酸残基、氨基酸类似物和/或非天然存在的氨基酸。也包括已被任何标签标记的氨基酸残基。虽然天然存在的蛋白质中的氨基酸残基通常通过肽键连接在一起,但在所公开方法的范围内,氨基酸残基可以通过肽键或通过已知共价连接的任何其它类型连接在一起。
术语“纳米孔(nanopore)”、“纳米通道(nanochannel)”和“纳米管(nanotube)”分别指孔、通道或管,其直径或宽度在1到999纳米(nm)之间,更通常在1到100nm之间,甚至更通常在1到10nm之间。如这里所使用,术语“纳米孔”、“纳米管”和“纳米通道”可以被交换使用。本领域技术人员将认识到,在说明书提及“纳米孔”的地方,不同的替代可以使用“纳米通道”或“纳米管”。惟一的要求是纳米孔、纳米通道或纳米管将一个充满流体的区室与另一个相连,并且允许被标记蛋白质的通过和检测。
如这里所使用,“可操作地连接(operably coupled)”意指,在两个或多个元件之间存在功能关系和/或结构关系。例如,如果布置检测器,使得它可以鉴定通过纳米孔的被标记氨基酸残基,则该检测器就是与该纳米孔“可操作地连接”。类似地,如果室中的蛋白质可以通过纳米孔,则该纳米孔就是与该室可操作地连接。在检测器和/或检测器的传感元件被整合进纳米孔的地方,该检测器也可以是与该纳米孔“可操作地连接”。
如这里所使用,“流体交通(fluid communication)”指两个或多个区室之间的功能性连接,其允许流体在这些区室之间通过。例如,如果流体可以从第一区室到第二区室和/或从第二区室到第一区室,则该第一区室与该第二区室为“流体交通”。
说明性实施方式描述 本公开的方法和设备用于快速、自动的蛋白质测序和/或鉴定。超越现有技术方法的优势包括高流通量、单个被标记蛋白质分子的灵敏检测、氨基酸残基距离的纳米尺寸分辨率以及蛋白质测序和/或鉴定的较低单位花费。
下面的详细描述包含许多具体的细节,以提供对所要求的方法和设备更全面的理解。然而,对本领域普通技术人员而言,显而易见的是这些方法和设备可以在没有这些具体细节的情况下被实施。在其它情况下,本领域熟知的设备、方法、过程和各个组件在这里不做详细描述。
如图1所说明,可将核酸模板放置在一个或多个室120中,每个室120包含不同的被标记氨基酸。可以通过体外翻译或偶联的转录/翻译,产生由核酸模板编码的被标记蛋白质。该被标记蛋白质可以通过一个或多个与各个室相连的纳米孔,这些纳米孔穿透一层或多层可操作地连接于检测器的传感器层。当被标记蛋白质通过纳米孔时,被标记氨基酸残基被检测。被标记氨基酸残基之间的距离被测定,并对每一类型的被标记氨基酸残基汇编距离图140。可使用距离图140测序150和/或鉴定160被标记蛋白质。
本领域技术人员会了解,考虑的距离图140可以显示亚纳米或更大尺寸上的距离。例如,在线性蛋白质序列中的单个氨基酸具有大约0.6nm的尺寸。在典型的蛋白质的凝胶电泳过程中(约10伏特/cm的场强),分子可以在60分钟内移动大约100mm(或每秒移动大约28,000nm)。由于现有的电检测器能够倒计数到毫微微秒级,因此相邻氨基酸的检测很好地在检测界限之内。如果给定蛋白质在电泳下的移动速率,1纳秒的时间间隔将等于0.036nm的距离,其小于约0.154nm的碳-碳键键长。检测两个相邻的氨基酸残基将用大约20纳秒。距离图140的范围可以从平均亚基距离(0.6nm)到全长蛋白质的长度,其可以是上千个氨基酸长。
在可选的方法中,可以通过在例如包括被标记氨基酸的溶液中培育细胞并从培育的细胞中纯化一种或多种蛋白质,制备被标记蛋白质。在另一可选方法中,可以用编码感兴趣蛋白质的表达载体转化细胞,并使其形成被标记蛋白质。在用20个室120包含所有20种不同被标记氨基酸残基的情况下,可以将距离图140汇编成完整的蛋白质序列150。
蛋白质、多肽和肽 将被分析的蛋白质可以是[1]从天然来源纯化的;[2]通过mRNA种类的体外翻译或通过DNA种类的偶联的转录/翻译而被表达的;和/或[3]在已用基因或互补DNA(cDNA)种类转化的宿主细胞中被表达的。这些方法并非限制性的,并且要被分析的蛋白质可以用本领域所知的任何方法制备。
蛋白质纯化 将被分析的蛋白质在分析前,可以部分或全部从多种来源纯化。蛋白质纯化技术是本领域熟知的。这些技术通常包括将细胞或组织的匀浆物初始地粗分级分离和/或提取为蛋白质和非蛋白质组分。分级分离可以利用,例如,在水溶液、去污剂和/或有机溶剂中不同的溶解度;通过酶消化,去除各类污染物如核酸;用硫酸铵、聚乙二醇、抗体、热变性以及类似方法使蛋白质沉淀,然后进行超速离心分离。在蛋白质纯化中使用的各种去污剂是本领域已知的,包括但不限于,离子表面活性剂(例如,十二烷基硫酸钠、胆酸钠、脱氧胆酸钠、溴化十六碳烷基三甲铵)和非离子表面活性剂(例如,Triton X-100、Tween-20、Brij-35、毛地黄皂苷、NonidetP40、辛基葡糖苷)。当利用电检测被标记残基时,非离子表面活性剂可以具有更大的用途。对于光学检测,离子或非离子去污剂都可以使用。对于光学检测,在用于激发和检测的波长处不表现基本吸收和/或发射的去污剂会具有更大的用途。还原剂,例如二硫苏糖醇或β-巯基乙醇可用于还原二硫键和分离蛋白质聚集体。通过透析、过滤和/或有机相萃取,可以除去低分子量污染物。
可以通过层析和/或电泳技术纯化感兴趣的蛋白质(多种蛋白质),以实现部分或完全纯化。适于纯化蛋白质、多肽和肽的方法包括但不限于离子交换层析、凝胶排阻层析、聚丙烯酰胺凝胶电泳、亲和层析、免疫亲和层析、羟基磷灰石层析、疏水作用层析、反相层析、等电聚焦、快速蛋白质液相层析(FPLC)和高压液相层析(HPLC)。这些以及其它蛋白质纯化方法是本领域已知的,并对于所要求的主题不是限制性的。可以使用任何已知的蛋白质纯化方法。不要求蛋白质必须为最纯的状态。显示出较低程度的相对纯化的方法可以在例如提高被标记蛋白质的回收率方面具有优势。
可使用亲和层析纯化一些蛋白质。该方法依赖于蛋白质和与它特异性结合的分子之间的亲和力。可以通过将蛋白质结合配体与不溶性基质(matrix)共价连接,制备层析物质,所述配体例如抗体、抗体片段、受体蛋白、底物(substrate)、抑制剂、这些配体的产物或类似物,所述基质例如柱层析珠子或尼龙或其它膜。然后,该基质可用于从溶液中特异性吸收靶蛋白质。通过改变溶剂条件(例如pH、离子强度、温度、去污剂浓度等),进行洗脱。亲和层析的一个最常规形式是免疫亲和层析。产生针对各种蛋白质的抗体用于免疫亲和层析的方法是本领域熟知的。
可以特异地标记感兴趣的蛋白质,用以协助纯化。通过找寻标记物的存在的纯化方案,可以得到感兴趣的蛋白质。用侧链特异性和/或选择性试剂,可以翻译后标记蛋白质,如下所述。标记蛋白质的各种方法是本领域已知的,下面将详细讨论。
体外翻译 蛋白质可以用带有mRNA模板的体外翻译系统表达。进行体外翻译的完整试剂盒(Complete kits)可以从商业来源获得,例如Ambion(Austin,TX)、Promega(Madison,WI)、Amersham Pharmacia Biotech(Piscataway,NJ)、Invitrogen(Carlsbad,CA)和Novagen(Madison,WI)。这种试剂盒可以利用总RNA、纯化的聚腺苷酸化的mRNA和/或从细胞、组织或其它样品获得的纯化的各个mRNA种类。制备用于体外翻译的不同RNA片段和/或各个mRNA种类的方法是已知的。(例如,Sambrook等,Molecular CloningA Laboratory Manual,Cold SpringHarbor Laboratory Press,Cold Spring Harbor,NY,1989;Ausubel等,Current Protocols in Molecular Biology,Wiley and Sons,New York,NY,1994)。
通常使用的体外翻译系统基于兔网织红细胞裂解物、麦胚提取物和大肠杆菌(E.coli)提取物。基于兔网织红细胞裂解物的体外翻译系统对于真核翻译特别强有力和有效。这些系统包含细胞粗提取物,其包括核糖体亚基、转运RNAs(tRNAs)、氨酰tRNA合成酶、起始因子、延伸因子及终止因子和/或翻译所需的所有其它组分。这些提取物中存在的天然氨基酸可以用一种或多种不同类型的被标记氨基酸补充。根据用途,标记物可以被限制于单种氨基酸。可选地,可以将待翻译的样品分成不同的次级样品,将每一个次级样品暴露于不同类型的被标记氨基酸。对于光学检测方法,色氨酸或5-氟-色氨酸显示天然荧光,可以用于拉曼光谱。可以在蛋白质合成前或通过翻译后修饰,将标记物添加在其它氨基酸残基上。在补充体外翻译系统中使用的其它组分和这些系统使用的方法是本领域已知的(参见,例如Ambion网站)。
可以将体外翻译与基因的转录相结合,以产生mRNA。这种偶联的转录/翻译系统可以使用PCR扩增产物和/或插入标准表达载体中的DNA序列,这些表达载体例如BACs(细菌人工染色体)、YACs(酵母人工染色体)、黏粒、质粒、噬菌体和/或其它已知的表达载体中的DNA序列。偶联的转录/翻译系统可从商业来源获得(例如,ProteinscriptTMII kit,Ambion,Austin,TX;Quick Coupled System,Promega,Madison,WI;Expressway,Invitrogen,Carlsbad,CA)。这些系统可以整合各种组分,以最佳化转录和翻译的效果,例如聚腺苷酸化的序列、共有核糖体结合(Kozak)序列、Shine-Dalgarno序列和/或其它本领域所知的调节序列。
被标记蛋白质可以在分析之前从粗体外翻译混合物中纯化,或可选地,可以不经纯化就进行分析。蛋白质纯化的使用部分取决于是用粗RNA组分还是用纯化RNA种类作为翻译的模板。
在宿主细胞中的蛋白质表达 可以将编码感兴趣的靶蛋白质的核酸整合进表达载体,以转化进宿主细胞和产生编码的蛋白质。本领域已知的宿主细胞系的非限制性例子包括细菌如大肠杆菌(E.coli)、酵母如毕赤酵母(pichia pastoris)以及哺乳动物细胞系,例如VERO细胞系、HeLa细胞系、中国仓鼠卵巢细胞系、人胚胎肾(HEK)293细胞、小鼠成神经细胞瘤N2A细胞,或W138、BHK、COS-1、COS-7、293、HepG2、3T3、RIN、L-929和MDCK细胞系。这些和其它宿主细胞系可以从标准来源获得,例如美国典型培养物保藏中心(Rockville,MD)或商业卖主。
可以表达完整的基因,或可以表达编码部分蛋白质的基因片段。通过标准克隆技术,可以将编码感兴趣的蛋白质(多种蛋白质)的基因或基因片段插入表达载体。通过已知技术,可以制备含有在给定细胞或组织类型中表达的部分或全部信使RNA的表达文库。可以筛选这些文库,筛选编码特定的感兴趣的蛋白质的克隆,例如使用抗体或寡核苷酸探针以及已知的筛选技术。
通过本领域公知的技术,可以进行基因工程,使DNA片段(多个片段)在原核或真核体系中表达。任何已知的表达系统可用于蛋白质表达。表达载体可以包括各种已知的蛋白质表达调节元件,例如启动子、增强子、核糖体结合位点、终止序列、聚腺苷酸化位点等。
在细菌表达载体中常规使用的启动子包括β-内酰胺酶、乳糖和色氨酸启动子系统。酵母表达载体中的合适的启动子序列包括3-磷酸甘油酸激酶或其它糖酵解酶的启动子。用于哺乳动物细胞表达的启动子可以来源于哺乳动物细胞的基因组(例如金属硫蛋白启动子)或来源于哺乳动物病毒(例如腺病毒晚期启动子或SV40的早期和晚期启动子)。许多其它启动子是已知的,并可以被用于所公开方法的实践中。
使用的真核表达系统包括但不限于,用例如重组杆状病毒感染的昆虫细胞系统,或用重组花椰菜花叶病毒或烟草花叶病毒感染的植物细胞系统。在示例性昆虫细胞系统中,苜蓿银纹夜蛾(Autographacalifornica)核型多角体病毒被用作载体,以在草地夜蛾(Spodopterafrugiperda)细胞或Hi5细胞系(Invitrogen,Carlsbad,CA)中表达外源基因。核酸编码序列被克隆到例如在多角体蛋白启动子的控制下的病毒的多角体蛋白基因中。包含克隆基因的重组病毒然后被用于感染草地夜蛾(Spodoptera frugiperda)细胞,并表达插入的基因(例如,美国专利4,215,051;Kitts等,Biotechniques 14810-817,1993;Lucklow等,J.Virol.,674566-79,1993)。其它示例性昆虫细胞表达载体基于杆状病毒载体,例如pBlueBac(Invitrogen,Sorrento,CA)。
在哺乳动物细胞系中的示例性表达系统可以用腺病毒作为表达载体。编码序列可以被连接到例如腺病毒晚期启动子上。可以通过体外或体内重组,将克隆的基因插入到腺病毒基因组中。在病毒基因组的非必需区(例如E1或E3区)中的插入形成能够在哺乳动物宿主细胞中感染和表达克隆蛋白质的重组病毒。这些公开的例子不是限制性的,可以使用任何已知的表达载体。
用表达载体转化的细胞可以与未转化的细胞选择区分开。可以使用许多选择系统,包括但不限于,胸腺嘧啶核苷激酶基因、次黄嘌呤鸟嘌呤磷酸核糖转移酶基因、氨甲蝶呤抗性基因、新霉素磷酸转移酶基因和潮霉素抗性基因。包含在标准克隆载体中的这些基因要么将抗性赋予细胞毒剂,要么允许细胞在养分缺乏的培养基中生长。
被表达的蛋白质可以在分析之前被部分或完全纯化。通过将被克隆的序列表达为包含短前导序列的融合蛋白,可以协助蛋白质的纯化,该短前导序列允许快速亲和纯化。这种融合蛋白表达系统的例子是谷胱甘肽S-转移酶系统(Pharmacia,Piscataway,NJ)、麦芽糖结合蛋白系统(NEB,Beverley,MA)、FLAG系统(IBI,New Haven,CT)和6xHis系统(Qiagen,Chatsworth,CA)。前导序列可以通过蛋白酶的特异性识别位点与蛋白质连接,允许在分析蛋白质前移去该前导序列。合适的蛋白酶识别序列的例子包括那些被烟草蚀刻病毒蛋白酶(LifeTechnologies,Gaithersburg,MD)或Factor Xa(New England Biolabs,Beverley,MA)识别的序列。可选地,被表达的蛋白质可以通过上面讨论的标准技术纯化。
虽然上述方法涉及蛋白质的分析,但它们也能够用于其它类型分析物的分析。例如,可在被标记的单糖和多糖中培育的细胞可以被纯化以及鉴定和/或测序,如这里所述。可以将被标记的亚基(如单糖)衍生化,以防止它代谢和转化为不同的结构。这些分析物的亚基和聚合物形式是本领域已知的。
蛋白质的标记 待分析的蛋白质可以包括被标记的氨基酸残基。可以用本领域所知的任何方法标记氨基酸。被标记的氨基酸残基可以在合成过程中被整合到蛋白质中。可选地,可以在蛋白质合成之后,通过共价或非共价键合,将标记物连接到氨基酸残基。
在本公开的方法中使用的标记物可以包括但不限于任何可通过电学技术、光学技术、分光光度技术、光化学技术、生物化学技术、免疫化学技术和/或其它化学技术检测的成分。标记物可包括但并不限于,导电标记物、发光标记物、荧光标记物、化学发光标记物、生物发光标记物和磷光标记物、纳米颗粒、金属纳米颗粒、金纳米颗粒、银纳米颗粒、色原、抗体、抗体片段、基因工程抗体、酶、底物、辅因子、抑制剂、结合蛋白、磁性颗粒以及自旋标记物。
可以使用的可光检测标记物的非限制性例子包括丹磺酰氯、异硫氰酸罗丹明、TRIT(四甲基罗丹明异硫醇)、NBD(7-硝基苯并-2--1,3-二唑)、德克萨斯红染料、邻苯二甲酸、对苯二酸、间苯二酸、甲酚固紫、甲酚蓝紫、亮甲酚蓝、对氨基苯甲酸、藻红、生物素、地高辛、荧光素、5-羧基-4′,5′-二氯-2′,7′-二甲氧基荧光素、5-羧基-2′,4′,5′,7′-四氯荧光素、5-羧基荧光素、5-羧基罗丹明、氨基吖啶、6-羧基罗丹明、6-羧基四甲基氨基酞菁、次甲基偶氮(azomethine)、花菁、黄嘌呤、琥珀酰荧光素、稀土金属穴状化合物、三联吡啶二胺铕、铕穴状化合物或螯合物、二胺、双花青、La Jolla蓝色染料、别藻蓝蛋白、藻蓝蛋白C、藻蓝蛋白R、硫胺素、藻红青素、藻红素R、萤光素或吖啶酯。这些以及其它发光标记物可以从商业渠道获得,例如MolecularProbes(Eugene,OR),并通过本领域已知的方法,连接到氨基酸上。可选地,某些预先被标记的氨基酸是商业可得的(例如MolecularProbes,Eugene,OR)。
氨基酸残基可以被标记上可电检测的标记物,例如金属纳米颗粒。可以使用尺寸在1nm到3nm之间的金或银纳米颗粒,但也可以使用其它不同尺寸和质量的纳米颗粒。制备纳米颗粒的方法是已知的。(参见,例如,美国专利号6,054,495;6,127,120;6,149,868;Lee和Meisel,J.Phys.Chem.863391-3395,1982)。纳米颗粒也可以从商业渠道获得(例如Nanoprobes Inc.,Yaphank,NY;Polysciences,Inc.,Warrington,PA)。修饰的纳米颗粒是商业可得的,例如来自Nanoprobes,Inc.(Yaphank,NY)的Nanogold纳米颗粒。Nanogold纳米颗粒可以用单个或多个马来酰亚胺、胺或其它基团连接每个纳米颗粒而获得。Nanogold纳米颗粒也可以以正电荷或负电荷形式得到。可以在氨基酸残基被整合进蛋白质之前或之后,将这种被修饰的纳米颗粒共价地连接到该氨基酸残基上。可以将纳米颗粒或其它标记物通过任何已知的连接化合物(linker compound)连接到氨基酸残基上,以降低空间位阻和促进蛋白质的聚合。
被标记的氨基酸残基可以被整合进由核酸模板制得的蛋白质。可选地,可在蛋白质合成后,将标记物连接到特定类型的氨基酸残基。在一些方法中,可以通过抗体-抗原相互作用连接标记物。可以将标记物如荧光素或生物素连接到蛋白质分子的一个末端,例如N-末端或C-末端。
用侧链特异性和/或选择性的试剂,可以在翻译后标记蛋白质。这些试剂以及翻译后修饰的方法是本领域已知的。可使用的非限制性的示例性试剂包括乙酸酐(赖氨酸、半胱氨酸、丝氨酸和酪氨酸);三硝基苯磺酸盐/酯(赖氨酸);碳二亚胺(谷氨酸、天冬氨酸);苯甲酰甲醛(精氨酸);2,3-丁二酮(精氨酸);磷酸吡哆醛(赖氨酸);对氯汞苯甲酸(半胱氨酸);5,5′-二硫代双(2-硝基-苯甲酸)(半胱氨酸);焦碳酸二乙酯(赖氨酸、组氨酸);N-溴丁二酰亚胺(色氨酸)和四硝基甲烷(半胱氨酸、酪氨酸)。可以对这些试剂进行修饰,以连接各种类型的标记物,例如拉曼标记物。可选地,包含与各种类型氨基酸侧链连接的活性基团的拉曼标记物和/或金纳米颗粒可以从商业渠道获得(Molecular Probes,Eugene,OR;Nanoprobes,Inc.,Yaphank,NY)。
可以使用本领域已知的各种交联剂,将标记物连接到蛋白质,例如同双功能交联剂、异双功能交联剂和/或可光活化的交联剂。这些试剂的非限制性例子包括双酰亚胺盐(bisimidate);1,5-二氟-2,4-(二硝基苯);辛二酸的N-琥珀酰亚胺酯;酒石酸二琥珀酰亚胺酯;二甲基-3,3′-二硫代-双丙酰亚胺酯;N-琥珀酰亚胺基-3-(2-吡啶基二硫代)丙酸酯;4-(溴氨基乙基)-2-硝基苯氮化物;以及4-叠氮乙二醛。交联剂的使用方法是本领域熟知的。
纳米孔、纳米通道和纳米管 被标记的蛋白质或其它聚合物可以通过一个或多个纳米孔、纳米通道或纳米管,以便分析。如这里所使用,术语纳米孔、纳米管和纳米通道被交换使用。本领域技术人员会认识到,当说明书提到纳米孔时,不同的选择方式可以使用纳米通道或纳米管。惟一的要求是纳米孔、纳米通道或纳米管将一个充满流体的区室与另一个相连,并且允许被标记蛋白质的通过和检测。
尺寸特征 使用的纳米孔的直径可以是大约0.5、1、2、3、4、5、6、7、8、9或10nm。然而,该直径的范围可以为1-3、1-5、1-10、1-20、1-50、1-100、5-10、5-20、10-20、20-50、30-75、50-75、50-100、75-100、100-300、300-400、400-500或100-999nm。可以选择纳米孔的直径,以便一次通过线性构型的单个蛋白质。在某些可选方式中,纳米孔的直径可以被选择为太小,以致不能通过球状或折叠构象的蛋白质。各种折叠和未折叠蛋白质的尺寸是本领域已知的,并可以通过已知技术如过滤或超离心进行估计。可以用已知方法,将待分析的蛋白质解折叠和/或部分或全部变性,以促进它们以线性构象通过纳米孔。这些方法包括但不限于,暴露于碱性或酸性pH的介质;使用高或低的盐浓度;使用去污剂如十二烷基硫酸钠、辛基葡糖苷或Triton X-100;使用离液剂如脲或胍盐(guanidinium);用二硫化物还原剂如二硫苏糖醇或巯基乙醇处理;暴露于有机溶剂,等等。可选地,可以通过蛋白质的有限蛋白水解消化,产生线性肽。当氨基酸残基要用大体积基团标记时,纳米孔可以大一些,以允许被标记蛋白质通过。在使用纳米管或纳米通道代替纳米孔的选择方式中,同样的尺寸考虑适用于纳米管或纳米通道的直径或宽度。
纳米孔、纳米管和纳米通道的制造 单个地或以阵列形式制造纳米孔、纳米管和/或纳米通道可以使用本领域已知的任何纳米级制造技术。可以使用已知的纳米光刻方法(nanolithography methods),在包括传感器层的固态基质上,建造纳米孔、纳米通道和/或纳米管,纳米光刻方法包括但不限于,化学气相沉积、电化学沉积、化学沉积、电镀、热扩散和蒸发、物理气相沉积、溶胶-凝胶沉积、聚焦电子束、聚焦离子束、分子束外延、蘸水笔纳米光刻术、活性离子束蚀刻、化学辅助离子束蚀刻、微波辅助等离子体蚀刻、电氧化、扫描探针方法、化学蚀刻、激光消融(laser ablation)或本领域已知的任何其它方法(例如美国专利US 6,146,227)。
纳米孔、纳米管和/或纳米通道可以穿透一层或多层传感器层。传感器层可以包括半导体材料,这些半导体材料包括但不限于,硅、二氧化硅、四氮化三硅、锗、砷化镓和/或金属基组分如金属或金属氧化物。可以通过电子束、离子束和/或激光光刻以及蚀刻技术,处理传感器层,以形成通道、凹槽或孔。通过从扫描隧道显微镜(STM)或原子力显微镜(AFM)的探针(tip)或从溶液进行场蒸发,可以将包含金属的导电层沉积在半导体表面。通过将半导体表面氧化为绝缘成分,可以形成绝缘层。
通过本领域已知的各种技术,可以将通道或凹槽蚀刻进半导体表面,这些技术包括但不限于在氧化物蚀刻溶液中使用STM/SFM探针的方法。形成通道之后,可以使两个半导体表面相对,形成贯穿半导体的一个或多个纳米孔或纳米通道。采用本领域已知的技术,可以使用STM探针方法,形成纳米孔、纳米检测器、纳米线(nanowire)、纳米引线(nanolead)、纳米通道以及其它纳米结构。可以使用扫描探针、化学蚀刻技术和/或微加工技术,在半导体基板上切割出微米尺寸或纳米尺寸的通道、凹槽或孔。
可以采用纳模塑法(nano-molding),其中形成的纳米管,例如碳纳米管或金属纳米管被放置在半导体芯片基板上或在半导体芯片基板上生长。在基板上沉积另外的材料之后,将纳米管移去,留下纳米通道和/或纳米孔压印在基板材料中。这种纳米结构可以被建造成具有分子电极性质的簇,其可以起检测器的作用。
使用高通量电子束光刻系统(high-throughput electron-beamlithography system),可制造出纳米孔和/或纳米通道。电子束光刻可用来在硅芯片上写出像5nm那么小的特征。灵敏性抗蚀剂诸如聚甲基丙烯酸甲酯被涂布于硅的表面,可以不使用掩模而形成图案。电子束阵列可以与具有微通道放大器的场发射簇(field emitter cluster)结合,以增加电子束的稳定性,允许在低电流下的操作。SoftMaskTM计算机控制系统可以被用来控制在硅或者其它芯片上的纳米级特征的电子束光刻。
纳米孔和/或纳米通道可以用聚焦原子激光(例如,Bloch等,″Optics with an atom laser beam,″Phys.Rev.Lett.87123-321,1)来制造。聚焦原子激光可以被用于光刻法(lithography),这很像标准激光或者聚焦电子束。这样的技术可以在芯片上制造出微米级或甚至纳米级的结构。在另一个可选方式中,可以使用蘸水笔纳米光刻术形成纳米通道(例如,Ivanisevic等,“Dip-Pen Nanolithography on SemiconductorSurfaces,”J.Am.Chem.Soc.,1237887-7889,1)。蘸水笔纳米光刻术使用AFM技术在表面如硅芯片上沉积分子。尺寸上像15nm那么小的特征都可以被形成,具有10nm的空间分辨率。使用蘸水笔纳米光刻,结合常规的光刻(photolithography)技术,可形成纳米孔和/或纳米通道。例如,抗蚀剂层上的微米级的线可以用标准的光刻术来形成。使用蘸水笔纳米光刻,可以通过沉积额外的抗蚀剂化合物来使线的宽度以及蚀刻之后通道的对应直径变窄。蚀刻更窄的线之后,可形成纳米级的通道。可选地,可用AFM移除光致抗蚀剂(photoresist)材料以形成纳米级的特征。
离子束光刻可用于在芯片上形成纳米孔和/或纳米通道(例如,Siegel,″Ion Beam Lithography,″VLSI Electronics,MicrostructureScience,<BR>Vol.16,Einspruch and Watts Eds.,Academic Press,NewYork,1987)。精细聚焦的离子束可被用来直接在抗蚀剂层上写出纳米级痕迹而不使用掩模。可选地,宽的离子束可以与掩模结合使用以形成小至100nm级别的痕迹。化学蚀刻,例如氢氟酸蚀刻,可以用来移除未被抗蚀剂保护的暴露的硅或其它芯片材料。技术人员将会意识到上面公开的技术并不是限制,纳米孔和/或纳米通道可以使用本领域所知的任何方法来形成。
可以通过涂覆,修饰纳米孔、纳米管或纳米通道的表面,例如,将表面从疏水性转化为亲水性表面,和/或减少表面对聚合物如蛋白质的吸附。常规芯片材料如玻璃、硅和/或石英的表面修饰在本领域是已知的(例如,美国专利US 6,263,286)。这些修饰可以包括但不仅限于涂覆以可通过商业途径获得的毛细涂料(Supelco,Bellafonte,PA)、具有各种官能团诸如聚环氧乙烷或丙烯酰胺的硅烷,或者其它任何已知的涂料。当这些涂料干扰标记物检测,例如使用电检测器时干扰电导率,它们是不合适的。
碳纳米管 纳米孔可以包括纳米管,可以与纳米管连接,或被纳米管取代,例如碳纳米管。可以将碳纳米管涂覆有机或无机成分,在碳纳米管上留下沉积层“模子(mold)”。当纳米管被移去并与有机或无机沉积层分离时,可以在“模子”中形成纳米孔或纳米通道。可以在半导体中形成碳纳米管,而其它组件如传感器层可以在纳米管周围形成。
可以用化学气相沉积法(chemical vapor deposition,CVD),制造碳纳米管,采用沉积在硅上的乙烯和铁催化剂(例如,Cheung等PNAS 973809-3813,2000)。可以使用AFM Si3N4探针,通过CVD法,在硅芯片上形成单壁碳纳米管(例如,Cheung等,2000;Wong等Nature 39452-55,1998)。通过在高载荷(~1μN)、高扫描速度(30Hz)和大扫描尺寸(40μm)下,与硅或CVD菱形表面(GE Suprabrasives,Worthington,OH)接触几分钟,可以在硅AFM探针上形成1-5μm2的平坦表面。通过在2.1V时阳极化100秒,可以在AFM探针末端制造大约100nm直径、1μm深的孔。可以将被阳极化的探针在0.03%KOH的水溶液中蚀刻50秒,然后可用乙醇除去过量的硅,在探针的表面形成纳米孔。
可采用已知的方法,将碳纳米管与AFM探针连接。例如,根据Murphy等的方法(Austr.J.Soil Res.13189-201,1975),可以合成由氧化铁纳米颗粒组成的铁催化剂。使用-0.5V时的铂反电极可以从胶状悬浮液将铁催化剂(0.5到4nm颗粒)电化学沉积到孔中(Cheung等,2000)。可以在水中洗涤探针,以除去过量的氧化铁颗粒。通过加热,可以在氧气中氧化AFM探针,并通过在碳源存在下有控制地加热和冷却,在催化剂上生长碳纳米管(Murphy等,1975;Cheung等,2000)。形成的碳纳米管的直径应当对应于所用的氧化铁催化剂的颗粒大小(0.5到4nm)。在这些条件下制备的各个单壁碳纳米管垂直于AFM探针的平坦化表面排列。可以通过已知的方法,除去残留的铁催化剂。
用已知技术,可以将碳纳米管切割为预先确定的长度。在本发明的一些实施方式中,用丙烯酸胶粘剂,可以将碳纳米管连接到棱锥形镀金硅悬臂上。通过在氧气氛中,在探针和铌表面之间应用偏电压,可以将碳纳米管缩短到确定长度(Wong等,Nature 39452-55,1998)。可选地,可以用高能量束使碳纳米管变短。这种高能量束可以包括但不限于激光束、离子束和电子束。截短碳纳米管的可选方法是本领域已知的(例如,美国专利US 6,283,812)。可以将预先形成的碳纳米管连接到芯片材料上,例如硅、玻璃、陶瓷、锗、聚苯乙烯和/或砷化镓(例如美国专利US 6,283,812和6,062,931)。
第一组碳纳米管可以用作半导体芯片上的冷阴极发射体,和包含蛋白质的第二组纳米管相连。当应用10到50伏特的外部电压时,第一组纳米管可以用于形成至少106伏/cm的局部电场。第一组纳米管中的该电场可以用于驱使蛋白质通过第二组纳米管,或者产生电信号或电磁信号,以检测被标记的氨基酸残基(Chuang等,2000;美国专利US 6,062,931)。来自第三组纳米管的电磁辐射可以激发与通过第二组纳米管的蛋白质相连的发光标记物,导致发射被光检测器检测的光,该光检测器与第一组纳米管可操作地相连。
半导体芯片上的离子通道 纳米孔可以包括在脂质双层膜中的单个离子通道(例如,Kasianowitz等,Proc.Natl.Acad.Sci.USA 9313770-13773,1996)。这种离子通道可以包括但不限于,金黄色葡萄球菌(Staphylococcus aureus)α-溶血素和/或线粒体电压依赖型阴离子通道。这些离子通道可以在延长的时间期间保持开放。施加在蛋白质上的电场可以使这些分子通过脂质双层膜中的离子通道。可将离子通道整合进芯片,并与检测器可操作地相连。
微机电系统(MEMS) 可以将本公开设备中的纳米孔、传感器层和其它组件整合进一个或多个微电子机械系统(MEMS)中。MEMS是集成系统,其包括机械元件、执行元件、控制元件、检测器元件和/或电子元件。所有这些组件可以用已知的微细加工技术在常规的芯片上制造,包括硅基基材或其等同基材(例如Voldman等,Ann.Rev.Biomed Eng.1401-425,1999)。
MEMS的电子组件可以用集成电路(IC)工艺制造(例如,CMOS、Bipolar或BICMOS工艺)。可以用半导体芯片制造领域所知的照相平版印刷术(photolithographic)和蚀刻方法使它们形成图案。微机械组件可以用“微加工”工艺制造,选择性地蚀刻掉部分硅片和/或添加新的结构层,以形成机械组件和/或机电组件。MEMS制造中的基础技术包括,在基材上沉积材料的薄膜;通过照相平版印刷成像法或其它已知的平版印刷方法,在膜的上面施加有图案的掩模;以及选择性地蚀刻这些膜。薄膜的厚度范围可以是几纳米到100微米。使用的沉积技术可以包括化学方法,例如化学气相沉积(CVD)、电镀、外延工艺和热氧化;以及物理方法,例如物理气相沉积(PVD)和浇铸(casting)。可以用这些已知的技术,形成厚度为5nm或更小的传感器层。可以用标准的平版印刷(lithography)技术,形成微米级或亚微米级的传感器层,可操作地与检测器和纳米孔相连。
制造方法是非限制性的,并可以使用本领域已知的任何方法,例如原子层沉积、脉冲直流磁控溅射、真空蒸发、激光切割、注塑、分子束外延、蘸水笔纳米光刻术、活性离子束蚀刻、化学辅助离子束蚀刻、微波辅助等离子体蚀刻、聚焦离子束铣削、电子束或聚焦离子束技术或压印技术。可以使用制造纳米机电系统的方法。(参见,例如,Craighead,Science 2901532-36,0。) 考虑,将设备的一些或所有组件建造为集成MEMS器件的一部分。采用本领域已知的STM技术,包括导电金属如金、铂或铜的纳米电极可以可操作地连接到纳米孔、纳米通道和/或纳米管(例如,Kolb等,Science 2751097-1099,1997)。纳米电极、检测器和其它组件可以通过纳米线相连。
检测器光检测器 使用激发光源和光检测器可以检测标记带有光标记物的氨基酸残基(例如,Sepaniak等,J.Microcol.Separations 1155-157,1981;Foret等,Electrophoresis 7430-432,1986;Horokawa等,J.Chromatog.46339-491989;美国专利US 5,302,272.)。示例性的光源包括二极管激光器、垂直腔表面发射激光器、边发射激光器、表面发射激光器和量子腔激光器(quantum cavity laser),例如Continuum Corporation的钕:钇铝石榴石(Nd:YAG)泵浦的钛:蓝宝石(Ti:sapphire)可调固态激光器和Lambda Physik激基泵浦的染料激光器。示例性的光检测器包括光敏二极管、雪崩光敏二极管、光电倍增管、多正极光电倍增管、光电晶体管、真空光敏二极管、硅光敏二极管、光纤检测器或光电晶体管检测器和电荷耦合器件(CCDs)。可以用雪崩光敏二极管(APD)检测低的照明水平。APD方法使用光敏二极管阵列,以达到电子倍增效应(美国专利US 6,197,503)。
使用已知的N阱互补型金属氧化物半导体(CMOS)工艺(OrbitSemiconductor,Sunnyvale,CA),可以将光检测器、光源和纳米孔制造到半导体芯片中。可选地,可以在绝缘体上硅薄膜CMOS工艺(silicon-on-insulator CMOS process)中,制造检测器、光源和纳米孔(美国专利US 6,117,643)。在一些可选方式中,可以将二极管激光器照明装置阵列和CCD检测器放置在半导体芯片上(美国专利US 4,874,492和5,061,067;Eggers等,BioTechniques 17516-524,1994)。
可将光检测器垂直于光源放置,以使背景光最小化。可以通过一层或多层不透光层,使光源与光检测器在光学上分离。通过发光标记物的激发而产生的光子被光纤收集,并被传递到芯片上的CCD检测器(例如美国专利US 6,274,320)。可记录检测被标记氨基酸残基的时间并形成氨基酸残基距离图。
可将光源如发光二极管和/或半导体激光器整合进半导体芯片(美国专利US 6,197,503)。也可以将形成激光或二极管光束的衍射光学元件结合进芯片。可使用488nm处的空气冷却氩激光激发荧光素标记的蛋白质。通过包括光纤、棱镜、成像光谱仪和0℃热电制冷CCD相机的光学系统,可以收集发射光。光检测器的可选例子是本领域已知的(例如美国专利US 5,143,8545)。
0拉曼光谱法 可以用拉曼光谱法,检测被标记的氨基酸残基。在光谱光度测量检测中使用的拉曼标记物是本领域熟知的(例如,美国专利US5,306,403;6,002,471;6,174,677)。可以用激光器、光敏二极管或其它光源激发被标记的氨基酸残基,并通过各种拉曼技术,检测被激发的氨基酸残基,这些拉曼技术包括但不限于,表面增强拉曼光谱法(SERS)、表面增强共振拉曼光谱法(SERRS)、标准拉曼散射、共振拉曼散射、相干反斯托克斯拉曼光谱法(CARS)、受激拉曼散射、逆转拉曼光谱法、受激增益拉曼光谱法、超拉曼散射、分子光学激光检测器(molecularoptical laser examiner(MOLE))或拉曼微探针或拉曼显微法或共焦拉曼显微测谱术、三维或扫描拉曼、拉曼饱和光谱、时间分辨共振拉曼、拉曼去耦光谱法或紫外拉曼显微法。在SERS和SERRS中,对于吸附在粗糙金属表面如银、金、铂、铜或铝表面上的分子而言,拉曼检测的灵敏度被增强106倍或更多倍。可以用拉曼敏感金属如银或金,涂覆纳米孔和/或传感器层的部分,以便产生增强的拉曼信号。
FRET检测 也可以用荧光共振能量转移(FRET),分析蛋白质。FRET是一种光谱现象,用于检测荧光给体与受体分子之间的相近性。选择给体和受体对,以便给体的荧光发射与受体的激发谱重叠。当两个分子以小于100埃的距离相联系时,给体的激发态能被非辐射地转移到受体。如果受体分子是荧光体,则其发射光被增强。FRET的构成和使用方法是已知的(例如美国专利US 5,866,336)。
给体荧光体分子可以被连接到氨基酸残基,而受体荧光体分子可以与纳米孔或传感器层连接。在被光源激发之后,给体荧光体分子可以将其能量转移给受体分子,形成受体分子的增强荧光信号,可以被光检测器检测。
电检测器 当被标记的蛋白质通过纳米孔时,电检测器可以检测来自导电层的电信号。电信号的非限制性例子包括穿过纳米孔测量的电流、电压、阻抗、电容、电动势、信号符号(signal sign)、频率或噪声特征(noisesignature)。电检测器可以与一层或多层导电层、电源和一个或多个穿透导电层的纳米孔可操作地连接。检测器可以包括电流表、电压表、电容计和/或电导率表等。其它电组件如电阻和/或电容可以被包括在与检测器相连的电路中。
在某些方法中,第一和第二缓冲液室可以充满低电导率的缓冲水溶液。可以给纳米孔侧部的导电层施加电位。当只存在缓冲液时,导电层之间的电阻高。通过纳米孔的蛋白质的未标记区域的存在可以使跨过纳米孔的电导率轻微提高。标记有高导电性标记物如金属纳米颗粒的氨基酸残基的通过会导致电导率的提高,在检测器产生可检测信号。可以测量可检测电信号之间的时间间隔,并用于形成距离图,其表示对于每一类型的被标记氨基酸,被标记氨基酸残基在蛋白质分子上的位置。通过与已知蛋白质序列比较,可使用距离图(多个距离图),鉴定蛋白质。通过汇编20种氨基酸残基中每一种的这种图,确定蛋白质的完整序列是可能的。
实施例实施例1蛋白质鉴定和/或测序的设备 图2和图3提供分析蛋白质230、310的方法和设备的非限制性例子。设备可以包括一个或多个次级器件200、300。各个次级器件200、300可以包括充满流体的第一室280、350和第二室290、360,它们被传感器层212、323隔开。一个或多个纳米孔255、330可以延伸通过传感器层212、323,并允许被标记蛋白质230、310通过。纳米孔255、330可以可操作地连接到一个或多个检测器257、345,这些检测器在被标记氨基酸残基235、245、315通过纳米孔255、330时,可以检测它们。在第一和第二室280、350、290、360中的电极262、264、350、355可以用于产生电场,该电场驱使被标记蛋白质230、310从第一室280、350通过纳米孔255、330到第二室290、360。通过电压调节器260、335,可以控制电梯度(electrical gradient),该电压调节器可以与计算机265、340可操作地连接。电梯度的性质是非限制性的,使用的电压可以是交流电、直流电、脉冲场直流电(pulse field direct current)、反相电流或其它任何已知类型的电梯度。
构建传感器层 如图3所说明,可使用照相平版印刷术,在硅基板上构建多层面结构(multiplaner structure)(0.5×0.5μm)阵列,每个结构具有硅基支持物和一层或多层金膜或其它导电层327,这些导电层被一层或多层绝缘层325分离,绝缘层包括例如氧化硅。其它绝缘层325覆盖在顶导电层和底导电层327上,使传感器层323与第一室350和第二室360中的介质绝缘。可以用标准的半导体技术,在芯片上形成导电层和绝缘层325、327。
可以将包含多层面结构的芯片分成两个或多个部分。可在每个芯片部分的侧部上,垂直于导电层和绝缘层,涂覆抗蚀剂层。可用AFM/STP探针,在覆盖各个结构的抗蚀剂层中蚀刻5-10nm的线。可用化学蚀刻,在每个结构中形成纳米尺寸的凹槽。当芯片部件被对齐并融合在一起时,这些凹槽形成延伸通过传感器层323的纳米孔330。用上述已知的方法,可以形成连接导电层327与电检测器345的纳米线。这些纳米线可用于在导电层327上施加电压。随着标记有导电标记物如金纳米颗粒315的蛋白质310通过纳米孔330,可以检测电流、电阻和/或其它电性质的变化。在光刻和蚀刻之前,可以在被分割芯片的侧部上形成绝缘材料的薄层,以阻止电流通过纳米孔330。
在可选的器件200中,如图2所示例,传感器层212可以包括一层或多层不透光层215和感光层(photon sensing layer)220,其覆盖在支持层225上,用以对标记有光标记物235、245的氨基酸残基进行光检测。不透光层215可以由任何已知的不透光材料制成,例如铬、银或金金属的薄层。类似地,感光层220可以由在光标记物235、245发射的光波长处相对半透明的任何材料制成,例如玻璃、硅或某种塑料。
多种材料和结构可用于感光层220。在某些非限制性的例子中,感光层220可以用于简单地将光引导到光检测器257的感光元件。在其它可选方式中,可以将感光元件结合到纳米孔255中。例如,通过用不同类型的材料(例如,P掺杂和N掺杂的硅或砷化镓(GaAs))形成层,或通过在纳米孔255的内部表面涂覆上不同类型的半导体材料,可以将感光PN结直接制造在围绕纳米孔255的感光层220中。形成P掺杂和N掺杂半导体层的方法在计算机芯片和/或光变换器(opticaltransducer)制造领域是熟知的。光变换器将光信号变换为对应的电信号。可用于检测光发射的不同类型的已知光传导结构包括那些基于光导材料、光伏元件(光电元件)、光电发射材料(光电倍增管、光电管)和半导体pn结(光电二极管)的结构。
在光导元件中,半导体例如CdS、PbS、PbSe、InSb、InAs、HgCdTe或PbSnTe的行为如同电阻。半导体串联在一起,具有恒定的电压源和负载电阻。负载电阻上的电压用于测量半导体材料的电阻。入射辐射,例如以来自标记氨基酸残基的发射光形式,导致带隙激发并降低了半导体的电阻。
光敏二极管包含反相偏压半导体pn结。P型半导体(例如掺硼的硅、掺铍的GaAs)具有过剩的电子空穴,而n型半导体(例如掺磷的硅、掺硅的GaAs)具有过剩的电子。在反相偏压下,耗尽层在p型和n型半导体之间的pn结处形成。当施加外部电势时,反相偏压被引发,迫使p型半导体中的电子空穴和n型半导体中的过剩电子从pn结迁移。当材料被照射时,形成电子-空穴对,其在偏压下移动,形成通过pn结的临时电流。可以将光敏二极管和其它类型的光传导结构整合进纳米孔255,并用作光检测器257的感光元件。
可以在芯片上涂覆聚合物材料,以增强信号检测。这种聚合物材料可以包括,但不限于,聚甲基丙烯酸甲酯、紫外可固化聚氨酯和环氧化合物以及其它具有光学透明性、在激发波长处具有低荧光性、具有导电性和/或绝缘性的聚合物。这些材料可以被形成合适的结构,例如通过聚合物浇铸和化学或光化学固化方法(Kim等,Nature 376581-584,1995)。
实施例2光检测 如图2所说明,标记有光标记物235的氨基酸残基被光源210如激光器激发。激发光通过第一室280中的透明窗240,将光标记物235激发到较高能量状态。被标记的氨基酸通过不透光层215,切断激发光的来源并使光检测器257屏蔽光源210。当光标记物235通过感光层220时,它发射光子,并返回未激发状态245。发射的光可以被光检测器257检测。被检测的信号可以被放大器270放大,并被计算机265储存和/或处理。计算机265也可以记录每个被标记的氨基酸通过纳米孔255的时间,使得可以计算相邻被标记氨基酸残基之间的距离和汇编每种被标记氨基酸的距离图。
在示例性方法中,可以使用高度灵敏的冷却CCD检测器257。冷却CCD检测器257具有高达80%的单光子检测概率、高的空间分辨象素尺寸(5微米)和通过近红外光谱可见的灵敏度。(Sheppard,Confocal MicroscopyBasic Principles and System Performance inMultidimensional Microscopy,Cheng et al.Eds.,Springer-Verlag,NewYork,NY pp.1-51,1994.)。在其它例子中,可以使用卷丝图像强化耦合器件(coiled image-intensified coupling device(ICCD)),作为光检测器257,其接近单光子计数水平(美国专利US 6,147,198)。纳米通道板起光电倍增管的作用,其中少量光子触发撞击在磷光屏上的电子的雪崩,产生受照的图像。磷光图像被通过光纤耦合器连接于放大器270的CCD芯片区域257感知。芯片上的CCD检测器257对紫外光、可见光和/或红外光谱的光敏感(美国专利US 5,846,708)。
实施例3电检测 如图3所说明,氨基酸残基可以被标记上标记物315,根据其电性质,可以被检测。在一个非限制性例子中,该标记物315可以包括金纳米颗粒315。当连接有金纳米颗粒315的氨基酸残基通过纳米孔330时,它在纳米孔330的电导率、电阻和其它电性质上产生可检测的变化。纳米孔330侧部的导电层327与电检测器345可操作地连接,该电检测器可以检测任何电信号,例如电压、电导、电阻、电容等。可以将检测器345与计算机340可操作地连接,以处理和储存数据。可以构建显示被标记氨基酸残基之间距离的距离图,并用于鉴定和/或测序被标记的蛋白质。
直径为2到5nm的纳米孔可以提供第一室350和第二室360之间的流体交通。可以合成标记有1nm金纳米颗粒315的蛋白质310和/或将它放置在第一室350中。电检测器345如电压检测器345和电源可以与纳米孔330侧部的导电层327可操作地相连。使用AxopatchA(Axon Instruments,Foster City,CA)或Dagan 3900A膜片钳放大器(patchclamp amplifier)(Dagan Instruments,Minneapolis,MN),可将流过纳米孔330的电流转化为电压,并放大。采用Frequency Devices(Haverhill,MA)低通Bessel过滤器过滤信号。使用National Instruments(Austin,TX)AT-MIO-16-X 16位操作台和LAN WINDOWS/CVI程序,数字化数据。使用一种高导磁率合金(mu-metal)箱(Amuneal,Philadelphia,PA),使芯片屏蔽电和磁的噪声源(参见,kasianowicz等,1996)。
实施例4标记蛋白质 对蛋白质进行标记的示例性方法在图4至图7中公开。如图所示,半胱氨酸残基被特定地用巯基特异性试剂标记。通过暴露于已知的硫醇还原剂,如二硫苏糖醇或β-巯基乙醇,将蛋白质410中天然存在的半胱氨酸残基从二硫化物还原。在移除过量的还原剂后,例如通过超过滤或在凝胶渗透柱上柱层析,包含被还原半胱氨酸残基的蛋白质410可以用硫醇特异性试剂420标记。在一个非限制性例子中,acrydite(一种丙烯酰胺)标记物420可以与内源性半胱氨酸反应,产生被标记的蛋白质430。可选地,胺标记物430可以通过暴露于N-琥珀酰亚胺基-4-马来酰亚胺丁酸酯(或盐)450被活化。活化基团450共价地结合于胺标记物440。然后,被活化的复合物460结合于巯基,导致被标记蛋白质470的形成。
图5说明,在胺残基如赖氨酸、精氨酸和蛋白质510的N末端残基上标记蛋白质510的示例性方法。如图5所示,蛋白质510上的胺残基可以通过与试剂520如N-琥珀酰亚胺基-4-马来酰亚胺丁酸酯(或盐)反应被活化。然后被活化的蛋白质530可以与硫醇化标记物540反应,形成共价键并产生被标记蛋白质550。在另一个非限制性例子中,水溶性碳二亚胺570如EDAC(1-乙基-3-(3-二甲氨基丙基)碳二亚胺)可以用于交联蛋白质510上的胺残基与羧基化标记物560。碳二亚胺570与标记物结合并活化该标记物,形成被活化的中间体580,其可与胺残基共价地键合。碳二亚胺活化基团570被消除而形成被标记的蛋白质590。
图6显示,在羧基残基如谷氨酸、天冬氨酸和C末端残基上标记蛋白质610的示例性方法。通过与水溶性碳二亚胺615如EDAC反应,可以活化含有羧基残基的蛋白质610,然后与胺标记物625反应,形成被标记的蛋白质630。可选地,可以通过与EDAC 615和半胱胺635同时反应,活化蛋白质610上的羧基残基。这导致二硫化物修饰的蛋白质640的形成,其可以与acrydite(一种丙烯酰胺)标记物645反应,形成被标记的蛋白质650。在另一个可选方式中,可以通过与EDAC615和半胱胺635反应,以及被活化蛋白质640与马来酰亚胺标记物655反应,活化蛋白质610上的羧基残基,形成被标记的蛋白质660。
图7说明,在丝氨酸、苏氨酸残基或糖基化残基上标记蛋白质的示例性方法。糖蛋白710可以用过碘酸盐715氧化,产生二醛糖衍生物720。二醛720将与胺标记物725自发地反应,形成希夫碱(Schiff′sbase)标记的蛋白质730。希夫碱730反应是可逆的。例如,用硼氢化钠735还原,形成不可逆地标记的蛋白质740。在另一个可选方式中,蛋白质745上的丝氨酸或苏氨酸残基可以被氧化,例如用半乳糖氧化酶750,形成醛衍生化的蛋白质755。醛衍生化的蛋白质755可以与胺标记物725反应,形成希夫碱标记的蛋白质760。同样,用硼氢化钠735还原,产生不可逆地标记的蛋白质765。
本领域技术人员将认识到,这些公开的方法只是示例性的。用于标记侧链特异蛋白质的许多方法是本领域已知的(例如,Bell和Bell,Proteins and Enzymes,Ch.7,pp.132-183,Prentice-Hall,Inc.,EnglewoodCliffs,NJ,1988),而且可以使用任何这样的已知方法,用光标记物、电标记物或这里公开的其它任何类型的标记物或本领域已知的其它标记物标记蛋白质。
实施例5分析物的拉曼检测方法和设备 在某些非限制性方法中,可使用拉曼光谱法分析分析物。在一个非限制性的例子中,拉曼检测单元的激发光束由钛:蓝宝石激光器(Mira by Coherent)产生,波长为近红外波长(750-950nm),或由镓铝砷化物二极管激光器(PI-ECL系列,Process Instruments)产生,波长为785nm或830nm。使用脉冲激光束或连续光束。将激发光束通过分色镜(Kaiser Optical的全息阶式滤波器或Chroma或Omega Optical的双色干涉滤光器),成为与收集的光束共线的几何形状。透射的光束通过显微镜物镜(Nikon LU系列),被聚焦在放置有目标分析物(核苷酸或嘌呤或嘧啶碱基)的拉曼活性基质上。
来自分析物的拉曼散射光被同一显微镜物镜收集,并通过分色镜,到达拉曼检测器。拉曼检测器包括聚焦透镜、摄谱仪和阵列检测器。聚焦透镜聚焦拉曼散射光,通过摄谱仪的入口狭缝。摄谱仪(ActonResearch)包括光栅,光栅按波长分散光线。分散的光线成像在阵列检测器(RoperScientific公司的背景照明深度耗尽CCD照相机)上。阵列检测器与控制器电路相连,并与计算机连接,以传输数据及控制检测器功能。
对于表面增强拉曼光谱(SERS),拉曼活性基质由金属纳米颗粒或覆盖金属的纳米结构组成。用Lee和Meisel(J.Phys.Chem.,863391,1982)的方法,制备银纳米颗粒,大小为5到200nm。可选地,将样品放置在显微镜物件下面的铝基质上。下面讨论的附图是在铝基质上的静止样品中收集的。通过被照明样品的光学采集体积(opticalcollection volume),确定被检测的分子数目。展示了低至单分子水平的检测灵敏度。
单个核苷酸也可通过SERS检测,其中使用微流体通道。核苷酸可以通过微流体通道(约5到200μm宽)被输送到拉曼活性基质。微流体通道可通过模塑聚二甲基硅氧烷(PDMS)来制造,其中使用Anderson等公开的技术(“Fabrication of topologically complexthree-dimensional microfluidic systems in PDMS by rapidprototyping,”Anal.Chem.723158-3164,2000)。
在存在银纳米颗粒的情况下进行SERS时,核苷酸、嘌呤或嘧啶分析物与LiCl(最终浓度为90μM)和纳米颗粒(银原子最终浓度为0.25M)混合。采用室温的分析物溶液,收集SERS数据。
也用拉曼光谱法,分析滚环扩增制备的寡核苷酸。将1皮摩尔(pmol)的滚环扩增(RCA)引物加入到0.1pmol的环形单链M13DNA模板中。用1×T7聚合酶160缓冲液(20mM(毫摩尔)Tris-HCl、pH7.5、10mM MgCl2、1mM二硫苏糖醇)、0.5mM dNTPs和2.5单位的T7DNA聚合酶,在37℃温育该混合物2小时,形成RCA产物。通过混合和温育不含DNA聚合酶的相同试剂,制备阴性对照(negative control)。
将1μL的RCA产物和1μL的阴性对照样品分开点放在铝盘上并进行空气干燥。用5μL的1×PBS(磷酸盐缓冲液)冲洗每个点。重复冲洗三次,最后的冲洗完毕后,对铝盘进行空气干燥。用2mL蒸馏水稀释1毫升银胶体溶液。将8微升的稀释银胶体溶液与2μL 0.5M LiCl混合,并加入到铝盘上的RCA产物点上。将同样的溶液加入到阴性对照物点上。按上面所述收集拉曼信号。
结果 使用上述系统,通过SERS,分析核苷一磷酸、嘌呤碱基和嘧啶碱基。表1显示各种分析物的当前检测限。
表1 核苷一磷酸、嘌呤和嘧啶的SERS检测
只对腺嘌呤核苷酸优化了条件。确定LiCl(最终浓度为90μM),以提供腺嘌呤核苷酸的最佳SERS检测。通过使用其它碱金属卤化物盐例如NaCl、KCl、RbCl或CsCl,可有助于其它核苷酸的检测。要求保护的方法并不被所用的电解质溶液限制,可以考虑使用其它类型的电解质溶液,例如MgCl、CaCl、NaF、KBr、LiI等。本领域技术人员将认识到,不显示强拉曼信号的电解质溶液将对核苷酸的SERS检测提供最小的干扰。结果表明,上面公开的拉曼检测系统和方法能够检测和鉴定单个分子的分析物。
图8显示四种不同类型核苷酸的100mM溶液的拉曼发射光谱,其中不存在表面增强并且没有拉曼标记。溶液中不加入LiCl。使用10秒的数据收集时间。激发发生在514nm处。较低浓度的核苷酸可用较长的收集时间、添加电解质和/或表面增强进行检测。如图8所示,未增强的拉曼光谱显示了四种未标记核苷一磷酸中每一种的特征发射峰。
表面增强拉曼发射光谱在存在LiCl和银纳米颗粒的情况下,从1nM的鸟嘌呤溶液、100nM的胞嘧啶溶液和100nM的胸腺嘧啶溶液获得(未图示)。使用785nm的激发波长。各光谱显示了可区分的拉曼发射峰(未图示)。
图9显示dATP(下曲线)和用荧光素标记的dATP(上曲线)的500nM溶液的SERS光谱,在785nm处激发。dATP-荧光素从Roche AppliedScience(Indianapolis,IN)购得。该图表明,用荧光素标记之后,SERS信号大大提高。
RCA产物是SERS可检测的,其中发射峰在约833和877nm处(未图示)。在此方案的条件下,用LiCl增强剂,腺嘌呤部分的信号强度强于鸟嘌呤、胞嘧啶和胸腺嘧啶的信号强度。阴性对照(未图示)表明,拉曼信号对RCA产物是特异性的,因为在没有扩增时未观察到信号。
本领域的技术人员将认识到,所公开的方法只是示例性的,公开的用于分析核苷酸和寡核苷酸的拉曼检测技术也可用于氨基酸和蛋白质。采用所公开的技术,可以例如用拉曼标记,共价地标记蛋白质上特定类型的氨基酸残基。被标记的蛋白质可以通过纳米孔,并用例如拉曼光谱法检测被标记的残基。如上所公开,可以用拉曼光谱法,在单分子水平,检测被标记或未被标记的残基。对被标记氨基酸残基的检测可以用于构建距离图、鉴定和/或测序感兴趣的蛋白质或其它分析物。
实施例6氨基酸、蛋白质和肽的拉曼检测 如实施例5所公开,进行氨基酸、蛋白质和肽的拉曼光谱法。如图10至图17所示,色氨酸、半胱氨酸、甲硫氨酸、组氨酸、苯丙氨酸、精氨酸和酪氨酸的SERS光谱都显示了可区分的SERS光谱,其具有特征拉曼发射峰。氨基酸的衍生化也导致拉曼光谱的变化(比较图10与图17,进行1mM的色氨酸与5-氟色氨酸的SERS光谱比较)。氟残基的连接导致色氨酸的SERS光谱的明显变化(图10和图17)。光谱也与氟残基被连接的位置相关,5-氟色氨酸(Sigma Chemicals,St.Louis,MO)产生了与6-氟色氨酸(未图示)不同的SERS光谱。
如前面的实施例所讨论,结论是拉曼光谱技术如SERS可以用于鉴定和区分不同类型的氨基酸残基。图10至图16所示的SERS光谱是从未标记的氨基酸上获得的。如图9所示,对于核苷酸残基,用拉曼标记物共价修饰可以使得衍生化残基的信号强度大大提高。如上所述,侧链特异性标记可以用于将不同类型的拉曼标记连接到不同类型的氨基酸残基上。
SERS光谱也从全蛋白质上获得。图18显示在铝板上干燥的1%牛血清的示例性SERS光谱。在829、839、848、852、865、872、877、886和896nm处观察到发射峰。1%牛血清蛋白的SERS光谱是相似的,在光谱中只观察到细小的差别(未图示)。全牛血清的SERS检测导致低到0.1%血清的特征峰检测(图19和图20)。图19显示了100%全牛血清的SERS光谱。将160μl等分试样的银纳米颗粒(用蒸馏水1∶2稀释)与20μl牛血清和40μl 0.5M LiCl混合。收集时间为1秒,得到图19所示的光谱。SERS光谱显示,发射峰在826、832、839、842、848、854、862、873、876和886nm处。0.1%牛血清样品也导致可检测的SERS光谱(图20),可检测的峰在842、848、854、876、882和886nm处。
SERS光谱也从一系列肽获得,这些肽由血清蛋白的胰蛋白酶消化而产生。通过在C18柱上进行反相HPLC,分离被消化的肽。在三氟乙酸盐和丙烯腈的酸性混合物中,进行肽的洗脱。得到的肽用SERS光谱法分析(图21)。可见,不同的肽显示出可区分的SERS光谱,不同大小的峰出现在827、833、844、848、853、857、859、862、870、874和880nm处。
获得的结果表明,SERS光谱可用于鉴定和区分蛋白质或肽内的不同类型的氨基酸残基,可以得到用于蛋白质检测、鉴定和/或测序的距离图。
根据本公开内容,在没有不适当实验方法的情况下,可制造和使用这里公开的和要求保护的所有方法和设备。对本领域技术人员来说,显而易见的是,在不偏离要求保护主题的概念、精神和范围的情况下,可以对这里所述的方法和设备进行改变。更具体地,显然,化学及生理学关联的某种试剂(物质)可以替代这里所述的试剂(物质),而获得相同的或相似的结果。对本领域技术人员显而易见的所有这些类似的替代和修饰都被认为在所要求保护主题的精神、范围和概念之内。
权利要求
1.一种方法,包括a)获得一种或多种被标记的蛋白质、多肽或肽;b)将所述被标记的蛋白质、多肽或肽通过一个或多个纳米孔;c)检测在所述被标记的蛋白质、多肽或肽中的被标记氨基酸残基;d)对于每种被标记的氨基酸,汇编氨基酸距离图;和e)基于所述距离图,鉴定所述蛋白质。
2.根据权利要求1所述的方法,进一步包括a)将模板核酸放进至少一个室中,每个室包含不同类型的被标记氨基酸;和b)产生一种或多种由所述模板核酸编码的被标记蛋白质、多肽或肽。
3.根据权利要求1所述的方法,进一步包括a)从生物学样品,获得一种或多种蛋白质、多肽或肽;和b)翻译后标记所述蛋白质、多肽或肽。
4.根据权利要求1所述的方法,其中所述蛋白质、多肽或肽是通过将所述距离图与氨基酸距离图文库比较而被鉴定的。
5.根据权利要求1所述的方法,其中所述蛋白质、多肽或肽是通过将所述距离图与已知蛋白质的序列比较而被鉴定的。
6.根据权利要求2所述的方法,其中每个室与不同组的纳米孔可操作地连接。
7.根据权利要求1所述的方法,其中每个纳米孔可操作地与检测器相连。
8.根据权利要求1所述的方法,其中一次只有一个被标记的蛋白质、多肽或肽通过纳米孔。
9.根据权利要求2所述的方法,其中所述被标记的氨基酸在每个室中的量为该室中相同氨基酸总量的约0.5%到约50%。
10.根据权利要求1所述的方法,其中第一个被标记的氨基酸通过所述纳米孔与第二个被标记的氨基酸通过所述纳米孔的时间长度对应于沿所述被标记蛋白质、多肽或肽上所述第一个氨基酸和第二个氨基酸之间的距离。
11.根据权利要求1所述的方法,其中所述标记物选自发光标记物、荧光标记物、磷光标记物、化学发光标记物、导电标记物、核磁共振标记物、质谱标记物、电子自旋共振标记物、电子顺磁共振标记物和拉曼标记物。
12.根据权利要求1所述的方法,其中所述被标记蛋白质、多肽或肽的至少一端被连接到可鉴定的标记物上。
13.根据权利要求1所述的方法,其中所述被标记的氨基酸用光检测器检测。
14.根据权利要求1所述的方法,其中所述被标记的氨基酸用电检测器检测。
15.根据权利要求2所述的方法,进一步包括分析来自各个室的被标记蛋白质、多肽或肽的多样性。
16.根据权利要求1所述的方法,进一步包括,基于所述距离图,确定所述蛋白质、多肽或肽的至少部分序列。
17.一种设备,其包括a)至少一个次级器件,每个次级器件包括第一室和第二室,所述第一和第二室被传感器层分离,每个次级器件的第一室和第二室通过一个或多个纳米孔流体交通;和b)一个或多个与所述纳米孔可操作地连接的检测器。
18.根据权利要求17所述的设备,进一步包括在每个第一室和第二室中的电极,以提供所述第一室和第二室之间的电势梯度。
19.根据权利要求17所述的设备,进一步包括与所述一个或多个检测器可操作地连接的计算机。
20.根据权利要求17所述的设备,其中所述一个或多个检测器包括光检测器、电检测器和/或电压检测器。
21.根据权利要求20所述的设备,其中所述一个或多个检测器包括拉曼检测器。
22.根据权利要求17所述的设备,其中所述传感器层包括支持层、感光层和两层或多层不透光层。
23.根据权利要求22所述的设备,进一步包括光源和放大器。
24.根据权利要求17所述的设备,其中所述传感器层包括至少一层导电层和至少两层绝缘层。
25.根据权利要求24所述的设备,其中所述导电层与一个或多个电检测器可操作地相连。
26.根据权利要求17所述的设备,其中所述纳米孔是纳米管或纳米通道的一部分。
27.一种方法,包括a)用被标记的亚基接触一个或多个细胞;b)从所述细胞中获得包括被标记亚基的一个或多个拷贝的分子;c)使所述被标记分子通过一个或多个纳米孔;d)检测所述被标记分子上的被标记亚基;e)汇编亚基距离图;和f)由所述距离图鉴定出所述分子。
28.根据权利要求27所述的方法,其中所述分子选自核酸、寡核苷酸、蛋白质、多肽、肽、多糖和脂类。
29.根据权利要求28所述的方法,其中所述分子是蛋白质、多肽或肽,并且所述细胞用编码所述蛋白质、多肽或肽的表达载体转化。
30.根据权利要求27所述的方法,进一步包括用被标记的亚基接触至少两组细胞,每组细胞与不同类型的被标记亚基接触。
全文摘要
这里公开的方法和设备用于测序和/或鉴定蛋白质、多肽和/或肽。包含被标记的氨基酸残基的蛋白质可以被合成并通过纳米孔。当被标记的氨基酸通过纳米孔时,与纳米孔可操作地相连的检测器可以检测它们。可以汇编每种被标记氨基酸残基的距离图。距离图可用于测序和/或鉴定蛋白质。这里也公开了用于蛋白质测序和/或鉴定的设备。在可选的方法中,用同样的技术,可以分析其它类型的分析物。
文档编号G01N33/48GK1860370SQ200380110616
公开日2006年11月8日 申请日期2003年10月31日 优先权日2003年10月29日
发明者X·苏, A·伯林 申请人:英特尔公司