本申请是申请日为2013年11月07日,申请号为201380058224.1,发明名称为“使用标记的核酸测序”的发明专利申请的分案申请。
交叉引用
本申请要求2012年11月9日提交的美国临时专利申请序列号61/724,869、2012年12月14日提交的美国临时专利申请序列号61/737,621和2013年9月20日提交的美国临时专利申请序列号61/880,407的权益,所述专利申请各自以引用方式整体并入本文。
本发明涉及生物技术领域,更具体地涉及用于装配具有多个亚基的蛋白的方法。
背景技术:
核酸测序为一种可用于提供核酸样品的序列信息的过程。此类序列信息可有助于诊断和/或治疗受试者。例如,受试者的核酸序列可用于识别、诊断遗传性疾病以及潜在地开发针对遗传性疾病的治疗。作为另一实例,对病原体的研究可导致针对传染性疾病的治疗。
存在可获得的可用于对核酸测序的方法。然而,此类方法是昂贵的并且可能在某一时间段内和以可能对诊断和/或治疗受试者所需的准确度不提供序列信息。
技术实现要素:
使单链核酸分子通过纳米孔的核酸测序的方法可能具有可能不足以或不充分提供用于诊断和/或治疗目的的日期的灵敏度。构成核酸分子的核酸碱基(例如,腺嘌呤(a)、胞嘧啶(c)、鸟嘌呤(g)、胸腺嘧啶(t)和/或尿嘧啶(u))可能不提供彼此显著不同的信号。特别地,嘌呤(即,a和g)彼此具有类似大小、形状和电荷并且在某些情况下提供非明显不同的信号。另外,嘧啶(即,c、t和u)彼此具有类似大小、形状和电荷并且在某些情况下提供非明显不同的信号。在本文认识到需要用于核酸分子识别和核酸测序的改进方法。
在一些实施方案中,核苷酸掺入事件(例如,将核苷酸掺入与模板链互补的核酸链)向纳米孔呈示标记和/或从通过纳米孔检测到的核苷酸释放标记。可识别掺入的碱基(即,a、c、g、t或u),因为对于每个类型的核苷酸(即,a、c、g、t或u)释放和/或呈示唯一标记。
在一些实施方案中,基于检测到标记与纳米孔相互作用时间段,所述标记归因于成功掺入的核苷酸。时间段可比与核苷酸标记自由流过纳米孔相关的时间段长。成功掺入的核苷酸标记的检测时间段也可比未掺入的核苷酸(例如,与模板链错配的核苷酸)的时间段长。
在某些情况下,聚合酶与纳米孔缔合(例如,共价连接于纳米孔)并且聚合酶进行核苷酸掺入事件。当标记核苷酸与聚合酶缔合时,可通过纳米孔检测到标记。在一些情况下,未掺入的标记核苷酸穿过纳米孔。所述方法可基于通过纳米孔检测到标记核苷酸的时间长度来区分与未掺入的核苷酸缔合的标记和与掺入的核苷酸缔合的标记。在一个实施方案中,通过纳米孔在少于约1毫秒内检测到未掺入的核苷酸并且通过纳米孔在至少约1毫秒内检测到掺入的核苷酸。
在一些实施方案中,聚合酶具有缓慢的动力学步骤,其中可通过纳米孔在至少1毫秒内检测到标记,平均检测时间为约100ms。聚合酶可以为突变型phi29dna聚合酶。
可使聚合酶突变以降低聚合酶将核苷酸掺入核酸链(例如,生长中的核酸链)的速率。在一些情况下,可通过将核苷酸和/或模板链官能化以提供空间位阻(诸如例如,通过将模板核酸链甲基化)来降低核苷酸掺入核酸链的速率。在某些情况下,通过掺入甲基化的核苷酸来降低速率。
一方面,借助于膜中邻近传感电极的纳米孔对核酸样品测序的方法包括:(a)向包含纳米孔的反应室提供标记核苷酸,其中标记核苷酸的单个标记核苷酸含有与核苷酸耦合的标记,所述标记借助于纳米孔是可检测到的;(b)借助于聚合酶进行聚合反应,从而将标记核苷酸的单个标记核苷酸掺入与来自核酸样品的单链核酸分子互补的生长链;以及(c)在掺入单个标记核苷酸期间和/或之时借助于纳米孔检测与单个标记核苷酸缔合的标记,其中当核苷酸与聚合酶缔合时借助于纳米孔检测到标记。
在一些实施方案中,标记当与聚合酶缔合时被检测到多次。
在一些实施方案中,在标记检测期之间对电极再充电。
在一些实施方案中,所述方法基于通过纳米孔检测到标记核苷酸的时间长度来区分掺入的标记核苷酸和未掺入的标记核苷酸。
在一些实施方案中,通过纳米孔检测到掺入的标记核苷酸的时间与通过纳米孔检测到未掺入的标记核苷酸的时间的比率为至少约1.5、2、3、4、5、6、7、8、9、10、20、30、40、50、100、1000或10,000。
在一些实施方案中,与掺入的核苷酸缔合的标记与纳米孔相互作用(并且借助于纳米孔检测)的时间段和与未掺入的核苷酸缔合的标记与纳米孔相互作用的时间段的比率为至少约1.5、2、3、4、5、6、7、8、9、10、20、30、40、50、100、1000或10,000。
在一些实施方案中,核苷酸与聚合酶缔合至少约1毫秒的平均(或均值)时间段。
在一些实施方案中,当核苷酸不与聚合酶缔合时,标记核苷酸在少于1毫秒(ms)内通过纳米孔。
在一些实施方案中,标记具有可通过纳米孔检测到的选定长度。
在一些实施方案中,第一标记核苷酸的掺入不干扰与第二标记核苷酸缔合的标记的纳米孔检测。
在一些实施方案中,与第一标记核苷酸缔合的标记的纳米孔检测不干扰第二标记核苷酸的掺入。
在一些实施方案中,纳米孔能够以至少95%的准确度区分掺入的标记核苷酸和未掺入的标记核苷酸。
在一些实施方案中,纳米孔能够以至少99%的准确度区分掺入的标记核苷酸和未掺入的标记核苷酸。
在一些实施方案中,当标记从单个标记核苷酸释放时检测到与单个标记核苷酸缔合的标记。
一方面,借助于膜中邻近传感电极的纳米孔对核酸样品测序的方法包括:(a)向包含纳米孔的反应室提供标记核苷酸,其中标记核苷酸的单个标记核苷酸含有与核苷酸耦合的标记,所述标记借助于纳米孔是可检测到的;(b)借助于酶将标记核苷酸的单个标记核苷酸掺入与源自核酸样品的单链核酸分子互补的生长链;以及(c)在掺入所述单个标记核苷酸期间,借助于纳米孔区分与单个标记核苷酸缔合的标记和与一个或多个未掺入的单个标记核苷酸缔合的一个或多个标记。
在一些实施方案中,所述酶为核酸聚合酶或可基于模板聚合物延伸新合成链的任意酶。
在一些实施方案中,基于借助于纳米孔检测到(b)中掺入的单个标记核苷酸和未掺入的单个标记核苷酸的时间长度和/或时间比率,区分(b)中掺入的单个标记核苷酸与未掺入的单个标记核苷酸。
一方面,借助于膜中的纳米孔对核酸测序的方法包括:(a)向包含纳米孔的反应室提供标记核苷酸,其中标记核苷酸的单个标记核苷酸含有可通过纳米孔检测到的标记;(b)将标记核苷酸掺入生长中的核酸链,其中与标记核苷酸的单个标记核苷酸缔合的标记在掺入期间停留于或接近至少部分的纳米孔,其中可通过纳米孔检测到掺入的标记核苷酸的时间与可通过纳米孔检测到未掺入标记的时间的比率为至少1.1、1.2、1.3、1.4、1.5、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、1000、10,000;以及(c)借助于纳米孔检测标记。
在一些实施方案中,可通过纳米孔检测到掺入的标记核苷酸的时间与可通过纳米孔检测到未掺入标记的时间的比率为至少约1,1、1.2、1.3、1.4、1.5、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、1000或10,000。
在一些实施方案中,标记在掺入核苷酸之时保持与单个核苷酸缔合。
在一些实施方案中,在掺入核苷酸之时释放与单个核苷酸缔合的标记。
在一些实施方案中,所述方法还包括从纳米孔逐出标记。
在一些实施方案中,以标记进入纳米孔的反方向逐出标记。
在一些实施方案中,标记停留于纳米孔中至少约100ms。
在一些实施方案中,标记停留于纳米孔中至少约10ms。
在一些实施方案中,标记停留于纳米孔中至少约1ms。
在一些实施方案中,以每秒至多约1个核苷酸的速率掺入标记核苷酸。
在一些实施方案中,纳米孔用电压脉冲逐出标记分子。
在一些实施方案中,标记分子至少99%有可能用电压脉冲逐出。
在一些实施方案中,纳米孔在一定时间段内逐出标记分子以使两个标记分子不同时存在于纳米孔中
在一些实施方案中,纳米孔在一定时间段内逐出标记分子以使两个标记分子同时存在于纳米孔中的概率为至多1%。
在一些实施方案中,标记具有小于约1.4nm的直径。
在一些实施方案中,当标记附接于掺入的标记核苷酸时,借助于纳米孔检测到与所述核苷酸缔合的每个标记。
在一些实施方案中,当标记从单个标记核苷酸释放时,检测到与单个标记核苷酸缔合的标记。
一方面,用于对核酸样品测序的芯片包括:多个纳米孔,具有膜中邻近或接近电极布置的至少一个纳米孔的所述多个纳米孔,其中每个纳米孔在标记核苷酸掺入生长中的核酸链期间检测到与单个标记核苷酸缔合的标记。在一些实施方案中,纳米孔是可单独寻址的。
在一些实施方案中,单个纳米孔在随后的标记通过或邻近纳米孔期间检测到与核苷酸缔合的标记。
在一些实施方案中,芯片包括至少500个可单独寻址的电极/平方毫米。在一些实施方案中,芯片包括至少50个可单独寻址的电极/平方毫米。
在一些实施方案中,芯片至少部分基于通过纳米孔检测到标记核苷酸的时间长度来区分掺入的标记核苷酸和未掺入的标记核苷酸。
在一些实施方案中,可通过纳米孔检测到掺入的标记核苷酸的时间与可通过纳米孔检测到未掺入的标记的时间的比率为至少约1.5。
在一些实施方案中,掺入第一标记核苷酸不干扰与第二标记核苷酸缔合的标记的纳米孔检测。
在一些实施方案中,与第一标记核苷酸缔合的标记的纳米孔检测不干扰第二标记核苷酸的掺入。
在一些实施方案中,纳米孔能够以至少95%的准确度区分掺入的标记核苷酸和未掺入的标记核苷酸。
在一些实施方案中,纳米孔能够以至少99%的准确度区分掺入的标记核苷酸和未掺入的标记核苷酸。
在一些实施方案中,电极为集成电路的部分。
在一些实施方案中,电极与集成电路耦合。
在一些实施方案中,当标记附接于掺入的标记核苷酸时,借助于纳米孔检测到与所述核苷酸缔合的每个标记。
在一些实施方案中,当标记从单个标记核苷酸释放时,检测到与单个标记核苷酸缔合的标记。
一方面,用于对核酸样品测序的芯片包括:多个纳米孔,其中所述多个纳米孔含有膜中邻近电极布置的至少一个纳米孔,其中每个纳米孔能够在包含标记种类的核酸分子掺入生长中的核酸链之时或期间检测标记种类,其中,可通过纳米孔检测到掺入的标记核苷酸的时间与可通过纳米孔检测到未掺入的标记的时间的比率为至少约1.5。在一些实施方案中,多个纳米孔是可单独寻址的。
在一些实施方案中,标记种类在掺入之时未穿过纳米孔。
在一些实施方案中,芯片被配置成从纳米孔逐出标记种类。
在一些实施方案中,纳米孔用电压脉冲逐出标记种类。
在一些实施方案中,电极为集成电路的部分。
在一些实施方案中,电极与集成电路耦合。
在一些实施方案中,当标记附接于掺入的标记核苷酸时,借助于纳米孔检测到与所述核苷酸缔合的每个标记。
在一些实施方案中,在没有标记种类从核酸分子释放的情况下检测到核酸分子的标记种类。
一方面,用于对核酸样品测序的系统包括:(a)包含一个或多个纳米孔设备的芯片,一个或多个纳米孔设备中的每个包含膜中邻近电极的纳米孔,其中所述纳米孔设备在通过聚合酶掺入标记核苷酸期间检测到与单个标记核苷酸缔合的标记;以及(b)与芯片耦合的处理器,其中所述处理器被编程为基于从纳米孔设备接收的电信号有助于表征核酸样品的核酸序列。
在一些实施方案中,纳米孔设备在随后的标记前进通过或邻近纳米孔期间检测到与单个标记核苷酸缔合的标记。
在一些实施方案中,纳米孔设备包含可单独寻址的纳米孔。
在一些实施方案中,芯片包括至少500个可单独寻址的电极/平方毫米。在一些实施方案中,芯片包括至少50个可单独寻址的电极/平方毫米
在一些实施方案中,芯片至少部分基于通过纳米孔检测到标记核苷酸的时间长度来区分掺入的标记核苷酸和未掺入的标记核苷酸。
在一些实施方案中,可通过纳米孔检测到掺入的标记核苷酸的时间与可通过纳米孔检测到未掺入的标记的时间的比率为至少约1.5。
在一些实施方案中,第一标记核苷酸的掺入不干扰与第二标记核苷酸缔合的标记的纳米孔检测。
在一些实施方案中,与第一标记核苷酸缔合的标记的纳米孔检测不干扰第二标记核苷酸的掺入。
在一些实施方案中,纳米孔能够以至少95%的准确度区分掺入的标记核苷酸和未掺入的标记核苷酸。
在一些实施方案中,纳米孔能够以至少99%的准确度区分掺入的标记核苷酸和未掺入的标记核苷酸。
在一些实施方案中,电极为集成电路的部分。
在一些实施方案中,电极与集成电路耦合。
在一些实施方案中,当标记附接于掺入的标记核苷酸时,借助于纳米孔检测到与所述核苷酸缔合的每个标记。
在一些实施方案中,当标记从单个标记核苷酸释放时,检测到与单个标记核苷酸缔合的标记。
在一些实施方案中,使用给定驱动力诸如施加至纳米孔或含有纳米孔的膜的电位(v )将标记引导入并通过至少部分的纳米孔。可将标记从纳米孔开口引导入纳米孔。然后可将驱动力反转(例如,所施加的相反极性的电位,或v-)以从纳米孔通过开口逐出至少部分的标记。然后可再次施加驱动力(例如,v )以使至少部分的标记通过开口驱动入纳米孔。可选地,标记的极性可以反转并且可使用包括v-、v 和v-的电位顺序。这可增加可借助于纳米孔检测到标记的时间段。
在一些实施方案中,纳米孔和/或标记被配置成提供能量景观(energylandscape)以使在纳米孔中,与核苷酸缔合的标记更有可能在一个方向移动(例如,移入孔),而不是另一方向(例如,移出孔)。
在一些实施方案中,可通过在核苷酸标记的核苷酸部分掺入新合成链期间和/或之时与聚合酶缔合时通过纳米孔检测到的标记核苷酸的标记的时间的差值检测到模板样品链中的修饰碱基(例如,甲基化的)的检测。在一些情况下,相较于非甲基化的核苷酸,当样品序列的相对核苷酸为甲基化的核苷酸时核苷酸标记与酶缔合的时间更长。
本文所述的标记核苷酸的实例可以为用可切割的标记修饰的任意天然存在的核苷酸或用可切割的标记修饰的合成的非天然核苷酸类似物。例如,用可切割的或未切割的标记修饰的通用碱基可用于对样品链中碱基的数量简单计数。
本文所述的标记核苷酸的实例可以是二聚体核苷酸或可作为二聚体单位延伸的二聚体核苷酸类似物,并且所述标记基于与聚合酶缔合的时间和通过纳米孔设备检测到的信号水平来报道所组合的二聚体核苷酸的二聚体组合物。
当标记与酶缔合的时间可用于区分掺入的核苷酸和未掺入的核苷酸时,独特的电流水平和/或纳米孔中的标记对施加电位或变化的施加电位的电响应允许区分与不同核苷酸缔合的标记。
一方面,用于对核酸测序的方法包括将交流电(ac)波形施加至接近纳米孔和传感电极的电路,其中当所述波形具有第一极性时,检测到与掺入与模板核酸链互补的生长中的核酸链的核苷酸缔合的标记并且当波形具有第二极性时对电极再充电。
在另一方面,用于对核酸分子测序的方法包括:(a)向膜中邻近电极的纳米孔提供一个或多个标记核苷酸;(b)将所述一个或多个标记核苷酸的单个标记核苷酸掺入与所述核酸分子互补的链;以及(c)借助于施加至所述电极的交流电(ac)波形检测与所述标记核苷酸缔合的标记一次或多次,其中在所述标记附接于掺入所述链的所述单个标记核苷酸时检测到所述标记。
在一些实施方案中,波形使得电极在至少约1秒、10秒、30秒、1分钟、10分钟、20分钟、30分钟、1小时、2小时、3小时、4小时、5小时、6小时、12小时、24小时、1天、2天、3天、4天、5天、6天、1周、2周、3周或1个月的时间段内不耗尽。
在一些实施方案中,标记的身份通过在不同电压下所测量电流与通过波形施加的电压之间的关系确定。
在一些实施方案中,核苷酸包含腺嘌呤(a)、胞嘧啶(c)、胸腺嘧啶(t)、鸟嘌呤(g)、尿嘧啶(u)、或其任意衍生物。
在一些实施方案中,通过当所述碱基被甲基化时检测到标记的时间段比当所述碱基未被甲基化时长来确定模板核酸链的碱基的甲基化。
一方面,借助于膜中邻近传感电极的纳米孔确定核酸或其区段的长度的方法包括(a)向包含所述纳米孔的反应室提供标记核苷酸,其中具有至少两个不同碱基的核苷酸含有与核苷酸耦合的相同标记,所述标记借助于所述纳米孔是可检测到的;(b)借助于聚合酶进行聚合反应,从而将所述标记核苷酸的单个标记核苷酸掺入与来自所述核酸样品的单链核酸分子互补的生长链;以及(c)在掺入所述单个标记核苷酸期间或之后借助于所述纳米孔检测到与所述单个标记核苷酸缔合的标记。
一方面,借助于膜中邻近传感电极的纳米孔确定核酸或其区段的长度的方法包括(a)向包含所述纳米孔的反应室提供标记核苷酸,其中所述标记核苷酸的单个标记核苷酸含有与核苷酸耦合的标记,所述标记能够减少流过所述纳米孔的电流相较于在不存在所述标记的情况下的电流的大小;(b)借助于聚合酶进行聚合反应,从而将所述标记核苷酸的单个标记核苷酸掺入与来自所述核酸样品的单链核酸分子互补的生长链并且减少流过所述纳米孔的电流大小;以及(c)借助于所述纳米孔检测在掺入所述单个标记核苷酸之间的时间段。在一些实施方案中,流过所述纳米孔的电流大小在掺入所述单个标记核苷酸之间的时间段期间回到至少80%的最大电流。
在一些实施方案中,所有核苷酸具有与核苷酸耦合的相同标记。在一些实施方案中,至少一些所述核苷酸具有识别核苷酸的标记。在一些实施方案中,至多20%的核苷酸具有识别核苷酸的标记。在一些实施方案中,所有核苷酸被识别为腺嘌呤(a)、胞嘧啶(c)、鸟嘌呤(g)、胸腺嘧啶(t)和/或尿嘧啶(u)。在一些实施方案中,所有核酸或其区段为短串联重复序列(str)。
一方面,用于装配具有多个亚基的蛋白的方法包括(a)提供多个第一亚基;(b)提供多个第二亚基,其中相对于第一亚基修饰第二亚基;(c)使第一亚基与第二亚基以第一比率接触以形成多个具有第一亚基和第二亚基的蛋白,其中所述多个蛋白具有多个比率的第一亚基与第二亚基;以及(d)分级分离所述多个蛋白以富集具有第二比率的第一亚基与第二亚基的蛋白,其中第二比率为每(n-1)个第一亚基一个第二亚基,其中'n'为构成所述蛋白的亚基的数量。
在一些实施方案中,所述蛋白为纳米孔。
在一些实施方案中,纳米孔与α-溶血素至少80%同源。
在一些实施方案中,第一亚基或第二亚基包含纯化标记。
在一些实施方案中,纯化标记为多组氨酸标记。
在一些实施方案中,分级分离使用离子交换色谱进行。
在一些实施方案中,第二比率为每6个第一亚基1个第二亚基。
在一些实施方案中,第二比率为每5个第一亚基2个第二亚基并且单个聚合酶附接于每个第二亚基。
在一些实施方案中,第二亚基包含化学活性部分并且所述方法还包括(e)进行反应以使实体附接于化学活性部分。
在一些实施方案中,所述蛋白为纳米孔且所述实体为聚合酶。
在一些实施方案中,第一亚基为野生型。
在一些实施方案中,第一亚基和/或第二亚基为重组的。
在一些实施方案中,第一比率为约等于第二比率。
在一些实施方案中,第一比率大于第二比率。
在一些实施方案中,所述方法还包括将具有第二比率亚基的蛋白插入双层。
在一些实施方案中,所述方法还包括借助于具有第二比率亚基的蛋白对核酸分子测序。
在另一方面,纳米孔包含多个亚基,其中聚合酶附接于所述亚基中的一个并且至少一个且少于所有的所述亚基包含第一纯化标记。
在一些实施方案中,纳米孔与α-溶血素至少80%同源。
在一些实施方案中,所有所述亚基包含第一纯化标记或第二纯化标记。
在一些实施方案中,第一纯化标记为多组氨酸标记。
在一些实施方案中,第一纯化标记在具有附接的聚合酶的亚基上。
在一些实施方案中,第一纯化标记在不具有附接的聚合酶的亚基上。
在另一方面,借助于膜中邻近传感电极的纳米孔对核酸样品测序的方法包括:(a)向包含所述纳米孔的反应室提供标记核苷酸,其中所述标记核苷酸的单个标记核苷酸含有与核苷酸耦合的标记,所述标记借助于所述纳米孔是可检测到的;(b)借助于聚合酶进行聚合反应,从而将所述标记核苷酸的单个标记核苷酸掺入与来自所述核酸样品的单链核酸分子互补的生长链;(c)在掺入所述单个标记核苷酸期间借助于所述纳米孔检测与所述单个标记核苷酸缔合的标记,其中当所述核苷酸与所述聚合酶缔合时借助于所述纳米孔检测到所述标记,并且其中所述检测包括(i)跨越所述纳米孔提供施加电压,以及(ii)在所述施加电压用所述传感电极测量电流;以及(d)校准所述施加电压。
在一些实施方案中,所述校准包括(i)测量所述标记分子的多个逃逸电压,(ii)计算所测量逃逸电压与参考点之间的差值,以及(iii)将施加电压改变所计算的差值。
在一些实施方案中,估测期望逃逸电压对时间的分布。
在一些实施方案中,参考点为所测量逃逸电压的平均值或中值。
在一些实施方案中,所述方法去除所检测到的期望逃逸电压分布的变化。
在一些实施方案中,所述方法在多个可独立寻址的纳米孔上进行,每个纳米孔邻近传感电极。
在一些实施方案中,施加电压随着时间推移而减少。
在一些实施方案中,纳米孔中标记的存在使在施加电压下用传感电极测量的电流减少。
在一些实施方案中,标记核苷酸包含多个不同标记并且所述方法检测多个不同标记中的每个。
在一些实施方案中,当与进行步骤(a)-(c)比较时,(d)增加方法的准确度。
在一些实施方案中,(d)补偿电化学条件随着时间推移的变化。
在一些实施方案中,(d)补偿在具有多个纳米孔的设备中的具有不同电化学条件的不同纳米孔。
在一些实施方案中,(d)针对所述方法的每种性能补偿不同电化学条件。
在一些实施方案中,所述方法还包括(e)校准电流增益的变化和/或电流偏移的变化。
在一些实施方案中,所述标记当与所述聚合酶缔合时被检测到多次。
在一些实施方案中,在标记检测期之间对电极再充电。
在一些实施方案中,所述方法基于通过所述纳米孔检测到所述标记核苷酸的时间长度来区分掺入的标记核苷酸和未掺入的标记核苷酸。
在另一方面,借助于膜中邻近传感电极的纳米孔对核酸样品测序的方法包括:(a)从核酸样品去除重复核酸序列以提供单链核酸分子供测序;(b)向包含所述纳米孔的反应室提供标记核苷酸,其中所述标记核苷酸的单个标记核苷酸含有与核苷酸耦合的标记,所述标记借助于所述纳米孔是可检测到的;(c)借助于聚合酶进行聚合反应,从而将所述标记核苷酸的单个标记核苷酸掺入与单链核酸分子互补的生长链;以及(d)在掺入所述单个标记核苷酸期间借助于所述纳米孔检测与所述单个标记核苷酸缔合的标记,其中当所述核苷酸与所述聚合酶缔合时借助于所述纳米孔检测到所述标记。
在一些实施方案中,重复核酸序列包含至少20个连续核酸碱基。
在一些实施方案中,重复核酸序列包含至少200个连续核酸碱基。
在一些实施方案中,重复核酸序列包含核酸碱基的至少20个连续重复亚单位。
在一些实施方案中,重复核酸序列包含核酸碱基的至少200个连续重复亚单位。
在一些实施方案中,通过与与重复核酸序列互补的核酸序列杂交来去除重复核酸序列。
在一些实施方案中,与重复核酸序列互补的核酸序列固定在固体支撑物上。
在一些实施方案中,固体支撑物为表面。
在一些实施方案中,固体支撑物为珠粒。
在一些实施方案中,与重复核酸序列互补的核酸序列包含cot-1dna。
在一些实施方案中,cot-1dna富集于具有约50个和约100个核酸碱基之间的长度的重复核酸序列中。
在另一方面,借助于膜中邻近传感电极的纳米孔对核酸样品测序的方法包括:(a)向包含所述纳米孔的反应室提供标记核苷酸,其中所述标记核苷酸的单个标记核苷酸含有与核苷酸耦合的标记,所述标记借助于所述纳米孔是可检测到的;(b)借助于通过接头附接于纳米孔的聚合酶进行聚合反应,从而将所述标记核苷酸的单个标记核苷酸掺入与来自所述核酸样品的单链核酸分子互补的生长链;以及(c)在掺入所述单个标记核苷酸期间借助于所述纳米孔检测与所述单个标记核苷酸缔合的标记,其中当所述核苷酸与所述聚合酶缔合时借助于所述纳米孔检测到所述标记。
在一些实施方案中,接头为柔性的。
在一些实施方案中,接头为至少5纳米长。
在一些实施方案中,接头为直接附接。
在一些实施方案中,接头包含氨基酸。
在一些实施方案中,纳米孔和聚合酶包含单个多肽。
在一些实施方案中,接头包含核酸或聚乙二醇(peg)。
在一些实施方案中,接头包含非共价键。
在一些实施方案中,接头包含生物素和链霉亲和素。
在一些实施方案中,以下至少一项:(a)聚合酶的c-末端附接于纳米孔的n-末端;(b)聚合酶的c-末端附接于纳米孔的c-末端;(c)聚合酶的n-末端附接于纳米孔的n-末端;(d)聚合酶的n-末端附接于纳米孔的c-末端;以及(e)聚合酶附接于纳米孔,其中聚合酶和纳米孔中的至少一个不在末端附接。
在一些实施方案中,接头相对于纳米孔对聚合酶定向以使借助于纳米孔检测到所述标记。
在一些实施方案中,聚合酶通过两个或更多个接头附接于纳米孔。
在一些实施方案中,接头包含一个或多个seqidno2-35,或由其产生的pcr产物。
在一些实施方案中,接头包含由一个或多个seqidno1-35编码的肽,或由其产生的pcr产物。
在一些实施方案中,纳米孔与α-溶血素至少80%同源。
在一些实施方案中,聚合酶与phi-29至少80%同源。
在另一方面,标记分子包含(a)包含第一区段和第二区段的第一聚合物链,其中第二区段比第一区段窄;以及(b)包含两个末端的第二聚合物链,其中第一末端固定于邻近第二区段的第一聚合物链并且第二末端未固定于第一聚合物链,其中所述标记分子能够以其中所述第二聚合物链邻近所述第二区段对齐的第一方向穿过纳米孔。
在一些实施方案中,所述标记分子不能够以其中第二聚合物链未邻近所述第二区段对齐的第二方向穿过纳米孔。
在一些实施方案中,当第二聚合物链不邻近第二区段对齐时,第二聚合物链与第一聚合物链碱基配对。
在一些实施方案中,第一聚合物链固定于核苷酸。
在一些实施方案中,当将核苷酸掺入生长中的核酸链时,第一聚合物链从核苷酸释放。
在一些实施方案中,第一聚合物链固定于核苷酸的末端磷酸。
在一些实施方案中,第一聚合物链包含核苷酸。
在一些实施方案中,第二区段包含脱碱基核苷酸。
在一些实施方案中,第二区段包含碳链。
在另一方面,借助于膜中邻近传感电极的纳米孔对核酸样品测序的方法包括:(a)向包含所述纳米孔的反应室提供标记核苷酸,其中所述标记核苷酸的单个标记核苷酸含有与核苷酸耦合的标记,所述标记借助于所述纳米孔是可检测到的,其中所述标记包含(i)包含第一区段和第二区段的第一聚合物链,其中第二区段比第一区段窄,以及(ii)包含两个末端的第二聚合物链,其中第一末端固定于邻近第二区段的第一聚合物链并且第二末端未固定于第一聚合物链,其中所述标记分子能够以其中所述第二聚合物链邻近所述第二区段对齐的第一方向穿过纳米孔;(b)借助于聚合酶进行聚合反应,从而将所述标记核苷酸的单个标记核苷酸掺入与来自所述核酸样品的单链核酸分子互补的生长链;以及(c)在掺入所述单个标记核苷酸期间借助于所述纳米孔检测与所述单个标记核苷酸缔合的标记,其中当所述核苷酸与所述聚合酶缔合时借助于所述纳米孔检测到所述标记。
在一些实施方案中,所述标记分子不能够以其中第二聚合物链不邻近所述第二区段对齐的第二方向穿过纳米孔。
在一些实施方案中,所述标记当与所述聚合酶缔合时被检测到多次。
在一些实施方案中,在标记检测期之间对电极再充电。
在一些实施方案中,所述标记在掺入所述单个标记核苷酸期间穿入纳米孔,并且其中当对电极再充电时所述标记不从纳米孔穿出。
在一些实施方案中,所述方法基于通过所述纳米孔检测到所述标记核苷酸的时间长度来区分掺入的标记核苷酸和未掺入的标记核苷酸。
在一些实施方案中,通过所述纳米孔检测到掺入的标记核苷酸的时间与通过所述纳米孔检测到未掺入的标记核苷酸的时间的比率为至少1.5。
在另一方面,用于核酸测序的方法包括:(a)提供待测序的单链核酸;(b)提供多个探针,其中所述探针包含(i)能够与单链核酸杂交的杂交部分,(ii)具有两个末端的环结构,其中每个末端附接于杂交部分,以及(iii)位于所述环结构的末端之间的杂交部分的可切割基团,其中所述环结构包含阻止所述环结构以反方向穿过纳米孔的门;(c)以通过将杂交部分与待测序的单链核酸杂交而确定的次序聚合所述多个探针;
切割可切割基团以提供待测序的扩展链;(d)使所述扩展链穿过纳米孔,其中所述门阻止扩展链以反方向穿过所述纳米孔;以及(e)借助于纳米孔,以通过将杂交部分与待测序的单链核酸杂交而确定的次序检测扩展链的环结构,从而对待测序的单链核酸测序。
在一些实施方案中,所述环结构包含窄区段并且所述门为包含两个末端的聚合物,其中第一末端固定于邻近窄区段的环结构并且第二末端未固定于环结构,其中所述环结构能够以其中所述门邻近窄区段对齐的第一方向穿过纳米孔。
在一些实施方案中,所述环结构不能够以其中所述门未邻近窄区段对齐的反方向穿过纳米孔。
在一些实施方案中,当所述门未邻近窄区段对齐时,所述门与环结构碱基配对。
在一些实施方案中,所述门包含核苷酸。
在一些实施方案中,窄区段包含脱碱基核苷酸。
在一些实施方案中,窄区段包含碳链。
在一些实施方案中,在检测期之间对电极再充电。
在一些实施方案中,当对电极再充电时,扩展链不以反方向穿过纳米孔。
本公开的另外的方面和优点将根据下列详述对本领域技术人员而言变得容易明显,其中仅显示并描述本公开的例证性实施方案。如将会意识到,本公开能够实现其它和不同实施方案,并且其某些细节能够在各个明显方面变化,均不偏离本公开。因此,附图和描述在本质上被视为例证性,而非限制性。
以引用方式并入
在本说明书中提及的所有公布、专利和专利申请在本文以引用方式并入,程度如同明确地且单独地指示每个单独公布、专利或专利申请以引用方式并入。
附图说明
本发明的新特征于所附权利要求中特别阐述。通过参考下列详述获得对本发明的特征和优点更好的理解,所述下列详述阐述其中利用本发明原理的例证性实施方案、以及附图,在附图中:
图1示意性示出方法的步骤;
图2a、2b和2c示出纳米孔检测器的实例,其中图2a具有布置于电极上的纳米孔,图2b具有在孔上插入膜中的纳米孔,以及图2c具有在突起电极上的纳米孔;
图3举例说明了设备和方法的组件;
图4举例说明了用于核酸测序的方法,其中当标记与聚合酶缔合时,通过纳米孔检测到所释放的标记;
图5举例说明了用于核酸测序的方法,其中标记在核苷酸掺入事件之时未被释放并且通过纳米孔检测到;
图6示出由短暂留在纳米孔中的标记产生的信号的实例;
图7示出纳米孔检测器的阵列;
图8示出包含纳米孔而非孔的芯片设置的实例;
图9示出随后的图9a-d的相对位置,图9a-d示出测试芯片单元阵列配置的实例;
图10示出单元模拟电路的实例;
图11示出超紧凑测量电路的实例;
图12示出超紧凑测量电路的实例;
图13示出附接于核苷酸的磷酸的标记分子的实例;
图14示出替代标记位置的实例;
图15示出可检测到的标记-多磷酸和可检测到的标记;
图16示出被配置成控制测序仪的计算机系统;
图17示出phi29聚合酶对接于溶血素纳米孔;
图18示出展现出两个限制性动力学步骤的聚合酶的停留时间的概率密度;
图19示出在纳米孔的更紧邻检测电路的一侧上与结合配偶体缔合的标记;
图20示出流过纳米孔比从纳米孔流出更容易的带倒刺毛标记;
图21a-c示出波形的实例;
图22示出四种核酸碱基腺嘌呤(a)、胞嘧啶(c)、鸟嘌呤(g)和胸腺嘧啶(t)的所提取信号对比施加电压的图;
图23示出四种核酸碱基腺嘌呤(a)、胞嘧啶(c)、鸟嘌呤(g)和胸腺嘧啶(t)的多次运行的所提取信号对比施加电压的图;
图24示出四种核酸碱基腺嘌呤(a)、胞嘧啶(c)、鸟嘌呤(g)和胸腺嘧啶(t)的多次运行的参考导电位差百分比(rcd%)对比施加电压的图;
图25示出使用寡核苷酸减速带(speed-bump)以减缓核酸聚合酶的前进;
图26示出使用除聚合酶之外的第二酶或蛋白诸如解旋酶或核酸结合蛋白;
图27示出用于形成具有规定数量的修饰亚基的多聚体蛋白的方法的实例;
图28示出分级分离具有不同数量的修饰亚基的分布的多个纳米孔的实例;
图29示出分级分离具有不同数量的修饰亚基的分布的多个纳米孔的实例;
图30示出施加电压的校准的实例;
图31示出具有门的标记核苷酸的实例;
图32示出使用具有门的标记核苷酸的核酸测序的实例;
图33示出用于扩展聚体(expandamer)测序的探针;
图34示出聚合的扩展聚体探针的实例;
图35示出切割可切割基团提供待测序的扩展链的实例;
图36示出使扩展链穿过纳米孔的实例;
图37示出非法拉第(non-faradaic)传导的实例;
图38示出捕获两个标记分子的实例;
图39示出待测序的核酸、标记核苷酸和纳米孔与聚合酶之间的融合物之间形成的三元复合物的实例;
图40示出在不存在标记核苷酸的情况下流过纳米孔的电流的实例;
图41示出使用电流水平以区分不同标记核苷酸的实例;
图42示出使用电流水平以区分不同标记核苷酸的实例;
图43示出使用电流水平以区分不同标记核苷酸的实例;
图44示出使用电流水平以使用标记核苷酸对核酸分子测序的实例;
图45示出使用电流水平以使用标记核苷酸对核酸分子测序的实例;
图46示出使用电流水平以使用标记核苷酸对核酸分子测序的实例;以及
图47示出使用电流水平以使用标记核苷酸对核酸分子测序的实例。
具体实施方案
尽管已在本文显示且描述本发明的各种实施方案,但是将对于本领域技术人员明显的是,此类实施方案仅作为实例提供。在不偏离本发明的情况下,许多改变、变化和取代可由本领域技术人员想到。应理解,可以采用本文所述的本发明的实施方案的各种替代方案。
如本文所使用的术语"纳米孔"一般是指在膜中形成或以其它方式提供的孔、通道或通路。膜可以是有机膜,诸如脂质双层,或合成膜,诸如由聚合物材料形成的膜。膜可以是聚合物材料。纳米孔可以邻近或接近传感电路或与传感电路耦合的电极布置,诸如,例如互补金属氧化物半导体(cmos)或场效应晶体管(fet)电路。在一些实例中,纳米孔具有近似0.1纳米(nm)至约1000nm的特性宽度或直径。一些纳米孔是蛋白。α溶血素是蛋白纳米孔的实例。
如本文所使用的术语"核酸"一般是指包含一个或多个核酸亚单位的分子。核酸可以包括一个或多个选自腺苷(a)、胞嘧啶(c)、鸟嘌呤(g)、胸腺嘧啶(t)和尿嘧啶(u)、或其变体的亚单位。核苷酸可以包括a、c、g、t或u、或其变体。核苷酸可以包括可掺入生长中的核酸链的任意亚单位。此类亚单位可以是a、c、g、t、或u、或对一个或多个互补的a、c、g、t或u特异、或与嘌呤(即,a或g、或其变体)或嘧啶(即,c、t或u、或其变体)互补的任意其它亚单位。亚单位能使单个核酸碱基或碱基组(例如,aa、ta、at、gc、cg、ct、tc、gt、tg、ac、ca、或其尿嘧啶对应物)被分辨。在一些实例中,核酸是脱氧核糖核酸(dna)或核糖核酸(rna)、或其衍生物。核酸可以是单链或双链。
如本文所使用的术语"聚合酶"一般是指能够催化聚合反应的任何酶。聚合酶的实例包括但不限于核酸聚合酶、转录酶或连接酶。聚合酶可以是聚合酶。
用于对样品测序的方法和系统
本文所述的是使用或借助于一个或多个纳米孔对核酸测序的方法、设备和系统。一个或多个纳米孔可以于膜(例如,脂质双层)中,邻近或传感接近电极布置,所述电极是集成电路的一部分或与集成电路耦合。
在一些实例中,纳米孔设备包括膜中邻近或传感接近电极的单个纳米孔。在其它实例中,纳米孔设备包括接近传感器电路或传感电极的至少1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、1000或10,000个纳米孔。一个或多个纳米孔可与单个电极和传感集成电路或多个电极以及传感集成电路缔合。
系统可以包括包括一个或多个纳米孔设备的反应室。纳米孔设备可以是可单独寻址的纳米孔设备(例如,能够检测信号且提供独立于系统中的其它纳米孔设备的输出的设备)。可单独寻址的纳米孔可以是单独可读的。在一些情况下,可单独寻址的纳米孔可以是单独可写的。作为替代方案,可单独寻址的纳米孔可以是单独可读的且单独可写的。系统可以包括用于促进样品制备和本公开的各种操作(诸如核酸测序)的一个或多个计算机处理器。处理器可以与纳米孔设备耦合。
纳米孔设备可以包括多个可单独寻址的传感电极。每个传感电极可以包括邻近电极的膜,以及膜中的一个或多个纳米孔。
本公开的方法、设备和系统可准确地检测到单个核苷酸掺入事件,诸如在核苷酸掺入与模板互补的生长链之时。酶(例如,dna聚合酶、rna聚合酶、连接酶)可将核苷酸掺入至生长中的多核苷酸链。本文提供的酶(例如,聚合酶)可产生聚合物链。
所添加的核苷酸可与和生长链杂交(例如,聚合酶链反应(pcr))的相应的模板核酸链互补。核苷酸可以包括与核苷酸的任意位置耦合的标记(或标记种类),所述任意位置包括但不限于核苷酸的磷酸(例如,γ磷酸)、糖或含氮碱基部分。在一些情况下,在掺入核苷酸标记期间标记与聚合酶缔合时检测到标记。在核苷酸掺入和随后的切割和/或释放标记后,所述标记可继续被检测到直到所述标记移动通过纳米孔。在一些情况下,核苷酸掺入事件从核苷酸释放标记,所述标记穿过纳米孔并被检测到。所述标记可通过聚合酶释放,或以任意适合的方式(包括但不限于被位于聚合酶比邻的酶切割)切割或释放。这样,掺入的碱基可被识别(即,a、c、g、t或u),因为唯一标记从每个类型的核苷酸(即,腺嘌呤、胞嘧啶、鸟嘌呤、胸腺嘧啶或尿嘧啶)释放。在一些情形下,核苷酸掺入事件不释放标记。在这种情况下,借助于纳米孔检测到与掺入的核苷酸耦合的标记。在一些实例中,所述标记可移动通过或接近纳米孔并且借助于纳米孔进行检测。
本公开的方法和系统可在给定时间段内诸如以至少1、2、3、4、5、6、7、8、9、10、20、30、40、50、100、500、1000、5000、10000、50000、或100000个核酸碱基("碱基")的分辨率实现核酸掺入事件的检测。在一些实例中,使用纳米孔设备检测单个核酸掺入事件,其中每个事件与单个核酸碱基缔合。在其它实例中,使用纳米孔设备检测与多个碱基缔合的事件。例如,通过纳米孔设备感测的信号可以是来自至少2、3、4或5个碱基的组合信号。
在某些情况下,标记不穿过纳米孔。标记可被纳米孔检测到并且在不通过纳米孔的情况下离开纳米孔(例如,从所述标记进入纳米孔的反方向离开)。芯片可被配置成从纳米孔主动逐出标记。
在某些情况下,在核苷酸掺入事件之时不释放标记。在一些情况下,核苷酸掺入事件将标记"呈递"至纳米孔(即,在不释放标记的情况下)。标记可在不释放的情况下被纳米孔检测到。标记可通过具有足够长度的接头附接于核苷酸以将所述标记呈递至纳米孔用于检测。
可实时(即,当它们发生时)并借助于纳米孔检测到核苷酸掺入事件。在某些情况下,附接于或接近纳米孔的酶(例如,dna聚合酶)可促进核酸分子流过或邻近纳米孔。核苷酸掺入事件、或掺入多个核苷酸可释放或呈递一个或多个标记种类(在本文也为"标记"),其可通过纳米孔检测到。当标记流过或邻近纳米孔时、当标记停留于纳米孔时和/或当将标记呈递至纳米孔时检测可发生。在一些情况下,附接于或接近纳米孔的酶可在掺入一个或多个核苷酸之时有助于检测标记。
本公开的标记可以是原子或分子,或原子或分子的集合。标记可提供光、电化学、磁或静电(例如,感应性、电容性)签名,所述签名可借助于纳米孔检测到。
本文所述的方法可以是单分子方法。即,检测到的信号由单分子(即,单个核苷酸掺入)产生并且不由多个克隆分子产生。所述方法可能不需要dna扩增。
核苷酸掺入事件可以由包含多个核苷酸(例如,脱氧核糖核苷三磷酸(dntp,其中n为腺苷(a)、胞苷(c)、胸苷(t)、鸟苷(g)或尿苷(u))的混合物发生。核苷酸掺入事件不一定由包含单个类型的核苷酸(例如,datp)的溶液发生。核苷酸掺入事件不一定由多个核苷酸(例如,datp,随后dctp,随后dgtp,随后dttp,随后datp)的交替溶液发生。在一些情况下,多个核苷酸(例如,aa、ag、ac、at、ga、gg、gg、gc、gt、ca等的二聚体)通过连接酶掺入。
用于核酸识别和测序的方法
用于对核酸测序的方法可以包括取回具有待测序的核酸的生物样品、从生物样品提取或以其它方式分离核酸样品、以及在一些情况下制备用于测序的核酸样品。
图1示意性举例说明了用于对核酸样品测序的方法。所述方法包括从生物样品(例如,组织样品、流体样品)分离核酸分子并制备用于测序的核酸样品。在某些情况下,从细胞提取核酸样品。用于提取核酸的技术的实例是使用溶菌酶、超声处理、提取、高压或其任意组合。在一些情况下核酸是不含细胞的核酸并且不需要从细胞提取。
在一些情况下,可制备核酸样品用于通过以下工艺测序,所述工艺包括从核酸样品去除蛋白、细胞壁碎片和其它组分。存在很多可用于实现此目的商购产品,诸如,例如,旋转柱。也可使用乙醇沉淀和离心。
可将核酸样品分割(或断裂)成多个片段,其可促进核酸测序,诸如借助于包括于阵列中的多个纳米孔的设备。然而,使待测序的核酸分子断裂可能不是必要的。
在某些情况下,确定长序列(即,可能不需要"鸟枪法测序"方法)。可确定任意适合长度的核酸序列。例如,可对至少约5、约10、约20、约30、约40、约50、约100、约200、约300、约400、约500、约600、约700、约800、约800、约1000、约1500、约2000、约2500、约3000、约3500、约4000、约4500、约5000、约6000、约7000、约8000、约9000、约10000、约20000、约40000、约60000、约80000或约100000个等碱基测序。在某些情况下,对至少5、至少10、至少20、至少30、至少40、至少50、至少100、至少200、至少300、至少400、至少500、至少600、至少700、至少800、至少800、至少1000、至少1500、至少2000、至少2500、至少3000、至少3500、至少4000、至少4500、至少5000、至少6000、至少7000、至少8000、至少9000、至少10000、至少20000、至少40000、至少60000、至少80000、至少100000个等碱基测序。在某些情况下,所测序的碱基是连续的。在某些情况下,所测序的碱基不是连续的。例如,可成行对给定数量的碱基测序。在另一实例中,一个或多个所测序碱基可通过序列信息未被确定和/或未可用的一个或多个嵌段分离。在一些实施方案中,模板可被测序多次(例如,使用环状核酸模板),在一些情况下产生多余的序列信息。在一些情况下,使用软件以提供序列。在一些情况下,可在测序之前分割核酸样品。在某些情况下,可对核酸样品链加工以使给定双螺旋dna或rna/dna区被制成环状,从而双螺旋dna或rna/dna区的相应的有义和反义部分包括于环状dna或环状dna/rna分子中。在这种情况下,来自此类分子的所测序碱基可允许更容易的数据组合及碱基位置读取的检查。
纳米孔测序和分子检测
本文提供了借助于纳米孔对核酸分子测序的系统和方法。纳米孔可形成或以其它方式包埋于邻近传感电路(诸如集成电路)的传感电极布置的膜中。集成电路可以是专用集成电路(asic)。在一些实例中,集成电路为场效应晶体管或互补金属氧化物半导体(cmos)。传感电路可位于具有纳米孔的芯片或其它设备中,或者芯片或设备的外部,诸如于片外(off-chip)配置中。半导体可以是任意半导体,包括但不限于iv族(例如,硅)和iii-v族半导体(例如,砷化镓)。
在一些情况下,当核酸或标记流过或邻近纳米孔时,传感电路检测与核酸或标记缔合的电信号。核酸可以是较大链的亚单位。所述标记可以是核苷酸掺入事件或者标记核酸与纳米孔或邻近纳米孔的种类(诸如从核酸切割标记的酶)之间的其它相互作用的副产物。所述标记可保持附接于核苷酸。所检测信号可收集且存储于存储器位置,并且此后用于构建核酸的序列。可对所收集的信号加工以解释所检测信号的任意异常,诸如误差。
图2示出具有温度控制的纳米孔检测器(或传感器)的实例,如可根据美国专利申请公布no.2011/0193570(其以引用方式整体并入本文)中所述的方法制备。参考图2a,纳米孔检测器包括与导电溶液(例如,盐溶液)207接触的顶部电极201。底部导电电极202紧邻、邻近或接近纳米孔206,其插入膜205中。在某些情况下,底部导电电极202包埋于半导体203中,半导体203被电路包埋于半导体基板204中。可将半导体203的表面处理为疏水性。正被检测到的样品通过纳米孔206中的孔。半导体芯片传感器放置于包装208中,并且这是转而位于温度控制元件209的近邻。温度控制元件209可以是热电式加热和/或冷却设备(例如,peltier设备)。多个纳米孔检测器可形成纳米孔阵列。
参考图2b,其中相同的数字表示相同的元件,膜205可布置于孔210上,其中传感器202形成孔的表面的部分。图2c示出其中电极202从经处理的半导体表面203突起的实例。
在一些实例中,膜205在底部导电电极202上,而非在半导体203上形成。在这种情况下,膜205可形成与底部导电电极202的耦合相互作用。然而,在一些情况下,膜205在底部导电电极202和半导体203上形成。作为替代方案,膜205可在半导体203上且非在底部导电电极202上形成,但是可在底部导电电极202上延伸。
纳米孔可用于对核酸分子间接测序,在一些情况下用电检测。间接测序可以是其中在生长链中掺入的核苷酸不穿过纳米孔的任何方法。核酸分子可在距和/或接近纳米孔任意适合的距离内通过,在一些情况下在使得从核苷酸掺入事件释放的标记于纳米孔中检测到的距离内。
核苷酸掺入事件的副产物可通过纳米孔检测到。"核苷酸掺入事件"是核苷酸到生长中的多核苷酸链的掺入。副产物可以与给定类型核苷酸的掺入相关。核苷酸掺入事件一般被酶诸如dna聚合酶催化,并且使用与模板分子的碱基配对相互作用以在可用的在每个位置掺入的核苷酸中选择。
核酸样品可使用标记核苷酸或核苷酸类似物测序。在一些实例中,用于对核酸分子测序的方法包括(a)掺入(例如,聚合)标记核苷酸,其中与单个核苷酸缔合的标记在掺入之时释放,以及(b)借助于纳米孔检测所释放的标记。在某些情况下,所述方法还包括引导所述标记附接于单个核苷酸或通过纳米孔从单个核苷酸释放。所释放或附接的标记可通过任意适合的技术引导,在一些情况下借助于酶(或分子马达)和/或跨越孔的电压差。可选地,可在不使用酶的情况下引导所释放或附接的标记通过纳米孔。例如,所述标记可通过跨越如本文所述的纳米孔的电压差来引导。
用预加载标记测序
在未加载到纳米孔的情况下释放的标记可从纳米孔扩散并且未被纳米孔检测到。这可对测序核酸分子造成误差(例如,缺少核酸位置或以错误的次序检测标记)。本文提供了用于对核酸分子测序的方法,其中在标记从核苷酸释放之前将标记分子"预加载"到纳米孔。预加载标记可比未预加载的标记更有可能通过纳米孔检测到(例如,可能至少约100倍以上)。另外,预加载标记提供了用于确定标记核苷酸是否已掺入生长中的核酸链的方法。与在未掺入的情况下穿过纳米孔(并通过纳米孔检测到)的标记(例如,平均少于约1ms)相比,与掺入的核苷酸缔合的标记可与纳米孔缔合更长的时间段(例如,平均至少约50毫秒(ms))。在一些实例中,与掺入的核苷酸缔合的所述标记可与纳米孔缔合或保持或以其它方式与邻近纳米孔的酶(例如,聚合酶)耦合至少约1毫秒(ms)、20ms、30ms、40ms、50ms、100ms、200ms或大于250ms的平均时间段。在一些实例中,与掺入的核苷酸缔合的标记信号可具有至少约1毫秒(ms)、20ms、30ms、40ms、50ms、100ms、200ms或大于250ms的平均检测寿命。所述标记可与所耦合的掺入的核苷酸耦合。平均检测寿命小于归因于掺入的核苷酸的平均检测寿命(例如,小于约1ms)的标记信号可归因于与标记耦合的未掺入的核苷酸。在一些情况下,至少'x'的平均检测寿命可归因于掺入的核苷酸,并且小于'x'的平均检测寿命可归因于未掺入的核苷酸。在一些实例中,'x'可以为0.1ms、1ms、20ms、30ms、40ms、50ms、100ms、1秒。
标记可借助于具有膜中的至少一个纳米孔的纳米孔设备进行检测。所述标记可在掺入所述单个标记核苷酸期间与单个标记核苷酸缔合。本文提供的方法可涉及借助于纳米孔区分与单个标记核苷酸缔合的标记和与一个或多个未掺入的单个标记核苷酸缔合的一个或多个标记。在一些情况下,纳米孔设备在掺入期间检测到与单个标记核苷酸缔合的标记。通过纳米孔设备,在一些情况下借助于纳米孔设备的电极和/或纳米孔在给定时间段内检测、确定或区分标记核苷酸(不管掺入生长中的核酸链还是未掺入)。与所述标记和/或与所述标记耦合的核苷酸由酶、诸如促进核苷酸掺入核酸链的酶(例如,聚合酶)保持的时间段相比,纳米孔设备检测到所述标记的时间段可能更短,在一些情况下短得多。在一些实例中,所述标记在掺入的标记核苷酸与所述酶缔合的时间段内可被电极检测到多次。例如,所述标记可在掺入的标记核苷酸与所述酶缔合的时间段内被电极检测到至少1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、1000、10,000、100,000或1,000,000次。
检测时间或平均检测时间的任何列举可允许检测时间比例高于或低于所述的时间或平均时间。在一些情况下,当对多个核酸碱基测序时的检测时间为统计学分布的(例如,指数分布或高斯(gaussian)分布)。例如,指数分布可具有检测时间低于平均检测时间的相对大的百分比,如在图18中。
在一些实例中,预加载标记包括在所述标记附接于核苷酸时引导至少部分的所述标记通过至少部分的纳米孔,所述核苷酸已掺入核酸链(例如,生长中的核酸链)、正经历掺入核酸链、或仍未掺入核酸链但可经历掺入核酸链。在一些实例中,预加载所述标记包括在核苷酸已掺入核酸链之前或当核苷酸正掺入核酸链时引导至少部分的所述标记通过至少部分的纳米孔。在一些情况下,预加载所述标记可以包括在核苷酸已掺入核酸链后引导至少部分的所述标记通过至少部分的纳米孔。
图3示出方法的主要组分。在此,纳米孔301形成于膜302中。酶303(例如,聚合酶诸如dna聚合酶)与纳米孔缔合。在一些情况下,所述酶共价连接于如下所述的纳米孔。聚合酶与待测序的单链核酸分子304缔合。单链核酸分子在某些情况下是环状的,但这并不是必需的。在一些情况下,核酸分子是线性的。在一些实施方案中,核酸引物305与核酸分子的一部分杂交。在一些情况下,引物具有发夹(例如,在环状模板周围首次通过后以阻止所替换的新产生的核酸链穿过纳米孔)。使用单链核酸分子作为模板,聚合酶催化核苷酸掺入引物。核苷酸306包含如本文所述的标记种类("标记")307。
图4示意性举例说明了借助于"预加载"标记的核酸测序方法。部分a示出图3所述的主要组分。部分c示出加载到纳米孔的标记。"加载的"标记可以是位于和/或保持于或紧邻纳米孔诸如,例如,至少0.1毫秒(ms)、至少1ms、至少5ms、至少10ms、至少50ms、至少100ms、或至少500ms或至少1000ms的可感知的时间段的标记。在一些情况下,在从核苷酸释放之前,"预加载"的标记加载于纳米孔中。在某些情况下,如果在核苷酸掺入事件之时标记在释放后通过纳米孔(和/或通过纳米孔检测到)的概率为适合地高,诸如,例如,至少90%、至少95%、至少99%、至少99.5%、至少99.9%、至少99.99%或至少99.999%,则所述标记被预加载。
在从部分a至部分b的转变中,核苷酸已与聚合酶缔合。所缔合的核苷酸与单链核酸分子碱基配对(例如,a与t和g与c)。应认识到,许多核苷酸可变得瞬时与聚合酶缔合,它们未与单链核酸分子碱基配对。未配对的核苷酸可能遭聚合酶排斥并且一般仅在核苷酸碱基配对的情况下开始核苷酸的掺入。未配对的核苷酸一般在比正确配对的核苷酸保持与聚合酶缔合的时标短的时标内被排斥。未配对的核苷酸可在至少约100纳秒(ns)、1ms、10ms、100ms、1秒的时间段(平均)内被排斥,而正确配对的核苷酸保持与聚合酶缔合达更长的时间段,诸如至少约1毫秒(ms)、10ms、100ms、1秒或10秒的平均时间段。在图4的部分a和b期间通过纳米孔的电流在一些情况下可以为3至30皮安(pa)之间。
图4部分c描绘了聚合酶对接于纳米孔。借助于施加至纳米孔停留的膜或纳米孔的电压(例如,dc或ac电压),可将聚合酶拉向纳米孔。图17也描绘了聚合酶对接于纳米孔,在这种情况下为具有α-溶血素纳米孔的phi29dna聚合酶(φ29dna聚合酶)。可通过电动力,诸如在通过对膜和/或纳米孔的施加电压产生的电场存在下产生的力在对接期间将标记拉入纳米孔。在一些实施方案中,在图4部分c期间流过纳米孔的电流为约6pa、约8pa、约10pa、约15pa或约30pa。聚合酶经历异构化和转磷酸反应以将核苷酸掺入生长中的核酸分子并且释放所述标记分子。
在部分d中,描绘了标记通过纳米孔。通过如本文所述的纳米孔检测到标记。重复循环(即,部分a至e或a至f)则允许对核酸分子测序。
在一些情况下,未掺入生长中的核酸分子的标记核苷酸也将穿过纳米孔,如在图4的部分f中所见。未掺入的核苷酸在某些情况下可通过纳米孔检测到,但是该方法提供了用于至少部分基于核苷酸于纳米孔中检测到的时间来区分掺入的核苷酸和未掺入的核苷酸的装置。与未掺入的核苷酸结合的标记快速穿过纳米孔并且被检测短时间段(例如,小于100ms),而与掺入的核苷酸结合的标记加载于纳米孔中并被检测长时间段(例如,至少100ms)。
在一些实施方案中,所述方法基于通过纳米孔检测到标记核苷酸的时间长度来区分掺入(例如,聚合)的标记核苷酸和未掺入的标记核苷酸。与在未掺入时相比,所述标记在掺入时可保持接近纳米孔较长的时间。在某些情况下,使聚合酶突变以增加掺入的标记核苷酸和未掺入的标记核苷酸之间的时间差值。通过纳米孔检测到掺入的标记核苷酸的时间与通过纳米孔检测到未掺入的标记的时间的比率可以为任意适合的值。在一些实施方案中,通过纳米孔检测到掺入的标记核苷酸的时间与通过纳米孔检测到未掺入的标记的时间的比率为约1.5、约2、约3、约4、约5、约6、约7、约8、约9、约10、约12、约14、约16、约18、约20、约25、约30、约40、约50、约100、约200、约300、约400、约500或约1000。在一些实施方案中,通过纳米孔检测到掺入(例如,聚合)的标记核苷酸的时间与通过纳米孔检测到未掺入的标记的时间的比率为至少约1.5、至少约2、至少约3、至少约4、至少约5、至少约6、至少约7、至少约8、至少约9、至少约10、至少约12、至少约14、至少约16、至少约18、至少约20、至少约25、至少约30、至少约40、至少约50、至少约100、至少约200、至少约300、至少约400、至少约500或至少约1000。
标记加载于纳米孔(和/或通过纳米孔检测)的时间为任意适合的值。在某些情况下,所述标记通过纳米孔检测平均约10毫秒(ms)、约20ms、约30ms、约40ms、约50ms、约60ms、约80ms、约100ms、约120ms、约140ms、约160ms、约180ms、约200ms、约220ms、约240ms、约260ms、约280ms、约300ms、约400ms、约500ms、约600ms、约800ms或约1000ms。在某些情况下,所述标记通过纳米孔检测平均至少约10毫秒(ms)、至少约20ms、至少约30ms、至少约40ms、至少约50ms、至少约60ms、至少约80ms、至少约100ms、至少约120ms、至少约140ms、至少约160ms、至少约180ms、至少约200ms、至少约220ms、至少约240ms、至少约260ms、至少约280ms、至少约300ms、至少约400ms、至少约500ms、至少约600ms、至少约800ms或至少约1000ms。
在一些实例中,在至少约1ms、至少约10ms、至少约50ms、至少约80ms、至少约100ms、至少约120ms、至少约140ms、至少约160ms、至少约180ms、至少约200ms、至少约220ms、至少约240ms或至少约260ms的时间段内产生信号的标记归因于已掺入与至少部分的模板互补的生长链的核苷酸。在一些情况下,在小于约100ms、小于约80ms、小于约60ms、小于约40ms、小于约20ms、小于约10ms、小于约5ms或小于约1ms的时间段内产生信号的标记归因于未掺入生长链的核苷酸。
核酸分子可以为线性(如图5中所见)。在一些情况下,如图3中所见,核酸分子304为环状(例如,环状dna、环状rna)。环化(例如,单链)核酸可被测序多次(例如,当聚合酶303完全在环周围前进时,其开始模板的重新测序部分)。对于联接在一起的相同的基因组位置,环状dna可以是有义和反义链(在一些情况下允许更稳健且准确的读取发生)。可对环状核酸测序直至达到适合的准确度(例如,至少95%、至少99%、至少99.9%或至少99.99%准确度)。在一些情况下,核酸被测序至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少12、至少15、至少20次、至少40次、至少50次、至少100次或至少1000次。
一方面,本文所述的方法和设备部分基于掺入的核苷酸被和/或可被纳米孔检测到的时间段比未掺入的核苷酸长来区分掺入的核苷酸和未掺入的核苷酸。在某些情况下,替换与正测序的核酸链(双链核酸)杂交的第二核酸链则增加检测到掺入的核苷酸和未掺入的核苷酸之间的时间差值。参考图3,在第一次测序后,聚合酶可遇到双链核酸(例如,从其遇到引物305之时开始)并且第二核酸链可能需要从模板替换以继续测序。与模板为单链时比较,这种替换可减缓聚合酶和/或核苷酸掺入事件的速率。
在某些情况下,模板核酸分子通过寡核苷酸与单链模板杂交而为双链的。图25示出其中使多个寡核苷酸2500杂交的实例。聚合酶2501以指示2502的方向前进则从模板替换寡核苷酸。与寡核苷酸不存在时相比,聚合酶可以前进更缓慢。在一些情况下,使用如本文所述的寡核苷酸部分基于掺入的核苷酸被和/或可被纳米孔检测到的时间段比未掺入的核苷酸长来改善掺入的核苷酸和未掺入的核苷酸的分辨率。寡核苷酸可以是任意适合的长度(例如,约4、约5、约6、约7、约8、约9、约10、约12、约14、约16、约18或约20个碱基长)。寡核苷酸可以包含天然碱基(例如,腺嘌呤(a)、胞嘧啶(c)、鸟嘌呤(g)、胸腺嘧啶(t)和/或尿嘧啶(u))、通用碱基、(例如,5-硝基吲哚、3-硝基吡咯、3-甲基7-丙炔基异喹诺酮(pim)、3-甲基异喹诺酮(mics)和/或5-甲基异喹诺酮(5mics))、或以任意比例的其任意组合。
在一些情况下,核酸聚合酶用甲基化核酸模板比用非甲基化核酸模板进行得更慢。一方面,本文所述的方法和/或设备使用甲基化核酸和/或使核酸分子甲基化。在一些情况下,甲基存在于和/或加入至胞嘧啶嘧啶环的5位和/或腺嘌呤嘌呤环的6号氮。待测序的核酸可从使核酸甲基化的生物体分离。在一些情况下,核酸可在体外被甲基化(例如,通过使用dna甲基转移酶)。时间可用于区分甲基化碱基与非甲基化碱基。这可实现表观遗传学研究。
在一些情况下,甲基化碱基可基于特性电流或电流/时间图的特性形状与非甲基化碱基区分。例如,根据核酸模板在给定位置是否具有甲基化碱基(例如,由于聚合酶的构象差异),标记核苷酸可产生不同的阻塞电流。在一些情况下,c和/或a碱基被甲基化并且相应的g和/或t标记核苷酸的掺入改变电流。
用于核酸测序的酶
所述方法可通过如本文所述的纳米孔和标记核苷酸,使用酶(例如,聚合酶、转录酶或连接酶)对核酸分子测序。在一些情况下,所述方法涉及借助于聚合酶(例如,dna聚合酶)掺入(例如,聚合)标记核苷酸。在一些情况下,已使聚合酶突变以允许其接受标记核苷酸。也可使聚合酶突变以增加通过纳米孔检测到标记的时间(例如,图4部分c的时间)。
在一些实施方案中,所述酶是通过核苷酸的磷酸键联产生核酸链的任意酶。在一些情况下,dna聚合酶为9°n聚合酶或其变体、大肠杆菌dna聚合酶i、噬菌体t4dna聚合酶、测序酶、taqdna聚合酶、9°n聚合酶(外-)a485l/y409v、phi29dna聚合酶(φ29dna聚合酶)、bct聚合酶、或其变体、突变体、或同系物。同系物可以具有任意适合的同源性百分比,包括但不限于至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或至少约95%序列同一性。
参考图3,酶303可附接于纳米孔301。适用于附接酶与纳米孔的方法包括交联诸如形成分子内二硫键。纳米孔和酶也可以是融合蛋白(即,通过单个多肽链编码)。用于产生融合蛋白的方法可以包括框内和邻近纳米孔的编码序列(在两者之间没有终止密码子)融合酶的编码序列以及从单个启动子表达该融合序列。在一些实例中,酶303可以使用分子订书钉(staple)或指蛋白(finger)附接或以其它方式耦合于纳米孔301。在一些情况下,所述酶通过中间体分子附接,诸如例如与酶和纳米孔两者缀合的生物素和连接于两个生物素的链霉亲和素四聚体。所述酶也可用抗体附接于纳米孔。在一些情况下,使用彼此形成共价键的蛋白(例如,spytag™/spycatcher™系统)以使聚合酶附接于纳米孔。在一些情况下,磷酸酶或从核苷酸切割标记的酶也附接于纳米孔。
在某些情况下dna聚合酶是phi29dna聚合酶。可使聚合酶突变以促进和/或改善突变型聚合酶相较于非突变型聚合酶使标记核苷酸掺入生长中的核酸分子的效率。可使聚合酶突变以改善核苷酸类似物(例如,标记核苷酸)进入聚合酶的活性位点区和/或突变以与活性区中的核苷酸类似物配位。
在一些实施方案中,聚合酶具有活性区,所述活性区具有与接收核苷酸类似物(例如,venta488l)的聚合酶活性区同源(例如,至少70%、至少80%或至少90%氨基酸位置相同)的氨基酸序列。
phi29dna聚合酶的适合的突变包括但不限于缺失残基505-525、在残基505-525内的缺失、k135a突变、e375h突变、e375s突变、e375k突变、e375r突变、e375a突变、e375q突变、e375w突变、e375y突变、e375f突变、e486a突变、e486d突变、k512a突变及其组合。在一些情况下,dna聚合酶还包含l384r突变。适合的dna聚合酶描述于美国专利公布no.2011/0059505中,其以引用方式整体并入本文。在一些实施方案中,聚合酶是具有突变n62d、l253a、e375y、a484e和/或k512y的phi29dna聚合酶。
针对phi29聚合酶的适合的突变并不限于赋予标记核苷酸掺入改善的突变。相较于非突变型(野生型)phi29dna聚合酶,其它突变(例如,氨基酸取代、插入、缺失和/或外源性特征)可赋予(但不限于)金属离子配位增强、核酸外切酶活性降低、聚合酶动力学循环的一个或多个步骤的反应速率降低、分支比减少、辅因子选择性改变、产率增加、热稳定性增加、准确度增加、速度增加、读取长度(readlength)增加、耐盐性增加等。
phi29dna聚合酶的适合的突变包括但不限于位置e375处的突变、位置k512处的突变以及选自由l253、a484、v250、e239、y224、y148、e508和t368组成的组的一个或多个位置处的突变。
在一些实施方案中,位置e375处的突变包括选自由e375y、e375f、e375r、e375q、e375h、e375l、e375a、e375k、e375s、e375t、e375c、e375g和e375n组成的组的氨基酸取代。在某些情况下,位置k512处的突变包括选自由k512y、k512f、k512i、k512m、k512c、k512e、k512g、k512h、k512n、k512q、k512r、k512v和k512h组成的组的氨基酸取代。在一个实施方案中,位置e375处的突变包括e375y取代且在位置k512处的突变包括k512y取代。
在一些情况下,突变型phi29聚合酶包含选自由l253a、l253c、l253s、a484e、a484q、a484n、a484d、a484k、v250i、v250q、v250l、v250m、v250c、v250f、v250n、v250r、v250t、v250y、e239g、y224k、y224q、y224r、y148i、y148a、y148k、y148f、y148c、y148d、y148e、y148g、y148h、y148k、y148l、y148m、y148n、y148p、y148q、y148r、y148s、y148t、y148v、y148w、e508r和e508k组成的组的一个或多个氨基酸取代。
在某些情况下,phi29dna聚合酶包含选自在由d510、e515和f526组成的组的一个或多个位置处的突变。突变可以包括选自由d510k、d510y、d510r、d510h、d510c、e515q、e515k、e515d、e515h、e515y、e515c、e515m、e515n、e515p、e515r、e515s、e515t、e515v、e515a、f526l、f526q、f526v、f526k、f526i、f526a、f526t、f526h、f526m、f526v和f526y组成的组的一个或多个氨基酸取代。可用于本公开的方法的dna聚合酶的实例描述于美国专利公布no.2012/0034602中,其以引用方式整体并入本文。
聚合酶可以具有适用于通过纳米孔检测标记的动力学速率特征。速率特征可以是指核苷酸掺入的总速率和/或核苷酸掺入的任意步骤(诸如核苷酸添加、诸如酶异构化成闭合状态或从闭合状态的酶异构化、辅因子结合或释放、产物释放、核酸向生长中的核酸的掺入或移位)的速率。
本公开的系统可允许检测与测序相关的一个或多个事件。该事件可以是动力学观察到的和/或非动力学观察到的(例如,在不与聚合酶接触的情况下通过纳米孔迁移的核苷酸)。
聚合酶可适于允许检测测序事件。在一些实施方案中,聚合酶的速率特征可以使得标记加载于纳米孔(和/或通过纳米孔检测)达平均约0.1毫秒(ms)、约1ms、约5ms、约10ms、约20ms、约30ms、约40ms、约50ms、约60ms、约80ms、约100ms、约120ms、约140ms、约160ms、约180ms、约200ms、约220ms、约240ms、约260ms、约280ms、约300ms、约400ms、约500ms、约600ms、约800ms或约1000ms。在一些实施方案中,聚合酶的速率特征可以使得标记加载于纳米孔(和/或通过纳米孔检测)达平均至少约5毫秒(ms)、至少约10ms、至少约20ms、至少约30ms、至少约40ms、至少约50ms、至少约60ms、至少约80ms、至少约100ms、至少约120ms、至少约140ms、至少约160ms、至少约180ms、至少约200ms、至少约220ms、至少约240ms、至少约260ms、至少约280ms、至少约300ms、至少约400ms、至少约500ms、至少约600ms、至少约800ms或至少约1000ms。在某些情况下,所述标记通过纳米孔检测平均约80ms与260ms之间、约100ms与200ms之间或约100ms与150ms之间。
在一些情况下,聚合酶反应展现出从中间体开始的两个动力学步骤(其中核苷酸或多磷酸产物与聚合酶结合),以及从中间体开始的两个动力学步骤(其中核苷酸或多磷酸产物未与聚合酶结合)。两个动力学步骤可以包括酶异构化、核苷酸掺入和产物释放。在一些情况下,两个动力学步骤是模板移位和核苷酸结合。
图18举例说明了如果存在一个动力学步骤,则当停留时间增加1800时标记于纳米孔中的给定停留时间的概率呈指数减少,提供了标记于纳米孔中的停留时间较短的概率相对高的分布1801(且因此可能未通过纳米孔检测)。图18也举例说明了对于存在两个或更多个动力学步骤(例如,可观察到的或"缓慢"步骤)的情况1802,标记于纳米孔中的停留时间非常快速的概率相较于具有一个缓慢步骤的情况1801是相对较低的1803。换句话说,添加两个指数函数可产生高斯函数或分布1802。此外,两个缓慢步骤的概率分布展现出在概率密度对比停留时间的图中的峰1802。这种类型的停留时间分布对于如本文所述的核酸测序是有利的(例如,其中期望检测高比例的掺入标记)。相对多的核苷酸掺入事件使所述标记加载于纳米孔达大于最短时间(tmin,其在某些情况下可以大于100ms)的时间段。
在一些情况下,使phi29dna聚合酶相较于野生型酶发生突变以提供两个动力学缓慢步骤和/或以提供适用于通过纳米孔检测标记的速率特征。在一些情况下,phi29dna聚合酶具有选自位置484、位置198和位置381的至少一个氨基酸取代或取代的组合。在一些实施方案中,氨基酸取代选自e375y、k512y、t368f、a484e、a484y、n387l、t372q、t372l、k478y、1370w、f198w、l381a及其任意组合。适合的dna聚合酶描述于美国专利no.8,133,672中,其以引用方式整体并入本文。
也可通过操纵与酶接触的溶液的内容物来影响和/或控制酶的动力学。例如,非催化二价离子(例如,不促进聚合酶功能的离子诸如锶(sr2 ))可与催化二价离子(例如,促进聚合酶功能的离子诸如镁(mg2 )和/或锰(mn2 ))混合以使聚合酶减速。催化离子与非催化离子的比率可以为任意适合的值,包括约20、约15、约10、约9、约8、约7、约6、约5、约4、约3、约2、约1、约0.5、约0.2或约0.1。在一些情况下,比率取决于单价盐(例如,氯化钾(kcl))的浓度、温度和/或ph。在一个实例中,溶液包含1微摩尔mg2 和0.25微摩尔sr2 。在另一实例中,溶液包含3微摩尔mg2 和0.7微摩尔sr2 。镁(mg2 )和锰(mn2 )的浓度可以为任意适合的值,并且可以变化以影响酶的动力学。在一个实例中,溶液包含1微摩尔mg2 和0.25微摩尔mn2 。在另一实例中,溶液包含3微摩尔mg2 和0.7微摩尔mn2 。
预加载标记分子的纳米孔测序
可在合成与靶链互补的核酸链期间在未从掺入的核苷酸释放的情况下检测到标记。标记可用接头附接于核苷酸以使所述标记呈递至纳米孔(例如,所述标记下垂到或以其它方式延伸通过至少部分的纳米孔)。接头的长度可以足够长以允许所述标记延伸至或通过至少部分的纳米孔。在某些情况下,通过电压差时将标记呈递至(即,移入)纳米孔。将所述标记呈递到孔中的其它方法也可以是适合的(例如,使用酶、磁体、电场、压差)。在某些情况下,无作用力施加至所述标记(即,所述标记扩散到纳米孔中)。
本发明的方面提供了用于对核酸测序的方法。所述方法包括掺入(例如,聚合)标记核苷酸。在掺入之时未从核苷酸释放的情况下可通过纳米孔检测到与单个核苷酸缔合的标记。
用于对核酸样品测序的芯片可以包含多个可单独寻址的纳米孔。多个可单独寻址的纳米孔可含有形成于膜中邻近集成电路布置的至少一个纳米孔。每个可单独寻址的纳米孔能够检测与单个核苷酸缔合的标记。可掺入(例如,聚合)核苷酸并且标记可在掺入之时未从核苷酸释放。
方法的实例描绘于图5中。在此,核酸链500跨越或接近(但未通过,如通过501的箭头所示)纳米孔502。酶503(例如,dna聚合酶)使用第一核酸分子作为模板500通过一次掺入一个核苷酸来延伸生长中的核酸链504(即,所述酶催化核苷酸掺入事件)。通过纳米孔502检测到标记。标记可停留于纳米孔中达一定时间段。
酶503可附接于纳米孔502。适用于附接酶和纳米孔的方法包括交联诸如形成分子内二硫键和/或产生如上所述的融合蛋白。在一些情况下,磷酸酶也附接于纳米孔。这些酶还可以结合于切割标记上的剩余磷酸并且通过进一步增加于纳米孔中的停留时间来产生更清楚的信号。适合的dna聚合酶包括phi29dna聚合酶(φ29dna聚合酶)并且还包括但不限于上文所述的那些。
继续参考图5,将所述酶从附接于标记分子(在指示505处的空心圆形)的核苷酸(在指示505处的实心圆形)的汇集物拉出。每种类型的核苷酸附接于不同标记分子以使当标记停留于纳米孔502中时,它们可基于在纳米孔中产生的或与纳米孔缔合的信号彼此区分。
在一些情况下,标记在核苷酸掺入事件之时呈递至纳米孔并且从核苷酸释放。在一些情况下,所释放的标记通过纳米孔。在某些情况下标记未穿过纳米孔。在某些情况下,已在核苷酸掺入事件之时释放的标记区分于可流过纳米孔的标记,但是至少部分通过纳米孔中的停留时间,仍未在核苷酸掺入事件之时释放。在一些情况下,留在纳米孔中至少约100毫秒(ms)的标记在核苷酸掺入事件之时释放并且留在纳米孔中小于约100ms的标记未在核苷酸掺入事件之时释放。在一些情况下,标记被捕获和/或被第二酶或蛋白(例如,核酸结合蛋白)指导通过纳米孔。第二酶可以在核苷酸掺入之时(例如,期间或之后)切割标记。所述标记与核苷酸之间的接头可被切割。
如图26中所见,第二酶或蛋白2600可附接于聚合酶。在一些实施方案中,第二酶或蛋白为促进双链模板与单链模板解离的核酸解旋酶。在一些情况下,第二酶或蛋白未附接于聚合酶。第二酶或蛋白可以是结合于单链核酸模板以助于保持模板单链的核酸结合蛋白。核酸结合蛋白可沿着单链核酸分子滑动。
基于借助于纳米孔检测到与核苷酸缔合的标记的时间长度,掺入的核苷酸可与未掺入的核苷酸区分。在一些实例中,与已掺入核酸链的核苷酸("掺入的核苷酸")缔合的标记通过或借助于纳米孔检测至少约5毫秒(ms)、10ms、20ms、30ms、40ms、50ms、60ms、70ms、80ms、90ms、100ms、200ms、300ms、400ms或500ms的平均时间段。与未掺入的(例如,自由流动)核苷酸缔合的标记通过纳米孔检测平均小于约500ms、400ms、300ms、200ms、100ms、90ms、80ms、70ms、60ms、50ms、40ms、30ms、20ms、10ms、5ms或1ms的时间段。在一些情况下,与掺入的核苷酸缔合的标记通过纳米孔检测平均至少约100ms的时间段,并且与未掺入的核苷酸缔合的标记通过纳米孔检测平均小于100ms的时间段。
在一些实例中,基于标记于纳米孔中的停留时间或借助于纳米孔从未掺入的核苷酸检测到的信号,与掺入的核苷酸耦合的标记区分于与未掺入生长中的互补链的核苷酸缔合的标记。未掺入的核苷酸可产生可在约1纳秒(ns)与100ms之间、或约1ns与50ms之间的时间段内检测到的信号(例如,电压差、电流),而掺入的核苷酸可产生具有约50ms与500ms之间、或100ms与200ms之间的寿命的信号。在一些实例中,未掺入的核苷酸可产生可在约1ns与10ms之间、或1ns与1ms之间的时间段内检测到的信号。在一些情况下,未掺入的标记可通过纳米孔检测到的时间段(平均)比掺入的标记可通过纳米孔检测到的时间段长。
在一些情况下,掺入的核苷酸通过和/或可通过纳米孔检测到的时间段比未掺入的核苷酸短。这些时间的差值和/或比率可用于确定通过纳米孔检测到的核苷酸是否掺入,如本文所述。
检测期可基于核苷酸通过纳米孔的自由流动;未掺入的核苷酸可停留在或接近纳米孔达约1纳秒(ns)与100ms之间、或约1ns与50ms之间的时间段,而掺入的核苷酸可停留在或接近纳米孔达约50ms与500ms之间、或100ms与200ms之间的时间。时间段可基于工艺条件而变化;然而,掺入的核苷酸可具有的停留时间比未掺入的核苷酸长。
聚合(例如,掺入)和检测均可在无彼此干扰的情况下发生。在一些实施方案中,第一标记核苷酸的聚合未明显干扰与第二标记核苷酸缔合的标记的纳米孔检测。在一些实施方案中,与第一标记核苷酸缔合的标记的纳米孔检测不干扰第二标记核苷酸的聚合。在一些情况下,所述标记足够长以通过纳米孔检测到和/或以在未阻止核苷酸掺入事件的情况下被检测到。
标记(或标记种类)可以包括可检测到的原子或分子、或多个可检测到的原子或分子。在一些情况下,标记包括一个或多个腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶、尿嘧啶、或其连接于任意位置(包括核酸分子的磷酸基团、糖或含氮碱基)的衍生物。在一些实例中,标记包括一个或多个腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶、尿嘧啶、或其共价连接于核酸碱基的磷酸基团的衍生物。
标记可具有至少约0.1纳米(nm)、1nm、2nm、3nm、4,nm、5nm、6nm、7nm、8nm、9nm、10nm、20nm、30nm、40nm、50nm、60nm、70nm、80nm、90nm、100nm、200nm、300nm、400nm、500nm或1000nm的长度。
标记可以包括重复亚单位诸如多个腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶、尿嘧啶或其衍生物的尾部。例如,标记可以包括具有腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶、尿嘧啶或其衍生物的至少2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、1000、10,000或100,000个亚单位的尾部部分。亚单位可彼此连接,并且在末端连接于核酸的磷酸基团。标记部分的其它实例包括任意聚合物材料,诸如聚乙二醇(peg)、聚磺酸酯、氨基酸或任意完全或部分带正电荷、带负电荷或不带电荷的聚合物。
标记种类可具有对于在掺入期间掺入的核酸分子类型而言独特的电子签名。例如,为腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶或尿嘧啶的核酸碱基可具有标记种类,所述标记种类具有分别对于腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶或尿嘧啶而言独特的一个或多个种类。
图6示出当不同标记通过纳米孔检测时由它们产生的不同信号的实例。检测到四个不同的信号强度(601、602、603和604)。这些可对应于四种不同标记。例如,呈递至纳米孔和/或通过掺入腺苷(a)而释放的标记可产生具有振幅601的信号。呈递至纳米孔和/或通过掺入胞嘧啶(c)而释放的标记可产生具有更高振幅603的信号;呈递至纳米孔和/或通过掺入鸟嘌呤(g)而释放的标记可产生具有甚至更高振幅604的信号;以及呈递至纳米孔和/或通过掺入胸腺嘧啶(t)而释放的标记可产生具有仍然更高振幅602的信号。图6也示出已从核苷酸释放和/或在核苷酸掺入事件之时呈递至纳米孔的标记分子的检测。本文所述的方法能够区分插入到纳米孔且随后被切割的标记(参见例如,图4,d)以及自由漂浮的未切割标记(参见例如,图4,f)。
本文提供的方法能够以至少约50%、至少约60%、至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约99%、至少约99.5%、至少约99.9%、至少约99.95%或至少约99.99%、或至少约99.999%、或至少约99.9999%的准确度区分释放的(或切割的)标记与未释放的(或未切割的)标记。
参考图6,电流的大小可通过标记减少任意适合的量,包括约5%、约10%、约15%、约20%、约25%、约30%、约40%、约50%、约60%、约70%、约80%、约90%、约95%或约99%。在一些实施方案中,电流的大小减少至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%或至少99%。在一些实施方案中,电流的大小减少至多5%、至多10%、至多15%、至多20%,至多25%、至多30%、至多40%、至多50%、至多60%、至多70%、至多80%、至多90%、至多95%或至多99%。
所述方法可还包括检测在掺入单个标记核苷酸之间的时间段(例如,图6的时间段605)。在掺入单个标记核苷酸之间的时间段可具有高的电流大小。在一些实施方案中,在核苷酸掺入事件之间流过纳米孔的电流大小为(例如,回到)最大电流的约50%、约60%、约70%、约80%、约90%、约95%或约99%(例如,当不存在标记时)。在一些实施方案中,在核苷酸掺入事件之间流过纳米孔的电流大小为最大电流的至少50%、至少60%、至少70%、至少80%、至少90%、至少95%或至少99%。在掺入单个标记核苷酸之间的时间段的期间检测和/或观察电流可在某些情况下改善测序准确度(例如,当成行对核酸的重复延伸片段诸如3个或以上的相同碱基测序时)。在核苷酸掺入事件之间的时间段可用作给出正测序的核酸分子或其区段的长度的时钟信号。
本文所述的方法能够区分掺入(例如,聚合)的标记核苷酸和非聚合的标记核苷酸(例如,图5中的506和505)。在一些实例中,掺入的标记核苷酸可以至少约50%、至少约60%、至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约99%、至少约99.5%、至少约99.9%、至少约99.95%或至少约99.99%、或至少约99.999%、或至少约99.9999%的准确度区分于未掺入的标记核苷酸。
标记与纳米孔之间的缔合
一方面,本文所述的方法和设备部分基于标记与纳米孔缔合和/或标记可通过纳米孔检测到的时间量(或时间比率)来区分掺入核酸分子的标记核苷酸和未掺入的标记核苷酸。在某些情况下,核苷酸与聚合酶之间的相互作用增加标记与纳米孔缔合和/或标记可通过纳米孔检测到的时间量。在一些情况下,所述标记与纳米孔相互作用和/或与纳米孔缔合。
标记插入纳米孔比从纳米孔去除可能相对容易。在某些情况下,标记进入纳米孔相较于所述标记离开纳米孔更快速和/或需要的力更小。一旦与纳米孔缔合,标记穿过纳米孔相较于所述标记从其进入纳米孔的方向离开纳米孔可更快速和/或需要的力更小。
标记与纳米孔之间的缔合可以是任意适合的力或相互作用,诸如非共价键、可逆的共价键、静电或电动力、或其任意组合。在一些情况下,标记被设计成与纳米孔相互作用,纳米孔突变成或被设计成与标记相互作用,或者标记和纳米孔均被设计或被选择成彼此形成缔合。
标记与纳米孔之间的缔合可以是任意适合的强度。在一些情况下,所述缔合足够强以使可在未从纳米孔逐出所述标记的情况下对电极再充电。在某些情况下,跨越纳米孔的电压极性可反转以对电极再充电并且再次反转以在标记未离开纳米孔的某些情况下检测到所述标记。
图19示出其中标记核苷酸1902的标记部分在与聚合酶相对的纳米孔1901侧上结合于和/或与亲合配偶体(例如,亲合分子)或结合配偶体1903相互作用的实例。亲合分子或结合配偶体1903可从纳米孔1901分离但连接于纳米孔或,作为替代方案,可以是纳米孔1901的部分。结合配偶体可附接于任意适合的表面诸如纳米孔或膜。在一些实例中,可以使用标记分子和结合配偶体的任意适合的组合。在某些情况下,标记分子和结合配偶体包含彼此杂交的核酸分子。在某些情况下,标记分子和结合配偶体包含彼此结合的链霉亲和素和生物素。作为替代方案,结合配偶体1903可以是纳米孔1901的部分。
图20示出其中标记核苷酸包含核苷酸部分2001和标记部分2002的实例,其中标记部分带倒刺毛。标记流过纳米孔2003比以其进入纳米孔的方向退出纳米孔更容易(例如,更快速和/或需要的力更小)以这样的方式使标记部分成形(例如,带倒刺毛)。在一个实施方案中,所述标记部分包含单链核酸并且碱基(例如,a、c、t、g)以指向标记核苷酸的核苷酸部分2001的角度连接于核酸标记的骨架(即,带倒刺毛)。作为替代方案,纳米孔可以包括瓣状物(flap)或允许标记部分沿着第一方向(例如,流出纳米孔)流动并阻止标记部分沿着第二方向(例如,与第二方向相反的方向)流动的其它障碍物(obstruction)。所述瓣状物可以是任意铰链障碍物。
所述标记可(例如,使用定向进化)被设计或被选择成与纳米孔结合和/或缔合(例如,于纳米孔的孔部分中)。在一些实施方案中,所述标记是具有结合于纳米孔的亲水性、疏水性、带正电荷和带负电荷氨基酸残基的排列的肽。在一些实施方案中,所述标记为具有结合于纳米孔的碱基的排列的核酸。
可使纳米孔突变以与标记分子缔合。例如,纳米孔可(例如,使用定向进化)被设计或选择成具有结合于标记分子的亲水性、疏水性、带正电荷和带负电荷氨基酸残基的排列。氨基酸残基可以于纳米孔的前庭(vestibule)和/或孔中。
从纳米孔逐出标记
本公开提供了从纳米孔逐出标记分子的方法。例如,芯片可在标记停留于纳米孔中或在核苷酸掺入事件之时例如在测序期间呈递至纳米孔的情况下适于逐出标记分子。所述标记可以其进入纳米孔的相反方向逐出(例如,在标记不通过纳米孔的情况下)—例如,所述标记可自第一开口指向纳米孔并且从纳米孔自不同于第一开口的第二开口逐出。可选地,所述标记可自其进入纳米孔的开口逐出—例如,所述标记可自第一开口指向纳米孔并且自第一开口从纳米孔逐出。
本发明的方面提供了用于对核酸样品测序的芯片,所述芯片包括多个可单独寻址的纳米孔、具有形成于膜中邻近集成电路布置的至少一个纳米孔的多个可单独寻址的纳米孔,每个可单独寻址的纳米孔适于从纳米孔逐出标记分子。在一些实施方案中,芯片适于以标记进入纳米孔的方向逐出(或所述方法逐出)标记。在一些情况下,纳米孔利用电压脉冲或一系列电压脉冲逐出标记分子。电压脉冲可具有约1纳秒至1分钟、或10纳秒至1秒的持续时间。
纳米孔可在一定时间段内适于逐出(或所述方法逐出)标记分子以使两个标记分子不同时存在于纳米孔中。在一些实施方案中,两个分子同时存在于纳米孔的概率为至多1%、至多0.5%、至多0.1%、至多0.05%或至多0.01%。
在某些情况下,纳米孔在标记进入纳米孔时的约0.1ms、0.5ms、1ms、5ms、10ms或50ms内(在小于约0.1ms、0.5ms、1ms、5ms、10ms或50ms的时间段内)适于逐出标记分子。
标记可使用电位(或电压)从纳米孔逐出。在一些情况下,电压可具有与将标记拉入纳米孔所使用的极性相反的极性。可借助于交流电(ac)波形施加电压,所述波形具有至少约1纳秒、10纳秒、100纳秒、500纳秒、1微秒、100微秒、1毫秒(ms)、5ms、10ms、20ms、30ms、40ms、50ms、100ms、200ms、300ms、400ms、500ms、600ms、700ms、800ms、900ms、1秒、2秒、3秒、4秒、5秒、6秒、7秒、8秒、9秒、10秒、100秒、200秒、300秒、400秒、500秒或1000秒的周期。
交流电(ac)波形
通过使核酸链通过纳米孔对核酸分子测序可需要施加直流电(例如,使得分子移动通过纳米孔的方向不逆转)。然而,使用直流电操作纳米孔传感器较长时间段可改变电极的组成,使跨越纳米孔的离子浓度失衡并且具有其它不需要的效应。施加交流电(ac)波形可避免这些不需要的效应并且具有如下所述的某些优点。利用标记核苷酸的本文所述的核酸测序方法完全与ac施加电压相容且因此用于实现所述优点。
当使用牺牲电极或在载流反应(例如,包含银的电极)中改变分子特征的电极、或在载流反应中改变分子特征的电极时,在检测周期期间对电极再充电的能力可以是有利的。电极可在检测周期期间耗尽,尽管在一些情况下电极可未在检测周期期间耗尽。再充电可阻止电极达到给定的耗尽限值,诸如变得完全耗尽,可当电极较小时(例如,当电极小至足以提供具有至少500个电极/平方毫米的电极的阵列时),这可能是一个问题。电极寿命在一些情况下按比例缩放并至少部分取决于电极的宽度。
在某些情况下,电极是多孔的和/或"海绵状"。相较于无孔电极,多孔电极可具有增强的双层至本体液体的电容。可通过在去垢剂存在下将金属(例如,贵金属)电镀于表面上而形成多孔电极。经电镀的金属可以是任意适合的金属。金属可以是贵金属(例如,钯、银、锇、铱、铂、银或金)。在一些情况下表面为金属表面(例如,钯、银、锇、铱、铂、银或金)。在一些情况下,表面的直径为约5微米并且光滑。去垢剂可在表面中产生纳米级胞间隙,使其多孔或"海绵状"。生产多孔和/或海绵状电极的另一方法是沉积金属氧化物(例如,氧化铂)并将其暴露于还原剂(例如,4%h2)。还原剂可将金属氧化物(例如,氧化铂)还原回到金属(例如,铂),并且通过这样做,提供海绵状和/或多孔电极。(例如,钯)海绵可吸收电解质并且产生较大的有效表面积(例如,33皮法拉/平方微米的电极的自上而下区域)。通过如本文所述使电极多孔来增加电极表面积,这可产生具有未变得完全耗尽的电容的电极。
在某些情况下,对使在检测期间跨越纳米孔的保守极性的电压差维持长时间段的需要(例如,当通过使核酸通过纳米孔对核酸测序时)耗尽电极并且可限制检测的持续时间和/或电极的大小。本文所述的设备和方法允许检测时间更长(例如,无限)和/或电极可按比例缩小至任意小的大小(例如,如通过除在检测期间电极耗尽之外的考虑所限制的)。如本文所述,可以检测标记与聚合酶缔合的仅仅一部分的时间。切换在检测期之间跨越纳米孔的电压的极性和/或大小(例如,施加ac波形)允许对电极再充电。在一些情况下,所述标记被检测到多次(例如,在100毫秒时间内2、3、4、5、6、7、8、9、10、20、30、40、50、100、1000、10,000、100,000、1,000,000或更多次)。
在某些情况下,跨越纳米孔的电压的极性定期逆转。电压的极性可在持续任意适合的时间量(例如,约1ms、约5ms、约10ms、约15ms、约20ms、约25ms、约30ms、约40ms、约50ms、约60ms、约80ms、约100ms、约125ms、约150ms、约200ms等)的检测期后逆转。在对电极再充电期间时间段和电场的强度(即,当电压的极性与用于标记检测的电压的极性相反时)使得电极在检测之前恢复至其状态(例如,电极质量)。跨越纳米孔的净电压在某些情况下为零(例如,在适当长的时标诸如1秒、1分钟或5分钟内正电压时间段减去负电压时间段)。在一些情况下,使施加至纳米孔的电压平衡以使存在通过邻近或接近纳米孔的传感电极检测的净零电流。
在一些实例中,将交流电(ac)波形施加至膜中的纳米孔或邻近膜的电极以将标记拉至通过或接近纳米孔以及释放标记。ac波形可具有约至少10微秒、1毫秒(ms)、5ms、10ms、20ms、100ms、200ms、300ms、400ms、500ms的频率。波形可有助于交替地且相继地捕获标记以及释放标记,或者以多个方向(例如,相对方向)移动标记,其可增加所述标记与纳米孔缔合的总时间段。充电和放电的这种平衡可允许从纳米孔电极和/或给定标记产生较长信号。
在一些实例中,施加ac波形以反复地将至少部分的与标记核苷酸(例如,掺入的标记核苷酸)缔合的标记引导入纳米孔以及将至少部分的标记引导出纳米孔。所述标记或与所述标记耦合的核苷酸可通过酶(例如,聚合酶)保持。这种重复性加载和逐出通过酶保持的单个标记可有利地提供更多的检测标记的机会。例如,如果所述标记通过酶保持40毫秒(ms)并且施加高的ac波形5ms(以将标记引导入纳米孔)以及施加低的ac波形5ms(以将标记引导出纳米孔),则纳米孔可用于读取所述标记约4次。多次读取可实现对误差(诸如与穿入和/或穿出纳米孔的标记相关的误差)的校正。
波形可具有任意适合的形状,包括规则形状(例如,在一定时间段内重复)和不规则形状(例如,在任意适当长时间段诸如1小时、1天或1周内不重复)。图21示出一些适合的(规则)波形。波形的实例包括三角波(图a)、正弦波(图b)、锯齿波、方波等。
诸如在施加交流电(ac)波形之时,跨越纳米孔的电压的极性的逆转(即,正到负或负到正)可以任何理由进行,包括但不限于(a)对电极再充电(例如,对金属电极的化学组成充电),(b)使在膜的顺侧和反侧上离子浓度再平衡,(c)重新建立跨越纳米孔的非零施加电压和/或(d)改变双层电容(例如,重新设置在金属电极和分析物界面处存在的电压或电荷至期望水平,例如零)。
图21c示出在跨越纳米孔的零电位差下的水平虚线,其中正电压与大小成比例地向上延伸并且负电压与大小成比例地向下延伸。不管波形的形状如何,"占空比"比较电压对时间图在正方向2100上曲线下的组合面积和在负方向2101上曲线下的组合面积。在一些情况下,正区2100等于负区2101(即,净占空比为零),然而ac波形可具有任意占空比。在某些情况下,具有最佳占空比的ac波形的公正使用可用于实现以下的任意一项或多项:(a)电极为电化学平衡的(例如,既未充电也未耗尽),(b)使膜的顺侧和反侧之间的离子浓度平衡,(c)跨越纳米孔施加的电压是已知的(例如,因为电极上的电容性双层定期重新设置并且电容器放电至与极性的每次翻转相同的程度),(d)标记分子于纳米孔中被识别多次(例如,通过用极性的每次翻转逐出以及重新捕获标记),(e)另外信息由标记分子的每次读取捕获(例如,因为所测量电流可以是每个标记分子的施加电压的不同函数),(f)实现高密度的纳米孔传感器(例如,因为金属电极组成不变化,所以不受组成电极的金属的量的限制),和/或(g)实现芯片的低功耗。这些益处可允许设备的连续延伸操作(例如,至少1小时、至少1天、至少1周)。
在一些情况下,在施加跨越纳米孔的正电位之时测量第一电流,并且在施加跨越纳米孔的负电位(例如,具有与正电位相等的绝对大小)之时测量第二电流。第一电流可等于第二电流,尽管在一些情况下第一电流和第二电流可以不同。例如,第一电流可小于第二电流。在某些情况下,仅测量正电流和负电流中的一个。
在一些情况下,纳米孔在较低电压下检测标记核苷酸持续相对长的时间段(例如,图21,指示2100)并且在较大电压下对电极再充电持续相对短的时间段(例如,图21,指示2101)。在一些情况下,检测时间段比用于电极再充电的时间段长至少2、至少3、至少4、至少5、至少6、至少8、至少10、至少15、至少20或至少50倍。
在某些情况下,响应于输入而改变波形。在一些情况下,输入是电极耗尽水平。在一些情况下,电压的极性和/或大小至少部分基于电极的耗尽或载流离子的耗尽是可变的并且波形不规则。
在短时间段内(例如,在小于约5秒、小于约1秒、小于约500ms、小于约100ms、小于约50ms、小于约10ms或小于约1ms内)反复地对电极检测并再充电的能力允许使用相较于可保持恒定直流电(dc)电位和直流电流且用于对穿过纳米孔的多核苷酸测序的电极小的电极。较小的电极可允许表面上高数量的检测位点(例如,包含电极、传感电路、纳米孔和聚合酶)。
所述表面包含任意适合密度的离散位点(例如,适用于在给定时间量内对核酸样品测序或用于给定成本的密度)。在一实施方案中,表面具有大于或等于约500个位点/1mm2的密度的离散位点。在一些实施方案中,表面具有约100、约200、约300、约400、约500、约600、约700、约800、约900、约1000、约2000、约3000、约4000、约5000、约6000、约7000、约8000、约9000、约10000、约20000、约40000、约60000、约80000、约100000或约500000个位点/1mm2的密度的离散位点。在一些实施方案中,表面具有至少约200、至少约300、至少约400、至少约500、至少约600、至少约700、至少约800、至少约900、至少约1000、至少约2000、至少约3000、至少约4000、至少约5000、至少约6000、至少约7000、至少约8000、至少约9000、至少约10000、至少约20000、至少约40000、至少约60000、至少约80000、至少约100000或至少约500000个位点/1mm2的密度的离散位点。
在核苷酸掺入事件之前、之间或期间、或之后可对电极再充电。在一些情况下,在约20毫秒(ms)、约40ms、约60ms、约80ms、约100ms、约120ms、约140ms、约160ms、约180ms或约200ms内对电极再充电。在一些情况下,在小于约20毫秒(ms)、小于约40ms、小于约60ms、小于约80ms、小于约100ms、小于约120ms、小于约140ms、小于约160ms、小于约180ms、约200ms,小于约500ms或小于约1秒内对电极再充电。
能够区分切割的标记和未切割的标记的芯片
另一方面提供了用于对核酸样品测序的芯片。在一实例中,芯片包括多个可单独寻址的纳米孔。多个可单独寻址的纳米孔可具有形成于膜中邻近集成电路布置的至少一个纳米孔。每个可单独寻址的纳米孔可适于确定标记分子是否结合于核苷酸或未结合于核苷酸或者以读取不同标记之间的变化。
在一些情况下,芯片可以包含多个可单独寻址的纳米孔。多个可单独寻址的纳米孔可具有有形成于膜中邻近集成电路布置的至少一个纳米孔。每个可单独寻址的纳米孔可适于确定标记分子是否结合于掺入的(例如,聚合的)核苷酸或未掺入的核苷酸。
本文所述的芯片能够区分释放的标记和未释放的标记(例如,图4中d对比f)。在一些实施方案中,芯片能够以至少约80%、至少约85%、至少约90%、至少约95%、至少约97%、至少约99%、至少约99.5%、至少约99.9%、至少约99.95%或至少约99.99%的准确度区分释放的标记和未释放的标记。当检测约5、4、3或2个连续核苷酸的组时可实现准确度水平。在一些情况下,对于单碱基分辨率(即,1个连续核苷酸)实现准确度。
本文所述的芯片能够区分掺入的标记核苷酸和未掺入的标记核苷酸(例如,图5中的506和505)。在一些实施方案中,芯片能够以至少约80%、至少约85%、至少约90%、至少约95%、至少约97%、至少约99%、至少约99.5%、至少约99.9%、至少约99.95%或至少约99.99%的准确度区分掺入的标记核苷酸和未掺入的标记核苷酸。当检测约5、4、3或2个连续核苷酸的组时可实现准确度水平。在一些情况下,对于单碱基分辨率(即,1个连续核苷酸)实现准确度。
纳米孔可有助于至少部分基于电信号差异来确定标记分子是否结合于核苷酸或未结合于核苷酸。在一些情况下,纳米孔可有助于至少部分基于纳米孔中的停留时间来确定标记分子是否结合于核苷酸或未结合于核苷酸。纳米孔可有助于至少部分基于脱离电压(fall-outvoltage)(其为标记或标记核苷酸离开纳米孔时的电压)确定标记分子是否结合或未结合于核苷酸。
能够捕获高比例的切割标记的芯片
另一方面提供了用于对核酸样品测序的芯片。在一实例中,芯片包括多个可单独寻址的纳米孔。多个可单独寻址的纳米孔可以包括形成于膜中邻近集成电路布置的至少一个纳米孔。每个可单独寻址的纳米孔可适于捕获在掺入(例如,聚合)标记核苷酸之时释放的大多数标记分子。
芯片可被配置成捕获任意适当高百分比的标记(例如,以便以适当高的准确度确定核酸序列)。在一些实施方案中,芯片捕获至少90%、至少99%、至少99.9%或至少99.99%的所述标记分子。
在一些实施方案中,纳米孔以单一电流水平捕获多个不同标记分子(例如,在掺入四个核苷酸之时释放的四个不同的标记分子)。芯片可适于以与释放标记分子的顺序相同的顺序捕获标记分子。
设备设置
图8示意性举例说明了可用于对核酸测序和/或检测如本文所述的标记分子的纳米孔设备100(或传感器)。含有脂质双层的纳米孔可由电阻和电容表征。纳米孔设备100包括在导电固体基板106的脂质双层相容的表面104上形成的脂质双层102,其中脂质双层相容的表面104可由脂质双层不相容的表面105隔离,并且导电固体基板106可由绝缘材料107电隔离,并且其中脂质双层102可由在脂质双层不相容的表面105上形成的无定形脂质103包围。脂质双层102可嵌有单个纳米孔结构108,所述纳米孔结构108具有大到足以使待表征的标记分子和/或在脂质双层102的两侧之间的小离子(例如,na 、k 、ca2 、cl-")通过的纳米孔110。可将水分子层114吸附到脂质双层相容的表面104上,并夹在脂质双层102与脂质双层相容的表面104之间。吸附到亲水性脂质双层相容的表面104上的水性薄膜114可促进脂质分子的有序化,并促进在脂质双层相容的表面104上形成脂质双层。可在脂质双层102上提供含有核酸分子112和标记核苷酸的溶液的样品室116。所述溶液可以是含有电解质的水溶液,并且可将其缓冲至最佳离子浓度并维持最佳ph以保持纳米孔110开放。所述设备包括一对电极118(包括负极118a和正极118b),其与可变电压源120耦合以用于提供跨越脂质双层的电刺激(例如,偏压)以及用于传感脂质双层的电特性(例如,电阻、电容和离子电流)。正极118b的表面是或形成脂质双层相容的表面104的一部分。导电固体基板106可耦合至或形成电极118之一的一部分。设备100也可以包括用于控制电刺激和用于处理所检测到的信号的电路122。在一些实施方案中,可变电压源120作为电路122的一部分包括在内。电路122可以包括放大器、积分器、噪音滤波器、反馈控制逻辑和/或各种其它组件。电路122可以是在硅基板128内集成的集成电路并且可还与耦合了存储器126的计算机处理器124耦合。
脂质双层相容的表面104可由适用于离子转导和气体形成以促进脂质双层形成的各种材料形成。在一些实施方案中,可使用导电或半导电亲水性材料,因为它们可允许更好地检测脂质双层电特性的变化。示例材料包括ag-agcl、au、pt或掺杂硅或其它半导体材料。在一些情况下,电极不是牺牲电极。
脂质双层不相容的表面105可由不适用于脂质双层形成的各种材料形成,并且它们通常为疏水性的。在一些实施方案中,优选不导电疏水性材料,因为其除了将脂质双层区域彼此分离之外,还使脂质双层区域电绝缘。示例脂质双层不相容的材料包括例如氮化硅(例如,si3n4)和特氟隆(teflon)、用疏水性分子硅烷化的氧化硅(例如,sio2)。
在一实例中,图8的纳米孔设备100为α溶血素(ahl)纳米孔设备,其具有嵌入二植烷酰基磷脂酰胆碱(dphpc)脂质双层102中的单个α溶血素(ahl)蛋白108,所述脂质双层在涂覆在铝材料106上的脂质双层相容的银(ag)表面104上形成。脂质双层相容的ag表面104由脂质双层不相容的氮化硅表面105隔离,并且铝材料106由氮化硅材料107电绝缘。铝106与集成于硅基板128中的电路122耦合。置于芯片上或从盖板128向下延伸的银-氯化银电极与含有核酸分子的水溶液接触。
ahl纳米孔是七个单独的肽的装配体。ahl纳米孔的入口或前庭的直径为约26埃,其宽度足以容纳dsdna分子的一部分。从前庭开始,ahl纳米孔首先变宽,然后变窄为具有约15埃的直径的桶(barrel),其宽度足以允许单个ssdna分子(或更小的标记分子)穿过但不足以使dsdna分子(或更大的标记分子)穿过。
除dphpc之外,纳米孔设备的脂质双层还可由不同的其它适合的两亲性材料装配,所述材料基于以下考虑来选择,诸如所用的纳米孔的类型、所表征的分子的类型和所形成的脂质双层的不同的物理、化学和/或电特性,诸如所形成的脂质双层的稳定性和渗透性、电阻和电容。示例两亲性材料包括各种磷脂,诸如棕榈酰基-油酰基-磷脂酰-胆碱(popc)和二油酰基-磷脂酰-甲酯(dopme)、二植烷酰基磷脂酰胆碱(dphpc)、1,2-二-o-植烷基-sn-甘油-3-磷酸胆碱(dophpc)、二棕榈酰基磷脂酰胆碱(dppc)、磷脂酰胆碱、磷脂酰乙醇胺、磷脂酰丝氨酸、磷脂酸、磷脂酰肌醇、磷脂酰甘油和鞘磷脂。
除上文所示的ahl纳米孔之外,纳米孔还可以具有各种其它类型的纳米孔。实例包括γ-溶血素、杀白细胞素、蜂毒肽、耻垢分枝杆菌(mycobacteriumsmegmatis)孔蛋白a(mspa)和各种其它天然存在的、天然修饰的和合成的纳米孔。可以基于分析物分子的不同特征来选择适合的纳米孔,诸如相较于纳米孔的孔径的分析物分子的大小。例如,ahl纳米孔具有约15埃的限制性孔径。
电流测量
在一些情况下,电流可在不同施加电压下测量。为了实现这一目的,可将期望电位施加至电极,并且所施加的电位随后可在整个测量中保持。在一个实现方法中,运算放大器积分器拓扑可用于此目的,如下所述。积分器通过借助于电容反馈在电极保持电压电位。积分器电路可提供突出的线性、单元间的匹配和偏移特性。运算放大器积分器通常需要大的尺寸以便实现所需性能。下面描述更紧凑的积分器拓扑。
在一些情况下,可将电压电位"vliquid"施加至为芯片上的所有单元提供通用电位(例如,350mv)的室。积分器电路可使电极(其在电学上为积分电容器的顶板)初始化至电位大于通用液电位。例如,在450mv加偏压可在电极与液体之间给出正100mv电位。此正电压电位可使电流从电极流至液体室接触件。在此情况下,载体为:(a)从双层的电极(反)侧流过孔至双层的贮液器(顺)侧的k 离子和(b)在反侧上根据下列电化学反应与银电极反应的氯(cl-)离子:ag cl-→agcl e-。
在一些情况下,k 从封闭单元流出(从双层的反侧至顺侧),同时cl-被转化成氯化银。作为电流的结果,双层的电极侧可变得淡化。在一些情况下,银/氯化银液体海绵状材料或基质可用作储库以在逆反应中供应cl-离子,其在电气室接触件处出现以完成电路。
在一些情况下,电子最终流到积分电容器的顶侧上,其产生电流,所述电流被测量。电化学反应将银转化为氯化银并且电流将继续流动,前提是存在可用的待转化的银。在一些情况下,银的有限供应导致电流依赖性电极寿命。在一些实施方案中,使用未耗尽的电极材料(例如,铂)。
当将恒定电位施加至纳米孔检测器时,标记可通过纳米孔调节离子电流,允许电流记录以确定标记的身份。然而,恒定电位可能不足以区分不同标记(例如,与a、c、t或g缔合的标记)。一方面,施加电压可以变化(例如,在电压范围内扫频)以识别所述标记(例如,以至少90%、至少95%、至少99%、至少99.9%或至少99.99%的置信度)。
施加电压可以以任意适合的方式(包括根据图21中所示的任意波形)变化。电压可以在任意适合的范围变化,包括从约120mv至约150mv、约40mv至约150mv。
图22示出核苷酸腺嘌呤(a,绿色)、胞嘧啶(c,蓝色)、鸟嘌呤(g,黑色)和胸腺嘧啶(t,红色)的所提取信号(例如,差示对数电导(dlc))对比施加电压。图23示出针对多个核苷酸的相同信息(很多实验性试验)。如此处观察到,在120mv下胞嘧啶相对容易与胸腺嘧啶区分,但是在150mv下难以彼此区分(例如,因为在150mv下对于c和t,所提取信号大约相等)。此外,在120mv下胸腺嘧啶难以与腺嘌呤区分,但在150mv下相对容易区分。因此,在一实施方案中,施加电压可以从120mv变化至150mv以区分核苷酸a、c、g和t中的每一个。
图24示出核苷酸腺嘌呤(a,绿色)、胞嘧啶(c,蓝色)、鸟嘌呤(g,黑色)和胸腺嘧啶(t,红色)作为施加电压函数的参考导电位差百分比(rcd%)。绘图rcd%(其基本上为每个分子的电导相较于30t参考分子的差值)可去除偏移并且增加在实验之间的变化。图24包括来自17/20试验的第一区块的单个dna波形。对于所有17个良好的试验,所有单个核苷酸dna的rcd%从数字50捕获至200。指示可区分每个核苷酸的电压。
尽管图22-24示出核苷酸对变化的施加电压的响应,但是变化的施加电压的概念可用于区分标记分子(例如,附接于标记核苷酸)。
单元电路
单元电路的实例示于图12中。将施加电压va施加至在mosfet电流传送器门1201之前的运算放大器1200。在此也显示电极1202和通过设备1203检测的核酸和/或标记的电阻。
施加电压va可以驱动电流传送器门1201。电极上产生的电压然后为va-vt,其中vt是mosfet的阈值电压。在某些情况下,这导致有限控制施加至电极的实际电压,因为mosfet阈值电压可随工艺、电压、温度和甚至在芯片内的设备之间变化相当大。这种vt变化可在低电流水平时较大,其中亚阈值漏电效应可开始起作用。因此,为了提供对施加电压的更好控制,运算放大器可用于具有电流传送器设备的跟随器反馈配置。这确保施加至电极的电压为va,与mosfet阈值电压的变化无关。
单元电路的另一实例示于图10中并且包括积分器、比较器、和移入控制位以及同时将状态从比较器输出移出的数字逻辑。单元电路可适于与本文提供的系统和方法一起使用。b0至b1链路可从移位寄存器产生。模拟信号由群组内的所有单元共享,而数字链路可以在单元间菊花链式连接(daisy-chained)。
单元数字逻辑包含5位数据移位寄存器(dsr)、5位并行加载寄存器(plr)、控制逻辑和模拟积分器电路。使用lin信号,移位入dsr的控制数据被并行加载到plr中。这些5位控制数字"先断后通(break-before-make)"时序逻辑,其控制单元中的切换。此外,数字逻辑具有置位-复位(sr)锁存器以记录比较器输出的切换。
架构递送与单个单元电流成比例的可变采样率。较高电流每秒可产生的样品多于较低电流。电流测量的分辨率与所测量的电流有关。与大电流相比,小电流可以较佳分辨率被测量,这相较于固定分辨率测量系统可能是益处。模拟输入允许用户通过改变积分器的电压摆幅来调节采样率。可能为了分析生物学快速过程而增加采样率或为了分析生物学缓慢过程而降低采样率(且由此增加精密度)。
积分器的输出被初始化至电压lvb(低电压偏移)并且积分至电压cmp。每当积分器输出在这两个水平之间摇摆便产生样品。由此,电流越大则积分器输出摆幅越快,且因此采样率越快。类似地,如果cmp电压减少,则产生新样品所需的积分器的输出摆幅减小,且因此采样率增加。因此,仅仅降低lvb至cmp的电压差就提供了增加采样率的机制
基于纳米孔的测序芯片可掺入大量自主操作的或可单独寻址的单元,它们被配置成阵列。例如,1百万个单元的阵列可由1000行单元×1000列单元构建。例如当在核苷酸掺入事件之时释放的标记通过纳米孔检测时,该阵列通过测量电导差值实现对核酸分子的平行测序。此外,这种电路实现方法允许确定孔-分子复合物的电导特征,从而确定哪个在区分标记方面可能有价值。
集成的纳米孔/双层电子单元结构可施加适当的电压以进行电流测量。例如,以下两者可能是必要的:(a)控制电极电压电位和(b)监测电极电流同时以便正确进行。
此外,可能有必要控制彼此独立的单元。为了管理可能呈不同物理状态的大量单元可能需要对单元的独立控制。对施加至电极的分段线性电压波形刺激的精确控制可用于单元的物理状态之间的转换。
为了降低电路大小和复杂性,可能足以提供逻辑以施加两个分立电压。这允许单元的两个独立分组以及施加相应的状态转换刺激。在相对低的发生概率下状态转换本质上是随机的。因此,能够维持适当的控制电压并且随后进行测量以确定期望状态转换是否已发生,这可能是高度有用的。例如可将适当的电压施加至单元,然后测量电流以确定双层是否已形成。单元被分成两组:(a)已有双层形式且不再需要施加电压的单元。这些单元可能被施加0v偏压以便产生空操作(nop)-其保持相同的状态,以及(b)未形成双层的单元。这些单元将再次被施加双层形成电压。
实质的简化和电路大小减少可通过将容许施加电压限制为2并且反复地将成批单元在物理状态之间转换来实现。例如,减少至少1.1、2、3、4、5、6、7、8、9、10、20、30、40、50或100倍可通过限制容许施加电压来实现。
使用紧凑型测量电路的本发明的另一实现方法示于图11中。在某些情况下,紧凑型测量电路可用于实现本文所述的高阵列密度。该电路也被设计成将电压施加至电极,同时测量低水平电流。
单元作为超紧凑型积分器(uci)操作并且在此描述基本操作。通过electrod-sense(elsns)连接将单元电连接至电化学活性电极(例如,agcl)。nmos晶体管m11执行两种独立功能:(1)作为源极跟随器操作以将电压施加至由(vg1-vt1)给出的elsns节点,以及(2)作为电流传送器操作以将电子从电容器c1移动至elsns节点(反之亦然)。
在某些情况下,可将控制电压电位施加至elsns电极并且这可仅仅通过改变电极源极跟随器m11的门上的电压而变化。此外,来自m11源极引脚的任意电流直接地且准确地传播到m11漏极引脚,其可在该漏极引脚中积聚在电容器c0上。因此m11和c0作为超紧凑型积分器一起作用。该积分器可用于通过测量集成在电容器上的电压的变化根据下式来确定流出至电极的电流和从电极流入的电流:i*t=c*v,其中i为电流,t为时间,c为电容且v为电压变化。
在一些情况下,在固定间隔t(例如,每1ms)测量电压变化。
晶体管m2可作为源极跟随器配置以便缓冲电容器电压并且提供集成电压的低阻抗表示。这阻止电荷共享改变电容器上的电压。
晶体管m3可用作行访问设备,其中模拟电压输出aout以与许多其它单元共享的列形式连接。仅实现单行的列连接的aout信号以使单个单元的电压得以测量。
在替代实现方法中,可通过将晶体管m2的漏极连接至行可选择的"切换轨道(switchedrail)"而省略晶体管m3。
可使用晶体管m4使单元复位至预定的起始电压,从所述起始电压进行电压集成。例如将高电压(如:至vdd=1.8v)施加至rst和rv两者则会将电容器拉起至预充电的(vdd-vt5)值。由于复位切换热噪音(sqrt(ktc)噪音),精确的起始值可在单元间以及测量之间变化(由于m4和m2的vt变化)。因此,相关双采样(cds)技术用于测量积分器起始电压和终止电压以确定在积分期期间的实际电压变化。
也注意到,晶体管m4的漏极可连接于控制电压rv(复位电压)。在正常操作中,这可被驱动至vdd,然而其也可以被驱动至低电压。如果m4的"漏极"实际上被驱动至接地,那么电流可反转(即,电流可通过m1和m4从电极流入电路并且源极和漏极的概念可被调换)。在一些情况下,当以该模式操作电路时,施加至电极(相对于液体参照)的负电压由该rv电压控制(假定vg1和vg5为至少大于rv的阈值)。因此,rv上的接地电压可用于将负电压施加至电极(例如以完成电穿孔或双层形成)。
模数转换器(adc,未示出)在复位后即刻以及在积分期(进行cds测量)后再次测量aout电压以确定在固定时间段期间集成的电流。且adc可根据每列或用于每列的分立晶体管作为模拟复用器来实现以在多列之间共享单个adc。该列复用器因子可根据噪音、准确度和通量的需求而变化。
在任意给定时间内,每个单元可以呈四种不同的物理状态之一:(1)短路至液体(2)双层形成(3)双层 孔(4)双层 孔 核酸和/或标记分子。
在某些情况下,施加电压以使单元在状态之间移动。使用nop操作以使单元留在特定的期望状态,而其它单元用施加电位刺激以从一个状态移至另一状态。
这可通过具有可被施加至m1源极跟随器的门电压的两种(或更多种)不同的电压来完成,所述源极跟随器可间接用于控制相对于液电位的施加至电极的电压。因此,晶体管m5用于施加电压a,而晶体管m6用于施加电压b。因此,m5和m6一起作为模拟复用器操作,其中sela或selb被驱动得很高以选择电压。
由于每个单元可以呈可能的不同状态并且因为sela和selb是补充的,所以可在每个单元中使用存储器元件以在电压a或b之间选择。该存储器元件可以是在每个周期刷新的动态元件(电容器)或简单的伪-锁存(cheater-latch)存储器元件(交叉耦合的反相器)。
运算放大器测试芯片结构
在一些实例中,测试芯片包括以四个分立组(也称为群组)排列的264个传感器的阵列,每个分立组各66个传感器单元。反过来,每组分成三"列",每列中有22个传感器"单元"。"单元"名称是适当的,因为,理想而言,由双脂质层和插入的纳米孔组成的虚拟单元在阵列中264个传感器的每一个上方形成(尽管设备可成功地仅用如此密集的传感器单元的一部分操作)。
存在单个模拟i/o垫,其将电压电位施加至在被安装至模片表面的导电圆筒内含有的液体。该"液体"电位被施加至孔的顶侧并且对于检测器阵列中的所有单元是常见的。孔的底侧具有暴露的电极并且每个传感器单元可施加不同的底侧电位至其电极。然后测量在顶部液体连接和在孔的底侧上每个单元的电极连接之间的电流。传感器单元测量由在孔内通过的标记分子调节的行进通过孔的电流。
在一些情况下,五位控制每个传感器单元的模式。继续参考图9,阵列中264个单元的每一个可被单独控制。将值分别施加至66个单元的组。组中66个单元的每一个的模式通过将330(66*5位/单元)个数值连续移位于datashiftregister(dsr)中来控制。使用kin(时钟)和din((datin))引脚将这些值移位入阵列,其中对于66个单元的每个组有一个分立引脚对。
因此,330个时钟用于将330位移位入dsr移位寄存器中。当相应的lin<i>(加载输入)被断言为高时,从该移位寄存器并行加载第二330位并行加载寄存器(plr)。当并行加载plr时,同时将单元的状态值加载到dsr中。
完整操作可由330个时钟组成以将330数据位移位入dsr,单个时钟周期(lin信号被断言为高),随后330个时钟周期以读取所捕获的从dsr移位出的状态数据。将操作流水线化以使新330位可被移位入dsr,同时330位从阵列读出。因此在50mhz时钟频率下,用于读取的周期时间为331/50mhz=6.62us。
用于测序的纳米孔的阵列
本公开提供了用于对核酸测序的纳米孔检测器(或传感器)的阵列。参考图7,可在纳米孔检测器的阵列上对多个核酸分子测序。在此,每个纳米孔位置(例如,701)包含纳米孔,在一些情况下附接于聚合酶和/或磷酸酶。一般也存在在本文其它地方描述的每个阵列位置处的传感器。
在一些实例中,提供了附接于核酸聚合酶的纳米孔的阵列,并且用聚合酶掺入标记核苷酸。在聚合期间,通过纳米孔(例如,通过释放并通入或通过纳米孔,或通过呈递至纳米孔)检测到标记。纳米孔的阵列可具有任意适合数量的纳米孔。在某些情况下,阵列包含约200、约400、约600、约800、约1000、约1500、约2000、约3000、约4000、约5000、约10000、约15000、约20000、约40000、约60000、约80000、约100000、约200000、约400000、约600000、约800000、约1000000个等的纳米孔。在某些情况下,阵列包含至少200、至少400、至少600、至少800、至少1000、至少1500、至少2000、至少3000、至少4000、至少5000、至少10000、至少15000、至少20000、至少40000、至少60000、至少80000、至少100000、至少200000、至少400000、至少600000、至少800000或至少1000000个纳米孔。
在一些情况下,单个标记在掺入单个核苷酸之时释放和/或呈递并且通过纳米孔检测。在其它情况下,多个标记在掺入多个核苷酸之时释放和/或呈递。邻近纳米孔的纳米孔传感器可以检测单个标记或多个标记。与多个标记缔合的一个或多个信号可被检测到并处理以获得平均信号。
标记可通过传感器随时间检测。随时间检测的标记可用于确定核酸样品的核酸序列,诸如借助于被编程为记录传感器数据并从数据产生序列信息的计算机系统(参见例如,图16)。
纳米孔检测器的阵列可具有高密度的离散位点。例如,相对大数量的位点/单位面积(即,密度)允许构建更小的设备,其为便携式的、低成本的、或具有其它有利特征。阵列中的单个位点可以是可单独寻址的位点。包含纳米孔和传感电路的大量位点可允许相对大数量的核酸分子一次被测序,诸如,例如通过平行测序。此类系统可增加通量和/或减少对核酸样品测序的成本。
核酸样品可使用具有基板(其表面包含离散位点)的传感器(或检测器)进行测序,每个单独位点具有纳米孔、聚合酶并且在一些情况下具有附接于纳米孔的至少一种磷酸酶和邻近纳米孔的传感电路。所述系统还可以包含与基板流体连通的流动池,所述流动池适于递送一种或多种试剂至基板。
表面包含任意适合密度的离散位点(例如,适用于以给定时间量或适用于给定成本对核酸样品测序的密度)。每个离散位点可以包括传感器。表面可具有大于或等于约500个位点/1mm2的密度的离散位点。在一些实施方案中,表面具有约200、约300、约400、约500、约600、约700、约800、约900、约1000、约2000、约3000、约4000、约5000、约6000、约7000、约8000、约9000、约10000、约20000、约40000、约60000、约80000、约100000或约500000个位点/1mm2的密度的离散位点。在一些情况下,表面具有至少200、至少300、至少400、至少500、至少600、至少700、至少800、至少900、至少1000、至少2000、至少3000、至少4000、至少5000、至少6000、至少7000、至少8000、至少9000、至少10000、至少20000、至少40000、至少60000、至少80000、至少100000或至少500000个位点/1mm2的密度的离散位点。
标记核苷酸
在一些情况下,标记核苷酸包含能够在核苷酸掺入事件中切割且借助于纳米孔检测到的标记。标记可附接于核苷酸的5'-磷酸。在某些情况下,标记不是荧光团。标记通过其电荷、形状、大小或其任意组合是可检测到的。标记的实例包括各种聚合物。每个类型的核苷酸(即,a、c、g、t)一般包含唯一标记。
标记可位于核苷酸上的任意适合的位置处。图13提供了标记核苷酸的实例。在此,虽然r1一般为oh且r2为h(即,对于dna)或oh(即,对于rna),但是其它修饰也是可接受的。在图13中,x是任意适合的接头。在一些情况下,接头是可切割的。接头的实例包括但不限于o、nh、s或ch2。位置z的适合的化学基团的实例包括o、s或bh3。所述碱基是适用于掺入核酸(包括腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶、尿嘧啶或其衍生物)的任意碱基。在一些情况下通用碱基也是可接受的。
磷酸的数量(n)是任意适合的整数值(例如,许多磷酸使得核苷酸可掺入核酸分子中)。在某些情况下,所有类型的标记核苷酸具有相同数量的磷酸,但这是非必需的。在一些应用中,对于每个类型的核苷酸有不同标记并且磷酸的数量不一定用于区分各种标记。然而,在一些情况下,一种以上类型的核苷酸(例如,a、c、t、g或u)具有相同标记分子并且区分一个核苷酸与另一个核苷酸的能力至少部分通过磷酸的数目来确定(其中对于n,各种类型的核苷酸具有不同值)。在一些实施方案中,n的值为1、2、3、4、5、6、7、8、9、10或更大。
适合的标记在下面描述。在某些情况下,标记的电荷符号相较于化合物的其余部分上的电荷符号是相反的。当标记被附接时,整个化合物上的电荷可以是中性的。标记的释放可产生两个分子:带电荷的标记和带电荷的核苷酸。带电荷的标记通过纳米孔并在一些情况下被检测到。
更多的适合的标记核苷酸的实例示于图14中。标记可附接于糖分子、碱基分子、或其任意组合。参考图13,y是标记且x是接头(在一些情况下是可切割的)。此外,r1(如果存在)一般为oh、-och2n3或-o-2-硝基苄基,且r2(如果存在)一般为h。另外,z一般为o、s或bh3,且n为包括1、2、3或4的任意整数。在一些情况下,a为o、s、ch2、chf、cff或nh。
继续参考图14,每个dnpp类似物上的碱基类型一般不同于其它三种dnpp类似物中的每种上的碱基类型并且每种dnpp类似物上的标记类型一般不同于其它三种dnpp类似物中的每种上的标记类型。适合的碱基包括但不限于腺嘌呤、鸟嘌呤、胞嘧啶、尿嘧啶或胸腺嘧啶、或其每种的衍生物。在一些情况下,所述碱基为7-脱氮鸟嘌呤、7-脱氮腺嘌呤或5-甲基胞嘧啶中的一种。
在r1为-o-ch2n3的情况下,所述方法可还包括处理掺入的dnpp类似物以去除-ch2n3以及产生附接于3'位置的oh基团,从而允许掺入另一种dnpp类似物。
在r1为-o-2-硝基苄基的情况下,所述方法可还包括处理掺入的核苷酸类似物以去除-2-硝基苄基以及产生附接于3'位置的oh基团,从而允许掺入另一种dnpp类似物。
标记的实例
标记可以是能够于纳米孔中检测到的任意化学基团或分子。在一些情况下,标记包含以下的一种或多种:乙二醇、氨基酸、碳水化合物、肽、染料、化学发光化合物、单核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸、六核苷酸、脂族酸、芳族酸、醇、硫醇基、氰基、硝基、烷基、烯基、炔基、叠氮基或其组合。
也应设想,标记还包含适当数量的赖氨酸或精氨酸以平衡化合物中磷酸的数量。
在一些情况下,所述标记为聚合物。聚乙二醇(peg)是聚合物的实例并且具有如下结构:
可以使用任意数量的乙二醇单元(w)。在某些情况下,w是0至100的整数。在一些情况下,乙二醇单元的数量对于每个类型的核苷酸是不同的。在一实施方案中,四个类型的核苷酸包含具有16、20、24或36个乙二醇单元的标记。在一些情况下,所述标记还包含另外的可识别部分,诸如基于香豆素的染料。在一些情况下,聚合物是带电荷的。在某些情况下,聚合物不带电荷并且标记于高浓度的盐(例如,3-4m)中检测到。
如本文所使用,术语"烷基"包括具有指定数量的碳原子且可以为未经取代的或取代的支链和直链饱和脂族烃基。如本文所使用,"烯基"是指含有至少1个碳碳双键的直链或支链非芳族烃基,并且可存在至多最大可能数量的非芳族碳-碳双键,且可以为未经取代的或取代的。术语"炔基"是指含有至少1个碳碳三键的烃基直链或支链,并且可存在至多最大可能数量的非芳族碳-碳三键,并且可以为未经取代的或取代的。术语"取代的"是指如上所述的官能团诸如烷基或烃基,在与其中含有的氢原子的至少一个键被与非氢或非碳原子的键替代,前提是维持正常价态并且所述取代产生稳定的化合物。取代的基团也包括其中与碳或氢原子的一个或多个键被与杂原子的一个或多个键(包括双键或三键)替代的基团。
在一些情况下,标记仅能够以一个方向(例如,在不反转方向的情况下)通过纳米孔。标记可具有附接于所述标记的铰链门,所述标记足够薄以当所述门与标记在一个方向上、而非另一方向对齐时穿过纳米孔。参考图31,本公开提供了标记分子,其包含含有第一区段3110和第二区段3115的第一聚合物链3105,其中第二区段比第一区段窄。第二区段可具有小于纳米孔的最窄开口的宽度。所述标记分子可以包括包含两个末端的第二聚合物链3120,其中第一末端固定于邻近第二区段的第一聚合物链并且第二末端未固定于第一聚合物链。标记分子能够以第一方向穿过纳米孔,其中第二聚合物链邻近第二区段3125对齐。在一些情况下,标记分子不能够以第二聚合物链未邻近第二区段3130对齐的第二方向穿过纳米孔。第二方向可以与第一方向相反。
第一和/或第二聚合物链可以包含核苷酸。在一些情况下,当第二聚合物链未邻近第二区段对齐时,第二聚合物链与第一聚合物链碱基配对。在某些情况下,第一聚合物链固定于核苷酸3135(例如,固定于核苷酸的末端磷酸)。当核苷酸掺入生长中的核酸链时,第一聚合物链可从核苷酸释放。
第二区段可以包含足够薄以当与所述门(第二聚合物)对齐时穿过纳米孔的任意聚合物或其它分子。例如,第二区段可以包含脱碱基核苷酸(即,不具有任意核酸碱基的核酸链)或碳链。
本公开也提供了借助于膜中邻近传感电极的纳米孔对核酸样品测序的方法。参考图32,所述方法可以包括向包含纳米孔的反应室提供标记核苷酸3205,其中标记核苷酸的单个标记核苷酸含有与核苷酸耦合的标记,其中所述标记借助于纳米孔是可检测到的。所述标记包含含有第一区段和第二区段(其中第二区段比第一区段窄)的第一聚合物链、和含有两个末端的第二聚合物链,其中第一末端固定于邻近第二区段的第一聚合物链并且第二末端未固定于第一聚合物链。标记分子能够以第一方向3210穿过纳米孔,其中第二聚合物链邻近第二区段对齐。
所述方法包括借助于聚合酶3215进行聚合反应,从而将标记核苷酸的单个标记核苷酸掺入与来自核酸样品的单链核酸分子3225互补的生长链3220。所述方法可以包括借助于纳米孔3230在掺入所述单个标记核苷酸期间检测与单个标记核苷酸缔合的标记,其中当核苷酸与聚合酶缔合时借助于纳米孔检测到标记。
在一些情况下,所述标记分子不能够以第二聚合物链未邻近所述第二区段对齐的第二方向穿过纳米孔。
所述标记当与聚合酶缔合时可被检测到多次。在一些实施方案中,在标记检测期之间对电极再充电。在一些情况下,标记在掺入单个标记核苷酸期间穿入纳米孔并且当对电极再充电时标记不从纳米孔穿出。
用于附接标记的方法
可以使用任意适合的用于附接标记的方法。在一实例中,标记可通过以下附接于末端磷酸:(a)使核苷三磷酸与二环己基碳化二亚胺/二甲基甲酰胺在允许生成环状三偏磷酸盐的条件下接触;(b)使由步骤a)得到的产物与亲核试剂接触以形成-oh或-nh2官能化化合物;以及(c)使步骤b)的产物与具有与其附接的-cor基团的标记在允许标记间接结合于末端磷酸的条件下反应,从而形成核苷三磷酸类似物。
在一些情况下,亲核试剂是h2n-r-oh、h2n-r-nh2、r's-r-oh、r's-r-nh2,或
在某些情况下,所述方法包括,在步骤b)中,使由步骤a)得到的产物与具有以下结构的化合物接触:
且随后或同时使所述产物与nh4oh接触以形成具有以下结构的化合物:
步骤b)的产物然后可与具有与其附接的-cor基团的标记在允许标记间接结合于末端磷酸的条件下反应,从而形成具有以下结构的核苷三磷酸类似物:
其中r1为oh,其中r2为h或oh,其中所述碱基为腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶、尿嘧啶、7-脱氮嘌呤或5-甲基嘧啶。
标记的释放
标记可以任意方式释放。标记可在具有标记的核苷酸掺入生长中的核酸链期间或之后释放。在一些情况下,所述标记附接于多磷酸盐(例如,图13)并且将核苷酸掺入核酸分子导致具有与其附接的标记的多磷酸的释放。掺入可由至少一种聚合酶催化,所述聚合酶可附接于纳米孔。在某些情况下,至少一种磷酸酶也附接于孔。磷酸酶可从多磷酸切割标记以释放标记。在一些情况下,磷酸酶被定位使得通过聚合酶在聚合酶反应中生成的焦磷酸在进入孔之前与磷酸酶相互作用。
在一些情况下,标记未附接于多磷酸(参见例如,图14)。在这些情况下,标记通过接头(x)附接,所述接头是可切割的。用于生成可切割封端和/或可切割连接的核苷酸类似物的方法于美国专利no.6,664,079中公开,其以引用方式整体并入本文。接头不一定是可切割的。
接头可以是任意适合的接头并且可以任意适合的方式切割。接头可以是可光切割的。在一实施方案中,使用uv光通过光化学切割法切割可光化学切割的接头和部分。在一实施方案中,可光切割的接头为2-硝基苄基部分。
-ch2n3基团可用tcep(三(2-羧乙基)膦)处理以使其从dnpp类似物、或rnpp类似物的3'o原子去除,从而产生3'oh基团。
标记的检测
在某些情况下,聚合酶从包含多个不同碱基(例如,a、c、g、t和/或u)的标记核苷酸的汇集物拉出。也有可能反复地将聚合酶与各种类型的标记碱基接触。在这种情况下,每个类型的核苷酸可能不一定具有唯一碱基,但是在一些情况下,不同碱基类型之间的循环给工艺增加成本和复杂性,不过本发明涵盖这种实施方案。
图15示出将标记核苷酸掺入核酸分子(例如,使用聚合酶以延伸与模板碱基配对的引物)可以释放在一些实施方案中可检测到的标记-多磷酸。在一些情况下,当标记-多磷酸通过纳米孔时检测到标记-多磷酸。在一些实施方案中,当标记-多磷酸停留于纳米孔时检测到标记-多磷酸。
在一些情况下,所述方法基于组成多磷酸的磷酸的数量来区分核苷酸(例如,甚至当标记(tag)相同时)。然而,每种类型的核苷酸一般具有唯一标记。
参考图15,标记-多磷酸化合物可以在标记通入和/或通过纳米孔以及测量离子电流之前用磷酸酶(例如,碱性磷酸酶)处理。
标记可以在它们从核苷酸释放后流过纳米孔。在某些情况下,施加电压以牵拉标记通过纳米孔。至少约85%、至少90%、至少95%、至少99%、至少99.9或至少99.99%的所释放标记可移位通过纳米孔。
在某些情况下,标记停留于纳米孔中达一定时间段,在纳米孔中它们被检测到。在某些情况下,施加电压以将标记拉入纳米孔,检测标记,从纳米孔逐出标记、或其任意组合。标记可在核苷酸掺入事件之时被释放或保持结合于核苷酸。
标记可在纳米孔中被检测到,(至少部分)是因为其电荷。在某些情况下,标记化合物是可选地带电荷的化合物,其具有第一净电荷以及在化学、物理或生物反应后具有不同的第二净电荷。在一些情况下,标记上的电荷的大小与化合物的其余部分上的电荷的大小相等。在一实施方案中,标记具有正电荷并且去除所述标记将改变化合物的电荷。
在一些情况下,当标记通入和/或通过纳米孔时,其可产生电子变化。在一些情况下,电子变化为电流大小的变化、纳米孔电导的变化、或其任意组合。
纳米孔可以是生物的或合成的。也设想,所述孔是蛋白,例如其中所述孔是α溶血素蛋白。合成的纳米孔的实例为固态孔或石墨烯。
在一些情况下,聚合酶和/或磷酸酶附接于纳米孔。融合蛋白或二硫化物交联是用于附接蛋白纳米孔的方法的实例。在固态纳米孔的情况下,与紧邻纳米孔的表面的附接可以是经由生物素-链霉亲和素键联。在一实例中,dna聚合酶经由用氨基官能化的利用烷硫醇自装配的单层修饰的金表面附接于固体表面,其中将氨基修饰成nhs酯用于与dna聚合酶上的氨基附接。
所述方法可以在任意适合的温度下进行。在一些实施方案中,温度在4℃和10℃之间。在一些实施方案中,温度为室温。
所述方法可在任意适合的溶液和/或缓冲液中进行。在某些情况下,缓冲液是用20mmhepes缓冲至ph7.0至8.0的300mmkcl。在一些实施方案中,缓冲液不包含二价阳离子。在一些情况下,所述方法未受存在二价阳离子的影响。
对核酸样品测序的计算机系统
本公开的核酸测序系统和方法可以借助于计算机系统来调控。图16示出包括与核酸测序系统1602耦合的计算机系统1601的系统1600。计算机系统1601可以是服务器或多个服务器。计算机系统1601可被编程为调控样品制备和加工,以及通过测序系统1602的核酸测序。测序系统1602可以是基于纳米孔的测序仪(或检测器),如在本文其它地方所述。
计算机系统可被编程为实现本发明的方法。计算机系统1601包括中央处理单元(cpu,在本文也称为"处理器")1605,其可以是单核或多核处理器、或用于并行处理的多个处理器。计算机系统1601也包括存储器1610(例如,随机存取存储器、只读存储器、闪存)、电子存储单元1615(例如,硬盘)、用于与一个或多个其它系统通信的通信接口1620(例如,网络适配器)、和外周设备1625,诸如高速缓冲存储器(cache)、其它存储器、数据储存器和/或电子显示适配器。存储器1610、储存单元1615、接口1620和外周设备1625通过通信总线(实线)诸如主板与cpu1605通信。储存单元1615可以是用于储存数据的数据储存单元(或数据储存库)。计算机系统1601可以借助于通信接口1620可操作地与计算机网络("网络")耦合。网络可以是因特网(internet)、内联网(internet)和/或外联网(extranet)、或与因特网通信的局域网(intranet)和/或外联网(extranet)。网络可以包括一个或多个计算机服务器,其可实现分布式计算。
本发明的方法可通过在计算机系统1601的电子储存位置,诸如,例如在存储器1610或电子储存单元1615上存储的机器(或计算机处理器)可执行代码(或软件)实现。在使用期间,代码可由处理器1605执行。在一些情况下,代码可由储存单元1615检索并且通过处理器1605存储在存储器1610上用于快速存取。在一些情况下,电子储存单元1615可被排除,并且机器可执行指令被存储在存储器1610上。
代码可被预编译并且被配置成与具有适于执行代码的处理器的机器一起使用,或可在运行时被编译。代码可于编程语言中提供,所述编程语言可被选择以实现代码以预编译或编译状态的方式执行。
计算机系统1601可适于存储用户配置文件信息,诸如,例如名称、物理地址、电子邮箱地址、电话号码、即时通讯(im)处理、教育信息、工作信息、社交爱好和/或厌恶、以及与用户或其它用户潜在相关的其它信息。此类配置文件信息可被存储于计算机系统1601的储存单元1615上。
本文提供的系统和方法的方面,诸如计算机系统1601,可在编程中具体化。技术的各个方面可被认为是通常以于一种类型的机器可读介质上携带或于该介质中具体化的机器(或处理器)可执行代码和/或相关数据的形式"产品"或"制品"。机器可执行代码可被存储于电子储存单元、此类存储器(例如,rom、ram)或硬盘中。"储存"类型介质可以包括计算机、处理器等或其相关模块的任意或所有的有形存储器,诸如各种半导体存储器、磁带驱动器、磁盘驱动器等,其可在任何时间为软件程序提供非易失性存储器。所有或部分的软件有时可通过因特网或各种其它电信网络通信。例如,此类通信能使软件从一个计算机或处理器加载到另一个计算机或处理器,例如从管理服务器或主机加载到应用服务器的计算机平台。因此,可承载软件元件的另一类型的介质包括诸如通过有线和光路线网络和通过各种空中链路在局部设备之间的物理接口中使用的光波、电波和电磁波。携带此类波的物理元件,诸如有线或无线链路,光链路等,也可被考虑为承载软件的介质。如本文所使用,除非被限制到非易失性、有形"存储器"介质,否则术语诸如计算机或机器"可读介质"是指参与向处理器提供指令以用于执行的任何介质。
因此,机器可读介质诸如计算机可执行代码可采取很多形式,包括但不限于有形存储介质、载波介质或物理传输介质。非易失性存储介质包括,例如光盘或磁盘,诸如在任何计算机等中的任何存储设备,诸如可用于实现如在附图中所示的数据库等。易失性存储介质包括动态存储器,诸如此类计算机平台的主存储器。有形传输介质包括同轴电缆;铜线和光纤,包括包含在计算机系统内的总线的电线。载波传输介质可采取电信号或电磁信号、或声波或光波诸如在射频(rf)和红外(ir)数据通信过程中产生的波的形式。计算机可读介质的常见形式因此包括例如:软盘、软磁盘、硬盘、磁带、任意其它磁性介质、cd-rom、dvd或dvd-rom、任意其它光学介质、穿孔卡纸带、具有孔的图案的任意其它物理存储介质、ram、rom、prom和eprom、flash-eprom、任意其它存储器芯片或磁带盒、传送数据或指令的载波、传送此类载波的电缆或链路、或计算机可由其读取编程代码和/或数据的任意其它介质。很多这些形式的计算机可读介质可涉及将一个或多个指令的一个或多个序列传送至处理器用于执行。
本公开的系统和方法可用于对各种类型的生物样品诸如核酸(例如,dna、rna)和蛋白测序。在一些实施方案中,本文所述的方法、设备和系统可用于分选生物样品(例如,蛋白或核酸)。所分选的样品和/或分子可被指向各种容器(bin)用于进一步分析。
测序准确度
本文提供的方法可准确地区分单个核苷酸掺入事件(例如,单分子事件)。所述方法可在单次通过中—即,在不一定对给定核酸分子重新测序的情况下准确地区分单个核苷酸掺入事件。在一些情况下,本文提供的方法可用于对核酸分子测序和重新测序、或对与标记分子缔合的标记感测单次或多次。例如,借助于纳米孔可以对标记感测至少1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000或10,000次。借助于例如施加至具有纳米孔的膜的电压可对所述标记感测和重新感测,所述电压可以将所述标记拉入纳米孔或从纳米孔逐出所述标记。
用于核酸测序的方法包括以大于约4σ的准确度区分单个核苷酸掺入事件。在一些情况下,借助于纳米孔检测到核苷酸掺入事件。与核苷酸缔合的标记可在掺入之时释放并且标记穿过纳米孔。在某些情况下,标记未释放(例如,呈递至纳米孔)。在又更多的实施方案中,标记释放但停留于纳米孔(例如,未穿过纳米孔)。不同标记可以与每种类型的核苷酸(例如,a、c、t、g)缔合和/或从所述核苷酸释放并且通过纳米孔检测到。误差包括但不限于(a)未能检测到标记,(b)误识别标记,(c)在无标记的情况下检测到标记,(d)以不正确的次序检测到标记(例如,两个标记以第一次序释放,但以第二次序检测到),(e)当释放时检测到还未从核苷酸释放出的标记,(f)当掺入生长中的核苷酸链时检测到未附接于掺入的核苷酸的标记,或其任意组合。在一些实施方案中,区分单个核苷酸掺入事件的准确度为100%减去误差发生的速率(即,误差率)。
区分单个核苷酸掺入事件的准确度为任意适合的百分比。区分单个核苷酸掺入事件的准确度可以为约93%、约94%、约95%、约96%、约97%、约98%、约99%、约99.5%、约99.9%、约99.99%、约99.999%、约99.9999%等。在一些情况下,区分单个核苷酸掺入事件的准确度为至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.9%、至少99.99%、至少99.999%、至少99.9999%等。在某些情况下,区分单个核苷酸掺入事件之间的准确度以sigma(σ)单位报道。σ为统计学变量,有时用于商业管理和制造策略以报道误差率诸如无缺陷产品的百分比。在此,σ值可根据如下关系与准确度交换使用:4σ为99.38%准确度,5σ为99.977%准确度,且6σ为99.99966%准确度。
根据本文所述的方法区分单个核苷酸掺入事件可用于准确地确定核酸序列。在某些情况下,核酸(例如,dna和rna)的核酸序列的测定包括误差。误差的实例包括但不限于缺失(未能检测到核酸)插入(在没有核酸真实存在的情况下检测到核酸)和取代(检测到不正确的核酸)。核酸测序的准确度可通过将所测量的核酸序列与真实的核酸序列比对(例如,根据生物信息学技术)以及确定为缺失、插入和/或取代的核酸位置的百分比来确定。误差为缺失、插入和取代的任意组合。准确度范围从0%至100%,其中100%为核酸的序列的完全正确的测定。类似地,误差率为100%-准确度并且范围为0%至100%,其中0%误差率为核酸序列的完全正确的测定。
根据本文所述的方法和/或使用本文所述的设备进行核酸测序的准确度很高。准确度为任意适当高的值。在某些情况下,准确度为约95%、约95.5%、约96%、约96.5%、约97%、约97.5%、约98%、约98.5%、约99%、约99.5%、约99.9%、约99.99%、约99.999%、约99.9999%等。在某些情况下,准确度为至少95%、至少95.5%、至少96%、至少96.5%、至少97%、至少97.5%、至少98%、至少98.5%、至少99%、至少99.5%、至少99.9%、至少99.99%、至少99.999%、至少99.9999%等。在某些情况下,准确度在约95%至99.9999%之间、在约97%至99.9999%之间、在约99%至99.9999%之间、在约99.5%至99.9999%之间、在约99.9%至99.9999%之间等。
高准确度可通过进行多次通过来实现(即,对核酸分子测序多次,例如通过使核酸通过或接近纳米孔及对核酸分子的核酸碱基测序)。可将来自多次通过的数据组合(例如,首次通过时的缺失、插入和/或取代使用来自其它重复通过的数据校正)。在某些情况下,可通过使标记通过或邻近纳米孔多次,诸如,例如通过反转施加至纳米孔或膜的电压(例如,dc或ac电压)来增加标记的检测准确度。所述方法提供在极少次通过下的高准确度(也称为读取,测序覆盖率的重数)。通过次数为任意适合的数量,并且不必为整数。在一些实施方案中,对核酸分子测序1次、2次、3次、4次、5次、6次、7次、8次、9次、10次、12次、14次、16次、18次、20次、25次、30次、35次、40次、45次、50次等。在一些实施方案中,对核酸分子测序至多1次、至多2次、至多3次、至多4次、至多5次、至多6次、至多7次、至多8次、至多9次、至多10次、至多12次、至多14次、至多16次、至多18次、至多20次、至多25次、至多30次、至多35次、至多40次、至多45次、至多50次等。在一些实施方案中,对核酸分子测序约1次至10次之间、约1次至5次之间、约1次至3次之间等。准确度水平可通过将由至多20次通过收集的数据组合来实现。在一些实施方案中,准确度水平通过将由至多10次通过收集的数据组合来实现。在一些实施方案中,准确度水平通过将由至多5次通过收集的数据组合来实现。在一些情况下,在单次通过时实现准确度水平。
误差率为任意适当低的速率。在某些情况下,误差率为约10%、约5%、约4%、约3%、约2%、约1%、约0.5%、约0.1%、约0.01%、约0.001%、约0.0001%等。在某些情况下,误差率为至多10%、至多5%、至多4%、至多3%、至多2%、至多1%、至多0.5%、至多0.1%、至多0.01%、至多0.001%、至多0.0001%等。在某些情况下,误差率为10%至0.0001%之间、3%至0.0001%之间、1%至0.0001%之间、0.01%至0.0001%之间等。
重复序列的去除
基因组dna可含有重复序列,所述重复序列在一些情况下当进行核酸测序反应时不受关注。本文提供了用于去除这些重复序列的方法(例如,通过和与重复序列例如cot-1dna互补的序列杂交)。
一方面,借助于膜中邻近传感电极的纳米孔对核酸样品测序的方法包括从核酸样品去除重复核酸序列以提供用于测序的单链核酸分子。所述方法可还包括向包含纳米孔的反应室提供标记核苷酸,其中标记核苷酸的单个标记核苷酸含有与核苷酸耦合的标记,所述标记借助于纳米孔是可检测到的。在一些情况下,所述方法包括借助于聚合酶进行聚合反应,从而将标记核苷酸的单个标记核苷酸掺入与单链核酸分子互补的生长链。所述方法可以包括在掺入所述单个标记核苷酸期间借助于纳米孔检测与单个标记核苷酸缔合的标记,其中当核苷酸与聚合酶缔合时借助于纳米孔检测到所述标记。
在一些情况下,重复序列未从反应中物理去除,但致使不能被测序并且留在反应混合物中(例如,通过与cot-1dna杂交,其致使重复序列双链化并且从测序反应中有效地"去除")。在一些情况下,使重复序列双链化。
重复序列可具有任意适合的长度。在一些情况下,重复核酸序列包含约20、约40、约60、约80、约100、约200、约400、约600、约800、约1000、约5000、约10000或约50000个核酸碱基。在一些情况下,重复核酸序列包含至少约20、至少约40、至少约60、至少约80、至少约100、至少约200、至少约400、至少约600、至少约800、至少约1000、至少约5000、至少约10000或至少约50000个核酸碱基。在一些情况下,碱基是连续的。
重复核酸序列可具有任何数量的重复亚单位。在一些情况下,重复亚单位是连续的。在一些实施方案中,重复核酸序列包含约20、约40、约60、约80、约100、约200、约400、约600、约800或约1000个重复亚单位的核酸碱基。在一些情况下,重复核酸序列包含至少约20、至少约40、至少约60、至少约80、至少约100、至少约200、至少约400、至少约600、至少约800或至少约1000个重复亚单位的核酸碱基。
在一些情况下,通过和与重复核酸序列互补的核酸序列杂交来去除重复核酸序列。可将与重复核酸序列互补的核酸序列固定在固体支撑物诸如表面或珠粒上。在一些情况下,与重复核酸序列互补的核酸序列包含cot-1dna(其是具有约50至约100个之间的核酸碱基的长度的重复核酸序列的实例)。
纳米孔装配和插入
本文所述的方法可使用具有附接于纳米孔的聚合酶的纳米孔。在一些情况下,期望每纳米孔具有一种且仅一种聚合酶(例如,以使在每个纳米孔处对仅一个核酸分子测序)。然而,包括α-溶血素(αhl)的很多纳米孔可以是具有多个亚基的多聚体蛋白(例如,对于αhl为7个亚基)。亚基可以为同一多肽的相同拷贝。本文提供了具有规定比率的修饰亚基与未修饰亚基的多聚体蛋白(例如,纳米孔)。本文也提供了用于生产具有规定比率的修饰亚基与未修饰亚基的多聚体蛋白(例如,纳米孔)的方法。
参考图27,用于装配具有多个亚基的蛋白的方法包括提供多个第一亚基2705以及提供多个第二亚基2710,其中第二亚基相比于第一亚基被修饰。在一些情况下,第一亚基为野生型(例如,从天然来源纯化,或重组生产)。第二亚基可以任意适合的方法被修饰。在一些情况下,第二亚基具有(例如,作为融合蛋白)附接的蛋白(例如,聚合酶)。修饰亚基可以包含化学活性部分(例如,适用于形成键联的叠氮化物或炔基)。在一些情况下,所述方法还包括进行反应(例如,点击化学环加成)以将实体(例如,聚合酶)附接至化学活性部分。
所述方法可还包括将第一亚基与第二亚基2715以第一比率接触以形成具有第一亚基和第二亚基的多个蛋白2720。例如,具有适用于附接聚合酶的反应性基团的一个部分修饰的αhl亚基可与六个部分野生型αhl亚基(即,以第一比率1:6)混合。所述多个蛋白可具有多个比率的第一亚基与第二亚基。例如,混合亚基可形成数个具有修饰亚基与未修饰亚基(例如,1:6、2:5、3:4)的化学计量法分布的纳米孔。
在一些情况下,蛋白通过仅仅将亚基混合而形成。在αhl纳米孔的情况下,例如,去垢剂(例如,脱氧胆酸)可触发αhl单体以采取孔构象。纳米孔也可使用脂质(例如,1,2-二植烷酰基-sn-甘油-3-磷酸胆碱(dphpc)或1,2-二-o-植烷基-sn-甘油-3-磷酸胆碱(dophpc))和适度温度(例如,低于约100℃)而形成。在一些情况下,将dphpc与缓冲液溶液混合产生较大的多层囊泡(lmv),并且将αhl亚基加入至该溶液以及在40℃温育混合物30分钟可导致孔形成。
如果使用两个不同类型的亚基(例如,天然野生型蛋白和第二αhl单体,其可含有单个点突变),则所得蛋白可具有混合化学计量法(例如,具有野生型和突变型蛋白)。这些蛋白的化学计量法可遵循这样的式,其取决于孔形成反应中所用的两种蛋白的浓度的比率。该式如下:
pm=具有m数量的突变亚基的孔的概率
n=亚基总数(例如,对于αhl为7)
m="突变"亚基的数量
fmut=混合在一起的突变亚基的分数或比率
fwt=混合在一起的野生型亚基的分数或比率
所述方法还可以包括分级分离所述多个蛋白以富集具有第二比率的第一亚基与第二亚基的蛋白2725。例如,可以分离具有一个且仅仅一个修饰亚基的纳米孔蛋白(例如,1:6的第二比率)。然而,任何第二比率是适合的。第二比率的分布也可以被分级分离,诸如富集具有一个或两个修饰亚基的蛋白。形成蛋白的亚基的总数不总为7(例如,可使用不同纳米孔或可以形成具有六个亚基的α-溶血素纳米孔),如图27中描绘。在一些情况下,具有仅仅一个修饰亚基的蛋白被富集。在此类情况下,第二比率为每(n-1)个第一亚基1个第二亚基,其中n为构成蛋白的亚基的数量。
第一比率可以与第二比率相同,然而这不是必需的。在一些情况下,具有突变单体的蛋白相较于未具有突变亚基的蛋白不太有效地形成。如果这样的话,那么第一比率可以大于第二比率(例如,如果纳米孔中期望1个突变亚基与6个非突变亚基的第二比率,则形成适合数量的1:6蛋白可以需要将亚基以大于1:6的比率混合)。
具有不同的第二比率的亚基的蛋白可以在分离中表现不同(例如,具有不同的保留时间)。在一些情况下,使用色谱,诸如离子交换色谱或亲合色谱来分级分离蛋白。因为第一亚基和第二亚基可以相同(除了修饰之外),所以蛋白上的修饰的数量可以充当用于分离的基础。在一些情况下、第一亚基或第二亚基具有纯化标记(例如,除修饰之外)以允许或改善分级分离的效率。在一些情况下,使用多组氨酸标记(his-标记)、链霉亲和素标记(strep-标记)、或其它肽标记。在某些情况下,第一亚基和第二亚基各包含不同标记并且分级分离步骤基于每个标记进行分级分离。在his-标记的情况下,以低ph下在标记上产生电荷(组氨酸残基变得带正电荷,低于侧链的pka)。利用αhl分子中的一个相较于其它分子在电荷上的显著性差异,离子交换色谱可用于分离具有0、1、2、3、4、5、6或7个"带电荷的-标记的"αhl亚基的低聚物。原则上,此带电荷的标记可以为携带均一电荷的一串任意氨基酸。图28和图29示出基于his-标记分级分离纳米孔的实例。图28示出在280纳米处的紫外吸光度、在260纳米处的紫外吸光度、和电导率的图。峰对应于具有不同比率的经修饰的亚基和未修饰的亚基的纳米孔。图29示出使用his-标记和strep-标记分级分离αhl纳米孔和其突变体。
在一些情况下,在分级分离2730后将实体(例如,聚合酶)附接于蛋白。蛋白可以为纳米孔并且实体可以为聚合酶。在某些情况下,该方法还包括将具有第二比率亚基的蛋白插入双层。
在一些情况下,纳米孔可以包含多个亚基。聚合酶可附接于亚基之一并且至少一个且少于所有的亚基包含第一纯化标记。在一些实例中,纳米孔是α-溶血素或其变体。在某些情况下,所有所述亚基包含第一纯化标记或第二纯化标记。第一纯化标记可以是多组氨酸标记(例如,在具有附接的聚合酶的亚基上)。
接头
本文所述的方法可以使用附接于纳米孔的酶(例如,聚合酶)用于纳米孔检测,包括核酸测序。在一些情况下,酶与纳米孔之间的连接可影响系统的性能。例如,将dna聚合酶与孔(α-溶血素)的附接工程化可增加有效的标记核苷酸浓度,从而降低熵障碍。在一些情况下,将聚合酶直接附接至纳米孔。在其它情况下,使用在聚合酶与纳米孔之间的接头。
本文所述的标记测序可能受益于通过电位诱导的特异性标记-核苷酸至αhl孔的有效捕获。捕获可在基于dna模板的聚合酶引物延伸期间或之后发生。一种改善捕获效率的方法是优化在聚合酶与αhl孔之间的连接。在不限制的情况下,待优化的连接的三种特征为:(a)连接的长度(其可增加有效的标记核苷酸浓度,影响捕获动力学,和/或改变熵障碍);(b)连接柔性(其可影响连接子构象变化的动力学);以及(c)聚合酶与纳米孔之间的连接的数量和位置(其可使可用的构象状态的数量降低,从而增加适合的孔-聚合酶定向的可能性,增加有效的标记核苷酸浓度并且减少熵障碍)。
酶和聚合酶可以任意适合的方式连接。在一些情况下,开放阅读框(orf)直接或与氨基酸接头融合。融合可以为任意次序。在一些情况下,(例如,通过点击化学)形成化学键。在一些情况下,连接为非共价的(例如,分子订书钉,通过生物素-链霉亲和素相互作用、或通过蛋白-蛋白标记诸如pdz、gbd、spytag、卤代标记或sh3配体)。
在一些情况下,接头为聚合物诸如肽、核酸、聚乙二醇(peg)。接头可以是任意适合的长度。例如,接头可以为约5纳米(nm)、约10nm、约15nm、约20nm、约40nm、约50nm或约100nm长。在一些情况下,接头为至少约5纳米(nm)、至少约10nm、至少约15nm、至少约20nm、至少约40nm、至少约50nm或至少约100nm长。在一些情况下,接头为至多约5纳米(nm)、至多约10nm、至多约15nm、至多约20nm、至多约40nm、至多约50nm或至多约100nm长。接头可以是刚性、柔性或其任意组合。在一些情况下,不使用任何接头(例如,将聚合酶直接附接于纳米孔)。
在一些情况下,一种以上接头将酶与纳米孔连接。聚合酶与纳米孔之间的连接的数量和位置可以变化。实例包括:αhlc-末端至聚合酶n-末端;αhln-末端至聚合酶c-末端;和不在末端处的氨基酸之间的连接。
一方面,借助于膜中邻近传感电极的纳米孔对核酸样品测序的方法包括向包含纳米孔的反应室提供标记核苷酸,其中标记核苷酸的单个标记核苷酸含有与核苷酸耦合的标记,所述标记借助于纳米孔是可检测到的。所述方法可以包括借助于通过接头附接于纳米孔的聚合酶进行聚合反应,从而将标记核苷酸的单个标记核苷酸掺入与来自核酸样品的单链核酸分子互补的生长链。所述方法可以包括在掺入所述单个标记核苷酸期间借助于纳米孔检测与单个标记核苷酸缔合的标记,其中当核苷酸与聚合酶缔合时借助于纳米孔检测到标记。
在一些情况下,接头相对于纳米孔定向聚合酶以使借助于纳米孔检测到标记。在某些情况下,聚合酶通过两个或更多个接头附接于纳米孔。
在一些情况下,接头包含seqidno2-35中的一个或多个或者由其产生的pcr产物。在某些情况下,接头包含由seqidno2-35中的一个或多个或者由其产生的pcr产物编码的肽。
施加电压的校准
来自单分子纳米孔传感器设备的分子特异性输出信号可以源自跨越由电解质溶液围绕的离子不渗透性膜的电化学电位差的存在。该跨膜电位差可确定纳米孔特异性电化学电流的强度,其可通过设备内的电子产品经由在电极表面发生的牺牲(即,法拉第)或非牺牲(即,电容性)反应检测到。
对于任意给定的纳米孔状态(即,开放通道、所捕获状态等),时间依赖性跨膜电位可作为输入信号起作用,所述输入信号可确定作为随时间变化的流过纳米孔复合物的所得电流。该纳米孔电流可提供通过纳米孔传感器设备的特异性分子信号输出。可通过部分阻断离子通过通道的流动的纳米孔与捕获分子之间的相互作用将开放通道纳米孔电流调节至不同程度。
这些调节可展现出已被捕获的分子的类型的特异性,允许一些分子从它们的纳米孔电流调节直接识别。对于给定分子类型和固定组的设备条件,通过所捕获的这种类型的分子对开放通道纳米孔电流的调节的程度可根据所施加的跨膜电位而变化,将每个类型的分子映射至特定电流对电压(i-v)曲线。
施加电压设置和跨膜电位之间的系统上可变的偏移可引入该i-v曲线沿着水平电压轴的水平移位,基于通过纳米孔传感器设备作为输出信号报道的所测量的电流信号可能减少分子识别的准确度。因此,对于准确比较在相同条件下相同分子的测量结果,所施加电位与跨膜电位之间的未经控制的偏移可以是成问题的。
这种所谓的外部施加电位与实际跨膜电位之间的"电位偏移"可以在实验内和实验间变化。电位偏移的变化可通过起始条件的变化以及在纳米孔传感器设备内电化学条件的时间依赖性变化(漂移)造成。
去除这些测量误差可以通过校准每个实验的施加电压与跨膜电位之间的时间依赖性偏移如在此描述地那样进行。在物理上,观察到纳米孔-捕获的分子的逃逸事件的概率可取决于所施加的跨膜电位并且这种概率分布对于在相同条件下相同的分子样品可以是相同的(例如,样品可以是不同类型的分子的混合物,前提是它们的比例不在样品之间变化)。在一些情况下,对于固定样品类型而言逃逸事件发生的电压分布提供了所施加电压与跨膜电位之间的偏移的测量。可以使用这种信息以校准跨越纳米孔的施加电压,消除由实验内和实验间的电位偏移造成的误差的系统性来源并且改善分子识别和其它测量结果的准确度。
对于用相同分子样品和试剂操作的给定纳米孔传感器装置,逃逸电压分布的期望值可以通过单分子逃逸事件的统计学样品来估测(尽管每个单独事件可以是服从于随机波动的随机过程)。这种估测可以是时间依赖性的以解释实验内电位偏移的时间漂移。这可以校正施加电压设置与在孔处感受到的实际电压之间的可变差值,有效地"比对"在i-v空间中作图时在水平方向上的所有测量结果。
在一些情况下,电位(即电压)偏移校准不解释电流增益和电流偏移变化,其也可以针对改善的纳米孔电流测量的准确度和再现性校准。然而,电位偏移校准一般在增益和偏移校正之前进行以防止在估测电流增益和电流偏移改变方面的误差,因为这些反过来可牵涉拟合电流对电压(i-v)曲线,并且这些拟合的结果受电压偏移的变化影响。即,在i-v空间中左到右(在水平方向上)移动数据可以引入在随后的电流增益和电流偏移拟合中的误差。
图30示出通过纳米孔的电流(实线)与施加电压(虚线)对时间的图。当分子于纳米孔中捕获时电流可减少3005。当施加电压随着时间推移而减少3010时,电流减少直至分子从纳米孔脱离3015,此时电流增加至施加电压处的期望水平。分子脱离时的施加电压可取决于分子的长度。例如,具有30个碱基的标记可在约40mv脱离,而具有50个碱基的标记可在约10mv脱离。对于不同纳米孔或对于在相同纳米孔上随着时间推移的不同测量结果而言脱离电压可以存在变化3020。将这种脱离电压调节至期望值可使数据更容易解释和/或更准确。
一方面,本文提供了借助于膜中邻近传感电极的纳米孔对核酸样品测序的方法。所述方法可以包括向包含纳米孔的反应室提供标记核苷酸,其中标记核苷酸的单个标记核苷酸含有与核苷酸耦合的标记,所述标记借助于纳米孔是可检测到的。所述方法可以包括借助于聚合酶进行聚合反应,从而将标记核苷酸的单个标记核苷酸掺入与来自核酸样品的单链核酸分子互补的生长链。所述方法然后可包括在掺入所述单个标记核苷酸期间借助于纳米孔检测与单个标记核苷酸缔合的标记,其中当核苷酸与聚合酶缔合时借助于纳米孔检测到所述标记。在一些情况下,所述检测包括施加跨域纳米孔的施加电压以及用在施加电压处的传感电极测量电流。
在一些情况下,对施加电压校准。校准可以包括为传感电极估测期望逃逸电压分布对时间。校准然后可以计算期望逃逸电压分布和参考点之间的差值(例如,任意参考点,诸如零)。校准然后可以使施加电压改变所计算的差值。在一些情况下,施加电压随着时间推移而减少。
在一些情况下,估测期望逃逸电压对时间的分布。在某些情况下,参考点为零伏特。所述方法可去除期望逃逸电压分布的检测变化。在一些情况下,所述方法在多个可独立寻址的纳米孔上进行,每个纳米孔邻近传感电极。
在一些实施方案中,所述标记在纳米孔中的存在减少用传感电极在施加电压下测量的电流。在一些情况下,标记核苷酸包含多个不同标记并且所述方法检测多个不同标记中的每一个。
在某些情况下,当与在未校准的情况下进行方法比较,校准增加方法的准确度。在一些情况下,校准补偿电化学条件随着时间推移的变化。在某些情况下,校准补偿在具有多个纳米孔的设备中具有不同电化学条件的不同纳米孔。在一些实施方案中,校准为方法的每种性能补偿不同电化学条件。在一些情况下,所述方法还包括校准电流增益的变化和/或电流偏移的变化。
扩展聚体测序方法
本公开提供了使用扩展聚体测序对核酸分子测序的方法。扩展聚体测序牵涉产生扩展聚合物的许多步骤,所述扩展聚合物比待测序的核酸长并且具有源自待测序的核酸分子的序列。可使扩展聚合物穿过纳米孔以确定其序列。如本文所述,扩展聚合物可在其上具有门以使扩展聚合物可以仅一个方向穿过纳米孔。该方法的步骤于图33至36中说明。关于通过扩展(即扩展聚体)的核酸测序的其它信息可见于美国专利8,324,360中,其以引用方式整体并入本文。
参考图33,一方面,用于核酸测序的方法包括提供待测序的单链核酸和提供多个探针。探针包含能够与单链核酸杂交的杂交部分3305、具有两个末端的环结构3310(其中每个末端附接于杂交部分)和位于在环结构末端之间的杂交部分的可切割基团3315。环结构包含阻止环结构以反方向穿过纳米孔的门3320。
参考图34,所述方法可以包括以通过将杂交部分与待测序的单链核酸3410杂交而确定的次序聚合3405多个探针。参考图35,所述方法可以包括切割3505可切割基团以提供待测序的扩展链。
参考图36,所述方法可以包括使扩展链3610穿过3605纳米孔3615,其中所述门阻止扩展链以反方向3620穿过纳米孔。所述方法可以包括借助于纳米孔以通过将杂交部分与待测序的单链核酸杂交而确定的次序检测扩展链的环结构,从而对待测序的单链核酸测序。
在一些情况下,环结构包含窄区段并且所述门为包含两个末端的聚合物,其中第一末端固定于邻近窄区段的环结构并且第二末端未固定于环结构。环结构能够以所述门邻近窄区段对齐的第一方向穿过纳米孔。在一些实施方案中,环结构不能够以所述门未邻近窄区段对齐的反方向穿过纳米孔。
在一些情况下,所述门包含核苷酸。当所述门未邻近窄区段对齐时,所述门可与环结构碱基配对。
窄区段可以包含足够窄使得当门与窄区段对齐时使聚合物可穿过纳米孔的任意聚合物或分子。在一些情况下,窄区段包含脱碱基核苷酸(即,不具有附接于其的核苷酸碱基的核酸侧链)或碳链。
在某些情况下,在检测期之间对电极再充电。当对电极再充电时,扩展链一般不以反方向穿过纳米孔。
非测序方法和应用
本文所述的设备和方法可用于测量核酸样品和/或核酸分子的除了它们的核酸序列之外的某些性质(例如,序列的长度或核酸样品的质量的任何测量包括但不限于样品中核酸的交联程度)。在一些情况下,可期望不确定核酸分子的序列。例如,可以通过确定基因组中某些重复序列(例如,被称为微卫星、简单序列重复(ssr)或短串联重复序列(str))的长度来识别人类个体(或其它生物体诸如马等)。人们可在不知晓str序列和/或在str之前(5')或之后(3')发现的dna序列的情况下(例如,以不识别人的种族、接触疾病的可能性等)希望知晓一个或多个str的长度(例如,以识别罪行的起源或作案者)。
一方面,方法识别存在于基因组中的一个或多个str。可识别任意数量的str(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30个或更多)。str可以包含重复区段(例如,序列seq.id.no.1-aggtctaggtctaggtctaggtctaggtctaggtctaggtct的'aggtct'),该区段具有任意数量的核酸碱基(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30个或更多碱基)。str可以包含任意数量的重复的重复区段,一般为连续重复的(例如,重复1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30次或更多次)。
核苷酸掺入事件的数量和/或核酸或其区段的长度可通过使用具有附接于一些、大多数或所有的标记核苷酸的相同标记的核苷酸来确定。对标记的检测(在释放之前预加载至纳米孔或在从标记核苷酸释放后引导入纳米孔)指示核苷酸掺入事件已发生,但在此情况下不识别哪个核苷酸已掺入(例如,没有任何序列信息被确定)。
在一些实施方案中,所有核苷酸(例如,所有腺嘌呤(a)、胞嘧啶(c)、鸟嘌呤(g)、胸腺嘧啶(t)和/或尿嘧啶(u)核苷酸)具有与核苷酸耦合的相同标记。在一些情况下,然而,这可能不是必需的。至少一些所述核苷酸可具有识别核苷酸的标记(例如,以使一些序列信息将被确定)。在一些情况下,约5%、约10%、约15%、约20%、约25%、约30%、约40%或约50%的核苷酸具有识别核苷酸的标记(例如,以使一些核酸位置被测序)。所测序的核酸位置可沿着核酸链随机分布。在一些情况下,所有单个类型的核苷酸具有识别标记(例如,以使所有腺嘌呤被测序)。在一些情况下、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少40%或至少50%的核苷酸具有识别核苷酸的标记。在一些实施方案中,至多5%、至多10%、至多15%、至多20%、至多25%、至多30%、至多40%或至多50%的核苷酸具有识别核苷酸的标记。在一些实施方案中,所有核酸或其区段为短串联重复序列(str)。
一方面,借助于膜中邻近传感电极的纳米孔确定核酸或其区段的长度的方法包括向包含纳米孔的反应室提供标记核苷酸。核苷酸可具有含有与核苷酸耦合的相同标记的不同碱基,诸如至少两个不同碱基,所述标记借助于纳米孔是可检测到的。所述方法还可包括借助于聚合酶进行聚合反应,从而将标记核苷酸的单个标记核苷酸掺入与来自核酸样品的单链核酸分子互补的生长链。所述方法还可包括在掺入单个标记核苷酸期间或之后借助于纳米孔检测与单个标记核苷酸缔合的标记。
一方面,借助于膜中邻近传感电极的纳米孔确定核酸或其区段的长度的方法包括向包含纳米孔的反应室提供标记核苷酸。标记核苷酸的单个标记核苷酸可含有与核苷酸耦合的标记,所述标记能够减少流过纳米孔的电流相较于当所述标记不存在时的电流的大小。
在一些实施方案中,所述方法还包括借助于聚合酶进行聚合反应,从而将标记核苷酸的单个标记核苷酸掺入与来自核酸样品的单链核酸分子互补的生长链以及减少流过纳米孔的电流大小。电流的大小可减少任意适合的量,包括约5%、约10%、约15%、约20%、约25%、约30%、约40%、约50%、约60%、约70%、约80%、约90%、约95%或约99%。在一些实施方案中,电流的大小减少至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%或至少99%。在一些实施方案中,电流的大小减少至多5%、至多10%,至多15%、至多20%、至多25%、至多30%、至多40%、至多50%、至多60%、至多70%、至多80%、至多90%、至多95%或至多99%。
所述方法还可包括借助于纳米孔检测在掺入单个标记核苷酸之间的时间段(例如,图6中的时间段605)。在掺入单个标记核苷酸之间的时间段可具有高的电流大小。在一些实施方案中,核苷酸掺入事件之间流过纳米孔的电流大小为(例如,回到)最大电流的约50%、约60%、约70%、约80%、约90%、约95%或约99%(例如,当不存在标记时)。在一些实施方案中,核苷酸掺入事件之间流过纳米孔的电流大小为最大电流的至少50%、至少60%、至少70%、至少80%、至少90%、至少95%或至少99%。
在某些情况下,在str之前(5')或之后(3')对核酸的部分测序以识别哪个str具有于纳米孔中确定的其长度(例如,在多个引物指向多个str的多路复用的情形中)。在一些情况下,在str之前(5')或之后(3')对约2、3、4、5、6、7、8、9、10、11、12、13、14、15个或更多个核酸测序。
模式匹配
本公开还提供了用于将通过纳米孔设备检测到的信号模式与已知(或参考)信号匹配的电子读取器。纳米孔设备可包括膜中的纳米孔,如在本文其它地方所述。已知信号可保持在存储器位置中,诸如位于包含纳米孔设备的芯片上的远程数据库或存储器位置。电子读取器可借助于模式匹配算法来匹配模式,其可借助于电子读取器的计算机处理器实现。电子读取器可位于芯片上。
模式匹配可实时诸如当数据正通过纳米孔设备收集时实现。作为替代方案,模式匹配可通过首先收集数据且随后处理数据以匹配模式来实现。
在一些情况下,读取器含有用户感兴趣的一个或多个多个核酸序列的列表(在本文也为"白色列表"),和用户不感兴趣的一个或多个其它核酸序列的一个列表(或多个列表)(在本文也为"黑色列表")。在核酸检测期间(包括核酸掺入事件),读取器可以检测并记录在白色列表中的核酸序列,并且不检测或记录在黑色列表中的核酸序列。
实施例
实施例1-非法拉第传导
图37示出非法拉第传导可使纳米孔与调节解耦。此图的纵轴是以皮安(pa)测量的电流,在-30至30范围内。横轴是以秒测量的时间,在0至2范围内。波形具有40%占空比。数据点3705是在双层上方和下方在150mmkcl,ph7.5和20mmhepes缓冲液以及3mmsrcl2的存在下用海绵铂工作电极测量的电流。存在240nm粘性聚合酶和具有0.0464o.d的5gs夹心结构。脂质为75%磷脂酰乙醇胺(pe)和25%磷脂酰胆碱(pc)。显示跨越工作电极和对电极(agcl丸粒)的模拟电压3710乘以100以拟合到图上。显示跨越纳米孔-聚合酶复合物3715的模拟电化学电位乘以100以拟合到图上。用集成电路增强(spice)模型使用模拟程序模拟电流3720。
实施例2-标记捕获
图38示出在交流电(ac)系统中的纳米孔中捕获的两个标记。附图的纵轴是以皮安(pa)测量的电流,在0至25范围内。横轴是以秒测量的时间,在约769至780范围内。第一标记3805于约10pa处捕获。第二标记3810于约5pa处捕获。开放通道电流3815为约18pa。由于标记的快速捕获,很少数据点在开放通道电流处观察到。在10hz和40%占空比时,波形为0至150mv。溶液含有150mmkcl。
实施例3-标记测序
图39示出在待测序的模板dna分子3905、溶血素纳米孔3910和dna聚合酶3915的融合物、以及标记核苷酸3920之间形成的三元复合物3900的实例。聚合酶3915附接于具有蛋白接头3925的纳米孔3910。纳米孔/聚合酶构建体形成使得纳米孔的七个多肽单体中仅一个具有附接的聚合酶。标记核苷酸的部分穿入3920纳米孔并且影响通过纳米孔的电流。
图40示出在待测序但不含标记核苷酸的模板dna存在下流过纳米孔的电流。与纳米孔接触的溶液在100mv施加电压下具有150mmkcl、0.7mmsrcl2、3mmmgcl2和20mmhepes缓冲液(ph7.5)。除了少数例外4005,使电流保持在邻近18皮安(pa)。例外可以是电子噪音并且可以是仅在横时间轴上的一个数据点。可使用区分噪音与信号的算法,诸如,例如自适应信号处理算法来减轻电子噪音。
图41、图42和图43示出不同标记提供不同电流水平。在所有实例中,与纳米孔接触的溶液在100mv施加电压下具有150mmkcl、0.7mmsrcl2、3mmmgcl2和20mmhepes缓冲液(ph7.5)。图41示出鸟嘌呤(g)4105区分于胸腺嘧啶(t)4110。标记为具有约8至10pa的电流水平的dt6p-t6-dsp8-t16-c3(对于t)和具有约4或5pa的电流水平的dg6p-cy3-30t-c6(对于g)。图42示出鸟嘌呤(g)4205区分于腺嘌呤(a)4210。标记为具有约6至7pa的电流水平的da6p-t4-(sp18)-t22-c3(对于a)和具有约4或5pa的电流水平的dg6p-cy3-30t-c6(对于g)。图43示出鸟嘌呤(g)4305区分于胞嘧啶(c)4310。标记为具有约1至3pa的电流水平的dc6p-t4-(sp18)-t22-c3(对于c)和具有约4或5pa的电流水平的dg6p-cy3-30t-c6(对于g)。
图44、图45、图46和图47示出使用标记核苷酸进行测序的实例。待测序的dna分子是单链并且具有序列agtcagtc(seq.id.no:36)且通过两个侧翼发夹结构来稳定。在所有实例中,与纳米孔接触的溶液在100mv施加电压下具有150mmkcl、0.7mmsrcl2、3mmmgcl2和20mmhepes缓冲液(ph7.5)。对应于鸟嘌呤(dg6p-cy3-30t-c6)、腺嘌呤(da6p-t4-(sp18)-t22-c3)、胞嘧啶(dc6p-t4-(sp18)-t22-c3)和胸腺嘧啶(dt6p-t6-dsp8-t16-c3)的四个标记包括于溶液中。图44示出其中识别出对应于seq.id.no:36中的序列gtca的四个连续标记核苷酸(即,c4405、a4410、g4415和t4420)的实例。标记可在掺入生长链之前通入且通过纳米孔数次(例如,于是对于每个掺入事件,电流水平可在开放通道电流与区分标记的减少的电流水平之间切换数次)。
出于任何理由,包括但不限于标记进入和离开纳米孔的次数不同和/或标记由聚合酶短暂保持的但并不完全掺入生长中的核酸链,在试验之间电流减少的持续时间可以是不同的。在一些实施方案中,在试验之间电流减少的持续时间是大约恒定的(例如,变化不超过约200%、100%、50%或20%)。在一些情况下,选择酶、施加电压波形、二价和/或单价离子的浓度、温度和/或ph使得在试验之间电流减少的持续时间是大约恒定的。图45示出所识别的seq.id.no:36中的相同序列gtca,如示于图44中(即,在这种情况下所识别的标记核苷酸为c4505、a4510、g4515和t4520)。在一些情况下,电流保持减少持续延长的时间段(例如,约2秒,如在4520所示)。
图46示出所识别的五个连续标记核苷酸(即,t4605、c4610、a4615、g4620、t4625)对应于seq.id.no:36中的序列agtca。图47示出所识别的五个连续标记核苷酸(即,t4705、c4710、a4715、g4720、t4725、c4730)对应于seq.id.no:36中的序列agtcag。
尽管在本文已显示且描述本发明的优选的实施方案,但是对本领域技术人员而言明显的是,仅以实例提供此类实施方案。本发明不旨在通过在说明书内提供的具体实施例进行限制。尽管已经参考前述说明书描述本发明,但是本文实施方案的描述和说明不意图以限制含义进行解释。在不偏离本发明的情况下,本领域技术人员现在会想到很多变化、改变和取代。此外,应理解的是,本发明的所有方面并不限于本文阐述的具体描述、配置或相对比例,这取决于多种条件和变量。应理解,在实践本发明中可采用本文所述的本发明的实施方案的各个替代方案。因此,可设想的是,本发明也应涵盖任何此类替代方案、修饰、变化或等效物。下列权利要求旨在限定本发明的范围并且由此涵盖在这些权利要求及其等效物的范围内的方法和结构。
1.一种用于装配具有多个亚基的蛋白的方法,所述方法包括:
(a)提供多个第一亚基;
(b)提供多个第二亚基,其中相对于所述第一亚基修饰所述第二亚基;
(c)使所述第一亚基与所述第二亚基以第一比率接触以形成多个具有所述第一亚基和所述第二亚基的蛋白,其中所述多个蛋白具有所述第一亚基与所述第二亚基的多个比率;以及
(d)分级分离所述多个蛋白以富集具有第二比率的所述第一亚基与所述第二亚基的蛋白,其中所述第二比率为每(n-1)个第一亚基一个第二亚基,其中'n'为构成所述蛋白的亚基的数量。
2.如权利要求1所述的方法,其中所述蛋白为纳米孔。
3.如权利要求2所述的方法,其中所述纳米孔与α-溶血素至少80%同源。
4.如权利要求1所述的方法,其中所述第一亚基或所述第二亚基包含纯化标记。
5.如权利要求4所述的方法,其中所述纯化标记为多组氨酸标记。
6.如权利要求1所述的方法,其中使用离子交换色谱进行(d)中的所述分级分离。
7.如权利要求1所述的方法,其中所述第二比率为每6个第一亚基1个第二亚基。
8.如权利要求1所述的方法,其中所述第二比率为每5个第一亚基2个第二亚基并且单个聚合酶附接于每个所述第二亚基。
9.如权利要求1所述的方法,其中所述第二亚基包含化学活性部分。
10.如权利要求9所述的方法,其中所述方法还包括(e)进行反应以使实体附接于所述化学活性部分。
11.如权利要求10所述的方法,其中所述蛋白为纳米孔且所述实体为聚合酶。
12.如权利要求1所述的方法,其中所述第一亚基为野生型。
13.如权利要求1所述的方法,其中所述第一亚基和/或第二亚基为重组的。
14.如权利要求1所述的方法,其中所述第一比率约等于所述第二比率。
15.如权利要求1所述的方法,其中所述第一比率大于所述第二比率。
16.如权利要求1所述的方法,其还包括将具有所述第二比率的亚基的蛋白插入双层。
17.如权利要求1所述的方法,其还包括借助于具有所述第二比率亚基的蛋白对核酸分子测序。
18.一种包含多个亚基的纳米孔,其中聚合酶附接于所述亚基中的一个并且至少一个且少于所有的所述亚基包含第一纯化标记。
19.如权利要求18所述的纳米孔,其中所述纳米孔与α-溶血素至少80%同源。
20.如权利要求18所述的纳米孔,其中所有所述亚基包含第一纯化标记或第二纯化标记。
21.如权利要求18所述的纳米孔,其中所述第一纯化标记为多组氨酸标记。
22.如权利要求18所述的纳米孔,其中所述第一纯化标记在具有所述附接的聚合酶的亚基上。
23.如权利要求18所述的纳米孔,其中所述第一纯化标记在不具有所述附接的聚合酶的亚基上。
技术总结