一种采用Aerolysin纳米孔道的蛋白质多肽测序方法与流程

    专利2022-07-08  118


    本发明属于生物技术领域,具体涉及一种基于aerolysin纳米孔道的蛋白质/多肽测序方法。



    背景技术:

    成千上万种不同的蛋白质维持着细胞的所有功能,对生物体内蛋白质氨基酸序列的精准测定可为理解蛋白质功能,其参与的生物学过程以及蛋白质与蛋白质(或其他生物分子)间相互作用提供关键信息。根据遗传信息的传递方向,蛋白质合成是由dna转录、转录后加工、翻译以及翻译后修饰等过程合成的。然而,在转录时一个基因可以多种mrna形式剪接,且同一个蛋白可以许多形式进行翻译后的修饰,因此蛋白质的基因型和表型之间具有较大差异。需要直接对蛋白质的氨基酸序列及翻译后修饰进行精准测定

    近年来,随着单分子蛋白质检测需求的日益增长,单分子水平蛋白质分析技术得到快速发展,以尝试解读单个蛋白质分子序列信息,如蛋白质指纹分析荧光技术、隧穿电流蛋白检测技术等。然而,现有荧光测序方法缺少用于检测20种不同氨基酸且发射峰间无明显重叠的高效有机荧光团来特异性标记20种氨基酸。而隧穿电流检测技术所使用的亚纳米尺度隧穿测量界面难以稳定制备,这些挑战使得现有技术虽可实现几种氨基酸的区分,但尚不能实现20种氨基酸及其翻译后修饰的有效识别,更难以获取氨基酸序列信息。因此,目前单分子蛋白质测序仍然面临着巨大的挑战,亟需发展针对20种氨基酸序列信息灵敏检测的新原理,建立针对单个蛋白质分子氨基酸序列及翻译后修饰精准测量的创新方法。



    技术实现要素:

    本发明所要解决的技术问题是:目前单分子蛋白质测序仍然面临着巨大的挑战,亟需发展针对20种氨基酸序列信息灵敏检测的新原理,建立针对单个蛋白质分子氨基酸序列及翻译后修饰精准测量的创新方法。

    为了解决上述技术问题,本发明提供了一种基于aerolysin纳米孔道的用于蛋白质/多肽测序的方法,实现对天然氨基酸及其翻译后修饰的特异性分辨和单分子蛋白质序列的精准获取,包括以下多个步骤:

    包括以下步骤:

    (1)蛋白质解折叠;(2)端位测序起点标记;(3)带电性初步筛选;(4)多肽三级结构解折叠;(5)氨基酸正交识别;(6)限域微扰辅助氨基酸识别;(7)单分子蛋白质序列测定。

    所述步骤(1)蛋白质解折叠中,单个蛋白质分子在纳米孔道测序前必须解开其高级结构以线性直链的方式进入单个纳米孔道,单个蛋白质在经由温度调控和ph调控的方法将去折叠。

    步骤(2)端位测序起点标记利用特定序列的肽核酸、寡聚核苷酸、多肽链或有机功能团标记去折叠多肽链的n端或c端为测序起点,从而获得离子流起点标签信号。

    步骤(3)带电性初步筛选中,设计电性的初步筛选纳米孔道。

    步骤(4)多肽三级结构解折叠中,为辅助电荷初筛,进一步设计三级结构解折叠纳米孔道,即在生物纳米孔道入口处构建解折叠域以进一步打开多肽分子结构,即突变型t284/f/y/i/l/w或g214/f/y/i/l/w。

    步骤(5)氨基酸正交识别中,采用针对每一种带电特性的线性多肽分子测序,设计至少包含以下六种正交识别的纳米孔道:

    (a)基于静电相互作用,即突变型t218k/r/h/d/e、s278k/r/h/d/e、s276k/r/h/d/e、t274k/r/h/d/e、a224q/n/d/e/r/k/h拟实现对第一类氨基酸的识别,包括但不仅限于h、r、k、e、d、q、n、w;

    (b)基于氢键及亲水作用,即突变型t218n/q、q212r/k/h、d209s/t、s276q/n、d222g/a/s或a224e/d,拟实现对第二类氨基酸的识别,包括但不仅限于q、n、y、t、s、c、g、h;其中,组氨酸his中r基的pka为7,可通过微调ph使其不带电,从而基于其与关键区域的氢键相互作用使其该特异性纳米孔道中实现区分;

    (c)基于范德华相互作用,即突变型r220s/t/a、d222g/a、s236i/l/v、g270i/l、t232i/l/v、t274g/a/i/l或k238f/y/w,拟实现对第三类氨基酸的识别,包括但不仅限于i、l、m、v、p、a、c、g;

    (d)基于部分氨基酸侧链的大p键,即突变型d222w/h/f/y、s276f/y、a224k/r/w、s272w/h或t274w/h/f/y,拟实现对第四类氨基酸的识别,包括但不仅限于w、p、f、y、h、i、l、v;

    (e)基于小位阻效应,即突变型s276f/y/i/l、s278f/y/i/l/p、t274w/p、s236w或k238g/w/i/l/f/y/p,拟实现对第五类小体积氨基酸的识别,包括但不仅限于a、c、g、s、t、v;

    (f)基于大位阻效应,即突变型t218g/a、s276g/a、s278g/a、t274g/a、n226d/e、q268s/t/g/a,拟实现第六类大体积氨基酸的识别,包括但不仅限于w、h、i、k、r、y。

    步骤(6)限域微扰辅助氨基酸识别中,针对部分结构差异较小的氨基酸及异构体氨基酸之间可能引入的识别误差,配合特定纳米孔道进一步提高测序准确性,引入交变电场、光学微扰测量体系,同时设计扰动体系微扰放大纳米孔道,所述特定纳米孔道如下所示:

    (a)突变型s236d/e/k/h/r、a260d/e/k/h/r、k238h/r/d/e、t240d/e、s256h/r/w结合交变电场微扰体系;

    (b)突变型s236w/h、k238i/l、s256y/f/w、p249w、v250i/l/f/y/w结合光学微扰体系。

    步骤(7)单分子蛋白质序列测定的方法为:

    (a)使所述蛋白或多肽与所述孔接触,使得所述蛋白或多肽相对于所述孔移动;

    (b)在所述蛋白或多肽相对于所述孔移动时,测量穿过所述孔的电流,其中所述电流指示所述蛋白或多肽的一或多个特征,包含电流信号的形状、幅值、持续时间,根据数学变换解析出该电流信号的特征,建立多肽数据库进行数据的相互校正,从而表征所述蛋白或多肽。

    优选的,上述采用aerolysin纳米孔道蛋白质/多肽测序的方法,具体步骤如下所示:

    (1)样本前处理:采用升高温度至60-100℃、降低溶液ph至0-5的方法破坏蛋白质内部氢键,同时采用三(2-羧乙基)膦(tcep)或二硫苏糖醇(dtt)还原剂破坏蛋白质其s-s键,释放并线性化单个蛋白质中的多肽链;

    (2)通过在多肽链的n端特异性修饰肽核酸pna、寡聚核苷酸、多肽链或有机功能团使其在进入纳米孔道的起始或终止产生特异性的离子流阻断台阶信号或荧光信号,从而确定单个多肽分子纳米孔道测序的起点,并为多个正交识别纳米孔道并行测序信号的互相校正提供起始时间标签;

    (3)采用变性剂以及设计构建“三级结构解折叠纳米孔道”实现多肽三级结构的解折叠,其中,对于“三级结构解折叠纳米孔道”的设计为在aerolysin纳米孔道入口处仿生构建蛋白酶体19s域的中心氨基酸环境,用于增强纳米孔道入口处与多肽的特异性非共价相互作用,并借助电驱动力,逐步破坏多肽分子内部的弱相互作用,驱动其进入限域孔道内部并实现线性解折叠,从而克服多肽三级结构对纳米孔道多肽测序的一大挑战;

    (4)设计可驱动不同带电性质多肽的功能化aerolysin纳米孔道,初步筛选多肽的电荷性质以匹配选择下一步正交测序纳米孔道;

    (5)基于静电作用、氢键及亲水作用、范德华相互作用、氨基酸大p键相互作用、大位阻效应和小位阻效应,针对由于每一种带电特性的多肽构建6类正交识别纳米孔道用以专一性识别氨基酸序列;

    (6)在每一个正交识别纳米孔道入口区域引入易形成氢键的氨基酸,并调节该区域限域孔道结构,从而设计构建多肽二级结构标签域,在该区域中,孔道内部氨基酸残疾将与不同二级结构的多肽形成特定规则的氢键相互作用,从而诱导特异性的离子流阻断及特定离子迁移率的变化,形成二级结构标签离子流特征,用以数据处理时对单个蛋白质测序离子流电信号的校准降噪;

    (7)针对氨基酸正交识别可能存在的氨基酸识别误差,采用离子流限域微扰技术,结合特定设计的纳米孔道放大温度扰动、交变电场扰动及光学扰动对孔道内离子迁移率的影响,进一步识别离子迁移频率特征,从而提高纳米孔道测量界面的氨基酸识别能力,精准获得蛋白质单分子序列信息;

    (8)在所述蛋白质或多肽相对于所述aerolysin纳米孔道移动时,进行一或多个测量,测量和分析穿过所述孔的电流,包括电流幅值、频率、形状和持续时间等特征,从而测定所述分析物是否存在或其一或多个特征。根据数学变换解析出该电流信号的特征,建立多肽数据库进行数据的相互校正,从而表征所述蛋白或多肽。

    与现有技术相比,本发明的有益效果在于:

    (1)由于多条多肽链通过氢键或s-s键盘曲折叠而成的蛋白质高级结构,其体积较大,难以进入最窄处仅为1nm的aerolysin纳米孔道。设计蛋白质高级结构解折叠模块,将具有高级结构的蛋白质分子解折叠成线性多肽分子。基于此,本发明采用升高温度、降低溶液ph等方法破坏蛋白质内部氢键,同时采用三(2-羧乙基)膦(tcep)、二硫苏糖醇(dtt)等还原剂破坏其s-s键,释放并线性化单个蛋白质中多条多肽链。

    (2)一条多肽分子可以从n端或c端进入纳米孔道。如实现根据时序纳米孔道特征信号顺序读出氨基酸序列,亟需确定单个多肽分子进入纳米孔道的端位,即确定测序的起始方向。针对这一目标,本发明通过在多肽的n端特异性修饰肽核酸pna(如包含多个腺嘌呤的pna序列)、寡聚核苷酸、多肽链或有机功能团(如fam),使其在进入纳米孔道的起始或终止产生特异性的离子流阻断台阶信号或荧光信号等特殊信号,从而确定单个多肽分子纳米孔道测序的起点,并为多个正交识别纳米孔道并行测序信号的互相校正提供起始时间标签。

    (3)由于在溶液中多肽二级结构可能进一步盘曲折叠成三级结构,使其具有较大的三维尺寸,因此难以进入纳米孔道。针对这一情况,本发明采用变性剂(如盐酸胍gdhcl)以及设计构建“三级结构解折叠纳米孔道”等方法实现多肽三级结构的解折叠。其中,对于“三级结构解折叠纳米孔道”的设计,拟在aerolysin纳米孔道入口处仿生构建蛋白酶体19s域的中心氨基酸环境(如突变型t210y&s213w等),增强纳米孔道入口处与多肽的特异性非共价相互作用,并借助电泳力、电渗流、介电泳力等多种电驱动力,逐步破坏多肽分子内部的弱相互作用,驱动其进入限域孔道内部并,实现线性解折叠,从而克服多肽三级结构对纳米孔道多肽测序的一大挑战。

    (4)本发明设计可驱动不同带电性质多肽的功能化aerolysin纳米孔道,初步筛选多肽的电荷性质以匹配选择下一步正交测序纳米孔道。本发明设计至少4种“电性初筛纳米孔道”分别针对性捕获4类带电性质多肽即负电荷多肽、正电荷多肽、电中性且正负电荷相互屏蔽多肽以及电中性且正负电荷分离多肽。4种“电性初筛纳米孔道”设计如下:

    (i)特异性识别带负电多肽的“电性初筛纳米孔道”。通过调节孔道内部关键区域直径或转移孔道内电荷至直径较宽区域(如突变型t274n/q/i/l、t232d/e、k238h/d/r/f/a/c/g/q/e/k/l/m/n/s/y/t/i/w/p/v、s280t/n/q/h/i/l等),控制其孔道内部由孔道最窄处电荷决定的电渗流为零,并减小介电泳力,使单个带负电多肽由电泳力驱动进入纳米孔道。

    (ii)特异性识别带正电多肽的“电性初筛纳米孔道”。通过引入或增大孔道内负电荷的分布(如突变型t274d/e、t218d/e、s276d/e、s278d/e、k238a/n/d/e/q、r282d/e/s/t/n/q/a、r220d/e/s/t/n/q/a等),从而调节由孔道内部阳离子决定的电渗流。在实验中,施加反向电压,从而实现对单个正电荷多肽的高效捕获。

    (iii)特异性识别电中性且正负电荷相互屏蔽多肽的“电性初筛纳米孔道”。对于电中性且其中正负电荷互相屏蔽(即正负电荷距离较近)的多肽,通过在孔道内直径较小区域引入正电荷氨基酸(如突变型t218k/r/h/n/q、s276k/r/h、s278k/r/h/n/q、s274k/r/h、n226k/r/h、s272k/r/h、g270k/r/h、s228k/r/h、q268k/r/h、t230k/r/h、a266k/r/h、t232k/r/h、s264k/r/h、g234k/r/h、n262k/r/h、s236k/r/h、a260k/r/h、s280n/q等),增强孔道内部由阴离子决定的电渗流,从而增强纳米孔道对于电中性且正负电荷相互屏蔽多肽的捕获效率,获得特异性离子流响应。

    (iiii)特异性识别电中性且正负电荷分离多肽的“电性初筛纳米孔道”。对于电中性且其中正负电荷分离的多肽,通过增强孔道入口处的电势梯度(如突变型s280q/n/a、t284q/n/a、g214q/n/a),调控于非线性的电场强度,从而利用介电泳力驱动单个电中性且正负电荷分离多肽进入孔道。

    (5)基于静电作用、氢键及亲水作用、范德华相互作用、氨基酸大p键相互作用、大位阻效应和小位阻效应,本发明针对由于每一种带电特性的多肽构建至少6类正交识别纳米孔道用以专一性识别氨基酸序列,如下所示:

    (i)基于静电相互作用,在孔道内现有电流传感区域中引入带电荷氨基酸,如突变型t218k/r/h/d/e、s278k/r/h/d/e、s276k/r/h/d/e、t274k/r/h/d/e、a224q/n/d/e/r/k/h等。同时,带电荷氨基酸的引入会增强孔道与待测氨基酸之间的氢键、盐键和阳离子-p相互作用,从而实现对第一类氨基酸的识别,包括但不仅限于h、r、k、e、d、q、n、w。

    (ii)基于氢键及亲水作用,调控孔道内电流传感区域的电势梯度,如突变型t218n/q、q212r/k/h、d209s/t、s276q/n、d222g/a/s、a224e/d等,加快带电荷氨基酸通过该区域的速度并延长极性不带电氨基酸在此区域内的停留时间,从而实现对第二类氨基酸的识别,包括但不仅限于q、n、y、t、s、c、g、h。其中,组氨酸h中r基的pka约为7,可通过微调ph使其不带电,从而基于其与纳米孔道关键传感区域的氢键相互作用,使其在该特异性纳米孔道中实现特征区分。

    (ⅲ)基于范德华相互作用,调控孔道整体的电势分布和孔道立体结构分布,引入疏水氨基酸域,如突变型r220s/t/a、d222g/a、s236i/l/v、g270i/l、t232i/l/v、t274g/a/i/l、k238f/y/w等,使得电流传感区域从野生型孔道的静电敏感域转移到突变型孔道的疏水域中,从而通过相互作用延长特定氨基酸在该区域的停留时间,获得特征离子流信号,从而拟实现对第三类氨基酸的识别,包括但不仅限于i、l、m、v、p、a、c、g。

    (iv)基于部分氨基酸大p键相互作用,在调控孔道立体结构和电势分布的基础上,重构aerolysin纳米孔道内的电流传感区域组成,构建以正电荷氨基酸及输水氨基酸为主导的灵敏区域,如突变型d222w/h/f/y、s276f/y、a224k/r/w、s272w/h、t274w/h/f/y等,增强该灵敏区域与特定氨基酸的p-p相互作用、阳离子-p键相互作用、p-p相互作用等,从而实现对第四类氨基酸的识别,包括但不仅限于w、p、f、y、h、i、l、v。

    (v)基于大位阻效应,进一步减小孔道内电流传感区域的限域空间,增大该区域的位阻,如突变型s276f/y/i/l、s278f/y/i/l/p、t274w/p、s236w、k238g/w/i/l/f/y/p等,延长所有氨基酸通过该区域的时间,增强小体积氨基酸的离子流信号电流幅值,并使得大体积氨基酸造成近乎全阻断离子流台阶,从而特异性区分氨基酸体积,实现对第五类小体积氨基酸的识别,包括但不仅限于a、c、g、s、t、v。

    (vi)基于小位阻效应,调控孔道内的立体结构,增大电流关键区域的尺寸,如突变型t218g/a、s276g/a、s278g/a、t274g/a、n226d/e、q268s/t/g/a等,并基于多肽整体的带电荷类型减小纳米孔道内的电渗流,从而进一步减小小体积氨基酸的电流响应,增强大体积氨基酸的电流差异,实现第六类大体积氨基酸的识别,包括但不仅限于w、h、i、k、r、y。

    (6)本发明在每一个正交识别纳米孔道靠近入口区域引入易形成氢键的氨基酸,并调孔该区域限域孔道结构,从而设计构建多肽二级结构标签域。在该区域中,孔道内部氨基酸残基将与不同二级结构的多肽形成特定规则的氢键相互作用,从而诱导特异性的离子流阻断及特定离子迁移率的变化,形成二级结构标签离子流特征,用以数据处理时对单个蛋白质测序离子流电信号的校准降噪。

    (7)针对氨基酸正交识别可能存在的氨基酸识别误差,本发明基于申请人团队前期对孔道内离子流迁移轨迹的研究,采用离子流限域微扰技术,结合特定设计的纳米孔道放大温度扰动、交变电场扰动及光学扰动对孔道内离子迁移率的影响,进一步识别离子迁移频率特征,从而提高纳米孔道测量界面的氨基酸识别能力,精准获得蛋白质单分子序列信息。

    (8)在所述蛋白质或多肽相对于所述孔移动时,进行一或多个测量,测量和分析穿过所述孔的电流,包括电流幅值、频率、形状和持续时间等特征,从而测定所述分析物是否存在或其一或多个特征。根据数学变换解析出该电流信号的特征,建立多肽数据库进行数据的相互校正,从而表征所述蛋白或多肽。

    其中,同种多肽分子在步骤(6)所示的6类正交识别纳米孔道中的测量时间具有差异,且不同氨基酸在每一种孔道内的传感灵敏区域停留时间不同,导致了各个孔道之间对氨基酸的测序时间轴存在差异。因此,本发明在六大类氨基酸识别中分别引入了标签氨基酸,如第(ⅰ)、(ⅱ)、(ⅳ)、(ⅵ)类正交识别纳米孔道中的组氨酸h,第(ⅲ)、(ⅳ)、(ⅵ)类正交识别纳米孔道中的异亮氨酸(i),第(ⅱ)、(ⅲ)、(ⅴ)类正交识别纳米孔道”中的半胱氨酸c,第(ⅱ)、(ⅳ)、(ⅵ)类正交识别纳米孔道中的酪氨酸y等。大多数待测氨基酸均有至少两类正交识别纳米孔道进行专一性识别,从而从多角度修正、统一不同孔道内的测序时间轴,实现对六种孔道测得离子流电信号的交叉、校正和精准整合。

    此外,本项目对氨基酸的翻译后修饰可以在氨基酸序列测定的同时被检测。例如,丝氨酸s、苏氨酸t、组氨酸h的磷酸化修饰可在步骤(6)所示的第(ⅰ)、(ⅱ)类正交识别纳米孔道中识别。天门冬氨酸d、谷氨酸e的甲基化修饰可在步骤(6)所示的第(ⅰ)类正交识别纳米孔道”中识别。天门冬酰胺n、苏氨酸t、丝氨酸s的糖基化修饰可在步骤(6)所示的第(ⅰ)、(ⅱ)、(ⅴ)类正交识别纳米孔道中识别。因此,本项目可在识别多肽氨基酸序列的同时,有望同时实现对特定氨基酸翻译后修饰种类、数量、位置的精准测定。

    其中,步骤(7)中在温度扰动方面是利用温度变化来显著改变分子的随机振动以及分子间的相互作用等,本发明通过在0-40℃范围内精准调控实验体系温度,实现最大化刺激由相互作用产生的离子迁移率变化程度,从而提升单个氨基酸频率特征的信噪比。在频率为0.1-1mhz的交变电场扰动方面拟设计功能化扰动体系微扰放大纳米孔道,通过定点突变调整孔道的直径和电荷分布,并在孔道内引入离子结合氨基酸,如突变型s236d/e/k/h/r、a260d/e/k/h/r、k238h/r/d/e、t240d/e、s256h/r/w等,如mg2 、ni 等,从而使得在特定交变电场频率下诱导诱导放大阳离子相互作用引起的离子迁移率变化,从而增强识别具有较小差异的氨基酸,如天门冬酰胺n和谷氨酰胺q、异亮氨酸i和缬氨酸v等。

    在步骤(7)中光学扰动方面,本发明设计高度限域的纳米孔道,使其在电荷敏感区域相互作用类型多样,如突变型s236w/h、k238i/l、s256y/f/w、p249w、v250i/l/f/y/w等,从而利用特定频率的红外(10000-25000nm)或紫外光(180-400nm),扰动待测多肽与孔道内部特定氨基酸的弱相互作用,如氢键、p-p相互作用、p-p相互作用等,提升具有相似弱相互作用以及同分异构体氨基酸的识别,如丝氨酸s和苏氨酸t、亮氨酸l和异亮氨酸i等。

    在步骤(8)中测量蛋白质或多肽的一个、两个、三个、四个或五个或更多个特征。一或多个特征优选地是选自:(i)蛋白质或多肽的序列;(ii)蛋白质或多肽是否被修饰以及被修饰的氨基酸种类,位置,个数;(iii)蛋白质或多肽的长度;(iv)蛋白质或多肽的一致性;(v)蛋白质或多肽的构象;(vi)蛋白质或多肽的二级结构。

    附图说明

    图1:蛋白质/多肽测序方法流程图。

    图2:n226q电性初筛aerolysin纳米孔道分别检测glu-gly-cys和glu-cys-gly两种三肽分子的原始电流轨迹。

    图3:t232k电性初筛aerolysin纳米孔道检测glu-gly-cys和glu-cys-gly两种三肽分子混合物的原始电流轨迹。

    图4:t232k/k238q多肽测序aerolysin纳米孔道分别检测glu-gly-cys和glu-cys-gly两种三肽分子的原始电流轨迹。

    图5:野生型电性初筛aerolysin纳米孔道分别检测模板多肽分子和两种磷酸化多肽分子的原始电流轨迹。

    图6:t232k/k238q磷酸化检测aerolysin纳米孔道分别检测模板多肽分子和两种磷酸化多肽分子的原始电流轨迹。

    实施例1

    一种利用半胱氨酸专一型aerolysin纳米孔道多肽分子测序的方法,多肽以glu为引导链,两种多肽分子的氨基酸序列分别为glu-gly-cys和glu-cys-gly。具体步骤如下:

    (1)设计了n226q和t232k两个电性初筛孔道,利用定点突变技术表达并纯化了相应的突变型proerolysin蛋白用于孔道构建,具体步骤如参考专利cn202010131704.8。

    (2)将1mg/ml的proerolysin蛋白与胰蛋白酶10:1混合并在室温下孵育6小时,得到具有成孔活性的aerolysin单体蛋白。

    (3)将实验温度控制在22±1℃。在两个检测池中分别加入1ml(1.0mkcl,10mmtris,1.0mmedta,ph=8)缓冲溶液,用提拉法制备磷脂双分子层,具体步骤参考专利cn201510047662.9。

    (4)在稳定的磷脂双分子层形成后,施加200mv电压,在cis检测池中加入1µl的aerolysin单体蛋白质。aerolysin单体自组装形成七聚体并插入磷脂膜中形成稳定的纳米孔道,同时,离子流发生跃升,在100mv电压下获得稳定的开孔电流。

    (5)在cis检测池中加入4µl浓度为50mm的三肽链,施加120mv的外加电压。采集到的原始电流轨迹如图2-3所示。图2和图3为n226q和t232k电性初筛aerolysin纳米孔道分别检测glu-gly-cys和glu-cys-gly两种三肽分子的原始电流轨迹。首先由电性初筛孔道判断多肽的电性,两种三肽分子在n226q电性初筛孔道中分别出现了电流阻断信号(图2)。在t232k电性初筛孔道中没有出现电流阻断信号,图3中为加了两种多肽分子混合物的电流轨迹。因此,我们判断两种多肽分子都是由负电荷驱动的。

    (6)进一步设计了t232k/k238q双突变型多肽测序孔道,利用定点突变技术表达并纯化了突变型proerolysin蛋白用于孔道构建。

    (7)重复以上纳米孔道构建步骤,分别在cis检测池加入两种多肽分子,如图4所示,两种多肽分子在t232k/k238q双突变型多肽测序孔道中产生了两种阻断信号,其中阻断时间较长的特征性双台阶的阻断信号是由引导链glu牵引的n端进孔的多肽分子产生的阻断信号,而阻断时间很短的信号为非引导链牵引进孔的多肽分子产生的阻断信号。根据阻断信号的形状、阻断时间和程度可以区分两种多肽分子的序列。

    实施例2

    一种利用突变型aerolysin纳米孔道检测磷酸化多肽的方法,以s-k-i-g为引导链,模板多肽序列为s-k-i-g-s-t-e-n-l,分别在第五位的丝氨酸和第六位的苏氨酸进行磷酸化修饰的到的序列分别为s-k-i-g-ps-t-e-n-l和s-k-i-g-s-pt-e-n-l。具体步骤如下:

    (1)设计了野生型电性初筛孔道,表达并纯化了野生型的proerolysin蛋白用于孔道构建,具体步骤如参考专利cn202010131704.8。

    (2)将1mg/ml的proerolysin蛋白与胰蛋白酶10:1混合并在室温下孵育6小时,得到具有成孔活性的aerolysin单体蛋白。

    (3)将实验温度控制在22±1℃。在两个检测池中分别加入1ml(1.0mkcl,10mmtris,1.0mmedta,ph=8)缓冲溶液,用提拉法制备磷脂双分子层,具体步骤参考专利cn201510047662.9。

    (4)在稳定的磷脂双分子层形成后,施加200mv电压,在cis检测池中加入1µl的aerolysin单体蛋白质。aerolysin单体自组装形成七聚体并插入磷脂膜中形成稳定的纳米孔道,同时,离子流发生跃升,获得稳定的开孔电流。

    (5)在cis检测池中加入5µl浓度为1mm的多肽溶液,施加100mv的外加电压。采集到的原始电流轨迹如图5所示,三种多肽分子在野生型aerolysin纳米孔道中产生了很少数的电流阻断信号,判断三种多肽分子由负电荷驱动。

    (6)进一步设计了t232k/k238q双突变型磷酸化检测孔道,利用定点突变技术表达并纯化了突变型proerolysin蛋白用于孔道构建。

    (7)重复以上纳米孔道构建步骤,分别在cis检测池加入三种多肽分子,如图6所示,根据多肽分子在t232k/k238q孔道产生的阻断信号的形状、阻断时间和程度可以区分模板多肽分子和两种磷酸化多肽分子。

    以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。


    技术特征:

    1.一种采用aerolysin纳米孔道蛋白质/多肽测序方法,包括以下步骤:

    (1)蛋白质解折叠;(2)端位测序起点标记;(3)带电性初步筛选;(4)多肽三级结构解折叠;(5)氨基酸正交识别;(6)限域微扰辅助氨基酸识别;(7)单分子蛋白质序列测定。

    2.根据权利要求1所述一种采用aerolysin纳米孔道蛋白质/多肽测序方法,其特征在于,所述步骤(1)蛋白质解折叠中,单个蛋白质分子在纳米孔道测序前必须解开其高级结构以线性直链的方式进入单个纳米孔道,单个蛋白质在经由温度调控和ph调控的方法将去折叠。

    3.根据权利要求1所述一种采用aerolysin纳米孔道蛋白质/多肽测序方法,其特征在于,步骤(2)端位测序起点标记利用特定序列的肽核酸、寡聚核苷酸、多肽链或有机功能团标记去折叠多肽链的n端或c端为测序起点,从而获得离子流起点标签信号。

    4.根据权利要求1所述一种采用aerolysin纳米孔道蛋白质/多肽测序方法,其特征在于,步骤(3)带电性初步筛选中,设计电性的初步筛选纳米孔道。

    5.根据权利要求1所述一种采用aerolysin纳米孔道蛋白质/多肽测序方法,其特征在于,步骤(4)多肽三级结构解折叠中,为辅助电荷初筛,进一步设计三级结构解折叠纳米孔道,即在生物纳米孔道入口处构建解折叠域以进一步打开多肽分子结构,即突变型t284/f/y/i/l/w或g214/f/y/i/l/w。

    6.根据权利要求1所述一种采用aerolysin纳米孔道蛋白质/多肽测序方法,其特征在于,步骤(5)氨基酸正交识别中,采用针对每一种带电特性的线性多肽分子测序,设计至少包含以下六种正交识别的纳米孔道:

    (a)基于静电相互作用,即突变型t218k/r/h/d/e、s278k/r/h/d/e、s276k/r/h/d/e、t274k/r/h/d/e、a224q/n/d/e/r/k/h拟实现对第一类氨基酸的识别,包括但不仅限于h、r、k、e、d、q、n、w;

    (b)基于氢键及亲水作用,即突变型t218n/q、q212r/k/h、d209s/t、s276q/n、d222g/a/s或a224e/d,拟实现对第二类氨基酸的识别,包括但不仅限于q、n、y、t、s、c、g、h;其中,组氨酸his中r基的pka为7,可通过微调ph使其不带电,从而基于其与关键区域的氢键相互作用使其该特异性纳米孔道中实现区分;

    (c)基于范德华相互作用,即突变型r220s/t/a、d222g/a、s236i/l/v、g270i/l、t232i/l/v、t274g/a/i/l或k238f/y/w,拟实现对第三类氨基酸的识别,包括但不仅限于i、l、m、v、p、a、c、g;

    (d)基于部分氨基酸侧链的大p键,即突变型d222w/h/f/y、s276f/y、a224k/r/w、s272w/h或t274w/h/f/y,拟实现对第四类氨基酸的识别,包括但不仅限于w、p、f、y、h、i、l、v;

    (e)基于小位阻效应,即突变型s276f/y/i/l、s278f/y/i/l/p、t274w/p、s236w或k238g/w/i/l/f/y/p,拟实现对第五类小体积氨基酸的识别,包括但不仅限于a、c、g、s、t、v;

    (f)基于大位阻效应,即突变型t218g/a、s276g/a、s278g/a、t274g/a、n226d/e、q268s/t/g/a,拟实现第六类大体积氨基酸的识别,包括但不仅限于w、h、i、k、r、y。

    7.根据权利要求1所述一种采用aerolysin纳米孔道蛋白质/多肽测序方法,其特征在于,步骤(6)限域微扰辅助氨基酸识别中,针对部分结构差异较小的氨基酸及异构体氨基酸之间可能引入的识别误差,配合特定纳米孔道进一步提高测序准确性,引入交变电场、光学微扰测量体系,同时设计扰动体系微扰放大纳米孔道,所述特定纳米孔道如下所示:

    (a)突变型s236d/e/k/h/r、a260d/e/k/h/r、k238h/r/d/e、t240d/e、s256h/r/w结合交变电场微扰体系;

    (b)突变型s236w/h、k238i/l、s256y/f/w、p249w、v250i/l/f/y/w结合光学微扰体系。

    8.根据权利要求1所述一种采用aerolysin纳米孔道蛋白质/多肽测序方法,其特征在于,步骤(7)单分子蛋白质序列测定的方法为:

    (a)使所述蛋白或多肽与所述孔接触,使得所述蛋白或多肽相对于所述孔移动;

    (b)在所述蛋白或多肽相对于所述孔移动时,测量穿过所述孔的电流,其中所述电流指示所述蛋白或多肽的一或多个特征,包含电流信号的形状、幅值、持续时间,根据数学变换解析出该电流信号的特征,建立多肽数据库进行数据的相互校正,从而表征所述蛋白或多肽。

    9.根据权利要求1所述采用aerolysin纳米孔道蛋白质/多肽测序的方法,具体步骤如下所示:

    样本前处理:采用升高温度至60-100℃、降低溶液ph至0-5的方法破坏蛋白质内部氢键,同时采用三(2-羧乙基)膦(tcep)或二硫苏糖醇(dtt)还原剂破坏蛋白质其s-s键,释放并线性化单个蛋白质中的多肽链;

    通过在多肽链的n端特异性修饰肽核酸pna、寡聚核苷酸、多肽链或有机功能团使其在进入纳米孔道的起始或终止产生特异性的离子流阻断台阶信号或荧光信号,从而确定单个多肽分子纳米孔道测序的起点,并为多个正交识别纳米孔道并行测序信号的互相校正提供起始时间标签;

    采用变性剂以及设计构建“三级结构解折叠纳米孔道”实现多肽三级结构的解折叠,其中,对于“三级结构解折叠纳米孔道”的设计为在aerolysin纳米孔道入口处仿生构建蛋白酶体19s域的中心氨基酸环境,用于增强纳米孔道入口处与多肽的特异性非共价相互作用,并借助电驱动力,逐步破坏多肽分子内部的弱相互作用,驱动其进入限域孔道内部并实现线性解折叠,从而克服多肽三级结构对纳米孔道多肽测序的一大挑战;

    设计可驱动不同带电性质多肽的功能化aerolysin纳米孔道,初步筛选多肽的电荷性质以匹配选择下一步正交测序纳米孔道;

    基于静电作用、氢键及亲水作用、范德华相互作用、氨基酸大p键相互作用、大位阻效应和小位阻效应,针对由于每一种带电特性的多肽构建6类正交识别纳米孔道用以专一性识别氨基酸序列;

    在每一个正交识别纳米孔道入口区域引入易形成氢键的氨基酸,并调节该区域限域孔道结构,从而设计构建多肽二级结构标签域,在该区域中,孔道内部氨基酸残疾将与不同二级结构的多肽形成特定规则的氢键相互作用,从而诱导特异性的离子流阻断及特定离子迁移率的变化,形成二级结构标签离子流特征,用以数据处理时对单个蛋白质测序离子流电信号的校准降噪;

    针对氨基酸正交识别可能存在的氨基酸识别误差,采用离子流限域微扰技术,结合特定设计的纳米孔道放大温度扰动、交变电场扰动及光学扰动对孔道内离子迁移率的影响,进一步识别离子迁移频率特征,从而提高纳米孔道测量界面的氨基酸识别能力,精准获得蛋白质单分子序列信息;

    在所述蛋白质或多肽相对于所述aerolysin纳米孔道移动时,进行一或多个测量,测量和分析穿过所述孔的电流,包括电流幅值、频率、形状和持续时间等特征,从而测定所述分析物是否存在或其一或多个特征,根据数学变换解析出该电流信号的特征,建立多肽数据库进行数据的相互校正,从而表征所述蛋白或多肽。

    10.根据权利要求1所述一种采用aerolysin纳米孔道蛋白质/多肽测序方法,其特征在于,所述步骤(2)中的有机功能团为fam、vic、cy5、hex、rox。

    11.根据权利要求1所述一种采用aerolysin纳米孔道蛋白质/多肽测序方法,其特征在于,所述步骤(3)中采用的变性剂为盐酸胍或gdhcl。

    12.根据权利要求1所述一种采用aerolysin纳米孔道蛋白质/多肽测序方法,其特征在于,所述步骤(3)中所述电驱动力为电泳力、电渗流、介电泳力。

    13.根据权利要求1所述一种采用aerolysin纳米孔道蛋白质/多肽测序方法,其特征在于,所述步骤(3)中设计可驱动不同带电性质多肽的功能化aerolysin纳米孔道具体方法为:采用4种“电性初筛纳米孔道”分别针对性捕获4类带电性质多肽即负电荷多肽、正电荷多肽、电中性且正负电荷相互屏蔽多肽以及电中性且正负电荷分离多肽。

    14.根据权利要求5所述一种采用aerolysin纳米孔道蛋白质/多肽测序方法,其特征在于,所述步骤4种“电性初筛纳米孔道”分别为特异性识别带负电多肽的“电性初筛纳米孔道”、特异性识别带正电多肽的“电性初筛纳米孔道”、特异性识别电中性且正负电荷相互屏蔽多肽的“电性初筛纳米孔道”、特异性识别电中性且正负电荷分离多肽的“电性初筛纳米孔道”;这4钟孔道的设计分别如下:

    (i)特异性识别带负电多肽的“电性初筛纳米孔道”:通过调节aerolysin纳米孔道内部关键区域直径或转移孔道内电荷至直径较宽区域,即将aerolysin纳米孔道中的aerolysin蛋白改为突变型t274n/q/i/l、t232d/e、k238h/d/r/f/a/c/g/q/e/k/l/m/n/s/y/t/i/w/p/v或s280t/n/q/h/i/l,控制其纳米孔道内部由孔道最窄处电荷决定的电渗流为零,并减小介电泳力,使单个带负电多肽由电泳力驱动进入纳米孔道;

    (ii)特异性识别带正电多肽的“电性初筛纳米孔道”:通过引入或增大aerolysin纳米孔道内负电荷的分布,即将aerolysin纳米孔道中的aerolysin蛋白改为突变型t274d/e、t218d/e、s276d/e、s278d/e、k238a/n/d/e/q、r282d/e/s/t/n/q/a或r220d/e/s/t/n/q/a,从而调节由孔道内部阳离子决定的电渗流;在实验中,施加反向电压,从而实现对单个正电荷多肽的高效捕获;

    (iii)特异性识别电中性且正负电荷相互屏蔽多肽的“电性初筛纳米孔道”:对于电中性且其中正负电荷互相屏蔽的多肽,通过在aerolysin纳米孔道内直径较小区域引入正电荷氨基酸,即将aerolysin纳米孔道中的aerolysin蛋白改为突变型t218k/r/h/n/q、s276k/r/h、s278k/r/h/n/q、s274k/r/h、n226k/r/h、s272k/r/h、g270k/r/h、s228k/r/h、q268k/r/h、t230k/r/h、a266k/r/h、t232k/r/h、s264k/r/h、g234k/r/h、n262k/r/h、s236k/r/h、a260k/r/h或s280n/q,用以增强孔道内部由阴离子决定的电渗流,从而增强纳米孔道对于电中性且正负电荷相互屏蔽多肽的捕获效率,获得特异性离子流响应;

    (iiii)特异性识别电中性且正负电荷分离多肽的“电性初筛纳米孔道”;

    对于电中性且其中正负电荷分离的多肽,通过增强aerolysin纳米孔道入口处的电势梯度,即将将aerolysin纳米孔道中的aerolysin蛋白变为突变型s280q/n/a、t284q/n/a或g214q/n/a,调控于非线性的电场强度,从而利用介电泳力驱动单个电中性且正负电荷分离多肽进入孔道。

    15.根据权利要求5所述一种采用aerolysin纳米孔道蛋白质/多肽测序方法,其特征在于,所述步骤(5)中6类正交识别纳米孔道构建方法如下所示:

    (i)基于静电相互作用,在孔道内现有电流传感区域中引入带电荷氨基酸,即将aerolysin纳米孔道中的aerolysin蛋白改为突变型t218k/r/h/d/e、s278k/r/h/d/e、s276k/r/h/d/e、t274k/r/h/d/e或a224q/n/d/e/r/k/h;带电荷氨基酸的引入会增强孔道与待测氨基酸之间的氢键、盐键和阳离子-p相互作用,从而实现对第一类氨基酸的识别,包括但不仅限于h、r、k、e、d、q、n、w;

    (ii)基于氢键及亲水作用,调控孔道内电流传感区域的电势梯度,即将aerolysin纳米孔道中的aerolysin蛋白改为突变型t218n/q、q212r/k/h、d209s/t、s276q/n、d222g/a/s或a224e/d,用以加快带电荷氨基酸通过该区域的速度并延长极性不带电氨基酸在此区域内的停留时间,从而实现对第二类氨基酸的识别,包括但不仅限于q、n、y、t、s、c、g、h;其中,组氨酸h中r基的pka约7,可通过微调ph使其不带电,从而基于其与纳米孔道关键传感区域的氢键相互作用,使其在该特异性纳米孔道中实现特征区分;

    (ⅲ)基于范德华相互作用,调控孔道整体的电势分布和孔道立体结构分布,引入疏水氨基酸域,即将aerolysin纳米孔道中的aerolysin蛋白改为突变型r220s/t/a、d222g/a、s236i/l/v、g270i/l、t232i/l/v、t274g/a/i/l或k238f/y/w,使得电流传感区域从野生型孔道的静电敏感域转移到突变型孔道的疏水域中,从而通过相互作用延长特定氨基酸在该区域的停留时间,获得特征离子流信号,从而拟实现对第三类氨基酸的识别,包括但不仅限于i、l、m、v、p、a、c、g;

    (iv)基于部分氨基酸大p键相互作用,在调控孔道立体结构和电势分布的基础上,重构aerolysin纳米孔道内的电流传感区域组成,构建以正电荷氨基酸及输水氨基酸为主导的灵敏区域,即将aerolysin纳米孔道中的aerolysin蛋白改为突变型d222w/h/f/y、s276f/y、a224k/r/w、s272w/h或t274w/h/f/y,用以增强该灵敏区域与特定氨基酸的p-p相互作用、阳离子-p键相互作用、p-p相互作用,从而实现对第四类氨基酸的识别,包括但不仅限于w、p、f、y、h、i、l、v;

    (v)基于大位阻效应,进一步减小孔道内电流传感区域的限域空间,增大该区域的位阻,即将aerolysin纳米孔道中的aerolysin蛋白改为突变型s276f/y/i/l、s278f/y/i/l/p、t274w/p、s236w或k238g/w/i/l/f/y/p,从而延长所有氨基酸通过该区域的时间,增强小体积氨基酸的离子流信号电流幅值,并使得大体积氨基酸造成近乎全阻断离子流台阶,从而特异性区分氨基酸体积,实现对第五类小体积氨基酸的识别,包括但不仅限于a、c、g、s、t、v;

    (vi)基于小位阻效应,调控孔道内的立体结构,增大电流关键区域的尺寸,即将aerolysin纳米孔道中的aerolysin蛋白改为突变型t218g/a、s276g/a、s278g/a、t274g/a、n226d/e或q268s/t/g/a,并基于多肽整体的带电荷类型减小纳米孔道内的电渗流,从而进一步减小小体积氨基酸的电流响应,增强大体积氨基酸的电流差异,实现第六类大体积氨基酸的识别,包括但不仅限于w、h、i、k、r、y。

    技术总结
    本发明提供了一种基于Aerolysin纳米孔道的用于蛋白质/多肽测序的方法,实现对天然氨基酸及其翻译后修饰的特异性分辨和单分子蛋白质序列的精准获取,包括以下多个步骤:(1)蛋白质解折叠;(2)端位测序起点标记;(3)带电性初步筛选;(4)多肽三级结构解折叠;(5)氨基酸正交识别;(6)限域微扰辅助氨基酸识别;(7)单分子蛋白质序列测定。该方法针对20种氨基酸序列信息灵敏检测,建立了针对单个蛋白质分子氨基酸序列及翻译后修饰精准测量的创新方法。

    技术研发人员:龙亿涛
    受保护的技术使用者:南京大学
    技术研发日:2020.10.28
    技术公布日:2021.03.12

    转载请注明原文地址:https://wp.8miu.com/read-20492.html

    最新回复(0)