本发明涉及人免疫球蛋白g的提纯技术领域,采用计算机模拟技术仿生设计人igg的亲和肽配基库,然后利用亲和色谱试验验证肽分子对人igg的纯化效果,属于生物仿生设计中的计算机模拟和下游蛋白分离纯化技术领域。
背景技术:
当前抗体被广泛地应用于医学诊断和疾病治疗中,2006年fda批准的20余种抗体类药物全球销售额超过170亿美元,其中igg是血清中主要的抗体成分,约占血清ig的75%,也是需求量最大的一类抗体。抗体药物制备通常采用沉淀、离子交换色谱、疏水性相互作用色谱、亲和色谱等方法完成,其过程成本约占生产成本的30%~40%。金黄色葡萄球菌蛋白a(spa)、蛋白g和蛋白l作为亲和配基已广泛用于制备高纯度抗体,这类配基特异性高,然而过高的亲和力需要较苛刻的洗脱条件,容易导致目标蛋白变性和配基脱落,吸附容量较低,此外这类配基的制备也比较困难,价格昂贵,蛋白经固定化后一般会失去部分活性,以上使得蛋白类配基的应用受到限制。
多肽作为亲和配基具有较多优越性,但自然界中与目标蛋白有亲和力的多肽数量十分有限,如何选择合适的多肽序列作为亲和配基,以及如何提高多肽的亲和力和选择性的问题是影响多肽亲和色谱应用的关键。现有的筛选和设计方法主要分为实验筛选和理性设计,实验筛选是基于组合库技术进行高通量实验筛选,理性设计主要是基于目标蛋白或已有配基的结构和性质设计新配基。
天津大学孙彦教授课题组采用6个spa关键残基:f132、y133、h137、e143、r146和k154构建模拟体系,利用分子对接和分子动力学模拟进行多肽库的筛选,可获得人igg纯度在88%以上、回收率在65%以上的线性八肽分子fywhclde、fythcake等,虽然其纯化效果也较好,但是离商业化应用还有较长的路程,其是基于蛋白a与igg之间的疏水作用模型进行模拟,但获得的多肽序列却是基于静电作用与higg进行结合,本领域公知静电作用不是特异性吸附作用,易吸附其它生物质分子,获得的蛋白纯度不高,很难商业化利用。
技术实现要素:
本发明基于蛋白a与higg-fc片段上的ch3结合区域(higg-fc-ch3),选取结合区域中的氨基酸序列ser383-asn389(sngqpen)作为模拟对象,利用其三维结构信息,构建以cys作为连接残基的环状肽库,接着采用半柔性分子对接程序ledock和flexx将多肽库中的多肽分子依次与higg-fc片段进行分子对接(两次半柔性分子对接),根据打分分数选取结合自由能较高的多肽分子,然后利用amber软件程序将初筛得到的多肽系列与fc片段之间进行分子动力学模拟,排除不能与fc片段稳定结合的多肽序列,以上属于本发明的计算机模拟设计部分,然后进行实验验证部分,即通过亲和色谱试验验证模拟得到的多肽序列与higg之间的实际结合情况以及纯化效果,确定能够实际与higg特异性结合的亲和环状肽配基。
本发明具体技术方案为一种疏水性环状肽配基纯化人免疫球蛋白g的应用,所述疏水性环状肽配基的序列为-[hwg-c-akte]-、-[yf-c-wrhe]-、-[wv-c-lhhyf]-、-[pyf-c-tie]-、-[fy-c-dehl]-,其中纯化效果最好的环状肽配基的序列为-[hwg-c-akte]-。
所述疏水性环状肽配基是通过计算机模拟仿生设计得到的,所述仿生设计方法包括如下步骤:1)构建模拟体系:选取pbd数据库id为1fc2的蛋白a(spa)-人igg(higg)复合物的晶体构象,提取蛋白a与higg-fc片段上的ch3结合区域,该结合区域的氨基酸序列为ser383-asn389(sngqpen),选取该结合区域的三维坐标作为模拟体系的坐标信息;2)获取仿生多肽库:用namd软件计算ser383-asn389序列中各残基之间的距离,以cys为连接残基,在cys周围插入5至7个氨基酸残基x,组成环状多肽链-[xxx-c-xxxx]-、-[xx-c-xxxx]-、-[xx-c-xxxxx]-、-[xxx-c-xxx]-、-[xx-c-xxx]-,采用autodock分子对接程序进行氨基酸定位,筛选确定氨基酸残基x的种类,x代表除cys以外的19中常见氨基酸残基,调用gromos程序获取包含环状6肽、环状7肽和环状8肽序列的仿生多肽库;3)多肽库的初筛:利用ledock分子对接软件将多肽库中的多肽序列与higg-fc片段进行半柔性对接;4)多肽库的复筛:利用flexx软件将步骤(3)初筛得到的多肽序列与fc片段再次进行半柔性分子对接;5)分子动力学模拟筛选:利用amber软件包对步骤(4)得到的多肽系列进行分子动力学模拟,排除不能与fc片段稳定结合的多肽序列;6)将步骤(5)得到的多肽序列装柱,进行亲和色谱纯化higg研究,计算纯化higg的纯度和回收率,确定能够与higg进行稳定疏水性结合的有效亲和肽配基。
优选的,步骤(3)中根据对接打分分数,挑选结合自由能低于-6.0kcal/mol的多肽分子进行下一轮的筛选;步骤(4)中依据打分分数选取结合自由能低于-7.0kcal/mol的多肽分子进行下一轮的筛选。
步骤(2)总共获得包含4256条多肽库序列的肽库,步骤(3)中根据对接打分分数,挑选亲和结合力低于-6.0kcal/mol的多肽分子(共1135条)进行下一轮的筛选;步骤(4)中依据打分分数选取亲和结合力低于-7.0kcal/mol的多肽分子(共157条)进行下一轮的筛选,通过md模拟筛选出可与higg-fc有稳定运行轨迹的10条多肽序列,通过亲和色谱试验,最终筛选出能够与higg特异性结合的有效亲和肽配基:序列为-[hwg-c-akte]-(简称pep1)、-[fy-c-wrhe]-(简称pep2)、-[wv-c-lhhyf]-(简称pep3)、-[pyf-c-tie]-(简称pep4)、-[fy-c-dehl]-(简称pep5)。
以上5个亲和肽配基其简化的结构式如下:
cys残基的选取是为了便于将多肽序列固定到色谱介质(thiopropylsepharose6b)上,肽配基的结构式当中,实心球代表色谱介质,实心球与cys之间的键代表二硫键。将多肽连接到thiopropylsepharose6b介质上后,即可将色谱介质装柱,进行亲和色谱纯化实验。
本发明与天津大学孙彦教授课题组采用的配基设计方法和结果有如下不同之处:
1)首先,本发明的模拟体系不同,本发明选取的是蛋白a与higg-fc片段上的ch3结合区域中的ser383-asn389(sngqpen)三维序列,而不是以spa上的6个关键残基(f132,y133,h137,e143,r146和k154)作为模拟对象,也就是说,对接采用的模板蛋白三维结构是根本不同的。
2)本发明采用的分子对接软件不同,ledock分子对接软件特别适合蛋白配体体系的对接,运用charmm力场,可除去蛋白中的离子、金属、水分子等,且ledock在对接构象得分上的情况要优于autodockvina,将配体的优化构象作为分子对接的输入,根据得分最高的构象的结构,ledock的表现(57.4%)要优于autodockvina(49.0%),也就是说,ledock更适合higg与肽配基体系的对接,其采样算法能更好的对数据库中的配体进行性能评估,采样算法和评分函数是对接软件最关键的计算模块,对对接结果的准确性有决定性影响。
3)本发明多肽库复筛采用的flexx为半柔性对接软件,采用flexx进行对接的过程中肽配基构象可在一定范围内变化,但构象的变化调整受到一定程度的限制,如某些非关键的键长、键角等,higg-fc片段的构象则是固定的,flexx对接方法兼顾计算效率和精度,而flexpepdock为柔性对接,其在对接过程中,配基和模板蛋白的构象均可变化,柔性对接虽能精准确定分子间的识别情况,但模板蛋白和配基构象的变化导致其计算量非常大,速度较慢,效率低,且如何能准确模拟大分子蛋白的构象变化也是目前对接软件普遍面临的难点,且孙教授课题组已公开发表:spa-igg结合主要由疏水作用和氢键主导,多肽是根据spa-igg复合物设计的,但该课题组得到的多肽与igg结合以静电作用和氢键为主,为何与蛋白a在结合机理方面差异巨大,分析原因在于flexpepdock对接软件的局限性,已有报导证明分子对接往往会低估多肽和目标蛋白之间的疏水作用,例如,芳香基团之间的pi-pi相互作用,使用flexpepdock软件进行计算时,默认为0。因此基于对接效率和精度的双重考虑,本发明采用flexx半柔性对接软件而非flexpepdock全柔性对接,flexx采用经验打分函数,综合考虑疏水相互作用、静电作用和氢键,残基之间的成对偏好性、几何互补性。
4)本发明进行分子动力学(md)模拟采用的程序是amber而非gromos,md模拟能在原子水平上模拟分子之间的作用机理,通过md模拟蛋白-配基体系的运行轨迹可以获得模拟体系的多种性质,如分子构象、能量、动力学性质以及蛋白-配基之间的相互作用能等,本发明采用amber模拟方法是基于其处理环肽的方法较gromos更简便、精确,环肽的模拟与直链肽的区别在于,环肽收尾相接,在读入amber或gromos时需做处理,否则会被当做n段和c端残基自动进行处理,amber处理的方式是将多肽的pdb文件中两端氨基酸当成普通的处于中端的氨基酸残基来处理,主要使环中每个氨基酸都没有特殊性,gromos对端基氨基酸的处理方式则是与在力场中定义处理氨基和羧基的方式相同,环肽残基容易被当做n段和c端残基,需要进行额外的加氢处理,过程复杂,精度也有限。
5)本发明制备得到的是环状肽配基,相比于线性肽分子,柔性低,导致了其在与目标蛋白结合时熵损失较少,可获得较高的结合亲和性,较低的柔性还导致可锁定靶标分子的特异性构象,与线性肽相比,增加了结合特异性。
6)本发明获得的环肽配基与higg之间的亲和作用以疏水性相互作用为主,其次是静电作用和氢键。本发明是基于蛋白a与igg之间的疏水作用模型进行模拟,相应的也获得了以疏水性作用为主导的亲和肽配基,进一步验证了分子模拟设计的有效性,孙教授课题组基于蛋白a模型获得的线性多肽序列是基于静电作用与higg进行结合,然而本领域公知静电作用不是特异性吸附作用,易吸附其它生物质分子,如血清中的白蛋白,获得的higg纯度很难达到商业化利用。
附图说明
图1是pep1介质对higg的亲和色谱吸附实验图,实验条件为:吸附采用缓冲液(20mmol/lpbs,ph7.4),洗脱采用2%的醋酸水溶液;
图2是pep2介质对higg的亲和色谱吸附实验图,实验条件为:吸附采用缓冲液(20mmol/lpbs,ph7.4),洗脱采用2%的醋酸水溶液;
图3是pep3介质对higg的亲和色谱吸附实验图,实验条件为:吸附采用缓冲液(20mmol/lpbs,ph7.4),洗脱采用2%的醋酸水溶液;
图4是pep4介质对higg的亲和色谱吸附实验图,实验条件为:吸附采用缓冲液(20mmol/lpbs,ph7.4),洗脱采用2%的醋酸水溶液;
图5是pep5介质对higg的亲和色谱吸附实验图,实验条件为:吸附采用缓冲液(20mmol/lpbs,ph7.4),洗脱采用2%的醋酸水溶液;
图6是pep6介质对higg的亲和色谱吸附实验图,实验条件为:吸附采用缓冲液(20mmol/lpbs,ph7.4),洗脱采用2%的醋酸水溶液;
图7是pep1介质对higg的亲和色谱吸附实验图,实验条件为:吸附采用缓冲液(20mmol/lpbs,ph7.4),洗脱依次采用0.5mol/lnacl水溶液和2%的醋酸水溶液;
图8是pep1亲和色谱介质从人血清中对higg的亲和色谱纯化实验图;
图9是pep1亲和色谱介质从人血清中对higg进行纯化的凝胶电泳图。
具体实施方式
下面结合附图对本发明作进一步详细地描述,以下实施例是用于解释、而不以任何方式限制本发明。
实施例1构建模拟体系
选取pbd数据库id为1fc2的spa-higg1复合物的晶体构象,提取spa与higg-fc片段上的ch3结合区域,该结合区域的氨基酸序列为ser383-asn389(sngqpen),选取该结合区域的每个氨基酸残基的三维坐标作为模拟体系的坐标信息。
实施例2获取仿生多肽库
用namd软件计算ser383-asn389序列中各残基之间的距离,以cys为连接残基,在cys周围插入5至7个氨基酸残基x,组成环状多钛链-[xxx-c-xxxx]-、-[xx-c-xxxx]-、-[xx-c-xxxxx]-、-[xxx-c-xxx]-、-[xx-c-xxx]-,采用autodock分子对接程序进行氨基酸定位,确定出与ser383-asn389坐标体系作用相匹配且结合位置最佳的氨基酸残基x的种类,x代表除cys以外的19种常见氨基酸残基,调用gromos程序获取可与higg-fc稳定结合的、首尾相接的环状6肽、环状7肽和环状8肽序列的仿生多肽库,该多肽库共包含4256条序列。
实施例3多肽库的初筛
采用ledock分子对接软件将多肽库中的多肽分子依次与higg-fc三维结构进行分子对接,对接结果显示绝大部分多肽都能与fc片段结合,且结合亲和力分布在-3.5—-7.6kcal/mol之间,综合考虑亲和力的大小以及筛选效率,最终选取结合亲和力低于-6.0kcal/mol(亲和力绝对值大于6.0kcal/mol)的多肽分子(共1135条)进行下一轮的筛选。
实施例4多肽库的复筛
利用flexx软件将步骤(3)初筛得到的1135条多肽序列分别再次与higg-fc进行半柔性分子对接,对接结果显示所有多肽都能与fc片段结合,结合亲和力分布在-5.8—-8.5kcal/mol之间,最终选取结合亲和力低于-7.0kcal/mol(亲和力绝对值大于7.0kcal/mol)的多肽分子(共157条)进行下一轮的筛选。本次对接利用flexx再次对配基与蛋白之间的结合构象和亲和力进行了筛选,排除掉ledock分子对接显示的假阳亲和配基,准确度进一步增强。
实施例5分子动力学模拟筛选
分子对接是对多肽与蛋白之间的静态结合构象进行模拟,为了进一步验证pep-higg之间的亲和结合力,还要考虑多肽与蛋白之间的动态结合行为,因此需要采用分子动力学模拟研究两者之间的结合动态信息。利用amber软件包程序对步骤(4)得到的157条多肽序列进行分子动力学模拟,amber运行的动力学过程分为三步:能量最小化、体系平衡和实际动力学模拟。其中能量最小化分为两步,第一步是mini1:限制蛋白,溶剂部分能量最小化,第二步mini2:放松蛋白,整个体系能量最小化;体系平衡也分为两个步骤:第一步,系统在约束蛋白下升温,给系统加热,从0k到300k,运行20ps动力学,第二步体系升压,为了平衡体系,运行100ps的恒温恒压动力学计算;第三步,实际模拟,获取轨迹,运行10ns的分子动力学模拟。在模拟过程中发现,部分多肽分子在与fc片段的接触过程中(10ns),会逐渐发生脱离,也就是说这些多肽分子不能与fc片段产生稳定的结合作用,最终筛选出可与higg-fc有稳定运行轨迹的10条多肽序列:-[hwg-c-akte]-(pep1)、-[fy-c-wrhe]-(pep2)、-[wv-c-lhhyf]-(pep3)、-[pyf-c-tie]-(pep4)、-[fy-c-dehl]-(pep5)、-[mey-c-kage]-(pep6)、-[vy-c-leit]-(pep7)、-[fd-c-tphra]-(pep8)、-[phr-c-gav]-(pep9)、-[fw-c-stpr]-(pep10)。对照试验采用pep6肽配基。
试验部分
主要原料和设备:多肽分子,吉尔生化(上海)有限公司,固相合成法合成;thiopropylsepharose6b介质,gehealthcare;将环肽分子交联到thiopropylsepharose6b介质上制得多肽配基介质(密度:10μmol/g);higg,sigma公司;人血清,北京鼎国生物技术有限责任公司;aktapurifier10色谱仪,gehealthcare;tricorn型色谱柱,hr5/5,gehealthcare。
实施例6
将肽配基介质(pep1-sepharose、pep2-sepharose、pep3-sepharose、pep4-sepharose、pep5-sepharose、pep6-sepharose)装入色谱柱,上样前,采用吸附缓冲液(20mmol/lpbs,ph7.4)进行充分平衡,uv基线达到稳定后,将100μl溶解在吸附缓冲液中的higg(1.0mg/ml)以50μl/min的流速脉冲注入柱子中,蛋白进样后,将吸附缓冲液连续注入柱子中,冲洗未吸附的蛋白,然后将吸附的蛋白用2%的醋酸水溶液以0.8ml/min的流速进行洗脱,洗出液用uv-900检测器在280nm下检测其吸收值。pep1-sepharose另外测试了用0.5mol/lnacl进行洗脱的色谱实验。色谱试验结果见图1-图7。
由色谱图可以看出,图1-图5流出组分中只有微量蛋白流出,说明higg在ph7.4的吸附条件下可全部结合到pep1至pep5亲和介质,结合蛋白能用2%的醋酸水溶液洗出,图7表明nacl溶液无法洗脱吸附的蛋白,这说明肽配基与higg之间的结合以疏水作用为主导,与蛋白a-higg的结合机理相同,这也直接证明了本发明分子模拟设计亲和肽配基的准确性。图6中大量蛋白在进样之后直接流出,洗脱组分中也只有少量蛋白,说明pep6不能与higg有效结合,不能作为higg的亲和肽配基。
实施例7静态吸附等温线测定
将抽干湿介质(pep-sepharose6b介质)用缓冲液进行充分预平衡,称取10mg抽干介质与1.0mlhigg溶液(吸附缓冲液溶解,0.1-5mg/ml)混合,150rpm反应5h,将吸附体系进行2000rpm离心分离6min后,收取上清,用分光光度计测量上清液在280nm下的吸光值从而确定蛋白浓度(c),蛋白吸附密度(q)通过质量平衡计算,应用langmuir模型q=qmc/(kd c)描述吸附等温线,其中qm是吸附容量(mg-蛋白/g-抽干湿介质),kd是表观解离常数。测定结果见表1。
表1
由表1可以看出,pep6介质对higg的吸附容量很低,仅为3.8mg/g,也再次证明了其不是higg的有效亲和肽配基,这与实施例5中亲和色谱试验结果相呼应。
pep1至pep5亲和介质的吸附容量是91.1-136.4mg/g,pep4的吸附容量(91.1mg/g)高于fychwale和fychtide,其余亲和肽配基对higg的吸附容量高于孙教授课题组获得的最优肽配基fywhclde(100.5mg/g),吸附容量越大,表示配基对蛋白的吸附能力越强。kd表示解离常数,kd越小,表示肽配基与蛋白之间的亲和性越高,可以看到pep1和pep2的亲和性最高,优于fywhclde,pep3-pep5的亲和性优于fychwale和fychtide。综合以上数据,可以看出pep1至pep5亲和肽配基对higg的结合亲和性整体上是优于孙教授课题组的三个线性八肽配基的。
实施例8人血清中higg的亲和色谱纯化
根据实施例5-6试验结果确定最优亲和肽配基pep1,采用装有1mlpep1亲和色谱介质的hr5/5色谱柱对血清中的人igg进行纯化,用吸附缓冲液(20mmol/lpbs,ph7.4)作为上样缓冲液并对血清样品进行稀释(稀释10倍),稀释后的血清在上样前进行膜过滤除去不溶物,用上样缓冲液对柱子进行充分平衡直至uv基线走平,然后将500μl的人血清稀释液(总蛋白浓度为8.86mg/ml)以0.5ml/min的流速进样,之后用上样缓冲液冲洗柱子,然后用2%的醋酸水溶液洗脱吸附的蛋白,收集流出组分(ft-1、ft-2)和洗脱组分(e-1、e-2),进行sds-page凝胶电泳,用micro-bcakit检测蛋白回收率,应用gel-proanalyzer软件分析蛋白纯度。试验结果见图8、图9。
由电泳图中可以看出,流出组分中包含大量的人血清白蛋白,只有微量人igg和少量其它杂质,higg能用醋酸水溶液(2%)完全洗脱,将洗脱组分e-1和e-2混合,计算higg的纯度(96%)和回收率(92%),高于fywhclde亲和介质从人血清中纯化higg的纯度(90%)和回收率(87%)。
综上,本发明试验表征结果显示,从吸附容量、结合亲和性以及结合纯化和回收率等方面,本发明设计的环肽配基对人igg的提纯效果,整体上,优于fywhclde、fychwale、fychtide肽配基介质。
也就是说,与孙教授课题组提出的理性设计方法相比,本发明分子模拟设计多肽配基采用的模拟体系、分子对接软件、分子动力学模拟程序、模拟参数与该课题组不同,筛选出的肽配基形状、与higg之间的作用(表观上为吸附和洗脱采用的缓冲液不同)、对higg的结合力和亲和性均不同。因此,两者没有可比性,且综合本发明环肽配基的纯化效果,在整体上也要优于该课题组得到的配基。
1.一种疏水性环状肽配基纯化人免疫球蛋白g的应用,其特征在于:所述疏水性环状肽配基的序列为-[hwg-c-akte]-、-[yf-c-wrhe]-、-[wv-c-lhhyf]-、-[pyf-c-tie]-、-[fy-c-dehl]-。
2.根据权利要求1所述的疏水性环状肽配基纯化人免疫球蛋白g的应用,其特征在于:所述疏水性环状肽配基的序列优选为-[hwg-c-akte]-。
3.根据权利要求1-2任一项所述的疏水性环状肽配基纯化人免疫球蛋白g的应用,其特征在于:所述疏水性环状肽配基是通过计算机模拟仿生设计得到的。
4.根据权利要求3所述的疏水性环状肽配基纯化人免疫球蛋白g的应用,其特征在于:所述仿生设计方法包括如下步骤:
(1)构建模拟体系:选取pbd数据库id为1fc2的蛋白a(spa)-人igg(higg)复合物的晶体构象,提取蛋白a与higg-fc片段上的ch3结合区域,该结合区域的氨基酸序列为ser383-asn389(sngqpen),选取该结合区域的三维坐标作为模拟体系的坐标信息;
(2)获取仿生多肽库:用namd软件计算ser383-asn389序列中各残基之间的距离,以cys为连接残基,在cys周围插入5至7个氨基酸残基x,组成环状多肽链-[xxx-c-xxxx]-、-[xx-c-xxxx]-、-[xx-c-xxxxx]-、-[xxx-c-xxx]-、-[xx-c-xxx]-,采用autodock分子对接程序进行氨基酸定位,筛选确定氨基酸残基x的种类,x代表除cys以外的19中常见氨基酸残基,调用gromos程序获取包含环状6肽、环状7肽和环状8肽序列的仿生多肽库;
(3)多肽库的初筛:利用ledock分子对接软件将多肽库中的多肽序列与higg-fc片段进行半柔性对接;
(4)多肽库的复筛:利用flexx软件将步骤(3)初筛得到的多肽序列与fc片段再次进行半柔性分子对接;
(5)分子动力学模拟筛选:利用amber软件包对步骤(4)得到的多肽系列进行分子动力学模拟,排除不能与fc片段稳定结合的多肽序列;
(6)将步骤(5)得到的多肽序列装柱,进行亲和色谱纯化higg研究,计算纯化higg的纯度和回收率,确定能够与higg进行稳定疏水性结合的有效亲和肽配基。
5.根据权利要求3所述的疏水性环状肽配基纯化人免疫球蛋白g的应用,其特征在于,步骤(3)中根据对接打分分数,挑选结合自由能低于-6.0kcal/mol的多肽分子进行下一轮的筛选。
6.根据权利要求3所述的疏水性环状肽配基纯化人免疫球蛋白g的应用,其特征在于,步骤(4)中依据打分分数选取结合自由能低于-7.0kcal/mol的多肽分子进行下一轮的筛选。
技术总结