本发明涉及生物
技术领域:
,特别涉及一种ago蛋白的用途。同时,本发明还涉及了一种包括该ago蛋白的组合物,以及一种应用该组合物实现真核细胞基因编辑的基因编辑方法。
背景技术:
:靶向基因编辑技术是一类高效率基因组定点改写技术的总称,它的主要优势在于:基因组靶向精度高、基因编辑效率高、应用范围广泛。靶向基因编辑技术可以针对微生物、植物、动物(包括哺乳动物)的细胞或个体,开展基因组的功能研究和遗传改造;进一步地,靶向基因编辑技术与合成生物学技术汇聚,可以实现基因组的改造与物种定制。目前公知的是:基因编辑技术的发展,主要历经了zfn、talen、crispr三代技术系统的演化。至今,crispr-cas9技术已经被广泛应用,可以用于包括酵母、丝状真菌、植物、动物(含哺乳动物及人类细胞)在内的真核细胞内的靶向基因编辑。上述基于zfn、talen、crispr的靶向基因编辑技术都能够引发对靶向位点的dna的切割,造成基因组dna的双链断裂(dsb),促使细胞启动同源介导的修复(hdr)、或者非同源末端连接(nhej)来挽救基因组的完整性。其中,nhej修复保真度低,有可能造成dsb附近的碱基缺失、置换等错误,从而引入突变或者失活基因。在同源序列充当修复模板的前提下,通过hdr修复可以实现精确的基因编辑,包括内源基因的精确修复或外源基因的精确导入。zfn和talen技术需要对蛋白质结构域进行设计和改造而实现基因组的靶向,因而存在成本高、技术难度大、效率低等缺点。crispr是细菌等原核生物用于防御外来dna入侵的初级免疫系统,其中cas9蛋白可以使用人工设计的5’端羟基化的单链向导rna(sgrna),对基因组特定的靶向区域进行识别并结合,之后,cas9蛋白自身的两个核酸酶活性位点切割靶dna,造成靶向区域dna的双链断裂(dsb)并引发nhej或hdr,从而实现基因编辑。crispr技术借助向导寡核苷酸完成对基因组特定位点的靶向,易于实现人工编程,所以crispr技术自2012年问世以来发展迅速,已经成为目前最受欢迎的技术,被广泛应用,该技术也已经形成和积累了大量的公开发表文献。然而,根据已经公开的文献,crispr技术仍然存在一些问题,例如:存在脱靶问题、存在nhej造成的非预期编辑。另一方面,cas9、cpf1等crispr相关蛋白的分子量较大,在开展哺乳动物成体细胞的基因编辑时,导致表达元件的递送困难。上述问题的解决,期待着更小的能够执行靶向基因编辑的蛋白元件、或者由更少的元件构成的更简便的技术体系的开发。argonautes蛋白是普遍存在于从原核细菌到高等生物(包括哺乳动物)的一类有进化谱系的核酸酶。argonautes蛋白的一个普遍的生物学特征是:与短链寡核苷酸互作并实现对相应互补核酸序列的靶向结合。在高等细胞中一些argonautes蛋白参与了非编码rna(ncrna)相关的许多重要生理过程,例如rnai。近几年来,来自原核微生物的prokaryoticargonaute(pago)蛋白的相关研究也取得了有趣的进展,pago也被寄希望用于开发新的基因编辑工具,并形成了一些公开发表的文献,但是与crispr相比较,pago的研究文献目前并不够丰富,也并未能在真核细胞中实现靶向基因编辑。已经公开的专利主要有:发明人为vanderoost,john的wo/2014/189628a1专利公开了dna向导的dna干扰技术,但是否能在常温下采用来自嗜热原核微生物thermusthermophilus的ttago完成细胞内基因组编辑,并没有相关的示例。发明人为doudna,jennifer的wo2015/157534a1专利公开了利用来自原核微生物marinitogapiezophila的mpago进行单链靶标核酸(dna或者rna)切割的技术方法,但是,该专利只有体外实验验证(invitro)实施例、缺乏活体细胞内(invivo)的实施例。发明人为valton,julien的wo2015/140347a1专利,公开了利用dna向导的argonaute干扰系统(dais)工程化哺乳动物基因组的技术,采用序列优化之后可以在30℃到40℃工作的ttago,以一个ttago加两个对向的5’磷酸化的单链向导dna的方式、实施了包括t细胞在内哺乳动物细胞基因组编辑,然而该专利的实施例十分粗糙,其技术方案并未被广泛接受和采用。发明人为沈啸、韩春雨的cn109153990a专利,公开了利用单链向导dna和ngago进行真核细胞基因编辑的技术方案,并且公开了在人类细胞293t中的实施例,然而该技术方案及相关论文一同被全球范围内的多个实验室认定为不可实现。围绕pago相关的主要学术论文发表情况如下:2009年8月25日,kirasmakarova等依据生物信息学的深度挖掘,预测了来自原核生物的pago很可能是一种对抗外来遗传物质入侵的原始防御系统。2013年9月12日,ivanolovnikov等报告了来自rhodobactersphaeroides的rsago能够通过对转录组“采样”而识别监控外来dna。2014年2月16日,daanc.swarts等报道了来自嗜热菌thermusthermophilus的ttago以13–25nt的5’磷酸化的单链dna为向导切割靶向dna,并将这种宿主防御系统称之为dna向导的dna干扰,简称dnai。2015年4月29日,daanc.swarts等在线发表了来自古细菌pyrococcusfuriosus的pfago,该pfago利用5’磷酸化的单链dna为向导,能够靶向切割单链或双链dna,起到防御外来dna入侵的作用。2016年4月12日,eminekaya等报道了来自marinitogapiezophila的与crispr相关的mpago,该mpago以15到40nt的5’羟基化单链rna为向导,能够识别和切割所靶向的单链dna或者单链rna。2016年5月2日,fenggao等报道了来自嗜盐微生物natronobacteriumgregoryi的ngago,该论文声称以24nt的5’磷酸化的单链dna为向导的该ngago,能够在常温下造成哺乳动物细胞靶向基因组位点的双链断裂(dsb)并引发高效率的基因组编辑,然而该论文因重复性危机而与2017年8月3日撤稿。2016年6月21日,tomohiromiyoshi等以的分辨率解析了来自rhodobactersphaeroides的rsago的结构,该rsago识别18nt的guiderna(grna)。2017年3月20日,sarahwillkomm等人和adrianzander等人背靠背刊发了两篇报道,以的分辨率解析了来自于methanocaldococcusjannaschii的mjago的结构,并对mjago催化活性的机制进行了讨论。2019年2月22日和2月25日,antonkuzmenko等人和jorritw.hegge等人分别独立在线发表了来自clostridiumbutyricum的cbago,该蛋白在中等温度(37℃)下能够在单链小干扰dna(smallinterferingdna)引导下以较高的活性切割单链和双链dna。此外,kuzmenko等人还同时发表了来自limnothrixrosea的lrago,该蛋白也能在中等温度下利用向导dna切割单链和双链dna。然而在生理条件下在活体细胞内(特别是真核细胞内),他们并未能够实现靶向基因编辑。2019年4月4日,kokzhilee等人在体外检测出了ngago的dna内切核酸酶活性。2019年7月30日,yuanweicao等人报道了2种来自人类肠道菌群的pago,分别是来自clostridiumperfringens的cpago和来自intestinibacterbartlettii的ibago,这2种pago蛋白能在较宽的温度范围内(4℃-60℃)以单链dna(15~30nt)为向导切割单链和质粒双链dna(double-strandedplasmiddna)。此外,cpago还能够利用向导dna实现对rna的靶向切割。上述几项工作都只是在体外测试了几种来自常温菌的pago的dna切割活性,并且这种活性依赖于单链dna;上述几篇论文并未发现和报告这些pago的体内活性、特别是其在真核细胞中的基因编辑能力。2019年1月30日,leifu等人报告了ngago能够通过与reca结合来促进reca介导的dna链交换,进而增强细菌中基因编辑(插入或删除)的效率。这是至今为止,pago在原核生物体内呈现基因编辑活性的唯一报道,但是ngago仍然不能用于真核细胞的基因编辑。综上,尽管全球范围内有多个团队在努力,但是至今为止,未能在真核细胞中真实地实现基于ago蛋白的靶向基因编辑。技术实现要素:有鉴于此,本发明旨在提出一种ago蛋白的用途,其能够以较为简便的方式进行真核细胞靶向基因编辑。为达到上述目的,本发明的ago蛋白的用途为所述ago蛋白用于真核细胞内的不依赖于外源靶向向导、并基于同源重组的靶向基因编辑。进一步的,所述ago蛋白包括来自常温菌的pago蛋白以及来自嗜热菌的pago蛋白。进一步的,所述ago蛋白是piwi核酸酶活性中心四元基序符合dedx特征的pago蛋白。进一步的,所述pago蛋白是来自常温菌的pago蛋白,并来自halogeometricumpallidum(ncbi登录号:elz29017.1)的hpago,或来自microcystisaeruginosa(ncbi登录号wp_012265209.1)的maago,或来自halorubrumezzemoulense(ncbi登录号:wp_094494460.1)的heago,或来自filamentouscyanobacterium(ncbi登录号:wp_106331578.1)的fcago,或来自mastigocoleustestarum(ncbi登录号:wp_027844945.1)的mtago;或者,所述pago蛋白是来自嗜热菌的pago蛋白,并来自exiguobacteriumsp.(ncbi登录号:acq71053.1)的exago。进一步的,所述ago蛋白是来自常温菌的、piwi核酸酶活性中心四元基序不符合dedx特征的pago蛋白。进一步的,所述pago蛋白是来自pantoeaanthophila(ncbi登录号:wp_046101283.1)的paago,或来自flavobacteriumsoli(ncbi登录号:wp_026705043.1)的fsago。进一步的,所述ago蛋白为piwi核酸酶活性中心突变后不再符合dedx特征的pago蛋白的突变体。进一步的,所述pago蛋白是来自常温菌的hpago的突变体hpagod646a,或者来自嗜热菌的exago的突变体exagod398a/s400a。进一步的,所述ago蛋白含有与所述pago蛋白/突变体的序列同源性大于等于80%的氨基酸序列。本发明的另一目的在于提出一种组合物,其用于真核细胞的靶向基因编辑,且所述组合物由同源重组片段和如上所述的ago蛋白组合而成。进一步的,所述同源重组片段是能够在靶向区域实现基因表达盒插入的同源重组片段,或能够在靶向区域通过替换原有基因片段以实现基因表达盒插入的同源重组片段,或能够在靶向区域实现基因片段插入或替换的同源重组片段,或能够在靶向区域实现基因片段删除的同源重组片段。进一步的,所述组合物中的ago蛋白是所述ago蛋白本身,或者是包括其编码rna/其整合到宿主染色体的表达盒/其表达质粒在内的所述ago蛋白的表达元件。进一步的,所述同源重组片段中,至少一侧的同源臂的长度不低于200bp。进一步的,所述同源重组片段中,至少一侧的同源臂的长度不低于400bp。此外,本发明还提出了一种基因编辑方法,该方法用于真核细胞靶向基因的编辑,并且该方法通过使如上所述组合物出现于真核细胞中,进行真核细胞内的靶向基因编辑。进一步的,使所述组合物出现于真核细胞中,是采用转染、或化学转化、或电转化、或基因枪转化的方式将所述组合物导入细胞内实现的。进一步的,该方法中所述基因编辑的形式包括基因表达盒的靶向敲入或替换、基因片段的靶向敲入或替换、基因片段的靶向删除。进一步的,所述真核细胞为活体真核微生物细胞、活体植物细胞或活体动物细胞。最后,本发明也提出了一种真核细胞,该真核细胞由以上所述的基因编辑方法获得。本发明中的ago蛋白,可以在无需dna或rna所构成的靶向向导下,用于真核细胞的靶向定位编辑,其使用更为简便,效果更优。在其编辑应用时,仅需将ago蛋白和同源重组片段组成的组合物中,至少所述同源重组片段被配置于用于转化或转染的递送体系内,即可进行基于同源重组修复(hdr)的靶向基因组编辑,其为基因编辑技术的应用提供了更好的发展空间。此外,在各类靶向基因编辑应用场景中,本发明基因编辑方案相对于包括crispr在内的现有技术,具有如下的特点和优势:(1)与公知的zfn及talen技术方案相比较,本发明提供的真核细胞靶向基因编辑技术方案,无需编辑改造外源核酸酶,仅需使用所选择的、无需重新编码的、固定的pago蛋白。(2)与公知的crispr技术方案相比较,本发明提供的真核细胞靶向基因编辑技术方案可以实现向导rna或向导dna设计和使用的省却,可以实现由“外源核酸酶 向导核酸 同源重组片段”的“三元体系”向“外源核酸酶 同源重组片段”的“二元体系”简化和回归。应用本方案时,只需将由pago蛋白或者能够表达该pago蛋白的基因元件、和同源重组片段组成的组合物导入细胞,即可实现真核细胞靶向基因编辑;对不同区域的基因编辑,本方案仅需执行基于pcr的同源重组片段的搭接或者直接合成所需的同源重组片段、无需执行额外的克隆及其他的分子构建操作,从而为真核细胞的靶向基因编辑提供了更便利、更高效的技术方案。(3)本发明提供的真核细胞靶向基因编辑方案,对于靶向区域的精准靶向,不同于依赖于长度仅为19-21nt向导rna的crispr系统,也不同于被广泛推测但仍未能真实实现的、依赖于24nt单链向导dna的pago系统,而能够大幅度提高靶向精准度、大幅度降低基因编辑的脱靶概率。(4)本发明提供的真核细胞靶向基因编辑方案,提供了多种可在真核细胞内实现靶向基因编辑的pago蛋白工具,不同的pago蛋白工具在不同的应用场景中,在都能够完成基因编辑的前提下,还具备各自的独特性,使得本发明方案可以针对不同的应用场景选择不同的pago蛋白工具,极大地丰富了靶向基因编辑技术的工具箱。(5)相对于其他靶向基因编辑方案中所使用的cas9等外源蛋白质,本发明提供的方案中所使用的候选pago蛋白的分子量较小,在基因治疗等应用场景中,将有利于解决递送困难等问题。附图说明构成本发明的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。本发明所述的附图如下:图1:总体设计思想与技术方案示意图;图2:实验流程示意图;图3(a):同源重组片段whr的设计及同源重组示意图;图3(b):同源重组片段whrgfp的设计及同源重组示意图;图3(c):同源重组片段xhr的设计及同源重组示意图;图3(d):同源重组片段xhrhis的设计及同源重组示意图;图3(e):同源重组片段whrleu1100的设计及同源重组示意图;图3(f):同源重组片段whrgfp1100的设计及同源重组示意图;图3(g):同源重组片段δ190hrhis的设计及同源重组示意图;图4(a):paago蛋白表达质粒paago-prs424-trp构建图谱;图4(b):fsago蛋白表达质粒fsago-prs424-trp构建图谱;图4(c):hpago蛋白表达质粒hpago-prs424-trp构建图谱;图4(d):maago蛋白表达质粒maago-prs424-trp构建图谱;图4(e):heago蛋白表达质粒heago-prs424-trp构建图谱;图4(f):fcago蛋白表达质粒fcago-prs424-trp构建图谱;图4(g):mtago蛋白表达质粒mtago-prs424-trp构建图谱;图4(h):exago蛋白表达质粒exago-prs424-trp构建图谱;图4(i):dexago蛋白表达质粒dexago-prs424-trp构建图谱;图4(j):dhpago蛋白表达质粒dhpago-prs424-trp构建图谱;图5(a):paago蛋白介导的靶向基因编辑表型验证;图5(b):fsago蛋白介导的靶向基因编辑表型验证;图5(c):hpago蛋白介导的靶向基因编辑表型验证;图5(d):maago蛋白介导的靶向基因编辑表型验证;图5(e):heago蛋白介导的靶向基因编辑表型验证;图5(f):fcago蛋白介导的靶向基因编辑表型验证;图5(g):mtago蛋白介导的靶向基因编辑表型验证;图5(h):exago蛋白介导的靶向基因编辑表型验证;图5(i):dexago蛋白介导的靶向基因编辑表型验证;图5(j):dhpago蛋白介导的靶向基因编辑表型验证;图6(a):whrgfp同源重组pcr验证电泳图;图6(b):whrgfp1100同源重组pcr验证电泳图;图6(c):whrleu1100同源重组pcr验证电泳图;图6(d):xhr同源重组pcr验证电泳图;图6(e):xhrhis同源重组pcr验证电泳图;图6(f):δ190hrhis同源重组pcr验证电泳图;图6(g):whr同源重组pcr验证电泳图;图7:氨基酸个数处于592至863之间的233个pago蛋白四元基序dedx预测分析图;图8:分属于8个pago亚群的55个pago蛋白的四元基序dedx预测分析图;图9:实施例中采用的10个pago蛋白的四元基序dedx预测分析图。具体实施方式需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。本发明涉及真核细胞基因编辑,尤其是真核细胞的基于同源重组的靶向基因编辑。针对于该基于同源重组的真核细胞靶向基因编辑,本发明首先涉及一种组合物,该组合物即用于真核细胞的靶向基因编辑组合物。在构成上,所述组合物由同源重组片段和ago蛋白组合而成。在组合物应用时,至少同源重组片段应被配置于用于转化或转染的递送体系内,一般情况下,该递送体系的溶剂是水或者te缓冲液等常规缓冲液,溶质是同源重组片段及ago蛋白、或同源重组片段及ago蛋白的表达元件,即:该用于转化或转染的递送体系是由同源重组片段、ago蛋白/ago蛋白表达元件、水/缓冲液构成的。其中,针对于组合物中的同源重组片段,其应是能够在靶向区域实现基因表达盒插入的同源重组片段,或能够在靶向区域通过替换原有基因片段以实现基因表达盒插入的同源重组片段,或能够在靶向区域实现基因片段插入或替换的同源重组片段,或能够在靶向区域实现基因片段删除的同源重组片段。同源重组片段的设计和组装可采用搭接pcr等常规分子生物学方法进行,通过对同源重组片段的设计,本发明能够在靶向区域实现外源基因的插入、原有基因的替换(由外源基因替换原有基因)、或者原有基因的删除。如同以上所述的,插入或进行替换的外源基因可为基因表达盒或基因片段,而基因表达盒代表在基因序列两端分别携带有启动子序列和终止子序列,以能够独立地转录出mrna进而翻译成蛋白质,其长度一般在数百个bp以上,基因片段则是相对于基因表达盒而言,代表在基因序列两端不携带有启动子序列和终止子序列、仅由一个、数个乃至数十个或更多个bp所构成,只能用于对原有基因序列进行置换但不能够如基因表达盒那样独立地转录出mrna进而翻译成蛋白质。从以上对本发明的同源重组片段的描述可以看出,本发明在靶向编辑时可实现基因表达盒的插入、替换,或基因片段的插入、替换或删除,其在具体应用情形中,视需要进行相关的选取设置即可。为了较好的实现靶向基因编辑效果,本发明的同源重组片段在设置上,其至少一侧的同源臂的长度应不低于200bp,并进一步优选的为不低于400bp。此时,例如同源重组片段任一侧的同源臂的长度可采用200bp、250bp、300bp、350bp、400bp、420bp、450bp、470bp、500bp、530bp、560bp、598bp、600bp、603bp、612bp、614bp、625bp、634bp、650bp、700bp、800bp等等。尽管不同的pago在介导基因编辑时,对同源重组片段的要求不尽完全相同,但是,一般而言,同源重组片段的同源臂的长度愈大,其在靶向基因编辑时的编辑效果趋好,随着同源臂长度的减小,靶向基因编辑的效果会下降,故本发明并不推荐采用低于200bp长度的同源臂的同源重组片段进行靶向基因编辑,且优选的推荐同源臂采用不低于400bp的长度,特别是在设置基因表达盒敲入所需的同源重组片段时,尽可能取较长的同源臂,以提高靶向基因编辑效率。例如在以绿色荧光蛋白gfp的表达盒敲入替代can1基因中间527bp的基因片段时,所采用同源重组片段whrgfp,其上同源臂612bp、下同源臂634bp。在特定的转化体系中(特定的感受态细胞、同源重组片段用量等),此whrgfp的本底重组率(无相关ago蛋白介导时)在0.1~1%左右,而以此同源重组片段测试各候选pago蛋白的基因编辑活性,一般将高出此本底重组率3倍以上的情形判定为具备靶向基因编辑活性,高出此本底重组率10倍以上的情形则判定为具备有效的靶向基因编辑。以此同源重组片段whrgfp测试exago及paago介导的基因编辑,其效率均能达到20%左右,但将whrgfp同源臂缩短至上同源臂226bp下同源臂204bp后,则难以稳定地检测到有效的靶向基因编辑活性。再例如,在设置24bp外源基因片段替换can1基因中间24bp的同源重组片段时,所设置的xhr的上同源臂625bp、下同源臂614bp,进一步的,设置了上同源臂439p下同源臂494bp的xhr400,以及上同源臂272p下同源臂250bp的xhr200。此时,所述的xhr、xhr400、xhr200的本底重组率均在0.05~0.5%之内。而以同源重组片段xhr、xhr400、xhr200测试exago介导的靶向基因编辑,其效率则分别达到20%左右、10%左右、3%左右。可见exago介导的靶向基因编辑效率与同源重组片段的同源臂长度呈现正相关性。本实施例中将在后文中通过多个具体实例,对采用不同的pago蛋白、不同的同源重组片段、以及不同的同源臂长度的同源重组片段实施靶向基因编辑的具体情况进行示例说明。针对于组合物中的ago蛋白,需要说明的是,本发明的所述ago蛋白可以是其本身、也即组合物中包含的所谓ago蛋白直接采用由氨基酸连接而成的具有蛋白质性质的ago蛋白。或者,作为其它可行方式,所谓的ago蛋白也能够是来自包括其编码rna、或其整合到宿主染色体的表达盒、或其表达质粒在内的其表达元件的ago蛋白。其中,不管是为ago蛋白本身,亦或是能够表达ago蛋白的其表达元件,本发明的ago蛋白为来自于原核生物的pago蛋白,并特别的包括来自常温菌的pago蛋白以及来自嗜热菌的pago蛋白。此时,我们从ncbi等公开的生物信息数据库中,挖掘比对ago蛋白的氨基酸序列,搜寻出320个来自原核生物的pago蛋白的氨基酸序列的有效信息。由于生物领域普遍认为酿酒酵母这一模式的细胞具有普适性,因此对320个有效pago蛋白,针对酿酒酵母生物开展了一系列测试验证,包括相关pago蛋白表达基因的合成、四元基序dedx不同残基突变、相关pago蛋白表达质粒构建、靶向基因编辑方法研究、组合物设计、靶向基因编辑活性测试等。试验发现pago蛋白的氨基酸个数低于592的plago等pago没有真核细胞基因编辑活性,ngago等氨基酸个数高于863的pago也没有真核细胞基因编辑活性。因此,在320个有效pago蛋白中,筛选出氨基酸个数处于592至863之间的233个具有基因编辑活性的ago蛋白,详见表1及图7。表1氨基酸个数在592至863之间的233个pago蛋白列表结合生物信息学分析和靶向基因编辑活性测试结果,表1中最后10个(序号为224-233的pago)经测试验证活性较差,由此便得到了包含有基因编辑活性的、氨基酸个数在592至863之间的223个pago蛋白,即表1中的序号为1-223的pago。其中:78个为来自常温菌并且其核酸酶活性中心四元基序符合公知的dedx特征的pago蛋白,115个为自常温菌并且其活性中心四元基序不符合公知的dedx特征的pago蛋白,26个为来自嗜热菌的并且其核酸酶活性中心四元基序符合公知的dedx特征的pago蛋白,4个为来自嗜热菌的并且其核酸酶活性中心四元基序不符合公知的dedx特征的pago蛋白。在进一步的生物信息学分析和靶向基因编辑活性测试中,从上述233个pago蛋白中筛选出能够更为有效的进行真核细胞基因编辑的、由55个pago蛋白构成的8个亚群。8个的亚群的55个pago蛋白的情况详见表2及图8。表2来自8个pago亚群的55个pago蛋白列表基于上述生物信息学分析和靶向基因编辑活性测试结果,从该8个亚群中选取代表性pago,得到10个具备基因编辑活性的pago,详情见表3及图9。而且表2中的pago蛋白与表3内相关的代表性pago蛋白之间的序列同源性大于等于80%。同时,本发明中该10个pago将作为具体示例,通过下文中对这10个pago的具体试验验证来说明本发明的组合物,以及采用所述组合物的基因编辑方法。表3用于具体实施例的10个代表性pago蛋白或突变体列表表3中:5个为来自常温菌pago蛋白亚群的代表性pago蛋白,具体包括来自halogeometricumpallidum(ncbi登录号:elz29017.1)的hpago、来自microcystisaeruginosa(ncbi登录号wp_012265209.1)的maago、来自halorubrumezzemoulense(ncbi登录号:wp_094494460.1)的heago、来自filamentouscyanobacterium(ncbi登录号:wp_106331578.1)的fcago、来自mastigocoleustestarum(ncbi登录号:wp_027844945.1)的mtago,上述5个pago蛋白的piwi核酸酶活性中心四元基序符合公知的dedx特征。1个为来自嗜热菌的pago蛋白亚群的代表性pago蛋白,其具体包括来自exiguobacteriumsp.(ncbi登录号:acq71053.1)的exago,该pago蛋白的piwi核酸酶活性中心四元基序符合公知的dedx特征。2个为来自常温菌的pago蛋白,具体包括来自pantoeaanthophila(ncbi登录号:wp_046101283.1)的paago和来自flavobacteriumsoli(ncbi登录号:wp_026705043.1)的fsago,上述2个pago蛋白的piwi核酸酶活性中心四元基序不符合公知的dedx特征。2个分别为来自常温菌的hpago的失活突变体hpagod646a和来自嗜热菌的exago的突变体exagod398a/s400a,这两个pago蛋白其piwi核酸酶活性中心突变后四元基序不再符合dedx特征,但该两个突变体均具备基因编辑活性。应当指出的是,其piwi核酸酶活性中心四元基序符合公知的dedx特征的pago蛋白,该pago蛋白dedx的某些氨基酸残基的突变会导致其基因编辑性的丧失,例如exagod467a。可见对于pago而言,其piwi核酸酶活性中心四元基序的不同的氨基酸残基对于其活性维持的贡献是不等同的,某些情况下的突变,例如第一个氨基酸残基d的突变,并不造成该pago蛋白基因编辑活性的丧失,而另外一些情况下的突变,例如第二个氨基酸残基d的突变,将会造成该pago蛋白基因编辑活性的丧失。本发明所涉及的组合物中的ago蛋白即是含有与上述代表性pago蛋白或其突变体的序列同源性大于等于80%的氨基酸序列的ago蛋白,如此,组合物中的ago蛋白当然可以是以上10个代表性pago蛋白或其突变体中的一个,或者,其亦可以是满足序列同源性大于等于80%、且具有基因编辑活性的表2内众多其它pago蛋白中的一个。基于上述的组合物,本实施例进一步涉及有针对于真核细胞的基因编辑方法,该编辑方法即用于真核细胞的靶向基因编辑,同时其为通过使以上组合物出现于真核细胞中,而进行基于同源重组的靶向基因编辑。此时,为使组合物出现在真核细胞中,例如可采用转染、或化学转化、或电转化、或基因枪转化等方式,以将所述组合物导入细胞内。而且,与前述针对同源重组片段的描述对应的,本实施例中靶向基因编辑的形式包括基因表达盒的靶向敲入或替换、基因片段的靶向敲入或替换、基因片段的靶向删除。此外,需要注意的是,本实施例所述的真核细胞具体为活体真核微生物细胞、活体植物细胞或活体动物细胞中的一种。而本发明则具体以普适性好的活体酿酒酵母(saccharomycescerevisiae)细胞进行相关试验,以验证本发明的组合物及相关的基于编辑方法。本实施例的靶向基因编辑方法一般在常温下进行,并优选为在酿酒酵母的最适温度下、即30℃下进行。而且通过本实施例编辑方法,其可建立和优化真核细胞靶向基因编辑的方法,打破了目前对采用ago进行真核细胞靶向基因编辑的一贯认知,而可为真核细胞靶向基因编辑的应用开拓出崭新的思路。另外,还需要指出的是,本实施例同时也涉及有一种ago蛋白的用途,该ago蛋白即用于真核细胞内的基于同源重组的靶向基因编辑,并且该所述ago蛋白正是如上介绍的组合物中的ago蛋白,而其在真核细胞内所进行的靶向基因编辑的应用则同以上描述的真核细胞基因编辑方法。基于此,对该ago蛋白的用途将不再做过多描述。最后,本实施例亦涉及一种真核细胞,该真核细胞即由以上基因编辑方法获得。下面,将以表3中的代表性ago蛋白为例,运用本发明所提供的靶向基因编辑方法,具体介绍本发明的ago蛋白及具有其的组合物的用途。具体而言,其以酿酒酵母为模式真核生物,ago蛋白的基因根据酿酒酵母碱基偏好性设计合成,之后采用gibson组装等分子生物学方法将其构建到表达质粒上备用。具体的105个实施例:以下的实施例,不需要向导rna或向导dna的靶向定位,仅需ago蛋白与同源重组片段便可引发真核细胞内的靶向基因编辑,该方法可以应用于真核细胞,应用前景广泛。本发明的基本原理、整体设计思想及总体技术方案,可由图1加以辅助说明。并且在图1中:pago表示作为外源ago的来自于原核生物的pago蛋白,且其中:①代表外源ago的pago蛋白的表达质粒;②代表外源ago的pago蛋白的编码mrna;③代表外源ago的pago蛋白;hr表示,同源重组片段,且up表示上同源臂、down表示下同源臂,其中,④代表实现基因表达盒靶向插入、或实现基因表达盒靶向插入同时替换原有基因的同源重组片段;⑤代表实现靶向区域基因片段替换的同源重组片段;⑥代表实现靶向区域基因片段删除的同源重组片段;基于如上的基本原理、整体设计思想及总体技术方案,设计组织实施了一系列的实施例,所涉及到基本的方法和总体实验流程,可由图2加以辅助说明。一、本实施例中生物信息学分析与实验测试验证工作是交叉互动的,首先采用blast等软件工具,分析和挖掘来自原核生物的pago蛋白作为本发明方案中所述的外源ago蛋白,具体见表1、表2、表3,相关的pago蛋白的piwi核酸酶活性位点四元基序分析见图7、图8、图9。二、本实施例中所涉及到的微生物学操作技术以及质粒构建、转化、pcr验证、基因测序验证等分子生物学操作技术,除以下额外说明的情况之外,均采用常规方法进行,这些常规方法是公知的、生命科学与
技术领域:
经专业训练的人员所应熟悉和掌握的基本方法,具体参见2002年8月出版的《分子克隆实验指南》(上、下册)第三版(sambrook,j.等著、黄培堂等译、科学出版社出版),本说明书不再具体加以描述。三、本实施例中所采用的微生物菌种、基础培养基及筛选培养基、培养条件具体如下:大肠杆菌escherichiacolidh5α等:lb培养基,37℃培养。双倍体酿酒酵母saccharomycescerevisiaesc4(his-,leu-,trp-,ura-):ynb培养基,30℃培养。液体摇瓶培养时,采用100ml三角瓶装液10ml,或者50ml三角瓶装液5ml,摇瓶转速为90rpm至180rpm、一般为120rpm。四、本实施例选择酿酒酵母精氨酸运输蛋白的编码基因(can1基因)作为靶向基因,开展基因编辑方法及用于基因编辑的组合物的研究。特别的,本实施例中,依据酿酒酵母碱基偏好性合成相关ago的基因,并构建于t克隆上保存。具体见表4。表4实施例所采用的基础质粒列表质粒名称相关性质来源peasy-bluntamp抗性,kan抗性购自北京全式金公司prs424-trpamp抗性,携带trp筛选标记本工作保存hpago-peasy合成hpago基因克隆质粒本工作构建maago-peasy合成maago基因克隆质粒本工作构建fcago-peasy合成fcago基因克隆质粒本工作构建mtago-peasy合成mtago基因克隆质粒本工作构建paago-peasy合成paago基因克隆质粒本工作构建fsago-peasy合成fsago基因克隆质粒本工作构建exago-peasy合成dexago基因克隆质粒本工作构建在表4所述的t克隆基础上,进一步构建出携带pago蛋白基因表达元件的穿梭质粒备用,具体见表5。表5实施例所构建的ago蛋白表达质粒列表基因名称基因大小表达质粒名称相关性质hpago2592bphpago-prs424-trp携带hpago表达盒,trp筛选maago2244bpmaago-prs424-trp携带maago表达盒,trp筛选fcago2238bpfcago-prs424-trp携带fcago表达盒,trp筛选mtago2295bpmtago-prs424-trp携带mtago表达盒,trp筛选paago2196bppaago-prs424-trp携带paago表达盒,trp筛选fsago1995bpfsago-prs424-trp携带fsago表达盒,trp筛选heago2544bpheago-prs424-trp携带heago表达盒,trp筛选exago1818bpexago-prs424-trp携带exago表达盒,trp筛选dexago1818bpdexago-prs424-trp携带dexago表达盒,trp筛选dhpago2592bpdhpago-prs424-trp携带dhpago表达盒,trp筛选五、本实施例中所选用的同源重组片段包括以下几种情况中的一种:能够在靶向区域实现基因表达盒插入的同源重组片段,或能够在靶向区域通过替换原有基因片段以实现基因表达盒插入的同源重组片段,或能够在靶向区域实现基因片段插入或替换的同源重组片段,或能够在靶向区域实现基因片段删除的同源重组片段,基因表达盒的靶向敲入或替换、基因片段的靶向敲入或替换、基因片段的靶向删除。同源臂hr的设计及其t克隆质粒构建的具体情况如下:以酿酒酵母的全长1773bp的精氨酸运输蛋白的编码基因(简称can1基因)作为基本靶点,设计一系列的重组片段hr并构建于t克隆上保存备用:(1)whr:敲除can1基因中央区域527bp,并同时敲入带有终止密码子24bp的外源序列,上同源臂长612bp,下同源臂长634bp,详情见图3(a)。(2)whrgfp:敲除can1基因中央区域527bp、并同时敲入cyc终止子及绿色荧光蛋白(gfp)的表达盒共1570bp(tef启动子、cps1终止子),上同源臂长612bp,下同源臂长634bp,详情见图3(b)。(3)xhr:敲除can1基因中央区域24bp、并同时敲入带有终止密码子24bp的外源序列,上同源臂长625bp,下同源臂长614bp,详情见图3(c)。(4)xhrhis:敲除can1基因中央区域24bp、并同时敲入cyc终止子及his3基因表达盒共1433bp,上同源臂长625bp,下同源臂长614bp。见图3(d)(5)whrleu1100:敲除can1基因中央区域527bp、并同时敲入1346bp由cyc终止子及来自leu2基因的1100bp片段连接而成的基因序列,上同源臂长612bp,下同源臂长634bp,详情见图3(e)。(6)whrgfp1100:敲除can1基因中央区域527bp,并同时敲入1100bp由cyc终止子及来自gfp基因的720bp片段连接而成的基因序列,上同源臂长612bp,下同源臂长634bp,详情见图3(f)。(7)δ190hrhis:敲除can1基因中央区域190bp、并敲入cyc终止子及his基因表达盒1178bp,上同源臂长603bp,下同源臂长598bp,详情见图3(g)。(8)xhr400:敲除can1基因中央区域24bp、并同时敲入带有终止密码子24bp的外源序列,上同源臂长439bp,下同源臂长494bp,详情见图3(c)。(9)xhr200:敲除can1基因中央区域24bp、并同时敲入带有终止密码子24bp的外源序列,上同源臂长272bp,下同源臂长250bp,详情见图3(c)。在图3中:1.阴影部分为基因组上被删除或者被替换部分;2.下划线部分为同源片段上敲入染色体部分;3.黑体部分为同源片段与基因组序列同源部分;4.数字表示碱基数;5.序列前后数字表示相应hr在can1基因中碱基的位数。采用overlappingpcr技术,融合上下同源臂及插入基因,t克隆,获得各hr相应基因克隆质粒如表6所示。表6实施例所构建的hr质粒及其验证引物列表在进行酿酒酵母靶向基因编辑时,以各同源重组片段(以下简称hr)的t克隆质粒为模板,应用相应的引物做pcr扩增,获得转化所需的hr片段,这些hr的pcr产物浓度一般控制在300-400ng/ul。某些实施例所需的单链hr制备方法为:用pcr仪将双链hr片段99℃加热5分钟之后迅速插冰5分钟,备用。六、感受态细胞的制备与转化:将细胞培养到od600值处于0.78-0.81时,离心收获细胞,用1×te缓冲液洗细胞一次,用25μl1×liac/0.5×te重悬,室温静置10min,加入0.6μg-1μgpago-prs424-trp、1.5μg-6μghr片段和1.5μl鱼精蛋白ss-dna(10.0mg/ml),加入250μl1×liac/40%peg3350/1×te,混合均匀,30℃孵育培养30min,加入30μldmso,混合均匀,42℃热激7min,离心,弃去上清,1ml1×te洗一次,离心,弃去上清,菌悬液注入10ml相应trp-的筛选培养基的100ml三角瓶中,30℃,120rpm或90rmp,培养64-72小时。七、突变株表型验证:为了快速评估酿酒酵母基因编辑结果及效率,选用其编码产物为精氨酸转运蛋白的can1基因作为模式靶标(参见doi:10.1093/nar/gkt135)。can1基因作为模式靶标可以快速筛选表型,其基本原理是:如果can1基因突变,则酵母细胞丧失将细胞外的精氨酸转运进入细胞的能力,该突变株可以通过自我合成精氨酸而继续存活,因为上述精氨酸转运能力的缺失,这类突变株也不能够运输刀豆氨酸这个有毒的精氨酸类似物,因而可以在含有刀豆氨酸的培养基中存活并正常生长。与此相对应的是,can1基因未被编辑(未突变)的出发菌株,却将因为具备精氨酸转运能力而将刀豆氨酸中毒,不能够在含有刀豆氨酸的培养基中存活下来。为了提高刀豆氨酸评估can1基因编辑的准确性,以下实施例中,本发明中相关实施例对刀豆氨酸法评估can1基因编辑的方法做了进一步改进,将培养基中的刀豆氨酸浓度由60μg/ml提高到80μg/ml,以便排除假阳性。在以上改进基础上,以酿酒酵母can1为模式基因,建立了平板微滴影印法,以便在每一个平板上开展多个实验验证筛选。具体步骤如下:将待检验菌悬液或者待检验菌株的液体培养物取100μl,注入96孔板中,再依次稀释10-1、10-2、10-3三个稀释度,每个稀释度菌液分别取3.5μl影印到含有80μg/ml刀豆氨酸和不含有刀豆氨酸的trp-的ynb筛选培养基的平板上,能在含有80μg/ml刀豆氨酸筛选培养基的平板上生长的为突变子,进一步的,可通过转化子的单菌落的数量,以不含有刀豆氨酸的平板为对照,评估靶向基因编辑效率。八、靶向基因编辑的分子生物学验证:随机挑取实施例所获得的can1基因靶向编辑阳性克隆,进行pcr验证,结果显示全部为靶向基因编辑。具体如下:随机挑取在80μg/ml刀豆氨酸平板上生长的单菌落,平板扩大培养16小时左右,挑取少量菌体细胞,蒸馏水混悬,匀浆器震荡裂解,采用敲入和敲除等两套验证引物,进行pcr验证。用敲入定位验证引物验证插入基因或插入的失活基因的存在,用敲除定位验证引物验证被敲除基因的敲除。各hr对应的验证引物见表6。九、具体实施例的实施详情与结果汇总:1、实施例1-1至实施例1-13:来源于pantoeaanthophila的paago蛋白介导的靶向基因编辑。paago蛋白来源于pantoeaanthophila,ncbi登录号:wp_046101283.1,含有731个氨基酸,以clostridiumbutyricum来源的cbuago为参照,其piwi核酸酶活性位点预测结果显示,paago蛋白不符合四元基序为dedx的特征。其表达质粒paago-prs424-trp的构建如方法1所述,相关的同源重组片段(hr)的设计构建如方法2所述,转化方法如方法3所述,转化子的表型验证如方法4所述,基因编辑的分子生物学验证方法如方法5所述。paago蛋白靶向基因编辑共13个实施例:实施例1到实施例13,各实施例的实验体系、条件及结果汇总如表7。表7paago蛋白介导的靶向基因编辑实验体系、条件及结果汇总对表7有关实施例进行pcr验证的结果如下:实施例1-5验证结果见图6(a),实施例1-6验证结果见图6(a),实施例1-7验证结果见图6(c),实施例1-8验证结果见图6(d),实施例1-10验证结果见图6(e),实施例1-11验证结果见图6(f),实施例1-12验证结果见图6(a),实施例1-13验证结果见图6(b),均为阳性结果。其中,实施例1-5、实施例1-6、实施例1-7、实施例1-8、实施例1-10、实施例1-11、实施例1-12、实施例1-13经进一步的pcr验证,结果分别见图6(a)、图6(a)、图6(c)、图6(d)、图6(e)、图6(f)、图6(a)、图6(b)。上述pcr结果表明,所验证的单克隆为预期的靶向基因编辑的结果。2、实施例2-1至实施例2-8:来源于flavobacteriumsoli的fsago蛋白介导的靶向基因编辑。fsago蛋白来源于flavobacteriumsoli,ncbi登录号:wp_026705043.1,含有664个氨基酸,以clostridiumbutyricum来源的cbuago为参照,其piwi核酸酶活性位点预测结果显示,fsago蛋白不符合四元基序为dedx的特征。其表达质粒fsago-prs424-trp的构建如方法1所述,相关的同源重组片段(hr)的设计构建如方法2所述,转化方法如方法3所述,转化子的表型验证如方法4所述,基因编辑的分子生物学验证方法如方法5所述。fsago蛋白靶向基因编辑共8个实施例:实施例2-1到实施例2-8,各实施例的实验体系、条件及结果汇总如表8。表8fsago蛋白介导的靶向基因编辑实验体系、条件及结果汇总对表8有关实施例进行pcr验证的结果如下:实施例2-2验证结果见图6(a),实施例2-4验证结果见图6(a),实施例2-6验证结果见图6(c),实施例2-8验证结果见图6(d),均为阳性结果。其中,实施例2-2、实施例2-4、实施例2-6、实施例2-8经进一步的pcr验证,结果分别见图6(a)、图6(a)、图6(c)、图6(d)。上述pcr结果表明,所验证的单克隆为预期的靶向基因编辑的结果。3、实施例3-1至实施例3-11:来源于halogeometricumpallidum的hpago蛋白介导的靶向基因编辑。hpago蛋白来源于halogeometricumpallidum,ncbi登录号:elz29017.1,含有863个氨基酸,以clostridiumbutyricum来源的cbuago为参照,其piwi核酸酶活性位点预测结果显示,hpago蛋白符合四元基序为dedx的特征。其表达质粒hpago-prs424-trp的构建如方法1所述,相关的同源重组片段(hr)的设计构建如方法2所述,转化方法如方法3所述,转化子的表型验证如方法4所述,基因编辑的分子生物学验证方法如方法5所述。hpago蛋白靶向基因编辑共11个实施例:实施例3-1到实施例3-11,各实施例的实验体系、条件及结果汇总如表9。表9hpago蛋白介导的靶向基因编辑实验体系、条件及结果汇总对表9有关实施例进行pcr验证的结果如下:实施例3-6验证结果见图6(a),实施例3-7验证结果见图6(c),实施例3-9验证结果见图6(d),实施例3-11验证结果见图6(e),均为阳性结果。其中,实施例3-6、实施例3-7、实施例3-9、实施例3-11经进一步的pcr验证,结果分别见图6(a)、图6(c)、图6(d)、图6(e)。上述pcr结果表明,所验证的单克隆为预期的靶向基因编辑的结果。4、实施例4-1至实施例4-8:来源于microcystisaeruginosa的maago蛋白介导的靶向基因编辑。maago蛋白来源于microcystisaeruginosa,ncbi登录号:wp_012265209.1,含有747个氨基酸,以clostridiumbutyricum来源的cbuago为参照,其piwi核酸酶活性位点预测结果显示,maago蛋白符合四元基序为dedx的特征。其表达质粒maago-prs424-trp的构建如方法1所述,相关的同源重组片段(hr)的设计构建如方法2所述,转化方法如方法3所述,转化子的表型验证如方法4所述,基因编辑的分子生物学验证方法如方法5所述。maago蛋白靶向基因编辑共8个实施例:实施例4-1到实施例4-8,各实施例的实验体系、条件及结果汇总如表10。表10maago蛋白介导的靶向基因编辑实验体系、条件及结果汇总对表10有关实施例进行pcr验证的结果如下:实施例4-1验证结果见图6(g),实施例4-2验证结果见图6(d),实施例4-4验证结果见图6(c),实施例4-5验证结果见图6(a),实施例4-6验证结果见图6(c),实施例4-7验证结果见图6(a),实施例4-8验证结果见图6(a),均为阳性结果。其中,实施例4-1、实施例4-2、实施例4-4、实施例4-5、实施例4-6、实施例4-7、实施例4-8经进一步的pcr验证,结果分别见图6(g)、图6(d)、图6(c)、图6(a)、图6(c)、图6(a)、图6(a)。上述pcr结果表明,所验证的单克隆为预期的靶向基因编辑的结果。5、实施例5-1至实施例5-6:来源于halorubrumezzemoulense的heago蛋白介导的靶向基因编辑。heago蛋白来源于halorubrumezzemoulense,ncbi登录号:wp_094494460.1,含有847个氨基酸,以clostridiumbutyricum来源的cbuago为参照,其piwi核酸酶活性位点预测结果显示,heago蛋白符合四元基序为dedx的特征。其表达质粒heago-prs424-trp的构建如方法1所述,相关的同源重组片段(hr)的设计构建如方法2所述,转化方法如方法3所述,转化子的表型验证如方法4所述,基因编辑的分子生物学验证方法如方法5所述。heago蛋白靶向基因编辑共6个实施例:实施例5-1到实施例5-6,各实施例的实验体系、条件及结果汇总如表11。表11heago蛋白介导的靶向基因编辑实验体系、条件及结果汇总对表11有关实施例进行pcr验证的结果如下:实施例5-1验证结果见图6(a),实施例5-4验证结果见图6(c),实施例5-5验证结果见图6(a),实施例5-6验证结果见图6(d),均为阳性结果。其中,实施例5-1、实施例5-4、实施例5-5、实施例5-6经进一步的pcr验证,结果分别见图6(a)、图6(c)、图6(a)、图6(d)。上述pcr结果表明,所验证的单克隆为预期的靶向基因编辑的结果。6、实施例6-1至实施例6-10:来源于filamentouscyanobacterium的fcago蛋白介导的靶向基因编辑。fcago蛋白来源于filamentouscyanobacterium,ncbi登录号:wp_106331578.1,含有745个氨基酸,以clostridiumbutyricum来源的cbuago为参照,其piwi核酸酶活性位点预测结果显示,fcago蛋白符合四元基序为dedx的特征。其表达质粒fcago-prs424-trp的构建如方法1所述,相关的同源重组片段(hr)的设计构建如方法2所述,转化方法如方法3所述,转化子的表型验证如方法4所述,基因编辑的分子生物学验证方法如方法5所述。fcago蛋白靶向基因编辑共10个实施例:实施例6-1到实施例6-10,各实施例的实验体系、条件及结果汇总如表12。表12fcago蛋白介导的靶向基因编辑实验体系、条件及结果汇总对表12有关实施例进行pcr验证的结果如下:实施例6-1验证结果见图6(a),实施例6-2验证结果见图6(a),实施例6-3验证结果见图6(a),实施例6-5验证结果见图6(c),实施例6-7验证结果见图6(d),实施例6-8验证结果见图6(c),实施例6-9验证结果见图6(a),实施例6-10验证结果见图6(d),均为阳性结果。其中,实施例6-1、实施例6-2、实施例6-3、实施例6-5、实施例6-7、实施例6-8、实施例6-9、实施例6-10经进一步的pcr验证,结果分别见图6(a)、图6(a)、图6(a)、图6(c)、图6(d)、图6(c)、图6(a)、图6(d)。上述pcr结果表明,所验证的单克隆为预期的靶向基因编辑的结果。7、实施例7-1至实施例7-11:来源于mastigocoleustestarum的mtago蛋白介导的靶向基因编辑。mtago蛋白来源于mastigocoleustestarum,ncbi登录号:wp_027844945.1,含有764个氨基酸,以clostridiumbutyricum来源的cbuago为参照,其piwi核酸酶活性位点预测结果显示,mtago蛋白符合四元基序为dedx的特征。其表达质粒mtago-prs424-trp的构建如方法1所述,相关的同源重组片段(hr)的设计构建如方法2所述,转化方法如方法3所述,转化子的表型验证如方法4所述,基因编辑的分子生物学验证方法如方法5所述。mtago蛋白靶向基因编辑共11个实施例:实施例7-1到实施例7-11,各实施例的实验体系、条件及结果汇总如表13。表13mtago蛋白介导的靶向基因编辑实验体系、条件及结果汇总对表13有关实施例进行pcr验证的结果如下:实施例7-1验证结果见图6(a),实施例7-3验证结果见图6(a),实施例7-5验证结果见图6(c),实施例7-7验证结果见图6(d),实施例7-8验证结果见图6(g),实施例7-9验证结果见图6(c),实施例7-10验证结果见图6(a),实施例7-11验证结果见图6(d),均为阳性结果。其中,实施例7-1、实施例7-3、实施例7-5、实施例7-7、实施例7-8、实施例7-9、实施例7-10、实施例7-11经进一步的pcr验证,结果分别见图6(a)、图6(a)、图6(c)、图6(d)、图6(g)、图6(c)、图6(a)、图6(d)。上述pcr结果表明,所验证的单克隆为预期的靶向基因编辑的结果。8、实施例8-1至实施例8-5:来源于exiguobacteriumsp.的exago蛋白介导的靶向基因编辑。exago蛋白来源于exiguobacteriumsp.,ncbi登录号:acq71053.1,含有605个氨基酸,以clostridiumbutyricum来源的cbuago为参照,其piwi核酸酶活性位点预测结果显示,exago蛋白符合四元基序为dedx的特征。其表达质粒exago-prs424-trp的构建如方法1所述,相关的同源重组片段(hr)的设计构建如方法2所述,转化方法如方法3所述,转化子的表型验证如方法4所述,基因编辑的分子生物学验证方法如方法5所述。exago蛋白靶向基因编辑共5个实施例:实施例8-1到实施例8-5,各实施例的实验体系、条件及结果汇总如表14。表14exago蛋白介导的靶向基因编辑实验体系、条件及结果汇总9、实施例9-1至实施例9-26:来源于exiguobacteriumsp.的突变体dexago蛋白介导的靶向基因编辑。以实施例8-1及8-2中所构建的exago-prs424-trp为模版,根据ncbi登录号:acq71053.1记录所指示的exago蛋白的piwi结构域核酸酶活性位点,设计突变点引物,实现位点突变d398a/s400a,通过gibson组装,得到dexago-prs424-trp,相关的同源重组片段(hr)的设计构建如方法2所述,转化方法如方法3所述,转化子的表型验证如方法4所述,基因编辑的分子生物学验证方法如方法5所述。dexago蛋白靶向基因编辑共26个实施例:实施例9-1到实施例9-26,各实施例的实验体系、条件及结果汇总如表15。表15dexago蛋白介导的靶向基因编辑实验体系、条件及结果汇总对表15有关实施例进行pcr验证的结果如下:实施例9-18验证结果见图6(a),实施例9-19验证结果见图6(c),实施例9-20验证结果见图6(d),实施例9-22验证结果见图6(e),实施例9-23验证结果见图6(a),均为阳性结果。其中,实施例9-18、实施例9-19、实施例9-20、实施例9-22、实施例9-23经进一步的pcr验证,结果分别见图6(a)、图6(c)、图6(d)、图6(e)、图6(a)。上述pcr结果表明,所验证的单克隆为预期的靶向基因编辑的结果。10、实施例10-1至实施例10-7:来源于halogeometricumpallidum的突变dhpago蛋白介导的靶向基因编辑。以实施例3-1及3-11中所构建的hpago-prs424-trp为模版,根据ncbi登录号elz29017.1记录所指示的piwi结构域核酸酶活性位点,设计突变点引物,实现位点突变d646a,通过gibson组装,得到dhpago-prs424-trp。相关的同源重组片段(hr)的设计构建如方法2所述,转化方法如方法3所述,转化子的表型验证如方法4所述,基因编辑的分子生物学验证方法如方法5所述。dhpago蛋白靶向基因编辑共7个实施例:实施例10-1到实施例10-7,各实施例的实验体系、条件及结果汇总如表16。表16dhpago蛋白介导的靶向基因编辑实验体系、条件及结果汇总对表16有关实施例进行pcr验证的结果如下:实施例10-3验证结果见图6(a),实施例10-5验证结果见图6(d),实施例10-7验证结果见图6(e),均为阳性结果。其中,实施例10-3、实施例10-5、实施例10-7经进一步的pcr验证,结果分别见图6(a)、图6(d)、图6(e)。上述pcr结果表明,所验证的单克隆为预期的靶向基因编辑的结果。通过以上试验结果可以看出,本发明的采用原核生物pago蛋白的ago蛋白、特别是包含有该ago蛋白的组合物,其基于对应的靶向基因编辑方法,能够实现真核细胞内的多种形式的靶向基因编辑,且其编辑效率大多不低于10%,仅有少数在3%或5%,故本发明能够很好的实现真核细胞的靶向基因编辑,进而为真核细胞的靶向基因编辑的研究提供了全新的思路。以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。缩略词表pago蛋白简称命名规则约定:默认情况下,使用属名的第1个大写字母加种名的第1个小写字母;如果存在重名物种,则将取用范围延长至种名的前2~4个字母以作区分,与cbago同源度高的pago优先使用更短的简称;对于同一物种下的不同ago蛋白,第1个蛋白使用默认命名法,其后的蛋白附加ncbi登录号后3位(版本号不计入)以作区分。如果ncbi数据库仅提供了相关ago的属名信息,则使用属名的前2~4个字母进行命名。本专利中所有的关于ago的表述,包括表1、表2、表3在内,皆遵从本约定。sequencelisting<110>石家庄埃佤基因科技有限公司<120>ago蛋白的用途及组合物和基因编辑方法<130>2019.9.12<160>20<170>patentinversion3.3<210>1<211>731<212>prt<213>pantoeaanthophila<400>1metproilevalleuasnalapheproleulysvalproaspmetglu151015leulysphevalglnileprotyrasplysthrthrleuaspserleu202530argserserhislysmetthrhisvalpheargargglnglyaspser354045ileglnilepheserseraspglythrpheprolysserglythrpro505560glnthrleuglnleulysasnasnleuglyilephepheserleuval65707580lysaspglyleuleulyshisphealaglyleuglyargserprocys859095glypheasnproilegluvalvalseralaglnalalysaspasnleu100105110leualaserileleuglyglualatyrproleulysilecysalalys115120125tyrserileaspthrargthrvalglnglyglnprocysleuileile130135140aspcysserthrargargvalvallysgluasncysleuphepheleu145150155160lysthrglypheasnvalileglyargtyrvalvalthrgluglnasp165170175aspglyphearglysleuleuglyphevalgluasncyshisglugly180185190argthrleuservalileargproaspglyglnalavalhisalaglu195200205alalysaspvaltyrleuglualaserargalaasnpheaspasptyr210215220ileleutyrthrhisglythrlyslysaspserilevalgluargile225230235240argglnservalserilepheasnglyglylysasnlyslysasparg245250255ileaspalaleulyslystyrileglnalathrasnileserleuleu260265270aspglythrargilegluileglugluproseraspileglnlysasp275280285cysalaglnmetglnlysprovalphevalpheasnaspasnglyglu290295300alaasptrpthrglulysglyleuthrglnasnglyprotyrthrlys305310315320argthrpheaspargasnaspproserilecysvalilecysalagln325330335hisaspargglyargvalgluglnphevalarglysleuleulysgly340345350metalaasnserlystyrpheargasnglyleugluglylyspheala355360365leuglythrserargvalgluvalphegluthrserthrasnserval370375380aspalatyrlysseralaileglualaalailearglyslysalaasp385390395400aspglyglyargtrpaspleualaleuvalglnvalargglnserphe405410415lysglnleulysvalthraspasnprotyrtyrleuglylysserleu420425430phetyrmethisglnvalprovalglnaspphethrilegluleuleu435440445serglnserasptyrserleuglytyrserleuasnasnmetserleu450455460alacystyralalysmetglyglyvalprotrpleuleulysserser465470475480prothrleuserhisgluleuvalileglyileglyasnalaasnile485490495valglngluargglyalahisasnglnargilemetglyilethrthr500505510valpheserglyaspglysertyrilevalserserthrserlysala515520525valvalproglualatyrcysglualaleuthrservalleuglyglu530535540asnileglulysileglnargargmetasntrpglnlysglyaspser545550555560ileargleuilephehisalaglnvallyslyspheasnlysgluglu565570575ileglnalavalargalavalileasplystyrargasptyrglnile580585590glutyralaphevallysilesergluasnhisglyleuhismetphe595600605aspserserthralathrmetprolysglyargleualathrhisarg610615620glylysthrphelysleuserlysasnglumetleuvaltyrleuile625630635640glyglnarggluleuargglngluthraspglyhisproargglyval645650655ilevalasnvalhislysaspserthrphelysaspilelystyrleu660665670seralaglnleutyrserphealaserhissertrpargsertyrphe675680685proasnprometprovalthrilethrtyrseraspleuilealahis690695700asnleuglytrpleuasnglnleuproglytrpseraspservalmet705710715720ileglylysileglyhisserglntrppheleu725730<210>2<211>664<212>prt<213>flavobacteriumsoli<400>2metserglyleupheleuasnphetyrglnvalaspileprothrlys151015servalproilehisservalglutyrserhistyrserserlysglu202530alapheilealaleulysgluasnpheprotyrpheserphetyrarg354045aspaspaspargileleuiletrplyslysasplysaspalagluleu505560proglulysasnserleuilegluileaspphethrglulysalalys65707580valleuserlysileleugluargalaileileasppheileglupro859095lysglytyrlysilephelysasnlystyrserasnsertrpgluile100105110valsermetlysaspileleuasnglyglyilegluglyleuserile115120125asnargilevalhispheserprocysphephephelysgluasnlys130135140leumetleuglypheserleuserthrserleulysasnvalphethr145150155160trpasnlysalaaspphegluargtyrglypheaspilelysglyleu165170175lysglyaspglugluargilephealaasnlysglnserleulysarg180185190pheleugluthrlysglyalavalalamettyraspglnileileala195200205lysgluasnlysasnalalysmetpheserileileaspglyphetyr210215220argtrpleugluargasnlysthrgluileglnleupropheglyleu225230235240lysileasnservalserlyslystyrleuprophegluaspgluleu245250255ilelyssergluileileprolysproglnargtyrphetyrserasn260265270arglysasnthrglnserleuargtyrtyraspglumetvallysthr275280285tyrglnprotyrserleugluleutyrglnasnlysglnileasnile290295300glyileilecysproserglutyrglnglygluthrgluglypheile305310315320lyslysilegluleulysleulysgluvalphehispheasnserleu325330335ilephehisphelysthrilethrasnlysaspleualasertyrlys340345350gluvalleutyraspaspgluleuleulyscysaspleuiletyrval355360365ilevalasnglualaglnglulysleuserproasnasnserprotyr370375380tyrvalcyslysalalyspheileglyasnglyileprothrglnasp385390395400ileglnilegluthrileargglnasnleuasnalaphethrmetthr405410415asnileserleuasnsertyralalysleuglyglythralatrpthr420425430ileglulysgluasplysleulysaspgluleuvalileglyilegly435440445serthrleusergluasnglyglnphevalleuglyilealaglnile450455460phehisasnaspglyargtyrmetalaglyaspcysserproleuser465470475480thrpheserasntyralagluasnleugluasphisleutyrlysthr485490495leulysproleuvalgluglumetserlysserglythrpheargleu500505510ilephehisleuphelysseralasergluglutyrgluileargala515520525ileasnglyleuglnlysargleualaasntyrasnpheglupheala530535540leuvalhisleualatyrglyhisasnpheargleutyrtyrasnasp545550555560glyasnglyaspileasnglnglythrtyrileglnleuserlyshis565570575seralaleuleuhisphevalserlysseraspleuproleulysile580585590aspleuasplysargserthrphethrserleuphetyrilealalys595600605glnvaltyrtrppheserhisleuserhisargsertyrmetproser610615620lysargthrvalthrilemettyrproserilemetalalysmetthr625630635640glugluleulyslysvalgluglytrpasptyrgluargleulysala645650655valserasplysleutrppheile660<210>3<211>863<212>prt<213>halogeometricumpallidum<400>3metvallysargtyrileserphehisleupheproargilelysleu151015cysglyvaltyrleucysleuargmetasnthrlysaspaspileala202530hislysglnproilethrilegluvalglnvalleulysgluleuasp354045lysproserprolysmetalathrargleuleuvalalaaspargala505560glyasnargpheproleualailetrplysasnasnalaleuserasp65707580tyrasptrpthrileglyglntrptyrargleugluasnalaarggly859095asnvalpheasnglylysglnserleuasnglyserserasnmetarg100105110alathrproleuglualaserglugluaspgluthrargalaaspasp115120125valglyargvalaspthrileleuglyasnleuserproasnglnala130135140tyrleuserleupheproileserargserpheaspthrleuserval145150155160tyrglutyrserileglualaalaglualaphegluaspaspproasp165170175thrvalthrtyrglncysalaglyargleuargargilethrglyala180185190glyvalalatyralaglyprometglnilevalserthrarglysleu195200205proasplysleualaasppropheserleusergluprothrgluarg210215220gluleulysalaalaaspalaargasparghisargilegluargleu225230235240leulysserleuvallysalaalaileaspaspserthrtyrasppro245250255tyrglnileasnargileargalaargthrproalailethralagly260265270aspglyleupheglualacystyrgluphealaalaargvalaspval275280285metproserglyaspalaphevalglyilegluvalargtyrhisala290295300argserglnvalthralaaspvaltyrgluasplysthrglygluleu305310315320valglythrilevalgluhisaspprogluargtyrasnvalsergly325330335thrglyargvalvalglyphethrasphistyrphethraspalaleu340345350aspgluleuglyglyleuserleualaasptrptyralaglnlysasp355360365argvalprogluglyvalleuglualaleuargglulysasnproarg370375380leuvalaspileglntyrglngluaspgluproalaglnilehisval385390395400progluleuleuargvalalaproarglysgluvalvallysgluleu405410415aspprothrphehisargargtrpaspargglualalysmetleupro420425430asplysargphearghisalailegluphevalasphisleuglyser435440445leuproaspileaspalathrvalalaprogluproleuglyproser450455460leusertyrmetserthralavalaspargglugluasnleuargphe465470475480lysaspglyargthralathrthrproserserglyileargsergly485490495valtyrglnglnprothrserpheaspilealatyrvaltyrprothr500505510glusergluglngluserlysglnpheileserasnphegluasnlys515520525leuserargcyshiscysgluprothralathrarghisvalprotyr530535540gluleuglyglygluleusertyrleualavalileasngluleuglu545550555560servalaspalavalleualavalvalproproargasnaspasparg565570575ilealaalaglyaspilethraspprotyrprogluphelyslysgly580585590leuglylysglnlysvalproserglnmetvalvalthrgluasnleu595600605aspthrargtrpvalmetasnasnthralametglyleuilealagly610615620alaglyglyvalprotrpargvalaspglumetproglyglualaasp625630635640cyspheileglyleuaspvalthrargaspprogluthrglyglnhis645650655leuglyalaseralaasnvalvaltyralaaspglythrvalpheala660665670serlysthrglnthrleuglnserglygluthrpheaspgluglnser675680685ileileaspvalilelysaspvalpheglngluphevalargargglu690695700glyargserprogluhisilevalilehisargaspglyargleuphe705710715720gluaspalaaspgluileglnalaprophealaaspserglyvalser725730735ileaspileleuaspilearglysserglyalaproargilealaarg740745750tyrgluaspasnserphelysileaspglulysglyargleupheile755760765serglnaspaspthrhisglypheilealathrthrglylysproglu770775780pheaspaspseraspasnleuglythrprolysthrleuargvalval785790795800argargalaglyaspthrprometleuthrleuleulysglnvaltyr805810815trpleuserglualahisileglyservalserargservalargleu820825830proilethrthrtyrtyralaaspargcysalagluhisalaargglu835840845glytyrleuleuhisglygluleuilegluglyvalprotyrleu850855860<210>4<211>747<212>prt<213>microcystisaeruginosa<400>4metasntyrthralaalaasnthralaasnserproilepheleuser151015gluileserserleuthrleulysasnsercysleuasncysphegln202530leuasnhisglnvalthrarglysileglyasnargphesertrpgln354045pheserarglyspheproaspvalvalvalilephegluaspasncys505560phetrpvalleualalysaspglulysserileproserleuglngln65707580trplysglualaleuseraspileglngluvalleuarggluaspile859095glyasphistyrtyrserilehistrpleulysasppheglnilethr100105110alaleuvalthralaglnleualavalargileleulysilephegly115120125lyspheseraspproilevalpheprolysaspserglnileserglu130135140asnglnvalglnvalargarggluvalasnphetrpalagluileile145150155160asnaspthraspproalailecysleuthrvalaspserserileval165170175tyrserglyaspleugluglnphetyrgluasnhisprotyrarggln180185190aspalavallysleuleuvalglyleulysvallysasparggluthr195200205asnglythralalysileileargilealaglyargileglygluarg210215220arggluaspleuleuthrlysalathrglyserileserargarglys225230235240leugluglualahisleuglyglnprovalvalalavalglnphegly245250255lysasnproglnglutyriletyrproleualaalaleulysprotrp260265270valthraspgluaspgluserleupheglnvalasntyrglyasnleu275280285leulysalathrlysilephetyralagluargglngluleuleulys290295300leutyrlysglnglualaglnlysalaleuasnasnpheglyphegln305310315320leuargglulysserileasnserglnglutyrprogluleuphetrp325330335thrproserileserilegluglnthrproileleupheglyglngly340345350gluargglyglulysarggluileilelysglyleuserlysglygly355360365valtyrlysarghisargglutyrvalaspproalaarglysilearg370375380leualaileleulysproalaasnleulysvalglyasppheargglu385390395400glnleuglulysargleulysleutyrlysphegluthrileleupro405410415progluasnglnileasnpheservalgluglyleuglypheglulys420425430argalaargleugluglualavalaspargleuileglyvalgluile435440445provalaspilealaleuvalpheleuproglngluaspargasnala450455460aspasnthrglugluglyserleutyrsertrpilelysarglysphe465470475480leuglyargglyvalilethrglnmetiletyrglulysthrleuasn485490495asplysserasntyrlysasnileleuasnglnvalvalproglyile500505510leualalysleuglyasnleuprotyrvalleualagluproleuglu515520525ilealaasptyrpheileglyleuaspvalglyargmetprolyslys530535540asnleuproglyserleuasnvalcysalaservalargleutyrgly545550555560lysglnglygluphevalargcysargvalgluaspserleuthrglu565570575glyglugluileproglnargileleugluasncysleuproglnala580585590gluleulysasnglnthrvalleuiletyrargaspglylysphegln595600605glylysgluvalgluasnleuleualaargalaargalaileasnala610615620lyspheileleuvalglucystyrlysthrglyileproargleutyr625630635640asnleuglnglnlysglnileasnalaproserlysglyleualaleu645650655alaleuserasnarggluvalileleuilethrserglnvalserglu660665670glnileglyvalproargproleuargleulysvalhisgluleugly675680685gluglnargasnleulysglnleuvalaspthrthrleulysleuthr690695700leuleuhistyrglyserleulysaspproargleuproileproleu705710715720tyrglyalaaspileilealatyrargargleuglnglyiletyrpro725730735serleuleugluaspaspcysglnphetrpleu740745<210>5<211>847<212>prt<213>halorubrumezzemoulense<400>5metthrthrglnalaaspilegluaspglylysargileaspilethr151015valglnvalvalalagluleuaspcysthrthrserlysmetalalys202530argleulysvalargaspthralaglyasnglupheproleualaile354045trpasnasnasnalaleuseraspphealatrpgluserglyargtrp505560tyrgluleugluasnalalysglyasnglutrpargglyglulysser65707580leuasnglyserserargleuseralagluilevalgluproproglu859095glugluasngluaspsersergluserglulysileserglyglygln100105110leupheaspthrleuglnaspasnleuprotyrleuserleuphepro115120125pheaspargaspphegluthrleuservaltyrglutyrargileglu130135140alaasnaspalaphegluaspserprometaspalathrtyrasnleu145150155160alaalatyrleuargserserserasnalaalavalthrhisalagly165170175valmetserleuileserthrgluproleugluileserleuproasp180185190prophethrleuthrsergluthrargvalthrleuargalaaspglu195200205thrseraspasngluthrmetvalargleuleuglnglnleuilelys210215220lysserileserthrasplystyrgluthrglyargvalaspargile225230235240argthrlysgluprovalileserglyprogluglyleuphegluala245250255cysleualatyrargvalglyilegluvalleuproserglyaspala260265270tyrvalglyvalgluvalserhishisalaargserglnalathrval275280285aspglutyrileaspargvalasnalathrvalaspgluleuvalasp290295300thrhisvalgluhisaspprogluthrtyrserthrproglysergly305310315320glnleulysserleualaaspvalargphethraspproileproasp325330335pheglyasnglnserleualaasptrptyrgluarglysaspargval340345350seraspglumetleuaspglnleuargsergluasnproargleuval355360365gluvalglntyrasnproasnseraspgluthrservalhisvalpro370375380glnleuleuargvalserproarglysgluvalvallysglnleuser385390395400proargphehisargglutrpaspargargalalysmetleuproglu405410415gluargpheglnlysalathrglnphevalthraspleuaspthrleu420425430proalavalaspthrtyrleuaspprothrprovalglyproserile435440445serphemetserthrgluvalaspargalaaspasnleuargphegly450455460asnaspcysthralaaspleuproglyserglyleuasnargtyrgly465470475480valtyrargargproserserpheargleuhistyrleuvalproglu485490495argtyrthraspgluphevalgluleuargserargilegluglugln500505510leugluaspmetasncysserproaspglumetsertyrserglutyr515520525alaleuglysergluileglutyrserasnalaalaalaalaileser530535540aspvalaspvalvalleualaalavalproserproserasnaspphe545550555560ileglnaspglythrileaspaspprotyrglygluphelyslysala565570575leuglylysglnthrileproserglnmetvalargvalaspasnleu580585590aspasnlystrpvalvalargasnthralaleuglyileilealagly595600605alaglyglyvalprotrpargvalaspglnmetproglyasnthrasp610615620cysphevalglyleuaspalathrargaspproaspthrglyglnphe625630635640leuglyalaseralaasnvalvalleualaaspglythrvalpheval645650655serlysthrglnserleuglnserglygluthrpheaspgluaspala660665670valvalaspvalleulysaspvalhisarggluphevalargalaglu675680685glyglulysproasnserilevalvalhisargaspglyargleuphe690695700gluaspvalaspalaileleualapropheasnglythrglyileasp705710715720ileaspileleuaspilearglysserglyalaproargalaalaphe725730735argargasnglyglnpheargvalasphislysglyargilepheile740745750alaglnasnaspasphisglypheleuthrthrthrglyargproglu755760765pheaspaspseraspglyleuglythrproargthrleuargileval770775780argargalaglygluthrprometglnthrleumetgluglnvaltyr785790795800trpleusergluserhisvalglyseralaglnargserthrargleu805810815proilethrthrtyrtyralaaspargcysalaglualathrarglys820825830glytyrleuvalasnglygluileileargglyvalprotyrile835840845<210>6<211>745<212>prt<213>filamentouscyanobacterium<400>6metthrvalalavalglnvalhisthrglnproalaserproilephe151015leusergluilepheproleuargileserglnleuasnleuilegly202530pheargvalthrprogluvalasparggluileglyasnargleuser354045trpargpheserglnlyspheproaspvalvalalailetrpglnasp505560lystyrphetrpvalleualalysproaspglnprometprosergln65707580aspglutrpargleulysleualagluileleuglugluleulyslys859095aspileglyaspargtyrtyrserileglntrpvalarggluprogln100105110valthralaserileleualaglnleualavalargvalleulysile115120125alaargpropheserserasnservalmetsergluasnglnvalgln130135140valargarggluvalaspphetrpalagluthrileaspleuglngly145150155160valleuglnproalaleuthrleuthrilehisserargileleuphe165170175lysglyaspleualaglnphecysgluasnhisprotyrargglnasp180185190prolysasnileleuileglyleulysvalargaspilegluhisasn195200205serphealaargilethrglyilevalglythrileglugluhisarg210215220aspglnleuleulysglualathrglyalaileserlysglnalaleu225230235240lysaspalaproasngluglnprovalvalalavalglnpheglylys245250255aspalalysprophehistyralametalaalaleuargprocysile260265270thrprogluthralalysargphegluvalasptyrglygluleuleu275280285lysalathrlysvalsertyrlysasparglysaspleuleuvalleu290295300tyrlyslysglualaglyglualaleutyrasntyrglypheglnleu305310315320gluargserileasnserargaspcysproasnleuphetrpglupro325330335lysvallysvalgluglnthrglnleumetpheglygluasnphethr340345350glyileglnserglnileleuthrglyleuserlysglyglyvaltyr355360365argarghisgluasptyrleuaspproserargproileargileala370375380alaleulysleucysasnphelysvalglyserpheleusergluphe385390395400glnlysargleulysargtyrglyphegluserileleuprogluglu405410415asnlyslysgluleuservalaspserleuargglyalaglualaarg420425430alalysvalgluglualavalaspaspleumetvalargglnproasp435440445valvalleuthrpheleuprothrserasparghisalaaspasplys450455460gluglyglyserleutyrsertrpvaltyrserargleuleuargarg465470475480glyilealaserglnvaliletyrgluaspthrleuargasnvalgln485490495alaasntyrleuleuasnglnvalileproglyvalleualalysleu500505510glyasnleupropheileleualagluproleugluilealaasptyr515520525pheileglyleuaspileserargglyserlyslyslysglyalagly530535540thrmetasnalacysalaservalargleutyrglylysglnglyglu545550555560pheileargtyrargleugluaspalaleuilegluglyglugluile565570575proglnargileleugluserpheleuproalaalaaspleulysasn580585590lysthrvalleuiletyrargaspglyargphecysglyglugluval595600605lystyrleuarggluargalaasnalaileserserlyspheileleu610615620valglucystyrlysserglyileproargmettyrasnleuthrglu625630635640lysleuvalleuproproarglysglyleualaleuargileserasp645650655pheglualaileleuvalthrthrgluvallysserglusermetgly660665670leuproleuproleuargleuasnvalileprotyrproglyglngln675680685valserilegluservalvalgluthrthrvalglnleuthrleuleu690695700hishisglyserleuasngluproargleuproileproleuphegly705710715720seraspargmetalatyrargargleuglnglyiletyrproglyala725730735leuaspglyaspargglnphetrpleu740745<210>7<211>764<212>prt<213>mastigocoleustestarum<400>7metasnilealailethrlysproleuproglnseralavalthrpro151015ilepheleusergluileleuproleuilephegluvalaspasnser202530argtyrasnleulysgluasnileilecyspheglnilepheproglu354045valglyarggluileglyasnargleusertrphisleucysglnlys505560phethrgluleuilevaliletrpglnasnasnphephetrpvalleu65707580asnlysprothrglnileproproasnhislysglnphelyslysala859095leuleugluilecysglugluleulysargaspileserasnsertyr100105110asnpheasnphealaphehisasnasntyrservalglnleuvalglu115120125lysproglnilethralaserthrleualaglnleualathrargile130135140leulysilealacyspropheserserproilealapheserglnlys145150155160glnvalgluvalargargglualaasnphetrpalagluileileglu165170175leugluglyglnpheileproalaleuthrilethralalysserasn180185190pheasncysthrileasnleualagluphetyrglnasnhissertyr195200205lysglnasnproglnglnleuleuvalglyleulysvalglnaspile210215220gluargserserphealathrilethrglyilevalglythrvalgly225230235240gluhislysglulysleulysalaseralathrglythrileserlys245250255glnalaleugluglualaproaspgluglnproleuvalservalgln260265270pheglylysasnlysglnglnphehistyralametglyalaleuarg275280285procysilethrleugluthralailelysleuglyleugluhisasn290295300lysleuleuasnvalalalysilevalproarggluarglysgluleu305310315320leuileleutyrlysglnglualaglulysvalleuthrasntyrgly325330335pheglyleuglylysserileasnserargasntyrproglnleuphe340345350trpglnprolysphelysileseralathrlysleuleupheglyasn355360365asnilethrglupheglnserasnileleulysglyleuserarggly370375380glyvaltyrargarghisglnasntyrargasnproserasplysile385390395400thrilealaalaleulysileglyasnpheleuvallysasnsercys405410415leulysglnvalglngluargleuglnglntyrglyphegluserile420425430ileproglngluasnvallysserleutyrleugluasnphethrthr435440445ileglualaargthrlysvalgluglulysileasnaspleumetglu450455460lyshisproaspilevalleuvalpheleuproglngluaspargasn465470475480seraspaspthrproasnglyserleutyrserleuilesersercys485490495leuleuargargglyilealaserglnpheiletyrgluargthrleu500505510lysaspvallysphehisasnileleuasnglnileileproglyile515520525leualalysleuglyasnleuprophevalleualalysproleuglu530535540ilealaasptyrpheileglyleuaspvalserargalaserlyslys545550555560argserlysglysermetasnalacysalaserserargleutyrgly565570575lysglnglyglupheaspasptyrlysileglyaspalaleuileglu580585590glyglugluileproglnvalvalleuglnasnpheleuproglyala595600605lysleulysglulysthrvalleuiletyrargaspglyargphecys610615620glyaspglualaleuhisleulysglutrpalalysalathrglyser625630635640glnpheileleuvalglucystyrlysserglyileproargleutyr645650655asntrpgluglnglnileilelysalaprothrlysglyleuglyleu660665670argleuseralaarggluileileleuvalthrthrgluphelysser675680685gluasnvalglyleuproleuproleuargleulysilehisgluala690695700glyhisglnvalserilegluaspleualagluthrthrleulysleu705710715720thrleuleuhishisglyserleuarggluproargleuproilepro725730735leupheglyseraspargilealatyrargargleuargglyiletyr740745750proglyglyleuaspglyasnargglnphetrpleu755760<210>8<211>605<212>prt<213>exiguobacteriumsp.<400>8metlyslysglnleugluargleualahisproasntyrmetmetasn151015argglylyspheargserlysglnalahisprolysserthrsergly202530leuleuiletyrproalaleuaspleuasnvalasnvalsergluthr354045alagluilevalpheglypheaspleuthrhisglnpheglutyrarg505560gluasnleuleuglnglnilelysargaspprolysservalserala65707580glymetargvalileaspserthrhisprolyssertyrglutyrglu859095phevalgluvalalaprotyrargalaasngluvalserproilemet100105110argcysserileileasptyrphealalyslysaspprolysargval115120125ilegluproaspalaleuvalvalhisvallysaspargasnasngln130135140ileleuiletyrleuprogluglnleulysglnsercysserpheglu145150155160thrileproalaarghisleuglyalavalserargileilelysleu165170175serproaspalaargmetserlysleumetproglualaleualaleu180185190ileglyargleuprometleuglnphegluargglnaspvalargala195200205alaargleuglytyrserileglnthrleuproserproargleuarg210215220pheglylysglyargthrthrsertyralalysthrglyleulysgln225230235240glyglyvaltyrgluthrglyglualathrvalserphephevalasp245250255prolysleuargasphisglnlysleuglnvalleuglupheileasn260265270lysleulysthrthrsergluargpheglyvalthrleuasnvalser275280285hislysprolysglyleuserglnlysleuproseraspleuleugln290295300thrgluaspileleutyrglnleulysasnileproglnhispheglu305310315320glyvalvalvalvalilealagluglualaserleuglnhissertyr325330335glnalailelysargglnpheglyglylysglnaspvalvalthrgln340345350cysvalgluleuhisaspargvalleuasnsergluaspthrleutyr355360365asnileleuleuglyiletyrvallysalaglyleuglnprotrpile370375380leuglygluproleuhisseraspcysphevalglyleuaspvalser385390395400hisgluasnglylyshisalaalaglyileileglnileileglylys405410415aspglyalametilelysglnlysalaleuserthrserglualagly420425430glulysilesersergluthrmetarggluilevaltyraspthrleu435440445hisalapheglugluglntyrglyhisalaprolyshisilethrphe450455460hisargaspglypheglyarggluaspleuthrleuileaspserile465470475480leuserproarggluileglnpheasptyrvalgluileleulysasn485490495ileasnargargmetalailehisgluaspglutrplysthrsergln500505510glyleusertyrthrlysgluargmetglytyrleuleuserthrasn515520525prohisalaargvalglymetalalysproleulysvalvalglngln530535540thrthrthrleupropheglualaileleuthraspvaltyrargleu545550555560serphemethisvalhisserleuleulysthrargleuproilethr565570575thrhistyralaaspleuserserthrphehisasnargglyleuleu580585590asnalaasnthrgluhisgluglualaleupropheval595600605<210>9<211>605<212>prt<213>exiguobacteriumsp.<400>9metlyslysglnleugluargleualahisproasntyrmetmetasn151015argglylyspheargserlysglnalahisprolysserthrsergly202530leuleuiletyrproalaleuaspleuasnvalasnvalsergluthr354045alagluilevalpheglypheaspleuthrhisglnpheglutyrarg505560gluasnleuleuglnglnilelysargaspprolysservalserala65707580glymetargvalileaspserthrhisprolyssertyrglutyrglu859095phevalgluvalalaprotyrargalaasngluvalserproilemet100105110argcysserileileasptyrphealalyslysaspprolysargval115120125ilegluproaspalaleuvalvalhisvallysaspargasnasngln130135140ileleuiletyrleuprogluglnleulysglnsercysserpheglu145150155160thrileproalaarghisleuglyalavalserargileilelysleu165170175serproaspalaargmetserlysleumetproglualaleualaleu180185190ileglyargleuprometleuglnphegluargglnaspvalargala195200205alaargleuglytyrserileglnthrleuproserproargleuarg210215220pheglylysglyargthrthrsertyralalysthrglyleulysgln225230235240glyglyvaltyrgluthrglyglualathrvalserphephevalasp245250255prolysleuargasphisglnlysleuglnvalleuglupheileasn260265270lysleulysthrthrsergluargpheglyvalthrleuasnvalser275280285hislysprolysglyleuserglnlysleuproseraspleuleugln290295300thrgluaspileleutyrglnleulysasnileproglnhispheglu305310315320glyvalvalvalvalilealagluglualaserleuglnhissertyr325330335glnalailelysargglnpheglyglylysglnaspvalvalthrgln340345350cysvalgluleuhisaspargvalleuasnsergluaspthrleutyr355360365asnileleuleuglyiletyrvallysalaglyleuglnprotrpile370375380leuglygluproleuhisseraspcysphevalglyleualavalala385390395400hisgluasnglylyshisalaalaglyileileglnileileglylys405410415aspglyalametilelysglnlysalaleuserthrserglualagly420425430glulysilesersergluthrmetarggluilevaltyraspthrleu435440445hisalapheglugluglntyrglyhisalaprolyshisilethrphe450455460hisargaspglypheglyarggluaspleuthrleuileaspserile465470475480leuserproarggluileglnpheasptyrvalgluileleulysasn485490495ileasnargargmetalailehisgluaspglutrplysthrsergln500505510glyleusertyrthrlysgluargmetglytyrleuleuserthrasn515520525prohisalaargvalglymetalalysproleulysvalvalglngln530535540thrthrthrleupropheglualaileleuthraspvaltyrargleu545550555560serphemethisvalhisserleuleulysthrargleuproilethr565570575thrhistyralaaspleuserserthrphehisasnargglyleuleu580585590asnalaasnthrgluhisgluglualaleupropheval595600605<210>10<211>863<212>prt<213>halogeometricumpallidum<400>10metvallysargtyrileserphehisleupheproargilelysleu151015cysglyvaltyrleucysleuargmetasnthrlysaspaspileala202530hislysglnproilethrilegluvalglnvalleulysgluleuasp354045lysproserprolysmetalathrargleuleuvalalaaspargala505560glyasnargpheproleualailetrplysasnasnalaleuserasp65707580tyrasptrpthrileglyglntrptyrargleugluasnalaarggly859095asnvalpheasnglylysglnserleuasnglyserserasnmetarg100105110alathrproleuglualaserglugluaspgluthrargalaaspasp115120125valglyargvalaspthrileleuglyasnleuserproasnglnala130135140tyrleuserleupheproileserargserpheaspthrleuserval145150155160tyrglutyrserileglualaalaglualaphegluaspaspproasp165170175thrvalthrtyrglncysalaglyargleuargargilethrglyala180185190glyvalalatyralaglyprometglnilevalserthrarglysleu195200205proasplysleualaasppropheserleusergluprothrgluarg210215220gluleulysalaalaaspalaargasparghisargilegluargleu225230235240leulysserleuvallysalaalaileaspaspserthrtyrasppro245250255tyrglnileasnargileargalaargthrproalailethralagly260265270aspglyleupheglualacystyrgluphealaalaargvalaspval275280285metproserglyaspalaphevalglyilegluvalargtyrhisala290295300argserglnvalthralaaspvaltyrgluasplysthrglygluleu305310315320valglythrilevalgluhisaspprogluargtyrasnvalsergly325330335thrglyargvalvalglyphethrasphistyrphethraspalaleu340345350aspgluleuglyglyleuserleualaasptrptyralaglnlysasp355360365argvalprogluglyvalleuglualaleuargglulysasnproarg370375380leuvalaspileglntyrglngluaspgluproalaglnilehisval385390395400progluleuleuargvalalaproarglysgluvalvallysgluleu405410415aspprothrphehisargargtrpaspargglualalysmetleupro420425430asplysargphearghisalailegluphevalasphisleuglyser435440445leuproaspileaspalathrvalalaprogluproleuglyproser450455460leusertyrmetserthralavalaspargglugluasnleuargphe465470475480lysaspglyargthralathrthrproserserglyileargsergly485490495valtyrglnglnprothrserpheaspilealatyrvaltyrprothr500505510glusergluglngluserlysglnpheileserasnphegluasnlys515520525leuserargcyshiscysgluprothralathrarghisvalprotyr530535540gluleuglyglygluleusertyrleualavalileasngluleuglu545550555560servalaspalavalleualavalvalproproargasnaspasparg565570575ilealaalaglyaspilethraspprotyrprogluphelyslysgly580585590leuglylysglnlysvalproserglnmetvalvalthrgluasnleu595600605aspthrargtrpvalmetasnasnthralametglyleuilealagly610615620alaglyglyvalprotrpargvalaspglumetproglyglualaasp625630635640cyspheileglyleualavalthrargaspprogluthrglyglnhis645650655leuglyalaseralaasnvalvaltyralaaspglythrvalpheala660665670serlysthrglnthrleuglnserglygluthrpheaspgluglnser675680685ileileaspvalilelysaspvalpheglngluphevalargargglu690695700glyargserprogluhisilevalilehisargaspglyargleuphe705710715720gluaspalaaspgluileglnalaprophealaaspserglyvalser725730735ileaspileleuaspilearglysserglyalaproargilealaarg740745750tyrgluaspasnserphelysileaspglulysglyargleupheile755760765serglnaspaspthrhisglypheilealathrthrglylysproglu770775780pheaspaspseraspasnleuglythrprolysthrleuargvalval785790795800argargalaglyaspthrprometleuthrleuleulysglnvaltyr805810815trpleuserglualahisileglyservalserargservalargleu820825830proilethrthrtyrtyralaaspargcysalagluhisalaargglu835840845glytyrleuleuhisglygluleuilegluglyvalprotyrleu850855860<210>11<211>2196<212>dna<213>人工序列<400>11atgccaatcgtactcaacgcgttcccattgaaggttccagacatggaattgaagttcgtt60caaatcccatacgacaagactactttggactctttgagatcttctcacaagatgactcac120gttttcagaagacaaggtgactctatccaaatcttctcttctgacggtactttcccaaag180tctggtactccacaaactttgcaattgaagaacaacttgggtatcttcttctctttggtt240aaggacggtttgttgaagcacttcgctggtttgggtagatctccatgtggtttcaaccca300atcgaagttgtttctgctcaagctaaggacaacttgttggcttctatcttgggtgaagct360tacccattgaagatctgtgctaagtactctatcgacactagaactgttcaggggcaacca420tgcctaatcatcgactgttctactagaagagttgttaaggaaaactgtttgttcttcttg480aagactggtttcaacgttatcggtagatacgttgttactgaacaagacgacggtttcaga540aagttgttgggtttcgttgaaaactgtcacgaaggtagaactttgtctgttatcagacca600gacggtcaagctgttcacgctgaagctaaggacgtttacttggaagcttctagagctaac660ttcgacgactacatcttgtacactcacggtactaagaaggactctatcgttgaaagaatc720cgtcagtctgtaagcatcttcaacggtggtaagaacaagaaggacagaatcgacgctttg780aagaagtacatccaagctactaacatctctttgttggacggtactagaatcgaaatcgaa840gaaccatctgacatccaaaaggactgtgctcaaatgcaaaagccagttttcgttttcaac900gacaacggtgaagctgactggactgaaaagggtttgactcaaaacggtccatacactaag960agaactttcgacagaaacgacccatctatctgtgttatctgtgctcaacacgacagaggt1020agagttgaacaattcgttagaaagttgttgaagggtatggctaactctaagtacttcaga1080aacggtttggaaggtaagttcgctttgggtacttctcgtgttgaagtcttcgaaacctct1140actaactctgttgacgcttacaagtctgctatcgaagctgctatcagaaagaaggctgac1200gacggtggtagatgggacttggctttggttcaagttagacaatctttcaagcaattgaag1260gttactgacaacccatactacttgggtaagtctttgttctacatgcaccaagttccagtt1320caagacttcactatcgaattgttgtctcaatctgactactctttgggttactctttgaac1380aacatgtctttggcttgttacgctaagatgggtggtgttccatggttgttgaagtcttcg1440ccaacattgtctcacgaactcgttatcggtatcggtaacgctaacatcgttcaagaaaga1500ggtgctcacaaccaaagaatcatgggtatcactactgttttctctggtgacggttcttac1560atcgtttcttctacttctaaggctgttgttccagaagcttactgcgaggctctcactagt1620gtgctcggtgaaaacatcgaaaagatccaaagaagaatgaactggcaaaagggtgactct1680atcagattgatcttccacgctcaagttaagaagttcaacaaggaagaaatccaagctgtt1740agagctgttatcgacaagtacagagactaccaaatcgaatacgctttcgttaagatctct1800gaaaaccacggtttgcacatgttcgactcttctactgctactatgccaaagggtagattg1860gctactcacagaggtaagactttcaagttgtctaagaacgaaatgttggtttacttgatc1920ggtcaaagagaattgagacaagaaactgacggtcacccaagaggtgttatcgttaacgtt1980cacaaggactctactttcaaggacatcaagtacttgtctgctcaattgtactctttcgct2040tctcactcttggagatcttacttcccaaacccaatgccagttactatcacttactctgac2100ttgatcgctcacaacttgggttggttgaaccaattgccaggttggtctgactctgttatg2160atcggtaagatcggtcactctcaatggttcttgtaa2196<210>12<211>1995<212>dna<213>人工序列<400>12atgtctggtttgttcttgaacttctaccaagttgacatcccaactaagtctgttccaatc60cactctgttgaatactctcactactctagtaaggaagcgtttatagctctcaaggaaaac120tttccatacttctctttctacagagacgacgacagaatcttgatctggaagaaggacaag180gacgctgaattgccagaaaagaactctttgatcgaaatcgacttcactgaaaaggctaag240gttttgtctaagatcttggaaagagctatcatcgacttcatcgaaccaaagggttacaag300atcttcaagaacaagtactctaactcttgggaaatcgtttctatgaaggacatcttgaac360ggtggcatagaaggcttgtctatcaaccgtatcgttcacttctctccatgtttcttcttc420aaggaaaacaagttgatgttgggtttctctttgtctacttcgctcaagaacgtgttcaca480tggaacaaggctgacttcgaaagatacggtttcgacatcaagggtttgaagggtgacgaa540gaaagaatcttcgctaacaagcaatctttgaagagattcttggaaactaagggtgctgtt600gctatgtacgaccaaatcatcgctaaggaaaacaagaacgctaagatgttctctatcatc660gacggtttctacagatggttggaaagaaacaagactgaaatccaattgccattcggtttg720aagatcaactctgtttctaagaagtacttgccattcgaagacgaattgatcaagtctgaa780atcatcccaaagccacaaagatacttctactctaacagaaagaacactcaatctttgaga840tactacgacgaaatggttaagacttaccaaccatactctttggaattgtaccaaaacaag900caaatcaacatcggtatcatctgtccatctgaataccaaggtgaaactgaaggtttcatc960aagaagatcgaattgaagttgaaagaagttttccacttcaacagcttgatcttccacttt1020aagactatcactaacaaggacttggctagttacaaggaagtgctctacgacgacgaattg1080ttgaagtgtgacttgatctacgttatcgttaacgaagctcaagaaaagttgtctccaaac1140aactctccatactacgtttgtaaggctaagttcatcggtaacggtatcccaactcaagac1200atccaaatcgaaactatcagacaaaacttgaacgctttcactatgactaacatctctttg1260aactcttacgctaagttgggtggtactgcttggactatcgaaaaggaagacaagttgaag1320gacgaattggttatcggtatcggttctactttgtctgaaaacggtcaattcgttttgggt1380atcgctcaaatcttccacaacgacggtagatacatggctggtgactgttctccattgtct1440actttctctaactacgctgaaaacttggaagaccacttgtacaagactttgaagccattg1500gttgaagaaatgtctaagtctggtactttcagattgatcttccacttgttcaagtctgct1560tctgaagaatacgaaatcagagctatcaacggtttgcaaaagagattggctaactacaac1620ttcgaattcgctttggttcacttggcttacggtcacaacttcagattgtactacaacgac1680ggtaacggtgacatcaaccaaggtacttacatccaattgtctaagcactctgctttgttg1740cacttcgtttctaagtctgacttgccattgaagatcgacttggacaagagatctactttc1800acttctttgttctacatcgctaagcaagtttactggttctctcacttgtctcacagatct1860tacatgccatctaagagaactgttactatcatgtacccatctatcatggctaagatgact1920gaagaattgaagaaggttgaaggttgggactacgaaagattgaaggctgtttctgacaag1980ttgtggttcatctaa1995<210>13<211>2592<212>dna<213>人工序列<400>13atggttaagagatacatatcgttccacttgttcccaagaatcaagttgtgtggtgtttac60ttgtgtttgagaatgaacactaaggacgacatcgctcacaagcaaccaatcactatcgaa120gttcaagttttgaaggaattggacaagccatctccaaagatggctactagattgttggtt180gctgacagagctggtaacagattcccattggctatctggaagaacaacgctttgtctgac240tacgactggactatcggtcaatggtacagattggaaaacgctagaggtaacgttttcaac300ggtaagcaatctttgaacggttcttctaacatgagagctactccattggaagctagtgaa360gaagacgaaactagagctgacgacgttggtagagttgacactatcttgggtaacttgtct420ccaaaccaggcgtacttgagcttgttcccaatctcgcgtagcttcgacactctctcggtg480tacgaatacagcatcgaagcggcggaagcgttcgaagacgacccagacactgttacttac540caatgtgctggtagattgagaagaatcactggtgctggtgttgcttacgctggtccaatg600caaatcgtttctactagaaagttgccagacaagttggctgacccattctctttgtctgaa660ccaactgaaagagaattgaaggctgctgacgctagagacagacacagaatcgaaagattg720ttgaagtctttggttaaggctgctatcgacgactctacttacgacccataccaaatcaac780agaatcagagctagaactccagctatcactgcgggcgacggcttgttcgaagcgtgctac840gaatttgctgctagagttgacgttatgccatctggtgacgctttcgttggtatcgaagtt900agataccacgctagatctcaagttactgctgacgtttacgaagacaagactggtgaattg960gttggtactatcgttgaacacgacccagaaagatacaacgtttctggtactggtagagtt1020gttggtttcactgaccactacttcactgacgctttggacgaattgggtggtttgtctttg1080gctgactggtacgctcaaaaggacagagttccagaaggtgttctcgaagctctcagagaa1140aagaatccaagattggttgacatccaataccaagaagacgaaccagctcaaatccacgtt1200ccagaattgttgagagttgctccaagaaaggaagttgttaaggaattggacccaactttc1260cacagaagatgggacagagaagctaagatgttgccagacaagagattcagacacgctatc1320gaatttgttgaccacttgggttctttgccagacatcgacgctactgttgctccagaacca1380ctcggcccaagcctctcttacatgtcgactgctgttgacagagaagaaaacttgagattc1440aaggacggtagaactgctactactccatcttctggtatcagatctggtgtttaccaacaa1500ccaacttctttcgacatcgcttacgtttacccaactgaatctgaacaagaatctaagcaa1560ttcatctctaacttcgaaaacaagttgtctcgttgtcactgtgaaccaactgctactaga1620cacgttccatacgaattgggtggtgaattgtcttacttggctgttatcaacgaattggaa1680tctgttgacgctgttttggctgttgttccaccaagaaacgacgacagaatcgctgctggt1740gacatcactgacccatacccagaatttaagaagggtttgggtaagcaaaaggttccatct1800caaatggttgttactgaaaacttggacactagatgggttatgaacaacactgctatgggt1860ttgatcgctggtgctggtggtgttccatggagagttgacgaaatgccaggtgaggctgac1920tgtttcatcggtctcgacgttactcgtgacccagaaactggtcaacacttgggtgcttct1980gctaacgttgtttacgctgacggtactgttttcgcttctaagactcaaactttgcaatct2040ggtgaaactttcgacgaacaatctatcatcgacgttatcaaggacgttttccaagaattt2100gttagaagagaaggtagatctccagaacacatcgttatccacagagacggtagattgttc2160gaagacgctgacgaaatccaagctccattcgctgactctggtgtttctatcgacatcttg2220gacatcagaaagtctggtgctccaagaatcgctagatacgaagacaactctttcaagatc2280gacgaaaagggtagattgttcatctctcaagacgacactcacggtttcatcgctactact2340ggtaagccagaatttgacgactctgacaacctcggtactccaaagactctcagagttgtt2400cgtagagctggtgacactccaatgttgactttgttgaagcaagtttactggttgtctgaa2460gctcacatcggttctgtttctcgttctgttagattgccaatcactacttactacgctgac2520agatgtgctgaacacgctagagaaggttacttgttgcacggtgaattgatcgaaggtgtt2580ccatacttgtaa2592<210>14<211>2244<212>dna<213>人工序列<400>14atgaactacactgctgctaacactgctaactctccaatcttcttgtctgaaatctcttct60ttgactttgaagaactcttgtttgaactgtttccaattgaaccaccaagttactagaaag120atcggtaacagattctcttggcaattctctagaaagttcccagacgttgttgttatcttc180gaagacaattgtttttgggtgctagctaaggacgaaaagtctatcccatctttgcaacaa240tggaaggaagctttgtctgacatccaagaagttttgagagaagacatcggtgaccactac300tactctatccactggttgaaggacttccaaatcactgctttggttactgctcaattggct360gttagaatcttgaagatcttcggtaagttctctgacccaatcgttttcccaaaggactct420caaatctctgaaaaccaagttcaagttagaagagaagttaacttctgggctgaaatcatc480aacgacactgacccagctatctgtttgactgttgactcttctatcgtttactctggtgac540ttggaacaattctacgaaaaccacccatacagacaagacgctgttaagttgttggttggt600ttgaaggttaaggacagagaaactaacggtactgctaagatcatcagaatcgctggtaga660atcggtgaaagaagagaagacttgttgactaaggctactggttctatctctagaagaaag720ttggaagaagctcacttgggtcaaccagttgttgctgttcaattcggtaagaacccacaa780gaatacatctacccattggctgctttgaagccatgggttactgacgaagacgaatctttg840ttccaagttaactacggtaacttgttgaaggctactaagatcttctacgctgaaagacaa900gaattgttgaagttgtacaagcaagaagctcaaaaggctttgaacaacttcggtttccaa960ttgagagaaaagtctatcaactctcaagaatacccagaattgttctggactccatctatc1020tctatcgaacaaactccaatcttgttcggtcaaggtgaaagaggtgaaaagagagaaatc1080atcaagggtttgtctaagggtggtgtttacaagagacacagagaatacgttgacccagct1140agaaagatcagattggctatcttgaagccagctaacttgaaggttggtgacttcagagaa1200caattggaaaagagattgaagttgtacaagttcgaaactatcttgccaccagaaaaccaa1260atcaatttctctgttgaaggtctcggtttcgaaaagagagctagattggaagaagctgtt1320gacagattgatcggtgttgaaatcccagttgacatcgctttggttttcttgccacaagaa1380gacagaaacgctgacaacactgaagaaggttctttgtactcttggatcaagagaaagttc1440ttgggtagaggtgttatcactcaaatgatctacgaaaagactttgaacgacaagtctaac1500tacaagaacatcttgaaccaagttgttccaggtatcttggctaagttgggtaacttgcca1560tacgttttggctgaaccattggaaatcgctgactacttcatcggtttggacgttggtaga1620atgccaaagaagaacttgccaggctcgttgaacgtgtgcgcttctgttagattgtacggt1680aagcaaggtgaattcgttagatgtagagttgaggacagcttgactgaaggtgaggaaatc1740ccacaaagaatcttggaaaactgtttgccacaagctgaattgaagaaccaaactgttttg1800atctacagagacggtaagttccaaggtaaggaagttgaaaacttgttggctagagctaga1860gctatcaacgctaagttcatcttggttgaatgttacaagactggtatcccaagattgtac1920aacttgcaacaaaagcaaatcaacgctccatctaagggtttggctttggctttgtctaac1980agagaagttatcttgatcacatcgcaagtaagcgaacaaatcggtgttccaagaccattg2040agattgaaggttcacgaattgggtgaacaaagaaacttgaagcaattggttgacactact2100ttgaagttgactttgttgcactacggttctttgaaggacccaagattgccaatcccattg2160tacggtgctgacatcatcgcttacagaagattgcaaggtatctacccatctttgttggaa2220gacgactgtcaattctggttgtaa2244<210>15<211>2544<212>dna<213>人工序列<400>15atgactactcaagctgacatcgaagacggtaagagaatcgacatcactgttcaagttgtt60gctgaattggactgtactacttctaagatggctaagagattgaaggttagagacactgct120ggtaacgaattcccattggctatctggaacaacaacgctttgtctgacttcgcttgggaa180tctggtagatggtacgaattggaaaacgctaagggtaacgaatggagaggtgaaaagtct240ttgaacggttcttctagattgtctgctgaaatcgttgaaccaccagaagaagaaaacgaa300gactcttctgaatctgaaaagatctctggtggtcaattgttcgacactttgcaagacaac360ttgccatacttgtctttgttcccattcgacagagacttcgaaactttgtctgtttacgaa420tacagaatcgaagctaacgacgctttcgaagactctccaatggacgctacttacaacttg480gctgcttacttgagatcttcttctaacgctgctgttactcacgctggtgttatgtctttg540atctctactgaaccattggaaatctctttgccagacccattcactttgacttctgaaact600agagttactttgagagctgacgaaacttctgacaacgaaactatggttagattgttgcaa660caattgatcaagaagtctatctctactgacaagtacgaaactggtagagttgacagaatc720agaactaaggaaccagttatctctggtccagaaggtttgttcgaagcttgtttggcttac780agagttggtatcgaagttttgccatctggtgacgcttacgttggtgttgaagtttctcac840cacgctagatctcaagctactgttgacgaatacatcgacagagttaacgctactgttgac900gaattggttgacactcacgttgaacacgacccagaaacttactctactccaggttctggt960caattgaagtctttggctgacgttagattcactgacccaatcccagacttcggtaaccaa1020tctttggctgactggtacgaaagaaaggacagagtttctgacgaaatgttggaccaattg1080agatctgaaaacccaagattggttgaagttcaatacaacccaaactctgacgaaacttct1140gttcacgttccacaattgttgagagtttctccaagaaaggaagttgttaagcaattgtct1200ccaagattccacagagaatgggacagaagagctaagatgttgccagaagaaagattccaa1260aaggctactcaattcgttactgacttggacactttgccagctgttgacacttacttggac1320ccaactccagttggtccatctatctctttcatgtctactgaagttgacagagctgacaac1380ttgagattcggtaacgactgtactgctgacttgccaggcagtggtctcaacagatacggc1440gtttacagaagaccatcgagcttcagattgcactacttggttccagaaagatacactgac1500gaattcgttgaattgagatctagaatcgaagaacaattggaagacatgaactgttctcca1560gacgaaatgtcttactctgaatacgctttgggttctgaaatcgaatactctaacgctgct1620gctgctatctctgacgttgacgttgttttggctgctgttccatctccatctaacgacttc1680atccaagacggtactatcgacgacccatacggtgaattcaagaaggctttgggtaagcaa1740actatcccatctcaaatggttagagttgacaacttggacaacaagtgggttgttagaaac1800actgctttgggtatcatcgctggtgctggtggtgttccatggagagttgaccaaatgcca1860ggtaacactgactgtttcgttggtttggacgctactagagacccagacactggtcaattc1920ttgggtgcttctgctaacgttgttttggctgacggtactgttttcgtttctaagactcaa1980tctttgcaatctggtgaaactttcgacgaagacgctgttgttgacgttttgaaggacgtt2040cacagagaattcgttagagctgaaggtgaaaagccaaactctatcgttgttcacagagac2100ggtagattgttcgaagacgttgacgctatcttggctccattcaacggtactggtatcgac2160atcgacatcttggacatcagaaagtctggtgccccaagagccgcgttcagaagaaacggc2220caattcagagttgaccacaagggtagaatcttcatcgctcaaaacgacgaccacggtttc2280ttgactactactggtagaccagaattcgacgattcggacggtctcggtactccaaggact2340ctcagaatcgttcgtagagctggtgaaactccaatgcaaactttgatggaacaagtttac2400tggttgtctgaatctcacgttggttctgctcaaagatctactagattgccaatcactact2460tactacgctgacagatgtgctgaagctactagaaagggttacttggttaacggtgaaatc2520atcagaggtgttccatacatctaa2544<210>16<211>2238<212>dna<213>人工序列<400>16atgactgttgctgttcaagttcacactcaaccagcttctccaatcttcttgtctgaaatc60ttcccattgagaatctctcaattgaacttgatcggtttcagagttactccagaagttgac120agagaaatcggtaacagattgtcttggagattctctcaaaagttcccagacgttgttgct180atctggcaagacaagtacttctgggttttggctaagccagaccaaccaatgccatctcaa240gacgaatggagattgaagttggctgaaatcttggaagaattgaagaaggacatcggtgac300agatactactctatccaatgggttagagaaccacaagttactgcttctatcttggctcaa360ttggctgttagagttttgaagatcgctagaccattctcttctaactctgttatgtctgaa420aaccaagttcaagttagaagagaagttgacttctgggctgaaactatcgacttgcaaggt480gttttgcaaccagctttgactttgactatccactctagaatcttgttcaagggtgacttg540gctcaattctgtgaaaaccacccatacagacaagacccaaagaacatcttgatcggtttg600aaggttagagacatcgaacacaactctttcgctagaatcactggtatcgttggtactatc660gaagaacacagagaccaattgttgaaggaagctactggtgctatctctaagcaagctttg720aaggacgctccaaacgaacaaccagttgttgctgttcaattcggtaaggacgctaagcca780ttccactacgctatggctgctttgagaccatgtatcactccagaaactgctaagagattc840gaagttgactacggtgaattgttgaaggctactaaggtttcttacaaggacagaaaggac900ttgttggttttgtacaagaaggaagctggtgaagctttgtacaactacggtttccaattg960gaaagatctatcaactctagagactgtccaaacttgttctgggaaccaaaggttaaggtt1020gaacaaactcaattgatgttcggtgaaaacttcactggtatccaatctcaaatcttgact1080ggtttgtctaagggtggtgtttacagaagacacgaagactacttggacccatctagacca1140atcagaatcgctgctttgaagctctgtaacttcaaggttggtagcttcttgtcggaattc1200caaaagagattgaagagatacggtttcgaatctatcttgccagaagaaaacaagaaggaa1260ttgtctgttgactctttgagaggtgctgaagctagagctaaggttgaagaagctgttgac1320gacttgatggttagacagccagacgttgttctcacattcttgccaacttcggacagacac1380gctgacgacaaggaaggtggttctttgtactcttgggtttactctagattgttgagaaga1440ggtatcgcttctcaagttatctacgaagacactttgagaaacgttcaagctaactacttg1500ttgaaccaagttatcccaggtgttttggctaagttgggtaacttgccattcatcttggct1560gaaccattggaaatcgctgactacttcatcggtttggacatctctagaggttctaagaag1620aagggtgctggtactatgaacgcttgtgcttctgttagattgtacggtaagcaaggtgaa1680ttcatcagatacagattggaagacgctttgatcgaaggtgaagaaatcccacaaagaatc1740ttggaatctttcttgccagctgctgacttgaagaataagactgtgctcatctacagagac1800ggtagattctgtggtgaagaagttaagtacttgagagaaagagctaacgctatctcttct1860aagttcatcttggttgaatgttacaagtctggtatcccaagaatgtacaacctcactgag1920aagttggtgctaccaccaagaaagggtttggctttgagaatctctgacttcgaagctatc1980ttggttactactgaagttaagtctgaatctatgggtttgccattgccattgagattgaac2040gttatcccatacccaggtcaacaagtttctatcgaatctgttgttgaaactactgttcaa2100ttgactttgttgcaccacggttctttgaacgaaccaagattgccaatcccattgttcggt2160tctgacagaatggcttacagaagattgcaaggtatctacccaggtgctttggacggtgac2220agacaattctggttgtaa2238<210>17<211>2295<212>dna<213>人工序列<400>17atgaacatcgctatcactaagccattgccacaatctgctgttactccaatcttcttgtct60gaaatcttgccattgatcttcgaagttgacaactctagatacaacttgaaggaaaacatc120atctgtttccaaatcttcccagaagttggtagagaaatcggtaacagattgtcttggcac180ttgtgtcaaaagttcactgaattgatcgttatctggcaaaacaacttcttctgggttttg240aacaagccaactcaaatcccaccaaaccacaagcaattcaagaaggctttgttggaaatc300tgtgaagaattgaagagagacatctctaactcttacaacttcaacttcgctttccacaac360aactactctgttcaattggttgaaaagccacaaatcactgcttctactttggctcaattg420gctactagaatcttgaagatcgcttgtccattctcttctccaatcgctttctctcaaaag480caagttgaagttagaagagaagctaacttctgggctgaaatcatcgaattggaaggtcaa540ttcatcccagctttgactatcactgctaagtctaacttcaactgtactatcaacttggct600gaattctaccaaaaccactcttacaagcaaaacccacaacaactcctcgttggtctcaag660gttcaagacatcgaaagatcttctttcgctactatcactggtatcgttggtactgttggt720gaacacaaggaaaagttgaaggcttctgctactggtactatctctaagcaagctttggaa780gaagctccagacgaacaaccattggtttctgttcaattcggtaagaacaagcaacaattc840cactacgctatgggtgctttgagaccatgtatcactttggaaactgctatcaagttgggt900ttggaacacaacaagttgttgaacgttgctaagatcgttccaagagaaagaaaggaattg960ttgatcttgtacaagcaagaagctgaaaaggttttgactaactacggtttcggtttgggt1020aagtctatcaactctagaaactacccacaattgttctggcaaccaaagttcaagatctct1080gctactaagttgttgttcggtaacaacatcactgaattccaatctaacatcttgaagggt1140ttgtctagaggtggtgtttacagaagacaccaaaactacagaaacccatctgacaagatc1200actatcgctgctttgaagatcggtaacttcttggttaagaactcttgtttgaagcaagtt1260caagaaagattgcaacaatacggtttcgaatctatcatcccacaagaaaacgttaagtct1320ttgtacttggaaaacttcactactatcgaagctagaactaaggttgaagaaaagatcaac1380gacttgatggaaaagcacccagatatcgttttggtcttcctgccacaagaagacagaaac1440tctgacgacactccaaacggttctttgtactctttgatctcttcttgtttgttgagaaga1500ggtatcgcttctcaattcatctacgaaagaactttgaaggacgttaagttccacaacatc1560ttgaaccaaatcatcccaggtatcttggctaagttgggtaacttgccattcgttttggct1620aagccattggaaatcgctgactacttcatcggtttggacgtttctagagcttctaagaag1680agatctaagggttctatgaacgcttgtgcttcttctagattgtacggtaagcaaggtgaa1740ttcgacgactacaagatcggtgacgctttgatcgaaggtgaagaaatcccacaagttgtt1800ttgcaaaacttcttgccaggtgctaagttgaaggaaaagactgttttgatctacagagac1860ggtagattctgtggtgacgaagctttgcacttgaaggaatgggctaaggctactggttct1920caattcatcttggttgaatgttacaagtctggtatcccaagattgtacaactgggaacaa1980caaatcatcaaggctccaactaagggtttgggtttgagattgtctgctagagaaatcatc2040ttggttactactgaattcaagtctgaaaacgttggtttgccattgccattgagattgaag2100atccacgaagctggtcaccaagtttctatcgaagacttggctgaaactactttgaagttg2160actttgttgcaccacggttctttgagagaaccaagattgccaatcccattgttcggttct2220gacagaatcgcttacagaagattgagaggtatctacccaggtggtttggacggtaacaga2280caattctggttgtaa2295<210>18<211>1818<212>dna<213>人工序列<400>18atgaagaagcaattggaaagattggctcacccaaactacatgatgaacagaggtaagttc60agatctaagcaagctcacccaaagtctacttctggtttgttgatctacccagctttggac120ttgaacgttaacgtttctgaaactgctgaaatcgtttttggcttcgacttgactcatcaa180ttcgaatacagagaaaacttgttgcaacaaatcaagagagacccaaagtctgtttctgct240ggtatgagagttatcgactctactcacccaaagtcttacgaatacgaattcgttgaagtt300gctccatacagagctaacgaagtttctccaatcatgagatgttctatcatcgactacttc360gctaagaaggacccaaagagagttatcgaaccagacgctttggttgttcacgttaaggac420agaaacaaccaaatcttgatctacttgccagaacaattgaagcaatcttgttctttcgaa480actatcccagctagacacttgggtgctgtttctagaatcatcaagttgtctccagacgct540agaatgtctaagttgatgccagaagcgctcgctctcatcggtagactcccaatgttgcaa600ttcgaaagacaagacgttagagctgctagattgggttactctatccaaactttgccatct660ccaagattgagattcggtaagggtagaactacttcttacgctaagactggtttgaagcaa720ggtggtgtttacgaaactggtgaagctactgttagcttcttcgttgacccaaagttgaga780gaccaccaaaagttgcaagttttggaattcatcaacaagttgaagactacttctgaaaga840ttcggtgttactttgaacgtttctcacaagccaaagggtttgtctcaaaagttgccatct900gacttgttgcaaactgaagacatcttgtaccaattgaagaacatcccacaacacttcgaa960ggtgttgttgttgttatcgctgaagaggcgagcttgcaacactcttaccaagctatcaag1020agacaattcggtggtaagcaagacgttgttactcaatgtgttgaattgcacgacagagtt1080ttgaactcggaggacactctctacaacatcctcttgggtatctacgttaaggctggtttg1140caaccatggatcttgggtgaaccattgcactctgactgtttcgttggtttggacgtttct1200cacgaaaacggtaagcacgctgctggtatcatccaaatcatcggtaaggacggtgctatg1260atcaagcaaaaggctttgtctacttctgaagctggtgaaaagatctcttctgaaactatg1320agagaaatcgtttacgacactttgcacgctttcgaagaacaatacggtcacgctccaaag1380cacatcactttccacagagacggtttcggtagagaagacttgactttgatcgactctatc1440ttgtctccaagagaaatccaattcgactacgttgaaatcttgaagaacatcaacagaaga1500atggctatccacgaagacgaatggaagacttctcaaggtttgtcttacactaaggaaaga1560atgggttacttgttgtctactaacccacacgctagagttggtatggctaagccattgaag1620gttgttcaacagactactactctcccattcgaagcgatcttgactgacgtttacagattg1680tctttcatgcacgttcactctttgttgaagactagattgccaatcactactcactacgct1740gacttgtcttctactttccacaacagaggtttgttgaacgctaacactgaacacgaagaa1800gctttgccattcgtttaa1818<210>19<211>1818<212>dna<213>人工序列<400>19atgaagaagcaattggaaagattggctcacccaaactacatgatgaacagaggtaagttc60agatctaagcaagctcacccaaagtctacttctggtttgttgatctacccagctttggac120ttgaacgttaacgtttctgaaactgctgaaatcgtttttggcttcgacttgactcatcaa180ttcgaatacagagaaaacttgttgcaacaaatcaagagagacccaaagtctgtttctgct240ggtatgagagttatcgactctactcacccaaagtcttacgaatacgaattcgttgaagtt300gctccatacagagctaacgaagtttctccaatcatgagatgttctatcatcgactacttc360gctaagaaggacccaaagagagttatcgaaccagacgctttggttgttcacgttaaggac420agaaacaaccaaatcttgatctacttgccagaacaattgaagcaatcttgttctttcgaa480actatcccagctagacacttgggtgctgtttctagaatcatcaagttgtctccagacgct540agaatgtctaagttgatgccagaagcgctcgctctcatcggtagactcccaatgttgcaa600ttcgaaagacaagacgttagagctgctagattgggttactctatccaaactttgccatct660ccaagattgagattcggtaagggtagaactacttcttacgctaagactggtttgaagcaa720ggtggtgtttacgaaactggtgaagctactgttagcttcttcgttgacccaaagttgaga780gaccaccaaaagttgcaagttttggaattcatcaacaagttgaagactacttctgaaaga840ttcggtgttactttgaacgtttctcacaagccaaagggtttgtctcaaaagttgccatct900gacttgttgcaaactgaagacatcttgtaccaattgaagaacatcccacaacacttcgaa960ggtgttgttgttgttatcgctgaagaggcgagcttgcaacactcttaccaagctatcaag1020agacaattcggtggtaagcaagacgttgttactcaatgtgttgaattgcacgacagagtt1080ttgaactcggaggacactctctacaacatcctcttgggtatctacgttaaggctggtttg1140caaccatggatcttgggtgaaccattgcactctgactgtttcgttggtttggctgttgca1200cacgaaaacggtaagcacgctgctggtatcatccaaatcatcggtaaggacggtgctatg1260atcaagcaaaaggctttgtctacttctgaagctggtgaaaagatctcttctgaaactatg1320agagaaatcgtttacgacactttgcacgctttcgaagaacaatacggtcacgctccaaag1380cacatcactttccacagagacggtttcggtagagaagacttgactttgatcgactctatc1440ttgtctccaagagaaatccaattcgactacgttgaaatcttgaagaacatcaacagaaga1500atggctatccacgaagacgaatggaagacttctcaaggtttgtcttacactaaggaaaga1560atgggttacttgttgtctactaacccacacgctagagttggtatggctaagccattgaag1620gttgttcaacagactactactctcccattcgaagcgatcttgactgacgtttacagattg1680tctttcatgcacgttcactctttgttgaagactagattgccaatcactactcactacgct1740gacttgtcttctactttccacaacagaggtttgttgaacgctaacactgaacacgaagaa1800gctttgccattcgtttaa1818<210>20<211>2592<212>dna<213>人工序列<400>20atggttaagagatacatatcgttccacttgttcccaagaatcaagttgtgtggtgtttac60ttgtgtttgagaatgaacactaaggacgacatcgctcacaagcaaccaatcactatcgaa120gttcaagttttgaaggaattggacaagccatctccaaagatggctactagattgttggtt180gctgacagagctggtaacagattcccattggctatctggaagaacaacgctttgtctgac240tacgactggactatcggtcaatggtacagattggaaaacgctagaggtaacgttttcaac300ggtaagcaatctttgaacggttcttctaacatgagagctactccattggaagctagtgaa360gaagacgaaactagagctgacgacgttggtagagttgacactatcttgggtaacttgtct420ccaaaccaggcgtacttgagcttgttcccaatctcgcgtagcttcgacactctctcggtg480tacgaatacagcatcgaagcggcggaagcgttcgaagacgacccagacactgttacttac540caatgtgctggtagattgagaagaatcactggtgctggtgttgcttacgctggtccaatg600caaatcgtttctactagaaagttgccagacaagttggctgacccattctctttgtctgaa660ccaactgaaagagaattgaaggctgctgacgctagagacagacacagaatcgaaagattg720ttgaagtctttggttaaggctgctatcgacgactctacttacgacccataccaaatcaac780agaatcagagctagaactccagctatcactgcgggcgacggcttgttcgaagcgtgctac840gaatttgctgctagagttgacgttatgccatctggtgacgctttcgttggtatcgaagtt900agataccacgctagatctcaagttactgctgacgtttacgaagacaagactggtgaattg960gttggtactatcgttgaacacgacccagaaagatacaacgtttctggtactggtagagtt1020gttggtttcactgaccactacttcactgacgctttggacgaattgggtggtttgtctttg1080gctgactggtacgctcaaaaggacagagttccagaaggtgttctcgaagctctcagagaa1140aagaatccaagattggttgacatccaataccaagaagacgaaccagctcaaatccacgtt1200ccagaattgttgagagttgctccaagaaaggaagttgttaaggaattggacccaactttc1260cacagaagatgggacagagaagctaagatgttgccagacaagagattcagacacgctatc1320gaatttgttgaccacttgggttctttgccagacatcgacgctactgttgctccagaacca1380ctcggcccaagcctctcttacatgtcgactgctgttgacagagaagaaaacttgagattc1440aaggacggtagaactgctactactccatcttctggtatcagatctggtgtttaccaacaa1500ccaacttctttcgacatcgcttacgtttacccaactgaatctgaacaagaatctaagcaa1560ttcatctctaacttcgaaaacaagttgtctcgttgtcactgtgaaccaactgctactaga1620cacgttccatacgaattgggtggtgaattgtcttacttggctgttatcaacgaattggaa1680tctgttgacgctgttttggctgttgttccaccaagaaacgacgacagaatcgctgctggt1740gacatcactgacccatacccagaatttaagaagggtttgggtaagcaaaaggttccatct1800caaatggttgttactgaaaacttggacactagatgggttatgaacaacactgctatgggt1860ttgatcgctggtgctggtggtgttccatggagagttgacgaaatgccaggtgaggctgac1920tgtttcatcggtctcgcagttactcgtgacccagaaactggtcaacacttgggtgcttct1980gctaacgttgtttacgctgacggtactgttttcgcttctaagactcaaactttgcaatct2040ggtgaaactttcgacgaacaatctatcatcgacgttatcaaggacgttttccaagaattt2100gttagaagagaaggtagatctccagaacacatcgttatccacagagacggtagattgttc2160gaagacgctgacgaaatccaagctccattcgctgactctggtgtttctatcgacatcttg2220gacatcagaaagtctggtgctccaagaatcgctagatacgaagacaactctttcaagatc2280gacgaaaagggtagattgttcatctctcaagacgacactcacggtttcatcgctactact2340ggtaagccagaatttgacgactctgacaacctcggtactccaaagactctcagagttgtt2400cgtagagctggtgacactccaatgttgactttgttgaagcaagtttactggttgtctgaa2460gctcacatcggttctgtttctcgttctgttagattgccaatcactacttactacgctgac2520agatgtgctgaacacgctagagaaggttacttgttgcacggtgaattgatcgaaggtgtt2580ccatacttgtaa2592当前第1页1 2 3 
技术特征:1.一种ago蛋白的用途,其特征在于:所述ago蛋白用于真核细胞内的不依赖于外源靶向向导、并基于同源重组的靶向基因编辑。
2.根据权利要求1所述的ago蛋白的用途,其特征在于:所述ago蛋白包括来自常温菌的pago蛋白以及来自嗜热菌的pago蛋白。
3.根据权利要求2所述的ago蛋白的用途,其特征在于:所述ago蛋白是piwi核酸酶活性中心四元基序符合dedx特征的pago蛋白。
4.根据权利要求3所述的ago蛋白的用途,其特征在于:所述pago蛋白是来自常温菌的pago蛋白,并来自halogeometricumpallidum(ncbi登录号:elz29017.1)的hpago,或来自microcystisaeruginosa(ncbi登录号wp_012265209.1)的maago,或来自halorubrumezzemoulense(ncbi登录号:wp_094494460.1)的heago,或来自filamentouscyanobacterium(ncbi登录号:wp_106331578.1)的fcago,或来自mastigocoleustestarum(ncbi登录号:wp_027844945.1)的mtago;或者,所述pago蛋白是来自嗜热菌的pago蛋白,并来自exiguobacteriumsp.(ncbi登录号:acq71053.1)的exago。
5.根据权利要求2所述的ago蛋白的用途,其特征在于:所述ago蛋白是来自常温菌的、piwi核酸酶活性中心四元基序不符合dedx特征的pago蛋白。
6.根据权利要求5所述的ago蛋白的用途,其特征在于:所述pago蛋白是来自常温菌的pantoeaanthophila(ncbi登录号:wp_046101283.1)的paago,或flavobacteriumsoli(ncbi登录号:wp_026705043.1)的fsago。
7.根据权利要求2所述的ago蛋白的用途,其特征在于:所述ago蛋白为piwi核酸酶活性中心突变后不再符合dedx特征的pago蛋白的突变体。
8.根据权利要求7所述的ago蛋白的用途,其特征在于:所述pago蛋白是来自常温菌的hpago的突变体hpagod646a,或者来自嗜热菌的exago的突变体exagod398a/s400a。
9.根据权利要求3至8中任一项所述的ago蛋白的用途,其特征在于:所述ago蛋白含有与所述pago蛋白/突变体的序列同源性大于等于80%的氨基酸序列。
10.一种组合物,用于真核细胞的靶向基因编辑,其特征在于:所述组合物由同源重组片段和权利要求1至9中任一项所述的ago蛋白组合而成。
11.根据权利要求10所述的组合物,其特征在于:所述同源重组片段是能够在靶向区域实现基因表达盒插入的同源重组片段,或能够在靶向区域通过替换原有基因片段以实现基因表达盒插入的同源重组片段,或能够在靶向区域实现基因片段插入或替换的同源重组片段,或能够在靶向区域实现基因片段删除的同源重组片段。
12.根据权利要求10所述的组合物,其特征在于:所述组合物中的ago蛋白是所述ago蛋白本身,或者是包括其编码rna/其整合到宿主染色体的表达盒/其表达质粒在内的所述ago蛋白的表达元件。
13.根据权利要求10至12中任一项所述的组合物,其特征在于:所述同源重组片段中,至少一侧的同源臂的长度不低于200bp。
14.根据权利要求13所述的组合物,其特征在于:所述同源重组片段中,至少一侧的同源臂的长度不低于400bp。
15.一种基因编辑方法,用于真核细胞靶向基因的编辑,其特征在于:该方法使权利要求10至14中任一项所述组合物出现于真核细胞中。
16.根据权利要求15所述的基因编辑方法,其特征在于:使所述组合物出现于真核细胞中,是采用转染、或化学转化、或电转化、或基因枪转化的方式将所述组合物导入细胞内实现的。
17.根据权利要求15所述的基因编辑方法,其特征在于:该方法中所述基因编辑的形式包括基因表达盒的靶向敲入或替换、基因片段的靶向敲入或替换、基因片段的靶向删除。
18.根据权利要求15所述的基因编辑方法,其特征在于:所述真核细胞为活体真核微生物细胞、活体植物细胞或活体动物细胞。
19.一种真核细胞,其特征在于:该真核细胞由权利要求15至18中任一项所述的基因编辑方法获得。
技术总结本发明提供了一种Ago蛋白的用途及组合物和基因编辑方法,本发明的真核细胞靶向基因编辑方案,通过使外源Ago蛋白与同源重组片段出现于真核细胞中,进行所述细胞内的基于同源重组的靶向基因编辑,其不需要向导DNA或向导RNA的靶向定位,仅需外源Ago蛋白与同源重组片段便可引发真核细胞的基因编辑,应用前景广泛。
技术研发人员:仪宏;冯慧勇;李天明;刘金雷
受保护的技术使用者:石家庄埃佤基因科技有限公司
技术研发日:2019.09.16
技术公布日:2021.03.12