本公开属于分子生物学和生物工程
技术领域:
,具体来说,本公开涉及一种转录环状rna的重组核酸分子及其在蛋白表达中的应用。更具体来说,本公开涉及一种转录环状rna的重组核酸分子、重组表达载体、线状rna、环状rna、重组宿主细胞、药物组合物,以及制备蛋白的方法。
背景技术:
:信使核糖核酸(messengerribonucleicacid,mrna)是由dna转录而来,并为下一步蛋白质的翻译提供所需的遗传信息。当编码抗原蛋白的mrna被注射进人体后,能够在体内合成抗原蛋白,从而诱导强烈的细胞免疫与体液免疫反应,并表现出自身免疫佐剂的特点,是一种绝佳的疫苗手段[1-3]。此外,mrna作为疫苗或产生治疗性蛋白还存在其他诸多优势,例如,与dna载体相比,mrna在细胞内瞬时表达,不存在整合到基因组的风险,且不依赖于细胞周期,因而具有更高的安全性[4];与病毒载体相比,mrna不存在载体本身带来的免疫抵抗,因此蛋白表达更容易实现[5];与重组蛋白、病毒等相比,mrna的生产过程为无细胞体系,仅涉及体外的酶催化反应,因此生产过程更加简单,可控而且低成本[6]。目前,mrna作为疫苗,产生治疗性蛋白以及作为基因治疗的手段等展现出广泛的应用潜力。目前在临床或临床前应用的mrna主要为线性mrna,线性mrna的结构包括5’帽子结构(5’cap),3’多聚腺苷尾巴(polyatail),5’非翻译序列(5’untranslationalregion,5’utr),3’非翻译序列(3’untranslationalregion,3’utr)以及开放阅读框(openreadingframe,orf)等[7]。5’帽子结构是真核生物mrna的基本特征,通过在mrna5’末端加入n7-甲基鸟苷而得[8]。研究发现,5’帽子结构通过与翻译起始复合物eif4e结合而促进mrna翻译,并能有效防止mrna降解,降低mrna的免疫源性。3’多聚腺苷尾巴的主要功能是通过与polya结合蛋白(polyabindingprotein,pabp)结合,后者与eif4g及eif4e相互作用,介导mrna形成环形,并促进翻译进程,防止mrna降解[9]。5’及3’非翻译序列,例如采用beta-globin的5’及3’非翻译序列,能有效防止mrna降解,并促进mrna翻译成蛋白。环状rna(circularrnas,circrnas)是真核生物常见的一种rna类型。天然存在的circrnas主要是通过细胞内一种称之为“反向剪切”(backsplicing)的分子机理产生。目前已发现真核生物circrnas具有多种分子细胞调控功能[10]。例如,环状rna可通过结合微小rna(micrornas,mirna)而调节靶标基因的表达;环状rna可通过与靶蛋白直接结合进而调节基因表达等。目前已确认的环状rna主要以非编码rna发挥功能。然而,自然界也存在可编码蛋白的环状rna,即环状mrna。环状mrna由于其环状属性,往往具有较长的半衰期,因此推测环状mrna可能具有较好的稳定性。体外形成环状rna的方法包括化学法,蛋白酶催化法以及核酶催化法等[11]。天然的i类内含子系统可发生剪切与连接反应形成环状内含子rna。位于5’端外显子e1的特定的剪切位点保守序列受游离的鸟苷酸三磷酸3’羟基的亲核进攻而发生断裂,产生裸露的3’羟基,而鸟苷酸则结合在断裂的5’外显子e1上。其后,内含子5’端的裸露的3’羟基对内含子3’端与外显子e2的之间的保守序列进行进攻,将外显子e2切除,而内含子发生成环反应,得到环状的内含子rna[12-13]。目前已报道了一种改良的来自anabaenatrna内含子的核酶催化法应用于体外环状rna的形成[14],称为“倒置的i类内含子-外显子自剪切系统”(groupipermutedintron-exonself-splicingsystem,pie系统)。该方法可把内含子切除,形成包含外显子的环状rna,因此,该方法具有形成可表达的环状mrna的潜力。pie系统的基本设计原理是通过分子克隆法将外显子e1与e2序列首尾相接,形成连续的环状质粒。通过限制性内切酶将内含子剪切断裂,得到线性质粒。再通过倒置的3’内含子上游的t7启动子进行体外转录,得到包含3’内含子-e2-e1-5’内含子结构的线状rna。与天然的i类内含子系统类似,外显子e1的特定的剪切位点保守序列受游离的鸟苷酸3’羟基的亲核进攻而发生断裂,外显子e1产生裸露的3’羟基,而鸟苷酸则结合在断裂的5’内含子上。其后,外显子e1的裸露的3’羟基对3’内含子与外显子e2之间的保守序列进行进攻,将3’内含子切除,而外显子e2与e1发生成环反应,得到环状的e1-e2rna。据现有技术报道[15],可利用pie系统构建用于真核细胞蛋白表达的环状rna。该研究发现将emcv(encephalomyocarditisvirus),cvb3(coxsackievirusb3)等ires(internalribosomeentrysite)序列以及编码基因序列置于anabaenatrna的pie系统的e1和e2之间,所形成的环状mrna能在293细胞等真核细胞实现蛋白质表达。除此之外,为了顺利实现mrna的体外成环,该研究对pie系统进行了修改,分别加入了同源臂(homologyarm)序列,以及在ires与外显子e2之间,编码区与外显子e1之间分别加入了间隔序列(spacer)。首先,该研究参考了上述m.puttaraju与michaeld.been等发现的pie系统,采用了同样的anabaenatrnapie系统构建环状mrna。在pie系统的e1与e2之间插入emcv或cvb3ires序列以及编码基因gluc(gaussialuciferase)后,在rna的5’和3’端分别设置同源臂序列,在ires与外显子e2之间,以及编码区与外显子e1之间分别加入了间隔序列,能最大程度地形成环状mrna。在体外转录反应获得线状mrna后,在加热及鸟苷酸三磷酸的作用下经过pie系统的自催化反应获得环状mrna。该环状mrna最终包含外显子e1和e2序列,间隔序列,ires以及编码基因序列。研究发现添加同源臂以及间隔序列的pie系统具有较好的mrna成环特性,且能增强蛋白表达量。该研究通过对不同的ires序列进行筛选,发现cvb3ires具有较高的介导mrna翻译能力,因而能实现相对较高的蛋白质表达量。目前,线性mrna虽然能实现mrna介导的蛋白质表达,然而其表达持续时间较短,蛋白表达量不足的问题,因而需要研发具有持久性表达蛋白能力的mrna新技术。现有技术中公开的环状mrna结构虽然实现了以环状rna翻译目标蛋白,并在一定程度上提高了以环状rna翻译目标蛋白的蛋白表达量。但为了满足蛋白体外表达的工业化生产需求,目前仍需要研发具有更高蛋白表达量、且蛋白表达持久性更好的的环状mrna。引用文献:[1]pardi,n.etal.(2018)nucleoside-modifiedmrnavaccinesinducepotenttfollicularhelperandgerminalcenterbcellresponses.j.exp.med.215,1571–1588.[2]liang,f.etal.(2017)efficienttargetingandactivationofantigen-presentingcellsinvivoaftermodifiedmrnavaccineadministrationinrhesusmacaques.mol.ther.25,2635–2647.[3]pardi,n.etal.(2017)zikavirusprotectionbyasinglelow-dosenucleoside-modifiedmrnavaccination.nature543,248–251.[4]ugursahin,katalinkarikó&türeci,mrna-basedtherapeutics—developinganewclassofdrugs。naturereviewsdrugdiscoveryvolume13,pages759–780(2014).[5]jamiel.shirley,ypep.dejong,coxterhorst,rolandw.herzog,immuneresponsestoviralgenetherapyvectors.moleculartherapy,volume28,issue3,4march2020,pages709-722.[6]kis,z.etal.(2018)emergingtechnologiesforlow-cost,rapidvaccinemanufacture.biotechnol.j.14,e1800376.[7]mrnavaccines—anewerainvaccinology.nat.rev.drugdiscov.17,261–279.[8]ramanathan,a.etal.(2016)mrnacapping:biologicalfunctionsandapplications.nucleicacidsres.44,7511–7526.[9]lima,s.a.etal.(2017)shortpoly(a)tailsareaconservedfeatureofhighlyexpressedgenes.nat.struct.mol.biol.24,1057–1063.[10]barrett,s.p.&salzman,j.circularrnas:analysis,expressionandpotentialfunctions.development143,1838–1847(2016).[11]sabinemullerandbettinaappel,invitrocircularizationofrna,rnabiology2017,vol.14,no.8,1018–1027.[12]cech,t.r.andbass,b.l.(1986)annu.rev.biochem.55,599-629.[13]cech,t.r.(1990)annu.rev.biochem.59,543-568.[14]m.puttaraju,michaeld.been,nucleicacidsresearch,vol.20,no.205357-5364.[15]us2020/0080106a1.技术实现要素:发明要解决的问题鉴于现有技术中存在的技术问题,例如,目前仍需要开发具有提高的蛋白表达量,且稳定性高、表达持久性好,适于蛋白体外或体内表达的需求。为此,本发明提供了一种重组核酸分子,其转录形成的环状rna包含特定的ires元件,能够在真核细胞中持续高效的表达目标多肽,适用于制备mrna传染病疫苗、治疗性mrna肿瘤疫苗、基于mrna的树突状细胞(dendriticcell,dc)肿瘤疫苗,或用于基于mrna的基因治疗(genetherapy)、基于mrna的嵌合抗原受体t细胞疗法(chimericantigenreceptort-celltherapy,car-t)、蛋白质补充疗法等领域。用于解决问题的方案(1)一种重组核酸分子,所述重组核酸分子包含ires元件;其中,所述ires元件包含如下(i)-(iv)组成的组中的任一项:(i)包含如seqidno:8-11任一序列所组成的组中的一种或多种序列的核苷酸序列;(ii)包含如seqidno:8-11任一序列所示的序列的反向互补序列的核苷酸序列;(iii)在高严格性杂交条件或非常高严格性杂交条件下,能够与(i)或(ii)所示的核苷酸序列杂交的序列的反向互补序列;(iv)与(i)或(ii)所示的核苷酸序列具有至少90%,可选至少95%,优选至少97%,更优选至少98%,最优选至少99%的序列同一性的序列。(2)根据(1)所述的重组核酸分子,其中,所述重组核酸分子进一步包含编码目标多肽的编码区,并且所述ires元件能够提高所述目标多肽的表达水平;优选地,所述ires元件能够提高所述目标多肽在真核细胞中的表达水平。(3)根据(1)或(2)所述的重组核酸分子,其中,所述ires元件选自如下(q1)-(q7)中的任一项:(q1)包含如seqidno:8所示序列的核苷酸序列;(q2)包含如seqidno:9所示序列的核苷酸序列;(q3)包含如seqidno:10所示序列的核苷酸序列;(q4)包含如seqidno:11所示序列的核苷酸序列;(q5)包含如seqidno:12所示序列的核苷酸序列;(q6)包含如seqidno:13所示序列的核苷酸序列;(q7)包含如seqidno:14所示序列的核苷酸序列。(4)根据(1)-(3)任一项所述的重组核酸分子,其中,所述重组核酸分子还包含位于所述ires元件上游的5’同源臂,和位于所述编码区下游且与所述5’同源臂互补的3’同源臂;优选地,所述5’同源臂包含如下(a1)-(a2)中任一项所示的序列:(a1)如seqidno:2-3任一序列所示的核苷酸序列;(a2)与(a1)所示的核苷酸序列具有至少90%,可选至少95%,优选至少97%,更优选至少98%,最优选至少99%的序列同一性的序列;所述3’同源臂包含如下(b1)-(b2)中任一项所示的序列:(b1)如seqidno:17-18任一序列所示的核苷酸序列;(b2)与(b1)所示的核苷酸序列具有至少90%,可选至少95%,优选至少97%,更优选至少98%,最优选至少99%的序列同一性的序列。(5)根据(1)-(4)任一项所述的重组核酸分子,其中,所述重组核酸分子还包含位于所述5’同源臂与所述ires元件之间的5’间隔区,和位于所述编码区与所述3’同源臂之间的3’间隔区;优选地,所述5’间隔区包含如下(c1)-(c2)中任一项所示的序列:(c1)如seqidno:6-7任一序列所示的核苷酸序列;(c2)与(c1)所示的核苷酸序列具有至少90%,可选至少95%,优选至少97%,更优选至少98%,最优选至少99%的序列同一性的序列;所述3’间隔区包含如下(o1)-(o2)中任一项所示的序列:(o1)如seqidno:52-53任一序列所示的核苷酸序列;(o2)与(o1)所示的核苷酸序列具有至少90%,可选至少95%,优选至少97%,更优选至少98%,最优选至少99%的序列同一性的序列。(6)根据(1)-(5)任一项所述的重组核酸分子,其中,所述重组核酸分子还包含位于所述5’同源臂与所述ires元件之间的3’内含子和第二外显子,以及位于所述编码区与所述3’同源臂之间的第一外显子和5’内含子;优选地,所述3’内含子位于所述第二外显子的上游,且所述第二外显子与所述ires元件之间包含所述5’间隔区;所述第一外显子位于所述5’内含子的上游,且所述第一外显子与所述编码区之间包含所述3’间隔区。(7)根据(6)所述的重组核酸分子,其中,所述3’内含子包含如下(d1)-(d2)中任一项所示的序列:(d1)如seqidno:4所示的核苷酸序列;(d2)与(d1)所示的核苷酸序列具有至少90%,可选至少95%,优选至少97%,更优选至少98%,最优选至少99%的序列同一性的序列;所述第二外显子包含如下(e1)-(e2)中任一项所示的序列:(e1)如seqidno:5所示的核苷酸序列;(e2)与(e1)所示的核苷酸序列具有至少90%,可选至少95%,优选至少97%,更优选至少98%,最优选至少99%的序列同一性的序列;所述第一外显子包含如下(f1)-(f2)中任一项所示的序列:(f1)如seqidno:15所示的核苷酸序列;(f2)与(f1)所示的核苷酸序列具有至少90%,可选至少95%,优选至少97%,更优选至少98%,最优选至少99%的序列同一性的序列;所述5’内含子包含如下(g1)-(g2)中任一项所示的序列:(g1)如seqidno:16所示的核苷酸序列;(g2)与(g1)所示的核苷酸序列具有至少90%,可选至少95%,优选至少97%,更优选至少98%,最优选至少99%的序列同一性的序列。(8)根据(1)-(7)任一项所述的重组核酸分子,其中,所述重组核酸分子还包含调控序列,所述调控序列用于指导所述重组核酸分子转录环状rna。(9)一种重组表达载体,其中,所述重组表达载体包含根据(1)-(8)任一项所述的重组核酸分子。(10)一种线状rna,其由根据(1)-(8)任一项所述的重组核酸分子,或(9)所述的重组表达载体转录形成;优选地,所述线状rna包括5’同源臂、3’内含子、第二外显子、5’间隔区、ires元件、编码区、3’间隔区、第一外显子、5’内含子和3’同源臂。(11)一种环状rna,其由根据(1)-(8)所述的重组核酸分子,或(9)所述的重组表达载体转录后环化形成;或者,其由(10)所述的线状rna环化形成;可选地,所述环状rna包含顺次连接的第二外显子、5’间隔区、ires元件、编码区、3’间隔区和第一外显子。(12)根据(11)所述的环状rna,其中,所述环状rna表达目标多肽。(13)根据(12)所述的环状rna,其中,所述目标多肽为新型冠状病毒的s蛋白的受体结合域(rbd);优选地,所述rbd蛋白选自如下(h1)-(h4)中的任一项:(h1)包含如seqidno:32所示氨基酸序列,且具有rbd蛋白活性的多肽;(h2)如seqidno:32所示氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸,且具有rbd蛋白活性的多肽;(h3)由编码(h1)或(h2)所示氨基酸序列的多核苷酸编码的多肽;(h4)由与seqidno:31所示的核苷酸序列具有至少90%,可选至少95%,优选至少97%,更优选至少98%,最优选至少99%的序列同一性的序列编码的,且具有rbd蛋白活性的多肽。(14)根据(12)或(13)所述的环状rna,其中,所述环状rna包含与seqidno:33所示的核苷酸序列具有至少90%,可选至少95%,优选至少97%,更优选至少98%,最优选至少99%的序列同一性的序列。(15)根据(12)所述的环状rna,其中,所述目标多肽选自程序性死亡受体1(programmedcelldeathprotein1,pd-1),程序性死亡配体-1(programmedcelldeathligand-1,pd-l1)或细胞毒性t淋巴细胞相关蛋白-4(cytotoxict-lymphocyteassociatedprotein-4,ctla-4)的单克隆抗体;优选地,所述pd-1单克隆抗体包含如下(j1)-(j6)中的任一项:(j1)包含如seqidno:38所示氨基酸序列的轻链;(j2)如seqidno:41所示氨基酸序列的重链;(j3)包含与seqidno:38所示氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸,且具有轻链蛋白活性的多肽;(j4)包含与seqidno:41所示氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸,且具有重链蛋白活性的多肽;(j5)由编码(j1)-(j4)任一项所示氨基酸序列的多核苷酸编码的多肽;(j6)由与seqidno:37所示的核苷酸序列具有至少90%,可选至少95%,优选至少97%,更优选至少98%,最优选至少99%的序列同一性的序列编码的,且具有轻链蛋白活性的多肽;或,由与seqidno:40所示的核苷酸序列具有至少90%,可选至少95%,优选至少97%,更优选至少98%,最优选至少99%的序列同一性的序列编码的,且具有重链蛋白活性的多肽。(16)根据(12)或(15)所述的环状rna,其中,所述环状rna包含与seqidno:39或42所示的核苷酸序列具有至少90%,可选至少95%,优选至少97%,更优选至少98%,最优选至少99%的序列同一性的序列。(17)根据(12)所述的环状rna,其中,所述目标多肽为嵌合抗原受体;可选地,所述目标多肽为嵌合抗原受体的cd16蛋白,所述cd16蛋白选自如下(k1)-(k4)中的任一项:(k1)包含如seqidno:50所示氨基酸序列,且具有cd16蛋白活性的多肽;(k2)如seqidno:50所示氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸,且具有cd16蛋白活性的多肽;(k3)由编码(k1)或(k2)所示氨基酸序列的多核苷酸编码的多肽;(k4)由与seqidno:49所示的核苷酸序列具有至少90%,可选至少95%,优选至少97%,更优选至少98%,最优选至少99%的序列同一性的序列编码的,且具有cd16蛋白活性的多肽。(18)根据(12)或(17)所述的环状rna,其中,所述环状rna包含与seqidno:51所示的核苷酸序列具有至少90%,可选至少95%,优选至少97%,更优选至少98%,最优选至少99%的序列同一性的序列。(19)根据(12)所述的环状rna,其中,所述目标多肽为重组人源化蛋白,可选地,所述重组人源化蛋白为重组人红细胞生成素(epo)蛋白,所述epo蛋白选自如下(l1)-(l4)中的任一项:(l1)包含如seqidno:35所示氨基酸序列,且具有epo蛋白活性的多肽;(l2)如seqidno:35所示氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸,且具有epo蛋白活性的多肽;(l3)由编码(l1)或(l2)所示氨基酸序列的多核苷酸编码的多肽;(l4)由与seqidno:34所示的核苷酸序列具有至少90%,可选至少95%,优选至少97%,更优选至少98%,最优选至少99%的序列同一性的序列编码的,且具有epo蛋白活性的多肽。(20)根据(12)或(19)所述的环状rna,其中,所述环状rna包含与seqidno:36所示的核苷酸序列具有至少90%,可选至少95%,优选至少97%,更优选至少98%,最优选至少99%的序列同一性的序列。(21)根据(12)所述的环状rna,其中,所述目标多肽为细胞因子;优选地,所述细胞因子为il-15蛋白,所述il-15蛋白选自如下(m1)-(m4)中的任一项:(m1)包含如seqidno:44所示氨基酸序列,且具有il-15蛋白活性的多肽;(m2)如seqidno:44所示氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸,且具有il-15蛋白活性的多肽;(m3)由编码(m1)或(m2)所示氨基酸序列的多核苷酸编码的多肽;(m4)由与seqidno:43所示的核苷酸序列具有至少90%,可选至少95%,优选至少97%,更优选至少98%,最优选至少99%的序列同一性的序列编码的,且具有il-15蛋白活性的多肽。(22)根据(12)或(21)所述的环状rna,其中,所述环状rna包含与seqidno:45所示的核苷酸序列具有至少90%,可选至少95%,优选至少97%,更优选至少98%,最优选至少99%的序列同一性的序列。(23)根据(12)所述的环状rna,其中,所述目标多肽为肿瘤相关抗原或肿瘤特异性抗原,可选地,所述肿瘤特异性抗原为pap蛋白,所述pap蛋白选自如下(n1)-(n4)中的任一项:(n1)包含如seqidno:47所示氨基酸序列,且具有pap蛋白活性的多肽;(n2)如seqidno:47所示氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸,且具有pap蛋白活性的多肽;(n3)由编码(n1)或(n2)所示氨基酸序列的多核苷酸编码的多肽;(n4)由与seqidno:46所示的核苷酸序列具有至少90%,可选至少95%,优选至少97%,更优选至少98%,最优选至少99%的序列同一性的序列编码的,且具有pap蛋白活性的多肽。(24)根据(12)或(23)所述的环状rna,其中,所述环状rna包含与seqidno:48所示的核苷酸序列具有至少90%,可选至少95%,优选至少97%,更优选至少98%,最优选至少99%的序列同一性的序列。(25)一种重组宿主细胞,其中,所述重组宿主细胞包含根据(1)-(8)任一项所述的重组核酸分子,根据(9)所述的重组表达载体,根据(10)所述的线状rna或根据(11)-(24)任一项所述的环状rna。(26)一种根据(1)-(8)任一项所述的重组核酸分子,根据(9)所述的重组表达载体,根据(10)所述的线状rna,根据(11)-(24)任一项所述的环状rna,或根据(25)所述的重组宿主细胞在制备蛋白中的应用。(27)一种药物组合物,其中,包括如下(i)-(ii)中任一项:(i)根据权利要求1-8任一项所述的重组核酸分子,根据权利要求9所述的重组表达载体,根据权利要求10所述的线状rna,根据权利要求11-24任一项所述的环状rna,或根据权利要求25所述的重组宿主细胞;或者(ii)根据权利要求1-8任一项所述的重组核酸分子,根据权利要求9所述的重组表达载体,根据权利要求10所述的线状rna,根据权利要求11-24任一项所述的环状rna,或根据权利要求25所述的重组宿主细胞表达的目标多肽。(28)一种制备蛋白的方法,其中,包括以根据(1)-(8)任一项所述的重组核酸分子,根据(9)所述的重组表达载体,根据(10)所述的线状rna,根据(11)-(24)任一项所述的环状rna,或根据(25)所述的重组宿主细胞表达目标蛋白的步骤。(29)一种预防或治疗疾病的方法,其中,包括向受试者施用(i)-(ii)中任一项的步骤:(i)根据权利要求1-8任一项所述的重组核酸分子,根据权利要求9所述的重组表达载体,根据权利要求10所述的线状rna,根据权利要求11-24任一项所述的环状rna,或根据权利要求25所述的重组宿主细胞;或者(ii)根据权利要求1-8任一项所述的重组核酸分子,根据权利要求9所述的重组表达载体,根据权利要求10所述的线状rna,根据权利要求11-24任一项所述的环状rna,或根据权利要求25所述的重组宿主细胞表达的目标多肽。发明的效果在一些实施方案中,本公开的重组核酸分子,其转录形成包含特定ires元件的环状rna,ires元件可提高环状rna在真核细胞中的蛋白表达水平,实现蛋白的高效、持久性表达,且表达效率高于线性mrna分子或其他环状rna,能够满足工业化蛋白表达的需求。在一些实施方案中,本公开的重组核酸分子,还包含具有特定序列的5’同源臂、3’同源臂以及5’间隔区、3’间隔区序列,使环状rna分子的成环效率和表达蛋白的水平进一步提高。在一些实施方案中,本公开提供的环状rna,可以提高目标多肽在真核细胞中的表达量,实现对抗原、抗体、抗原结合受体、配体、融合蛋白或重组蛋白的高效和持久性表达,适于制备治疗性的疫苗、抗体或嵌合抗原受体、t细胞受体、药用重组蛋白等。附图说明图1显示以包含重组核酸分子的重组表达载体(dna载体)得到环状rna的过程示意图;图2显示鉴定rna成环的琼脂糖凝胶电泳图,图1中:1.rnaladder;2.cvb3-egfp线状mrna;3.cvb3-egfp环化mrna;4.ev29-egfp线状mrna;5.ev29-egfp环化mrna;6.ev29 cvb3vegfp线状mrna;7.ev29 cvb3vegfp环化mrna;8.ev33-egfp线状mrna;9.ev33-egfp环化mrna;10.ev33 cvb3vegfp线状mrna;11.ev33 cvb3vegfp环化mrna;图3显示测序鉴定rna成环的测序结果;图4显示不同ires元件(circ-rna-ev24、circ-rna-ev24 cvb3v、circ-rna-ev29、circ-rna-ev29 cvb3v、circ-rna-ev33、circ-rna-ev33 cvb3v、circ-rna-cvb3)介导的蛋白表达水平;图5显示不同ires元件(circ-rna-ev24、circ-rna-ev29、circ-rna-ev33、circ-rna-ev33 cvb3v、线性mrna)介导的蛋白表达持续时间;图6显示不同ires元件(circ-rnaev24 cvb3v,circ-rna-ev29 cvb3v,circ-rnaev33 cvb3v,circ-rnacvb3以及线性mrna)介导的蛋白表达持续时间图7显示鉴定rna成环的琼脂糖凝胶电泳图,图7中:1.rnaladder;2.cvb3-egfp线状mrna;3.cvb3-egfp环化mrna;4.ev29-egfph1s1线状mrna;5.ev29-egfph1s1环化mrna;6.ev29-egfph2s2线状mrna;7.ev29-egfph2s2环化mrna;图8显示不同ires元件(circ-rna-ev24、circ-rna-ev29-h1s1、circ-rna-ev29-h2s2、circ-rna-cvb3)介导的蛋白表达水平;图9显示不同ires元件(circ-rna-ev29、circ-rnaev2-h1s1、circ-rnaev2-h2s2、circ-rnacvb3以及线性mrna)介导的蛋白表达持续时间。具体实施方式当在权利要求和/或说明书中与术语“包含”联用时,词语“一(a)”或“一(an)”可以指“一个”,但也可以指“一个或多个”、“至少一个”以及“一个或多于一个”。如在权利要求和说明书中所使用的,词语“包含”、“具有”、“包括”或“含有”是指包括在内的或开放式的,并不排除额外的、未引述的元件或方法步骤。在整个申请文件中,术语“约”表示:一个值包括测定该值所使用的装置或方法的误差的标准偏差。虽然所公开的内容支持术语“或”的定义仅为替代物以及“和/或”,但除非明确表示仅为替代物或替代物之间相互排斥外,权利要求中的术语“或”是指“和/或”。如本公开所使用的,术语“多肽”、“肽”和“蛋白质”在本文中互换地使用并且为任意长度的氨基酸聚合物。该聚合物可以是线形或分支的,它可以包含修饰的氨基酸,并且它可以由非氨基酸隔断。该术语也包括已经被修饰(例如,二硫键形成、糖基化、脂质化、乙酰化、磷酸化或任何其他操作,如以标记组分缀合)的氨基酸聚合物。如本公开所使用的,术语“环状rna”是一种呈封闭环形rna分子,主要由外显子、ires元件、蛋白编码区和间隔区。在一些优选的实施方案中,环状rna具有如下结构:“第二外显子e2-间隔区-ires元件-编码区-间隔区-第一外显子e1”。本公开所使用的环状rna具有蛋白翻译活性,又可称为“环状mrna”。如本公开所使用的,术语“线状rna”是指能够环化形成环状rna的rna前体,其一般由线状的dna分子转录形成。如本公开所使用的,术语“线性rna”是指包括5’帽子结构(5’cap),3’多聚腺苷尾巴(polyatail),5’非翻译序列(5’untranslationalregion,5’utr),3’非翻译序列(3’untranslationalregion,3’utr)以及开放阅读框(openreadingframe,orf)等结构的具有翻译功能的rna。如本公开所使用的,术语“ires”(internalribosomeentrysite,ires)又称内部核糖体进入位点,“内部核糖体进入位点”(ires)属于翻译控制序列,通常位于所关注基因的5’端,并使得以帽非依赖性方式翻译rna。经转录的ires可直接结合核糖体亚单位,以使得mrna起始密码子在核糖体中适当地取向以进行翻译。ires序列通常位于mrna的5’utr中(起始密码子的正上游)。ires在功能上取代对各种与真核生物翻译机制相互作用的蛋白因子的需求。在一些具体的实施方案中,本公开的ires元件来源于ev病毒或柯萨奇病毒(cvb病毒)。在一些优选的实施方案中,本公开的ires元件选自ev24ires,ev29ires,ev33ires,cvb3ires,或者cvb3vires与ev24ires、ev29ires、ev33ires中任意1种的嵌合体序列。本公开中的“cvb3v”是指cvb3ires的v结构域,本公开中嵌合体序列包括:以cvb3ires的v结构域替换ev24ires的v结构域所得的ev24 cvb3v嵌合体,以cvb3ires的v结构域替换ev29ires的v结构域所得的ev29 cvb3v嵌合体,以cvb3ires的v结构域替换ev33ires的v结构域所得的ev33 cvb3v嵌合体。如本公开所使用的,术语“编码区”(codingregion)是指能够转录信使rna,并最终翻译为目标多肽、蛋白的基因序列。如本公开所使用的,术语“上游”或“下游”是指沿编码区的蛋白翻译方向的上游及下游。在一些实施方案中,本公开的编码区编码选自抗原、抗体、抗原结合受体、配体、融合蛋白和重组蛋白中的一种或多种的目标多肽。在一些实施方案中,本公开的抗原选自病毒来源的抗体或肿瘤特异性抗原。在一些实施方案中,本公开的抗体选自fab、fab’、f(ab’)2、fv、scfv、sdab、双抗体、骆驼科抗体或单克隆抗体。在一些实施方案中,本公开的抗原结合受体选自嵌合抗原受体或t细胞受体。在一些实施方案中,本公开的目标多肽选自抗原、抗体、抗原结合受体、配体、融合蛋白和重组蛋白中的一种或多种。如本公开所使用的,术语“取代、重复、缺失或添加一个或多个氨基酸”其中,取代是指用不同氨基酸置换占用一个位置的核苷酸或氨基酸。缺失是指去除占据某一位置的氨基酸。插入是指在邻接并且紧随占据位置的氨基酸之后添加氨基酸。示例性的,本公开中的“突变”包括“保守突变”。本公开中的术语“保守突变”是指可正常维持蛋白质的功能的保守突变。保守突变的代表性例子为保守置换。保守置换是指,例如,在置换部位为芳香族氨基酸的情况下,在phe、trp、tyr间相互置换的突变;在置换部位为疏水性氨基酸的情况下,在leu、ile、val间相互置换的突变;在为极性氨基酸的情况下,在gln、asn间相互置换的突变;在为碱性氨基酸的情况下,在lys、arg、his间相互置换的突变;在为酸性氨基酸的情况下,在asp、glu间相互置换的突变;在为具有羟基的氨基酸的情况下,在ser、thr间相互置换的突变。作为被视作保守置换的置换,具体而言,可以举出ala向ser或thr的置换、arg向gln、his或lys的置换、asn向glu、gln、lys、his或asp的置换、asp向asn、glu或gln的置换、cys向ser或ala的置换、gln向asn、glu、lys、his、asp或arg的置换、glu向gly、asn、gln、lys或asp的置换、gly向pro的置换、his向asn、lys、gln、arg或tyr的置换、ile向leu、met、val或phe的置换、leu向ile、met、val或phe的置换、lys向asn、glu、gln、his或arg的置换、met向ile、leu、val或phe的置换、phe向trp、tyr、met、ile或leu的置换、ser向thr或ala的置换、thr向ser或ala的置换、trp向phe或tyr的置换、tyr向his、phe或trp的置换、及val向met、ile或leu的置换。此外,保守突变还包括起因于基因所来源的个体差异、株、种的差异等天然产生的突变。本公开中的“序列同一性”和“同一性百分比”指两个或更多个多核苷酸或多肽之间相同(即同一)的核苷酸或氨基酸的百分比。两个或更多个多核苷酸或多肽之间的序列同一性可通过以下方法测定:将多核苷酸或多肽的核苷酸或氨基酸序列对准且对经对准的多核苷酸或多肽中含有相同核苷酸或氨基酸残基的位置数目进行评分,且将其与经对准的多核苷酸或多肽中含有不同核苷酸或氨基酸残基的位置数目进行比较。多核苷酸可例如通过含有不同核苷酸(即取代或突变)或缺失核苷酸(即一个或两个多核苷酸中的核苷酸插入或核苷酸缺失)而在一个位置处不同。多肽可例如通过含有不同氨基酸(即取代或突变)或缺失氨基酸(即一个或两个多肽中的氨基酸插入或氨基酸缺失)而在一个位置处不同。序列同一性可通过用含有相同核苷酸或氨基酸残基的位置数目除以多核苷酸或多肽中氨基酸残基的总数来计算。举例而言,可通过用含有相同核苷酸或氨基酸残基的位置数目除以多核苷酸或多肽中核苷酸或氨基酸残基的总数且乘以100来计算同一性百分比。示例性的,在本公开中,当使用序列比较算法或通过目视检查测量以最大的对应性进行比较和比对时,两个或多个序列或子序列具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%核苷酸或氨基酸残基的“序列同一性”或“同一性百分比”。“序列同一性”或“同一性百分比”的判断/计算可以基于序列任何合适的区域上。例如,长度至少约50个残基的区域、至少约100个残基的区域,至少约200个残基的区域,至少约400个残基的区域,或至少约500个残基的区域。在某些实施方案中,所述序列在任一或两个相比较的生物聚合物(就是核酸或多肽)的整个长度上基本相同。如本公开所使用的,术语“反向互补序列”(reversecomplementarysequence)的含义为:和原始多核苷酸的序列的方向相反,并且与原始多核苷酸的序列也互补的序列。示例性的,如果原始多核苷酸序列为actgaac,则其反向互补序列为gttcagt。如本公开所使用的,术语“多核苷酸”指由核苷酸组成的聚合物。多核苷酸可以是单独片段的形式,也可以是更大的核苷酸序列结构的一个组成部分,其是从至少在数量或浓度上分离一次的核苷酸序列衍生而来的,能够通过标准分子生物学方法(例如,使用克隆载体)识别、操纵以及恢复序列及其组分核苷酸序列。当一个核苷酸序列通过一个dna序列(即a、t、g、c)表示时,这也包括一个rna序列(即a、u、g、c),其中“u”取代“t”。换句话说,“多核苷酸”指从其他核苷酸(单独的片段或整个片段)中去除的核苷酸聚合物,或者可以是一个较大核苷酸结构的组成部分或成分,如表达载体或多顺反子序列。多核苷酸包括dna、rna和cdna序列。“重组多核苷酸”、“重组核酸分子”属于“多核苷酸”中的一种。如本公开所使用的,术语“重组核酸分子”指具有在自然界中不连接在一起的序列的多核苷酸。重组多核苷酸可包括在合适的载体中,且该载体可用于转化至合适的宿主细胞。然后多核苷酸在重组宿主细胞中表达以产生例如“重组多肽”“重组蛋白”“融合蛋白”等。在本公开中,重组核酸分子包含编码目标多肽的编码区,和连接于所述编码区上游的ires元件。在一些具体的实施方案中,本公开的重组核酸分子包含如下的序列结构:5’同源臂-3’内含子-第二外显子e2-5’间隔区-ires元件-编码区-3’间隔区-第一外显子e1-5’内含子-3’同源臂。利用内含子的核酶特性,在gtp的引发下,5’内含子与第一外显子的连接处发生断裂;第一外显子的核酶裂口进一步攻击3’内含子与第二外显子的连接处,使该处发生断裂,3’内含子解离,第一外显子和第二外显子连接形成环状rna。如本公开所使用的,术语“载体”指的是dna构建体,其含有与合适的控制序列可操作地连接的dna序列,从而在合适的宿主中表达目的基因。如本公开所使用的,术语“重组表达载体”指用于表达例如编码所需多肽的多核苷酸的dna结构。重组表达载体可包括,例如包含i)对基因表达具有调控作用的遗传元素的集合,例如启动子和增强子;ii)转录成mrna并翻译成蛋白质的结构或编码序列;以及iii)适当的转录和翻译起始和终止序列的转录亚单位。重组表达载体以任何合适的方式构建。载体的性质并不重要,并可以使用任何载体,包括质粒、病毒、噬菌体和转座子。用于本公开的可能载体包括但不限于染色体、非染色体和合成dna序列,例如病毒质粒、细菌质粒、噬菌体dna、酵母质粒以及从质粒和噬菌体dna的组合中衍生的载体,来自如慢病毒、逆转录病毒、牛痘、腺病毒、鸡痘、杆状病毒、sv40和伪狂犬病等病毒的dna。如本公开所使用的,术语“抗原”是指引发免疫应答的分子。这种免疫应答可能涉及抗体产生或特异性免疫细胞的活化,或两者兼有。任何大分子,包括基本上所有的蛋白质或肽,都可以用作抗原。在本公开中,抗原包括病毒来源的抗原,例如新型冠状病毒(sars-cov-2)抗原,或肿瘤特异性抗原等。如本公开所使用的,术语“抗体”,指免疫球蛋白或其片段或它们的衍生物,并且包括其包含的抗原结合位点的任何多肽,而不管其是否是在体外或体内产生。该术语包括,但不限于,多克隆、单克隆、单特异性的、多特异性的、非特异性的、人源化、单链的、嵌合的、合成的、重组的、杂合的、突变的、嫁接的抗体。术语“抗体”还包括抗体片段例如fab、f(ab’)2、fv、scfv、fd、dab和其它保留抗原结合功能的抗体片段。通常情况下,这样的片段将包括抗原结合片段。如本公开所使用的,术语“单链抗体”(scfv),是由抗体重链可变区和轻链可变区通过有限个氨基酸的短肽(也被称为连接子,linker)连接而成的抗体。如本公开所使用的,术语“t细胞受体”(tcellreceptor,tcr)是能够靶向异源性抗原的各类t细胞受体。大多数t细胞的tcr由α和β肽链组成,少数t细胞的tcr由γ和δ肽链组成。如本公开所使用的,术语“嵌合抗原受体”(chimericantigenreceptor,car)是人工受体,其被改造为含有免疫球蛋白抗原结合结构域。目前,嵌合抗原受体可以包括抗原结合区、铰链区、跨膜区和细胞内结构区等结构域。本公开中的术语“宿主细胞”意指易于用包含本公开的重组核酸分子、环状rna或重组表达载体转化、转染、转导等的任何细胞类型。术语“重组宿主细胞”涵盖导入重组核酸分子、环状rna或重组表达载体后不同于亲本细胞的宿主细胞,重组宿主细胞具体通过转化来实现。本公开的宿主细胞可以是原核细胞或真核细胞,只要是能够导入本公开的重组核酸分子、环状rna或重组表达载体的细胞即可。在导入本公开的重组核酸分子、环状rna或重组表达载体后,可以得到表达目标多肽的重组宿主细胞。本公开中的术语“转化、转染、转导”具有本领域技术人员普遍理解的意思,即将40外源性的dna导入宿主的过程。所述转化、转染、转导的方法包括任何将核酸导入细胞的方法,这些方法包括但不限于电穿孔法、磷酸钙(capo4)沉淀法、氯化钙(cacl2)沉淀法、微注射法、聚乙二醇(peg)法、deae-葡聚糖法、阳离子脂质体法以及乙酸锂-dmso法。如本公开所使用的,“治疗”是指:在罹患疾病之后,使受试者接触(例如给药)本发明的菌株和/或巨噬细胞或含者有其的药物组合物(以下也称为“本发明的药物组合物”),从而与不接触时相比使该疾病的症状减轻,并不意味着必需完全抑制疾病的症状。罹患疾病是指:身体出现了疾病症状。如本公开所使用的,“预防”是指:在罹患疾病之前,通过使受试者接触(例如给药)本发明的药物组合物等,从而与不接触时相比减轻罹患疾病后的症状,并不意味着必需完全抑制患病。如本公开所使用的,术语“个体”、“患者”或“受试者”包括哺乳动物。哺乳动物包括但不限于,家养动物(例如,牛,羊,猫,狗和马),灵长类动物(例如,人和非人灵长类动物如猴),兔,以及啮齿类动物(例如,小鼠和大鼠)。如本公开所使用的,术语“高严格条件”是指,对于长度为至少100个核苷酸的探针而言,遵循标准dna印迹程序,在42℃处在5xsspe(salinesodiumphosphateedta)、0.3%sds、200微克/ml剪切并变性的鲑精dna和50%甲酰胺中预杂交和杂交12至24小时。最后在65℃处使用2xssc、0.2%sds将载体材料洗涤三次,每次15分钟。如本公开所使用的,术语“非常高严格条件”是指,对于长度为至少100个核苷酸的探针而言,遵循标准dna印迹程序,在42℃处在5xsspe(salinesodiumphosphateedta)、0.3%sds、200微克/ml剪切并变性的鲑精dna和50%甲酰胺中预杂交和杂交12至24小时。最后在70℃处使用2xssc、0.2%sds将载体材料洗涤三次,每次15分钟。除非另外定义或由背景清楚指示,否则在本公开中的全部技术与科学术语具有如本公开所属领域的普通技术人员通常理解的相同含义。技术方案在本公开的技术方案中,说明书核苷酸和氨基酸序列表的编号所代表的含义如下所示:seqidno:1所示的序列是t7启动子的核苷酸序列;seqidno:2所示的序列是5’同源臂序列1(h1)的核苷酸序列;seqidno:3所示的序列是5’同源臂序列2(h2)的核苷酸序列;seqidno:4所示的序列是i类pie系统的3’内含子的核苷酸序列;seqidno:5所示的序列是i类pie系统的第二外显子(e2)的核苷酸序列;seqidno:6所示的序列是5’间隔区序列1的核苷酸序列;seqidno:7所示的序列是5’间隔区序列2的核苷酸序列;seqidno:8所示的序列是cvb3ires的核苷酸序列;seqidno:9所示的序列是ev24ires的核苷酸序列;seqidno:10所示的序列是ev29ires的核苷酸序列;seqidno:11所示的序列是ev33ires的核苷酸序列;seqidno:12所示的序列是ev24与cvb3v嵌合ires的核苷酸序列;seqidno:13所示的序列是ev29与cvb3v嵌合ires的核苷酸序列;seqidno:14所示的序列是ev33与cvb3v嵌合ires的核苷酸序列;seqidno:15所示的序列是i类pie系统的第一外显子(e1)的核苷酸序列;seqidno:16所示的序列是i类pie系统的5’内含子的核苷酸序列;seqidno:17所示的序列是3’同源臂序列1的核苷酸序列;seqidno:18所示的序列是3’同源臂序列2的核苷酸序列;seqidno:19所示的序列是xbai酶切位点的核苷酸序列;seqidno:20所示的序列是egfp编码dna的核苷酸序列;seqidno:21所示的序列是egfp氨基酸序列;seqidno:22所示的序列是egfp环状rna(cvb3ires)的核苷酸序列;seqidno:23所示的序列是egfp环状rna(ev24ires)的核苷酸序列;seqidno:24所示的序列是egfp环状rna(ev24 cvb3vires)的核苷酸序列;seqidno:25所示的序列是egfp环状rna(ev29ires)的核苷酸序列seqidno:26所示的序列是egfp环状rna(ev29 cvb3vires)的核苷酸序列;seqidno:27所示的序列是egfp环状rna(ev33ires)的核苷酸序列;seqidno:28所示的序列是egfp环状rna(ev33 cvb3vires)的核苷酸序列;seqidno:29所示的序列是egfp环状rna(ev29ires h1s1)的核苷酸序列;seqidno:30所示的序列是egfp环状rna(ev29ires h2s2)的核苷酸序列;seqidno:31所示的序列是rbd编码dna的核苷酸序列;seqidno:32所示的序列是rbd蛋白的氨基酸序列seqidno:33所示的序列是rbd环状rna(ev29ires h1s1)的核苷酸序列;seqidno:34所示的序列是epo编码dna的核苷酸序列;seqidno:35所示的序列是epo蛋白的氨基酸序列;seqidno:36所示的序列是epo环状rna(ev29ires h1s1)的核苷酸序列;seqidno:37所示的序列是pd-1单克隆抗体轻链编码dna的核苷酸序列;seqidno:38所示的序列是pd-1单克隆抗体轻链的氨基酸序列;seqidno:39所示的序列是pd-1单克隆抗体轻链环状rna(ev29ires h1s1)的核苷酸序列;seqidno:40所示的序列是pd-1单克隆抗体重链编码dna的的核苷酸序列;seqidno:41所示的序列是pd-1单克隆抗体重链蛋白的氨基酸序列;seqidno:42所示的序列是pd-1单克隆抗体重链环状rna(ev29ires h1s1)的核苷酸序列;seqidno:43所示的序列是il-15编码dna的核苷酸序列;seqidno:44所示的序列是il-15蛋白的氨基酸序列;seqidno:45所示的序列是il-15环状rna(ev29ires h1s1)的核苷酸序列;seqidno:46所示的序列是pap编码dna的核苷酸序列;seqidno:47所示的序列是pap蛋白的氨基酸序列;seqidno:48所示的序列是pap环状rna(ev29ires h1s1)的核苷酸序列;seqidno:49所示的序列是cd16car编码dna的核苷酸序列;seqidno:50所示的序列是cd16car蛋白的氨基酸序列;seqidno:51所示的序列是cd16car环状rna(ev29ires h1s1)的核苷酸序列;seqidno:52所示的序列是3’间隔区序列1的核苷酸序列;seqidno:53所示的序列是3’间隔区序列2的核苷酸序列。本公开在研究中发现,现有技术中的线性mrna虽然具有较高的蛋白表达量,但无法实现长期、持久性的蛋白表达。引用文献15中公开的环状rna虽然在一定程度上提高了环状rna的蛋白表达量和表达时间,但仍无法满足蛋白工业化生产的需求,目前需要兼具高的蛋白表达量,且可实现长时间蛋白表达的环状rna分子。在一些实施方案中,本公开提供了一种重组核酸分子,其转录形成环状rna。重组核酸分子包含编码目标多肽的编码区,和连接于所述编码区上游的ires元件。ires元件能够提高所述目标多肽的表达水平,以上述重组核酸分子转录的环状rna可以实现在真核细胞中高效、持久的蛋白表达。ires元件包含如seqidno:8-11任一序列所组成的组中的一种或多种序列的核苷酸序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%序列同一性的序列。在一些实施方案中,ires元件为seqidno:8所示核苷酸序列的cvb3ires、seqidno:9所示核苷酸序列的ev24ires、seqidno:10所示核苷酸序列的ev29ires、seqidno:11所示核苷酸序列的ev33ires。在一些实施方案中,ires元件包含cvb3vires与ev24ires、ev29ires和ev33ires中任意一种的嵌合体序列。在一些具体的实施方案中,本公开的重组核酸分子还包含位于所述ires元件上游的5’同源臂,和位于所述编码区下游且与所述5’同源臂互补的3’同源臂。在本公开中,5’同源臂包括5’同源臂1(h1)和5’同源臂2(h2),具体的,5’同源臂的核苷酸序列为与seqidno:2-3任一序列所示的核苷酸序列相比具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%序列同一性的序列。3’同源臂的核苷酸序列为与seqidno:17-18任一序列所示的核苷酸序列相比具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%序列同一性的序列。在一些具体的实施方案中,本公开的重组核酸分子还包含分别位于所述5’同源臂与所述ires元件之间,和位于所述编码区与所述3’同源臂之间的间隔区。在本公开中,间隔区包括5’间隔区和3’间隔区,具体的,5’间隔区的核苷酸序列为与seqidno:6-7任一序列所示的核苷酸序列相比具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%序列同一性的序列。3’间隔区的核苷酸序列为与seqidno:52-53任一序列所示的核苷酸序列相比具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%序列同一性的序列。本公开中的5’同源臂、3’同源臂以及间隔区的序列能够进一步提高以重组核酸分子形成环状rna的环化效率,进而提高环状rna的蛋白表达水平。在一些具体的实施方案中,本公开的重组核酸分子还包含位于所述5’同源臂与所述ires元件之间的3’内含子和第二外显子,以及位于所述编码区与所述3’同源臂之间的第一外显子和5’内含子。在本公开中,3’内含子的核苷酸序列为与seqidno:4所示的核苷酸序列相比具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%序列同一性的序列。第二外显子(e2)的核苷酸序列为与seqidno:5所示的核苷酸序列相比具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%序列同一性的序列。5’内含子的核苷酸序列为与seqidno:16所示的核苷酸序列相比具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%序列同一性的序列。第一外显子(e1)的核苷酸序列为与seqidno:15所示的核苷酸序列相比具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%序列同一性的序列。在一些优选的实施方案中,重组核酸分子的结构如下:5’同源臂-3’内含子-第二外显子e2-5’间隔区-ires元件-编码区-3’间隔区-第一外显子e1-5’内含子-3’同源臂。为使重组核酸分子能够进一步转录形成rna分子,在重组核酸分子中还可以包含调控序列。示例性的,调控序列为连接于5’同源臂上游的t7启动子,t7启动子序列为seqidno:1所示的核苷酸序列。在一些实施方案中,本公开提供了一种重组表达载体,包含上述的重组核酸分子。其中,连接重组核酸分子的载体可以是本领域常用的各类载体,例如puc57质粒等。进一步的重组核酸分子中包含限制性酶切位点,使重组表达载体经酶切后得到适于转录的线性化载体。在一些实施方案中,本公开提供了一种线状rna,其由重组核酸分子或线性化的重组表达载体转录后形成。作为优选,线状rna具有如下的结构:5’同源臂-3’内含子-第二外显子e2-5’间隔区-ires元件-编码区-3’间隔区-第一外显子e1-5’内含子-3’同源臂。图1显示以包含重组核酸分子的重组表达载体(dna载体)得到环状rna的过程:首先将dna载体酶切后得到线性化载体,线性化的dna载体转录后得到线状的rna载体。最后,线状的rna载体通过如下过程成环:利用内含子的核酶特性,在gtp的引发下,5’内含子与第一外显子的连接处发生断裂;第一外显子的核酶裂口进一步攻击3’内含子与第二外显子的连接处,使该处发生断裂,3’内含子解离,第一外显子和第二外显子连接形成环状rna。在一些实施方案中,本公开提供了一种环状rna,其由上述的线状rna环化形成,或由重组核酸分子、重组表达载体转录后环化形成。具体的,在重组核酸分子中调控序列的指导下,重组核酸分子转录产生线状的rna分子。具体的,线状rna分子中的5’同源臂与3’同源臂互补配对,利用内含子的核酶特性,使3’内含子与第二外显子e2之间,以及第一外显子e1与5’内含子之间发生断裂,e1与e2连接得到具有第二外显子e2-间隔区-ires元件-编码区-间隔区-第一外显子e1的序列结构的环状rna。在一些实施方案中,表达选自抗原、抗体、抗原结合受体、配体、融合蛋白和重组蛋白中的一种或多种的目标多肽。在一些实施方案中,环状rna表达如seqidno:21所示氨基酸序列的egfp蛋白,或seqidno:21所示氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸,且具有egfp蛋白活性的多肽。编码egfp蛋白的核苷酸序列如seqidno:20所示。表达egfp蛋白的环状rna包含如seqidno:22-30任一序列所示的核苷酸序列。在一些实施方案中,环状rna表达病毒抗原。示例性的,病毒抗原是具有如seqidno:32所示氨基酸序列的rbd蛋白,或seqidno:32所示氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸,且具有rbd蛋白活性的多肽。编码rbd蛋白的核苷酸序列如seqidno:31所示。表达rbd蛋白的环状rna包含如seqidno:33所示的核苷酸序列。在一些实施方案中,环状rna表达重组人源化蛋白。示例性的,重组人源化蛋白具体为如seqidno:35所示氨基酸序列的epo蛋白,或seqidno:35所示氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸,且具有epo蛋白活性的多肽。编码epo蛋白的核苷酸序列如seqidno:34所示。表达epo蛋白的环状rna包含如seqidno:36所示的核苷酸序列。在一些实施方案中,环状rna表达细胞因子。细胞因子具体为如seqidno:44所示氨基酸序列的il-15蛋白,或seqidno:44所示氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸,且具有il-15蛋白活性的多肽。编码il-15蛋白的核苷酸序列如seqidno:43所示。表达il-15蛋白的环状rna包含如seqidno:45所示的核苷酸序列。在一些实施方案中,环状rna表达肿瘤特异性抗原,肿瘤特异性抗原包括ceaafppsapsmamage-a3pap蛋白等等。示例性的,肿瘤特异性抗原是具有如seqidno:47所示氨基酸序列的pap蛋白,或seqidno:47所示氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸,且具有pap蛋白活性的多肽。编码pap蛋白的核苷酸序列如seqidno:46所示。表达pap蛋白的环状rna包含如seqidno:48所示的核苷酸序列。在一些实施方案中,环状rna表达嵌合抗原受体的相关蛋白,嵌合抗原受体的相关蛋白包括cd19、cd20、cd133、cd138、bcma、cd16蛋白等等。示例性的,嵌合抗原受体的相关蛋白是具有如seqidno:50所示氨基酸序列的cd16蛋白,或seqidno:50所示氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸,且具有cd16蛋白活性的多肽。编码cd16蛋白的核苷酸序列如seqidno:49所示。表达cd16蛋白的环状rna包含如seqidno:51所示的核苷酸序列。在一些实施方案中,环状rna表达单克隆抗体。示例性的,单克隆抗体为pd-1单克隆抗体。pd-1单克隆抗体的轻链为如seqidno:38所示氨基酸序列的多肽,或seqidno:38所示氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸,且具有轻链活性的多肽。编码轻链的核苷酸序列如seqidno:37所示。表达pd-1单克隆抗体轻链的环状rna包含如seqidno:39所示的核苷酸序列。pd-1单克隆抗体的重链为如seqidno:41所示氨基酸序列的多肽,或seqidno:41所示氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸,且具有重链活性的多肽。编码重链的核苷酸序列如seqidno:40所示。表达pd-1单克隆抗体重链的环状rna包含如seqidno:42所示的核苷酸序列。以本公开的环状rna分子表达上述的蛋白,由于环状rna包含特定序列的ires元件,5’间隔区、3’间隔区,以及5’同源臂、3’同源臂,通过各元件的协同配合,使环状rna能够实现蛋白的高效表达,且持久性好,优于现有的线性mrna和环状rna等各类蛋白表达元件。在一些实施方案中,本公开提供了一种重组宿主细胞,包含上述的重组核酸分子、重组表达载体、线状rna或环状rna。作为优选,重组宿主细胞为真核生物来源的细胞,本公开的ires元件可以实现目标多肽在真核细胞中的高效、持久表达。在一些实施方案中,本公开提供了一种药物组合物,包括上述重组核酸分子、重组表达载体、线状rna、环状rna、重组宿主细胞或其所表达的蛋白。本公开的环状rna即可作为病毒抗原、重组人源化蛋白、肿瘤特异性抗原、嵌合抗原受体等的表达元件,也可作为核酸疫苗直接导入生物体内,在生物体内产生病毒抗原、肿瘤特异性抗原、嵌合抗原受体等。实施例本公开的其他目的、特征和优点将从以下详细描述中变得明显。但是,应当理解的是,详细描述和具体实施例(虽然表示本公开的具体实施方式)仅为解释性目的而给出,因为在阅读该详细说明后,在本公开的精神和范围内所作出的各种改变和修饰,对于本领域技术人员来说将变得显而易见。本实施例中所用到的实验技术与实验方法,如无特殊说明均为常规技术方法,例如下列实施例中未注明具体条件的实验方法,通常按照常规条件如sambrook等人,分子克隆:实验室手册(newyork:coldspringharborlaboratorypress,1989)中所述的条件,或按照制造厂商所建议的条件。实施例中所使用的材料、试剂等,如无特殊说明,均可通过正规商业渠道获得。实施例1:探究不同ires介导形成的环状mrna在293t细胞中的表达1.1实验方法与步骤(1)质粒构建构建含有不同元件的egfp目的基因,该步骤委托苏州金唯智生物科技有限公司进行基因合成与克隆。此处所使用的构建环状rna的dna载体,包含t7启动子,5’同源臂,3’内含子,第二外显子e2,5’间隔区,ires元件,egfp编码区,下游间隔区,5’内含子,第一外显子e1,3’同源臂,以及可用于质粒线性化的酶切位点xbai。所得基因片段连接到puc57载体。ires元件信息如下:其中,ires元件v结构域的定义可参见参考文献(procnatlacadsciusa.2009jun9;106(23):9197–9202.)以上述ires元件所得的表达egfp的环状rna序列分别如下所示:ires名称编码区基因seqidno:cvb3iresegfpseqidno:22ev24iresegfpseqidno:23ev24 cvb3viresegfpseqidno:24ev29iresegfpseqidno:25ev29 cvb3viresegfpseqidno:26ev33iresegfpseqidno:27ev33 cvb3viresegfpseqidno:28(2)线性质粒模板制备1)质粒抽提①将外部合成的穿刺菌活化,条件37℃/220rpm/3~4h②取活化菌液扩大培养,培养条件:37℃/220rpm/过夜③质粒抽提(天根无内毒素小量中提试剂盒),测定od值2)质粒酶切采取xbai单酶切的方法酶切上述1)制备质粒酶切体系如下:表1试剂体积质粒10μg酶(1000units)5μl10xcutsmartbuffer50μlnucleasefree,h2ototal,500μl37℃酶切过夜。采用通用型dna胶回收试剂盒(天根生化科技有限公司)回收酶切产物,测定od值并采用1%琼脂糖凝胶电泳鉴定酶切产物。纯化的线性质粒模板用于体外转录。(3)体外转录制备线状mrna1)体外转录采用t7体外转录试剂盒(apexbiot7highyieldrnasynthesiskit)合成mrna转录体系如下:表2试剂体积10xreactionbuffer2μlatp(20mm)2μlctp(20mm)2μlutp(20mm)2μlgtp(20mm)2μl线性化dna模板1μgt7rnapolymerasemix2μlrnanucleasefree,h2ototal20μl37℃孵育2h,然后用dnasei消化线性dna模板。消化条件:37℃消化15min。2)线状mrna纯化将上述1)所得转录产物,使用硅膜离心柱法纯化(thermo,genejetrnapurificationkit),测定od值及1%变性琼脂糖凝胶电泳鉴定rna大小。1%变性琼脂糖凝胶配方如下:①称取1g琼脂糖,至72mlnuclease-free,h2o中,微波炉加热溶解;②上述琼脂糖冷却至55~60℃时,在通风橱加0.1%的gelred,10ml10xmops,18ml甲醛,灌胶。变性琼脂糖凝胶电泳流程如下:取等体积样本rna与2xloadingbuffer,65~70℃变性5~10min。上样,采用100v/30min条件进行电泳,其后采用凝胶成像系统拍照。(4)mrna环化1)环化试剂:gtpbuffer:50mmtris-hcl,10mmmgcl2,1mmdtt,ph7.5左右2)环化体系与条件:表3溶液体积mrna25μgrna溶液gtpsolution(20mm)50μlgtpbuffer补足至500μl将上述溶液于55℃加热15min,环化rna产物使用硅膜离心柱法纯化(thermo,genejetrnapurificationkit),测定od值及1%变性琼脂糖凝胶电泳鉴定rna大小。3)环状rna鉴定①1%变性琼脂糖凝胶鉴定:a.试剂配制:1g琼脂糖粉加入72ml无核酸酶水中,加热将琼脂塘融化,加入10ml10×mops缓冲液。然后在通风柜中加入18ml新鲜37%甲醛,充分混合,将凝胶倒入槽中。b.mrna检测:取500ng左右mrna溶液,加入等体积的2×rnaloadingbuffer混匀,65℃加热5min,上样进行琼脂糖凝胶检测。②环化mrnart-rcr与测序鉴定a.mrna逆转录体系与条件表4溶液体积mrna1μgrna溶液rtprimermix4.0μlprimerscriptrtenzyemixi1.0μl5×primerscriptbuffer24.0μl无核酸酶水补足至20μl将实验组:环化处理的mrna、对照组:未环化处理的mrna,按照上述体系进行配制,于37℃加热15min,85℃加热5s,4℃保存。b.逆转录产物pcr扩增体系与条件表5溶液体积逆转录产物1.0μl10×buffer2.0μldntp1.6μlprimer-f(10μm)1.0μlprimer-r(10μm)1.0μltaq酶0.5μl无核酸酶水12.9μlpcr扩增程序:95℃,1min;95℃,30s;60℃,30s;72℃,30s;(35cycles)72℃,7min;4℃。c.pcr产物切胶纯化核酸电泳,选择特异性存在于实验组,不存在于对照组的rt-rcrdna条带,切胶回收,通用型dna纯化回收试剂盒纯化,取纯化dna、引物ev29-egfp-f:gtgacagcagcaggaatcaca、引物ev29-egfp-r:tgggatcaacccacaggct送金唯智公司进行正、反向测序。(5)编码egfp的环状mrna转染293t细胞及荧光强度测定1)细胞培养:293t接种于含有10%胎牛血清,1%双抗的dmem高糖培养基中,于37℃,5%co2培养箱中培养。细胞每隔2-3天进行传代培养。2)细胞转染:转染前将293t细胞以1×105个/孔接种于24孔板中,于37℃,5%co2培养箱中培养。待细胞达到70-90%融合度后,使用lipofectaminemessengermax(invitrogen)转染试剂将mrna以500ng/孔量转染293t细胞,具体操作如下:①稀释messengermaxtmreagent表6试剂体积/孔mem无血清培养基25μlmessengermaxtmreagent0.75μl稀释混合后,室温静置孵育10min。②稀释mrna表7试剂体积/孔mrna1μgmem无血清培养基补足至25μl③取混合稀释后的messengermaxtmreagent和mrna(1:1)表8试剂体积/孔稀释的messengermaxtmreagent25μl稀释的mrna25μl稀释混合后,室温静置孵育5min。④吸取上述混合液50ul贴壁缓缓加入24孔板中,37℃、5%co2培养箱中孵育培养。3)蛋白表达检测①细胞荧光观察:将转染后1-10天293t细胞于200×荧光显微镜下观察egfp的表达情况。②流式细胞术检测细胞平均荧光强度:将转染后1-10天293t细胞用流式细胞仪检测细胞平均荧光强度。1.2实验结果1)dna转录模板制备①质粒提取浓度:puc57-cvb3-egfp:271.2ng/μl,puc57-ev24-egfp:245.4ng/ul,puc57-ev24 cvb3v-egfp:263.8ng/ul,puc57-ev29-egfp:277.9ng/μl,puc57-ev29 cvb3v-egfp:249.9ng/μl,puc57-ev33-egfp:273.0ng/μl,puc57-ev33 cvb3v-egfp:283.3ng/μl;②质粒酶切线性化后dna浓度:puc57-cvb3-egfp:120.6ng/μl,puc57-ev24-egfp:134.5ng/ul,puc57-ev24 cvb3v-egfp:125.8ng/ul,puc57-ev29-egfp:146.1ng/μl,puc57-ev29 cvb3v-egfp:119.2ng/μl,puc57-ev33-egfp:141.1ng/μl,puc57-ev33 cvb3v-egfp:137.9ng/μl;2)mrna转录与环化①mrna转录纯化后rna浓度:cvb3-egfp:1149.8ng/μl,ev24-egfp:1168.5ng/ul,ev24 cvb3v-egfp:1284.6ng/ul,ev29-egfp:1245.5μg/μl,ev29 cvb3vegfp:1111.8ng/μl,ev33-egfp:1180.4ng/μl,ev33 cvb3v-egfp:1148.5ng/μl;②mrna环化并纯化后rna浓度:cvb3-egfp:482.8ng/μl,ev24-egfp:462.4ng/ul,ev24 cvb3v-egfp:532.5ng/ul,ev29-egfp:444.5μg/μl,ev29 cvb3-egfp:447.2ng/μl,ev33-egfp:452.0ng/μl,ev33 cvb3egfp:415.5ng/μl;③rna变性琼脂糖凝胶电泳。如图2所示:变性琼脂糖凝胶电泳图显示环化处理组mrna较线状mrna,其在胶上的迁移速度更快。3)rt-pcr以及基因测序鉴定mrna成环为鉴定环化反应所得rna是否为环状rna,此处采用rt-pcr及dna测序法进行检测。根据rna环化的基本原理,通过内含子的核酶特性,在gtp的引发下,5’内含子与第一外显子e1连接处将发生断裂,该第一外显子e1处核酸裂口将进攻3’内含子与第二外显子e2的连接处,导致该连接处发生断裂,3’内含子发生解离,第一外显子e1与第二外显子e2形成共价连接,最终形成环状rna。因此,通过扩增包含第一外显子e1与第二外显子e2连接序列并进行测序,可作为rna是否成环的最终判断依据。通过随机引物介导的rna逆转录反应获得cdna。以cdna作为模板,采用特异性引物进行pcr扩增。实验结果显示,线状mrna组未见特异性扩增条带,环状mrna组可见特异性扩增条带。通过对该特异性条带进行切胶回收,纯化后进行dna测序。如图3所示,测序结果显示,该dna条带包含连接后的e1和e2序列。由此可见,环状rna包含连接的e1-e2rna序列,说明该rna已连接成环。4)蛋白表达检测细胞转染后1-3天荧光强度定量测试结果如图4所示,与包含cvb3ires的环状egfpmrna(circ-rnacvb3,引用文献15)相比,包含ev24ires,ev24与cvb3v嵌合型ires(ev24 cvb3v),ev29ires,ev29与cvb3v嵌合型ires(ev29 cvb3v),ev33ires,ev33与cvb3v嵌合型ires(ev33 cvb3v)的环状mrna介导的细胞荧光更强,说明本专利提供的包含不同ires组合的环状mrna能介导更强的蛋白表达。为鉴定该系列环状mrna介导蛋白表达的持久度,对细胞转染后1-5天的荧光强度进行定量。测试结果如图5和图6所示:与包含cvb3ires的环状egfpmrna(circ-rnacvb3,引用文献15)相比,包含ev24ires,ev24 cvb3vires,ev29ires,ev29 cvb3vires,ev33ires,ev33 cvb3vires的环状mrna介导的egfp的表达更强且更持久,同时也显著地比线性egfpmrna(为购自apexbio的标准品,cap1帽子结构及polya尾)介导的egfp的表达更强且更持久。实施例2:ev29ires与不同的同源臂、间隔序列组合所得环状mrna在293t细胞中的表达2.1实验方法与步骤在上述实施例1的基础上,采用与上述实施例相同的内含子与外显子元件,以ev29ires(seqidno:10所示核苷酸序列),结构新颖的5’同源臂1(seqidno:2所示的核苷酸序列)、3’同源臂1(seqidno:17所示的核苷酸序列)和5’间隔区1序列(seqidno:6所示的核苷酸序列)及3’间隔区1序列(seqidno:52所示的核苷酸序列)作为环状mrna的基础元件,构建编码绿色荧光蛋白(egfp)的环状mrna(circ-rnaev29h1s1)。采用与上述环状mrna相同的内含子与外显子元件,以ev29ires,5’同源臂2(seqidno:3所示的核苷酸序列)、3’同源臂2(seqidno:18所示的核苷酸序列)和5’间隔区2序列(seqidno:7所示的核苷酸序列)及3’间隔区2序列(seqidno:53所示的核苷酸序列)作为环状mrna的基础元件,构建编码绿色荧光蛋白(egfp)的环状mrna(circ-rnaev29h2s2)。编码egfp的dna序列如seqidno:20所示。dna合成委托苏州金唯智生物科技有限公司完成。最终将含有t7启动子、i类pie元件、5’同源臂1、3’同源臂1、5’间隔区1、3’间隔区1、ev29ires元件、egfp编码区(或者t7启动子、i类pie元件、5’同源臂2、3’同源臂2、5’间隔区2、3’间隔区2、ev29ires元件、egfp编码区)的完整dna片段克隆至puc57质粒。质粒dna线性化,线状mrna体外转录,线状mrna纯化,mrna的成环反应,环状mrna的纯化,细胞培养与转染等方法均与实施例1的1.1相同。2.2实验结果2.2.1实验结果1)dna线性化模板制备①质粒提取浓度:puc57-cvb3-egfp:356.4ng/μl,puc57-ev29-egfp:481.9ng/μl,puc57-ev29-egfph1s1:283.1ng/μl,puc57-ev29-egfph2s2:303.1ng/μl;②质粒酶切线性化浓度:puc57-cvb3-egfp:249.6ng/μlpuc57-ev29-egfp:289ng/μl,puc57-ev29-egfph1s1:293ng/μl,puc57-ev29-egfph2s2:294ng/μl;2)mrna转录与环化①mrna转录纯化后浓度:cvb3-egfp:506.3ng/ul,ev29-egfp:527.5ng/μl,ev29-egfph1s1:573.2ng/μl,ev29-egfph2s2:564.9ng/μl;②mrna环化纯化后浓度:cvb3-egfp:257.4ng/ul,ev29-egfp:236.2ng/μl,ev29-egfph1s1:208.0ng/μl,ev29-egfph2s2:240.3ng/μl;采用变性琼脂糖凝胶鉴定rna成环。实验结果如图7所示:变性琼脂糖凝胶电泳图中各组环化后mrna较相应的环化前线状mrna在胶上的迁移速度更快。3)蛋白表达检测细胞转染后1-3d荧光定量如图8所示:环状mrnacirc-rnaev29-egfph1s1所介导的荧光蛋白表达量显著高于circ-rnaev29-egfp组所对应的量,也显著高于circ-rnacvb3-egfp组所对应的量。说明本发明提供的新颖的5’同源臂1、3’同源臂1以及5’间隔区1、3’间隔区1组合可有效提高环状mrna介导的蛋白表达。环状mrnacirc-rnaev29-egfph2s2所介导的荧光蛋白表达量较circ-rnaev29-egfp组所对应的量有提高,且显著高于circ-rnacvb3-egfp组所对应的量。说明本发明提供的新颖的5’同源臂2、3’同源臂2以及5’间隔区2、3’间隔区2组合可提高环状mrna介导的蛋白表达。为鉴定不同的环状mrna介导蛋白表达的持久度,对细胞转染1-5d后荧光进行定量。如图9所示,circ-rnaev29-egfph1s1介导的荧光蛋白,其表达的强度和持久度均高于circ-rnaev29-egfp组以及circ-rnacvb3-egfp组。说明本发明提供的新颖的5’同源臂1、3’同源臂1以及5’间隔区1、3’间隔区1组合可有效提高环状mrna介导的蛋白表达的持久性。circ-rnaev29-egfph2s2所介导的荧光蛋白表达持久度与circ-rnaev29-egfp组相当,但显著高于circ-rnacvb3-egfp组。说明本发明提供的新颖的5’同源臂2、3’同源臂2以及5’间隔区2、3’间隔区2组合,其环状mrna介导的蛋白表达显著优于专利引用文献15所提供的方法及设计。另外,上述所有环状mrna的egfp表达持久度均显著高于线性mrna(为购自apexbio的标准品,包含cap1帽子结构及polya尾)。实施例3:环状mrna编码新型冠状病毒spike抗原rbd蛋白实现在293t细胞的蛋白表达3.1实验方法与步骤在上述实施例2的基础上,以ev29ires,5’同源臂1、3’同源臂1和5’间隔区1、3’间隔区1序列作为环状mrna的基础元件,构建编码新型冠状病毒spike抗原的rbd结构域(receptorbindingdomain)的环状mrna。rbd蛋白序列如seqidno:32所示,编码rbd的dna序列如seqidno:31所示。dna合成委托苏州金唯智生物科技有限公司完成。最终将含有t7启动子,i类pie元件,5’同源臂1、3’同源臂1,5’间隔区1、3’间隔区1,ev29ires,rbd编码区的完整dna片段克隆至puc57质粒。质粒dna线性化,线状mrna体外转录,线状mrna纯化,mrna的成环反应,环状mrna的纯化,得到如seqidno:33所示序列的环状mrna。细胞培养与转染等方法均与实施例1的1.1相同。采用his-tagelisa检测试剂盒对分泌的his-rbd蛋白进行定量检测(南京金斯瑞生物科技有限公司)。3.2实验结果表9核酸名称浓度puc57-ev29-rbd-h1s1质粒(纯化后)342.2ng/μlpuc57-ev29-rbd-h1s1线性化质粒(纯化后)264.3ng/μlev29-rbd-h1s1线状mrna(纯化后)508.5ng/μlev29-rbd-h1s1环状mrna(纯化后)236.2ng/μl经his-tagelisa检测,rbd-his环状mrna在293t表达1-5天所得蛋白的量分别为21.6,35.4,40.3,28.6,22.7ng/ml,说明以本公开的环状mrna可实现rbd蛋白的高效且持久性的表达。实施例4:环状mrna编码epo实现在293t细胞的蛋白表达4.1实验方法与步骤在上述实施例2的基础上,以ev33ires,5’同源臂1、3’同源臂1和5’间隔区1、3’间隔区1作为环状mrna的基础元件,构建编码红细胞生成素(epo)的环状mrna。编码epo的dna和蛋白序列分别如seqidno:34和seqidno:35所示.。dna合成委托苏州金唯智生物科技有限公司完成。最终将含有t7启动子,i类pie元件,5’同源臂1、3’同源臂1,5’间隔区1、3’间隔区1,ev33ires,epo编码区的完整dna片段克隆到puc57质粒。质粒dna线性化,线状mrna体外转录,线状mrna纯化,mrna的成环反应,环状mrna的纯化,细胞培养与转染等方法均与实施例1的1.1相同。采用epoelisa检测试剂盒(thermofisher)对293t表达的epo蛋白进行定量。4.2实验结果表10核酸名称浓度puc57-ev33-epo-h1s1质粒(纯化后)297.5ng/μlpuc57-ev33-epo-h1s1线性化质粒(纯化后)275.4ng/μlev33-epo-h1s1线状mrna(纯化后)375.3ng/μlev33-epo-h1s1环状mrna(纯化后)286.7ng/μl经epoelisa检测,epo环状mrna在293t表达1-5天所得蛋白的量分别为35.6,42.8,56.4,50.3,25.7ng/ml,说明以本公开的环状mrna可实现epo蛋白的高效、持久性表达。实施例5:环状mrna编码pd-1单克隆抗体实现在293t细胞的蛋白表达5.1实验方法和步骤上述实施例2的基础上,以ev29ires,5’同源臂1、3’同源臂1和5’间隔区1、3’间隔区1作为环状mrna的基础元件,构建编码抗程序性细胞死亡受体1(pd-1)单克隆抗体)的环状mrna。编码抗pd1单抗轻链的dna和蛋白序列分别如seqidno:37和seqidno:38所示,编码抗pd1单抗重链的dna和蛋白序列分别如seqidno:40和seqidno:41所示。dna合成委托苏州金唯智生物科技有限公司完成。最终将含有t7启动子,i类pie元件,5’同源臂1、3’同源臂1,5’间隔区1、3’间隔区1,ev29ires,pd1轻链编码区的完整dna片段克隆到puc57质粒。类似地,将含有t7启动子,i类pie元件,5’同源臂1、3’同源臂1,5’间隔区1、3’间隔区1,ev29ires,pd1重链编码区的完整dna片段克隆到puc57质粒。质粒dna线性化,线状mrna体外转录,线状mrna纯化,mrna的成环反应,环状mrna的纯化,得到序列如seqidno:39或42所示的两种环状rna,细胞培养等方法均与实施例1的1.1相同。将编码pd1单抗轻链和重链的两种mrna以1:1的比例混合,共转染到293t细胞。转染方法同实施例1。采用pd1elisa检测试剂盒(thermofisher)对293t表达的pd1蛋白进行定量。5.2实验结果表11核酸名称浓度puc57-ev29-pd1l-h1s1质粒(纯化后)279.3ng/μlpuc57-ev29-pd1l-h1s1线性化质粒(纯化后)204.2ng/μlev29-pd1l-h1s1线状mrna(纯化后)396.5ng/μlev29-pd1l-h1s1环状mrna(纯化后)247.2ng/μl核酸名称浓度puc57-ev29-pd1h-h1s1质粒(纯化后)268.6ng/μlpuc57-ev29-pd1h-h1s1线性化质粒(纯化后)201.3ng/μlev29-pd1h-h1s1线状mrna(纯化后)304.7ng/μlev29-pd1h-h1s1环状mrna(纯化后)207.4ng/μl经pd1单抗elisa检测,pd1单抗环状mrna在293t表达1-5天所得蛋白的量分别为120.3,234.6,356.4,221.6,104.8ng/ml,说明以本公开的环状mrna可实现pd1单抗的高效、持久性表达。实施例6:环状mrna编码细胞因子il-15实现在293t细胞的蛋白表达6.1实验方法和步骤在上述实施例2的基础上,以ev29ires,5’同源臂1、3’同源臂1,5’间隔区1、3’间隔区1作为环状mrna的基础元件,构建编码白介素15(il-15)的环状mrna。编码il-15的dna和蛋白序列分别分别如seqidno:43和seqidno:44所示。dna合成委托苏州金唯智生物科技有限公司完成。最终将含有t7启动子,i类pie元件,5’同源臂1、3’同源臂1,5’间隔区1、3’间隔区1,ev29ires,il-15编码区的完整dna片段克隆到puc57质粒。质粒dna线性化,线状mrna体外转录,线状mrna纯化,mrna的成环反应,环状mrna的纯化,得到序列如seqidno:45所示的环状rna,细胞培养与转染等方法均与实施例1的1.1相同。采用il-15elisa检测试剂盒(thermofisher)对293t表达的il-15蛋白进行定量。6.2实验结果表12核酸名称浓度puc57-ev29-il15-h1s1质粒(纯化后)286.3ng/μlpuc57-ev29-il15-h1s1线性化质粒(纯化后)251.5ng/μlev29-il15-h1s1线状mrna(纯化后)311.3ng/μlev29-il15-h1s1环状mrna(纯化后)274.3ng/μl经il-15elisa检测,il-15环状mrna在293t表达1-5天所得蛋白的量分别为38.9,47.3,68.4,51.6,26.4ng/ml,说明以本公开的环状mrna可实现il-15的高效、持久性表达。实施例7:环状mrna编码肿瘤特异性抗原前列腺癌pap蛋白实现在293t细胞的蛋白表达7.1实验方法和步骤在上述实施例2的基础上,以ev29ires,5’同源臂1、3’同源臂1,5’间隔区1、3’间隔区1作为环状mrna的基础元件,构建编前列腺癌肿瘤特异性抗原酸性磷酸酶蛋白pap(prostateacidphosphatase)的环状mrna。编码pap的dna和蛋白序列分别分别如seqidno:46和seqidno:47所示。dna合成委托苏州金唯智生物科技有限公司完成。最终将含有t7启动子,i类pie元件,5’同源臂1、3’同源臂1,5’间隔区1、3’间隔区1,ev29ires,pap编码区的完整dna片段克隆到puc57质粒。质粒dna线性化,线状mrna体外转录,线状mrna纯化,mrna的成环反应,环状mrna的纯化,得到序列如seqidno:48所示的环状rna,细胞培养与转染等方法均与实施例1的1.1相同。采用papelisa检测试剂盒(thermofisher)对293t表达的pap蛋白进行定量。7.2实验结果表13核酸名称浓度puc57-ev29-pap-h1s1质粒(纯化后)386.7ng/μlpuc57-ev29-pap-h1s1线性化质粒(纯化后)294.5ng/μlev29-pap--h1s1线状mrna(纯化后)317.2ng/μlev29-pap-h1s1环状mrna(纯化后)268.9ng/μlpapelisa检测,epo环状mrna在293t表达1-5天所得蛋白的量分别为69.3,86.4,75.5,52.4,38.6ng/ml,说明以本公开的环状mrna可实现epo的高效、持久性表达。实施例8:环状mrna编码嵌合抗原受体cd16car蛋白实现在293t细胞的表达8.1实验方法和步骤在上述实施例2的基础上,以ev29ires,5’同源臂1、3’同源臂1,5’间隔区1、3’间隔区1作为环状mrna的基础元件,构建编嵌合抗原受体cd16car的环状mrna。编码cd16car的dna和蛋白序列分别如seqidno:49和seqidno:50所示。dna合成委托苏州金唯智生物科技有限公司完成。最终将含有t7启动子,i类pie元件,5’同源臂1、3’同源臂1,5’间隔区1、3’间隔区1,ev29ires,cd16car编码区的完整dna片段克隆到puc57质粒。质粒dna线性化,线状mrna体外转录,线状mrna纯化,mrna的成环反应,环状mrna的纯化,得到序列如seqidno:51所示的环状rna,细胞培养与转染等方法均与实施例1的1.1相同。采用抗cd16单克隆抗体介导的流式细胞术(thermofisher)对293t表达的cd16car蛋白进行表达效率测试。8.2实验结果表14核酸名称浓度puc57-ev29-cd16car-h1s1质粒(纯化后)268.5ng/μlpuc57-ev29-cd16car-h1s1线性化质粒(纯化后)221.7ng/μlev29-cd16car--h1s1线状mrna(纯化后)375.4ng/μlev29-cd16car-h1s1环状mrna(纯化后)284.3ng/μl通过采用抗cd16抗体检测环状mrna介导的cd16car在293t的表达阳性率。结果现实,在环状mrna转染1-5天,cd16car表达的阳性率分别为90.4%,85.6%,80.3%,78.4%以及60.5%,说明以本公开的环状mrna可实现cd16抗体的高效、持久性表达。本公开的上述实施例仅是为清楚地说明本公开所作的举例,而并非是对本公开的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本公开的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本公开权利要求的保护范围之内。序列表<110>江苏普瑞康生物医药科技有限公司<120>一种转录环状rna的重组核酸分子及其在蛋白表达中的应用<130>6a23-2018183i<141>2020-12-04<160>53<170>siposequencelisting1.0<210>1<211>19<212>dna<213>artificialsequence<400>1taatacgactcactatagg19<210>2<211>21<212>dna<213>artificialsequence<400>2accgtcagttgctcactgtgc21<210>3<211>21<212>dna<213>artificialsequence<400>3accgtgctatgtccacgtgtc21<210>4<211>131<212>dna<213>artificialsequence<400>4aacaatagatgacttacaactaatcggaaggtgcagagactcgacgggagctaccctaac60gtcaagacgagggtaaagagagagtccaattctcaaagccaataggcagtagcgaaagct120gcaagagaatg131<210>5<211>51<212>dna<213>artificialsequence<400>5aaaatccgttgaccttaaacggtcgtgtgggttcaagtccctccaccccca51<210>6<211>50<212>dna<213>artificialsequence<400>6aaaaaacaaaaacaaaaaaaacaaaaaaacaaaaaaaaaaccaaaacaca50<210>7<211>50<212>dna<213>artificialsequence<400>7aaaaacaaaaaacaaaaaaaaaaccaaaaaaacaaaaaaaacaaaacaca50<210>8<211>741<212>dna<213>artificialsequence<400>8ttaaaacagcctgtgggttgatcccacccacaggcccattgggcgctagcactctggtat60cacggtacctttgtgcgcctgttttataccccctcccccaactgtaacttagaagtaaca120cacaccgatcaacagtcagcgtggcacaccagccacgttttgatcaagcacttctgttac180cccggactgagtatcaatagactgctcacgcggttgaaggagaaagcgttcgttatccgg240ccaactacttcgaaaaacctagtaacaccgtggaagttgcagagtgtttcgctcagcact300accccagtgtagatcaggtcgatgagtcaccgcattccccacgggcgaccgtggcggtgg360ctgcgttggcggcctgcccatggggaaacccatgggacgctctaatacagacatggtgcg420aagagtctattgagctagttggtagtcctccggcccctgaatgcggctaatcctaactgc480ggagcacacaccctcaagccagagggcagtgtgtcgtaacgggcaactctgcagcggaac540cgactactttgggtgtccgtgtttcattttattcctatactggctgcttatggtgacaat600tgagagatcgttaccatatagctattggattggccatccggtgactaatagagctattat660atatccctttgttgggtttataccacttagcttgaaagaggttaaaacattacaattcat720tgttaagttgaatacagcaaa741<210>9<211>682<212>dna<213>artificialsequence<400>9ttaaaacagcctgtgggttgcacccacccacagggcccacagggcgctagcactctggta60tcacggtacctttgtgcgcctgttttattaccccttccccaattgaaaattagaagcaat120gcacaccgatcaacagcaggcgtggcgcaccagtcacgtctcgatcaagcacttctgttt180ccccggaccgagtatcaatagactgctcacgcggttgaaggagaaagtgttcgttatccg240gctaaccacttcgagaaacccagtaacaccatgaaagttgcagggtgtttcgctcagcac300ttccccagtgtagatcaggtcgatgagtcaccgcgttccccacgggcgaccgtggcggtg360gctgcgttggcggcctgcctatgggttaacccataggacgctctaatacagacatggtgc420gaagagtttattgagctggttagtatccctccggcccctgaatgcggctaatcctaactg480cggagcacgtgcctccaatccagggggttgcatgtcgtaacgggtaactctgcagcggaa540ccgactactttgggtgtccgtgtttccttttattcttatactggctgcttatggtgacaa600tcgaggaattgttaccatatagctattggattggccatccggtgtctaacagagcgatta660tatacctctttgttggatttat682<210>10<211>742<212>dna<213>artificialsequence<400>10ttaaaacagcctgtgggttgatcccacccacagggcccactgggcgctagcactctggta60tcacggtacctttgtgcgcctgttttatacttcctcccccaactgcaacttagaagtaac120acaaaccgatcaacagtcagcgtggcacaccagccacgttttgatcaaacacttctgtta180ccccggactgagtatcaatagactgctcacgcggttgaaggagaaaacgttcgttatccg240gccaactacttcgagaaacctagtaacgccatggaagttgtggagtgtttcgctcagcac300taccccagtgtagatcaggttgatgagtcaccgcattccccacgggtgaccgtggcggtg360gctgcgttggcggcctgcccatggggaaacccatgggacgctcttatacagacatggtgc420gaagagtctattgagctagttggtagtcctccggcccctgaatgcggctaatcccaactg480cggagcatacactctcaagccagagggtagtgtgtcgtaatgggcaactctgcagcggaa540ccgactactttgggtgtccgtgtttcattttattcctatactggctgcttatggtgacaa600ttgagagattgttaccatatagctattggattggccatccggtgactaacagagctatta660tatatctttttgttgggtttataccacttagcttgaaagaggttaaaactctacattaca720ttttaatactgaacaccgcaaa742<210>11<211>737<212>dna<213>artificialsequence<400>11ttaaaacagcctgtgggttgatcccacccacagggcccattgggcgctagcactctggta60tcacggtacccttgtgcgcctgttttatgtcccttccctcaactgtaacttagaagtaac120gcacaccgatcaacagtcagcgtggcacaccagccatgttttgatcaagcacttctgtta180ccccggaccgagtatcaacagactgctcacgcggttgaaggagaaagtgttcgttatccg240gccaactacttcgaaaaacctagtaacaccatggaagttgcagagtgtttcgctcagcac300taccccagtgtagatcaggtcgatgagtcaccgcatcccccacgggcgaccgtggcggtg360gctgcgttggcggcctgcctatgggggaacccataggacgctctaatacagacatggtgc420gaagagtccattgagctagttggtagtcctccggcccctgaatgcggctaatcctaactg480cggagcacacaccttcaagccagagggcagtgtgtcgtaacgggcaactctgcagcggaa540ccgactactttgggtgtccgtgtttcattttattcttatactggctgcttatggtgacaa600ttgagagattgttaccatatagctattggattggccatccagtgactagcagagctatta660tatacctctttgttgggtttataccacctaatttgaaagaagttaaaacattagaattca720ttattaaattgaataca737<210>12<211>683<212>dna<213>artificialsequence<400>12ttaaaacagcctgtgggttgcacccacccacagggcccacagggcgctagcactctggta60tcacggtacctttgtgcgcctgttttattaccccttccccaattgaaaattagaagcaat120gcacaccgatcaacagcaggcgtggcgcaccagtcacgtctcgatcaagcacttctgttt180ccccggaccgagtatcaatagactgctcacgcggttgaaggagaaagtgttcgttatccg240gctaaccacttcgagaaacccagtaacaccatgaaagttgcagggtgtttcgctcagcac300ttccccagtgtagatcaggtcgatgagtcaccgcgttccccacgggcgaccgtggcggtg360gctgcgttggcggcctgcctatgggttaacccataggacgctctaatacagacatggtgc420gaagagtttattgagctggttagtatctcctccggcccctgaatgcggctaatcctaact480gcggagcacacaccctcaagccagagggcagtgtgtcgtaacgggcaactctgcagcgga540accgactactttgggtgtccgtgtttccttttattcttatactggctgcttatggtgaca600atcgaggaattgttaccatatagctattggattggccatccggtgtctaacagagcgatt660atatacctctttgttggatttat683<210>13<211>742<212>dna<213>artificialsequence<400>13ttaaaacagcctgtgggttgatcccacccacagggcccactgggcgctagcactctggta60tcacggtacctttgtgcgcctgttttatacttcctcccccaactgcaacttagaagtaac120acaaaccgatcaacagtcagcgtggcacaccagccacgttttgatcaaacacttctgtta180ccccggactgagtatcaatagactgctcacgcggttgaaggagaaaacgttcgttatccg240gccaactacttcgagaaacctagtaacgccatggaagttgtggagtgtttcgctcagcac300taccccagtgtagatcaggttgatgagtcaccgcattccccacgggtgaccgtggcggtg360gctgcgttggcggcctgcccatggggaaacccatgggacgctcttatacagacatggtgc420gaagagtctattgagctagttggtagtcctccggcccctgaatgcggctaatcctaactg480cggagcacacaccctcaagccagagggcagtgtgtcgtaacgggcaactctgcagcggaa540ccgactactttgggtgtccgtgtttcattttattcctatactggctgcttatggtgacaa600ttgagagattgttaccatatagctattggattggccatccggtgactaacagagctatta660tatatctttttgttgggtttataccacttagcttgaaagaggttaaaactctacattaca720ttttaatactgaacaccgcaaa742<210>14<211>737<212>dna<213>artificialsequence<400>14ttaaaacagcctgtgggttgatcccacccacagggcccattgggcgctagcactctggta60tcacggtacccttgtgcgcctgttttatgtcccttccctcaactgtaacttagaagtaac120gcacaccgatcaacagtcagcgtggcacaccagccatgttttgatcaagcacttctgtta180ccccggaccgagtatcaacagactgctcacgcggttgaaggagaaagtgttcgttatccg240gccaactacttcgaaaaacctagtaacaccatggaagttgcagagtgtttcgctcagcac300taccccagtgtagatcaggtcgatgagtcaccgcatcccccacgggcgaccgtggcggtg360gctgcgttggcggcctgcctatgggggaacccataggacgctctaatacagacatggtgc420gaagagtccattgagctagttggtagtcctccggcccctgaatgcggctaatcctaactg480cggagcacacaccctcaagccagagggcagtgtgtcgtaacgggcaactctgcagcggaa540ccgactactttgggtgtccgtgtttcattttattcttatactggctgcttatggtgacaa600ttgagagattgttaccatatagctattggattggccatccagtgactagcagagctatta660tatacctctttgttgggtttataccacctaatttgaaagaagttaaaacattagaattca720ttattaaattgaataca737<210>15<211>16<212>dna<213>artificialsequence<400>15agacgctacggactta16<210>16<211>114<212>dna<213>artificialsequence<400>16aataattgagccttaaagaagaaattctttaagtggatgctctcaaactcagggaaacct60aaatctagttatagacaaggcaatcctgagccaagccgaagtagtaattagtaa114<210>17<211>21<212>dna<213>artificialsequence<400>17gcacagtgagcaactgacgga21<210>18<211>21<212>dna<213>artificialsequence<400>18gacacgtggacatagcacgga21<210>19<211>6<212>dna<213>artificialsequence<400>19tctaga6<210>20<211>720<212>dna<213>artificialsequence<400>20atggtgtcaaagggtgaggaattattcaccggcgtggtgcctatccttgtggaacttgat60ggagatgtgaacggacacaaattcagtgtatcaggagaaggagaaggagatgcaacatac120ggaaagctcactcttaaatttatctgcacaacaggaaagctcccggtgccttggcctaca180cttgtgacaacacttacatacggagtgcaatgcttctcgcgttaccctgatcacatgaaa240caacacgatttcttcaagagtgcaatgcctgaaggatacgtgcaagaaagaacaatcttc300ttcaaggacgatggaaactacaagactcgtgcagaagtgaaatttgaaggagatacactt360gtgaacagaatcgaacttaaaggaatcgatttcaaggaggatggaaacatccttggacac420aaacttgaatacaactacaactcacacaacgtgtacatcatggcagataaacagaagaat480ggtatcaaagtgaactttaagattcgccacaacatcgaagatggatcagtgcaacttgca540gatcactaccaacagaatacgccgataggagatggacctgtgcttcttcctgataaccac600tacctttcaacacaatcagcactttcaaaggacccaaacgagaagcgagaccacatggtg660cttcttgaatttgtgacagcagcaggaatcacacttggaatggatgaactttacaaatga720<210>21<211>239<212>prt<213>artificialsequence<400>21metvalserlysglyglugluleuphethrglyvalvalproileleu151015valgluleuaspglyaspvalasnglyhislyspheservalsergly202530gluglygluglyaspalathrtyrglylysleuthrleulyspheile354045cysthrthrglylysleuprovalprotrpprothrleuvalthrthr505560leuthrtyrglyvalglncyspheserargtyrproasphismetlys65707580glnhisaspphephelysseralametprogluglytyrvalglnglu859095argthrilephephelysaspaspglyasntyrlysthrargalaglu100105110vallysphegluglyaspthrleuvalasnargilegluleulysgly115120125ileaspphelysgluaspglyasnileleuglyhislysleuglutyr130135140asntyrasnserhisasnvaltyrilemetalaasplysglnlysasn145150155160glyilelysvalasnphelysilearghisasnilegluaspglyser165170175valglnleualaasphistyrglnglnasnthrproileglyaspgly180185190provalleuleuproaspasnhistyrleuserthrglnseralaleu195200205serlysaspproasnglulysargasphismetvalleuleugluphe210215220valthralaalaglyilethrleuglymetaspgluleutyrlys225230235<210>22<211>1638<212>rna<213>artificialsequence<400>22aaaauccguugaccuuaaacggucguguggguucaagucccuccacccccacgccggaaa60cgcaauagccgaaaaacaaaaaacaaaaaaaacaaaaaaaaaaccaaaaaaacaaaacac120auuaaaacagccuguggguugaucccacccacaggcccauugggcgcuagcacucuggua180ucacgguaccuuugugcgccuguuuuauacccccucccccaacuguaacuuagaaguaac240acacaccgaucaacagucagcguggcacaccagccacguuuugaucaagcacuucuguua300ccccggacugaguaucaauagacugcucacgcgguugaaggagaaagcguucguuauccg360gccaacuacuucgaaaaaccuaguaacaccguggaaguugcagaguguuucgcucagcac420uaccccaguguagaucaggucgaugagucaccgcauuccccacgggcgaccguggcggug480gcugcguuggcggccugcccauggggaaacccaugggacgcucuaauacagacauggugc540gaagagucuauugagcuaguugguaguccuccggccccugaaugcggcuaauccuaacug600cggagcacacacccucaagccagagggcagugugucguaacgggcaacucugcagcggaa660ccgacuacuuuggguguccguguuucauuuuauuccuauacuggcugcuuauggugacaa720uugagagaucguuaccauauagcuauuggauuggccauccggugacuaauagagcuauua780uauaucccuuuguuggguuuauaccacuuagcuugaaagagguuaaaacauuacaauuca840uuguuaaguugaauacagcaaaauggugucaaagggugaggaauuauucaccggcguggu900gccuauccuuguggaacuugauggagaugugaacggacacaaauucaguguaucaggaga960aggagaaggagaugcaacauacggaaagcucacucuuaaauuuaucugcacaacaggaaa1020gcucccggugccuuggccuacacuugugacaacacuuacauacggagugcaaugcuucuc1080gcguuacccugaucacaugaaacaacacgauuucuucaagagugcaaugccugaaggaua1140cgugcaagaaagaacaaucuucuucaaggacgauggaaacuacaagacucgugcagaagu1200gaaauuugaaggagauacacuugugaacagaaucgaacuuaaaggaaucgauuucaagga1260ggauggaaacauccuuggacacaaacuugaauacaacuacaacucacacaacguguacau1320cauggcagauaaacagaagaaugguaucaaagugaacuuuaagauucgccacaacaucga1380agauggaucagugcaacuugcagaucacuaccaacagaauacgccgauaggagauggacc1440ugugcuucuuccugauaaccacuaccuuucaacacaaucagcacuuucaaaggacccaaa1500cgagaagcgagaccacauggugcuucuugaauuugugacagcagcaggaaucacacuugg1560aauggaugaacuuuacaaaugaaaaaaacaaaaaacaaaacggcuauuaugcguuaccgg1620cgagacgcuacggacuua1638<210>23<211>1579<212>rna<213>artificialsequence<400>23aaaauccguugaccuuaaacggucguguggguucaagucccuccacccccacgccggaaa60cgcaauagccgaaaaacaaaaaacaaaaaaaacaaaaaaaaaaccaaaaaaacaaaacac120auuaaaacagccuguggguugcacccacccacagggcccacagggcgcuagcacucuggu180aucacgguaccuuugugcgccuguuuuauuaccccuuccccaauugaaaauuagaagcaa240ugcacaccgaucaacagcaggcguggcgcaccagucacgucucgaucaagcacuucuguu300uccccggaccgaguaucaauagacugcucacgcgguugaaggagaaaguguucguuaucc360ggcuaaccacuucgagaaacccaguaacaccaugaaaguugcaggguguuucgcucagca420cuuccccaguguagaucaggucgaugagucaccgcguuccccacgggcgaccguggcggu480ggcugcguuggcggccugccuauggguuaacccauaggacgcucuaauacagacauggug540cgaagaguuuauugagcugguuaguaucccuccggccccugaaugcggcuaauccuaacu600gcggagcacgugccuccaauccaggggguugcaugucguaacggguaacucugcagcgga660accgacuacuuuggguguccguguuuccuuuuauucuuauacuggcugcuuauggugaca720aucgaggaauuguuaccauauagcuauuggauuggccauccggugucuaacagagcgauu780auauaccucuuuguuggauuuauauggugucaaagggugaggaauuauucaccggcgugg840ugccuauccuuguggaacuugauggagaugugaacggacacaaauucaguguaucaggag900aaggagaaggagaugcaacauacggaaagcucacucuuaaauuuaucugcacaacaggaa960agcucccggugccuuggccuacacuugugacaacacuuacauacggagugcaaugcuucu1020cgcguuacccugaucacaugaaacaacacgauuucuucaagagugcaaugccugaaggau1080acgugcaagaaagaacaaucuucuucaaggacgauggaaacuacaagacucgugcagaag1140ugaaauuugaaggagauacacuugugaacagaaucgaacuuaaaggaaucgauuucaagg1200aggauggaaacauccuuggacacaaacuugaauacaacuacaacucacacaacguguaca1260ucauggcagauaaacagaagaaugguaucaaagugaacuuuaagauucgccacaacaucg1320aagauggaucagugcaacuugcagaucacuaccaacagaauacgccgauaggagauggac1380cugugcuucuuccugauaaccacuaccuuucaacacaaucagcacuuucaaaggacccaa1440acgagaagcgagaccacauggugcuucuugaauuugugacagcagcaggaaucacacuug1500gaauggaugaacuuuacaaaugaaaaaaacaaaaaacaaaacggcuauuaugcguuaccg1560gcgagacgcuacggacuua1579<210>24<211>1580<212>rna<213>artificialsequence<400>24aaaauccguugaccuuaaacggucguguggguucaagucccuccacccccacgccggaaa60cgcaauagccgaaaaacaaaaaacaaaaaaaacaaaaaaaaaaccaaaaaaacaaaacac120auuaaaacagccuguggguugcacccacccacagggcccacagggcgcuagcacucuggu180aucacgguaccuuugugcgccuguuuuauuaccccuuccccaauugaaaauuagaagcaa240ugcacaccgaucaacagcaggcguggcgcaccagucacgucucgaucaagcacuucuguu300uccccggaccgaguaucaauagacugcucacgcgguugaaggagaaaguguucguuaucc360ggcuaaccacuucgagaaacccaguaacaccaugaaaguugcaggguguuucgcucagca420cuuccccaguguagaucaggucgaugagucaccgcguuccccacgggcgaccguggcggu480ggcugcguuggcggccugccuauggguuaacccauaggacgcucuaauacagacauggug540cgaagaguuuauugagcugguuaguaucuccuccggccccugaaugcggcuaauccuaac600ugcggagcacacacccucaagccagagggcagugugucguaacgggcaacucugcagcgg660aaccgacuacuuuggguguccguguuuccuuuuauucuuauacuggcugcuuauggugac720aaucgaggaauuguuaccauauagcuauuggauuggccauccggugucuaacagagcgau780uauauaccucuuuguuggauuuauauggugucaaagggugaggaauuauucaccggcgug840gugccuauccuuguggaacuugauggagaugugaacggacacaaauucaguguaucagga900gaaggagaaggagaugcaacauacggaaagcucacucuuaaauuuaucugcacaacagga960aagcucccggugccuuggccuacacuugugacaacacuuacauacggagugcaaugcuuc1020ucgcguuacccugaucacaugaaacaacacgauuucuucaagagugcaaugccugaagga1080uacgugcaagaaagaacaaucuucuucaaggacgauggaaacuacaagacucgugcagaa1140gugaaauuugaaggagauacacuugugaacagaaucgaacuuaaaggaaucgauuucaag1200gaggauggaaacauccuuggacacaaacuugaauacaacuacaacucacacaacguguac1260aucauggcagauaaacagaagaaugguaucaaagugaacuuuaagauucgccacaacauc1320gaagauggaucagugcaacuugcagaucacuaccaacagaauacgccgauaggagaugga1380ccugugcuucuuccugauaaccacuaccuuucaacacaaucagcacuuucaaaggaccca1440aacgagaagcgagaccacauggugcuucuugaauuugugacagcagcaggaaucacacuu1500ggaauggaugaacuuuacaaaugaaaaaaacaaaaaacaaaacggcuauuaugcguuacc1560ggcgagacgcuacggacuua1580<210>25<211>1639<212>rna<213>artificialsequence<400>25aaaauccguugaccuuaaacggucguguggguucaagucccuccacccccacgccggaaa60cgcaauagccgaaaaacaaaaaacaaaaaaaacaaaaaaaaaaccaaaaaaacaaaacac120auuaaaacagccuguggguugaucccacccacagggcccacugggcgcuagcacucuggu180aucacgguaccuuugugcgccuguuuuauacuuccucccccaacugcaacuuagaaguaa240cacaaaccgaucaacagucagcguggcacaccagccacguuuugaucaaacacuucuguu300accccggacugaguaucaauagacugcucacgcgguugaaggagaaaacguucguuaucc360ggccaacuacuucgagaaaccuaguaacgccauggaaguuguggaguguuucgcucagca420cuaccccaguguagaucagguugaugagucaccgcauuccccacgggugaccguggcggu480ggcugcguuggcggccugcccauggggaaacccaugggacgcucuuauacagacauggug540cgaagagucuauugagcuaguugguaguccuccggccccugaaugcggcuaaucccaacu600gcggagcauacacucucaagccagaggguagugugucguaaugggcaacucugcagcgga660accgacuacuuuggguguccguguuucauuuuauuccuauacuggcugcuuauggugaca720auugagagauuguuaccauauagcuauuggauuggccauccggugacuaacagagcuauu780auauaucuuuuuguuggguuuauaccacuuagcuugaaagagguuaaaacucuacauuac840auuuuaauacugaacaccgcaaaauggugucaaagggugaggaauuauucaccggcgugg900ugccuauccuuguggaacuugauggagaugugaacggacacaaauucaguguaucaggag960aaggagaaggagaugcaacauacggaaagcucacucuuaaauuuaucugcacaacaggaa1020agcucccggugccuuggccuacacuugugacaacacuuacauacggagugcaaugcuucu1080cgcguuacccugaucacaugaaacaacacgauuucuucaagagugcaaugccugaaggau1140acgugcaagaaagaacaaucuucuucaaggacgauggaaacuacaagacucgugcagaag1200ugaaauuugaaggagauacacuugugaacagaaucgaacuuaaaggaaucgauuucaagg1260aggauggaaacauccuuggacacaaacuugaauacaacuacaacucacacaacguguaca1320ucauggcagauaaacagaagaaugguaucaaagugaacuuuaagauucgccacaacaucg1380aagauggaucagugcaacuugcagaucacuaccaacagaauacgccgauaggagauggac1440cugugcuucuuccugauaaccacuaccuuucaacacaaucagcacuuucaaaggacccaa1500acgagaagcgagaccacauggugcuucuugaauuugugacagcagcaggaaucacacuug1560gaauggaugaacuuuacaaaugaaaaaaacaaaaaacaaaacggcuauuaugcguuaccg1620gcgagacgcuacggacuua1639<210>26<211>1639<212>rna<213>artificialsequence<400>26aaaauccguugaccuuaaacggucguguggguucaagucccuccacccccacgccggaaa60cgcaauagccgaaaaacaaaaaacaaaaaaaacaaaaaaaaaaccaaaaaaacaaaacac120auuaaaacagccuguggguugaucccacccacagggcccacugggcgcuagcacucuggu180aucacgguaccuuugugcgccuguuuuauacuuccucccccaacugcaacuuagaaguaa240cacaaaccgaucaacagucagcguggcacaccagccacguuuugaucaaacacuucuguu300accccggacugaguaucaauagacugcucacgcgguugaaggagaaaacguucguuaucc360ggccaacuacuucgagaaaccuaguaacgccauggaaguuguggaguguuucgcucagca420cuaccccaguguagaucagguugaugagucaccgcauuccccacgggugaccguggcggu480ggcugcguuggcggccugcccauggggaaacccaugggacgcucuuauacagacauggug540cgaagagucuauugagcuaguugguaguccuccggccccugaaugcggcuaauccuaacu600gcggagcacacacccucaagccagagggcagugugucguaacgggcaacucugcagcgga660accgacuacuuuggguguccguguuucauuuuauuccuauacuggcugcuuauggugaca720auugagagauuguuaccauauagcuauuggauuggccauccggugacuaacagagcuauu780auauaucuuuuuguuggguuuauaccacuuagcuugaaagagguuaaaacucuacauuac840auuuuaauacugaacaccgcaaaauggugucaaagggugaggaauuauucaccggcgugg900ugccuauccuuguggaacuugauggagaugugaacggacacaaauucaguguaucaggag960aaggagaaggagaugcaacauacggaaagcucacucuuaaauuuaucugcacaacaggaa1020agcucccggugccuuggccuacacuugugacaacacuuacauacggagugcaaugcuucu1080cgcguuacccugaucacaugaaacaacacgauuucuucaagagugcaaugccugaaggau1140acgugcaagaaagaacaaucuucuucaaggacgauggaaacuacaagacucgugcagaag1200ugaaauuugaaggagauacacuugugaacagaaucgaacuuaaaggaaucgauuucaagg1260aggauggaaacauccuuggacacaaacuugaauacaacuacaacucacacaacguguaca1320ucauggcagauaaacagaagaaugguaucaaagugaacuuuaagauucgccacaacaucg1380aagauggaucagugcaacuugcagaucacuaccaacagaauacgccgauaggagauggac1440cugugcuucuuccugauaaccacuaccuuucaacacaaucagcacuuucaaaggacccaa1500acgagaagcgagaccacauggugcuucuugaauuugugacagcagcaggaaucacacuug1560gaauggaugaacuuuacaaaugaaaaaaacaaaaaacaaaacggcuauuaugcguuaccg1620gcgagacgcuacggacuua1639<210>27<211>1634<212>rna<213>artificialsequence<400>27aaaauccguugaccuuaaacggucguguggguucaagucccuccacccccacgccggaaa60cgcaauagccgaaaaacaaaaaacaaaaaaaacaaaaaaaaaaccaaaaaaacaaaacac120auuaaaacagccuguggguugaucccacccacagggcccauugggcgcuagcacucuggu180aucacgguacccuugugcgccuguuuuaugucccuucccucaacuguaacuuagaaguaa240cgcacaccgaucaacagucagcguggcacaccagccauguuuugaucaagcacuucuguu300accccggaccgaguaucaacagacugcucacgcgguugaaggagaaaguguucguuaucc360ggccaacuacuucgaaaaaccuaguaacaccauggaaguugcagaguguuucgcucagca420cuaccccaguguagaucaggucgaugagucaccgcaucccccacgggcgaccguggcggu480ggcugcguuggcggccugccuaugggggaacccauaggacgcucuaauacagacauggug540cgaagaguccauugagcuaguugguaguccuccggccccugaaugcggcuaauccuaacu600gcggagcacacaccuucaagccagagggcagugugucguaacgggcaacucugcagcgga660accgacuacuuuggguguccguguuucauuuuauucuuauacuggcugcuuauggugaca720auugagagauuguuaccauauagcuauuggauuggccauccagugacuagcagagcuauu780auauaccucuuuguuggguuuauaccaccuaauuugaaagaaguuaaaacauuagaauuc840auuauuaaauugaauacaauggugucaaagggugaggaauuauucaccggcguggugccu900auccuuguggaacuugauggagaugugaacggacacaaauucaguguaucaggagaagga960gaaggagaugcaacauacggaaagcucacucuuaaauuuaucugcacaacaggaaagcuc1020ccggugccuuggccuacacuugugacaacacuuacauacggagugcaaugcuucucgcgu1080uacccugaucacaugaaacaacacgauuucuucaagagugcaaugccugaaggauacgug1140caagaaagaacaaucuucuucaaggacgauggaaacuacaagacucgugcagaagugaaa1200uuugaaggagauacacuugugaacagaaucgaacuuaaaggaaucgauuucaaggaggau1260ggaaacauccuuggacacaaacuugaauacaacuacaacucacacaacguguacaucaug1320gcagauaaacagaagaaugguaucaaagugaacuuuaagauucgccacaacaucgaagau1380ggaucagugcaacuugcagaucacuaccaacagaauacgccgauaggagauggaccugug1440cuucuuccugauaaccacuaccuuucaacacaaucagcacuuucaaaggacccaaacgag1500aagcgagaccacauggugcuucuugaauuugugacagcagcaggaaucacacuuggaaug1560gaugaacuuuacaaaugaaaaaaacaaaaaacaaaacggcuauuaugcguuaccggcgag1620acgcuacggacuua1634<210>28<211>1634<212>rna<213>artificialsequence<400>28aaaauccguugaccuuaaacggucguguggguucaagucccuccacccccacgccggaaa60cgcaauagccgaaaaacaaaaaacaaaaaaaacaaaaaaaaaaccaaaaaaacaaaacac120auuaaaacagccuguggguugaucccacccacagggcccauugggcgcuagcacucuggu180aucacgguacccuugugcgccuguuuuaugucccuucccucaacuguaacuuagaaguaa240cgcacaccgaucaacagucagcguggcacaccagccauguuuugaucaagcacuucuguu300accccggaccgaguaucaacagacugcucacgcgguugaaggagaaaguguucguuaucc360ggccaacuacuucgaaaaaccuaguaacaccauggaaguugcagaguguuucgcucagca420cuaccccaguguagaucaggucgaugagucaccgcaucccccacgggcgaccguggcggu480ggcugcguuggcggccugccuaugggggaacccauaggacgcucuaauacagacauggug540cgaagaguccauugagcuaguugguaguccuccggccccugaaugcggcuaauccuaacu600gcggagcacacacccucaagccagagggcagugugucguaacgggcaacucugcagcgga660accgacuacuuuggguguccguguuucauuuuauucuuauacuggcugcuuauggugaca720auugagagauuguuaccauauagcuauuggauuggccauccagugacuagcagagcuauu780auauaccucuuuguuggguuuauaccaccuaauuugaaagaaguuaaaacauuagaauuc840auuauuaaauugaauacaauggugucaaagggugaggaauuauucaccggcguggugccu900auccuuguggaacuugauggagaugugaacggacacaaauucaguguaucaggagaagga960gaaggagaugcaacauacggaaagcucacucuuaaauuuaucugcacaacaggaaagcuc1020ccggugccuuggccuacacuugugacaacacuuacauacggagugcaaugcuucucgcgu1080uacccugaucacaugaaacaacacgauuucuucaagagugcaaugccugaaggauacgug1140caagaaagaacaaucuucuucaaggacgauggaaacuacaagacucgugcagaagugaaa1200uuugaaggagauacacuugugaacagaaucgaacuuaaaggaaucgauuucaaggaggau1260ggaaacauccuuggacacaaacuugaauacaacuacaacucacacaacguguacaucaug1320gcagauaaacagaagaaugguaucaaagugaacuuuaagauucgccacaacaucgaagau1380ggaucagugcaacuugcagaucacuaccaacagaauacgccgauaggagauggaccugug1440cuucuuccugauaaccacuaccuuucaacacaaucagcacuuucaaaggacccaaacgag1500aagcgagaccacauggugcuucuugaauuugugacagcagcaggaaucacacuuggaaug1560gaugaacuuuacaaaugaaaaaaacaaaaaacaaaacggcuauuaugcguuaccggcgag1620acgcuacggacuua1634<210>29<211>1645<212>rna<213>artificialsequence<400>29aaaauccguugaccuuaaacggucguguggguucaagucccuccacccccacgccggaaa60cgcaauagccgaaaaaacaaaaacaaaaaaaacaaaaaaacaaaaaaaaaaccaaaacac120auuaaaacagccuguggguugaucccacccacagggcccacugggcgcuagcacucuggu180aucacgguaccuuugugcgccuguuuuauacuuccucccccaacugcaacuuagaaguaa240cacaaaccgaucaacagucagcguggcacaccagccacguuuugaucaaacacuucuguu300accccggacugaguaucaauagacugcucacgcgguugaaggagaaaacguucguuaucc360ggccaacuacuucgagaaaccuaguaacgccauggaaguuguggaguguuucgcucagca420cuaccccaguguagaucagguugaugagucaccgcauuccccacgggugaccguggcggu480ggcugcguuggcggccugcccauggggaaacccaugggacgcucuuauacagacauggug540cgaagagucuauugagcuaguugguaguccuccggccccugaaugcggcuaaucccaacu600gcggagcauacacucucaagccagaggguagugugucguaaugggcaacucugcagcgga660accgacuacuuuggguguccguguuucauuuuauuccuauacuggcugcuuauggugaca720auugagagauuguuaccauauagcuauuggauuggccauccggugacuaacagagcuauu780auauaucuuuuuguuggguuuauaccacuuagcuugaaagagguuaaaacucuacauuac840auuuuaauacugaacaccgcaaaauggugucaaagggugaggaauuauucaccggcgugg900ugccuauccuuguggaacuugauggagaugugaacggacacaaauucaguguaucaggag960aaggagaaggagaugcaacauacggaaagcucacucuuaaauuuaucugcacaacaggaa1020agcucccggugccuuggccuacacuugugacaacacuuacauacggagugcaaugcuucu1080cgcguuacccugaucacaugaaacaacacgauuucuucaagagugcaaugccugaaggau1140acgugcaagaaagaacaaucuucuucaaggacgauggaaacuacaagacucgugcagaag1200ugaaauuugaaggagauacacuugugaacagaaucgaacuuaaaggaaucgauuucaagg1260aggauggaaacauccuuggacacaaacuugaauacaacuacaacucacacaacguguaca1320ucauggcagauaaacagaagaaugguaucaaagugaacuuuaagauucgccacaacaucg1380aagauggaucagugcaacuugcagaucacuaccaacagaauacgccgauaggagauggac1440cugugcuucuuccugauaaccacuaccuuucaacacaaucagcacuuucaaaggacccaa1500acgagaagcgagaccacauggugcuucuugaauuugugacagcagcaggaaucacacuug1560gaauggaugaacuuuacaaaugaaaaaaaacaaaaaaacaaaacaaacggcuauuaugcg1620uuaccggcgagacgcuacggacuua1645<210>30<211>1642<212>rna<213>artificialsequence<400>30aaaauccguugaccuuaaacggucguguggguucaagucccuccacccccacgccggaaa60cgcaauagccgaaaaacaaaaaacaaaaaaaaaaccaaaaaaacaaaaaaaacaaaacac120auuaaaacagccuguggguugaucccacccacagggcccacugggcgcuagcacucuggu180aucacgguaccuuugugcgccuguuuuauacuuccucccccaacugcaacuuagaaguaa240cacaaaccgaucaacagucagcguggcacaccagccacguuuugaucaaacacuucuguu300accccggacugaguaucaauagacugcucacgcgguugaaggagaaaacguucguuaucc360ggccaacuacuucgagaaaccuaguaacgccauggaaguuguggaguguuucgcucagca420cuaccccaguguagaucagguugaugagucaccgcauuccccacgggugaccguggcggu480ggcugcguuggcggccugcccauggggaaacccaugggacgcucuuauacagacauggug540cgaagagucuauugagcuaguugguaguccuccggccccugaaugcggcuaaucccaacu600gcggagcauacacucucaagccagaggguagugugucguaaugggcaacucugcagcgga660accgacuacuuuggguguccguguuucauuuuauuccuauacuggcugcuuauggugaca720auugagagauuguuaccauauagcuauuggauuggccauccggugacuaacagagcuauu780auauaucuuuuuguuggguuuauaccacuuagcuugaaagagguuaaaacucuacauuac840auuuuaauacugaacaccgcaaaauggugucaaagggugaggaauuauucaccggcgugg900ugccuauccuuguggaacuugauggagaugugaacggacacaaauucaguguaucaggag960aaggagaaggagaugcaacauacggaaagcucacucuuaaauuuaucugcacaacaggaa1020agcucccggugccuuggccuacacuugugacaacacuuacauacggagugcaaugcuucu1080cgcguuacccugaucacaugaaacaacacgauuucuucaagagugcaaugccugaaggau1140acgugcaagaaagaacaaucuucuucaaggacgauggaaacuacaagacucgugcagaag1200ugaaauuugaaggagauacacuugugaacagaaucgaacuuaaaggaaucgauuucaagg1260aggauggaaacauccuuggacacaaacuugaauacaacuacaacucacacaacguguaca1320ucauggcagauaaacagaagaaugguaucaaagugaacuuuaagauucgccacaacaucg1380aagauggaucagugcaacuugcagaucacuaccaacagaauacgccgauaggagauggac1440cugugcuucuuccugauaaccacuaccuuucaacacaaucagcacuuucaaaggacccaa1500acgagaagcgagaccacauggugcuucuugaauuugugacagcagcaggaaucacacuug1560gaauggaugaacuuuacaaaugaaaaaacaaaaaacaaaacaaacggcuauuaugcguua1620ccggcgagacgcuacggacuua1642<210>31<211>822<212>dna<213>artificialsequence<400>31atgtttgtgttcctggtgctgctgcctctggtgtctagggtgcagcctacagagagcatt60gtgaggttccctaacatcaccaacctgtgcccttttggagaggtgttcaatgccacaagg120tttgcctctgtgtatgcctggaataggaagaggatcagcaactgtgtggctgactactct180gtgctgtacaactctgctagcttcagcaccttcaagtgctatggagtgagccctaccaag240ctgaatgacctgtgcttcaccaatgtgtatgctgacagctttgtgattaggggagatgag300gtgaggcagattgcccctggacagactggcaagattgctgactacaactacaagctgcct360gatgacttcactggctgtgtgattgcctggaacagcaacaacctggacagcaaggtggga420ggcaactacaactacctgtataggctgtttaggaagagcaacctgaagccttttgagagg480gacatcagcacagagatctaccaagctggcagcaccccttgcaatggagtggagggcttc540aactgctacttccctctgcagagctatggctttcagcctaccaatggagtgggctatcag600ccttatagggtggtggtgctgagctttgagctgctgcatgcccctgccacagtgtgtggc660cctaagaagagcaccaacctggtgaagaacaagtgtgtgaacttcagctctggcctggtg720cctaccggctctggctctggctacatccctgaggcccctagggatggccaagcctatgtg780aggaaggatggagagtgggtgctgctgagcaccttcctgtga822<210>32<211>273<212>prt<213>artificialsequence<400>32metphevalpheleuvalleuleuproleuvalserargvalglnpro151015thrgluserilevalargpheproasnilethrasnleucysprophe202530glygluvalpheasnalathrargphealaservaltyralatrpasn354045arglysargileserasncysvalalaasptyrservalleutyrasn505560seralaserpheserthrphelyscystyrglyvalserprothrlys65707580leuasnaspleucysphethrasnvaltyralaaspserphevalile859095argglyaspgluvalargglnilealaproglyglnthrglylysile100105110alaasptyrasntyrlysleuproaspaspphethrglycysvalile115120125alatrpasnserasnasnleuaspserlysvalglyglyasntyrasn130135140tyrleutyrargleuphearglysserasnleulysprophegluarg145150155160aspileserthrgluiletyrglnalaglyserthrprocysasngly165170175valgluglypheasncystyrpheproleuglnsertyrglyphegln180185190prothrasnglyvalglytyrglnprotyrargvalvalvalleuser195200205phegluleuleuhisalaproalathrvalcysglyprolyslysser210215220thrasnleuvallysasnlyscysvalasnpheserserglyleuval225230235240prothrglyserglyserglytyrileproglualaproargaspgly245250255glnalatyrvalarglysaspglyglutrpvalleuleuserthrphe260265270leu<210>33<211>1747<212>rna<213>artificialsequence<400>33aaaauccguugaccuuaaacggucguguggguucaagucccuccacccccacgccggaaa60cgcaauagccgaaaaaacaaaaacaaaaaaaacaaaaaaacaaaaaaaaaaccaaaacac120auuaaaacagccuguggguugaucccacccacagggcccacugggcgcuagcacucuggu180aucacgguaccuuugugcgccuguuuuauacuuccucccccaacugcaacuuagaaguaa240cacaaaccgaucaacagucagcguggcacaccagccacguuuugaucaaacacuucuguu300accccggacugaguaucaauagacugcucacgcgguugaaggagaaaacguucguuaucc360ggccaacuacuucgagaaaccuaguaacgccauggaaguuguggaguguuucgcucagca420cuaccccaguguagaucagguugaugagucaccgcauuccccacgggugaccguggcggu480ggcugcguuggcggccugcccauggggaaacccaugggacgcucuuauacagacauggug540cgaagagucuauugagcuaguugguaguccuccggccccugaaugcggcuaaucccaacu600gcggagcauacacucucaagccagaggguagugugucguaaugggcaacucugcagcgga660accgacuacuuuggguguccguguuucauuuuauuccuauacuggcugcuuauggugaca720auugagagauuguuaccauauagcuauuggauuggccauccggugacuaacagagcuauu780auauaucuuuuuguuggguuuauaccacuuagcuugaaagagguuaaaacucuacauuac840auuuuaauacugaacaccgcaaaauguuuguguuccuggugcugcugccucuggugucua900gggugcagccuacagagagcauugugagguucccuaacaucaccaaccugugcccuuuug960gagagguguucaaugccacaagguuugccucuguguaugccuggaauaggaagaggauca1020gcaacuguguggcugacuacucugugcuguacaacucugcuagcuucagcaccuucaagu1080gcuauggagugagcccuaccaagcugaaugaccugugcuucaccaauguguaugcugaca1140gcuuugugauuaggggagaugaggugaggcagauugccccuggacagacuggcaagauug1200cugacuacaacuacaagcugccugaugacuucacuggcugugugauugccuggaacagca1260acaaccuggacagcaaggugggaggcaacuacaacuaccuguauaggcuguuuaggaaga1320gcaaccugaagccuuuugagagggacaucagcacagagaucuaccaagcuggcagcaccc1380cuugcaauggaguggagggcuucaacugcuacuucccucugcagagcuauggcuuucagc1440cuaccaauggagugggcuaucagccuuauagggugguggugcugagcuuugagcugcugc1500augccccugccacaguguguggcccuaagaagagcaccaaccuggugaagaacaagugug1560ugaacuucagcucuggccuggugccuaccggcucuggcucuggcuacaucccugaggccc1620cuagggauggccaagccuaugugaggaaggauggagagugggugcugcugagcaccuucc1680ugugaaaaaaaacaaaaaaacaaaacaaacggcuauuaugcguuaccggcgagacgcuac1740ggacuua1747<210>34<211>579<212>dna<213>artificialsequence<400>34atgggcgtgcacgagtgccccgcctggctgtggctgctgctgagcctgctgagcctgccc60ctgggcctgcccgtgctgggcgccccccccaggctgatctgcgacagcagggtgctggag120aggtacctgctggaggccaaggaggccgagaacatcaccaccggctgcgccgagcactgc180agcctgaacgagaacatcaccgtgcccgacaccaaggtgaacttctacgcctggaagagg240atggaggtgggccagcaggccgtggaggtgtggcagggcctggccctgctgagcgaggcc300gtgctgaggggccaggccctgctggtgaacagcagccagccctgggagcccctgcagctg360cacgtggacaaggccgtgagcggcctgaggagcctgaccaccctgctgagggccctgggc420gcccagaaggaggccatcagcccccccgacgccgccagcgccgcccccctgaggaccatc480accgccgacaccttcaggaagctgttcagggtgtacagcaacttcctgaggggcaagctg540aagctgtacaccggcgaggcctgcaggaccggcgacagg579<210>35<211>193<212>prt<213>artificialsequence<400>35metglyvalhisglucysproalatrpleutrpleuleuleuserleu151015leuserleuproleuglyleuprovalleuglyalaproproargleu202530ilecysaspserargvalleugluargtyrleuleuglualalysglu354045alagluasnilethrthrglycysalagluhiscysserleuasnglu505560asnilethrvalproaspthrlysvalasnphetyralatrplysarg65707580metgluvalglyglnglnalavalgluvaltrpglnglyleualaleu859095leuserglualavalleuargglyglnalaleuleuvalasnserser100105110glnprotrpgluproleuglnleuhisvalasplysalavalsergly115120125leuargserleuthrthrleuleuargalaleuglyalaglnlysglu130135140alaileserproproaspalaalaseralaalaproleuargthrile145150155160thralaaspthrphearglysleupheargvaltyrserasnpheleu165170175argglylysleulysleutyrthrglyglualacysargthrglyasp180185190arg<210>36<211>1502<212>rna<213>artificialsequence<400>36aaaauccguugaccuuaaacggucguguggguucaagucccuccacccccacgccggaaa60cgcaauagccgaaaaacaaaaaacaaaaaaaacaaaaaaaaaaccaaaaaaacaaaacac120auuaaaacagccuguggguugaucccacccacagggcccauugggcgcuagcacucuggu180aucacgguacccuugugcgccuguuuuaugucccuucccucaacuguaacuuagaaguaa240cgcacaccgaucaacagucagcguggcacaccagccauguuuugaucaagcacuucuguu300accccggaccgaguaucaacagacugcucacgcgguugaaggagaaaguguucguuaucc360ggccaacuacuucgaaaaaccuaguaacaccauggaaguugcagaguguuucgcucagca420cuaccccaguguagaucaggucgaugagucaccgcaucccccacgggcgaccguggcggu480ggcugcguuggcggccugccuaugggggaacccauaggacgcucuaauacagacauggug540cgaagaguccauugagcuaguugguaguccuccggccccugaaugcggcuaauccuaacu600gcggagcacacaccuucaagccagagggcagugugucguaacgggcaacucugcagcgga660accgacuacuuuggguguccguguuucauuuuauucuuauacuggcugcuuauggugaca720auugagagauuguuaccauauagcuauuggauuggccauccagugacuagcagagcuauu780auauaccucuuuguuggguuuauaccaccuaauuugaaagaaguuaaaacauuagaauuc840auuauuaaauugaauacaaugggcgugcacgagugccccgccuggcuguggcugcugcug900agccugcugagccugccccugggccugcccgugcugggcgccccccccaggcugaucugc960gacagcagggugcuggagagguaccugcuggaggccaaggaggccgagaacaucaccacc1020ggcugcgccgagcacugcagccugaacgagaacaucaccgugcccgacaccaaggugaac1080uucuacgccuggaagaggauggaggugggccagcaggccguggagguguggcagggccug1140gcccugcugagcgaggccgugcugaggggccaggcccugcuggugaacagcagccagccc1200ugggagccccugcagcugcacguggacaaggccgugagcggccugaggagccugaccacc1260cugcugagggcccugggcgcccagaaggaggccaucagcccccccgacgccgccagcgcc1320gccccccugaggaccaucaccgccgacaccuucaggaagcuguucaggguguacagcaac1380uuccugaggggcaagcugaagcuguacaccggcgaggccugcaggaccggcgacagguga1440aaaaaaacaaaaaaacaaaacaaacggcuauuaugcguuaccggcgagacgcuacggacu1500ua1502<210>37<211>648<212>dna<213>artificialsequence<400>37atggagatcgtgctgacccagagccccgccaccctgagcctgagccccggcgagagggcc60accctgagctgcagggccagccagagcgtgagcagctacctggcctggtaccagcagaag120cccggccaggcccccaggctgctgatctacgacgccagcaacagggccaccggcatcccc180gccaggttcagcggcagcggcagcggcaccgacttcaccctgaccatcagcagcctggag240cccgaggacttcgccgtgtactactgccagcagagcagcaactggcccaggaccttcggc300cagggcaccaaggtggagatcaagaggaccgtggccgcccccagcgtgttcatcttcccc360cccagcgacgagcagctgaagagcggcaccgccagcgtggtgtgcctgctgaacaacttc420taccccagggaggccaaggtgcagtggaaggtggacaacgccctgcagagcggcaacagc480caggagagcgtgaccgagcaggacagcaaggacagcacctacagcctgagcagcaccctg540accctgagcaaggccgactacgagaagcacaaggtgtacgcctgcgaggtgacccaccag600ggcctgagcagccccgtgaccaagagcttcaacaggggcgagtgctga648<210>38<211>215<212>prt<213>artificialsequence<400>38metgluilevalleuthrglnserproalathrleuserleuserpro151015glygluargalathrleusercysargalaserglnservalserser202530tyrleualatrptyrglnglnlysproglyglnalaproargleuleu354045iletyraspalaserasnargalathrglyileproalaargpheser505560glyserglyserglythraspphethrleuthrileserserleuglu65707580progluaspphealavaltyrtyrcysglnglnserserasntrppro859095argthrpheglyglnglythrlysvalgluilelysargthrvalala100105110alaproservalpheilepheproproseraspgluglnleulysser115120125glythralaservalvalcysleuleuasnasnphetyrproargglu130135140alalysvalglntrplysvalaspasnalaleuglnserglyasnser145150155160glngluservalthrgluglnaspserlysaspserthrtyrserleu165170175serserthrleuthrleuserlysalaasptyrglulyshislysval180185190tyralacysgluvalthrhisglnglyleuserserprovalthrlys195200205serpheasnargglyglucys210215<210>39<211>1573<212>rna<213>artificialsequence<400>39aaaauccguugaccuuaaacggucguguggguucaagucccuccacccccacgccggaaa60cgcaauagccgaaaaaacaaaaacaaaaaaaacaaaaaaacaaaaaaaaaaccaaaacac120auuaaaacagccuguggguugaucccacccacagggcccacugggcgcuagcacucuggu180aucacgguaccuuugugcgccuguuuuauacuuccucccccaacugcaacuuagaaguaa240cacaaaccgaucaacagucagcguggcacaccagccacguuuugaucaaacacuucuguu300accccggacugaguaucaauagacugcucacgcgguugaaggagaaaacguucguuaucc360ggccaacuacuucgagaaaccuaguaacgccauggaaguuguggaguguuucgcucagca420cuaccccaguguagaucagguugaugagucaccgcauuccccacgggugaccguggcggu480ggcugcguuggcggccugcccauggggaaacccaugggacgcucuuauacagacauggug540cgaagagucuauugagcuaguugguaguccuccggccccugaaugcggcuaaucccaacu600gcggagcauacacucucaagccagaggguagugugucguaaugggcaacucugcagcgga660accgacuacuuuggguguccguguuucauuuuauuccuauacuggcugcuuauggugaca720auugagagauuguuaccauauagcuauuggauuggccauccggugacuaacagagcuauu780auauaucuuuuuguuggguuuauaccacuuagcuugaaagagguuaaaacucuacauuac840auuuuaauacugaacaccgcaaaauggagaucgugcugacccagagccccgccacccuga900gccugagccccggcgagagggccacccugagcugcagggccagccagagcgugagcagcu960accuggccugguaccagcagaagcccggccaggcccccaggcugcugaucuacgacgcca1020gcaacagggccaccggcauccccgccagguucagcggcagcggcagcggcaccgacuuca1080cccugaccaucagcagccuggagcccgaggacuucgccguguacuacugccagcagagca1140gcaacuggcccaggaccuucggccagggcaccaagguggagaucaagaggaccguggccg1200cccccagcguguucaucuucccccccagcgacgagcagcugaagagcggcaccgccagcg1260uggugugccugcugaacaacuucuaccccagggaggccaaggugcaguggaagguggaca1320acgcccugcagagcggcaacagccaggagagcgugaccgagcaggacagcaaggacagca1380ccuacagccugagcagcacccugacccugagcaaggccgacuacgagaagcacaaggugu1440acgccugcgaggugacccaccagggccugagcagccccgugaccaagagcuucaacaggg1500gcgagugcugaaaaaaaacaaaaaaacaaaacaaacggcuauuaugcguuaccggcgaga1560cgcuacggacuua1573<210>40<211>1326<212>dna<213>artificialsequence<400>40atgcaggtgcagctggtggagagcggcggcggcgtggtgcagcccggcaggagcctgagg60ctggactgcaaggccagcggcatcaccttcagcaacagcggcatgcactgggtgaggcag120gcccccggcaagggcctggagtgggtggccgtgatctggtacgacggcagcaagaggtac180tacgccgacagcgtgaagggcaggttcaccatcagcagggacaacagcaagaacaccctg240ttcctgcagatgaacagcctgagggccgaggacaccgccgtgtactactgcgccaccaac300gacgactactggggccagggcaccctggtgaccgtgagcagcgccagcaccaagggcccc360agcgtgttccccctggccccctgcagcaggagcaccagcgagagcaccgccgccctgggc420tgcctggtgaaggactacttccccgagcccgtgaccgtgagctggaacagcggcgccctg480accagcggcgtgcacaccttccccgccgtgctgcagagcagcggcctgtacagcctgagc540agcgtggtgaccgtgcccagcagcagcctgggcaccaagacctacacctgcaacgtggac600cacaagcccagcaacaccaaggtggacaagagggtggagagcaagtacggccccccctgc660cccccctgccccgcccccgagttcctgggcggccccagcgtgttcctgttcccccccaag720cccaaggacaccctgatgatcagcaggacccccgaggtgacctgcgtggtggtggacgtg780agccaggaggaccccgaggtgcagttcaactggtacgtggacggcgtggaggtgcacaac840gccaagaccaagcccagggaggagcagttcaacagcacctacagggtggtgagcgtgctg900accgtgctgcaccaggactggctgaacggcaaggagtacaagtgcaaggtgagcaacaag960ggcctgcccagcagcatcgagaagaccatcagcaaggccaagggccagcccagggagccc1020caggtgtacaccctgccccccagccaggaggagatgaccaagaaccaggtgagcctgacc1080tgcctggtgaagggcttctaccccagcgacatcgccgtggagtgggagagcaacggccag1140cccgagaacaactacaagaccaccccccccgtgctggacagcgacggcagcttcttcctg1200tacagcaggctgaccgtggacaagagcaggtggcaggagggcaacgtgttcagctgcagc1260gtgatgcacgaggccctgcacaaccactacacccagaagagcctgagcctgagcctgggc1320aagtga1326<210>41<211>440<212>prt<213>artificialsequence<400>41glnvalglnleuvalgluserglyglyglyvalvalglnproglyarg151015serleuargleuaspcyslysalaserglyilethrpheserasnser202530glymethistrpvalargglnalaproglylysglyleuglutrpval354045alavaliletrptyraspglyserlysargtyrtyralaaspserval505560lysglyargphethrileserargaspasnserlysasnthrleuphe65707580leuglnmetasnserleuargalagluaspthralavaltyrtyrcys859095alathrasnaspasptyrtrpglyglnglythrleuvalthrvalser100105110seralaserthrlysglyproservalpheproleualaprocysser115120125argserthrsergluserthralaalaleuglycysleuvallysasp130135140tyrpheprogluprovalthrvalsertrpasnserglyalaleuthr145150155160serglyvalhisthrpheproalavalleuglnserserglyleutyr165170175serleuserservalvalthrvalproserserserleuglythrlys180185190thrtyrthrcysasnvalasphislysproserasnthrlysvalasp195200205lysargvalgluserlystyrglyproprocysproprocysproala210215220proglupheleuglyglyproservalpheleupheproprolyspro225230235240lysaspthrleumetileserargthrprogluvalthrcysvalval245250255valaspvalserglngluaspprogluvalglnpheasntrptyrval260265270aspglyvalgluvalhisasnalalysthrlysproarggluglugln275280285pheasnserthrtyrargvalvalservalleuthrvalleuhisgln290295300asptrpleuasnglylysglutyrlyscyslysvalserasnlysgly305310315320leuproserserileglulysthrileserlysalalysglyglnpro325330335arggluproglnvaltyrthrleuproproserglngluglumetthr340345350lysasnglnvalserleuthrcysleuvallysglyphetyrproser355360365aspilealavalglutrpgluserasnglyglnprogluasnasntyr370375380lysthrthrproprovalleuaspseraspglyserphepheleutyr385390395400serargleuthrvalasplysserargtrpglngluglyasnvalphe405410415sercysservalmethisglualaleuhisasnhistyrthrglnlys420425430serleuserleuserleuglylys435440<210>42<211>2251<212>rna<213>artificialsequence<400>42aaaauccguugaccuuaaacggucguguggguucaagucccuccacccccacgccggaaa60cgcaauagccgaaaaaacaaaaacaaaaaaaacaaaaaaacaaaaaaaaaaccaaaacac120auuaaaacagccuguggguugaucccacccacagggcccacugggcgcuagcacucuggu180aucacgguaccuuugugcgccuguuuuauacuuccucccccaacugcaacuuagaaguaa240cacaaaccgaucaacagucagcguggcacaccagccacguuuugaucaaacacuucuguu300accccggacugaguaucaauagacugcucacgcgguugaaggagaaaacguucguuaucc360ggccaacuacuucgagaaaccuaguaacgccauggaaguuguggaguguuucgcucagca420cuaccccaguguagaucagguugaugagucaccgcauuccccacgggugaccguggcggu480ggcugcguuggcggccugcccauggggaaacccaugggacgcucuuauacagacauggug540cgaagagucuauugagcuaguugguaguccuccggccccugaaugcggcuaaucccaacu600gcggagcauacacucucaagccagaggguagugugucguaaugggcaacucugcagcgga660accgacuacuuuggguguccguguuucauuuuauuccuauacuggcugcuuauggugaca720auugagagauuguuaccauauagcuauuggauuggccauccggugacuaacagagcuauu780auauaucuuuuuguuggguuuauaccacuuagcuugaaagagguuaaaacucuacauuac840auuuuaauacugaacaccgcaaaaugcaggugcagcugguggagagcggcggcggcgugg900ugcagcccggcaggagccugaggcuggacugcaaggccagcggcaucaccuucagcaaca960gcggcaugcacugggugaggcaggcccccggcaagggccuggaguggguggccgugaucu1020gguacgacggcagcaagagguacuacgccgacagcgugaagggcagguucaccaucagca1080gggacaacagcaagaacacccuguuccugcagaugaacagccugagggccgaggacaccg1140ccguguacuacugcgccaccaacgacgacuacuggggccagggcacccuggugaccguga1200gcagcgccagcaccaagggccccagcguguucccccuggcccccugcagcaggagcacca1260gcgagagcaccgccgcccugggcugccuggugaaggacuacuuccccgagcccgugaccg1320ugagcuggaacagcggcgcccugaccagcggcgugcacaccuuccccgccgugcugcaga1380gcagcggccuguacagccugagcagcguggugaccgugcccagcagcagccugggcacca1440agaccuacaccugcaacguggaccacaagcccagcaacaccaagguggacaagagggugg1500agagcaaguacggcccccccugcccccccugccccgcccccgaguuccugggcggcccca1560gcguguuccuguucccccccaagcccaaggacacccugaugaucagcaggacccccgagg1620ugaccugcguggugguggacgugagccaggaggaccccgaggugcaguucaacugguacg1680uggacggcguggaggugcacaacgccaagaccaagcccagggaggagcaguucaacagca1740ccuacaggguggugagcgugcugaccgugcugcaccaggacuggcugaacggcaaggagu1800acaagugcaaggugagcaacaagggccugcccagcagcaucgagaagaccaucagcaagg1860ccaagggccagcccagggagccccagguguacacccugccccccagccaggaggagauga1920ccaagaaccaggugagccugaccugccuggugaagggcuucuaccccagcgacaucgccg1980uggagugggagagcaacggccagcccgagaacaacuacaagaccaccccccccgugcugg2040acagcgacggcagcuucuuccuguacagcaggcugaccguggacaagagcagguggcagg2100agggcaacguguucagcugcagcgugaugcacgaggcccugcacaaccacuacacccaga2160agagccugagccugagccugggcaagugaaaaaaaacaaaaaaacaaaacaaacggcuau2220uaugcguuaccggcgagacgcuacggacuua2251<210>43<211>489<212>dna<213>artificialsequence<400>43atgaggatcagcaagccccacctgaggagcatcagcatccagtgctacctgtgcctgctg60ctgaacagccacttcctgaccgaggccggcatccacgtgttcatcctgggctgcttcagc120gccggcctgcccaagaccgaggccaactgggtgaacgtgatcagcgacctgaagaagatc180gaggacctgatccagagcatgcacatcgacgccaccctgtacaccgagagcgacgtgcac240cccagctgcaaggtgaccgccatgaagtgcttcctgctggagctgcaggtgatcagcctg300gagagcggcgacgccagcatccacgacaccgtggagaacctgatcatcctggccaacaac360agcctgagcagcaacggcaacgtgaccgagagcggctgcaaggagtgcgaggagctggag420gagaagaacatcaaggagttcctgcagagcttcgtgcacatcgtgcagatgttcatcaac480accagctga489<210>44<211>162<212>prt<213>artificialsequence<400>44metargileserlysprohisleuargserileserileglncystyr151015leucysleuleuleuasnserhispheleuthrglualaglyilehis202530valpheileleuglycyspheseralaglyleuprolysthrgluala354045asntrpvalasnvalileseraspleulyslysilegluaspleuile505560glnsermethisileaspalathrleutyrthrgluseraspvalhis65707580prosercyslysvalthralametlyscyspheleuleugluleugln859095valileserleugluserglyaspalaserilehisaspthrvalglu100105110asnleuileileleualaasnasnserleuserserasnglyasnval115120125thrgluserglycyslysglucysglugluleugluglulysasnile130135140lysglupheleuglnserphevalhisilevalglnmetpheileasn145150155160thrser<210>45<211>1414<212>rna<213>artificialsequence<400>45aaaauccguugaccuuaaacggucguguggguucaagucccuccacccccacgccggaaa60cgcaauagccgaaaaaacaaaaacaaaaaaaacaaaaaaacaaaaaaaaaaccaaaacac120auuaaaacagccuguggguugaucccacccacagggcccacugggcgcuagcacucuggu180aucacgguaccuuugugcgccuguuuuauacuuccucccccaacugcaacuuagaaguaa240cacaaaccgaucaacagucagcguggcacaccagccacguuuugaucaaacacuucuguu300accccggacugaguaucaauagacugcucacgcgguugaaggagaaaacguucguuaucc360ggccaacuacuucgagaaaccuaguaacgccauggaaguuguggaguguuucgcucagca420cuaccccaguguagaucagguugaugagucaccgcauuccccacgggugaccguggcggu480ggcugcguuggcggccugcccauggggaaacccaugggacgcucuuauacagacauggug540cgaagagucuauugagcuaguugguaguccuccggccccugaaugcggcuaaucccaacu600gcggagcauacacucucaagccagaggguagugugucguaaugggcaacucugcagcgga660accgacuacuuuggguguccguguuucauuuuauuccuauacuggcugcuuauggugaca720auugagagauuguuaccauauagcuauuggauuggccauccggugacuaacagagcuauu780auauaucuuuuuguuggguuuauaccacuuagcuugaaagagguuaaaacucuacauuac840auuuuaauacugaacaccgcaaaaugaggaucagcaagccccaccugaggagcaucagca900uccagugcuaccugugccugcugcugaacagccacuuccugaccgaggccggcauccacg960uguucauccugggcugcuucagcgccggccugcccaagaccgaggccaacugggugaacg1020ugaucagcgaccugaagaagaucgaggaccugauccagagcaugcacaucgacgccaccc1080uguacaccgagagcgacgugcaccccagcugcaaggugaccgccaugaagugcuuccugc1140uggagcugcaggugaucagccuggagagcggcgacgccagcauccacgacaccguggaga1200accugaucauccuggccaacaacagccugagcagcaacggcaacgugaccgagagcggcu1260gcaaggagugcgaggagcuggaggagaagaacaucaaggaguuccugcagagcuucgugc1320acaucgugcagauguucaucaacaccagcugaaaaaaaacaaaaaaacaaaacaaacggc1380uauuaugcguuaccggcgagacgcuacggacuua1414<210>46<211>1161<212>dna<213>artificialsequence<400>46atgagggccgcccctctgctgctggctagggccgctagcctgagcctgggcttcctgttc60ctgctgttcttctggctggataggagcgtgctggccaaggagctgaagttcgtgaccctg120gtgtttaggcacggcgataggagccctatcgacaccttccctaccgaccctatcaaggag180agcagctggcctcaaggcttcggacagctgacacagctgggcatggagcagcactacgag240ctgggcgagtacattaggaagaggtataggaagttcctgaacgagagctacaagcacgag300caagtgtacattaggagcaccgacgtggataggaccctgatgagcgccatgaccaacctg360gccgccctgttccctcctgagggcgtgagcatctggaaccctatcctgctgtggcagcct420atccctgtgcacaccgtgcctctgagcgaggatcagctgctgtacctgccttttaggaac480tgccctaggttccaagagctggagagcgagaccctgaagagcgaggagtttcagaagagg540ctgcacccttacaaggacttcatcgccaccctgggcaagctctccggcctgcacggccaa600gacctgttcggcatctggagcaaggtgtacgaccctctgtactgcgagagcgtgcacaac660ttcaccctgcctagctgggccaccgaggacaccatgaccaagctgagggagctgagcgag720ctgagcctgctgagcctgtacggcatccacaagcagaaggagaagtctaggctgcaaggc780ggcgtgctggtgaacgagatcctgaaccacatgaagagggccacacagatccctagctac840aagaagctgatcatgtacagcgcccacgacaccaccgtcagcggcctgcagatggccctg900gacgtgtacaacggcctgctgcctccttacgctagctgccacctgaccgagctgtacttc960gagaagggcgagtacttcgtggagatgtactataggaacgagacacagcacgagccttac1020cctctgatgctgcctggctgcagccctagctgccctctggagaggttcgccgagctggtg1080ggccctgtgatccctcaagactggagcaccgagtgcatgaccaccaacagccaccaaggc1140accgaggacagcaccgactga1161<210>47<211>386<212>prt<213>artificialsequence<400>47metargalaalaproleuleuleualaargalaalaserleuserleu151015glypheleupheleuleuphephetrpleuaspargservalleuala202530lysgluleulysphevalthrleuvalphearghisglyaspargser354045proileaspthrpheprothraspproilelysglusersertrppro505560glnglypheglyglnleuthrglnleuglymetgluglnhistyrglu65707580leuglyglutyrilearglysargtyrarglyspheleuasngluser859095tyrlyshisgluglnvaltyrileargserthraspvalaspargthr100105110leumetseralametthrasnleualaalaleupheproproglugly115120125valseriletrpasnproileleuleutrpglnproileprovalhis130135140thrvalproleusergluaspglnleuleutyrleupropheargasn145150155160cysproargpheglngluleuglusergluthrleulyssergluglu165170175pheglnlysargleuhisprotyrlysasppheilealathrleugly180185190lysleuserglyleuhisglyglnaspleupheglyiletrpserlys195200205valtyraspproleutyrcysgluservalhisasnphethrleupro210215220sertrpalathrgluaspthrmetthrlysleuarggluleuserglu225230235240leuserleuleuserleutyrglyilehislysglnlysglulysser245250255argleuglnglyglyvalleuvalasngluileleuasnhismetlys260265270argalathrglnileprosertyrlyslysleuilemettyrserala275280285hisaspthrthrvalserglyleuglnmetalaleuaspvaltyrasn290295300glyleuleuproprotyralasercyshisleuthrgluleutyrphe305310315320glulysglyglutyrphevalglumettyrtyrargasngluthrgln325330335hisgluprotyrproleumetleuproglycysserprosercyspro340345350leugluargphealagluleuvalglyprovalileproglnasptrp355360365serthrglucysmetthrthrasnserhisglnglythrgluaspser370375380thrasp385<210>48<211>2086<212>rna<213>artificialsequence<400>48aaaauccguugaccuuaaacggucguguggguucaagucccuccacccccacgccggaaa60cgcaauagccgaaaaaacaaaaacaaaaaaaacaaaaaaacaaaaaaaaaaccaaaacac120auuaaaacagccuguggguugaucccacccacagggcccacugggcgcuagcacucuggu180aucacgguaccuuugugcgccuguuuuauacuuccucccccaacugcaacuuagaaguaa240cacaaaccgaucaacagucagcguggcacaccagccacguuuugaucaaacacuucuguu300accccggacugaguaucaauagacugcucacgcgguugaaggagaaaacguucguuaucc360ggccaacuacuucgagaaaccuaguaacgccauggaaguuguggaguguuucgcucagca420cuaccccaguguagaucagguugaugagucaccgcauuccccacgggugaccguggcggu480ggcugcguuggcggccugcccauggggaaacccaugggacgcucuuauacagacauggug540cgaagagucuauugagcuaguugguaguccuccggccccugaaugcggcuaaucccaacu600gcggagcauacacucucaagccagaggguagugugucguaaugggcaacucugcagcgga660accgacuacuuuggguguccguguuucauuuuauuccuauacuggcugcuuauggugaca720auugagagauuguuaccauauagcuauuggauuggccauccggugacuaacagagcuauu780auauaucuuuuuguuggguuuauaccacuuagcuugaaagagguuaaaacucuacauuac840auuuuaauacugaacaccgcaaaaugagggccgccccucugcugcuggcuagggccgcua900gccugagccugggcuuccuguuccugcuguucuucuggcuggauaggagcgugcuggcca960aggagcugaaguucgugacccugguguuuaggcacggcgauaggagcccuaucgacaccu1020ucccuaccgacccuaucaaggagagcagcuggccucaaggcuucggacagcugacacagc1080ugggcauggagcagcacuacgagcugggcgaguacauuaggaagagguauaggaaguucc1140ugaacgagagcuacaagcacgagcaaguguacauuaggagcaccgacguggauaggaccc1200ugaugagcgccaugaccaaccuggccgcccuguucccuccugagggcgugagcaucugga1260acccuauccugcuguggcagccuaucccugugcacaccgugccucugagcgaggaucagc1320ugcuguaccugccuuuuaggaacugcccuagguuccaagagcuggagagcgagacccuga1380agagcgaggaguuucagaagaggcugcacccuuacaaggacuucaucgccacccugggca1440agcucuccggccugcacggccaagaccuguucggcaucuggagcaagguguacgacccuc1500uguacugcgagagcgugcacaacuucacccugccuagcugggccaccgaggacaccauga1560ccaagcugagggagcugagcgagcugagccugcugagccuguacggcauccacaagcaga1620aggagaagucuaggcugcaaggcggcgugcuggugaacgagauccugaaccacaugaaga1680gggccacacagaucccuagcuacaagaagcugaucauguacagcgcccacgacaccaccg1740ucagcggccugcagauggcccuggacguguacaacggccugcugccuccuuacgcuagcu1800gccaccugaccgagcuguacuucgagaagggcgaguacuucguggagauguacuauagga1860acgagacacagcacgagccuuacccucugaugcugccuggcugcagcccuagcugcccuc1920uggagagguucgccgagcuggugggcccugugaucccucaagacuggagcaccgagugca1980ugaccaccaacagccaccaaggcaccgaggacagcaccgacugaaaaaaaacaaaaaaac2040aaaacaaacggcuauuaugcguuaccggcgagacgcuacggacuua2086<210>49<211>1260<212>dna<213>artificialsequence<400>49atgggcggcggcgccggcgagaggctgttcaccagcagctgcctggtgggcctggtgccc60ctgggcctgaggatcagcctggtgacctgccccctgcagtgcggcatcatgtggcagctg120ctgctgcccaccgccctgctgctgctcgtgagcgccggcatgaggaccgaggacctgccc180aaggccgtggtgttcctggagccccagtggtacagggtgctggagaaggacagcgtgacc240ctgaagtgccagggcgcctacagccccgaggacaacagcacccagtggttccacaacgag300agcctgatcagcagccaggccagcagctacttcatcgacgccgccacagtggacgactct360ggagagtacaggtgccagacaaacctgagcaccctgtctgaccccgtgcagcttgaagtg420catatcggctggctgttgctgcaggcccctaggtgggtgttcaaggaggaggaccctatt480cacctgaggtgtcacagctggaagaacaccgccctgcacaaggtgacctacctgcagaac540ggcaagggcaggaagtacttccaccacaacagcgacttctacatccccaaggccaccctg600aaggacagcggcagctacttctgcaggggcgtgttcggcagcaagaacgtgagcagcgag660accgtgaacatcaccattacccagggcctggccgtgagcaccatcagcagcttcttccct720cccggctaccagatctacatctgggcccccttggccggcacctgcggcgtgctgctgctg780agcctggtgatcaccaagaggggcagaaagaagctgctgtacatcttcaagcagcccttc840atgagacccgtgcagaccacccaggaggaggacggctgcagctgccggttccccgaagag900gaggagggcggctgcgagctgagagtgaagttcagcaggagcgccgacgcccccgcctac960cagcagggccagaaccagctgtacaacgagctgaacctgggcaggagagaggagtacgac1020gtgctggacaagagaaggggcagggaccccgagatgggcggcaagcccagaaggaagaac1080ccccaggagggcctgtacaacgagctgcagaaggacaagatggccgaggcctacagcgag1140atcggcatgaagggcgagaggaggaggggcaagggccacgacggcctgtaccagggcctg1200agcaccgccaccaaggacacctacgacgccctgcacatgcaggccctgccccctaggtga1260<210>50<211>419<212>prt<213>artificialsequence<400>50metglyglyglyalaglygluargleuphethrsersercysleuval151015glyleuvalproleuglyleuargileserleuvalthrcysproleu202530glncysglyilemettrpglnleuleuleuprothralaleuleuleu354045leuvalseralaglymetargthrgluaspleuprolysalavalval505560pheleugluproglntrptyrargvalleuglulysaspservalthr65707580leulyscysglnglyalatyrserprogluaspasnserthrglntrp859095phehisasngluserleuileserserglnalasersertyrpheile100105110aspalaalathrvalaspaspserglyglutyrargcysglnthrasn115120125leuserthrleuseraspprovalglnleugluvalhisileglytrp130135140leuleuleuglnalaproargtrpvalphelysglugluaspproile145150155160hisleuargcyshissertrplysasnthralaleuhislysvalthr165170175tyrleuglnasnglylysglyarglystyrphehishisasnserasp180185190phetyrileprolysalathrleulysaspserglysertyrphecys195200205argglyvalpheglyserlysasnvalsersergluthrvalasnile210215220thrilethrglnglyleualavalserthrileserserphephepro225230235240proglytyrglniletyriletrpalaproleualaglythrcysgly245250255valleuleuleuserleuvalilethrlysargglyarglyslysleu260265270leutyrilephelysglnprophemetargprovalglnthrthrgln275280285glugluaspglycyssercysargpheproglugluglugluglygly290295300cysgluleuargvallyspheserargseralaaspalaproalatyr305310315320glnglnglyglnasnglnleutyrasngluleuasnleuglyargarg325330335gluglutyraspvalleuasplysargargglyargaspproglumet340345350glyglylysproargarglysasnproglngluglyleutyrasnglu355360365leuglnlysasplysmetalaglualatyrsergluileglymetlys370375380glygluargargargglylysglyhisaspglyleutyrglnglyleu385390395400serthralathrlysaspthrtyraspalaleuhismetglnalaleu405410415proproarg<210>51<211>2185<212>rna<213>artificialsequence<400>51aaaauccguugaccuuaaacggucguguggguucaagucccuccacccccacgccggaaa60cgcaauagccgaaaaaacaaaaacaaaaaaaacaaaaaaacaaaaaaaaaaccaaaacac120auuaaaacagccuguggguugaucccacccacagggcccacugggcgcuagcacucuggu180aucacgguaccuuugugcgccuguuuuauacuuccucccccaacugcaacuuagaaguaa240cacaaaccgaucaacagucagcguggcacaccagccacguuuugaucaaacacuucuguu300accccggacugaguaucaauagacugcucacgcgguugaaggagaaaacguucguuaucc360ggccaacuacuucgagaaaccuaguaacgccauggaaguuguggaguguuucgcucagca420cuaccccaguguagaucagguugaugagucaccgcauuccccacgggugaccguggcggu480ggcugcguuggcggccugcccauggggaaacccaugggacgcucuuauacagacauggug540cgaagagucuauugagcuaguugguaguccuccggccccugaaugcggcuaaucccaacu600gcggagcauacacucucaagccagaggguagugugucguaaugggcaacucugcagcgga660accgacuacuuuggguguccguguuucauuuuauuccuauacuggcugcuuauggugaca720auugagagauuguuaccauauagcuauuggauuggccauccggugacuaacagagcuauu780auauaucuuuuuguuggguuuauaccacuuagcuugaaagagguuaaaacucuacauuac840auuuuaauacugaacaccgcaaaaugggcggcggcgccggcgagaggcuguucaccagca900gcugccuggugggccuggugccccugggccugaggaucagccuggugaccugcccccugc960agugcggcaucauguggcagcugcugcugcccaccgcccugcugcugcucgugagcgccg1020gcaugaggaccgaggaccugcccaaggccgugguguuccuggagccccagugguacaggg1080ugcuggagaaggacagcgugacccugaagugccagggcgccuacagccccgaggacaaca1140gcacccagugguuccacaacgagagccugaucagcagccaggccagcagcuacuucaucg1200acgccgccacaguggacgacucuggagaguacaggugccagacaaaccugagcacccugu1260cugaccccgugcagcuugaagugcauaucggcuggcuguugcugcaggccccuagguggg1320uguucaaggaggaggacccuauucaccugaggugucacagcuggaagaacaccgcccugc1380acaaggugaccuaccugcagaacggcaagggcaggaaguacuuccaccacaacagcgacu1440ucuacauccccaaggccacccugaaggacagcggcagcuacuucugcaggggcguguucg1500gcagcaagaacgugagcagcgagaccgugaacaucaccauuacccagggccuggccguga1560gcaccaucagcagcuucuucccucccggcuaccagaucuacaucugggcccccuuggccg1620gcaccugcggcgugcugcugcugagccuggugaucaccaagaggggcagaaagaagcugc1680uguacaucuucaagcagcccuucaugagacccgugcagaccacccaggaggaggacggcu1740gcagcugccgguuccccgaagaggaggagggcggcugcgagcugagagugaaguucagca1800ggagcgccgacgcccccgccuaccagcagggccagaaccagcuguacaacgagcugaacc1860ugggcaggagagaggaguacgacgugcuggacaagagaaggggcagggaccccgagaugg1920gcggcaagcccagaaggaagaacccccaggagggccuguacaacgagcugcagaaggaca1980agauggccgaggccuacagcgagaucggcaugaagggcgagaggaggaggggcaagggcc2040acgacggccuguaccagggccugagcaccgccaccaaggacaccuacgacgcccugcaca2100ugcaggcccugcccccuaggugaaaaaaaacaaaaaaacaaaacaaacggcuauuaugcg2160uuaccggcgagacgcuacggacuua2185<210>52<211>25<212>dna<213>artificialsequence<400>52aaaaaaacaaaaaaacaaaacaaac25<210>53<211>22<212>dna<213>artificialsequence<400>53aaaaacaaaaaacaaaacaaac22当前第1页1 2 3 
技术特征:1.一种重组核酸分子,所述重组核酸分子包含ires元件;其中,所述ires元件包含如下(i)-(iv)组成的组中的任一项:
(i)包含如seqidno:8-11任一序列所组成的组中的一种或多种序列的核苷酸序列;
(ii)包含如seqidno:8-11任一序列所示的序列的反向互补序列的核苷酸序列;
(iii)在高严格性杂交条件或非常高严格性杂交条件下,能够与(i)或(ii)所示的核苷酸序列杂交的序列的反向互补序列;
(iv)与(i)或(ii)所示的核苷酸序列具有至少90%,可选至少95%,优选至少97%,更优选至少98%,最优选至少99%的序列同一性的序列。
2.根据权利要求1所述的重组核酸分子,其中,所述重组核酸分子进一步包含编码目标多肽的编码区,并且所述ires元件能够提高所述目标多肽的表达水平;优选地,所述ires元件能够提高所述目标多肽在真核细胞中的表达水平。
3.根据权利要求1或2所述的重组核酸分子,其中,所述ires元件选自如下(q1)-(q7)中的任一项:
(q1)包含如seqidno:8所示序列的核苷酸序列;
(q2)包含如seqidno:9所示序列的核苷酸序列;
(q3)包含如seqidno:10所示序列的核苷酸序列;
(q4)包含如seqidno:11所示序列的核苷酸序列;
(q5)包含如seqidno:12所示序列的核苷酸序列;
(q6)包含如seqidno:13所示序列的核苷酸序列;
(q7)包含如seqidno:14所示序列的核苷酸序列。
4.根据权利要求1-3任一项所述的重组核酸分子,其中,所述重组核酸分子还包含位于所述ires元件上游的5’同源臂,和位于所述编码区下游且与所述5’同源臂互补的3’同源臂;
优选地,所述5’同源臂包含如下(a1)-(a2)中任一项所示的序列:
(a1)如seqidno:2-3任一序列所示的核苷酸序列;
(a2)与(a1)所示的核苷酸序列具有至少90%,可选至少95%,优选至少97%,更优选至少98%,最优选至少99%的序列同一性的序列;
所述3’同源臂包含如下(b1)-(b2)中任一项所示的序列:
(b1)如seqidno:17-18任一序列所示的核苷酸序列;
(b2)与(b1)所示的核苷酸序列具有至少90%,可选至少95%,优选至少97%,更优选至少98%,最优选至少99%的序列同一性的序列。
5.根据权利要求1-4任一项所述的重组核酸分子,其中,所述重组核酸分子还包含位于所述5’同源臂与所述ires元件之间的5’间隔区,和位于所述编码区与所述3’同源臂之间的3’间隔区;
优选地,所述5’间隔区包含如下(c1)-(c2)中任一项所示的序列:
(c1)如seqidno:6-7任一序列所示的核苷酸序列;
(c2)与(c1)所示的核苷酸序列具有至少90%,可选至少95%,优选至少97%,更优选至少98%,最优选至少99%的序列同一性的序列;
所述3’间隔区包含如下(o1)-(o2)中任一项所示的序列:
(o1)如seqidno:52-53任一序列所示的核苷酸序列;
(o2)与(o1)所示的核苷酸序列具有至少90%,可选至少95%,优选至少97%,更优选至少98%,最优选至少99%的序列同一性的序列。
6.根据权利要求1-5任一项所述的重组核酸分子,其中,所述重组核酸分子还包含位于所述5’同源臂与所述ires元件之间的3’内含子和第二外显子,以及位于所述编码区与所述3’同源臂之间的第一外显子和5’内含子;
优选地,所述3’内含子位于所述第二外显子的上游,且所述第二外显子与所述ires元件之间包含所述5’间隔区;所述第一外显子位于所述5’内含子的上游,且所述第一外显子与所述编码区之间包含所述3’间隔区。
7.根据权利要求6所述的重组核酸分子,其中,所述3’内含子包含如下(d1)-(d2)中任一项所示的序列:
(d1)如seqidno:4所示的核苷酸序列;
(d2)与(d1)所示的核苷酸序列具有至少90%,可选至少95%,优选至少97%,更优选至少98%,最优选至少99%的序列同一性的序列;
所述第二外显子包含如下(e1)-(e2)中任一项所示的序列:
(e1)如seqidno:5所示的核苷酸序列;
(e2)与(e1)所示的核苷酸序列具有至少90%,可选至少95%,优选至少97%,更优选至少98%,最优选至少99%的序列同一性的序列;
所述第一外显子包含如下(f1)-(f2)中任一项所示的序列:
(f1)如seqidno:15所示的核苷酸序列;
(f2)与(f1)所示的核苷酸序列具有至少90%,可选至少95%,优选至少97%,更优选至少98%,最优选至少99%的序列同一性的序列;
所述5’内含子包含如下(g1)-(g2)中任一项所示的序列:
(g1)如seqidno:16所示的核苷酸序列;
(g2)与(g1)所示的核苷酸序列具有至少90%,可选至少95%,优选至少97%,更优选至少98%,最优选至少99%的序列同一性的序列。
8.根据权利要求1-7任一项所述的重组核酸分子,其中,所述重组核酸分子还包含调控序列,所述调控序列用于指导所述重组核酸分子转录环状rna。
9.一种重组表达载体,其中,所述重组表达载体包含根据权利要求1-8任一项所述的重组核酸分子。
10.一种线状rna,其由根据权利要求1-8任一项所述的重组核酸分子,或权利要求9所述的重组表达载体转录形成;
优选地,所述线状rna包括5’同源臂、3’内含子、第二外显子、5’间隔区、ires元件、编码区、3’间隔区、第一外显子、5’内含子和3’同源臂。
11.一种环状rna,其由根据权利要求1-8任一项所述的重组核酸分子,或权利要求9所述的重组表达载体转录后环化形成;或者,其由根据权利要求10所述的线状rna环化形成;
可选地,所述环状rna包含顺次连接的第二外显子、5’间隔区、ires元件、编码区、3’间隔区和第一外显子。
12.根据权利要求11所述的环状rna,其中,所述环状rna表达目标多肽。
13.根据权利要求12所述的环状rna,其中,所述目标多肽为新型冠状病毒的s蛋白的受体结合域(rbd);优选地,所述rbd蛋白选自如下(h1)-(h4)中的任一项:
(h1)包含如seqidno:32所示氨基酸序列,且具有rbd蛋白活性的多肽;
(h2)如seqidno:32所示氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸,且具有rbd蛋白活性的多肽;
(h3)由编码(h1)或(h2)所示氨基酸序列的多核苷酸编码的多肽;
(h4)由与seqidno:31所示的核苷酸序列具有至少90%,可选至少95%,优选至少97%,更优选至少98%,最优选至少99%的序列同一性的序列编码的,且具有rbd蛋白活性的多肽。
14.根据权利要求12或13所述的环状rna,其中,所述环状rna包含与seqidno:33所示的核苷酸序列具有至少90%,可选至少95%,优选至少97%,更优选至少98%,最优选至少99%的序列同一性的序列。
15.根据权利要求12所述的环状rna,其中,所述目标多肽选自程序性死亡受体1(programmedcelldeathprotein1,pd-1),程序性死亡配体-1(programmedcelldeathligand-1,pd-l1)或细胞毒性t淋巴细胞相关蛋白-4(cytotoxict-lymphocyteassociatedprotein-4,ctla-4)的单克隆抗体;
优选地,所述pd-1单克隆抗体包含如下(j1)-(j6)中的任一项:
(j1)包含如seqidno:38所示氨基酸序列的轻链;
(j2)如seqidno:41所示氨基酸序列的重链;
(j3)包含与seqidno:38所示氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸,且具有轻链蛋白活性的多肽;
(j4)包含与seqidno:41所示氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸,且具有重链蛋白活性的多肽;
(j5)由编码(j1)-(j4)任一项所示氨基酸序列的多核苷酸编码的多肽;
(j6)由与seqidno:37所示的核苷酸序列具有至少90%,可选至少95%,优选至少97%,更优选至少98%,最优选至少99%的序列同一性的序列编码的,且具有轻链蛋白活性的多肽;或,由与seqidno:40所示的核苷酸序列具有至少90%,可选至少95%,优选至少97%,更优选至少98%,最优选至少99%的序列同一性的序列编码的,且具有重链蛋白活性的多肽。
16.根据权利要求12或15所述的环状rna,其中,所述环状rna包含与seqidno:39或42所示的核苷酸序列具有至少90%,可选至少95%,优选至少97%,更优选至少98%,最优选至少99%的序列同一性的序列。
17.根据权利要求12所述的环状rna,其中,所述目标多肽为嵌合抗原受体;可选地,所述目标多肽为嵌合抗原受体的cd16蛋白,所述cd16蛋白选自如下(k1)-(k4)中的任一项:
(k1)包含如seqidno:50所示氨基酸序列,且具有cd16蛋白活性的多肽;
(k2)如seqidno:50所示氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸,且具有cd16蛋白活性的多肽;
(k3)由编码(k1)或(k2)所示氨基酸序列的多核苷酸编码的多肽;
(k4)由与seqidno:49所示的核苷酸序列具有至少90%,可选至少95%,优选至少97%,更优选至少98%,最优选至少99%的序列同一性的序列编码的,且具有cd16蛋白活性的多肽。
18.根据权利要求12或17所述的环状rna,其中,所述环状rna包含与seqidno:51所示的核苷酸序列具有至少90%,可选至少95%,优选至少97%,更优选至少98%,最优选至少99%的序列同一性的序列。
19.根据权利要求12所述的环状rna,其中,所述目标多肽为重组人源化蛋白,可选地,所述重组人源化蛋白为重组人红细胞生成素(epo)蛋白,所述epo蛋白选自如下(l1)-(l4)中的任一项:
(l1)包含如seqidno:35所示氨基酸序列,且具有epo蛋白活性的多肽;
(l2)如seqidno:35所示氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸,且具有epo蛋白活性的多肽;
(l3)由编码(l1)或(l2)所示氨基酸序列的多核苷酸编码的多肽;
(l4)由与seqidno:34所示的核苷酸序列具有至少90%,可选至少95%,优选至少97%,更优选至少98%,最优选至少99%的序列同一性的序列编码的,且具有epo蛋白活性的多肽。
20.根据权利要求12或19所述的环状rna,其中,所述环状rna包含与seqidno:36所示的核苷酸序列具有至少90%,可选至少95%,优选至少97%,更优选至少98%,最优选至少99%的序列同一性的序列。
21.根据权利要求12所述的环状rna,其中,所述目标多肽为细胞因子;优选地,所述细胞因子为il-15蛋白,所述il-15蛋白选自如下(m1)-(m4)中的任一项:
(m1)包含如seqidno:44所示氨基酸序列,且具有il-15蛋白活性的多肽;
(m2)如seqidno:44所示氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸,且具有il-15蛋白活性的多肽;
(m3)由编码(m1)或(m2)所示氨基酸序列的多核苷酸编码的多肽;
(m4)由与seqidno:43所示的核苷酸序列具有至少90%,可选至少95%,优选至少97%,更优选至少98%,最优选至少99%的序列同一性的序列编码的,且具有il-15蛋白活性的多肽。
22.根据权利要求12或21所述的环状rna,其中,所述环状rna包含与seqidno:45所示的核苷酸序列具有至少90%,可选至少95%,优选至少97%,更优选至少98%,最优选至少99%的序列同一性的序列。
23.根据权利要求12所述的环状rna,其中,所述目标多肽为肿瘤相关抗原或肿瘤特异性抗原,可选地,所述肿瘤特异性抗原为pap蛋白,所述pap蛋白选自如下(n1)-(n4)中的任一项:
(n1)包含如seqidno:47所示氨基酸序列,且具有pap蛋白活性的多肽;
(n2)如seqidno:47所示氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸,且具有pap蛋白活性的多肽;
(n3)由编码(n1)或(n2)所示氨基酸序列的多核苷酸编码的多肽;
(n4)由与seqidno:46所示的核苷酸序列具有至少90%,可选至少95%,优选至少97%,更优选至少98%,最优选至少99%的序列同一性的序列编码的,且具有pap蛋白活性的多肽。
24.根据权利要求12或23所述的环状rna,其中,所述环状rna包含与seqidno:48所示的核苷酸序列具有至少90%,可选至少95%,优选至少97%,更优选至少98%,最优选至少99%的序列同一性的序列。
25.一种重组宿主细胞,其中,所述重组宿主细胞包含根据权利要求1-8任一项所述的重组核酸分子,根据权利要求9所述的重组表达载体,根据权利要求10所述的线状rna或根据权利要求11-24任一项所述的环状rna。
26.一种根据权利要求1-8任一项所述的重组核酸分子,根据权利要求9所述的重组表达载体,根据权利要求10所述的线状rna,根据权利要求11-24任一项所述的环状rna,或根据权利要求25所述的重组宿主细胞在制备蛋白中的应用。
27.一种药物组合物,其中,包括如下(i)-(ii)中任一项:
(i)根据权利要求1-8任一项所述的重组核酸分子,根据权利要求9所述的重组表达载体,根据权利要求10所述的线状rna,根据权利要求11-24任一项所述的环状rna,或根据权利要求25所述的重组宿主细胞;或者
(ii)根据权利要求1-8任一项所述的重组核酸分子,根据权利要求9所述的重组表达载体,根据权利要求10所述的线状rna,根据权利要求11-24任一项所述的环状rna,或根据权利要求25所述的重组宿主细胞表达的目标多肽。
28.一种制备蛋白的方法,其中,包括以根据权利要求1-8任一项所述的重组核酸分子,根据权利要求9所述的重组表达载体,根据权利要求10所述的线状rna,根据权利要求11-24任一项所述的环状rna,或根据权利要求25所述的重组宿主细胞表达目标蛋白的步骤。
29.一种预防或治疗疾病的方法,其中,包括向受试者施用(i)-(ii)中任一项的步骤:
(i)根据权利要求1-8任一项所述的重组核酸分子,根据权利要求9所述的重组表达载体,根据权利要求10所述的线状rna,根据权利要求11-24任一项所述的环状rna,或根据权利要求25所述的重组宿主细胞;或者
(ii)根据权利要求1-8任一项所述的重组核酸分子,根据权利要求9所述的重组表达载体,根据权利要求10所述的线状rna,根据权利要求11-24任一项所述的环状rna,或根据权利要求25所述的重组宿主细胞表达的目标多肽。
技术总结本公开涉及一种转录环状RNA的重组核酸分子及其在蛋白表达中的应用。具体来说,本公开涉及一种转录环状RNA的重组核酸分子、重组表达载体、线状RNA、环状RNA、重组宿主细胞、药物组合物,以及制备蛋白的方法。本公开的重组核酸分子,其转录形成包含特定IRES元件的环状RNA,IRES元件可提高环状RNA在真核细胞中的蛋白表达水平,实现蛋白的高效、持久性表达,在制备mRNA传染病疫苗、治疗性mRNA肿瘤疫苗、基于mRNA的树突状细胞的肿瘤疫苗,基于mRNA的基因治疗、基于mRNA的嵌合抗原受体T细胞疗法、蛋白质补充疗法等领域具有重要的应用价值。
技术研发人员:孙振华;左炽健;朱佳凤
受保护的技术使用者:江苏普瑞康生物医药科技有限公司
技术研发日:2020.12.04
技术公布日:2021.03.12