本公开内容一般涉及分子生物学领域,具体涉及用于基因编辑的新型核酸酶。
背景技术:
1、在过去几年中,使用crispr(成簇规律间隔短回文重复序列)-cas(crispr相关蛋白)的rna引导的dna靶向原理编辑基因组已被广泛应用。已经描述了三种类型的crispr-cas系统(i型、ii型和iib型、iii型和v型)。用于基因组编辑的crispr-cas的大多数用途都是使用ii型系统。细菌ii型crispr-cas系统提供的主要优势在于对可编程dna干扰的最低要求:由可定制的双rna结构引导的核酸内切酶cas9。如在化脓性链球菌(streptococcuspyogenes)的原始ii型系统中最初证明的那样,反式激活的crispr rna(tracrrna)与前体crispr rna(pre-crrna)的不可变重复序列(invariable repeat)结合,以形成双rna,该双rna对于在cas9存在下通过rnase iii的rna共成熟和通过cas9切割入侵dna都是必需的。如在化脓性链球菌中所证明的,cas9在成熟激活tracrrna和靶向crrna之间形成的双链体(duplex)引导下,在入侵的同源dna中引入位点特异性双链dna(dsdna)断裂。cas9是一种多结构域酶,它使用hnh核酸酶结构域来切割靶标链(target strand)(定义为与crrna的间隔区序列(spacer sequence)互补)和ruvc样结构域(ruvc-iike domain)来切割非靶标链(non-target strand)。核酸酶可以通过该核酸酶的选择性基序失活而起到切口酶(nickase)的作用。dna裂解特异性由两个参数决定:(1)靶向原型间隔区序列(protospacersequence)的crrna的可变的、间隔区衍生的序列(dna靶标上与crrna间隔区非互补的序列),和(2)一个短序列,直接位于非靶标dna链上原型间隔区3’(下游)处的原型间隔区相邻基序(protospacer adjacent motif,pam)。
2、研究表明,rna引导的cas9可以在多种细胞(包括原核生物和真核生物(包括人)的细胞)中用作基因组编辑工具。该系统是多功能的,通过对cas9进行编程,使用多个向导rna同时编辑基因组中的多个位点,从而实现多重基因组工程(multiplex genomeengineering)。cas9转化为切口酶被证明有助于哺乳动物基因组中同源定向修复,同时降低诱变活性。此外,例如,cas9催化失活突变体的dna结合活性已被用于设计rna可编程转录沉默和激活装置或表观遗传修饰物(epigenetic modifier)。
3、哺乳动物细胞中的基因组编辑部分受到cas9蛋白尺寸的限制。来源于化脓性葡萄球菌的cas9(spycas9)是迄今为止使用最广泛的酶,包含约4.2kb的dna(wo2013/176722),与同源单链向导rna(single guide rna,sgrna)的直接组合进一步增加了尺寸。腺相关病毒是在基因治疗应用中用于递送cas9酶的载体之一。然而,aav负载尺寸(cargo size)被限制在约4.5kb。由于尺寸限制,递送cas9及其sgrna和潜在dna修复模板可能会成为使用该方法的障碍。更小的cas9分子已经被表征,但它们中大多数都存在原型间隔区相邻基序(pam)序列不如spycas9所使用的原型间隔区相邻基序定义得那么明确的问题。例如,金黄色葡萄球菌(staphylococcus aureus)(saucas9使用“nngrr(t)”序列,其中r=a或g,空肠弯曲杆菌(campylobacter jejuni)(cja)cas9分别使用“nnnacac”/“nnnryac”pam(其中y=t或g)(j.biol.chem.,vol.295,issue 19,2020,pp 6509-6517)。pam的模糊性增加了该酶在与pam具有高度或完美序列同一性的脱靶序列(off-target sequence)上产生不希望的活性的可能性。这些系统的特异性仍然令人担忧,因为意外地靶向类似位点(“脱靶”)会增加不良事件的可能性。
4、现有的crispr-cas 9系统通常具有以下一个或多个缺点:
5、a)它们的尺寸太大,以至于无法在已建立的适合治疗的病毒递送系统的基因组中携带,如腺相关病毒(aav)。
6、b)它们中的许多在非宿主环境中(例如,在真核细胞中,特别是在哺乳动物细胞中)基本上没有活性。
7、c)当间隔区和原型间隔区序列之间存在错配时,它们的核酸酶可以催化dna链切割,导致不希望的脱靶效应,例如使它们不适合基因治疗用途或需要高精度的其他应用。
8、d)它们可能会激发免疫应答,从而限制其在哺乳动物体内的应用。
9、e)它们需要复杂和/或长的pam,这限制了dna靶向区段的靶标选择。
10、f)它们在质粒或病毒载体中表现出较差的表达。
技术实现思路
1、本发明涉及改进的和工程化的crispr cas核酸酶(smallcas9),其基于小crisprcas9核酸酶,如金黄色葡萄球菌的crispr cas 9核酸酶(m-saucas9)(ncbi refseq idj7rua5.1)和类似的crispr cas核酸酶(一般是m-smallcas9,其具有显著改进的pam需求(例如,与saucas9的“nngrr(t)”相比的“nngg”)(j.biol.chem.,vol.295,issue 19,2020,pp 6509-6517),从而保持核酸酶的高活性。通过引入一个或一些选择的氨基酸交换,可以容易地优化野生型酶的pam选择性,由此通常酶的活性一般不受影响。
2、本发明的一个具体实施方案是选自以下的多肽:
3、seq id no:1、seq id no:2、seq id no:3、seq id no:4、seq id no:5,或与上述任何多肽具有至少95%同一性的任何多肽序列,条件是该多肽具有以下称为saucas 9的氨基酸残基,而saucas9中位置前面的氨基酸表征了该多肽中必须存在的氨基酸;
4、或者选自以下的多肽:
5、seq id no:1、seq id no:2、seq id no:3、seq id no:4、seq id no:5,或与上述任何任何多肽具有至少95%同一性的任何多肽序列,条件是与来自金黄色葡萄球菌的cas9序列(ncbi refseq id j7rua5.1)相比,该多肽包括以下氨基酸置换,而saucas9中位置前面的氨基酸表征了该多肽中必须存在的氨基酸;
6、(i)seq id no:1的i1017k、p1013e、r991m
7、(ii)seq id no:2的i1017k、p1013e、r991m、l989r
8、(iii)seq id no:3的i1017k、p1013e、r991m、l989r、r1012g、d1010i、l1005c
9、(iv)seq id no:4的i1017k、p1013e、r991m、l989r、n986s、l988t
10、(v)seq id no:5的i1017k、p1013e、r991m、l989r、r1012g、d1010i、l1005c、n986s、l988t。
11、优选的是基于seq id no:2、3、4和5的多肽。
12、更优选的是基于seq id no:3、4和5的多肽。
13、甚至更优选的是基于seq id no:4和5的多肽。
14、甚至更特别优选的是基于seq id no:5的多肽
15、最优选的是根据seq id no:5的多肽
16、本发明的另一个实施方案涉及组合物,其包含:
17、(i)根据权利要求1至2中任一项所述的m-smallcas9多肽;以及
18、(ii)一种或多种单异源向导rna(sgrna)或允许原位产生这样的一种或多种sgrna的dna,每种sgrna或编码sgrna的dna包含:
19、(a)能够与多核苷酸基因座中的靶序列杂交的工程化的dna靶向区段,
20、(b)tracr伴侣序列(tracr mate sequence),以及
21、(c)tracr rna序列,
22、其中tracr伴侣序列能够与tracr序列杂交,并且其中(a)、(b)和(c)以5’至3’的方向排列。
23、优选地,这样的组合物工程化的dna靶向区段在其3’末端与pam序列直接相邻,或者这样的pam序列在其3’部分是dna靶向序列的一部分。
24、本发明的又另一个实施方案涉及在细胞中或体外的一个或多个位置靶向、编辑、修饰或操纵靶dna的方法,所述方法包括
25、(i)将根据权利要求1至2中任一项所述的异源m-smallcas9多肽或编码权利要求1或权利要求2的m-smallcas9的核酸引入至细胞或体外环境中;以及
26、(ii)将一种或多种单异源向导rna(sgrna)或编码这样的一种或多种sgrna的dna引入至细胞或体外环境中,每种sgrna或编码sgrna的dna包含:
27、(a)包含rna并能够与多核苷酸基因座中的靶序列杂交的工程化的dna靶向区段,
28、(b)由rna组成的tracr伴侣序列,以及
29、(c)由rna组成的tracr rna序列,
30、其中tracr伴侣序列与tracr序列杂交,并且其中(a)、(b)和(b)以5’至3’的方向排列;以及
31、(iii)在靶dna中产生一个或多个切口或缺口或碱基编辑,其中m-smallcas9多肽通过sgrna以其加工或未加工的形式被引导至靶dna。
32、本发明的另一个实施方案涉及组合物用于在细胞中或体外的一个或多个位置靶向、编辑、修饰或操纵靶dna的用途,所述组合物包含(i)根据权利要求1或权利要求2所述的m-smallcas9多肽或编码相同多肽的核酸;和/或
33、(ii)一种或多种单异源向导rna(sgrna)或适合于原位产生这样的一种或多种sgrna的dna,各自包含:
34、(a)由rna组成并能够与多核苷酸基因座中的这样的靶序列杂交的工程化的dna靶向区段,
35、(b)由rna组成的tracr伴侣序列,以及
36、(c)由rna组成的tracr rna序列,
37、其中tracr伴侣序列与tracr序列杂交,并且其中(a)、(b)和(c)以5’至3’的方向排列。
38、在另一个实施方案中,本发明涉及细胞,其包含
39、(i)根据权利要求1或权利要求2所述的m-smallcas9多肽,或编码根据权利要求1或权利要求2所述的m-smallcas9多肽的核酸;以及
40、(ii)一种或多种单异源向导rna(sgrna)或适合于原位产生这样的一种或多种sgrna的dna,各自包含:
41、(a)能够与多核苷酸基因座中的靶序列杂交的工程化的dna靶向区段,
42、(b)tracr伴侣序列,以及
43、(c)tracr rna序列,
44、其中tracr伴侣序列能够与tracr序列杂交,并且其中(a)、(b)和(c)以5’至3’的方向排列。
45、本发明的另一个实施方案涉及试剂盒,其包含
46、(i)编码根据权利要求1或权利要求2所述的m-smallcas9多肽的核酸序列,其中编码m-smallcas9的核酸序列可操作地连接至启动子;以及
47、(ii)一种或多种单异源向导rna(sgrna)或适合于原位产生这样的一种或多种sgrna的dna,每种sgrna包含:
48、(a)能够与多核苷酸基因座中的靶序列杂交的工程化的dna靶向区段,
49、(b)tracr伴侣序列,以及
50、(c)tracr rna序列,
51、其中tracr伴侣序列能够与tracr序列杂交,并且其中(a)、(b)和(c)以5’至3’的方向排列。
52、表1包含本文所用蛋白质和命名法的参考文献
53、表1
54、
55、
56、本专利申请中对ncbi refseq数据库的任何引用是指以下引文:national centerfor biotechnology information(ncbi)[internet].bethesda(md):national libraryof medicine(us),national center for biotechnology information;[1988]-[cited2020march 26]。可以从以下网址获得:https://www.ncbi.nlm.nih.gov/protein)。例如,对于ncbi refseq wp_0488803085,这是https://www.ncbi.nlm.nih.gov/protein/wp_048803085.
57、在一个方面,本文提供了在细胞中或体外的一个或多个位置靶向、编辑、修饰或操纵靶dna的方法,该方法包括:(i)将本文公开的异源m-smallcas9多肽或编码本文公开的m-smallcas9的核酸引入至细胞或体外环境中;和(ii)将一种或多种单异源向导rna(sgrna)或编码这样的一种或多种sgrna的dna引入至细胞或体外环境中,每种sgrna或编码sgrna的dna包含:(a)包含rna并能够与多核苷酸基因座中的靶序列杂交的工程化的dna靶向区段,(b)由rna组成的tracr伴侣序列,和(c)由rna组成的tracr rna序列,其中tracr伴侣序列与tracr序列杂交,并且其中(a)、(b)和(c)以5’至3’的方向排列;和(iii)在靶dna中产生一个或多个切口或缺口或碱基编辑,其中m-smallcas9多肽通过sgrna以其加工或未加工的形式被引导至靶dna。
58、在一个方面,本文提供了组合物用于在细胞中或体外的一个或多个位置靶向、编辑、修饰或操纵靶dna的用途,所述组合物包含(i)本文公开的m-smallcas9多肽或编码相同多肽的核酸;和/或(ii)一种或多种单异源向导rna(sgrna)或适合于原位产生这样的一种或多种sgrna的dna,各自包含:(a)由rna组成并能够与多核苷酸基因座中的这样的靶序列杂交的工程化的dna靶向区段,(b)由rna组成的tracr伴侣序列,和(c)由rna组成的tracrrna序列,其中tracr伴侣序列与tracr序列杂交,并且其中(a)、(b)和(c)以5’至3’的方向排列。
59、在另一个方面,本文提供了一种细胞,其包含(i)本文公开的m-smallcas9多肽,或编码本文公开的m-smallcas9多肽的核酸;和(ii)一种或多种单异源向导rna(sgrna)或适合于原位产生这样的一种或多种sgrna的dna,各自包含:(a)能够与多核苷酸基因座中的靶序列杂交的工程化的dna靶向区段,(b)tracr伴侣序列,和(c)tracr rna序列,其中tracr伴侣序列能够与tracr序列杂交,并且其中(a)、(b)和(c)以5’至3’的方向排列。
60、在又另一个方面,本文提供了一种试剂盒,其包含(i)编码本文公开的m-smallcas9多肽的核酸序列,其中编码m-smallcas9的核酸序列可操作地连接至启动子;和(ii)一种或多种单异源向导rna(sgrna)或适合于原位产生这样的一种或多种sgrna的dna,每种sgrna包含:(a)能够与多核苷酸基因座中的靶序列杂交的工程化的dna靶向区段,(b)tracr伴侣序列,和(c)tracr rna序列,其中tracr伴侣序列能够与tracr序列杂交,并且其中(a)、(b)和(c)以5’至3’的方向排列。
61、本文所提及的每个专利文件和科学文章的全部公开内容,以及由此引用的那些专利文件和科技文章,出于所有目的通过引用的方式明确地纳入本文。
62、下面更具体地描述本发明的额外特征和优点。
1.一种多肽,其选自:
2.一种多肽,其选自:seq id no:1、seq id no:2、seq id no:3、seq id no:4和seq idno:5。
3.一种多肽,其选自:seq id no:3、seq id no:4和seq id no:5。
4.根据seq id no:5所述的多肽。
5.一种组合物,其包含
6.根据权利要求5所述的组合物,其中所述工程化的dna靶向区段在其3'末端与pam序列直接相邻,或者这样的pam序列在其3’部分是dna靶向序列的一部分。
7.在细胞中或体外的一个或多个位置靶向、编辑、修饰或操纵靶dna的方法,所述方法包括
8.组合物用于在细胞中或体外的一个或多个位置靶向、编辑、修饰或操纵靶dna的用途,所述组合物包含
9.一种细胞,其包含
10.一种试剂盒,其包含
