本发明涉及领域基因调控领域,具体而言,涉及一种基因元件以及该基因元件的使用方法。
背景技术:
目前,人类已经实现通过基因编辑等技术使细胞工厂将自生内源能量和代谢物转换为预先设计的代谢产物来生产大量能源、化学品和药物。但在生产这类外源产物的过程中会不可避免和细胞竞争资源,甚至对细胞本身产生毒性,导致细胞正常结构被破坏或者代谢网络紊乱,其后果将导致细胞生长突变、外源基因线路快速失效、细胞死亡、产量降低、能量和碳源的浪费等。
通过动态调控代谢过程细胞的基因表达可以有效提高底物的利用率和产物的产率,动态调控细胞代谢途径,可以精细调控细胞资源分配,缓解组成型表达外源基因线路造成的细胞生长抑制和代谢流失衡。例如,通过外部响应的一些启动子例如诱导剂(iptg、l-阿拉伯糖、脱水四环素)响应启动子、光、ph、溶氧、温度响应启动子,可以在发酵的不同阶段调控外源基因线路的表达,或者通过响应细胞内部资源的转录因子实现外源线路和细胞生理状态耦合,使得外源线路的表达具有细胞生理状态依赖性,实现外源线路的表达开关具有自动、可编程性。
目前的一类动态调控依赖细胞生长环境的外部条件,由诱导剂、温度、光、溶氧、ph值响应的启动子介导的条件性转录,这类途径往往需要大量的诱导剂分子,增加了发酵过程的成本;另外还需要通过对发酵过程中细菌生长的状态监控进行添加,增加了设备和人力的成本。
另一类动态调控策略是将细胞自生的代谢过程耦合,例如响应细胞内前体代谢物的转录因子,通过这类转录因子特异响应细胞内的前体物浓度,当细胞内前体物质浓度上升到某一阈值打开外源线路的表达,这类转录因子往往为细胞内源性蛋白,因此不仅控制了外源基因线路的转录,同时又不可避免地启动了细胞内其他代谢通路的转录,一方面造成了细胞内资源的竞争,另外会导致出现无法预料的代谢转变;同时,在耦合外源基因线路和内源代谢通路涉及到对细胞基因组的大量编辑试错过程,开发难度和周期长。
技术实现要素:
本公开的目的是提供一种基因元件,该元件能够自我激活,利用细胞内的全局资源调控机制进行基因表达的动态调控。
根据本公开的第一方面,提供了一种基因元件,用于调控基因的表达,具有:转录因子序列,其表达被配置为与基因的表达耦合;启动子序列,其被配置在转录因子序列的上游,用于启动启动子的下游序列表达。该基因元件适用于表达外源蛋白或具有特定活性的酶用于生产非蛋白产物。
在一些可能的实现方式中,转录因子序列被配置为表达具有组成型转录活性的转录因子,使得转录因子在无诱导剂的情况下具有转录活性。该基因元件适用于表达外源蛋白或具有特定活性的酶用于生产非蛋白产物。
在一些可能的实现方式中,转录因子序列被配置为表达n端具有与l-阿拉伯糖结合后的构象的arac/xyls家族蛋白。
在一些可能的实现方式中,转录因子包括具有组成型转录活性的arac蛋白、rhas蛋白或rhar蛋白。
在一些可能的实现方式中,转录因子为arac-1蛋白,转录因子的核苷酸序列为seqidno.1。
在一些可能的实现方式中,转录因子为arac-2蛋白,转录因子的核苷酸序列为seqidno.2。
在一些可能的实现方式中,转录因子为arac-3蛋白,转录因子的核苷酸序列为seqidno.3。
在一些可能的实现方式中,转录因子为arac-4蛋白,转录因子的核苷酸序列为seqidno.4。
在一些可能的实现方式中,转录因子为arac-5蛋白,转录因子的核苷酸序列为seqidno.5。
在一些可能的实现方式中,转录因子为rhas-1蛋白,转录因子的核苷酸序列为seqidno.6。
在一些可能的实现方式中,转录因子为rhar-1蛋白,转录因子的核苷酸序列为seqidno.7。
在一些可能的实现方式中,启动子序列被配置为野生型的pbad启动子序列或野生型的prhas启动子序列。
在一些可能的实现方式中,启动子序列被配置为删除了野生型的pbad启动子序列上游的crp结合位点后的pbad-1启动子序列,pbad-1启动子序列的核苷酸序列为seqidno.8。
在一些可能的实现方式中,启动子序列被配置为删除了野生型的prhas启动子序列上游的crp结合位点后的prhas-1启动子,prhas-1启动子序列的核苷酸序列为seqidno.9。
在一些可能的实现方式中,基因元件包括pbad启动子和arac-1蛋白,基因元件的核苷酸序列为seqidno.10。
在一些可能的实现方式中,基因元件被配置为调控基因或基因簇的表达。
在一些可能的实现方式中,还包括终止子,终止子被配置在基因元件的上游或下游序列,用于阻遏转录干扰。
在一些可能的实现方式中,还包括荧光报告基因,荧光报告基因被配置于基因元件的下游序列,用于表征基因或基因簇的表达水平。
根据本公开的第二方面,提供了一种基因元件的使用方法,包括:将配置有基因元件的细胞在培养基中培养;当细胞的浓度od600超过0.2时,收集细胞并将稀释后的细胞接种至新的培养基中继续培养。
根据本公开的第三方面,提供了一种基因元件的使用方法,包括:将配置有基因元件的细胞在培养基中培养;当细胞的浓度od600超过0.2时,收集细胞并将稀释后的细胞接种至新的培养基中培养;当所述细胞浓度od600接近0.2时,向新的培养基中补充细胞外源产物的前体物质后继续培养。
在一些可能的实现方式中,将基因元件通过无痕组装法配置在待调控基因或基因簇的序列上游使用。
在一些可能的实现方式中,将基因元件通过基因组装法配置于细胞的基因组或质粒中使用。
在一些可能的实现方式中,将基因元件的序列、由与基因元件相同的启动子序列和待调控的基因或基因簇序列串联构成的序列配置在同一细胞内使用。
在一些可能的实现方式中,细胞被配置为大肠杆菌细胞、枯草芽孢杆菌、乳酸菌、链霉菌、酵母菌、棒杆菌、动物细胞中的一种。
在一些可能的实现方式中,培养基被配置为lb培养基、sob培养基、yt培养基、tb培养基、rdm培养基中的一种或多种。
从以上技术方案可以看出,本公开具有以下优点:
1.相对于传统的诱导型调控,本发明不依赖任何诱导条件,包括化学分子和物理条件;
2.整个过程无需人工监督,节省了成本;
3.适合于各种培养基,对培养基的组分无依赖;
4.相对于代谢前体分子耦合的调控线路,本发明不与细胞的代谢直接进行偶联,正交性好,因此可以通过简单的改造直接使用到不同的外源产物发酵中,重复性,成功率高;
5.基因线路非常简单,改造和部署到不同的底盘细胞或应用于不同的发酵产物时,成本低和效率高。
附图说明
为了更清楚地说明本发明实施方式的技术方案,下面将对实施方式中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出本公开的一个实施例的基因元件结构示意图;
图2示出本公开的一个实施例的细胞生长速率与基因表达水平的关系图;
图3示出本公开的一个实施例的体系中,细胞生长速率与基因表达水平的关系图;
图4示出本公开的一个实施例中不同培养基对基因表达水平的影响。
具体实施方式
为使本发明实施方式的目的、技术方案和优点更加清楚,下面将结合本发明实施方式中的附图,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本发明一部分实施方式,而不是全部的实施方式。因此,以下对在附图中提供的本发明的实施方式的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
本公开提供了一种基因元件,用于调控基因的表达,具有:转录因子序列,其被配置在基因的上游,用于将该转录因子与基因的表达耦合;启动子序列,其被配置在转录因子序列的上游,用于启动启动子的下游序列表达。启动子序列与转录因子序列串联后形成该基因元件配置于基因的上游,转录因子序列位于启动子序列和下游基因之间。该基因元件适用于表达外源蛋白或具有特定活性的酶用于生产非蛋白产物。
本公开了解到,细胞在生长过程中具有全局资源调控机制,该全局资源调控机制会根据外界营养状况调控生长速率和调节蛋白质组分,即,当细胞在营养充分的情况下,细胞的资源大量用于产生核糖体;而当外部资源短缺时,细胞大量资源分配给产生与代谢相关的蛋白。故在细胞生长速度较慢的情况下,一些组成型表达和camp响应的蛋白产物浓度会大幅上升。自激活通路的本底表达水平可以在一定范围内变化,从而使得细胞生长速度较快时,自激活线路处于关闭状态,而生长速率低于一定阈值后自动激活。而基本结构为一个能够自我激活的转录因子和一个控制转录因子的转录的特异的启动子的自激活网络模体具有以下特点:当转录因子处于被激活状态下,能够快速促进转录因子自身的转录和翻译,实现在几分钟内快速表达启动子下游基因的功能。同时,自激活模体具有双稳态性,在一定的转录因子的本底表达水平下,带有该自激活模体的细胞个体会出现两种状态,即激活状态和非激活状态,这两种状态时随机决定的,导致携带相同基因的细胞群体出现两种细胞表型。而当转录因子的本底转录水平太低时,自激活模体只能出现非激活状态,当本底转录水平过高时,自激活模体只能出现激活状态。又由于现有的动态调控或依赖细胞生长环境的外部条件,或与细胞自生的代谢过程耦合且各有缺陷。
本公开利用以上信息,设计了一种基因元件,将转录因子序列配置于该转录因子序列的启动子序列与下游基因之间,将该转录因子的表达与基因的表达耦合。在转录过程中,启动子序列被rna聚合酶识别后开始转录下游的转录因子序列和基因序列,转录因子的表达水平会影响其自身的激活状态进而又影响基因序列的表达水平。而转录因子的初始表达水平又与细胞的生长状态有关。因此,本公开结合细胞的全局资源调控机制和基因元件,调节基因的表达水平。当细胞营养充分的情况下,细胞的生长速率快,细胞的资源大量用于产生核糖体,具有组成型转录活性的转录因子的本底表达(转录)水平低,只能处于非激活状态,由于基因元件配置在待调控基因的上游,两者之间耦合,使得该基因的表达水平也降低了。而当细胞营养缺乏时,细胞的生长速率慢,细胞大量资源分配给产生与代谢相关的蛋白,具有组成型转录活性的转录因子的本底表达(转录)水平高,转录因子处于自我激活状态,此时,下游的待调控基因受转录因子的影响,表达水平也随之提高。
该基因元件与细胞的生长速率耦合,通过细胞生长速率的变化,适应性的调整外源基因的表达程度,从而实现自动、可编程的代谢动态调控。本公开涉及到改造的基因非常少,不直接与细胞的代谢网络相连接,具有很好的正交性,避免了产生不必要的代谢干扰,同时也无需对底盘细胞进行大量的基因改造。
在一些实施例中,转录因子序列被配置为表达具有组成型转录活性的转录因子,使得转录因子在无诱导剂的情况下具有转录活性。
其中,本文所使用的术语“组成型转录活性的转录因子”是指由于受诱导剂诱导或与特定分子结合构象发生改变后获得的转录因子,该类转录因子在不存在诱导剂或特定分子的情况下,具有转录活性或聚合形成多聚体后具有转录活性。
由于翻译获得的转录因子为设计后的构象,具有组成型转录活性,在不需要诱导剂的情况下也具有转录活性。因此,该转录因子才能够直接或在聚合后与启动子相互作用,控制转录因子序列下游基因表达(转录)而不需要诱导剂的参与。适用于表达外源蛋白或具有特定活性的酶用于生产非蛋白产物。本公开利用改造后的激活因子,解决了使用基因元件的过程中诱导剂的成本消耗的问题,全过程自动发生,也不依赖培养基组分。
在一些实施例中,转录因子序列被配置为表达n端具有与l-阿拉伯糖结合后的构象的arac/xyls家族蛋白。
在自然状态下,大肠杆菌细胞内源的l-阿拉伯糖响应通路中的转录因子arac蛋白,需要结合l-阿拉伯糖后成为激活状态的arac·l-ara才能够启动pbad启动子的转录。通过对arac/xyls家族蛋白晶体结构的解析,了解到arac/xyls家族蛋白的n端结构域负责与l-阿拉伯糖结合改变构象,俩俩形成二聚体才具有转录活性,通过对n端蛋白序列的突变,可以实现n端结构域的构象变换,实现组成型的转录活性。
在一些实施例中,转录因子包括具有组成型转录活性的arac蛋白、rhas蛋白或rhar蛋白。基因元件中使用的启动子和激活蛋白也可以是其他激活因子和其启动子的组合,包括arac/xyls家族内的激活因子和对应的启动子。具有组成型转录活性的arac蛋白、rhas蛋白和rhar蛋白是arac/xyls家族中野生型的arac、rhas和rhar蛋白的n或c端序列进行氨基酸替换的变体,通过改造,存在多个活性不同的arac蛋白、rhas蛋白和rhar蛋白的变体,根据所需要的转录强度可以自由选择。
在一些实施例中,转录因子为arac-1蛋白,转录因子的核苷酸序列为seqidno.1。
在一些实施例中,转录因子为arac-2蛋白,转录因子的核苷酸序列为seqidno.2。
在一些实施例中,转录因子为arac-3蛋白,转录因子的核苷酸序列为seqidno.3。
在一些实施例中,转录因子为arac-4蛋白,转录因子的核苷酸序列为seqidno.4。
在一些实施例中,转录因子为arac-5蛋白,转录因子的核苷酸序列为seqidno.5。
在一些实施例中,转录因子为rhas-1蛋白,转录因子的核苷酸序列为seqidno.6。
在一些实施例中,转录因子为rhar-1蛋白,转录因子的核苷酸序列为seqidno.7。
在一些实施例中,启动子序列被配置为野生型的pbad启动子序列或野生型的prhas启动子序列。
在一些实施例中,启动子序列被配置为删除了野生型的pbad启动子序列上游的crp结合位点后的pbad-1启动子序列,pbad-1启动子序列的核苷酸序列为seqidno.8。
在一些实施例中,启动子序列被配置为删除了野生型的prhas启动子序列上游的crp结合位点后的prhas-1启动子,prhas-1启动子序列的核苷酸序列为seqidno.9。
在一些实施例中,基因元件包括pbad启动子和arac-1蛋白,基因元件的核苷酸序列为seqidno.10。
在一些实施例中,基因元件被配置为调控基因或基因簇的表达。
在一些实施例中,还包括终止子,终止子被配置在基因元件的上游或下游序列,用于阻遏转录干扰。
在一些实施例中,还包括荧光报告基因,荧光报告基因被配置于基因元件的下游序列,用于表征基因或基因簇的表达水平。将mvenus荧光报告基因置于下游,用于表征被动态调控的基因或基因簇的表达水平。
本公开还提供了一种基因元件的使用方法,包括:将配置有基因元件的细胞在培养基中培养;当细胞的浓度od600超过0.2时,收集细胞并将稀释后的细胞接种至新的培养基中继续培养。
将构建好的配置有基因元件的菌株在合适的培养平板中划线,挑取大小适中的单克隆到lb培养基中,37℃培养至少3h,至其od600超过0.2,离心收集细胞,使用mops缓冲液将细胞重悬洗净,接种到新鲜的sob培养基,控制od600浓度在低于0.1以下,37℃震荡培养,控制细胞od600始终低于0.2,od接近0.2时进行转接,按照1:100~500比例转接到新鲜预热的sob培养基,当od600再次到达0.2时按照1:50~1000转接到新鲜预热的sob培养基中。
一些实施方案中,可以将带有该调控线路的细胞直接转入富含营养的培养基中进行一步培养,培养基可以是常用的培养基lb、sob、yt、tb、rdm等培养基,细胞在生长初期,没有受到环境中的营养限制,处于快速生长状态,该基因元件中的转录因子表达水平低,处于非激活状态。随着细胞的生长和细胞密度上升,部分营养物质消耗,对细胞的生长产生了一定的限制,细胞生长速度开始放缓进入产物生产阶段,转录因子的表达水平高,自我激活状态自动开启,与该转录因子表达耦合的下游基因的表达水平也提高。
本公开还提供了另一种基因元件的使用方法,包括:将配置有基因元件的细胞在培养基中培养;当细胞的浓度od600超过0.2时,收集细胞并将稀释后的细胞接种至新的培养基中培养;当所述细胞浓度od600接近0.2时,向新的培养基中补充细胞外源产物的前体物质后继续培养。
将构建好的配置有基因元件的菌株在合适的培养平板中划线,挑取大小适中的单克隆到lb培养基中,37℃培养至少3h,至其od600超过0.2,离心收集细胞,使用mops缓冲液将细胞重悬洗净,接种到新鲜的rdm培养基(葡萄糖作为碳源),控制od600浓度在低于0.02以下,37℃震荡培养,控制细胞od600始终低于0.2,od600接近0.2时进行转接,按照1:100-500比例转接到到新鲜的rdm培养基,再次达到细胞0.2时细胞转接到新鲜预热的培养基,当细胞生长浓度od600接近0.2时准备进行补料,补料培养基采用mops培养基(葡萄糖作为碳源),然后继续培养,由于补料培养基缺乏细胞可以直接利用的氨基酸等营养物质,细胞生长速率下降,转录因子处于激活状态。
该种基因元件的使用方法可以用于流加式发酵,在细胞生长阶段,细胞高速生长,转录因子的表达水平低,处于非激活状态。当进入细胞产物的生产阶段后,配置流加培养基以维持细胞处于低速生长状态,此时转录因子高表达并处于激活状态,与其耦合的下游基因也高水平表达。而流加式发酵可以在发酵的产物产生阶段(细胞低生长速率阶段),进行一定的外源产物前体的补充,可以提高单位体积的产量,同时给与细胞一定量的用于生长的营养成分,延长产物产生阶段的时长,以进一步提高外源基因产物的表达。
在一些实施例中,将基因元件通过无痕组装法配置在待调控基因或基因簇的序列上游。通过标准的无痕组装法将待调控的基因或基因簇插入所述基因元件的下游使用。
在一些实施例中,将基因元件通过基因组装法配置于细胞的基因组或质粒中。利用标准的基因组装方法,如二型-s限制酶-t4连接酶无痕组装法、吉布森组装法或dna化学合成法得到基因元件,该基因元件可以通过标准的组装方法装入到质粒中或者直接敲入细胞的基因组中使用。
在一些实施例中,将基因元件的序列、由与基因元件相同的启动子序列和待调控的基因或基因簇序列串联构成的序列配置在同一细胞内使用。
在一些实施例中,细胞被配置为大肠杆菌细胞、枯草芽孢杆菌、乳酸菌、链霉菌、酵母菌、棒杆菌、动物细胞中的一种。本发明创造不依赖细胞的遗传背景,适用于各种常用的细胞底盘。
在一些实施例中,培养基被配置为lb培养基、sob培养基、yt培养基、tb培养基、rdm培养基中的一种或多种。
在本公开的一个实施例中,基因元件的结构示意图如图1所示,基因元件包括相互串联的转录因子特异的启动子序列1和转录因子序列2。转录因子序列的下游为与待调控基因的基因序列3。
在本公开的一个实施例中,根据细胞生长速率与待调控基因的表达水平的关系如图2所示,快速生长阶段,被调控基因表达水平很低(l1),随着细胞生长速率变慢,被调控基因的表达水平迅速升高,基因线路处于激活状态(l2)。
在本公开的一个实施例中,将构建好的配置有基因元件的菌株在合适的培养平板中划线,挑取大小适中的单克隆到lb培养基中,37℃培养至少三小时,至其od600超过0.2,离心收集细胞,使用mops缓冲液将细胞重悬洗净,接种到新鲜的sob培养基,控制od600浓度在低于0.1以下,37℃震荡培养,控制细胞od600始终低于0.2,od接近0.2时进行转接,按照1:100~500比例转接到新鲜预热的sob培养基,当od600再次到达0.2时按照1:50~1000转接到新鲜预热的sob培养基中,此时,定时取样,测定细胞的报告基因的表达量和od600,用于表征细胞内外源基因的表达强度和计算细胞的生长速率。实验结果如图3,其中,在细胞生长速率下降到1.0/h后,基因表达水平开始上升,当od600接近0.2时,细胞生长速率开始迅速下降,此时动态调控基因线路进入激活状态,报告基因信号迅速上升,此时细胞生长速率维持在一个较低的生长速率。大约8h后,细胞的生长基本进入停滞状态,此时细胞的外源表达量达到最高值。
在本公开的一个实施例中,将构建好的配置有基因元件的菌株在合适的培养平板中划线,挑取大小适中的单克隆到lb培养基中,37℃培养至少三小时,至其od600超过0.2,离心收集细胞,使用mops缓冲液将细胞重悬洗净,接种到新鲜的rdm培养基(葡萄糖作为碳源),控制od600浓度在低于0.02以下,37℃震荡培养,控制细胞od600始终低于0.2,od600接近0.2时进行转接,按照1:100-500比例转接到到新鲜的rdm培养基,再次达到细胞0.2时细胞转接到新鲜预热的培养基,当细胞生长浓度od600接近0.2时准备进行补料,补料培养基采用了mops培养基(葡萄糖作为碳源),继续培养,由于补料培养基缺乏细胞可以直接利用的氨基酸等营养物质,细胞生长速率下降,动态调控线路打开,整个过程中,进行细胞密度和报告基因表达强度的测定,实验结果如图4。
如图4所示,在补料发酵过程中,当细胞生长速率下降进入细胞产物生产阶段后,使用不同配方的补料培养基的前提下,待调控基因的表达水平相对于快速生长阶段的表达水平差异(生产阶段的基因表达水平/生长阶段的基因表达水平)。
尽管已经通过优选实施例进一步详细说明和描述了本发明,但是本发明不限于所公开的示例,并且本领域技术人员可以在不脱离本发明的范围的情况下从其中得出其他变型。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
序列表
<110>中国科学院深圳先进技术研究院
<120>一种基因元件及其使用方法
<160>10
<170>siposequencelisting1.0
<210>1
<211>879
<212>dna
<213>人工序列(artificialsequence)
<400>1
atggctgaagcgcaaaatgatctgctgctgccgggatactcgtttaatgcccatctggtg60
gcgggtttaacgccgattgaggccaacggttatctcgatttttttatcgaccgaccgctg120
ggaatgaaaggttatattctcaatctcaccattcgcggtcagggggtggtgaaaaatcag180
ggacgagaatttgtttgccgaccgggtgatattttgctgttcccgccaggagagattcat240
cactacggtcgtcatccggaggctcgcgaatggtatcaccagtgggtttactttcgtccg300
cgcgcctactggcatgaatggcttaactggccgtcaatatttgccaatacggggttcttt360
cgcccggatgaagcgcaccagccgcatttcagcgacctgtttgggcaaatcattaacgcc420
gggcaaggggaagggcgctattcggagctgctggcgataaatctgcttgagcaattgtta480
ctgcggcgcatggaagcgattaacgagtcgctccatccaccgatggataatcgggtacgc540
gaggcttgtcagtacatcagcgatcacctggcagacagcaattttgatatcgccagcgtc600
gcacagcatgtttgcttgtcgccgtcgcgtctgtcacatcttttccgccagcagttaggg660
attagcgtcttaagctggcgcgaggaccaacgtatcagccaggcgaagctgcttttgagc720
accacccggatgcctatcgccaccgtcggtcgcaatgttggttttgacgatcaactctat780
ttctcgcgggtatttaaaaaatgcaccggggccagcccgagcgagttccgtgccggttgt840
gaagaaaaagtgaatgatgtagccgtcaagttgtcataa879
<210>2
<211>879
<212>dna
<213>人工序列(artificialsequence)
<400>2
atggctgaagcgcaaaatgatcccaaactgccgggatactcgtttaatgcccatctggtg60
gcgggtttaacgccgattgaggccaacggttatctcgatttttttatcgaccgaccgctg120
ggaatgaaaggttatattctcaatctcaccattcgcggtcagggggtggtgaaaaatcag180
ggacgagaatttgtttgccgaccgggtgatattttgctgttcccgccaggagagattcat240
cactacggtcgtcatccggaggctcgcgaatggtatcaccagtgggtttactttcgtccg300
cgcgcctactggcatgaatggcttaactggccgtcaatatttgccaatacggggttcttt360
cgcccggatgaagcgcaccagccgcatttcagcgacctgtttgggcaaatcattaacgcc420
gggcaaggggaagggcgctattcggagctgctggcgataaatctgcttgagcaattgtta480
ctgcggcgcatggaagcgattaacgagtcgctccatccaccgatggataatcgggtacgc540
gaggcttgtcagtacatcagcgatcacctggcagacagcaattttgatatcgccagcgtc600
gcacagcatgtttgcttgtcgccgtcgcgtctgtcacatcttttccgccagcagttaggg660
attagcgtcttaagctggcgcgaggaccaacgtatcagccaggcgaagctgcttttgagc720
accacccggatgcctatcgccaccgtcggtcgcaatgttggttttgacgatcaactctat780
ttctcgcgggtatttaaaaaatgcaccggggccagcccgagcgagttccgtgccggttgt840
gaagaaaaagtgaatgatgtagccgtcaagttgtcataa879
<210>3
<211>879
<212>dna
<213>人工序列(artificialsequence)
<400>3
atggctgaagcgcaaaatgatcccccgctgccgggatactcgtttaatgcccatctggtg60
gcgggtttaacgccgattgaggccaacggttatctcgatttttttatcgaccgaccgctg120
ggaatgaaaggttatattctcaatctcaccattcgcggtcagggggtggtgaaaaatcag180
ggacgagaatttgtttgccgaccgggtgatattttgctgttcccgccaggagagattcat240
cactacggtcgtcatccggaggctcgcgaatggtatcaccagtgggtttactttcgtccg300
cgcgcctactggcatgaatggcttaactggccgtcaatatttgccaatacggggttcttt360
cgcccggatgaagcgcaccagccgcatttcagcgacctgtttgggcaaatcattaacgcc420
gggcaaggggaagggcgctattcggagctgctggcgataaatctgcttgagcaattgtta480
ctgcggcgcatggaagcgattaacgagtcgctccatccaccgatggataatcgggtacgc540
gaggcttgtcagtacatcagcgatcacctggcagacagcaattttgatatcgccagcgtc600
gcacagcatgtttgcttgtcgccgtcgcgtctgtcacatcttttccgccagcagttaggg660
attagcgtcttaagctggcgcgaggaccaacgtatcagccaggcgaagctgcttttgagc720
accacccggatgcctatcgccaccgtcggtcgcaatgttggttttgacgatcaactctat780
ttctcgcgggtatttaaaaaatgcaccggggccagcccgagcgagttccgtgccggttgt840
gaagaaaaagtgaatgatgtagccgtcaagttgtcataa879
<210>4
<211>879
<212>dna
<213>人工序列(artificialsequence)
<400>4
atggctgaagcgcaaaatgatcccctgatgccgggatactcgtttaatgcccatctggtg60
gcgggtttaacgccgattgaggccaacggttatctcgatttttttatcgaccgaccgctg120
ggaatgaaaggttatattctcaatctcaccattcgcggtcagggggtggtgaaaaatcag180
ggacgagaatttgtttgccgaccgggtgatattttgctgttcccgccaggagagattcat240
cactacggtcgtcatccggaggctcgcgaatggtatcaccagtgggtttactttcgtccg300
cgcgcctactggcatgaatggcttaactggccgtcaatatttgccaatacggggttcttt360
cgcccggatgaagcgcaccagccgcatttcagcgacctgtttgggcaaatcattaacgcc420
gggcaaggggaagggcgctattcggagctgctggcgataaatctgcttgagcaattgtta480
ctgcggcgcatggaagcgattaacgagtcgctccatccaccgatggataatcgggtacgc540
gaggcttgtcagtacatcagcgatcacctggcagacagcaattttgatatcgccagcgtc600
gcacagcatgtttgcttgtcgccgtcgcgtctgtcacatcttttccgccagcagttaggg660
attagcgtcttaagctggcgcgaggaccaacgtatcagccaggcgaagctgcttttgagc720
accacccggatgcctatcgccaccgtcggtcgcaatgttggttttgacgatcaactctat780
ttctcgcgggtatttaaaaaatgcaccggggccagcccgagcgagttccgtgccggttgt840
gaagaaaaagtgaatgatgtagccgtcaagttgtcataa879
<210>5
<211>879
<212>dna
<213>人工序列(artificialsequence)
<400>5
atggctgaagcgcaaaatgatcccctgctgcgcggatactcgtttaatgcccatctggtg60
gcgggtttaacgccgattgaggccaacggttatctcgatttttttatcgaccgaccgctg120
ggaatgaaaggttatattctcaatctcaccattcgcggtcagggggtggtgaaaaatcag180
ggacgagaatttgtttgccgaccgggtgatattttgctgttcccgccaggagagattcat240
cactacggtcgtcatccggaggctcgcgaatggtatcaccagtgggtttactttcgtccg300
cgcgcctactggcatgaatggcttaactggccgtcaatatttgccaatacggggttcttt360
cgcccggatgaagcgcaccagccgcatttcagcgacctgtttgggcaaatcattaacgcc420
gggcaaggggaagggcgctattcggagctgctggcgataaatctgcttgagcaattgtta480
ctgcggcgcatggaagcgattaacgagtcgctccatccaccgatggataatcgggtacgc540
gaggcttgtcagtacatcagcgatcacctggcagacagcaattttgatatcgccagcgtc600
gcacagcatgtttgcttgtcgccgtcgcgtctgtcacatcttttccgccagcagttaggg660
attagcgtcttaagctggcgcgaggaccaacgtatcagccaggcgaagctgcttttgagc720
accacccggatgcctatcgccaccgtcggtcgcaatgttggttttgacgatcaactctat780
ttctcgcgggtatttaaaaaatgcaccggggccagcccgagcgagttccgtgccggttgt840
gaagaaaaagtgaatgatgtagccgtcaagttgtcataa879
<210>6
<211>351
<212>dna
<213>人工序列(artificialsequence)
<400>6
caggagaacctggaaaacagcgcatcacgtctcaacttgcttctggcctggctggaggac60
cattttgccgatgaggtgaattgggatgccgtggcggatcaattttctctttcaagacgt120
acgctacatcggcagcttaagcagcaaacgggactgacgcctcagcgatacctgaaccgc180
ctgcgactgatgaaagcccgacatctgctacgccacagcgaggccagcgttactgacatc240
gcctatcgctgtggattcagcgacagtaaccacttttcgacgctttttcgccgagagttt300
aactggtcaccgcgtgatattcgccagggacgggatggctttctgcaataa351
<210>7
<211>357
<212>dna
<213>人工序列(artificialsequence)
<400>7
atgagtgattcgttgccgccaacatccagcgaaacgttgctggataagctgattacccgg60
ctggcggctagcctgaaaagtccctttgcgctggataaattttgtgatgaggcatcgtgc120
agtgagcgcgttttgcgtcagcaatttcgccagcagactggaatgaccatcaatcaatat180
ctgcgacaggtcagagtgtgtcatgcgcaatatcttctccagcatagccgcctgttaatc240
agtgatatttcggcggaatgtggctttgaagatagtaactatttttcggtggtgtttacc300
cgggaaaccgggatgacgcccagccagtggcgtcatctcaattcgcagaaagattaa357
<210>8
<211>82
<212>dna
<213>人工序列(artificialsequence)
<400>8
tgctatgccatagcaagatagtccataagattagcggatcctacctgacgctttttatcg60
caactctctactgtttctccat82
<210>9
<211>82
<212>dna
<213>人工序列(artificialsequence)
<400>9
gtggttttccgtcgaaaatttaaggtaagaacctgacctcgtgattactatttcgccgtg60
ttgacgacatcaggaggccagt82
<210>10
<211>1991
<212>dna
<213>人工序列(artificialsequence)
<400>10
ctcggtaccaaattccagaaaagaggccgcgaaagcggccttttttcgttttggtcctac60
tagatgcctccacaccgctcgtcacatcctgggagacctgctatgccatagcaagatagt120
ccataagattagcggatcctacctgacgctttttatcgcaactctctactgtttctccat180
accgtttttttgggctagcgctactagagaaagaggagaaatactagatggctgaagcgc240
aaaatgatctgctgctgccgggatactcgtttaatgcccatctggtggcgggtttaacgc300
cgattgaggccaacggttatctcgatttttttatcgaccgaccgctgggaatgaaaggtt360
atattctcaatctcaccattcgcggtcagggggtggtgaaaaatcagggacgagaatttg420
tttgccgaccgggtgatattttgctgttcccgccaggagagattcatcactacggtcgtc480
atccggaggctcgcgaatggtatcaccagtgggtttactttcgtccgcgcgcctactggc540
atgaatggcttaactggccgtcaatatttgccaatacggggttctttcgcccggatgaag600
cgcaccagccgcatttcagcgacctgtttgggcaaatcattaacgccgggcaaggggaag660
ggcgctattcggagctgctggcgataaatctgcttgagcaattgttactgcggcgcatgg720
aagcgattaacgagtcgctccatccaccgatggataatcgggtacgcgaggcttgtcagt780
acatcagcgatcacctggcagacagcaattttgatatcgccagcgtcgcacagcatgttt840
gcttgtcgccgtcgcgtctgtcacatcttttccgccagcagttagggattagcgtcttaa900
gctggcgcgaggaccaacgtatcagccaggcgaagctgcttttgagcaccacccggatgc960
ctatcgccaccgtcggtcgcaatgttggttttgacgatcaactctatttctcgcgggtat1020
ttaaaaaatgcaccggggccagcccgagcgagttccgtgccggttgtgaagaaaaagtga1080
atgatgtagccgtcaagttgtcataataaatcgatgcaggtggcacttttcggtctcaaa1140
gaagctgtcaccggatgtgctttccggtctgatgagtccgtgaggacgaaacagcctcta1200
caaataattttgtttaatgtctaatggcggttttctaaatggtttctaaaggtgaagaac1260
tgttcaccggtgttgttccgatcctggttgaactggacggtgacgttaacggtcacaaat1320
tctctgtttctggtgaaggtgaaggtgacgctacctacggtaaactgaccctgaaactga1380
tctgcaccaccggtaaactgccggttccgtggccgaccctggttaccaccctgggttacg1440
gtgttcagtgcttcgctcgttacccggaccacatgaaacagcacgacttcttcaaatctg1500
ctatgccggaaggttacgttcaggaacgtaccatcttcttcaaagacgacggtaactaca1560
aaacccgtgctgaagttaaattcgaaggtgacaccctggttaaccgtatcgaactgaaag1620
gtatcgacttcaaagaagacggtaacatcctgggtcacaaactggaatacaactacaact1680
ctcacaacgtttacatcaccgctgacaaacagaaaaacggtatcaaagctaacttcaaaa1740
tccgtcacaacatcgaagacggtggtgttcagctggctgaccactaccagcagaacaccc1800
cgatcggtgacggtccggttctgctgccggacaaccactacctgtcttaccagtctaaac1860
tgtctaaagacccgaacgaaaaacgtgaccacatggttctgctggaattcgttaccgctg1920
ctggtatcaccctgggtatggacgaactgtacaaagctgcaaacgacgaaaactacgctt1980
tagtagcttaa1991
1.一种基因元件,用于调控基因的表达,其特征在于,具有:
转录因子序列,所述转录因子序列的表达被配置为与所述基因的表达耦合;
启动子序列,其被配置在所述转录因子序列的上游,用于启动所述启动子的下游序列表达。
2.根据权利要求1所述的基因元件,其特征在于,所述转录因子序列被配置为表达具有组成型转录活性的转录因子,使得所述转录因子在无诱导剂的情况下具有转录活性。
3.根据权利要求2所述的基因元件,其特征在于,所述转录因子序列被配置为表达n端具有与l-阿拉伯糖结合后的构象的arac/xyls家族蛋白。
4.根据权利要求3所述的基因元件,其特征在于,所述转录因子为arac-1蛋白,所述转录因子的核苷酸序列为seqidno.1。
5.根据权利要求3所述的基因元件,其特征在于,所述转录因子为arac-2蛋白,所述转录因子的核苷酸序列为seqidno.2。
6.根据权利要求3所述的基因元件,其特征在于,所述转录因子为arac-3蛋白,所述转录因子的核苷酸序列为seqidno.3。
7.根据权利要求3所述的基因元件,其特征在于,所述转录因子为arac-4蛋白,所述转录因子的核苷酸序列为seqidno.4。
8.根据权利要求3所述的基因元件,其特征在于,所述转录因子为arac-5蛋白,所述转录因子的核苷酸序列为seqidno.5。
9.根据权利要求3所述的基因元件,其特征在于,所述转录因子为rhas-1蛋白,所述转录因子的核苷酸序列为seqidno.6。
10.根据权利要求3所述的基因元件,其特征在于,所述转录因子为rhar-1蛋白,所述转录因子的核苷酸序列为seqidno.7。
11.根据权利要求3所述的基因元件,其特征在于,所述启动子序列被配置为野生型的pbad启动子序列或野生型的prhas启动子序列。
12.根据权利要求11所述的基因元件,其特征在于,所述启动子序列被配置为删除了野生型的pbad启动子序列上游的crp结合位点后的pbad-1启动子序列,所述pbad-1启动子序列的核苷酸序列为seqidno.8。
13.根据权利要求12所述的基因元件,其特征在于,所述启动子序列被配置为删除了野生型的prhas启动子序列上游的crp结合位点后的prhas-1启动子,所述prhas-1启动子序列的核苷酸序列为seqidno.9。
14.根据权利要求1~13任一项所述的基因元件,其特征在于,所述基因元件包括pbad启动子和arac-1蛋白,所述基因元件的核苷酸序列为seqidno.10。
15.根据权利要求1~13任一项所述的基因元件,其特征在于,所述基因元件被配置为调控基因或基因簇的表达。
16.根据权利要求15所述的基因元件,其特征在于,还包括终止子,所述终止子被配置在所述基因元件的上游或下游序列,用于阻遏转录干扰。
17.根据权利要求16所述的基因元件,其特征在于,还包括荧光报告基因,所述荧光报告基因被配置于所述基因元件的下游序列,用于表征基因或基因簇的表达水平。
18.一种基因元件的使用方法,其特征在于,该方法包括:
将配置有所述基因元件的细胞在培养基中培养;
当所述细胞的浓度od600超过0.2时,收集所述细胞并将稀释后的所述细胞接种至新的培养基中继续培养。
19.一种基因元件的使用方法,其特征在于,包括:
将配置有所述基因元件的细胞在培养基中培养;
当所述细胞的浓度od600超过0.2时,收集所述细胞并将稀释后的所述细胞接种至新的培养基中培养;
当所述细胞浓度od600接近0.2时,向新的培养基中补充所述细胞外源产物的前体物质后继续培养。
20.根据权利要求18或19所述的基因元件的使用方法,其特征在于,所述基因元件被配置为通过无痕组装法配置在待调控基因或基因簇的序列上游使用。
21.根据权利要求18或19所述的基因元件的使用方法,其特征在于,所述基因元件被配置为通过基因组装法配置于细胞的基因组或质粒中使用。
22.根据权利要求18或19所述的基因元件的使用方法,其特征在于,将所述基因元件的序列,由与所述基因元件相同的启动子序列和待调控的基因或基因簇序列串联构成的序列配置在同一细胞内使用。
23.根据权利要求18或19所述的基因元件的使用方法,其特征在于,所述细胞被配置为大肠杆菌细胞、枯草芽孢杆菌、乳酸菌、链霉菌、酵母菌、棒杆菌、动物细胞中的一种。
24.根据权利要求18或19所述的基因元件的使用方法,其特征在于,所述培养基被配置为lb培养基、sob培养基、yt培养基、tb培养基、rdm培养基中的一种或多种。
技术总结