本发明涉及一种特异性识别黄原胶侧链的碳水化合物结合模块cbm6b蛋白质及应用,属于生物技术领域。
背景技术:
黄原胶作为自1969年以来第一种大规模生产的生物聚合物,具备诸多优良特性,应用十分广泛。其降解产物黄原胶寡糖已被证明是集抑菌、抗氧化、抗肿瘤等活性于一体的新型功能性寡糖,在食品、医药等领域有着广阔的应用前景。因此,寻找能够高效、精准降解黄原胶的方法迫在眉睫。目前,黄原胶降解主要是通过物理法、化学法和生物法来实现。于制备寡糖而言,物理法对仪器要求较高,且能耗大,难以实现大规模工业化生产。化学法制备黄原胶寡糖过程中会产生有毒化合物,对环境不友好。生物法主要利用酶作用黄原胶,使黄原胶的糖苷键发生断裂,产生侧链修饰或生成低分子量的寡糖。相对物理化学法,生物法的成本低廉,能够生成特异性更高的产物。
酶法生产黄原胶寡糖的主要瓶颈就是缺少能够高效、稳定发挥作用的黄原胶酶。黄原胶的主链为类纤维素结构,富含取代基的三糖侧链结构形成了酶攻击主链的屏障。黄原胶二级结构、三级结构较为复杂,限制了酶对底物的可及性,使一般的碳水化合物活性酶的难以降解黄原胶。
碳水化合物结合模块(cbm)是一类可以精准识别并结合各种形式的碳水化合物的蛋白质模块,该模块并无催化活性。cbm通常能够发挥邻近、靶向功能,从而增加底物表面的酶浓度,提高酶与底物的亲和能力,以此来影响酶的催化速率及稳定性。迄今为止,关于cbm与碳水化合物活性酶融合表达以高效水解黄原胶的研究尚未有人尝试。挖掘对黄原胶底物有特异性的碳水化合物结合模块和黄原胶降解酶是高效精准切割黄原胶,制备黄原胶寡糖的首要任务。
技术实现要素:
本发明利用融合表达的手段,选取微杆菌xt11的黄原胶裂解酶的碳水化合物结合模块cbm6b作为底物结合域,对其进行理性改造,构建碳水化合物活性酶-cbm6b融合表达载体。将表达载体转化至遗传背景清晰的大肠杆菌中,高水平表达兼具高催化活性和稳定性的融合酶。旨在获得具备稳定、高效、定点切割能力的黄原胶酶,为快速、精准切割黄原胶,制备黄原胶寡糖打下基础。
本发明的目的在于提供一种含有能够特异性识别黄原胶侧链的碳水化合物结合模块cbm6b基因及其重组载体。此外,本发明提供了一种利用构建的大肠杆菌表达载体转化的大肠杆菌宿主。
本发明提供了一种基因,为1a)~2a)中的一种:
1a)如seqidno.1所示的核苷酸序列;
2a)与seqidno.1所示的核苷酸序列至少具有90%以上同源性编码所述蛋白质的dna分子。
本发明还提供了所述基因编码的碳水化合物结合模块蛋白质,为1b)~3b)中的一种:
1b)具有如seqidno.2所示氨基酸序列的蛋白质;
2b)将seqidno.2所示的氨基酸序列经过1个或多个氨基酸残基的取代和/或缺失和/或添加得到的具有相同功能的蛋白质;
3b)含有序列表中seqidno.2所示的氨基酸序列的具有相同功能的蛋白质。
本发明还提供了所述碳水化合物结合模块蛋白质与碳水化合物活性酶构建的融合表达载体。
进一步地,上述技术方案中,所述碳水化合物活性酶包括糖苷水解酶类、糖基转移酶类、多糖裂解酶类或糖酯酶类。
进一步地,上述技术方案中,所述糖苷水解酶包括纤维素内切酶和黄原胶内切酶。
本发明还提供了一种含有所述融合表达载体的重组表达菌。
本发明还提供了所述碳水化合物结合模块在识别黄原胶侧链、降解黄原胶制备黄原胶寡糖中的应用。
本申请的有益效果包括:
本发明利用生物信息学及分子生物学手段,选取微杆菌xt11的黄原胶裂解酶碳水化合物结合模块cbm6b作为底物结合域,对其进行理性改造。甄选高活力的碳水化合物活性酶为催化结构域,构建碳水化合物活性酶-cbm6b融合表达载体。将其转化至大肠杆菌中,诱导表达融合酶。本发明发现cbm6b能够提高碳水化合物活性酶识别底物黄原胶的能力,使其可以高效、靶向作用底物,提高酶活力,从而获得聚合度集中的黄原胶寡糖。为黄原胶的酶法降解提供了新思路,为黄原胶寡糖的工业化生产和寡糖构效关系的研究打下基础。cbm6b能够提高重组酶与底物黄原胶的亲和能力及催化能力,为高效、精准切割黄原胶,制备黄原胶寡糖打下基础。
附图说明
图1是微杆菌microbacteriumsp.xt11全基因组dna的电泳图,图中,泳道m为marker蛋白,泳道1为微杆菌microbacteriumsp.xt11。
图2是cbm6b目的片段的琼脂糖凝胶电泳图,图中,泳道m为100bpdnamarker,泳道1为cbm6b。
图3是重组质粒pet28a-cbm6b的构建流程图。
图4是重组质粒pet28a-cbm6b酶切鉴定琼脂糖凝胶电泳图,图中,泳道m为100bpdnamarker,泳道1-5为pet28a-cbm6b双酶切后dna片段。
图5是ctcel8a目的片段的琼脂糖凝胶电泳图,图中,泳道m为250bpdnamarker,泳道1为ctcel8a。
图6是表达载体pet28a-ctcel8a-cbm6b的构建流程图。
图7是表达载体pet28a-ctcel8a-cbm6b的酶切鉴定琼脂糖凝胶电泳图,图中,泳道m为1kbdnamarker,泳道1-2为pet28a-ctcel8a-cbm6b双酶切后的dna片段。
图8是带mixencd同源臂的cbm6b目的片段的琼脂糖凝胶电泳图,图中,泳道m为100bpdnamarker,泳道1为带mixencd同源臂的cbm6b。
图9是表达载体pet28a-mixencd-6b的构建流程图。
图10是表达载体pet28a-mixencd-6b的酶切鉴定琼脂糖凝胶电泳图,图中,泳道m为1kbdnamarker,泳道1-4为pet28a-mixencd-6b双酶切后的dna片段。
图11是融合酶ctcel8a-cbm6b的sds-page分析,图中,泳道m为proteinhighmarker,泳道1为融合酶ctcel8a-cbm6b。
图12是融合酶mixencd-6b的sds-page分析,图中,泳道m为proteinhighmarker,泳道1为融合酶mixencd-6b。
图13是纤维素内切酶ctcel8a和融合酶ctcel8a-cbm6b酶活力测定结果。
图14是纤维素内切酶ctcel8a和融合酶ctcel8a-cbm6b水解黄原胶的凝胶渗透色谱结果。
图15是纤维素内切酶ctcel8a和融合酶ctcel8a-cbm6b水解黄原胶的傅里叶红外光谱表征结果。
图16是重组黄原胶内切酶mixen-cd及融合酶mixencd-6b的酶活力测定结果。
图17是重组黄原胶内切酶mixen-cd及融合酶mixencd-6b降解产物的离子色谱表征结果。
具体实施方式
下述非限定性实施例可以使本领域的普通技术人员更全面地理解本发明,但不以任何方式限制本发明。
本发明构建所用的引物及ni-nta亲和填料均由上海生工公司合成;pcr反应所需的酶及各试剂均购自大连宝生物公司。
实施例1碳水化合物结合模块cbm6b表达载体的构建
a、微杆菌microbacteriumsp.xt11基因组dna的提取(ctab/nacl法)
微杆菌microbacteriumsp.xt11(由本实验室从土壤中筛选的黄原胶降解菌xt11的中国典型培养物保藏中心编号为ab2016011,基因组序列在ddbj/embl/genbank数据库中的登录号为cp013859)。
4℃低温离心收集10ml新鲜的微杆菌xt11种子液,并用纯水重悬清洗菌体。用20μl浓度为10mg/ml的溶菌酶裂解菌体,加入1ml1×te后轻柔混匀,37℃反应1h。反应结束后,将菌体转移至新的2ml进口离心管中,依次加入10μl10mg/ml蛋白酶k、60μl10%sds,混匀后,37℃反应1h。
加入100μl的5mnacl、80μlctab/nacl缓冲液(称取5gctab和2.045gnacl,加纯水至50ml,过0.45μm滤膜),混匀后,65℃反应30min。用等量的tris-酚/氯仿/异戊醇(25:24:1)抽提核酸后,用异丙醇沉淀核酸,并用75%乙醇清洗核酸沉淀。最后用终浓度为100μg/ml的rnasea(核糖核酸酶a)处理核酸,溶解后电泳检验(见图1)并测定基因组dna浓度为2253ng/μl。a260/a230为2.01,a260/a280为1.93,质量良好,冻存备用,命名为xt11-gdna。
b、利用pcr技术扩增碳水化合物结合模块cbm6b的编码基因
pcr的具体反应体系及反应条件如下:150ngxt11-gdna,30μl5×primestarbuffer,15μl二甲基亚砜(dmso),上下游引物各30μm(上游引物序列如seqidno.3,下游引物序列如seqidno.4所示),12μl2.5mmdntps,3.75uprimestardna聚合酶,纯水补齐150μl。反应参数为:95℃预变性5min;95℃变性30s,60℃退火30s,72℃延伸40s,30个循环;72℃延伸10min;16℃结束反应。pcr反应结束后,用dna胶回收试剂盒回收目的基因片段。琼脂糖凝胶电泳验证胶回收产物,结果如图2所示。目的基因cbm6b的回收产物的理论大小为464bp,序列如seqidno.1所示,图中条带与理论大小一致,成功获得含有pet28a质粒同源臂的dna片段。由cbm6b基因编码的cbm6b蛋白的氨基酸序列如seqidno.2所示.
c、利用同源重组的方法将cbm6b构建至大肠杆菌的表达载体
以pet28a质粒为模板,完成对cbm6b表达载体的构建工作,构建流程图如图3。反应体系如下:100ngpet28a模板质粒,280ng目的基因片段(步骤b所得含有pet28a质粒同源臂的dna片段),5μl5×primestarbuffer,2.5mmdntps,0.625uprimestardna聚合酶,添加纯水至25μl。设置pcr反应参数为:95℃预变性5min;94℃变性1min、65℃退火1min(每循环一次降温1℃)、72℃延伸8min,15个循环;94℃变性1min、55℃退火1min、72℃延伸8min,20个循环;68℃延伸20min;4℃终止反应。
吸取8.5μl反应产物,加入30u限制性核酸酶dpni,37℃反应9h,消化模板质粒。随后吸取2μl消化产物,电击转化至e.colidh10b感受态细胞中。在含卡那霉素抗性的lb固体培养基上37℃培养12h。挑取阳性转化子,接种至含卡那霉素抗性的lb液体培养基中,37℃,200rpm,过夜培养。提取质粒进行酶切鉴定,向pcr管中加入100ng待鉴定质粒,限制酶bglii和xhoi各0.3μl,1μl10×q.cutbuffer,加纯水至10μl,37℃酶切15min。经电泳分析检验样品的酶切产物,酶切后的正确大小为523bp和5142bp(见图4)。将酶切正确的质粒进行测序鉴定(由吉林库美生物进行),测序结果显示序列正确,表达载体pet28a-cbm6b构建成功。
实施例2碳水化合物活性酶ctcel8a与cbm6b的融合表达载体的构建
甄选高活力的纤维素内切酶为改造对象,与底物结合域cbm6b融合表达,构建新型黄原胶内切酶。
a、利用pcr技术扩增纤维素内切酶ctcel8a的编码基因
全基因合成密码子优化后的来自热纤梭菌clostridiumthermocellum的高活力纤维素内切酶ctcel8a的序列(genebank:cp016502.1),见seqidno.5。pcr的具体反应体系及反应条件如下:150ngpuc57-ctcel8,30μl5×primestarbuffer,15μl二甲基亚砜(dmso),上下游引物各30μm(上游引物序列如seqidno.6,下游引物序列如seqidno.7所示),12μl2.5mmdntps,3.75uprimestardna聚合酶,纯水补齐150μl。反应参数为:95℃预变性5min;95℃变性30s,64℃退火30s,72℃延伸40s,30个循环;72℃延伸10min;16℃结束反应。pcr反应结束后,用dna胶回收试剂盒回收目的基因片段。琼脂糖凝胶电泳验证胶回收产物,结果如图5所示。目的基因ctcel8a的回收产物的理论大小为1399bp,图中条带与理论大小一致,成功扩增带pet28a-cbm6b同源臂的dna片段。
b、利用同源重组的方法将ctcel8a构建至pet28a-cbm6b表达载体
以pet28a-cbm6b质粒为模板,完成对pet28a-ctcel8a-cbm6b表达载体的构建工作,构建流程见图6。反应体系如下:100ngpet28a-cbm6b模板质粒,280ng目的基因片段(步骤a所得含有pet28a-cbm6b质粒同源臂的dna片段),5μl5×primestarbuffer,2.5mmdntps,0.625uprimestardna聚合酶,添加纯水至25μl。设置pcr反应参数为:95℃预变性5min;94℃变性1min、65℃退火1min(每循环一次降温1℃)、72℃延伸8min,15个循环;94℃变性1min、55℃退火1min、72℃延伸8min,20个循环;68℃延伸20min;4℃终止反应。
吸取8.5μl反应产物,加入30u限制性核酸酶dpni,37℃反应9h,消化模板质粒。随后吸取2μl消化产物,电击转化至e.colidh10b感受态细胞中。在含卡那霉素抗性的lb固体培养基上37℃培养12h。挑取阳性转化子,接种至含卡那霉素抗性的lb液体培养基中,37℃,200rpm,过夜培养。提取质粒进行酶切鉴定,向pcr管中加入100ng待鉴定质粒,限制酶ecorv和hindiii各0.3μl,1μl10×q.cutbuffer,加纯水至10μl,37℃酶切15min。经电泳分析检验样品的酶切产物,酶切后的理论大小为3051bp和3973bp(见图7),电泳图中各条带的大小与实际大小一致。将酶切正确的质粒进行测序鉴定(由吉林库美生物进行),测序结果显示序列正确,成功构建表达载体pet28a-ctcel8a-cbm6b。
实施例3碳水化合物活性酶mixen与cbm6b的融合表达载体的构建
甄选来自黄原胶降解菌microbacteriumsp.xt11的黄原胶内切酶mixen的催化结构域序列mixen-cd,见seqidno.8(genebank:lx1-1gl001095),与底物结合域cbm6b融合表达,构建新型黄原胶内切酶。
a、利用pcr技术扩增碳水化合物结合模块cbm6b的编码基因
pcr的具体反应体系及反应条件如下:150ngpet28a-cbm6b,30μl5×primestarbuffer,15μl二甲基亚砜(dmso),上下游引物各30μm(上游引物序列如seqidno.9,下游引物序列如seqidno.10所示),12μl2.5mmdntps,3.75uprimestardna聚合酶,纯水补齐150μl。反应参数为:95℃预变性5min;95℃变性30s,68℃退火30s,72℃延伸40s,30个循环;72℃延伸10min;16℃结束反应。pcr反应结束后,用dna胶回收试剂盒回收目的基因片段。琼脂糖凝胶电泳验证胶回收产物,结果如图8所示。目的基因cbm6b的回收产物的理论大小为463bp,图中条带与理论大小一致,成功获得含有pet28a-mixencd质粒同源臂的dna片段。
b、利用同源重组的方法将mixencd构建至pet28a-cbm6b表达载体
以pet28a-mixencd质粒为模板,见序列seqidno.11,完成对pet28a-mixencd-6b表达载体的构建工作,构建流程见图9。反应体系如下:100ngpet28a-mixen-cd模板质粒,280ng目的基因片段(步骤a所得含有pet28a-mixen-cd质粒同源臂的dna片段),5μl5×primestarbuffer,2.5mmdntps,0.625uprimestardna聚合酶,添加纯水至25μl。设置pcr反应参数为:95℃预变性5min;94℃变性1min、65℃退火1min(每循环一次降温1℃)、72℃延伸8min,15个循环;94℃变性1min、55℃退火1min、72℃延伸8min,20个循环;68℃延伸20min;4℃终止反应。
吸取8.5μl反应产物,加入30u限制性核酸酶dpni,37℃反应9h,消化模板质粒。随后吸取2μl消化产物,电击转化至e.colidh10b感受态细胞中。在含卡那霉素抗性的lb固体培养基上37℃培养12h。挑取阳性转化子,接种至含卡那霉素抗性的lb液体培养基中,37℃,200rpm,过夜培养。提取质粒进行酶切鉴定,向pcr管中加入100ng待鉴定质粒,限制酶smai各0.3μl,1μl10×q.cutbuffer,加纯水至10μl,37℃酶切15min。经电泳分析检验样品的酶切产物,酶切后的理论大小为2443bp和5085bp(见图10),电泳图中各条带的大小与实际大小一致。将酶切正确的质粒进行测序鉴定(由吉林库美生物进行),测序结果显示序列正确,成功构建表达载体pet28a-mixencd-6b。
实施例4碳水化合物活性酶-cbm6b融合酶的表达及纯化
吸取100ng重组表达载体pet28a-ctcel8a-cbm6b,pet28a-mixencd-6b,分别电击转化至大肠杆菌表达菌株bl21(de3)中(至大肠杆菌表达菌株rosetta(de3)、或origami(de3)也可以)。将转化液涂布在含卡那霉素抗性的lb平板上,37℃培养12h。挑取单菌落接种至lb液体培养基中,37℃过夜震荡培养。随后转接至lb低盐培养基中,于37℃摇床中培养,至od600约为0.6,加入终浓度为0.5mm的iptg,16℃低温诱导表达16h。随后收集并超声破碎菌体,选用ni-nta填料柱进行亲和纯化。得到融合酶ctcel8a-cbm6b和融合酶mixencd-6b,纯化结果如图11和图12所示。
实施例5融合酶ctcel8a-cbm6b的酶活力测定及产物表征
a、测酶活方法:向ctcel8a-cbm6b酶液(提前与0.1倍体积的0.1mg/mlbsa混合)中加入等体积的2mg/ml黄原胶,在60℃反应20min。随后向反应体系中添加等体积的bca溶液进行显色反应,在od562处测定还原糖的生成量。ctcel8a-cbm6b的酶活力定义为每分钟释放1μmol还原糖所需的酶量为1u。设置对照组为ctcel8a酶(来自热纤梭菌clostridiumthermocellum的高活力纤维素内切酶),测试方法同融合酶ctcel8a-cbm6b。
酶活力测定结果分析:如图13所示,融合酶ctcel8a-cbm6b的酶活为ctcel8a酶活的2.07倍,说明黄原胶侧链结合单元cbm6b能够有效提高ctcel8a对黄原胶底物的酶解活性。
b、产物表征:将3mg/ml融合酶ctcel8a-cbm6b与5g/l的黄原胶40℃孵育5天后得到黄原胶寡糖。将黄原胶寡糖经过凝胶渗透色谱(图14)、傅里叶红外光谱(图15)表征。
酶解产物表征结果分析:如图14和图15所示,融合酶ctcel8a-cbm6b将黄原胶水解成更多的中分子量低聚物,寡糖含量更高,说明cbm6b能够提高ctcel8a水解黄原胶的效率。
实施例6融合酶mixencd-6b的酶活力测定及产物表征
a、测酶活方法:向融合酶mixencd-6b酶液(提前与0.1倍体积的0.1mg/mlbsa混合)中加入等体积的2mg/ml黄原胶,在40℃反应20min。随后向反应体系中添加等体积的bca溶液进行显色反应,在od562处测定还原糖的生成量。mixencd-6b的酶活力定义为每分钟释放1μmol还原糖所需的酶量为1u。设置对照组为mixen-cd酶(黄原胶降解菌microbacteriumsp.xt11的黄原胶内切酶),测试方法同融合酶mixencd-6b。
酶活力测定结果分析:如图16所示,融合酶mixencd-6b的酶活力是mixen-cd的1.46倍,说明cbm6b能够提高黄原胶内切酶的水解能力。
b、产物表征:将1mg/ml融合酶mixencd-6b与5g/l的黄原胶孵育2天后得到黄原胶寡糖。将黄原胶寡糖经过离子色谱表征。对照组为mixen-cd酶与黄原胶孵育,测试方法同融合酶mixencd-6b。
酶解产物表征结果分析:如图17所示,融合酶mixencd-6b作用黄原胶的中低分子量酶解产物明显多于对照组,说明cbm6b能够帮助黄原胶内切酶快速精准的定位在底物上,从而实现酶的精准切割,并使得降解产物的聚合度相对集中。
sequencelisting
<110>李宪臻
<120>一种特异性识别黄原胶侧链的碳水化合物结合模块cbm6b蛋白质及应用
<130>2020
<160>11
<170>patentinversion3.5
<210>1
<211>414
<212>dna
<213>人工序列(artificialsequence)
<400>1
acgaccgctgctgtcagcaccaggctggaggccgaggcgctgaccgccagttcgggagtg60
atcaagagcaatgccgacgccagcggaggccagtaccggatcttcaacgcgtacggcgtc120
gcggagcagatcgactatgcggttcctgtatcgcatgctggggcatacgacctggtcctc180
ggcaccatgagattcagcgacaacggcacgtatcagctgcagatcgacgggaacgacgtc240
ggcgcccctgtggatctgtttcgaccgtcgggcaaagtggtggttgtcgatctgggaagc300
gtgacgctgagcgcgggcgtccacgagttcacgttcacggctgtcggcaagaacaccagc360
tcgctgggctacaaacttcctctcgactacattcagctggtctccgccatcgag414
<210>2
<211>138
<212>prt
<213>人工序列(artificialsequence)
<400>2
thrthralaalavalserthrargleuglualaglualaleuthrala
151015
serserglyvalilelysserasnalaaspalaserglyglyglntyr
202530
argilepheasnalatyrglyvalalagluglnileasptyralaval
354045
provalserhisalaglyalatyraspleuvalleuglythrmetarg
505560
pheseraspasnglythrtyrglnleuglnileaspglyasnaspval
65707580
glyalaprovalaspleupheargproserglylysvalvalvalval
859095
aspleuglyservalthrleuseralaglyvalhisgluphethrphe
100105110
thralavalglylysasnthrserserleuglytyrlysleuproleu
115120125
asptyrileglnleuvalseralaileglu
130135
<210>3
<211>50
<212>dna
<213>人工序列(artificialsequence)
<400>3
gtttaactttaagaaggagatataccatgacgaccgctgctgtcagcacc50
<210>4
<211>40
<212>dna
<213>人工序列(artificialsequence)
<400>4
ctcgagtgcggccgcaagcttctcgatggcggagaccagc40
<210>5
<211>1338
<212>dna
<213>人工序列(artificialsequence)
<400>5
atggcaggtgtgccgtttaacaccaaatacccgtatggtccgacctctattgccgataat60
cagtctgaagtgaccgcgatgctgaaagcggaatgggaagattggaaaagcaaacgcatt120
acctctaacggtgcgggcggctacaagcgcgtgcagcgtgatgcgtccaccaattatgat180
acggtgtccgaaggtatgggctatggcctgctgctggcggtttgctttaacgaacaggcg240
ctgtttgatgatctgtaccgttatgtgaaatctcattttaatggcaacggcctgatgcat300
tggcatattgatgccaataataatgtgaccagtcatgatggcggcgatggtgcggcaacc360
gatgcggatgaagatattgcactggcgctgatttttgcggataaactgtggggttcttcc420
ggtgcaattaattacggccaggaagcacgcaccctgattaataatctgtacaatcattgt480
gtggaacatggctcctatgtgctgaagccgggtgaccgctggggcggttcttctgtgacc540
aacccgtcttattttgcgccggcatggtacaaagtgtatgcgcagtataccggcgatacc600
cgctggaatcaggtggcggataaatgttaccagattgttgaagaagttaagaaatataac660
aacggcaccggcctggttccggattggtgtaccgcaagcggcaccccggcaagcggtcag720
agttatgattataaatatgatgcgacccgttatggctggcgcaccgcggtggattattct780
tggtttggtgaccagcgcgcgaaggcgaactgcgatatgctgaccaaattttttgcgcgc840
gatggcgcaaaaggcatcgttgatggctacaccattcagggctctaaaattagcaacaat900
cataacgcatcttttattggcccggttgcggcagcaagtatgaccggttatgatctgaac960
tttgcaaaggaactgtatcgcgaaaccgttgcggtgaaggatagtgaatattatggctat1020
tatggcaacagcttgcgcctgctgaccctgctgtatattaccggcaactttccgaatccg1080
ctgagtgatctgtccggccagccgaccccaccgtctaatccgaccccgtctctgccgccg1140
caggttgtttacggcgatgtgaatggcgatggcaatgttaactccaccgatctgaccatg1200
ctgaaacgctacctgctgaagagcgttaccaatattaaccgcgaagcggcggatgttaat1260
cgtgatggtgcgattaactcctctgatatgaccattctgaaacgctatctgattaaaagc1320
attccgcacctgccgtat1338
<210>6
<211>45
<212>dna
<213>人工序列(artificialsequence)
<400>6
aaggagatataccatgggcagcagcgcaggtgtgccgtttaacac45
<210>7
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>7
cctggtgctgacagcagcggtcgtaccaccaccaccaccatacggcaggtgcggaatgc59
<210>8
<211>2157
<212>dna
<213>人工序列(artificialsequence)
<400>8
atgtcccgacgacgagcgagttcgatgtggagaggtgcggcagtcgtcacggcggtcgtg60
ctgggcggggcggtgatcgctgcgccgcccgccgcggccgccaccatcgacaaggtcacg120
gtcagccaggcgggctacagcgccagcggttacaaggtcggcttcgccgtcgccgacagc180
gcagttccgggttcgaccagctgtcgcctgctccagggcgagacggtcgtgctgccgtcc240
tgcactcttctggatcgcggcacgacctggggcgaccgcgtgtatcaggtcgacttcagc300
gcgttcgacgacgtcggcaccgacttcgccctcgagatcgggggtgtgcgctccccgcgc360
ttcgcgatcgaagacaacgtctggtccggctacctcgatgagatgatcgcgttctacagg420
ttgcaacgctcgggaatggacaccgaggatgcataccccgcgggctacagcagcatcgcc480
ccgtccgacaaggtcttccacgccgccggtcatctcgacgatgccgcgtccgaggacggc540
acgcagcactacgacctcacgggtggctggtacgacgccggcgactacggcatctacggt600
gggaaccagtgggtcgcggggaacatcgccatctcgtatctgcgatacggcgacacaccc660
gcggtcgggttcgacggcgactcgaacggcgtgcccgatctcgtcgacgaggcctggttc720
ggcagcgagtacctgctccggatgctggacgctttcgggggcccgttctgggatgtcaag780
ggcagcggcggcttccggcatcccgagttccacaccgacggcgtgatcggaacggctgac840
gaccgacgtgtctccggcatgggtgtgggcggctcggccaaggcgtcgggttcgctcgcc900
gccacagcgagagcgatccgcgccgccatcgacagcggagacatcgacgccggagccgcc960
gcgtcctgggagacccgggccgccgaggccgaggaagcagcggtcgcgttctacgagtac1020
gccgacacgcaccgcggagatccgctcggcgggtactcgaccacgcgcggcggcatcgcc1080
aactccctgctgttcgccgaagtgcagctctaccttctgtcgggcgacgcggcgtatcgc1140
acgtcggccgaagcgacgatcgccgcgaccccgttcacgatcctgtccagtacgaactac1200
tgggacatggcgccgctgtcgatggctgagctgtatcccgctgcgacggcgaccggaaag1260
atcaacatccagcgttacctcaagaagcagctcgactacgtcctctcctcgaccgacgac1320
accccctacggcgtgatcaaccagttcaagaacttcggtgtcaacgagccgcacgtctcc1380
tacatggccgacgcgctgcgctactgggagctgttcggagaccagcgtgccctgcgagcg1440
gtgcagaagggcctgtactgggtgttcggcaacaacccgtgggggacgagctgggtctcc1500
ggcgtgggtgagaagcacacgatgttcctgcacacgcggctcgacgagcaggcgcagacc1560
cagggcggcacggggatcatcctgccgggggcgctcgtctcgggaccgaatgcgaaggac1620
ccgctcgacgcgaccagtgcgagcccctggtacgaagatcgtccaggctccgccgatgtc1680
ggtcagcagtggcgatacaacgagtacagcgtgagcatccaggctgggctgttctcgtcc1740
gtgttcgggctcgccgccgccggcgacgcgccgtggtccaccgggacaccgccgacggcg1800
ctgaccatcggatccccgaagatcggccagtacgtcaccggcgaggtgaccgtgttcgcg1860
cagagcggctcctcgctcacggcgcacgcgctcggtccggattggacgccgatgacctcg1920
tcggccggagtctcgaccggtgtggtcgatgtgagcggccttgcgccgtacacgaacgcc1980
cgtatcgacgtgcgcggcacgcaggcgagcggtgcccacagctacagctctacgcactac2040
accgtcgcgccacccctgccggctcccgacgcgccgctgctgtacgacggcttcggtcgc2100
gacggcctgttcggcgtgcaggggtacacctgggcgaattggtacaacaaccatgcc2157
<210>9
<211>41
<212>dna
<213>人工序列(artificialsequence)
<400>9
catgccggtggtggtggtggtggtacgaccgctgctgtcag41
<210>10
<211>43
<212>dna
<213>人工序列(artificialsequence)
<400>10
ctcgagtgcggccgcaagctttcactcgatggcggagaccagc43
<210>11
<211>7528
<212>dna
<213>人工序列(artificialsequence)
<400>11
tggcgaatgggacgcgccctgtagcggcgcattaagcgcggcgggtgtggtggttacgcg60
cagcgtgaccgctacacttgccagcgccctagcgcccgctcctttcgctttcttcccttc120
ctttctcgccacgttcgccggctttccccgtcaagctctaaatcgggggctccctttagg180
gttccgatttagtgctttacggcacctcgaccccaaaaaacttgattagggtgatggttc240
acgtagtgggccatcgccctgatagacggtttttcgccctttgacgttggagtccacgtt300
ctttaatagtggactcttgttccaaactggaacaacactcaaccctatctcggtctattc360
ttttgatttataagggattttgccgatttcggcctattggttaaaaaatgagctgattta420
acaaaaatttaacgcgaattttaacaaaatattaacgtttacaatttcaggtggcacttt480
tcggggaaatgtgcgcggaacccctatttgtttatttttctaaatacattcaaatatgta540
tccgctcatgaattaattcttagaaaaactcatcgagcatcaaatgaaactgcaatttat600
tcatatcaggattatcaataccatatttttgaaaaagccgtttctgtaatgaaggagaaa660
actcaccgaggcagttccataggatggcaagatcctggtatcggtctgcgattccgactc720
gtccaacatcaatacaacctattaatttcccctcgtcaaaaataaggttatcaagtgaga780
aatcaccatgagtgacgactgaatccggtgagaatggcaaaagtttatgcatttctttcc840
agacttgttcaacaggccagccattacgctcgtcatcaaaatcactcgcatcaaccaaac900
cgttattcattcgtgattgcgcctgagcgagacgaaatacgcgatcgctgttaaaaggac960
aattacaaacaggaatcgaatgcaaccggcgcaggaacactgccagcgcatcaacaatat1020
tttcacctgaatcaggatattcttctaatacctggaatgctgttttcccggggatcgcag1080
tggtgagtaaccatgcatcatcaggagtacggataaaatgcttgatggtcggaagaggca1140
taaattccgtcagccagtttagtctgaccatctcatctgtaacatcattggcaacgctac1200
ctttgccatgtttcagaaacaactctggcgcatcgggcttcccatacaatcgatagattg1260
tcgcacctgattgcccgacattatcgcgagcccatttatacccatataaatcagcatcca1320
tgttggaatttaatcgcggcctagagcaagacgtttcccgttgaatatggctcataacac1380
cccttgtattactgtttatgtaagcagacagttttattgttcatgaccaaaatcccttaa1440
cgtgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttga1500
gatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaccaccgctaccagcg1560
gtggtttgtttgccggatcaagagctaccaactctttttccgaaggtaactggcttcagc1620
agagcgcagataccaaatactgtccttctagtgtagccgtagttaggccaccacttcaag1680
aactctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgctgcc1740
agtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcg1800
cagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctac1860
accgaactgagatacctacagcgtgagctatgagaaagcgccacgcttcccgaagggaga1920
aaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagctt1980
ccagggggaaacgcctggtatctttatagtcctgtcgggtttcgccacctctgacttgag2040
cgtcgatttttgtgatgctcgtcaggggggcggagcctatggaaaaacgccagcaacgcg2100
gcctttttacggttcctggccttttgctggccttttgctcacatgttctttcctgcgtta2160
tcccctgattctgtggataaccgtattaccgcctttgagtgagctgataccgctcgccgc2220
agccgaacgaccgagcgcagcgagtcagtgagcgaggaagcggaagagcgcctgatgcgg2280
tattttctccttacgcatctgtgcggtatttcacaccgcatatatggtgcactctcagta2340
caatctgctctgatgccgcatagttaagccagtatacactccgctatcgctacgtgactg2400
ggtcatggctgcgccccgacacccgccaacacccgctgacgcgccctgacgggcttgtct2460
gctcccggcatccgcttacagacaagctgtgaccgtctccgggagctgcatgtgtcagag2520
gttttcaccgtcatcaccgaaacgcgcgaggcagctgcggtaaagctcatcagcgtggtc2580
gtgaagcgattcacagatgtctgcctgttcatccgcgtccagctcgttgagtttctccag2640
aagcgttaatgtctggcttctgataaagcgggccatgttaagggcggttttttcctgttt2700
ggtcactgatgcctccgtgtaagggggatttctgttcatgggggtaatgataccgatgaa2760
acgagagaggatgctcacgatacgggttactgatgatgaacatgcccggttactggaacg2820
ttgtgagggtaaacaactggcggtatggatgcggcgggaccagagaaaaatcactcaggg2880
tcaatgccagcgcttcgttaatacagatgtaggtgttccacagggtagccagcagcatcc2940
tgcgatgcagatccggaacataatggtgcagggcgctgacttccgcgtttccagacttta3000
cgaaacacggaaaccgaagaccattcatgttgttgctcaggtcgcagacgttttgcagca3060
gcagtcgcttcacgttcgctcgcgtatcggtgattcattctgctaaccagtaaggcaacc3120
ccgccagcctagccgggtcctcaacgacaggagcacgatcatgcgcacccgtggggccgc3180
catgccggcgataatggcctgcttctcgccgaaacgtttggtggcgggaccagtgacgaa3240
ggcttgagcgagggcgtgcaagattccgaataccgcaagcgacaggccgatcatcgtcgc3300
gctccagcgaaagcggtcctcgccgaaaatgacccagagcgctgccggcacctgtcctac3360
gagttgcatgataaagaagacagtcataagtgcggcgacgatagtcatgccccgcgccca3420
ccggaaggagctgactgggttgaaggctctcaagggcatcggtcgagatcccggtgccta3480
atgagtgagctaacttacattaattgcgttgcgctcactgcccgctttccagtcgggaaa3540
cctgtcgtgccagctgcattaatgaatcggccaacgcgcggggagaggcggtttgcgtat3600
tgggcgccagggtggtttttcttttcaccagtgagacgggcaacagctgattgcccttca3660
ccgcctggccctgagagagttgcagcaagcggtccacgctggtttgccccagcaggcgaa3720
aatcctgtttgatggtggttaacggcgggatataacatgagctgtcttcggtatcgtcgt3780
atcccactaccgagatatccgcaccaacgcgcagcccggactcggtaatggcgcgcattg3840
cgcccagcgccatctgatcgttggcaaccagcatcgcagtgggaacgatgccctcattca3900
gcatttgcatggtttgttgaaaaccggacatggcactccagtcgccttcccgttccgcta3960
tcggctgaatttgattgcgagtgagatatttatgccagccagccagacgcagacgcgccg4020
agacagaacttaatgggcccgctaacagcgcgatttgctggtgacccaatgcgaccagat4080
gctccacgcccagtcgcgtaccgtcttcatgggagaaaataatactgttgatgggtgtct4140
ggtcagagacatcaagaaataacgccggaacattagtgcaggcagcttccacagcaatgg4200
catcctggtcatccagcggatagttaatgatcagcccactgacgcgttgcgcgagaagat4260
tgtgcaccgccgctttacaggcttcgacgccgcttcgttctaccatcgacaccaccacgc4320
tggcacccagttgatcggcgcgagatttaatcgccgcgacaatttgcgacggcgcgtgca4380
gggccagactggaggtggcaacgccaatcagcaacgactgtttgcccgccagttgttgtg4440
ccacgcggttgggaatgtaattcagctccgccatcgccgcttccactttttcccgcgttt4500
tcgcagaaacgtggctggcctggttcaccacgcgggaaacggtctgataagagacaccgg4560
catactctgcgacatcgtataacgttactggtttcacattcaccaccctgaattgactct4620
cttccgggcgctatcatgccataccgcgaaaggttttgcgccattcgatggtgtccggga4680
tctcgacgctctcccttatgcgactcctgcattaggaagcagcccagtagtaggttgagg4740
ccgttgagcaccgccgccgcaaggaatggtgcatgcaaggagatggcgcccaacagtccc4800
ccggccacggggcctgccaccatacccacgccgaaacaagcgctcatgagcccgaagtgg4860
cgagcccgatcttccccatcggtgatgtcggcgatataggcgccagcaaccgcacctgtg4920
gcgccggtgatgccggccacgatgcgtccggcgtagaggatcgagatctcgatcccgcga4980
aattaatacgactcactataggggaattgtgagcggataacaattcccctctagaaataa5040
ttttgtttaactttaagaaggagatataccatgggcagcagccatcatcatcatcatcac5100
agcagcggcctggtgccgcgcggcagccatatggctagcatgactggtggacagcaaatg5160
ggtcgcggatccgaattcatgtcccgacgacgagcgagttcgatgtggagaggtgcggca5220
gtcgtcacggcggtcgtgctgggcggggcggtgatcgctgcgccgcccgccgcggccgcc5280
accatcgacaaggtcacggtcagccaggcgggctacagcgccagcggttacaaggtcggc5340
ttcgccgtcgccgacagcgcagttccgggttcgaccagctgtcgcctgctccagggcgag5400
acggtcgtgctgccgtcctgcactcttctggatcgcggcacgacctggggcgaccgcgtg5460
tatcaggtcgacttcagcgcgttcgacgacgtcggcaccgacttcgccctcgagatcggg5520
ggtgtgcgctccccgcgcttcgcgatcgaagacaacgtctggtccggctacctcgatgag5580
atgatcgcgttctacaggttgcaacgctcgggaatggacaccgaggatgcataccccgcg5640
ggctacagcagcatcgccccgtccgacaaggtcttccacgccgccggtcatctcgacgat5700
gccgcgtccgaggacggcacgcagcactacgacctcacgggtggctggtacgacgccggc5760
gactacggcatctacggtgggaaccagtgggtcgcggggaacatcgccatctcgtatctg5820
cgatacggcgacacacccgcggtcgggttcgacggcgactcgaacggcgtgcccgatctc5880
gtcgacgaggcctggttcggcagcgagtacctgctccggatgctggacgctttcgggggc5940
ccgttctgggatgtcaagggcagcggcggcttccggcatcccgagttccacaccgacggc6000
gtgatcggaacggctgacgaccgacgtgtctccggcatgggtgtgggcggctcggccaag6060
gcgtcgggttcgctcgccgccacagcgagagcgatccgcgccgccatcgacagcggagac6120
atcgacgccggagccgccgcgtcctgggagacccgggccgccgaggccgaggaagcagcg6180
gtcgcgttctacgagtacgccgacacgcaccgcggagatccgctcggcgggtactcgacc6240
acgcgcggcggcatcgccaactccctgctgttcgccgaagtgcagctctaccttctgtcg6300
ggcgacgcggcgtatcgcacgtcggccgaagcgacgatcgccgcgaccccgttcacgatc6360
ctgtccagtacgaactactgggacatggcgccgctgtcgatggctgagctgtatcccgct6420
gcgacggcgaccggaaagatcaacatccagcgttacctcaagaagcagctcgactacgtc6480
ctctcctcgaccgacgacaccccctacggcgtgatcaaccagttcaagaacttcggtgtc6540
aacgagccgcacgtctcctacatggccgacgcgctgcgctactgggagctgttcggagac6600
cagcgtgccctgcgagcggtgcagaagggcctgtactgggtgttcggcaacaacccgtgg6660
gggacgagctgggtctccggcgtgggtgagaagcacacgatgttcctgcacacgcggctc6720
gacgagcaggcgcagacccagggcggcacggggatcatcctgccgggggcgctcgtctcg6780
ggaccgaatgcgaaggacccgctcgacgcgaccagtgcgagcccctggtacgaagatcgt6840
ccaggctccgccgatgtcggtcagcagtggcgatacaacgagtacagcgtgagcatccag6900
gctgggctgttctcgtccgtgttcgggctcgccgccgccggcgacgcgccgtggtccacc6960
gggacaccgccgacggcgctgaccatcggatccccgaagatcggccagtacgtcaccggc7020
gaggtgaccgtgttcgcgcagagcggctcctcgctcacggcgcacgcgctcggtccggat7080
tggacgccgatgacctcgtcggccggagtctcgaccggtgtggtcgatgtgagcggcctt7140
gcgccgtacacgaacgcccgtatcgacgtgcgcggcacgcaggcgagcggtgcccacagc7200
tacagctctacgcactacaccgtcgcgccacccctgccggctcccgacgcgccgctgctg7260
tacgacggcttcggtcgcgacggcctgttcggcgtgcaggggtacacctgggcgaattgg7320
tacaacaaccatgccggtggtggtggtggtaagcttgcggccgcactcgagcaccaccac7380
caccaccactgagatccggctgctaacaaagcccgaaaggaagctgagttggctgctgcc7440
accgctgagcaataactagcataaccccttggggcctctaaacgggtcttgaggggtttt7500
ttgctgaaaggaggaactatatccggat7528
1.一种基因,其特征在于,为1a)~2a)中的一种:
1a)如seqidno.1所示的核苷酸序列;
2a)与seqidno.1所示的核苷酸序列至少具有90%以上同源性编码所述蛋白质的dna分子。
2.权利要求1所述基因编码的碳水化合物结合模块蛋白质,其特征在于:为1b)~3b)中的一种:
1b)具有如seqidno.2所示氨基酸序列的蛋白质;
2b)将seqidno.2所示的氨基酸序列经过1个或多个氨基酸残基的取代和/或缺失和/或添加得到的具有相同功能的蛋白质;
3b)含有序列表中seqidno.2所示的氨基酸序列的具有相同功能的蛋白质。
3.权利要求2所述的碳水化合物结合模块蛋白质与碳水化合物活性酶构建的融合表达载体。
4.根据权利要求3所述的融合表达载体,其特征在于,所述碳水化合物活性酶包括糖苷水解酶类、糖基转移酶类、多糖裂解酶类或糖酯酶类。
5.根据权利要求4所述的融合表达载体,其特征在于,所述糖苷水解酶包括纤维素内切酶和黄原胶内切酶。
6.一种含有权利要求3~5中任一项所述融合表达载体的重组表达菌。
7.权利要求2所述的碳水化合物结合模块在识别黄原胶侧链、降解黄原胶制备黄原胶寡糖中的应用。
技术总结