本发明属于生物,具体涉及分析嗜热四膜虫镉耐受机制关联基因的方法。
背景技术:
1、原生动物嗜热四膜虫是在淡水中普遍存在的单细胞模式动物,其基因组信息和毒理学研究数据丰富。近年来的研究表明嗜热四膜虫中含有丰富的重金属解毒遗传资源,比如嗜热四膜虫基因组中含有五种金属硫蛋白编码基因,分别编码金属硫蛋白mtt1、mtt2、mtt3、mtt4、mtt5,研究工作证实嗜热四膜虫基因组中的金属硫蛋白可以螯合重金属离子而解毒。但是关于嗜热四膜虫响应重金属的分子机制仍不清楚,嗜热四膜虫参与重金属耐受的相关基因也有待进一步挖掘。
2、各种组学分析技术可以帮助我们在不同层面进行生物毒理学研究,系统了解生物体在暴露于有毒物质后的分子机制,从而筛选可能应用于毒性物质风险监测和评估的关键基因表达产物或代谢物,并探索其作为生物标志物、制定预防和解决毒性物质的有效策略。细胞转录组水平差异可以反映细胞的整体基因表达信息,通过差异表达基因的功能注释可帮助我们发现细胞响应环境胁迫的可能代谢机制。随着二代测序技术的快速发展和测序成本的逐渐降低,基于高通量测序的转录组测序技术已成为研究不同生物不同基因的表达变异和结构差异的常规方法之一。生物体在应激前后,其基因表达模式会有所变化。同一种刺激条件下生长的生物体在不同的时间点也可能呈现出不同的生物学特征,而这些特征可能可以更好地反映生物体本身的适应过程和变化规律。通常人们关注于生物体在刺激前后或是两种不同刺激条件下的转录组水平差异,却忽略了在刺激过程中的转录组水平的动态变化规律。转录组时序分析则是针对处于多个时间节点的处理条件相同的样本进行基因表达水平差异分析,以解析各个时间点的基因表达变化情况。在重金属胁迫条件下,生物体会通过一系列的生理反应来减轻重金属的毒性作用,包括细胞内重金属的感知和信号转导途径、转录因子驱动的基因转录激活和基因表达等,从而使生物体能够抵消重金属胁迫,这一过程涉及到各种复杂的分子机制。转录组时序分析技术可以在具有时间序列特征的数据中分析基因表达模式差异,将具有相似表达模式的基因划分聚类,进一步通过基因功能注释了解基因功能的联系和生物体相关代谢通路的动态变化。转录组时序分析技术适用于帮助我们了解生物体应对重金属胁迫的复杂机制,但是目前缺乏关于转录组时序分析技术在探究微生物响应重金属胁迫的分子机制和挖掘微生物抵抗重金属胁迫的关键基因的应用研究。
技术实现思路
1、为弥补上述不足之处,本发明提供一种基于转录组时序分析以分析嗜热四膜虫镉耐受机制可能的关联基因的方法。这一方法可以通过在不同时间节点取样进行转录组测序,筛选不同处理时间下的差异表达基因,分析在时间尺度上受处理条件影响的基因表达变化模式。通过本发明提供的方法,可以系统探究嗜热四膜虫响应重金属胁迫的转录水平变化,筛选得到嗜热四膜虫参与重金属耐受的潜在关联基因。
2、具体来说,本发明提供以下技术方案:
3、一方面,本发明提供分析嗜热四膜虫镉耐受机制关联基因的方法,所述方法包括以下步骤:
4、a.在含镉环境中培养嗜热四膜虫;
5、b.提取培养的嗜热四膜虫的rna,构建cdna文库进行高通量测序;
6、c.对测序数据进行质控;
7、d.将质控后的测序数据与参考基因组比对并进行基因表达水平定量;
8、e.筛选差异表达基因或进行转录组时序分析,对不同表达变化趋势的基因进行聚类;
9、f.采用kegg和go数据库分别进行通路富集分析和功能富集分析,获得嗜热四膜虫在时间序列上响应镉胁迫的可能相关代谢通路的动态变化,进而选取代谢通路相关的表达差异显著的基因作为潜在的嗜热四膜虫镉耐受机制关联基因。
10、在一些实施方案中,提取培养的嗜热四膜虫的rna包括提取在正常条件下和镉应激条件下培养不同时间的嗜热四膜虫的rna。
11、在一些实施方案中,培养时间为2小时、6小时或24小时。
12、在一些实施方案中,对测序数据进行质控,使用trim galore工具进行低质量碱基和3'末端接头序列的识别,并去除。
13、在一些实施方案中,低质量碱基为质量分数小于20的碱基。
14、在一些实施方案中,利用将质控后的测序数据与参考基因组比对后获得的碱基序列总数计算fpkm,以fpkm量化基因表达水平。
15、在一些实施方案中,筛选差异表达基因时,利用r包deseq2以差异倍数|log2(倍数变化)|≥1且q值<0.05作为筛选标准筛选差异表达基因。
16、在一些实施方案中,转录组时序分析利用r软件包mfuzz对不同表达变化趋势的基因进行聚类。
17、在一些实施方案中,转录组时序分析将不同表达变化趋势的基因聚类为多个基因集。
18、在一些实施方案中,对多个基因集中的每一个基因集进行kegg通路富集分析和go功能富集分析。
19、在一些实施方案中,在步骤d之后步骤e之前还包括样本相关性分析,以判断转录组测序数据比对结果是否能够进行后续分析。
20、另一方面,本发明发现嗜热四膜虫镉耐受机制关联基因,其包括:谷胱甘肽过氧化物酶编码基因和谷胱甘肽s-转移酶编码基因。
21、定义
22、转录组时序分析:通过转录组测序技术可以快速地获得特定细胞或组织在某一状态下(即某一时间节点下)几乎所有转录本的序列信息和表达信息。利用某些特定条件处理生物体,比如本发明中的镉应激条件,在不同时间节点取样进行转录组测序,可发现生物体中不同的基因的表达水平随处理时间表现出不同的变化规律。转录组时序分析则是识别多个时间点的转录组数据中不同的基因表达水平变化模式,并将具有相似表达变化模式的基因聚类。转录组时序分析可以帮助我们找到功能相似,表达变化趋势相近的基因,进一步通过基因功能注释了解基因功能之间的联系和生物体代谢通路在某一处理条件下的可能变化规律。
23、嗜热四膜虫:嗜热四膜虫是一种单细胞真核模式动物,其隶属于囊泡虫门纤毛亚门。四膜虫具有纤毛虫特有的双核特性(在同一个细胞里同时具有负责生殖的小核和负责营养的大核)。嗜热四膜虫在不同的生长环境中具有不同的生活史类型。在营养充足的环境中,进行无性营养生殖;而在营养不足的饥饿环境中,不同配型的嗜热四膜虫会进行接合生殖,不同配型的小核通过减数分裂形成合子,子代中的大核与小核均由新的合子发育而来。
24、go功能富集分析:go全称为gene ontology,是一个国际标准化的基因功能分类体系,提供了一套动态更新的标准词汇表以全面描述生物体中基因和基因产物的属性。go的基本单位是term(词条),每个term都对应一个属性。每个基因都会对应一个或多个go term(也就是go功能)。进行go功能富集分析即分析各个go功能在所关注的差异表达基因集中所占的比例,若某个go功能显著高于其他go功能在物种所有基因集中所占的比例,则表示该go功能富集。显著性计算是通过超几何检验方法计算p值,p值小于0.05可说明具有显著性。
25、kegg通路富集分析:kegg数据库是系统地分析基因功能、链接基因组信息和功能信息的数据库,包括代谢通路数据库、分层分类数据库、基因数据库、基因组数据库等。kegg的代谢通路数据库是应用最广泛的代谢通路公共数据库之一。同go功能富集分析相似,每个基因都对应一个或多个kegg通路。进行kegg通路富集分析即分析各个kegg通路在所关注的差异表达基因集中所占的比例,若某个kegg通路显著高于其他kegg通路在物种所有基因集中所占的比例,则表示该kegg通路富集。显著性计算是通过超几何检验方法计算p值,p值小于0.05可说明具有显著性。
26、fragments per kilobase of transcript per million mapped reads:简称为fpkm(每百万片段上的每千碱基转录本)是一种基因表达单位。fpkm基于基因长度和映射读数的总数对读数进行归一化,主要用于规范化成对末端rna测序数据的计数。fpkm在一定程度反映基因转录情况,本发明中以fpkm值量化基因表达水平。
27、转录组测序:转录组测序是一种利用高通量测序技术,通过全面快速的cdna测序,获得特定组织或细胞在特定状态下几乎所有转录本的信息的方法。使用这一技术能够在特定时间点对生物样本中的多种rna进行定性和定量检测。本技术中对嗜热四膜虫转录组样本进行mrna测序,其主要流程如下:
28、1、在分离提取得到嗜热四膜虫rna后,对提取的总rna进行纯度、浓度、完整性的质量检查;
29、2、利用oligo dt磁珠靶向富集含有poly a尾结构的rna,其中主要包括绝大部分的mrna及少量含有polya尾结构的非编码rna;
30、3、对纯化后的rna进行片段化处理;
31、4、以小片段rna作为模板,进行反转录合成cdna,然后对双链cdna的末端进行修饰并在3’端加入a尾;
32、5、纯化、洗脱后进行末端修饰并连接测序接头;
33、6、进行pcr扩增,建立测序文库;
34、7、文库检测(包括检测片段长度和样品浓度,确保文库质量符合测序要求);
35、8、高通量测序,并通过测序比对得到rna的序列信息和表达信息。
36、r包:r包是包含r语言代码、内部函数相关文档、代码测试文件,以及相关数据集的一系列集合,一般为完成特定功能而开发。
37、有益效果
38、与现有技术相比,本发明的有益效果是:本发明基于转录组测序技术,通过在含重金属镉的环境中培养嗜热四膜虫,设置生物学重复,并在不同时间节点取样进行转录组测序,从而成功构建镉处理不同时间下的嗜热四膜虫转录组测序数据库。本发明基于转录组测序数据和转录组时序分析探究嗜热四膜虫在时间尺度上受镉处理条件影响的基因表达变化模式,结合基因功能注释深入分析嗜热四膜虫响应镉胁迫的潜在代谢通路的时序动态变化,成功挖掘获得嗜热四膜虫参与镉耐受的潜在关联基因,比如参与抗氧化应激的基因集。本发明提出的研究方法和研究结果为定向改造嗜热四膜虫基因组,构建可应用于重金属污染治理的超强镉耐受嗜热四膜虫的工作提供了研究数据和技术支持,为利用工程微生物修复重金属污染的研究提供理论依据。
1.分析嗜热四膜虫镉耐受机制关联基因的方法,其特征在于,所述方法包括以下步骤:
2.根据权利要求1所述的方法,其特征在于,提取培养的嗜热四膜虫的rna包括提取在正常条件下和镉应激条件下培养不同时间的嗜热四膜虫的rna。
3.根据权利要求2所述的方法,其特征在于,培养时间为2小时、6小时或24小时。
4.根据权利要求1所述的方法,其特征在于,对测序数据进行质控使用trim galore工具进行,trim galore识别低质量碱基和3'末端的接头序列,然后去除。
5.根据权利要求4所述的方法,其特征在于,低质量碱基为质量分数小于20的碱基。
6.根据权利要求1所述的方法,其特征在于,利用将质控后的测序数据与参考基因组比对后获得的碱基序列总数计算fpkm,以fpkm量化基因表达水平。
7.根据权利要求1所述的方法,其特征在于,筛选差异表达基因时,利用r包deseq2以差异倍数|log2(倍数变化)|≥1且q值<0.05作为筛选标准筛选差异表达基因。
8.根据权利要求1所述的方法,其特征在于,转录组时序分析利用r软件包mfuzz对不同表达变化趋势的基因进行聚类。
9.根据权利要求1所述的方法,其特征在于,转录组时序分析将不同表达变化趋势的基因聚类为多个基因集。
10.根据权利要求1所述的方法,其特征在于,在步骤d之后步骤e之前还包括样本相关性分析,以验证转录组测序数据比对结果是否能够进行后续分析。
