本发明涉及生物,具体地说,涉及一种绵羊脂尾单细胞转录组图谱及其构建方法与应用。
背景技术:
1、脂尾已成为现代肉羊生产中亟需改良的目标性状之一。羊肉作为主要肉类食品之一,其肉质细嫩、风味独特、蛋白含量高,深受消费者青睐。据统计,多数绵羊品种为脂尾羊和脂臀羊,脂尾羊中尾部脂肪(尾脂)的重量可占到胴体重的10%~20%。随着肉羊养殖向规模化集约化舍饲过渡,人们生活水平的提高,饮食习惯和膳食结构发生改变,特别是对脂肪的偏好逐步降低,以及大量尾脂沉积造成了饲料的浪费,导致料肉比高、收益降低等问题,制约了绵羊产业的高质量发展,深入解析尾脂沉积机制,可为改良绵羊尾型、提高生产效率、改善胴体质量提供重要的理论依据。
2、脂尾性状是受到遗传、营养、饲养管理等多种因素的影响,已有的众多研究表明仅仅通过传统的基因组学或转录组学技术手段难以解析其遗传调控机制。自单细胞测序技术首次应用于基础研究,经过十余年的发展,该技术愈发成熟,广泛应用于发育生物学及组织异质性研究,为深入解析尾脂沉积提供了新的契机。但该技术在脂肪生成相关研究领域的应用是非常具有挑战性的,首先成熟的脂肪细胞直径可达到100μm左右,而高通量单细胞分离技术(微流控、微液滴)仅能够分离直径40μm以下的细胞;其次,在单细胞分离过程中,由于体积较大,脂肪细胞非常容易破裂,而且成熟的脂肪细胞大多分布在悬液上层,在悬液处理和上机测序时具有很强的偏好性,造成后续数据分析困难。
3、细胞注释是单细胞转录组数据分析的关键环节。目前主要通过两种策略实现细胞注释:一种方法是基于已知标记基因的表达量进行手动注释;另一种方法是利用scannotate、singler等软件对细胞进行自动注释。两种方法均依赖于已知标记基因信息。但目前不同细胞类型已知的、可有效利用的标记基因数量较少,且缺乏基因表达特异性信息。因此有必要对基因表达特异性进行评估的方法进行进一步研究。
技术实现思路
1、本发明的目的之一在于提供一种基于单细胞转录组测序技术构建绵羊脂尾单细胞转录组图谱及评估基因表达特异性的方法及应用。
2、为了实现该目的,本发明的技术方案如下:
3、一种构建绵羊脂尾单细胞转录组图谱的方法,其包括:
4、(1)同时采集绵羊尾脂沉积发生前后不同胚胎发育阶段尾组织样品,分别制备为单细胞悬液;
5、(2)捕获所述单细胞悬液中的单个细胞,进行细胞裂解、cdna合成、cdna文库质检、片段化和末端修复后,构建测序文库,进行上机测序获得原始测试数据;
6、(3)将所述原始测试数据与参考基因组比对,获得原始比对数据和基因在各细胞表达量矩阵;
7、(4)基于各细胞捕获的mrna数量和线粒体基因比例进行细胞质控;移除在少于10个细胞中表达的基因;进行双细胞预测及过滤,获得质控后的各时期样本,将所述质控后的各时期样本进行合并,获得质控后的基因-细胞表达矩阵(clean count matrix)用于下游分析;
8、(5)对质控后的所述基因-细胞表达矩阵进行数据预处理;
9、(6)基于不同细胞类型已知标记基因进行细胞注释,构建获得绵羊脂尾单细胞转录组图谱。
10、本发明方法步骤(1)中,通过分阶段同期发情和人工授精处理,调整发情时间和配种时间,保证同时采集绵羊尾脂沉积发生前后不同胚胎发育阶段尾组织样品;各母本配种时均使用同一个父本;
11、优选,同期发情和人工授精处理方法包括:
12、阴道埋植孕激素海绵栓,11d后取出;肌肉注射1ml浓度为0.1mg/ml的氯前列醇注射液;2d后用试情公羊进行发情鉴定;采集种公羊精液,以维生素b12注射液稀释精液并镜检精子活力,所述维生素b12注射液与精液的体积比为3:1,镜检精子活力大于50%后,对发情母羊进行人工授精,共授精3次,每12h一次;配种30d后,使用b超仪进行发情鉴定;
13、和/或,所述不同胚胎发育阶段指妊娠50、55、60、63、66、69、72、75和80日龄。
14、和/或,步骤(1)中,制备单细胞悬液时,使用胶原酶ⅳ、dna酶和胰蛋白酶消化组织,并使用红细胞裂解液裂解红细胞,获得单细胞悬液;优选,胶原酶ⅳ的工作浓度为2.5mg/ml、dna酶的工作浓度为15μg/ml、胰蛋白酶的工作浓度为0.25%(w/v)。
15、所述单细胞悬液中细胞浓度为500-2000个/ul,细胞总数>106个,细胞活率>86%。
16、本发明通过分阶段同期发情和人工授精的方法,同时采集不同发育阶段绵羊尾组织样品,有效消除了数据分析过程中的批次效应;且选取了多个胚胎发育时期的样本,使构建获得的图谱信息更全面。本发明方法中,所有发情母羊均用同一只种公羊的精液进行配种,从而消除了父本效应。
17、本发明方法步骤(2)中,cdna文库质检的标准为片段长度范围200-9000bp,主峰值在1000-2000bp之间;
18、构建测序文库后,先对所述测序文库进行质检后再进行上机测序,测序文库的质检标准为峰形位于250bp-1500bp之间,主峰位于400-500bp之间,无接头污染;
19、和/或,上机测序数据量为150gb/5000个细胞。
20、本发明方法步骤(3)中,所述原始比对数据包括:各时期的预测细胞数量、各细胞平均reads数量、基因umi数量中位数、测序饱和度、比对率、全部基因数量和细胞umi数量中位数。
21、本发明方法步骤(4)中,细胞质控的方法包括:计算各样本中每个细胞线粒体基因比例与总体线粒体基因比例离群情况,筛选adjust p value<0.05的线粒体基因比例最小值作为各样本阈值,删除各样本中线粒体基因比例高于所述阈值的细胞,同时删除uminumber<300的细胞。
22、本发明方法步骤(5)中,所述数据预处理包括:基于各细胞所有基因表达量进行数据标准化处理;针对表达量变异程度最高的多个基因进行数据归一化处理;数据线性降维和非线性降维;对所有细胞进行聚类分析,划分细胞群体。
23、本发明方法步骤(6)中,所述已知标记基因包括:祖细胞和干细胞标记基因:top2a;结缔组织祖细胞标记基因:col6a6;前体脂肪细胞和脂肪细胞标记基因:pparg、adipoq和lpl;前体成骨细胞和骨细胞标记基因:twist1、bmp3和bmp7;前体软骨细胞和软骨细胞标记基因:col8a1和col2a1;成肌祖细胞、肌卫星细胞、成肌细胞和肌细胞标记基因:myod1和myf6;血管平滑肌细胞标记基因:acta2和tagln;内皮细胞标记基因:pecam1;上皮细胞标记基因:epcam;血细胞标记基因:hbm和hbb;神经细胞标记基因:ptprz1;免疫细胞标记基因:ltc4s、itgam和cd163。
24、本发明在研究时遇到的问题有:1.难以确定合适的采样时间点;2.如何准确获得不同时间点样品;3.如何降低数据分析过程中的批次效应;4.尾组织复杂,如何有效消化,等。
25、绵羊胚胎的动态发育过程、各组织部位发育的关键时间节点和最佳采样时间在本发明之前无人报道,尤其是本发明涉及的绵羊脂尾组织的胚胎期发育模式鲜有关注,发育过程未知。为此,本发明之初通过常规配种手段采集了妊娠60、70、80日龄和成年等四个时间节点的尾组织样品,基于大量的组织形态学分析和普通转录组学研究才预测出胚胎70日龄是尾组织发育关键时期,同时研究发现成年阶段尾组织中脂肪大量沉积,细胞直径过大,无法应用单细胞测序技术,而80日龄脂肪细胞直径范围为14-20μm,完全满足技术要求。
26、在此过程中具体遇到了如下困难:(1)妊娠60天、70天、80天发育时间间隔过长,脂尾组织形态和转录本水平剧烈变化,无法充分探究调控脂尾发育的关键基因、通路和分子机制等科学问题;(2)常规配种手段导致样品准备工作复杂,同时也存在空怀情况;(3)多次组织消化处理和文库制备等流程造成的批次效应会导致下游分析背景噪音过大,无法科学客观的构建单细胞转录组图谱。
27、为解决以上问题,本发明(1)重新对采样时间点进行评估,最终选择妊娠50、55、60、63、66、69、72、75和80日龄,发育早期和晚期时间间隔为5天,重要发育阶段时间间隔为3天;(2)采用分阶段同期发情和人工授精的方式,探索出稳定的孕激素处理、刺激发情、发情鉴定、人工授精和妊娠检测流程,从而避免了空怀、批次效应和父本效应对下游分析的影响;(3)皮肤、骨骼和脂肪等组织可用胶原酶ⅰ消化制备细胞悬液,但预实验结果表明单一使用胶原酶ⅰ导致组织消化时间长、消化效率低、细胞活性差等问题,本发明进一步优化组织消化方法,联合使用胶原酶ⅳ、dna酶和胰蛋白酶,从而成功制备高质量单细胞悬液。
28、本发明还提供一种绵羊脂尾单细胞转录组图谱,其由上述方法构建获得。
29、详细而言,本发明精确采集尾脂沉积发生前后不同胚胎发育阶段尾组织样品,探究脂尾发育模式;通过酶消法制备高质量单细胞悬液;细胞捕获、文库构建和测序;对原始测序数据进行参考基因组比对,获得比对统计信息和细胞-基因表达矩阵(barcode-features matrix);细胞质控,过滤死细胞、低质量细胞和双细胞;细胞-基因表达矩阵预处理,包括矩阵标准化、高变基因鉴定、数据降维和划分细胞类群;基于不同细胞类型已知标记基因进行细胞注释,探究组织异质性;进行基因差异表达分析,鉴别在各细胞类群中高表达基因;高表达基因go功能富集分析,进一步验证注释结果准确性;基于高表达基因集,进行特异性评估。
30、具体地,1.精确采集尾脂沉积发生前后不同胚胎发育阶段尾组织样品,探究脂尾发育模式
31、绵羊尾脂沉积是一个从无到有的动态发育过程,为此本发明特别采集不同发育阶段的滩羊胚胎尾组织样品。为减少采样、组织处理、上机测序和数据分析可能产生的批次效应,应用分阶段同期发情和人工授精处理,通过调整发情时间和配种时间保证同时采集不同发育阶段的尾组织样品。采样时测量并记录胎儿体长、体高、尾长、尾宽、尾厚等表型数据。
32、2.通过酶消法进行组织解离,制备高质量单细胞悬液
33、pbs缓冲液将采集的新鲜组织漂洗干净,之后充分剪碎。综合使用胶原酶ⅳ、dna酶和胰蛋白酶消化组织1-2h,并使用红细胞裂解液裂解红细胞,制备单细胞悬液,检测细胞活性、细胞浓度、细胞结团率等多个指标。单细胞转录组测序要求细胞浓度500-2000个/ul,细胞总数>106,细胞活率>90%,经质检合格的单细胞悬液用于单细胞转录组测序。
34、3.细胞捕获、文库构建和测序
35、应用10x genomics的chromium next gem single cell 3′gem,library&gelbead kit v3.1试剂盒和chromium single cell a chip kit芯片,通过chromium singlecell controller仪器捕获单细胞悬液中的单个细胞,形成“油包水”结构。经细胞裂解、cdna合成、cdna文库质检、测序文库构建等步骤后,进行上机测序,测序数据量为150gb/5000细胞。
36、4.对原始测序数据进行参考基因组比对,获得原始比对数据和基因在各细胞表达量矩阵
37、利用cell ranger软件将原始测序数据比对至绵羊参考基因组oar_rambouillet_v1.0,获得预测细胞数量(estimated cell number),参考基因组比对率(mapping rate)和原始细胞-基因表达量矩阵(raw barcode-features count matrix)等数据用于后续分析。
38、5.细胞质控和基因质控
39、在细胞悬液制备和单细胞捕获过程中,无法避免的也会捕获死细胞、破碎细胞以及多个细胞(例如双细胞)进行建库测序。首先基于各细胞捕获的mrna数量(umi数量)和线粒体基因比例对raw count matrix进行细胞质控;其次移除在少于10个细胞中表达的基因;最后利用doubletfinder软件进行双细胞预测及过滤生成clean count matrix用于后续分析。
40、6.细胞-基因表达矩阵预处理
41、利用seurat软件对clean count matrix进行数据预处理流程,包括:基于各细胞所有基因表达量进行数据标准化处理(normalization);鉴别表达量变异程度最高的2000个基因,并对这些基因进行数据归一化处理(scaling);数据线性降维(pca)和非线性降维(uamp或tsne);对所有细胞进行聚类分析(clustering),划分细胞群体。
42、7.基于不同细胞类型已知标记基因进行细胞注释,探究组织异质性
43、利用各种细胞类型已知标记基因,通过手动注释的方法对各细胞群体进行注释,包括:祖细胞和干细胞标记基因:top2a;结缔组织祖细胞标记基因:col6a6;前体脂肪细胞和脂肪细胞标记基因:pparg、adipoq和lpl;前体成骨细胞和骨细胞标记基因:twist1、bmp3和bmp7;前体软骨细胞和软骨细胞标记基因:col8a1和col2a1;成肌细胞标记基因:myod1和myf6;血管平滑肌细胞标记基因:acta2和tagln;内皮细胞标记基因:pecam1;上皮细胞标记基因:epcam;血细胞标记基因:hbm和hbb;神经细胞标记基因:ptprz1;免疫细胞标记基因:ltc4s、itgam和cd163。
44、本发明另提供上述方法或绵羊脂尾单细胞转录组图谱在绵羊脂尾细胞go功能富集分析或在绵羊脂尾细胞中基因表达特异性分析中的应用。
45、本发明还筛选各细胞类型中高表达基因,并进行go功能富集分析:基于细胞注释结果,筛选在各细胞类型中高表达基因,阈值为adjust p value<0.05和log2fold change>0.5。利用annotationhub和biomart软件将绵羊基因id转换为人类同源基因id,再用clusterprofiler软件和org.hs.eg.db数据库进行go功能富集分析,adjust p value<0.05的通路为显著富集通路。可通过富集到的go通路进一步验证注释结果准确性。
46、基于筛选出的高表达基因,本发明进一步对其表达特异性进行了评估,并将其划分为四个等级:a+,完全特异性表达基因,仅在某一特定细胞类型中高表达;a,高度特异性表达基因,该基因仅在10%细胞类型中高表达;a-,中等特异性表达基因,该基因在10%~30%细胞类群中高表达;h,其他高表达基因。
47、本发明依据基因在全部细胞类型中的表达量,将其表达特异性划分四个等级:a+,a,a-和h。设计了一种用于评估单细胞图谱中基因表达特异性的策略。发现了多个可用于祖细胞干细胞群体、脂肪细胞、骨细胞、软骨细胞、成肌细胞、肌细胞等多种细胞类型注释的完全特异性表达基因(a+)。
48、本发明的有益效果至少在于:
49、本发明通过对不同胚胎发育阶段滩羊尾组织进行单细胞转录组测序,深入探究其组织异质性,构建脂尾组织单细胞转录组图谱,同时基于构建的脂尾单细胞转录组图谱,设计了一种对基因表达特异性进行评估的方法,实现了各细胞类型高表达基因的表达特异性评估,丰富了可用于标记不同细胞类型的特异性表达基因。
50、本发明为深入解析尾脂沉积分子机制、改良绵羊尾型、提高生产效率、改善胴体质量提供了重要的理论依据,同时为单细胞转录组测序技术在脂肪生成相关研究领域的应用具有重要借鉴意义。
1.一种构建绵羊脂尾单细胞转录组图谱的方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,步骤(1)中,通过分阶段同期发情和人工授精处理,调整发情时间和配种时间,保证同时采集绵羊尾脂沉积发生前后不同胚胎发育阶段尾组织样品;各母本配种时均使用同一个父本;
3.根据权利要求1或2所述的方法,其特征在于,步骤(2)中,cdna文库质检的标准为片段长度范围200-9000bp,主峰值在1000-2000bp之间;
4.根据权利要求1-3任一项所述的方法,其特征在于,步骤(3)中,所述原始比对数据包括:各时期的预测细胞数量、各细胞平均reads数量、基因umi数量中位数、测序饱和度、比对率、全部基因数量和细胞umi数量中位数。
5.根据权利要求1-4任一项所述的方法,其特征在于,步骤(4)中,细胞质控的方法包括:计算各样本中每个细胞线粒体基因比例与总体线粒体基因比例离群情况,筛选adjustp value<0.05的线粒体基因比例最小值作为各样本阈值,删除各样本中线粒体基因比例高于所述阈值的细胞,同时删除umi number<300的细胞。
6.根据权利要求1-5任一项所述的方法,其特征在于,步骤(5)中,所述数据预处理包括:基于各细胞所有基因表达量进行数据标准化处理;针对表达量变异程度最高的多个基因进行数据归一化处理;数据线性降维和非线性降维;对所有细胞进行聚类分析,划分细胞群体。
7.根据权利要求1-6任一项所述的方法,其特征在于,步骤(6)中,所述已知标记基因包括:祖细胞和干细胞标记基因:top2a;结缔组织祖细胞标记基因:col6a6;前体脂肪细胞和脂肪细胞标记基因:pparg、adipoq和lpl;前体成骨细胞和骨细胞标记基因:twist1、bmp3和bmp7;前体软骨细胞和软骨细胞标记基因:col8a1和col2a1;成肌祖细胞、肌卫星细胞、成肌细胞和肌细胞标记基因:myod1和myf6;血管平滑肌细胞标记基因:acta2和tagln;内皮细胞标记基因:pecam1;上皮细胞标记基因:epcam;血细胞标记基因:hbm和hbb;神经细胞标记基因:ptprz1;免疫细胞标记基因:ltc4s、itgam和cd163。
8.一种绵羊脂尾单细胞转录组图谱,其特征在于,由权利要求1-7任一项所述的方法构建获得。
9.权利要求1-7任一项所述的方法或权利要求8所述的绵羊脂尾单细胞转录组图谱在绵羊脂尾细胞go功能富集分析中的应用。
10.权利要求1-7任一项所述的方法或权利要求8所述的绵羊脂尾单细胞转录组图谱在绵羊脂尾细胞中基因表达特异性分析中的应用。