中烟103的DNA指纹图谱及其应用的制作方法

    专利2022-07-08  111


    本发明涉及分子生物学研究领域,具体而言,本发明涉及烟草品种的dna指纹图谱库及其在烟草品种鉴定中的应用。
    背景技术
    :为了依法处理烟草原料的走私和违法销售,需要对依法罚没的烟草原料进行鉴别检验。目前在烟草原料的鉴别检验工作中,烟叶状的样品基本上是通过外观、评吸等主观手段进行。为了提升鉴别检验的准确性,已经进行了烟草dna鉴别检验的研究。由于在dna分子水平,不同物种间甚至是同一物种不同个体之间都能得到很好的区分,因此dna分子技术作为物种分类鉴定的一种手段,已被广泛地应用于属间、种间、品种间的分类鉴定和亲缘关系研究中,几乎可以对所有的生物种类进行分类鉴定,在目前物种鉴定技术中发展最快,也最为热门。目前dna分子鉴定技术已有数十种之多,如限制性片段长度多态性标记、随机扩增多态性标记、序列特异性扩增区域标记、内含子长度多态性标记、单核苷酸多态性、简单序列重复标记等。目前用于烟草鉴定的dna分子技术主要就是ssr标记技术和snp标记技术。ssr标记技术是目前应用最为广泛的dna分子鉴定方法,但是由于ssr标记所承载的遗传信息有限,以ssr标记来进行鉴定,为了保障鉴定结果的可靠性,往往需要设计多达十几到二十多对的引物,引物的设计开发比较复杂,并需要大量的验证试验,这就造成前期引物设计周期长,实验验证工作量大,后期鉴定时操作比较繁琐,鉴定通量低,并且在稍复杂的鉴定中,还是需要测序来验证检验结果的准确性。snp标记技术包括质谱法、芯片法等,质谱法所采用的质谱设备昂贵且检测通量低,芯片法成本较高,且需要进行基因芯片的定制,实验操作比较复杂。受益于当前测序技术的进步和成本的大幅度降低,以测序法进行烟草dna鉴定成为可能。测序法主要包括简化基因组测序法和全基因组重测序法,这两种方法都能够比较全面的获取被检样品的遗传信息,区别在于简化基因组测序所需要的位点数较少,覆盖基因组的5%-10%即可,而全基因组重测序则需要获得整个基因组的遗传变异信息,需要的数据量大,成本高,结合烟草dna鉴定的实际情况,简化基因组测序已经完全可以满足鉴定要求。开发烟草品种的新型dna鉴定方法对于提升相关品种鉴定的准确性、对于推动烟草dna鉴别检验工作的发展具有积极的意义。技术实现要素:针对上述技术问题,本发明的目的是提供一种可用于鉴定烟草品种的dna指纹图谱库,所述dna指纹图谱库包括品种特异性的snp位点。此外,中国烟草的两大类型为晾晒烟和烤烟,前者以宁乡晒烟为典型品种,后者以中烟103和云烟87为典型品种。在实际鉴定工作中这几类烟草的鉴定需求大,鉴定难度高,因此本发明的目的还在于提供这些特定烟草品种的dna指纹图谱。本发明的技术方案如下。一方面,本发明提供一种烟草品种的dna指纹图谱库,所述dna指纹图谱库包括如下101个特异性snp位点:另一方面,本发明还提供所述指纹图谱库的建立方法,包括以下步骤:(1)收集烟草品种种质共131个,见表1,取新鲜烟叶分别提取基因组dna,然后以限制性内切酶saci和msei分别对基因组dna进行酶切;(2)将步骤(1)得到的酶切片段与测序接头相连接后纯化,选择长度在320-420bp范围内的片段,富集扩增并测序,其中采用illuminanovaseq测序系统,原始测序读长为paired-end150bp,测序数据为fastq格式;(3)从ftp://ftp.solgenomics.net/genomes/nicotiana_tabacum/edwards_et_al_2017/assembly/获得典型烟草品种的基因组,使用其scaffold水平作为参考基因组,选取长度≥1kb的scaffold,共371,419条,总长4.2gb,用限制性内切酶saci和msei进行模拟酶切,选择片段双端分别为两个酶切位点且片段长度为200-600bp的片段,共获得片段355,695个;(4)将步骤(2)得到的原始reads使用软件fastqcv0.11.5进行质量统计,并使用软件trimmomatic-0.38进行过滤,过滤参数如下:a.双末端测序前端去掉前5个碱基,双末端测序后端去掉前3个碱基;b.从头开始去掉质量小于20的碱基,直到出现质量大于20的碱基为止,从结尾开始去掉质量小于20的碱基,直到出现质量大于20的碱基为止;c.如果5个相连碱基平均质量小于20,则去掉此5个碱基;d.read最小长50bp;e.reads平均质量大于20;(5)进行dna指纹图谱库的构建,包括:(5-1)用bwa gatk流程检测步骤(4)得到的reads的变异,包括1,219,877个indel和2,222,588个snp;(5-2)选择所述snp,按照“qd<2.0||fs>60.0||mq<40.0||mqranksum<-12.5||readposranksum<-8.0||qual<40”对低质量的snp进行过滤,得到978,426个高质量snp;(5-3)使用vcftools过滤掉等位基因频率小于0.05、群体中缺失率大于20%的snp,得到104,788个snp;(5-4)计算每个snp的多态性信息含量(pic)值,选择pic值大于0.35的snp,得到65,582个snp;(5-5)依据参考基因组scaffold的数量及其长度,选择大于50kb的scaffold上的snp,得到44,122个snp;(5-6)对所述snp进行注释,选择在基因编码区的snp,得到746个snp,过滤掉杂合度大于5%的snp,得到101个snp。另一方面,本发明还提供一种烟草品种的dna指纹图谱的建立方法,所述建立方法包括:基于本发明提供的指纹图谱库,检测所述烟草的标准品种对应snp位点上的特异性核苷酸,得到所述烟草品种的dna指纹图谱。由此,再一方面,本发明还提供通过所述建立方法得到的dna指纹图谱。以及,另一方面,本发明还提供所述dna指纹图谱库或dna指纹图谱在鉴定烟草品种中的应用。根据本发明的具体实施方式,本发明提供宁乡晒烟的dna指纹图谱,所述dna指纹图谱包括101个snp位点,所述snp位点及其上的特异性核苷酸如下:上述dna指纹图谱可用于鉴定宁乡晒烟,因此本发明还提供所述dna指纹图谱在鉴定宁乡晒烟中的应用。因此,本发明还提供一种宁乡晒烟的鉴定方法,所述鉴定方法包括以下步骤:检测待测烟草的基因组dna中本发明所提供的dna指纹图谱库中的101个snp位点,并与宁乡晒烟dna指纹图谱中所述位点上的特异性核苷酸相比较,符合率≥95%时将待测烟草鉴定为宁乡晒烟。其中优选地,从待测烟草的新鲜烟叶中获得所述基因组dna。根据本发明的具体实施方式,本发明提供中烟103的dna指纹图谱,所述dna指纹图谱包括101个snp位点,所述snp位点及其上的特异性核苷酸如下:上述dna指纹图谱可用于鉴定中烟103,因此本发明还提供所述dna指纹图谱在鉴定中烟103中的应用。因此,本发明还提供一种中烟103的鉴定方法,所述鉴定方法包括以下步骤:检测待测烟草的基因组dna中本发明所提供的dna指纹图谱库中的101个snp位点,并与中烟103dna指纹图谱中所述位点上的特异性核苷酸相比较,符合率≥95%时将待测烟草鉴定为中烟103。其中优选地,从待测烟草的新鲜烟叶中获得所述基因组dna。根据本发明的具体实施方式,本发明提供云烟87的dna指纹图谱,所述dna指纹图谱包括101个snp位点,所述snp位点及其上的特异性核苷酸如下:上述dna指纹图谱可用于鉴定云烟87,因此本发明还提供所述dna指纹图谱在鉴定云烟87中的应用。因此,本发明还提供一种云烟87的鉴定方法,所述鉴定方法包括以下步骤:检测待测烟草的基因组dna中本发明所提供的dna指纹图谱库中的101个snp位点,并与云烟87dna指纹图谱中所述位点上的特异性核苷酸相比较,符合率≥95%时将待测烟草鉴定为云烟87。其中优选地,从待测烟草的新鲜烟叶中获得所述基因组dna。具体而言,本发明提供的鉴定方法优选包括以下步骤:(1)从待测烟草的组织样品中提取基因组dna,以限制性内切酶saci和msei对基因组dna进行酶切;(2)将步骤(1)得到的酶切片段与测序接头相连接后纯化,选择长度在320-420bp范围内的片段,富集扩增并测序,其中采用illuminanovaseq测序系统,原始测序读长为paired-end150bp,测序数据为fastq格式;(3)将步骤(2)得到的所述101个snp位点上的核苷酸与宁乡晒烟、中烟103或云烟87dna指纹图谱中所述位点上的特异性核苷酸相比较,符合率>95%时将待测烟草鉴定为宁乡晒烟、中烟103或云烟87。在所述鉴定方法中,步骤(1)中,所述组织样品为新鲜烟叶;酶切体系为:37℃温育4h以上。本发明的具体方案如下。本发明的研究过程及原理在于:广泛收集目前在种植的烟草品种种质,构建基于简化基因组测序的烟草dna数据库,在该数据库中筛选和过滤烟草品种特异位点,并对其进行验证。具体步骤包括:1、广泛收集目前在种植的烟草品种种质;2、对收集的烟草品种种质分别进行dna提取,并对提取的dna进行质量分析;3、选用合适的酶切方法分别对提取的dna进行酶切,以设计的测序接头与酶切片段进行连接,将加了接头的片段进行纯化后,再进行片段选择,而后对选择的dna片段进行富集扩增并上机测序;4、选择已经公开发表的典型烟草品种的基因组作为参考基因组,仿照步骤3对参考基因组进行模拟酶切,选择合适位置和长度的片段,并以生物信息分析软件分析;5、采用软件将各个样本的reads比对到参考基因组,设置合理的筛选过滤参数,构建在种植烟草品种的特异位点数据库;6、从中筛选出特定烟草品种的特异位点,建立基于简化基因组测序的指纹图谱以及采用该指纹图谱的鉴定方法;7、以盲样对上述方法的可靠性进行验证。具体步骤如下:1)广泛收集目前在种植的烟草品种种质共131个(见表1)。2)对收集的131个烟草品种种质分别进行dna提取:(1)取不同品种的新鲜烟叶分别将其组织碾磨成细粉末,放入2ml离心管中;(2)加入600~800μl的ctab提取缓冲液,混匀(ctab在65℃水浴预热),每3~5min轻轻震荡几次,20min后12000r/min离心10~15min;(3)小心吸取上清液,加入等体积的苯酚:氯仿(各400μl)溶液,混匀,4℃,12000r/min,离心10~15min;(4)小心吸取上清液,加入等体积的氯仿,混匀,4℃,12000r/min,离心10~15min,重复2~3次,以蛋白层不出现为止;(5)取上清,-20℃沉淀1~2h,4℃,12000r/min,离心10~15min;(6)弃去上清液,用50%~70%乙醇洗涤沉淀2次;室温下干燥后(一般干燥10~15min),于-20℃或者-70℃下保存备用。对提取的dna进行质量分析(dna总量大于1μg,dna浓度≥40ng/ul,dna纯度:od260/od280=1.8-2.0,od260/od230大于2.0,琼脂糖凝胶电泳检测主带大约23kb,无拖尾,无降解),结果见表2。3)以限制性内切酶saci和msei对基因组dna进行酶切,酶切体系如下:酶切条件为:37℃温育4h以上,然后由商业测序公司用设计的测序接头与酶切片段进行连接;将加了接头的片段进行纯化后,再进行片段选择,选择长度在320-420bp范围内的片段,最后对选择的dna片段进行富集扩增并上机测序。测序平台使用的是illuminanovaseq测序系统,原始测序读长为paired-end150bp,测序数据为fastq格式,所有131个烟草种质的测序数据统计见表3。4)选择已经公开发表的典型烟草品种的基因组作为参考基因组(ftp://ftp.solgenomics.net/genomes/nicotiana_tabacum/edwards_et_a1_2017/assemblv/)。此参考基因组染色体水平总长度仅为2.8gb,所以使用scaffold水平作为参考基因组,选取长度>=1kb的scaffold,共371,419条,总长4.2gb(见表4)。用限制性内切酶saci(gagctc)和msei(ttaa)对参考烟草基因组进行模拟酶切,选择片段双端分别为两个酶切位点且片段长度为200-600bp的片段,共获得片段355,695个。步骤3)得到的原始reads质量统计使用软件fastqcv0.11.5(见图1);过滤软件使用trimmomatic-0.38,数据统计如表4,过滤参数如下:a.双末端测序前端去掉前5个碱基,双末端测序后端去掉前3个碱基;b.从头开始去掉质量小于20的碱基,直到出现质量大于20的碱基为止,从结尾开始去掉质量小于20的碱基,直到出现质量大于20的碱基为止;c.如果5个相连碱基平均质量小于20,则去掉此5个碱基;d.read最小长50bp;e.reads平均质量大于20。5)dna指纹图谱库的构建:(1)用bwa gatk流程,检测步骤4)得到的reads的变异。一共得到3,442,465个变异,包括1,219,877个indel和2,222,588个snp;(2)选择snp进行进一步的指纹图谱的开发,按照“qd<2.0||fs>60.0||mq<40.0||mqranksum<-12.5||readposranksum<-8.0||qual<40”对低质量的snp进行过滤,得到978,426个高质量snp;(3)用vcftools,过滤掉此等位基因频率小于0.05,群体中缺失率大于20%的snp,得到104,788个snp;(4)计算每个snp的多态性信息含量(pic)值,根据结果(图2),选择pic值大于0.35的snp,进行下一步分析,共计65,582个snp;(5)依据参考基因组scaffold的数量及其长度,选择大于50kb的scaffold上的snp进行下一步分析,这些scaffold连续性好,组装质量相对更高,snp数量为44,122;(6)对上述snp进行了注释,在基因编码区的snp共有746个,相对来说,基因编码区的snp和表型的直接关联程度更高,在足够多snp可选的情况下,选取相关snp,是更好的选择,在群体范围内,过滤到杂合度大于5%的snp后,snp个数为101,统计了每个样品的杂合率(参见表5),有4个个体的杂合率明显偏高(>20%),过滤掉这4个样品(t54,t128,t123和t1);(7)将上述101个snp位点作为本专利所构建的烟草品种dna指纹图谱库核心位点。6)特定烟草品种的dna指纹图谱的获取:6-1)宁乡晒烟:通过参照表1中t131宁乡晒烟的测序结果确定101个位点上的具体核苷酸,得到宁乡晒烟的dna指纹图谱如表6所示。接下来,以步骤6-1)得到的宁乡晒烟特异性位点对其进行盲样dna鉴定。在盲样鉴定中,随机抽取10个烟草样品(其中5号是宁乡晒烟),对宁乡晒烟的简化基因组测序鉴定法进行验证,结果表明,5号样品101个核心snp位点有99个符合,符合率95%以上,判断5号样品为宁乡晒烟,这也与事实相符,因此证明了本发明的基于简化基因组测序的宁乡晒烟dna鉴定方法是可靠的,可以对宁乡晒烟进行dna鉴定。6-2)中烟103:通过参照表1中t2中烟103的测序结果确定101个位点上的具体核苷酸,得到中烟103的dna指纹图谱如表7所示。接下来,以步骤6-2)得到的中烟103特异性位点对其进行盲样dna鉴定。在盲样鉴定中,随机抽取10个烟草样品(其中3号是中烟103),对中烟103的简化基因组测序鉴定法进行验证,结果表明,3号样品101个核心snp位点有96个符合,符合率95%以上,判断3号样品为中烟103,这也与事实相符,因此证明了本发明的基于简化基因组测序的中烟103dna鉴定方法是可靠的,可以对中烟103进行dna鉴定。6-3)云烟87:通过参照表1中t101云烟87的测序结果确定101个位点上的具体核苷酸,得到云烟87的dna指纹图谱如表8所示。接下来,以步骤6-3)得到的云烟87特异性位点对其进行盲样dna鉴定。在盲样鉴定中,随机抽取10个烟草样品(其中7号是云烟87),对云烟87的简化基因组测序鉴定法进行验证,结果表明,7号样品101个核心snp位点有97个符合,符合率95%以上,判断7号样品为云烟87,这也与事实相符,因此证明了本发明的基于简化基因组测序的云烟87dna鉴定方法是可靠的,可以对云烟87进行dna鉴定。相比于现有技术,由于本发明的方法以烟草dna的特异性作为鉴定依据,因此与传统的外观、评吸鉴定方法相比,有更加客观、更加准确、更加可靠的优势。表1收集的烟草品种种质表2对提取的dna进行质量分析的结果表3烟草种质的简化测序数据统计表表4对照烟草基因组scaffold统计no.ofscaffoldlengthofscaffold(bp)0-1k713,013447,478,5001-10k354,214701,677,34410-100k8,431342,749,966100-500k7,0921,645,198,586500k-1m1,230840,375,0091m452717,469,393toltal1,084,4324,694,948,798表5在核心snp标记中单个样品的杂合度(杂合度等于0的样品忽略)附图说明以下,结合附图来详细说明本发明的实施方案,其中:图1显示了原始reads质量统计情况,其中,图1a:(a)双末端测序前端每个碱基序列含量;图1b:(b)双末端测序前端每个碱基序列质量;图1c:(c)双末端测序后端每个碱基序列含量;图1d:(d)双末端测序后端每个碱基序列质量。图2显示了104,788个snp标记的多态性信息含量分布情况。具体实施方式以下参照具体的实施例来说明本发明。下述实施例中的实验方法,如无特殊说明,均为常规方法。下述实施例中所用的原料、试剂材料等,如无特殊说明,均为市售购买产品。实施例1对一未知烟草品种样品,进行dna提取:(1)取不同样品分别将其组织碾磨成细粉末,放入2ml离心管中;(2)加入800μl的ctab提取缓冲液,混匀(ctab在65℃水浴预热),每5min轻轻震荡几次,20min后12000r/min离心10min;(3)小心吸取上清液,加入等体积的苯酚:氯仿(各400μl)溶液,混匀,4℃,12000r/min,离心10min;(4)小心吸取上清液,加入等体积的氯仿,混匀,4℃,12000r/min,离心10min,重复2次,以蛋白层不出现为止;(5)取上清,-20℃沉淀1h,4℃,12000r/min,离心10min;(6)弃去上清液,用50%乙醇洗涤沉淀2次;室温下干燥后(一般干燥10min),于-20℃下保存备用。以限制性内切酶saci和msei对基因组dna进行酶切,然后用设计的测序接头与酶切片段进行连接;将加了接头的片段进行纯化后,再进行片段选择,选择长度在320-420bp范围内的片段,最后对选择的dna片段进行富集扩增并上机测序。测序平台使用的是illuminanovaseq测序系统,原始测序读长为paired-end150bp,测序数据为fastq格式。测序结果表明,该样品101个核心snp位点有23个符合宁乡晒烟dna指纹图谱,符合率22.8%,在95%以下,因此判断该样品不是宁乡晒烟。实施例2对一未知烟草品种样品,进行dna提取:(1)取不同样品分别将其组织碾磨成细粉末,放入2ml离心管中;(2)加入800μl的ctab提取缓冲液,混匀(ctab在65℃水浴预热),每3min轻轻震荡几次,20min后12000r/min离心15min;(3)小心吸取上清液,加入等体积的苯酚:氯仿(各400μl)溶液,混匀,4℃,12000r/min,离心15min;(4)小心吸取上清液,加入等体积的氯仿,混匀,4℃,12000r/min,离心15min,重复3次,以蛋白层不出现为止;(5)取上清,-20℃沉淀2h,4℃,12000r/min,离心15min;(6)弃去上清液,用70%乙醇洗涤沉淀2次;室温下干燥后(一般干燥15min),于-70℃下保存备用。以限制性内切酶saci和msei对基因组dna进行酶切,然后用设计的测序接头与酶切片段进行连接;将加了接头的片段进行纯化后,再进行片段选择,选择长度在320-420bp范围内的片段,最后对选择的dna片段进行富集扩增并上机测序。测序平台使用的是illuminanovaseq测序系统,原始测序读长为paired-end150bp,测序数据为fastq格式。测序结果表明,该样品101个核心snp位点有97个符合宁乡晒烟dna指纹图谱,符合率96.0%,在95%以上,因此判断该样品是宁乡晒烟。实施例3对一未知烟草品种样品,进行dna提取:(1)取不同样品分别将其组织碾磨成细粉末,放入2ml离心管中;(2)加入800μl的ctab提取缓冲液,混匀(ctab在65℃水浴预热),每5min轻轻震荡几次,20min后12000r/min离心10min;(3)小心吸取上清液,加入等体积的苯酚:氯仿(各400μl)溶液,混匀,4℃,12000r/min,离心10min;(4)小心吸取上清液,加入等体积的氯仿,混匀,4℃,12000r/min,离心10min,重复2次,以蛋白层不出现为止;(5)取上清,-20℃沉淀1h,4℃,12000r/min,离心10min;(6)弃去上清液,用50%乙醇洗涤沉淀2次;室温下干燥后(一般干燥10min),于-20℃下保存备用。以限制性内切酶saci和msei对基因组dna进行酶切,然后用设计的测序接头与酶切片段进行连接;将加了接头的片段进行纯化后,再进行片段选择,选择长度在320-420bp范围内的片段,最后对选择的dna片段进行富集扩增并上机测序。测序平台使用的是illuminanovaseq测序系统,原始测序读长为paired-end150bp,测序数据为fastq格式。测序结果表明,该样品101个核心snp位点有17个符合中烟103dna指纹图谱,符合率16.8%,在95%以下,因此判断该样品不是中烟103。实施例4对一未知烟草品种样品,进行dna提取:(1)取不同样品分别将其组织碾磨成细粉末,放入2ml离心管中;(2)加入800μl的ctab提取缓冲液,混匀(ctab在65℃水浴预热),每3min轻轻震荡几次,20min后12000r/min离心15min;(3)小心吸取上清液,加入等体积的苯酚:氯仿(各400μl)溶液,混匀,4℃,12000r/min,离心15min;(4)小心吸取上清液,加入等体积的氯仿,混匀,4℃,12000r/min,离心15min,重复3次,以蛋白层不出现为止;(5)取上清,-20℃沉淀2h,4℃,12000r/min,离心15min;(6)弃去上清液,用70%乙醇洗涤沉淀2次;室温下干燥后(一般干燥15min),于-70℃下保存备用。以限制性内切酶saci和msei对基因组dna进行酶切,然后用设计的测序接头与酶切片段进行连接;将加了接头的片段进行纯化后,再进行片段选择,选择长度在320-420bp范围内的片段,最后对选择的dna片段进行富集扩增并上机测序。测序平台使用的是illuminanovaseq测序系统,原始测序读长为paired-end150bp,测序数据为fastq格式。测序结果表明,该样品101个核心snp位点有97个符合中烟103dna指纹图谱,符合率96.0%,在95%以上,因此判断该样品是中烟103。实施例5对一未知烟草品种样品,进行dna提取:(1)取不同样品分别将其组织碾磨成细粉末,放入2ml离心管中;(2)加入800μl的ctab提取缓冲液,混匀(ctab在65℃水浴预热),每5min轻轻震荡几次,20min后12000r/min离心10min;(3)小心吸取上清液,加入等体积的苯酚:氯仿(各400μl)溶液,混匀,4℃,12000r/min,离心10min;(4)小心吸取上清液,加入等体积的氯仿,混匀,4℃,12000r/min,离心10min,重复2次,以蛋白层不出现为止;(5)取上清,-20℃沉淀1h,4℃,12000r/min,离心10min;(6)弃去上清液,用50%乙醇洗涤沉淀2次;室温下干燥后(一般干燥10min),于-20℃下保存备用。以限制性内切酶saci和msei对基因组dna进行酶切,然后用设计的测序接头与酶切片段进行连接;将加了接头的片段进行纯化后,再进行片段选择,选择长度在320-420bp范围内的片段,最后对选择的dna片段进行富集扩增并上机测序。测序平台使用的是illuminanovaseq测序系统,原始测序读长为paired-end150bp,测序数据为fastq格式。测序结果表明,该样品101个核心snp位点有27个符合云烟87dna指纹图谱,符合率26.7%,在95%以下,因此判断该样品不是云烟87。实施例6对一未知烟草品种样品,进行dna提取:(1)取不同样品分别将其组织碾磨成细粉末,放入2ml离心管中;(2)加入800μl的ctab提取缓冲液,混匀(ctab在65℃水浴预热),每3min轻轻震荡几次,20min后12000r/min离心15min;(3)小心吸取上清液,加入等体积的苯酚:氯仿(各400μl)溶液,混匀,4℃,12000r/min,离心15min;(4)小心吸取上清液,加入等体积的氯仿,混匀,4℃,12000r/min,离心15min,重复3次,以蛋白层不出现为止;(5)取上清,-20℃沉淀2h,4℃,12000r/min,离心15min;(6)弃去上清液,用70%乙醇洗涤沉淀2次;室温下干燥后(一般干燥15min),于-70℃下保存备用。以限制性内切酶saci和msei对基因组dna进行酶切,然后用设计的测序接头与酶切片段进行连接;将加了接头的片段进行纯化后,再进行片段选择,选择长度在320-420bp范围内的片段,最后对选择的dna片段进行富集扩增并上机测序。测序平台使用的是illuminanovaseq测序系统,原始测序读长为paired-end150bp,测序数据为fastq格式。测序结果表明,该样品101个核心snp位点有97个符合云烟87dna指纹图谱,符合率96.0%,在95%以上,因此判断该样品是云烟87。以上对本发明具体实施方式的描述并不限制本发明,本领域技术人员可以根据本发明作出各种改变或变形,只要不脱离本发明的精神,均应属于本发明所附权利要求的范围。当前第1页1 2 3 
    技术特征:

    1.中烟103的dna指纹图谱,所述dna指纹图谱包括101个snp位点,所述snp位点及其上的特异性核苷酸如下:

    2.权利要求1所述的dna指纹图谱的获取方法,其特征在于,所述获取方法包括以下步骤:

    (1)收集烟草品种种质131个,见表1,取新鲜烟叶分别提取基因组dna,然后以限制性内切酶saci和msei对基因组dna进行酶切;

    (2)将步骤(1)得到的酶切片段与测序接头相连接后纯化,选择长度在320-420bp范围内的片段,富集扩增并测序,其中采用illuminanovaseq测序系统,原始测序读长为paired-end150bp,测序数据为fastq格式;

    (3)从ftp://ftp.solgenomics.net/genomes/nicotiana_tabacum/edwards_et_al_2017/assembly/获得典型烟草品种的基因组,使用其scaffold水平作为参考基因组,选取长度≥1kb的scaffold,共371,419条,总长4.2gb,用限制性内切酶saci和msei进行模拟酶切,选择片段双端分别为两个酶切位点且片段长度为200-600bp的片段,共获得片段355,695个;

    (4)将步骤(2)得到的原始reads使用软件fastqcv0.11.5进行质量统计,并使用软件trimmomatic-0.38进行过滤,过滤参数如下:a.双末端测序前端去掉前5个碱基,双末端测序后端去掉前3个碱基;b.从头开始去掉质量小于20的碱基,直到出现质量大于20的碱基为止,从结尾开始去掉质量小于20的碱基,直到出现质量大于20的碱基为止;c.如果5个相连碱基平均质量小于20,则去掉此5个碱基;d.read最小长50bp;e.reads平均质量大于20;

    (5)进行dna指纹图谱库的构建,包括:

    (5-1)用bwa gatk流程检测步骤(4)得到的reads的变异,包括1,219,877个indel和2,222,588个snp;

    (5-2)选择所述snp,按照“qd<2.0||fs>60.0||mq<40.0||mqranksum<-12.5||readposranksum<-8.0||qual<40”对低质量的snp进行过滤,得到978,426个高质量snp;

    (5-3)使用vcftools过滤掉等位基因频率小于0.05、群体中缺失率大于20%的snp,得到104,788个snp;

    (5-4)计算每个snp的多态性信息含量(pic)值,选择pic值大于0.35的snp,得到65,582个snp;

    (5-5)依据参考基因组scaffold的数量及其长度,选择大于50kb的scaffold上的snp,得到44,122个snp;

    (5-6)对所述snp进行注释,选择在基因编码区的snp,得到746个snp,过滤掉杂合度大于5%的snp,得到101个snp;

    (6)特定烟草品种的dna指纹图谱的获取:

    通过参照表1中t2中烟103的测序结果确定101个位点上的具体核苷酸,得到中烟103的dna指纹图谱。

    3.权利要求1所述的dna指纹图谱在鉴定中烟103中的应用。

    4.中烟103的鉴定方法,所述鉴定方法包括以下步骤:

    检测待测烟草的基因组dna中权利要求1中限定的101个snp位点,并与权利要求1中限定的dna指纹图谱中所述位点上的特异性核苷酸相比较,符合率≥95%时将待测烟草鉴定为中烟103。

    5.根据权利要求4所述的鉴定方法,其特征在于,从待测烟草的新鲜烟叶中获得所述基因组dna。

    6.根据权利要求4或5所述的鉴定方法,其特征在于,所述鉴定方法包括以下步骤:

    (1)从待测烟草的组织样品中提取基因组dna,以限制性内切酶saci和msei对基因组dna进行酶切;

    (2)将步骤(1)得到的酶切片段与测序接头相连接后纯化,选择长度在320-420bp范围内的片段,富集扩增并测序,其中采用illuminanovaseq测序系统,原始测序读长为paired-end150bp,测序数据为fastq格式;

    (3)将步骤(2)得到的所述101个snp位点上的核苷酸与权利要求1中限定的dna指纹图谱中所述位点上的特异性核苷酸相比较,符合率≥95%时将待测烟草鉴定为中烟103。

    7.根据权利要求3至6中任一项所述的鉴定方法,其特征在于,所述步骤(1)中,所述组织样品为新鲜烟叶。

    8.根据权利要求3至7中任一项所述的鉴定方法,其特征在于,所述步骤(1)中,酶切体系为:

    37℃温育4h以上。

    技术总结
    本发明公开了烟草品种的DNA指纹图谱库,所述DNA指纹图谱库包括101个特异性SNP位点;并且本发明还提供了采用所述DNA指纹图谱库在烟草品种鉴定中的应用。本发明提供的DNA指纹图谱库以及特定烟草品种的DNA指纹图谱基于简化基因组测序得到,用于烟草品种鉴定时,与传统的外观、评吸鉴定方法相比,可以提供更加客观、更加准确、更加可靠的鉴定结果。

    技术研发人员:刘楠;张威;何声宝;王英元;罗安娜;冯晓民;张晓慧;范月月
    受保护的技术使用者:国家烟草质量监督检验中心
    技术研发日:2020.04.27
    技术公布日:2021.03.12

    转载请注明原文地址:https://wp.8miu.com/read-17084.html

    最新回复(0)