染色体实例分割方法、系统和存储介质与流程

    专利2022-07-08  113


    本发明涉及图像处理技术领域,尤其是一种染色体实例分割方法、系统和存储介质。



    背景技术:

    染色体是遗传信息的重要载体,正常的人体细胞中包含46条染色体,其包括23对常染色体和一对性染色体。在该对性染色体中,女性为两条x性染色体,男性为一条性染色体一条y染色体。染色体核型分析是产前诊断、遗传疾病诊断和筛查的常用且重要的基础手段。染色体核型分析是指从细胞分裂中期的显微镜图像中分割出染色体实例,并根据iscn规则排列成染色体核型的过程。染色体核型分析主要包括染色体分割和染色体分类排序两个阶段。染色体分割是指从显微镜图像中将染色体实例分离出来。由于染色体存在非刚性特性,导致在显微镜图像中经常出现染色体接触或者重叠在一起,从而增加了分割染色体实例的难度。



    技术实现要素:

    为解决上述技术问题,本发明的目的在于:提供一种染色体实例分割方法、系统和存储介质,其能自动分割和提取出图像中所有染色体实例。

    本发明实施例的第一方面提供了:

    一种染色体实例分割方法,包括以下步骤:

    获取细胞分裂中期的显微镜图像;

    对所述细胞分裂中期的显微镜图像进行第一次分割,得到若干张子图像;

    对所述若干张子图像进行识别,得到第一染色体实例集合和染色体簇集合;

    对所述染色体簇集合内的染色体簇进行第二次分割,得到第二染色体实例集合;

    将所述第一染色体实例集合和第二染色体实例集合合并,得到染色体实例总集合。

    进一步地,所述细胞分裂中期的显微镜图像为灰度图像,所述对所述细胞分裂中期的显微镜图像进行第一次分割,其具体为:

    根据所述灰度图像的几何连通性对所述细胞分裂中期的显微镜图像进行第一次分割。

    进一步地,所述根据所述灰度图像的几何连通性对所述细胞分裂中期的显微镜图像进行第一次分割,其具体为:

    采用分水岭算法或者阈值分割算法根据所述灰度图像的几何连通性对所述细胞分裂中期的显微镜图像进行第一次分割。

    进一步地,所述对所述若干张子图像进行识别,得到第一染色体实例集合和染色体簇集合,其具体为:

    通过机器学习分类算法和分类权重对所述干张子图像进行识别划分,得到第一染色体实例集合和染色体簇集合。

    进一步地,所述机器学习分类算法为预先进行训练的算法,所述分类权重为所述机器学习分类算法在预先训练过程中得到在权重;所述机器学习分类算法的训练步骤包括:

    获取预先完成标签的染色体图像作为第一训练集,所述标签与所述染色体类别对应;

    通过所述第一训练集对所述机器学习分类算法进行训练,得到训练权重。

    进一步地,所述对所述染色体簇集合内的染色体簇进行第二次分割,得到第二染色体实例集合,包括:

    对所述染色体簇集合内的染色体簇进行无效像素边界最小化,得到每个染色体簇的边框大小;

    获取所述边框大小中高度和宽度均最大的边框大小作为标准值;

    对剩余边框大小对应的染色体簇的四周进行像素填充,得到与所述标准值相同的染色体簇;

    采用深度学习实例分割模型和训练权重预测像素填充后的染色体簇的掩码;

    根据所述掩码从所述染色体簇集合内的染色体簇中获取染色体实例作为第二染色体实例集合。

    进一步地,所述深度学习实例分割模型为预先进行训练的模型,所述训练权重为所述深度学习实例分割模型在完成训练后得到的训练权重,所述深度学习实例分割模型的训练步骤包括:

    将像素填充后的若干个的染色体簇进行像素标注;

    根据像素标注后的染色体簇创建第二训练集;

    将所述第二训练集划分为实训集、测试集和验证集;

    通过所述实训集、测试集和验证集分别对所述深度学习实例分割模型进行训练、测试和验证。

    本发明实施例的第二方面提供了:

    一种染色体实例分割系统,包括:

    获取模块,用于获取细胞分裂中期的显微镜图像;

    第一分割模块,用于对所述细胞分裂中期的显微镜图像进行第一次分割,得到若干张子图像;

    识别模块,用于对所述若干张子图像进行识别,得到第一染色体实例集合和染色体簇集合;

    第二分割模块,用于对所述染色体簇集合内的染色体簇进行第二次分割,得到第二染色体实例集合;

    合并模块,用于将所述第一染色体实例集合和第二染色体实例集合合并,得到染色体实例总集合。

    本发明实施例的第三方面提供了:

    一种染色体实例分割系统,包括:

    至少一个存储器,用于存储程序;

    至少一个处理器,用于加载所述程序以执行所述的染色体实例分割方法。

    本发明实施例的第四方面提供了:

    一种存储介质,其中存储有处理器可执行的指令,所述处理器可执行的指令在由处理器执行时用于实现所述的染色体实例分割方法。

    本发明的有益效果是:本发明通过对细胞分裂中期的显微镜图像进行第一次分割,得到若干张子图像,然后对若干张子图像进行识别,得到第一染色体实例集合和染色体簇集合,并对染色体簇集合内的染色体簇进行第二次分割,得到第二染色体实例集合,接着第一染色体实例集合和第二染色体实例集合合并,得到染色体实例总集合,以实现全自动化染色体实例分割的效果,降低因染色体的非刚性特性导致染色体实例分割的难度,提取出图像中的所有染色体实例。

    附图说明

    图1为本发明一种具体实施例的染色体实例分割方法的流程图。

    具体实施方式

    下面结合附图和具体实施例对本发明做进一步的详细说明。对于以下实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。

    在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。

    除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。

    首先,对本申请出现的名词进行解释:

    iscn:internationalsystemforhumancytogeneticnomenclature,国际人类细胞遗传命名系统,用于规范描述人类染色体和染色体畸变时使用的条带名称、符号和缩写词术等。

    染色体中期细胞图像:其指通过电子显微镜拍摄的细胞中期的灰度图像。

    染色体核型图:其指对染色体实例进行分割后,依据条带信息进行排序,生成核型图。

    染色体实例:其指一条一条的染色体。正常的人体细胞中,包含23对染色体,其中22对常染色体,编号从1到22号,每一对染色体中,有一条遗传自母亲,有一条遗传自父亲。在一对性染色体中,女性为两条x,分别遗传自母亲和父亲,男性为一条x(遗传自母亲)和一条y(遗传自父亲)。异常人体细胞中,可能在某对或者某几对染色体中缺少其中一条染色体,或者多出一条染色体。

    染色体核型分析:其指对染色体中期细胞图象进行分割,获取到所有条染色体实例,然后再根据染色体条带信息进行排序生成染色体核型图的过程。染色体核型分析主要包括两个步骤,染色体的实例分割和染色体的分类。制约染色体的核型分析的主要障碍在与重叠和接触染色体簇的分离或分割。

    染色体簇:其指有两条或者两条以上的染色体重叠、相连(接触)在一起,形成具有像素相连的簇。根据簇形成的原因,染色体簇还可以进一步细分为重叠染色体簇(overlappingchromosomecluster)、接触染色体簇(也叫:相连染色体簇,touchingchromosomecluster)以及重叠并接触染色体簇(overlapping&touchingchromosomecluster)。其中,重叠染色体簇是指两条或者两条以上的染色体实例重叠在一起;接触染色体簇是指两条或者两条以上的染色体实例相连;重叠并接触染色体簇是指三条或三条以上的染色体实例重叠和接触在一起。

    参照图1,本发明实施例提供了一种染色体实例分割方法,本实施例可应用于处理终端或者服务端。具体地,本实施例包括以下步骤:

    s11、获取细胞分裂中期的显微镜图像;该细胞分裂中期的显微镜图像可以为通过显微镜获取的灰度图像。

    s12、对细胞分裂中期的显微镜图像进行第一次分割,得到若干张子图像;

    在一些实施例中,上述的细胞分裂中期的显微镜图像为灰度图像,其中,对细胞分裂中期的显微镜图像进行第一次分割,其具体可通过以下方式实现:

    根据灰度图像的几何连通性对细胞分裂中期的显微镜图像进行第一次分割。在第一次分割后,可以得到若干张子图像,每一个该若干张子图像为只包含一个染色体簇或者一个染色体实例的图像。

    具体地,上述分割方式可采用分水岭算法或者阈值分割算法等其他几何连通性算法根据灰度图像的连通性对细胞分裂中期的显微镜图像进行第一次分割。例如,将给定的细胞分裂中期的显微镜图像j描述为ij,使用φ表示几何连通性分割算法,使用表示经过几何连通性分割后,细胞分裂中期的显微镜图像ij被分成的k个图像切片的集合。其中,任意的图像切片仅包含一个单独的染色体实例或者包含一个染色体簇、染色体细胞分裂中期的显微镜图像的连通性分割可表示为如公式1所示:

    s13、对所述若干张子图像进行识别,得到第一染色体实例集合和染色体簇集合;在本步骤中,主要是从若干张子图像中识别出染色体簇图像,则剩余的子图像为染色体实例图像,将本步骤获取的染色体实例图像保存到指定集合中,得到第一染色体实例集合。

    在一些实施例中,所述对所述若干张子图像进行识别,得到染色体簇集合,其具体可通过以下方式实现:

    通过机器学习分类算法和分类权重对所述干张子图像进行识别划分,得到第一染色体实例集合和染色体簇集合。

    具体地,机器学习分类算法为预先进行训练的算法,分类权重则为机器学习分类算法在预先训练过程中得到在权重;其中,机器学习分类算法的训练步骤可以包括以下步骤:

    获取预先完成标签的染色体图像作为第一训练集,该标签与染色体类别对应;

    通过第一训练集对机器学习分类算法进行训练,得到训练权重。

    在本实施例中,由于步骤s12中,获取到了一个细胞分裂中期的显微镜图像ij的所有染色体切片图像集合然而,在图像集合中,既包含了单个染色体实例的切片,也包含了多个染色体形成的簇的切片。对于单个染色体实例的切片,则不需要在进行额外的处理,而对于多个染色体形成的簇的切片,则还需要进一步执行步骤s14进行分割。其中,染色体簇识别的步骤是从图像集合中识别出染色体实例和染色体簇两种不同的图像。使用f表示染色体簇识别算法,wf表示f的权重,使用表示中的所有非簇染色体的实例集合,使用表示中的所有染色体簇集合。则染色体簇识别可表示为公式2所示,中的所有非簇染色体的实例集合可表示为如公式3所示:

    具体地,由于使用几何特征结合机器学习分类算法实现染色体簇的识别,因此,其具体过程可描述如下:

    第一步、提取染色体图像中d维度的几何特征,使用fd={f1,f2,…,fd},其中,fk(1≤k≤d)表示染色体的第d维特征。fd中的几何特征可以包括但不限于图像中的染色体区域面积、凸包面积、边界框面积和周长等。

    第二步、对染色体图像的类别(非簇或者簇)打标签y,形成n个特征与标签对<ftd,yt>作为第一训练集使用f表示机器学习分类算法,f是逻辑回归、svm、决策树等机器学习中的分类算法的其中的一种。

    第三步、使用tn对f进行训练,获取f的分类权重

    第四步、使用训练后的f及其训练好的权重wf对图像集合进行分类。

    本实施例通过训练后的算法和对应的训练权重来对图像进行识别分类,以提高识别分类结果的准确性。

    s14、对染色体簇集合内的染色体簇进行第二次分割,得到第二染色体实例集合;

    在一些实施例中,步骤s14,其具体可通过以下方式实现:

    对染色体簇集合内的染色体簇进行无效像素边界最小化,得到每个染色体簇的边框大小;

    获取边框大小中高度和宽度均最大的边框大小作为标准值;

    对剩余边框大小对应的染色体簇的四周进行像素填充,得到与标准值相同的染色体簇;

    采用深度学习实例分割模型和训练权重预测像素填充后的染色体簇的掩码;

    根据掩码从染色体簇集合内的染色体簇中获取染色体实例作为第二染色体实例集合。

    在一些实施例中,上述深度学习实例分割模型在进行预测之前先进模型训练,以提高预测准确度。且上述训练权重为深度学习实例分割模型在完成本次训练后得到的训练权重,而深度学习实例分割模型的训练步骤包括:

    将像素填充后的若干个的染色体簇进行像素标注;

    根据像素标注后的染色体簇创建第二训练集;

    将第二训练集划分为实训集、测试集和验证集;

    通过实训集、测试集和验证集分别对深度学习实例分割模型进行训练、测试和验证。

    具体地,上述分割和训练的过程,通过以下具体实例进行阐述:

    第一步、对所有染色体簇图片进行无效像素最小化,最小化后的边界图像为每一个图像的边框bbox,因此,每个图像的边框的大小都会不一致。取所有图像边框中的最大的高度h和最大的宽度w,进行取最大值作为统一的像素尺寸size。size=max(w,h)。所有最小化无效像素后的染色体簇最后都从四周开始进行像素填充到(size,size)尺寸。在本步骤中,无效像素最小化以得到边界图像为每一个图像边框bbox的目的是得到所有真正的染色体像素的图像大小尺寸。取最大值作为统一的像素尺寸size的目的是将所有染色体填充到统一的尺寸。由于目标尺寸的图像是正方形的图像,因此,高度和宽度需要相同。而为了能够把所有图像都能扩充到统一的尺寸,自然就需要获得一个最小的图像尺寸size,这个size就是在所有图像中的最大的宽度或者最大的高度中选最大的值。

    第二步、人工对m个染色体簇进行逐个像素标注,创建包含m个训练样本的实例分割训练数据集对训练数据集按照p1:p2:p3的比例划分成训练集、验证集和测试集,分别使用表示。

    第三步、使用ψ表示基于深度学习实例分割模型,使用表示使用数据集训练的ψ的权重。其中,ψ模型可以是任何一种基于深度学习的实例分割模型,例如maskr-cnn、yolact、d2det等。

    第四步、依次使用训练好的实例分割模型ψ及其权重预测一个染色体簇的染色体实例的掩码,再根据掩码从染色体实例中获取染色体实例。其具体过程可用公式4表示:

    其中,公式4表示通过实例分割模型获得图像切片的染色体实例掩码集合其中,表示为公式5所示;代表在中的第一个染色体实例,τ表示模型ψ从中检测并识别出来的染色体实例的条数。

    通过掩码进行逐像素提取即可从染色体簇中提取出对应的染色体实例,使用表示从中获取的染色体实例的集合。其中,可用公式6表示:

    对于中每个染色体簇,重复第四步的过程,即可获取所有簇的染色体实例,使用s'ij表示中所有的染色体簇中分割处理的所有实例集合,其具体如公式7所示:

    s15、将第一染色体实例集合和第二染色体实例集合合并,得到染色体实例总集合。具体地,是将非簇染色体实例与通过染色体实例分割模型从染色体簇中分割处理的实例进行合并,最终得到所有染色体实例,其具体如公式8所示:

    综上所述,上述方法实施例采用几何特征结合深度学习模型,通过利用连通性的几何特征,快速将细胞分裂中期的显微镜图像分割成多个子图像再进行分割,使其相比完全利用几何图像特征进行分割,可以获得更高的、更准确的重叠染色体分割、接触染色体簇分割的准确率;而相比端到端直接使用深度学习分割模型的技术,可以获得更高的分割精确度,因为直接使用深度学习模型对整个图像进行分割时,染色体的有效像素相对图像的整体尺寸而言,显得太小,因此难以获得精确的边界;同时,直接使用深度学习模型,需要一个细胞分裂中期的显微镜图像是一个训练样本,因此标注数据的难度更大。因为,标注一个图像簇远远要比标注一整个细胞分裂中期的显微镜图像要容易的多;此外,相比现有的只能处理某种类型的染色体簇,本发明实施例能够端到端处理整个细胞图象的分割,而不是其中的某个类型的簇。

    本发明实施例提供了一种与图1方法相对应的染色体实例分割系统,包括:

    获取模块,用于获取细胞分裂中期的显微镜图像;

    第一分割模块,用于对所述细胞分裂中期的显微镜图像进行第一次分割,得到若干张子图像;

    识别模块,用于对所述若干张子图像进行识别,得到第一染色体实例集合和染色体簇集合;

    第二分割模块,用于对所述染色体簇集合内的染色体簇进行第二次分割,得到第二染色体实例集合;

    合并模块,用于将所述第一染色体实例集合和第二染色体实例集合合并,得到染色体实例总集合。

    本发明方法实施例的内容均适用于本系统实施例,本系统实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法达到的有益效果也相同。

    本发明实施例提供了一种染色体实例分割系统,包括:

    至少一个存储器,用于存储程序;

    至少一个处理器,用于加载所述程序以执行所述的染色体实例分割方法。

    本发明方法实施例的内容均适用于本系统实施例,本系统实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法达到的有益效果也相同。

    本发明实施例还提供了一种存储介质,其中存储有处理器可执行的指令,所述处理器可执行的指令在由处理器执行时用于实现所述的染色体实例分割方法。

    本申请实施例还公开了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存介质中。计算机设备的处理器可以从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行图1所示的方法。

    以上是对本发明的较佳实施进行了具体说明,但本发明并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。


    技术特征:

    1.一种染色体实例分割方法,其特征在于,包括以下步骤:

    获取细胞分裂中期的显微镜图像;

    对所述细胞分裂中期的显微镜图像进行第一次分割,得到若干张子图像;

    对所述若干张子图像进行识别,得到第一染色体实例集合和染色体簇集合;

    对所述染色体簇集合内的染色体簇进行第二次分割,得到第二染色体实例集合;

    将所述第一染色体实例集合和第二染色体实例集合合并,得到染色体实例总集合。

    2.根据权利要求1所述的一种染色体实例分割方法,其特征在于,所述细胞分裂中期的显微镜图像为灰度图像,所述对所述细胞分裂中期的显微镜图像进行第一次分割,其具体为:

    根据所述灰度图像的几何连通性对所述细胞分裂中期的显微镜图像进行第一次分割。

    3.根据权利要求2所述的一种染色体实例分割方法,其特征在于,所述根据所述灰度图像的几何连通性对所述细胞分裂中期的显微镜图像进行第一次分割,其具体为:

    采用分水岭算法或者阈值分割算法根据所述灰度图像的几何连通性对所述细胞分裂中期的显微镜图像进行第一次分割。

    4.根据权利要求1所述的一种染色体实例分割方法,其特征在于,所述对所述若干张子图像进行识别,得到第一染色体实例集合和染色体簇集合,其具体为:

    通过机器学习分类算法和分类权重对所述干张子图像进行识别划分,得到第一染色体实例集合和染色体簇集合。

    5.根据权利要求4所述的一种染色体实例分割方法,其特征在于,所述机器学习分类算法为预先进行训练的算法,所述分类权重为所述机器学习分类算法在预先训练过程中得到在权重;所述机器学习分类算法的训练步骤包括:

    获取预先完成标签的染色体图像作为第一训练集,所述标签与所述染色体类别对应;

    通过所述第一训练集对所述机器学习分类算法进行训练,得到训练权重。

    6.根据权利要求1所述的一种染色体实例分割方法,其特征在于,所述对所述染色体簇集合内的染色体簇进行第二次分割,得到第二染色体实例集合,包括:

    对所述染色体簇集合内的染色体簇进行无效像素边界最小化,得到每个染色体簇的边框大小;

    获取所述边框大小中高度和宽度均最大的边框大小作为标准值;

    对剩余边框大小对应的染色体簇的四周进行像素填充,得到与所述标准值相同的染色体簇;

    采用深度学习实例分割模型和训练权重预测像素填充后的染色体簇的掩码;

    根据所述掩码从所述染色体簇集合内的染色体簇中获取染色体实例作为第二染色体实例集合。

    7.根据权利要求6所述的的一种染色体实例分割方法,其特征在于,所述深度学习实例分割模型为预先进行训练的模型,所述训练权重为所述深度学习实例分割模型在完成训练后得到的训练权重,所述深度学习实例分割模型的训练步骤包括:

    将像素填充后的若干个的染色体簇进行像素标注;

    根据像素标注后的染色体簇创建第二训练集;

    将所述第二训练集划分为实训集、测试集和验证集;

    通过所述实训集、测试集和验证集分别对所述深度学习实例分割模型进行训练、测试和验证。

    8.一种染色体实例分割系统,其特征在于,包括:

    获取模块,用于获取细胞分裂中期的显微镜图像;

    第一分割模块,用于对所述细胞分裂中期的显微镜图像进行第一次分割,得到若干张子图像;

    识别模块,用于对所述若干张子图像进行识别,得到第一染色体实例集合和染色体簇集合;

    第二分割模块,用于对所述染色体簇集合内的染色体簇进行第二次分割,得到第二染色体实例集合;

    合并模块,用于将所述第一染色体实例集合和第二染色体实例集合合并,得到染色体实例总集合。

    9.一种染色体实例分割系统,其特征在于,包括:

    至少一个存储器,用于存储程序;

    至少一个处理器,用于加载所述程序以执行如权利要求1-7任一项所述的染色体实例分割方法。

    10.一种存储介质,其中存储有处理器可执行的指令,其特征在于,所述处理器可执行的指令在由处理器执行时用于实现如权利要求1-7任一项所述的染色体实例分割方法。

    技术总结
    本发明公开了一种染色体实例分割方法、系统和存储介质,方法包括以下步骤:获取细胞分裂中期的显微镜图像;对显微镜图像进行第一次分割,得到若干张子图像;对若干张子图像进行识别,得到第一染色体实例集合和染色体簇集合;对染色体簇集合内的染色体簇进行第二次分割,得到第二染色体实例集合;将第一染色体实例集合和第二染色体实例集合合并,得到染色体实例总集合。本发明通过对分割得到的若干张子图像进行识别后,对识别得到的染色体簇集合内的染色体簇进行第二次分割,接着将两次分割得到的染色体实例集合合并,得到染色体实例总集合,以降低因染色体的非刚性特性导致染色体实例分割的难度。本发明可广泛应用于图像处理技术领域。

    技术研发人员:赵淦森;林成创;黄润桦;彭璟;吴清蓝;李壮伟;李双印;樊小毛;唐华;张奇之;杨晋吉;罗浩宇;易序晟;陈少洁
    受保护的技术使用者:华南师范大学
    技术研发日:2020.11.26
    技术公布日:2021.03.12

    转载请注明原文地址:https://wp.8miu.com/read-19694.html

    最新回复(0)