表皮生长因子受体突变状态判断方法、介质及电子设备与流程

    专利2022-07-08  103


    本发明涉及ct影像处理技术领域,尤其是涉及一种表皮生长因子受体突变状态判断方法、介质及电子设备。



    背景技术:

    肺癌是全世界范围内最常见的恶性肿瘤及最主要的肿瘤致死性疾病,其中非小细胞肺癌约占肺癌总数的80%~85%,如何降低肺癌的死亡率是一个亟待解决的挑战性临床问题。肺癌预后是否有发生复发或转移的可能与多种基因有关,其中最重要的基因之一是表皮生长因子受体(epidermalgrowthfactorreceptor,egfr)。提高表皮生长因子受体突变判断的准确性有利用使早期肺癌得到及时有效的治疗。

    目前采用的egfr基因型鉴定方式需要活检和基因序列检测,有创且难以获取组织样本。此外,活检检测增加了癌症转移的潜在风险,相对高的成本限制了突变测序的适用性。随着影像组学概念的提出,为该问题提供了更加定量化的影像手段,让无创、可靠、便捷地判断egfr突变状态成为可能。但现有方法还无法完整获取肿瘤异质性、肿瘤转移和肿瘤代谢状态等信息,判断结果准确性还有待提高。



    技术实现要素:

    本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种判断结果准确性高的表皮生长因子受体突变状态判断方法、介质及电子设备。

    本发明的目的可以通过以下技术方案来实现:

    一种表皮生长因子受体突变状态判断方法,该方法包括以下步骤:

    获取pet图像和ct图像,并分别进行预处理,形成处理后图像;

    采用预训练的卷积神经网络提取所述处理后图像的深度学习特征;

    提取所述处理后图像的影像组学特征;

    融合所述深度学习特征、影像组学特征以及对应的临床特征,形成融合特征;

    采用预训练的判断模型基于所述融合特征获得表皮生长因子受体突变状态判断结果。

    进一步地,对所述pet图像的预处理具体为:

    对pet图像进行切片排序;

    基于对应的肿瘤区域分割金标准数据确定每张切片中心点;

    从所述中心点向四周均匀以0像素填充直至切片像素大小至设定值。

    进一步地,对所述ct图像的预处理具体为:

    对ct图像进行切片排序;

    基于对应的肿瘤区域分割金标准数据确定每张切片中心点;

    以所述中心点为中心向四周均匀分割出像素大小为设定值的切片。

    进一步地,所述影像组学特征包括ct图像的强度特征、形状特征、纹理特征、改进型lbp-3d特征、小波特征和傅里叶特征以及pet图像的强度特征、形状特征和纹理特征。

    进一步地,所述改进型lbp-3d特征的获取公式为:

    其中,c表示中心点,xc表示中心点像素值,xp表示中心点周围像素值,p表示像素值,r表示相邻像素到中心像素的距离,i表示过程中包含的相邻像素的数量,pi表示i个像素数量的像素值,pc表示中心点的像素值,函数

    进一步地,所述融合特征的形成过程具体为:

    分别计算深度学习特征、影像组学特征和临床特征的协方差矩阵、协方差矩阵的特征向量以及类间散射矩阵;

    基于所述类间散射矩阵获得集合间协方差矩阵及其对角化参数矩阵;

    基于所述类间散射矩阵、对角化参数矩阵获得融合特征。

    所述融合特征输入预训练的判断模型前,进行的处理包括均衡化处理、异常点检测、特征简化和特征选择。

    进一步地,采用5折交叉验证对所述判断模型进行模型验证。

    本发明还提供一种计算机可读存储介质,包括供电子设备的一个或多个处理器执行的一个或多个程序,所述一个或多个程序包括用于执行如上所述表皮生长因子受体突变状态判断方法的指令。

    本发明还提供一种电子设备,包括:

    一个或多个处理器;

    存储器;和

    被存储在存储器中的一个或多个程序,所述一个或多个程序包括用于执行如上所述表皮生长因子受体突变状态判断方法的指令。

    与现有技术相比,本发明具有以下有益效果:

    1、本发明同时利用pet图像的影像组学特征及pet/ct深度学习特征进行基于图像的受体突变状态判断,不仅能提供肿瘤区域信息,也能提供肿瘤周围区域信息,能完整获取肿瘤异质性,肿瘤转移和肿瘤代谢状态等信息,鲁棒性好。

    2、本发明判断模型的输入为深度学习特征、影像组学特征以及对应的临床特征的融合,能够获得更稳定、更准确的判断结果。

    3、本发明考虑的影像组学特征中包括ct图像的强度特征、形状特征、纹理特征、改进型lbp-3d特征等,以更能准确反映ct图像的特征集合作为基础,有效提高了判断准确性。

    4、本发明在不同医学中心的数据验证下,不同特征选择和预测算法的测试下,均能够得到稳定且较好的判断结果。

    附图说明

    图1为本发明的结构示意图。

    具体实施方式

    下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。

    实施例1

    如图1所示,本实施例提供一种表皮生长因子受体突变状态判断方法,该方法包括:

    步骤1,获取pet(positronemissioncomputedtomography,正电子发射型计算机断层显像)图像和ct图像。

    步骤2,分别对pet图像和ct图像进行预处理,形成处理后图像。

    对所述ct图像的预处理具体为:

    (21)读取ct原始dicom文件,将每副ct切片进行排序;

    (22)读取ct的肿瘤区域分割金标准并进行对应的切片排序;

    (23)确定ct肿瘤区域分割文件每张切片的中心点;

    (24)按照ct肿瘤区域分割文件每张切片的中心点确定ct原始图像文件的中心点;

    (25)以ct原始dicom文件的中心点为中心,向四周均匀分割出224×224像素的切片。

    对所述pet图像的预处理具体为:

    读取pet原始dicom文件,每副pet进行对应的切片排序;

    基于对应的肿瘤区域分割金标准数据确定每张切片中心点,以pet原始dicom切片为中心,向四周均匀以0像素填充直至切片像素大小为224×224。

    步骤3,采用预训练的卷积神经网络提取所述处理后图像的深度学习特征,具体为:

    (31)导入预训练的卷积神经网络,本实施例,该卷积神经网络基于imagenet数据训练获得;

    (32)导入ct图像预处理数据,计算最后一层全连接层输出的特征,导出ct图像的深度学习特征;

    (33)导入pet图像预处理数据,计算最后一层全连接层输出的特征,导出pet图像的深度学习特征;

    (34)将ct图像的深度学习特征和pet图像的深度学习特征融合为深度学习特征。

    步骤4,提取所述处理后图像的影像组学特征。

    (41)导入ct原始图像及其对应的肿瘤分割金标准图像,计算每个ct图像肿瘤区域的强度特征、形状特征、纹理特征、改进型localbinarypatternl-3dimension(lbp-3d)特征、小波特征、傅里叶特征,导出ct图像影像组学特征;

    (42)导入pet原始图像及其对应的肿瘤分割金标准图像,计算每个pet图像肿瘤的强度特征,形状特征,纹理特征,导出pet图像影像组学特征;

    (43)将ct图像影像组学特征与pet图像影像组学特征拼接融合为影像组学特征。

    其中,改进型lbp-3d特征的获取公式为:

    其中,c表示中心点,xc表示中心点像素值,xp表示中心点周围像素值,p表示像素值,r表示相邻像素到中心像素的距离,i表示过程中包含的相邻像素的数量,pi表示i个像素数量的像素值,pc表示中心点的像素值,函数

    步骤5,融合所述深度学习特征、影像组学特征以及对应的临床特征,形成融合特征。临床特征包括人口统计信息、吸烟史、糖尿病、病理分期、治疗史、治疗效果、复发以及生存状态、ct语义特征及血清肿瘤标志物信息等。

    融合特征获取的具体过程包括:

    分别计算深度学习特征、影像组学特征和临床特征的协方差矩阵、协方差矩阵的特征向量以及类间散射矩阵;

    基于所述类间散射矩阵获得集合间协方差矩阵及其对角化参数矩阵;

    基于所述类间散射矩阵、对角化参数矩阵获得融合特征。

    假设pet/ct图像深度学习特征矩阵记为x,影像组学特征矩阵记为y,临床特征矩阵记为z,xij∈x,yij∈y,zij∈z。

    (51)以深度学习特征x为例,计算协方差矩阵的公式为:

    其中,c表示特征的类别数量,n表示特征数量。

    (52)计算协方差矩阵的特征向量φbtφb,公式为:

    其中,p为正交特征向量的矩阵,为实特征值和非负特征值按递减顺序排列的对角矩阵。

    (53)计算类间散射矩阵i:

    假设q(c×r)为矩阵p的r阶最大非零特征:

    qt(φbxtφbx)q=λ(r×r),

    则r阶最显著特征向量sbx可从下式计算得出:

    (φbxq)tsbx(φbx)q=λ(r×r),

    最后,类间散射矩阵i可从下式得出:

    同理,计算出sby,iy,y′(r×n),sbz,iz,z′(r×n)。

    (54)对转换后的集合间协方差矩阵对角化。

    首先s′xy定义为:

    s′xy=x′y′t,

    s′xy=u∑vt

    那么主对角线元素为非零的对角矩阵∑为:

    uts′xyv=∑.

    (55)计算融合空间内特征。

    可得:

    融合空间内特征x′、y′、z′为:

    步骤6,采用预训练的判断模型基于所述融合特征获得表皮生长因子受体突变状态判断结果。

    所述融合特征输入预训练的判断模型前,进行的处理包括均衡化处理、异常点检测、特征简化和特征选择。具体地,本实施例中,利用合成少数类过采样技术(syntheticminorityoversamplingtechnique,smote)均衡化;通过计算中值绝对偏差进行异常点检测;利用皮尔逊相关系数进行特征简化,阈值取0.86;分别利用单因素方差分析、递推特征消除、relief等进行特征选择。

    判断模型可基于支持向量机(supportvectormachine,svm)、线性判别分析(lineardiscriminantanalysis,lda)、自动编码器(autoencoder,ae)、随机森林(randomforest,rf)、逻辑回归(logisticregression,lr)、结合lasso的逻辑回归算法(lr-lasso)、adaboost(ab)、决策树(decisiontree,dt)、高斯过程(gaussianprocess,gp)、朴素贝叶斯(naivebayes,nb)等建立。

    本实施例中,判断模型在构建及训练时,采用5折交叉验证对所述判断模型进行模型验证,以提高模型精度。

    所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

    本实施例通过以下测试实验验证上述方法的有效性。

    实验数据采用100例肺腺癌病人的完整临床资料及其18f-fdgpet/ct图像资料为判断模型的训练样本。样本基本信息如表1所示。

    表1样本基本信息

    表2列出了基于3种特征选择方法、十种机器学习法方法建立的30种模型的性能结果,以验证上述方法的鲁棒性。

    表230种模型性能结果

    通过以上结果可知:所有模型均能对egfr突变状态(突变或野生)进行二元预测。采用方差分析进行特征选择,采用lda进行预测的模型具有最高的性能(auc=0.8071)。其他分类器在特征空间降维后也显示出较好的预测能力(在独立试验队列中auc≥0.6000,acc≥0.6250)。综上所述,本发明对从pet/ct图像中提取的特征进行融合、并对融合特征进行处理后再进行状态判断,具有很高的精度,能够有效预测表皮生长因子受体突变状态,并且鲁棒性好,抗干扰能力强。

    实施例2

    本实施例提供一种电子设备,包括一个或多个处理器、存储器和被存储在存储器中的一个或多个程序,所述一个或多个程序包括用于执行如实施例1所述表皮生长因子受体突变状态判断方法的指令。

    以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。


    技术特征:

    1.一种表皮生长因子受体突变状态判断方法,其特征在于,该方法包括以下步骤:

    获取pet图像和ct图像,并分别进行预处理,形成处理后图像;

    采用预训练的卷积神经网络提取所述处理后图像的深度学习特征;

    提取所述处理后图像的影像组学特征;

    融合所述深度学习特征、影像组学特征以及对应的临床特征,形成融合特征;

    采用预训练的判断模型基于所述融合特征获得表皮生长因子受体突变状态判断结果。

    2.根据权利要求1所述的表皮生长因子受体突变状态判断方法,其特征在于,对所述pet图像的预处理具体为:

    对pet图像进行切片排序;

    基于对应的肿瘤区域分割金标准数据确定每张切片中心点;

    从所述中心点向四周均匀以0像素填充直至切片像素大小至设定值。

    3.根据权利要求1所述的表皮生长因子受体突变状态判断方法,其特征在于,对所述ct图像的预处理具体为:

    对ct图像进行切片排序;

    基于对应的肿瘤区域分割金标准数据确定每张切片中心点;

    以所述中心点为中心向四周均匀分割出像素大小为设定值的切片。

    4.根据权利要求1所述的表皮生长因子受体突变状态判断方法,其特征在于,所述影像组学特征包括ct图像的强度特征、形状特征、纹理特征、改进型lbp-3d特征、小波特征和傅里叶特征以及pet图像的强度特征、形状特征和纹理特征。

    5.根据权利要求4所述的表皮生长因子受体突变状态判断方法,其特征在于,所述改进型lbp-3d特征的获取公式为:

    其中,c表示中心点,xc表示中心点像素值,xp表示中心点周围像素值,p表示像素值,r表示相邻像素到中心像素的距离,i表示过程中包含的相邻像素的数量,pi表示i个像素数量的像素值,pc表示中心点的像素值,函数

    6.根据权利要求1所述的表皮生长因子受体突变状态判断方法,其特征在于,所述融合特征的形成过程具体为:

    分别计算深度学习特征、影像组学特征和临床特征的协方差矩阵、协方差矩阵的特征向量以及类间散射矩阵;

    基于所述类间散射矩阵获得集合间协方差矩阵及其对角化参数矩阵;

    基于所述类间散射矩阵、对角化参数矩阵获得融合特征。

    7.根据权利要求1所述的表皮生长因子受体突变状态判断方法,其特征在于,所述融合特征输入预训练的判断模型前,进行的处理包括均衡化处理、异常点检测、特征简化和特征选择。

    8.根据权利要求1所述的表皮生长因子受体突变状态判断方法,其特征在于,采用5折交叉验证对所述判断模型进行模型验证。

    9.一种计算机可读存储介质,其特征在于,包括供电子设备的一个或多个处理器执行的一个或多个程序,所述一个或多个程序包括用于执行如权利要求1-8任一所述表皮生长因子受体突变状态判断方法的指令。

    10.一种电子设备,其特征在于,包括:

    一个或多个处理器;

    存储器;和

    被存储在存储器中的一个或多个程序,所述一个或多个程序包括用于执行如权利要求1-8任一所述表皮生长因子受体突变状态判断方法的指令。

    技术总结
    本发明涉及一种表皮生长因子受体突变状态判断方法、介质及电子设备,该方法包括以下步骤:获取PET图像和CT图像,并分别进行预处理,形成处理后图像;采用预训练的卷积神经网络提取所述处理后图像的深度学习特征;提取所述处理后图像的影像组学特征;融合所述深度学习特征、影像组学特征以及对应的临床特征,形成融合特征;采用预训练的判断模型基于所述融合特征获得表皮生长因子受体突变状态判断结果。与现有技术相比,本发明具有判断结果准确性高等优点。

    技术研发人员:黄钢;左艳;聂生东
    受保护的技术使用者:上海健康医学院;上海理工大学
    技术研发日:2020.11.13
    技术公布日:2021.03.12

    转载请注明原文地址:https://wp.8miu.com/read-16565.html

    最新回复(0)