本发明涉及跨站点医学图像分割的,尤其是指一种基于域特定性正则化的跨站点医学图像增量分割系统。
背景技术:
1、医学图像分割是一种将医学图像中感兴趣的结构或区域从背景中准确地分割出来的技术,它在医学领域中具有广泛的应用。然而,基于卷积神经网络的医学图像分割任务需要大量的带标注的图像,训练图像需要从多个站点收集,但是在医疗领域,隐私限制会禁止临床数据的共享,很难在同一时间获取到多个站点的训练数据。
2、增量学习是一种机器学习方法,其目标是在已经训练好的模型上继续学习新的数据,而无需获取先前的训练数据。增量学习方法可以有效地利用新样本的信息,将其纳入到已有的模型中,从而使得模型能够适应新数据并不遗忘来自旧数据的知识。跨站点医学图像增量分割是一种基于增量学习的医学图像分割任务,它能够克服医学图像数据的隐私限制,其目标是在不牺牲先前站点分割准确率的情况下,有效利用新站点的数据更新在旧站点训练的模型,使模型在新站点和旧站点都具有高的分割准确率。
3、跨站点医学图像增量分割的任务设定如下:来自多站点的医学图像数据将按顺序到来并用于训练分割模型,在每一个训练的步骤中,只能获取到当前站点的医学图像和分割掩码,而无法获取先前站点的医学图像和分割掩码,最终增量训练得到的分割模型应当在所有站点的医学图像都有准确的分割性能。其难点在于,由于每一个训练的步骤中只能获得一个站点的数据,一方面,分割模型很容易过拟合于该站点的域特定特征,例如医学图像的亮度、对比度、饱和度和图像噪声;另一方面,分割模型难以从一个站点的数据中学习到多个站点间共有的跨域不变的知识,容易降低模型的泛化性,从而导致分割模型在先前站点的灾难性遗忘。
4、为了减轻灾难性遗忘,先前的增量学习方法主要分为三种流派:1)基于数据回放的方法:需要在新站点的增量学习中回放来自旧站点的数据,这会违背医学图像数据的隐私限制,因此不适用于跨站点医学图像增量分割任务;2)基于参数隔离的方法:此类方法明确地为每个站点分配不同的模型参数,但其有效性受到模型容量的限制,因此实用性不高;3)基于正则化的方法又可以进一步分为两种类型:基于数据的方法通过蒸馏学习的方法从先前的网络模型中提取知识,以蒸馏损失作为正则化项来引导网络模型学习,防止网络模型遗忘旧站点的知识;而基于先验的方法通过为模型的参数分配重要性权重,并在网络模型更新的过程中引入替代损失作为正则化项来惩罚相应参数的偏移。
5、尽管现有的方法可以在一定程度上缓解遗忘,但它们忽略了跨站点医学图像增量分割任务中固有的获取偏差问题,没有在增量学习的过程中进行域特定知识和跨域不变知识的解耦,难以在不同站点之间精确提取跨站点不变的知识,因此在跨站点医学图像增量分割过程的任务中产生较差的分割性能。
技术实现思路
1、本发明的目的在于克服现有技术的缺点与不足,提出了一种基于域特定性正则化的跨站点医学图像增量分割系统,该系统通过模拟来自不同站点医学图像的亮度、对比度、饱和度和图像噪声的变化,来分析医学图像分割模型参数的域特定性,并在分割模型增量训练阶段通过引入正则化项的方式限制具有高域特定性的网络参数更新,防止分割模型过度拟合于域特定特征,从而解决跨站点医学图像增量分割任务中的灾难性遗忘问题。
2、为实现上述目的,本发明所提供的技术方案为:基于域特定性正则化的跨站点医学图像增量分割系统,包括:
3、初始站点数据导入模块,用于获取来自首个站点的数据,包含医学图像和分割掩码,并对该数据进行预处理得到统一大小的图像和分割掩码;
4、分割模型初始化训练模块,用于构建u-net分割模型,并使用预处理后的首个站点的医学图像和分割掩码来初始化训练分割模型,得到初始化训练的u-net分割模型;
5、分割模型网络参数分析模块,用于分析训练完成的u-net分割模型的参数域特定性,对训练u-net分割模型使用的医学图像进行亮度、对比度和饱和度的增强,将增强前、后的医学图像分别送入u-net分割模型进行预测得到两次输出,计算u-net分割模型的两次输出差异,对该差异进行一次反向传播,得到分割模型梯度,即为u-net分割模型的参数域特定性;
6、新站点数据导入模块,用于导入先前站点训练的u-net分割模型和每个u-net分割模型的参数域特定性,并导入来自新站点的医学图像和分割掩码,进行预处理后得到统一大小的图像和分割掩码,即为预处理后的新站点的医学图像和分割掩码;
7、分割模型增量训练模块,根据得到的预处理后的新站点的医学图像和分割掩码,用上一个站点训练的u-net分割模型作为预训练模型进行增量训练,在增量训练的过程中,根据分割模型参数的域特定性来定义正则化项,通过域特定性正则化项损失来约束具有高域特定性的模型参数的更新,得到增量训练的u-net分割模型;
8、分割模型预测模块,将增量训练的u-net分割模型用于医学图像分割的精准预测。
9、进一步,所述初始站点数据导入模块具体执行以下操作:
10、对来自首个站点的医学图像和对应的分割掩码进行调整图像大小操作,对图像和分割掩码整体成比例调整图像大小,使得图像和分割掩码的长边为384,如果长边和短边的长度相同,则所有图像和分割掩码的大小为384×384,如果短边的长度不为384,则对图像的短边和对应的分割掩码部分进行零填充,使得所有的输入图像和分割掩码的大小都为固定尺寸384×384,得到预处理后的首个站点的医学图像x和分割掩码y,其中(x,y)∈d1,d1表示来自首个站点的预处理数据。
11、进一步,所述分割模型初始化训练模块包括分割模型构建模块和分割模型训练模块,其中:
12、所述分割模型构建模块构建用于语义分割的u-net分割模型,该模型由一个u型的编码器和解码器组成,两者通过跳跃连接相连,编码器负责提取图像特征并降低维度,而解码器则将低维特征重新上采样至原始尺寸并生成分割结果;
13、所述分割模型训练模块使用预处理后的首个站点的医学图像和分割掩码训练u-net分割模型,作为分割损失的训练损失函数lseg定义如下:
14、
15、
16、式中,(x,y)∈d1为首个站点的医学图像和分割掩码;f1(·)表示初始站点的u-net分割模型,为u-net分割模型的预测输出,即原始分割模型输出,mse(·,·)和dice(·,·)分别表示最小平方误差损失和骰子系数损失,其具体定义如下:
17、
18、
19、式中,n为和y的元素数量,n为元素序号,和yn分别为原始分割模型输出和分割掩码y的第n个元素,是和y的交集,和|y|分别表示和y元素的个数;
20、经过上述训练损失函数lseg的训练后,得到初始化训练的u-net分割模型f1(·)。
21、进一步,所述分割模型网络参数分析模块包括域差异模拟模块和域特定性分析模块,其中:
22、所述域差异模拟模块用于模拟来自不同站点的医学图像的差异,这种差异来源于不同站点使用的扫描仪器协议的区别,体现在扫描仪器获取的医学图像的亮度、对比度、饱和度和图像噪声上;所述域差异模拟模块对输入图像实施如下的数据增强方法:
23、a、亮度数据增强:调整输入图像的亮度,幅度为[0.5,1.5];
24、b、对比度数据增强:调整输入图像的对比度,幅度为[0.5,1.5];
25、c、饱和度数据增强:调整输入图像的饱和度,幅度为[0.5,1.5];
26、d、高斯噪声数据增强:给输入图像增加高斯噪声,方差为0.1;
27、所述域特定性分析模块用于引入上述域差异模拟模块的数据增强方法,观测数据增强前、后的u-net分割模型输出差异,进而计算u-net分割模型的网络参数的域定特性;在每个站点训练完成的u-net分割模型均需要计算参数域特定性,供后续站点的增量训练使用,所述域特定性分析模块的处理步骤如下:
28、1)将来自第t个站点的预处理数据(x,y)∈dt作为输入,送入在第t个站点训练的u-net分割模型ft(·),得到原始分割模型输出
29、
30、2)对于来自第t个站点的预处理数据(x,y)∈dt,执行以下过程:从域差异模拟模块的亮度数据增强、对比度数据增强、饱和度数据增强和高斯噪声数据增强这四种数据增强模式中随机选择一种,作用于来自第t个站点的医学图像x上,随后将数据增强后的图像送入在第t个站点训练的u-net分割模型ft(·);上述过程重复h次,得到h组域偏差输出:
31、
32、式中,ηh表示第h次数据增强的模式,表示第h次数据增强后输入得到的对应的域偏差输出,其中h={1,2,3,…,h};
33、3)基于步骤1)得到的不进行域差异模拟的原始分割模型输出和步骤2)得到的域偏差输出使用最小平方误差损失来衡量分割模型输出差异ldif,其定义如下:
34、
35、4)以步骤3)得到的分割模型输出差异ldif作为损失函数,将在第t个站点训练的u-net分割模型ft(·)进行一次反向传播,得到各个参数的反向传播梯度,作为分割模型参数的域特定性:
36、
37、式中,i代表在第t个站点训练的u-net分割模型ft(·)的参数的序号,t代表站点顺序,ωi,t代表在第t个站点训练的u-net分割模型ft(·)的网络参数θii,t的域特定性;网络参数θi,t域特定性越高,说明该参数对于输入图像的域偏差更敏感,即更容易拟合于域特定特征。
38、进一步,所述新站点数据导入模块具体执行以下操作:
39、1)导入在先前站点的u-net分割模型,即在站点1到站点t-1训练的u-net分割模型f1(·),f2(·),…,ft-1(·);
40、2)导入分割模型网络参数分析模块计算得到的先前站点的u-net分割模型f1(·),f2(·),…,ft-1(·)的参数域特定性{ωi,1}i,{ωi,2}i,…,{ωi,t}i…,{ωi,t-1}i,其中,i代表u-net分割模型的参数的序号,{ωi,t}i代表在第t个站点训练的u-net分割模型ft(·)的所有参数的域特定性集合;
41、3)对来自新站点t的医学图像和对应的分割掩码进行调整图像大小操作,对图像和分割掩码整体成比例调整图像大小,使得图像和分割掩码的长边为384,如果长边和短边的长度相同,则所有图像和分割掩码的大小为384×384,如果短边的长度不为384,则对图像的短边和对应的分割掩码部分进行零填充,使得所有的输入图像和分割掩码的大小都为固定尺寸384×384,得到预处理后的新站点t的医学图像x和分割掩码y,其中(x,y)∈dt,dt表示来自新站点t的预处理数据。
42、进一步,所述分割模型增量训练模块以在上一个站点t-1完成训练的u-net分割模型ft-1(·)作为预训练模型,以预处理后的新站点t的医学图像和分割掩码(x,y)∈dt作为训练数据,dt表示来自新站点t的预处理数据,增量训练u-net分割模型ft(·),包括如下步骤:
43、1)定义域特定性正则化项损失lreg,用于对域特定性高的网络参数的更新进行限制,防止u-net分割模型在增量训练过程中过度拟合于域特定特征,导致初始站点知识的灾难性遗忘:
44、
45、式中,ωi.t代表在站点t训练u-net分割模型ft(·)的网络参数θi,t的域特定性,θi代表在站点t增量训练中更新的u-net分割模型的网络参数;
46、2)定义增量训练损失函数ltotal如下:
47、
48、
49、ltotal=lseg+λlreg
50、式中,为新站点u-net分割模型的预测输出,λ代表域特定性正则化项损失lreg的权重;增量训练损失函数ltotal为分割损失lseg和加权后的域特定性正则化项损失lreg的总和;
51、3)以在上一个站点t-1完成训练的u-net分割模型ft-1(·)作为预训练模型,初始化u-net分割模型的网络参数权重,以增量训练损失函数ltotal作为损失函数,以预处理后的新站点的医学图像和分割掩码(x,y)∈dt作为训练数据,进行增量训练;
52、4)增量训练结束,得到在新站点t完成增量训练的u-net分割模型ft(·),该模型将用于分割模型预测模块,进行医学图像分割的精准预测。
53、本发明与现有技术相比,具有如下优点与有益效果:
54、1、本发明引入了域差异模拟模块,通过数据增强方法模拟在采集医学图像过程中可能的域偏差,以分析训练完成的医学图像分割模型参数的域特定性,从而在增量学习的过程中实现了域特定知识和跨域不变知识的解耦,从而解决跨站点医学图像增量分割任务中的灾难性遗忘问题。
55、2、本发明定义了网络模型的域特定性的计算方法,通过给医学图像分割模型的每个参数定义并计算域特定性,并在分割模型增量训练阶段通过引入正则化项的方式限制具有高域特定性的网络参数更新,防止分割模型过度拟合于域特定特征,因此提高了跨站点医学图像分割的平均性能,降低了增量学习过程中的知识遗忘程度。
56、3、本发明能够克服医学图像数据的隐私限制,在跨站点医学图像分割任务中无需访问先前站点的数据,对cpu、gpu等计算资源的需求低;本发明适用于包括u-net网络在内的医学图像分割模型,即插即用,具有高可用性。
1.基于域特定性正则化的跨站点医学图像增量分割系统,其特征在于,包括:
2.根据权利要求1所述的基于域特定性正则化的跨站点医学图像增量分割系统,其特征在于,所述初始站点数据导入模块具体执行以下操作:
3.根据权利要求1所述的基于域特定性正则化的跨站点医学图像增量分割系统,其特征在于,所述分割模型初始化训练模块包括分割模型构建模块和分割模型训练模块,其中:
4.根据权利要求1所述的基于域特定性正则化的跨站点医学图像增量分割系统,其特征在于:所述分割模型网络参数分析模块包括域差异模拟模块和域特定性分析模块,其中:
5.根据权利要求1所述的基于域特定性正则化的跨站点医学图像增量分割系统,其特征在于:所述新站点数据导入模块具体执行以下操作:
6.根据权利要求1所述的基于域特定性正则化的跨站点医学图像增量分割系统,其特征在于:所述分割模型增量训练模块以在上一个站点t-1完成训练的u-net分割模型ft-1(·)作为预训练模型,以预处理后的新站点t的医学图像和分割掩码(x,y)∈dt作为训练数据,dt表示来自新站点t的预处理数据,增量训练u-net分割模型ft(·),包括如下步骤: