基于图像増广的模型训练方法、系统和存储介质与流程

    专利2022-07-08  107


    本发明涉及模型训练技术领域,尤其是一种基于图像増广的模型训练方法、系统和存储介质。



    背景技术:

    深度学习:深度学习是指使用多层神经网络架构技术的模型,其可以应用于图像分类、图像分割和目标检测等方面。

    泛化能力:泛化能力是在训练好的模型在测试数据集的上表现能力。

    基于深度学习的机器视觉应用是一种端到端的技术的应用。以图像分类为例,即准备好训练图像及其对应的标注信息作为训练数据集,在设计好模型后,直接通过不断的学习模型即可完成分类的操作,而无需技术人员设计具体分类的逻辑。这种最大的最大好处是无需关注具体分分类逻辑,表达能力强,应用适用性强。但是,其需要数以万计的海量标注图像作为训练数据集。而在某些应用场景中,例如医疗图像应用场景,收集和标注图像是一项极其费时、费力、费钱的过程。因此,可采用图像増广技术以有效扩大训练数据集,提高模型泛化能力。然而,不同的图像増广方法对模型的提升效果有很大的区别,然而,目前通常是使用固定的图像増广方式对图像数据进行増广,从而可能导致増广后的图像数据无法有效训练模型。



    技术实现要素:

    为解决上述技术问题,本发明的目的在于:提供一种基于图像増广的模型训练方法、系统和存储介质,其能有效提高图像増广后的图像数据对模型的训练效果。

    第一方面,本发明实施例提供了:

    一种基于图像増广的模型训练方法,包括以下步骤:

    采用预先获取的第一训练数据对第一模型进行第一训练,得到第二模型;

    采用预设的若干种图像増广方式对所述第一训练数据进行图像増广,得到第二训练数据;

    采用所述第二模型对所述第二训练数据进行预测;

    根据预测结果从所述若干种图像増广方式中确定目标増广方式;

    将通过所述目标増广方式对所述第一训练数据进行图像増广后的数据和所述第一训练数据作为第三训练数据;

    通过所述第三训练数据对所述第一模型进行第二训练,得到目标模型。

    进一步地,所述采用预先获取的第一训练数据对第一模型进行第一训练,得到第二模型,包括:

    获取第一训练数据;

    采用所述第一训练数据对第一模型进行第一训练;

    当所述第一模型在所述第一训练中的损失函数的若干个迭代次数满足预设要求后,得到第二模型。

    进一步地,所述采用预设的若干种图像増广方式对所述第一训练数据进行图像増广,得到第二训练数据,其具体为:

    从所述若干种图像増广方式中依次采用其中一种图像増广方式对所述第一训练数据进行图像増广,得到与所述其中一种图像増广方式对应的第二训练数据。

    进一步地,所述根据预测结果从所述若干种图像増广方式中确定目标増广方式,包括:

    依次计算与所述第二训练数据对应的预测损失值;

    将与最大的预测损失值对应的图像増广方式作为目标増广方式。

    进一步地,所述通过所述第三训练数据对所述第一模型进行第二训练,得到目标模型,包括:

    采用所述第三训练数据对第一模型进行第二训练;

    当所述第一模型在所述第二训练中的损失函数的若干个迭代次数满足预设要求后,得到目标模型。

    进一步地,所述若干个迭代次数为连续的迭代次数。

    进一步地,所述若干种图像増广方式包括随机旋转、随机剪裁、随机粘贴和光学图像増广;每一种图像増广方式包含不同的参数。

    第二方面,本发明实施例提供了:

    一种基于图像増广的模型训练系统,包括:

    第一训练模块,用于采用预先获取的第一训练数据对第一模型进行第一训练,得到第二模型;

    图像増广模块,用于采用预设的若干种图像増广方式对所述第一训练数据进行图像増广,得到第二训练数据;

    预测模块,用于采用所述第二模型对所述第二训练数据进行预测;

    确定模块,用于根据预测结果从所述若干种图像増广方式中确定目标増广方式;

    保存模块,用于将通过所述目标増广方式对所述第一训练数据进行图像増广后的数据和所述第一训练数据作为第三训练数据;

    第二训练模块,用于通过所述第三训练数据对所述第一模型进行第二训练,得到目标模型。

    第三方面,本发明实施例提供了:

    一种基于图像増广的模型训练系统,包括:

    至少一个存储器,用于存储程序;

    至少一个处理器,用于加载所述程序以执行所述的基于图像増广的模型训练方法。

    第四方面,本发明实施例提供了:

    一种存储介质,其中存储有处理器可执行的指令,所述处理器可执行的指令在由处理器执行时用于实现所述的基于图像増广的模型训练方法。

    本发明实施例的有益效果是:本发明实施例通过预先获取的第一训练数据对第一模型进行第一训练,得到第二模型,接着采用预设的若干种图像増广方式对第一训练数据进行图像増广,得到第二训练数据,并采用第二模型对第二训练数据进行预测,然后根据预测结果从若干种图像増广方式中确定目标増广方式,并将通过目标増广方式对第一训练数据进行图像増广后的数据和第一训练数据作为第三训练数据,最后第三训练数据对第一模型进行第二训练,得到目标模型,从而避免发生因固定的图像増广方式对图像数据进行増广后导致无法有效训练模型的情况,以有效提高图像増广后的图像数据对模型的训练效果。

    附图说明

    图1为本发明一种具体实施例的基于图像増广的模型训练方法的流程图。

    具体实施方式

    下面结合附图和具体实施例对本发明做进一步的详细说明。对于以下实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。

    在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。此外,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。

    除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。

    参照图1,本发明实施例提供了一种基于图像増广的模型训练方法,本实施例可应用于服务端或者各个处理终端。本实施例包括以下步骤:

    s1、采用预先获取的第一训练数据对第一模型进行第一训练,得到第二模型;本步骤中的第一训练数据是未经过任何图像增强方式处理的数据,其为原始图像数据。第一模型可以为图像分类模型、图像分割模型或者目标检测模型等。第二模型为第一模型进行第一训练后的模型。

    在一些实施例中,步骤s1可通过以下方式实现:

    首先获取第一训练数据;接着采用第一训练数据对第一模型进行第一训练;当第一模型在第一训练中的损失函数的若干个迭代次数满足预设要求后,得到第二模型。其中,若干个迭代次数为损失函数中连续的若干个迭代次数。预设要求是指连续的若干个迭代次数不再下降。本实施例中,当续的若干个迭代次数不再下降时,则认为模型达到收敛,将达到收敛的模型作为第二模型。

    s2、采用预设的若干种图像増广方式对第一训练数据进行图像増广,得到第二训练数据;具体地,本步骤是从若干种图像増广方式中依次采用其中一种图像増广方式对第一训练数据进行图像増广,得到与当前的图像増广方式对应的第二训练数据。例如,若干种图像増广方式包括a、b、c、d和e五种图像増广方式,则先采用a图像増广方式对第一训练数据进行图像増广,得到与a图像増广方式对应的第二训练数据;接着采用b图像増广方式对第一训练数据进行图像増广,得到与b图像増广方式对应的第二训练数据,依次类推,直到采用e图像増广方式对第一训练数据进行图像増广,得到与e图像増广方式对应的第二训练数据为止,则本次图像増广操作完成。在本实施例中,若干种图像増广方式包括随机旋转、随机剪裁、随机粘贴和光学图像増广,其中,每一种图像増广方式包含不同的参数,不同的参数对应不同的图像増广方式。

    s3、采用第二模型对第二训练数据进行预测;本步骤是采用第二模型依次对各种图像増广方式获得的第二训练数据进行预测。

    s4、根据预测结果从若干种图像増广方式中确定目标増广方式;本步骤中的预测结果为步骤s3中的预测结果。

    在一些实施例中,步骤s4可通过以下方式实现:

    依次计算与第二训练数据对应的预测损失值;其计算过程是通过损失函数进行计算,其中,计算方式包括多种,例如交叉熵损失计算、均方差损失计算、平滑损失计算等。然后将与最大的预测损失值对应的图像増广方式作为目标増广方式。

    在本实施例中,预测损失值越大,则说明当前已经训练好的第一模型,对于使用该增广策略在原始图象上进行操作获得增广后的图象的识别能力越差。表明该种增广策略在保证图像标签不变的情况下,能够带来最大的差异信息。因此,使用该策略作为最终的增广策略,能够使得模型学习到图象最具有区分性的特征。

    s5、将通过目标増广方式对第一训练数据进行图像増广后的数据和第一训练数据作为第三训练数据;并通过第三训练数据对所述第一模型进行第二训练,得到目标模型。

    在一些实施例中,通过第三训练数据对第一模型进行第二训练,得到目标模型,其可通过以下方式实现:

    采用第三训练数据对第一模型进行第二训练;

    当第一模型在第二训练中的损失函数的若干个迭代次数满足预设要求后,得到目标模型。

    在本实施例中,若干个迭代次数为损失函数中连续的若干个迭代次数。预设要求是指连续的若干个迭代次数不再下降。本实施例中,当续的若干个迭代次数不再下降时,则认为模型达到收敛,将达到收敛的模型作为目标模型,以提高目标模型在应用过程的预测准确性。

    综上可知,上述方法实施例仅需要一次额外的训练代价,即可快速确定最佳的增强策略,从而只要给定图像训练集以及设计好模型、配置好图像増广方式即可,上述方法实施例即能自动搜索出最强的图像増广方式,从而提高模型训练效果,以提高目标模型在应用过程的预测准确性。

    本发明实施例提供了一种与图1相对应的基于图像増广的模型训练系统,包括:

    第一训练模块,用于采用预先获取的第一训练数据对第一模型进行第一训练,得到第二模型;

    图像増广模块,用于采用预设的若干种图像増广方式对所述第一训练数据进行图像増广,得到第二训练数据;

    预测模块,用于采用所述第二模型对所述第二训练数据进行预测;

    确定模块,用于根据预测结果从所述若干种图像増广方式中确定目标増广方式;

    保存模块,用于将通过所述目标増广方式对所述第一训练数据进行图像増广后的数据和所述第一训练数据作为第三训练数据;

    第二训练模块,用于通过所述第三训练数据对所述第一模型进行第二训练,得到目标模型。

    本发明方法实施例的内容均适用于本系统实施例,本系统实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法达到的有益效果也相同。

    本发明实施例提供了一种基于图像増广的模型训练系统,包括:

    至少一个存储器,用于存储程序;

    至少一个处理器,用于加载所述程序以执行图1所示方法。

    本发明方法实施例的内容均适用于本系统实施例,本系统实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法达到的有益效果也相同。

    本发明实施例提供了一种存储介质,其中存储有处理器可执行的指令,所述处理器可执行的指令在由处理器执行时用于实现图1所示方法。

    本发明实施例还公开了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存介质中。计算机设备的处理器可以从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行图1所示的方法。

    以上是对本发明的较佳实施进行了具体说明,但本发明并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。


    技术特征:

    1.一种基于图像増广的模型训练方法,其特征在于,包括以下步骤:

    采用预先获取的第一训练数据对第一模型进行第一训练,得到第二模型;

    采用预设的若干种图像増广方式对所述第一训练数据进行图像増广,得到第二训练数据;

    采用所述第二模型对所述第二训练数据进行预测;

    根据预测结果从所述若干种图像増广方式中确定目标増广方式;

    将通过所述目标増广方式对所述第一训练数据进行图像増广后的数据和所述第一训练数据作为第三训练数据;

    通过所述第三训练数据对所述第一模型进行第二训练,得到目标模型。

    2.根据权利要求1所述的一种基于图像増广的模型训练方法,其特征在于,所述采用预先获取的第一训练数据对第一模型进行第一训练,得到第二模型,包括:

    获取第一训练数据;

    采用所述第一训练数据对第一模型进行第一训练;

    当所述第一模型在所述第一训练中的损失函数的若干个迭代次数满足预设要求后,得到第二模型。

    3.根据权利要求1所述的一种基于图像増广的模型训练方法,其特征在于,所述采用预设的若干种图像増广方式对所述第一训练数据进行图像増广,得到第二训练数据,其具体为:

    从所述若干种图像増广方式中依次采用其中一种图像増广方式对所述第一训练数据进行图像増广,得到与所述其中一种图像増广方式对应的第二训练数据。

    4.根据权利要求3所述的一种基于图像増广的模型训练方法,其特征在于,所述根据预测结果从所述若干种图像増广方式中确定目标増广方式,包括:

    依次计算与所述第二训练数据对应的预测损失值;

    将与最大的预测损失值对应的图像増广方式作为目标増广方式。

    5.根据权利要求1所述的一种基于图像増广的模型训练方法,其特征在于,所述通过所述第三训练数据对所述第一模型进行第二训练,得到目标模型,包括:

    采用所述第三训练数据对第一模型进行第二训练;

    当所述第一模型在所述第二训练中的损失函数的若干个迭代次数满足预设要求后,得到目标模型。

    6.根据权利要求2或5所述的一种基于图像増广的模型训练方法,其特征在于,所述若干个迭代次数为连续的迭代次数。

    7.根据权利要求1-5任一项所述的一种基于图像増广的模型训练方法,其特征在于,所述若干种图像増广方式包括随机旋转、随机剪裁、随机粘贴和光学图像増广;每一种图像増广方式包含不同的参数。

    8.一种基于图像増广的模型训练系统,其特征在于,包括:

    第一训练模块,用于采用预先获取的第一训练数据对第一模型进行第一训练,得到第二模型;

    图像増广模块,用于采用预设的若干种图像増广方式对所述第一训练数据进行图像増广,得到第二训练数据;

    预测模块,用于采用所述第二模型对所述第二训练数据进行预测;

    确定模块,用于根据预测结果从所述若干种图像増广方式中确定目标増广方式;

    保存模块,用于将通过所述目标増广方式对所述第一训练数据进行图像増广后的数据和所述第一训练数据作为第三训练数据;

    第二训练模块,用于通过所述第三训练数据对所述第一模型进行第二训练,得到目标模型。

    9.一种基于图像増广的模型训练系统,其特征在于,包括:

    至少一个存储器,用于存储程序;

    至少一个处理器,用于加载所述程序以执行如权利要求1-7任一项所述的基于图像増广的模型训练方法。

    10.一种存储介质,其中存储有处理器可执行的指令,其特征在于,所述处理器可执行的指令在由处理器执行时用于实现如权利要求1-7任一项所述的基于图像増广的模型训练方法。

    技术总结
    本发明公开了一种基于图像増广的模型训练方法、系统和存储介质,方法包括以下步骤:采用预先获取的第一训练数据对第一模型进行第一训练,得到第二模型;采用预设的若干种图像増广方式对第一训练数据进行图像増广,得到第二训练数据;采用第二模型对第二训练数据进行预测;根据预测结果从若干种图像増广方式中确定目标増广方式;将通过目标増广方式对第一训练数据进行图像増广后的数据和第一训练数据作为第三训练数据;通过第三训练数据对第一模型进行第二训练,得到目标模型。本发明能有效提高图像増广后的图像数据对模型的训练效果。本发明可广泛应用于模型训练技术领域。

    技术研发人员:林成创;赵淦森;李壮伟;黄润桦;彭璟;吴清蓝;张奇之;杨晋吉;罗浩宇;李双印;樊小毛;唐华
    受保护的技术使用者:华南师范大学
    技术研发日:2020.11.26
    技术公布日:2021.03.12

    转载请注明原文地址:https://wp.8miu.com/read-19045.html

    最新回复(0)