本发明实施例涉及模型训练技术,尤其涉及一种模型的训练方法、装置、电子终端及存储介质。
背景技术:
目前,医院可使用各模型对医疗数据进行预测,例如使用检出模型对医学影像中的感兴趣区域进行检出,又如使用分割模型对医学影像中的感兴趣区域进行分割等。
通常,医院使用的模型基本上是离线训练得到的,其常规流程是:首先,训练平台从多家不同医院收集大量的医疗数据,以及医疗数据的标记数据;然后,训练平台根据收集的医疗数据和标记数据,进行模型训练;最后,训练平台将模型上线到各医院相应的系统平台中。
使用多家医院的大量医疗数据进行模型训练,虽然为模型的鲁棒性和泛化性提供了保障,但是其针对特定数据的表现会相对下降一些。以ct数据为例,当有些医院的数据比较特殊,比如机型比较罕见,重建算法比较特殊等,那么该模型在这种数据上的表现就会比通用的机型、通用的重建算法的数据要差一些。
针对这些特定数据,比较常见的模型训练方法是:医护人员整理特定数据、特定数据的标记数据,和对特定数据的预测结果的标记数据等,并通过医院的系统平台上传至训练平台;训练平台将上述数据加入训练集,使用新的训练集对原先训练好的训练模型再次进行训练。
现有的针对特定数据的模型再训练方法,其不足之处至少包括:医护人员整理数据的过程为重复性、机械性的过程,需耗费大量的时间和人力资源;可能会造成医院某些敏感数据的泄露。
技术实现要素:
有鉴于此,本发明实施例提供了一种模型的训练方法、装置、电子终端及存储介质,能够在保证医院数据安全的情况下,实现针对特定数据进行自动地模型训练,从而不仅提高模型针对特定数据的表现,还可以避免浪费大量时间和人力资源。
第一方面,本发明实施例提供了一种模型的训练方法,应用于医院的系统平台,包括:
于当前时机满足预设时机时,从预设存储空间获取标记数据、训练数据和原始模型;其中,所述标记数据为所述系统平台上线所述原始模型后,存储的全部标记数据;所述训练数据为训练所述原始模型时,所使用的原始训练集中的部分数据;
基于所述标记数据和所述训练数据,对所述原始模型中预设组成模块的参数进行调整,得到调参后的模型;
根据评测数据对所述调参后的模型进行评测,并根据评测结果将所述调参后的模型更新到所述预设存储空间。
第二方面,本发明实施例提供了一种基于模型的预测方法,应用于医院的系统平台,包括:
每隔预设时间,从本发明任意实施例提供的模型的训练方法中的预设存储空间中,获取最新更新的模型;
接收输入数据,并基于最新更新的模型对输入数据进行预测,得到预测结果。
第三方面,本发明实施例还提供了一种模型的训练装置,集成于医院的系统平台,包括:
数据获取模块,用以于当前时机满足预设时机时,从预设存储空间获取标记数据、训练数据和原始模型;其中,所述标记数据为所述系统平台上线所述原始模型后,存储的全部标记数据;所述训练数据为训练所述原始模型时,所使用的原始训练集中的部分数据;
模型训练模块,用以基于所述标记数据和所述训练数据,对所述原始模型中预设组成模块的参数进行调整,得到调参后的模型;
评测模块,用以根据评测数据对所述调参后的模型进行评测,并根据评测结果将所述调参后的模型更新到所述预设存储空间。
第四方面,本发明实施例还提供了一种基于模型的预测装置,集成于医院的系统平台,包括:
模型获取模块,用以每隔预设时间,从本发明任意实施例提供的模型的训练方法中的预设存储空间中,获取最新更新的模型;
预测模块,用以接收输入数据,并基于最新更新的模型对输入数据进行预测,得到预测结果。
第五方面,本发明实施例还提供了一种电子终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本发明任意实施例提供的模型的训练方法,或基于模型的预测方法。
第六方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如本发明任意实施例提供的模型的训练方法,或基于模型的预测方法。
本发明实施例提供的一种模型的训练方法、装置、电子终端及存储介质,其中模型的训练方法应用于医院的系统平台,包括:于当前时机满足预设时机时,从预设存储空间获取标记数据、训练数据和原始模型;其中,标记数据为系统平台上线原始模型后,存储的全部标记数据;训练数据为训练原始模型时,所使用的原始训练集中的部分数据;基于标记数据和训练数据,对原始模型中预设组成模块的参数进行调整,得到调参后的模型;根据评测数据对调参后的模型进行评测,并根据评测结果将调参后的模型更新到预设存储空间。
通过利用医院的系统平台进行模型再训练,能够保证医院数据不外泄,提高医院数据的安全性;通过在当前时机满足预设时机时,获取数据进行模型再训练,能够保证再训练过程在适宜时机下进行;通过获取标记数据和训练数据,以用于模型再训练,能够保证训练后的模型既在通用数据上获得较佳表现,又在特定数据上获取较佳表现;通过获取原始训练集中的部分数据作为训练数据,能够提高训练速度;通过只对原始模型中预设组成模块的参数进行调整,能够实现模型微调,且提高训练速度;通过对调参后的模型进行评测,能够保证更新至预设存储空间的模型,为具备优化效果的模型。从而能够在保证医院数据安全的情况下,实现针对特定数据进行自动地模型训练,从而不仅提高模型针对特定数据的表现,还可以避免浪费大量时间和人力资源。
附图说明
图1是本发明实施例一提供的一种模型的训练方法的流程示意图;
图2是本发明实施例二提供的一种模型的训练方法的流程示意图;
图3是本发明实施例三提供的一种基于模型的预测方法的流程示意图;
图4是本发明实施例四提供的一种模型的训练装置的结构示意图;
图5是本发明实施例五提供的一种基于模型的预测装置的结构示意图;
图6是本发明实施例六提供的一种医院的系统平台的结构示意图;
图7是本发明实施例七提供的一种电子终端的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,以下将参照本发明实施例中的附图,通过实施方式清楚、完整地描述本发明的技术方案,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。下述各实施例中,每个实施例中同时提供了可选特征和示例,实施例中记载的各个特征可进行组合,形成多个可选方案,不应将每个编号的实施例仅视为一个技术方案。
实施例一
图1是本发明实施例一提供的一种模型的训练方法的流程示意图,本实施例可适用于有针对性的模型训练过程,进行模型自动训练的情况,例如可适用于针对医院中,罕见机型的医学影像设备的数据,或重建算法比较特殊的数据,进行数据预测模型的自动训练的情况。该方法可以由本发明实施例提供的模型的训练装置(可简称为训练装置)来执行,且训练装置可配置于本发明实施例提供的电子终端中,例如可配置于计算机中。
参见图1,模型的训练方法,应用于医院的系统平台,具体包括如下步骤:
s110、于当前时机满足预设时机时,从预设存储空间获取标记数据、训练数据和原始模型。
本发明实施例中,通过在医院的系统平台上进行模型再训练,能够降低数据泄露的风险,提高医院数据的安全性。其中,系统平台每当判断到当前时机满足预设时机时,都可以执行“从预设存储空间获取标记数据、训练数据和原始模型”步骤,从而能够实现模型的自动、持续更新,避免了大量重复性工作,节省了时间和人力成本。通常模型在医院的系统平台上线越久,系统平台针对医院特定数据进行模型再训练的次数越多,从而针对该医院的特定数据的预测效果就越好。
其中,标记数据为系统平台上线原始模型后,存储的全部标记数据;训练数据为训练原始模型时,所使用的原始训练集中的部分数据。其中,标记数据可以表征医院的特定数据的特征,且标记数据可包括特定数据和对特定数据进行标记后的数据;训练数据可以表征适谱性高的通用数据的特征,且训练数据可包括普通数据和对普通数据进行标记后的数据。通过既获取标记数据又获取训练数据,能够保证训练后的模型既在特定数据上获得较佳表现,又在通用数据上获取较佳表现。
其中,训练数据可以是在系统平台上线原始模型时,同步存储到预设存储空间的。由于原始模型训练过程通常使用到海量数据,如果全部都加入训练,会导致训练太慢。通过获取原始训练集中的部分数据作为训练数据,能够提高训练速度。其中,模型在每次再训练时,通过在原始模型基础上进行训练,而不是在上次训练好的模型基础上进行训练,能够为模型的鲁棒性和泛化性提供保障。
在一些可选的实现方式中,当前时机满足预设时机,包括:从上次得到调参后的模型的时刻起,存储的标记数据达到预设条数,且当前时段为系统平台的预设空闲时段。
在这些可选的实现方式中,系统平台并不会每次存储标记数据都会重新训练,而是会查询相对上次得到调参后的模型的时刻起,新存储的标记数据的条数。当新存储的标记数据达到预设条数再进行训练,从而一方面可避免频繁训练造成的系统平台资源浪费,另一方面可避免根据增量太少的标记数据进行训练,达不到优化效果的情况。此外,预设空闲时段通常为医院的业务不繁忙的时段,比如凌晨、节假日等,通过在预设空闲时段进行训练,能够避免训练影响系统平台执行各业务的性能。
在一些可选的实现方式中,标记数据的生成步骤,包括:接收输入数据;基于最新更新的模型对输入数据进行预测,得到预测结果;响应于接收的修改指令,对预测结果进行修改,并将修改后的预测结果作为标记数据;和/或,响应于接收的标记指令,对输入数据进行标记,并将标记结果作为标记数据。
在这些可选的实现方式中,标记数据来源可以包括两方面:第一方面为,当医护人员对最新更新的模型输出的预测结果不满意时,可以通过用户界面等方式向系统平台输入修改指令,以修改预测结果,并可以将修改后的预测结果作为标记数据;第二方面为,医护人员还可以对输入数据,直接进行标注。此外,标记数据的其他生成方式也可应用于此,在此不做穷举。
s120、基于标记数据和训练数据,对原始模型中预设组成模块的参数进行调整,得到调参后的模型。
本实施例中,模型可以包括专家系统或人工智能网络模型,且人工智能网络模型包括机器学习(machinelearning,ml)模型或深度学习(deeplearning,dl)模型。其中,模型可以由多个组成模块构成,以深度学习模型为例,可以包括主干网络backbone、neck网络和head网络等。其中,常见的backbone有残差神经网络(residualneuralnetwork,res-net)、可视化几何组网络(visualgeometrygroupnetwork,vgg-net)和高效网络efficient-net等;常见的neck网络有特征金字塔网络(featurepyramidnetworks,fpn)、空间金字塔池网络(spatialpyramidpoolingnetwork,spp-net)等;常见的head网络有区域提取网络(regionproposalnetwork,rpn)、中心网络(center-net)、一阶全卷积目标检测(fullyconvolutionalone-stageobjectdetection,fcos)等。
通过利用标记数据和训练数据的混合数据进行模型再训练,且在训练的过程中对模型微调,即只对模型的预设组成模块的参数进行调整,能够保证训练后的模型既在通用数据上获得较佳表现,又在特定数据上获取较佳表现。
例如,在一些可选的实现方式中,若模型为深度学习模型,则预设组成模块包括深度学习模型中的neck网络和head网络。其中,可将深度学习模型的backbone网络中的网络参数进行固定,不对其进行参数更新,只会更新后面的neck网络和head网络。
s130、根据评测数据对调参后的模型进行评测,并根据评测结果将调参后的模型更新到预设存储空间。
本实施例中,调参后的模型并不可以直接就更新到预设存储空间,以供系统平台使用,而是要进行评测,并根据评测结果选择性存储调参后的模型。
其中,可利用评测数据分别对上次更新的调参后的模型和当前调参后的模型进行评测,得到各评测结果。并且,可以在评测结果表征当前调参后的模型,较上次更新的调参后的模型的预测效果得到优化时,将当前调参后的模型更新到预设存储空间。
通过对调参后的模型进行评测,能够保证每次更新至预设存储空间的模型,为较前次调参后的模型预测效果更佳的模型。
在一些可选的实现方式中,根据评测数据对调参后的模型进行评测,并根据评测结果将调参后的模型更新到预设存储空间,包括:
获取系统平台对应的第一评测数据,以及原始模型对应的第二评测数据;从预设存储空间获取上次更新的调参后的模型,将第一评测数据和第二评测数据输入上次更新的调参后的模型,分别得到第一预测结果和第二预测结果;将第一评测数据和第二评测数据输入当前调参后的模型,分别得到第三预测结果和第四预测结果;于第三预测结果的评测指标优于第一预测结果的评测指标,且第四预测结果的评价指标不劣于第二预测结果的评测指标时,将当前调参后的模型更新到预设存储空间。
其中,评测数据往往由两方面数据组成,分别是系统平台中待预测的特定数据(即第一评测数据),以及原始模型在训练完毕进行测评时,所使用的测试集中的普通数据(即第二评测数据)。其中,预设存储空间中可存储有每次更新的调参后的模型,例如可存储每次更新的调参后的模型的模型参数。
其中,在从预设存储空间获取上次更新的调参后的模型之后,可利用两方面评测数据,分别对上次调参后的模型和当前调参后的模型进行评测。具体例如为:将第一评测数据和第二评测数据输入上次更新的调参后的模型,分别得到第一预测结果和第二预测结果;将第一评测数据和第二评测数据输入当前调参后的模型,分别得到第三预测结果和第四预测结果。
其中,在确定预测结果后,可进一步确定预测结果的评测指标,即确定评测结果。其中,针对不同评测数据、不同预测功能的模型,其预测结果的评测指标可存在差异。示例性的,当评测数据为肺部电子计算机断层扫描(computedtomography,ct)数据时,若模型为针对肺结节检出的检出模型,则评价指标可以为预测结果的召回率、精确率和f1分数(f1-score)等;若模型为针对肺结节分割的分割模型,评价指标可以为dice等指标。
在分别确定上次调参后的模型针对特定数据的第一预测结果、针对普通数据的第二预测结果,以及当前调参后的模型针对特定数据的第三预测结果、针对普通数据的第四预测结果之后,可从两方面评测当前调参后的模型,是否较上次调参后的模型得到优化,具体是:第三预测结果的评测指标是否优于第一预测结果的评测指标,同时第四预测结果的评价指标不劣于第二预测结果的评测指标。
在当前调参后的模型较上次调参后的模型,针对医院的系统平台的特定数据的评测指标有所提高,且针对普通数据的评测指标不会下降的时候,可以将调参后的模型更新到预设存储空间,以用于后续进行数据预测。
在这些可选的实现方式中,通过将特定数据和普通数据两方面数据,分别输入当前调参后的模型和上次调参后的模型,输入预测结果,并基于预测结果确定评测指标,能够判断当前调参后的模型是否较上次调参后的模型得到优化;通过将得到优化的当前调参后的模型,更新至预设存储空间,能够能够保证更新至预设存储空间的模型,为具备优化效果的模型。
本发明实施例提供的一种模型的训练方法,通过利用医院的系统平台进行模型再训练,能够保证医院数据不外泄,提高医院数据的安全性;通过在当前时机满足预设时机时,获取数据进行模型再训练,能够保证再训练过程在适宜时机下进行;通过获取标记数据和训练数据,以用于模型再训练,能够保证训练后的模型既在通用数据上获得较佳表现,又在特定数据上获取较佳表现;通过获取原始训练集中的部分数据作为训练数据,能够提高训练速度;通过只对原始模型中预设组成模块的参数进行调整,能够实现模型微调,且提高训练速度;通过对调参后的模型进行评测,能够保证更新至预设存储空间的模型,为具备优化效果的模型。从而能够在保证医院数据安全的情况下,实现针对特定数据进行自动地模型训练,从而不仅提高模型针对特定数据的表现,还可以避免浪费大量时间和人力资源。
实施例二
图2是本发明实施例二提供的一种模型的训练方法的流程示意图,本实施例在上述实施例的基础上,对标注数据扩增进行了优化,能够提高再训练后的模型针对医院特征数据的表现;本实施例在上述实施例的基础上,还对模型间存在依赖关系时各模型的评测进行了优化,能够保证再训练后的模型。
参见图2,模型的训练方法,具体包括如下步骤:
s210、于当前时机满足预设时机时,从预设存储空间获取标记数据、训练数据和原始模型。
其中,标记数据为系统平台上线原始模型后,存储的全部标记数据;训练数据为训练原始模型时,所使用的原始训练集中的部分数据。
s220、判断标记数据与训练数据的条数比例,是否达到预设比例。
其中,预设比例可根据具体场景,以及该场景下的经验值或实验值进行设置。当标记数据与训练数据的条数比例达到预设比例时,可认为标记数据对原始模型的修正效果,可以达到预设效果;当标记数据与训练数据的条数比例未达到预设比例时,可认为标记数据对原始模型的修正效果微弱。
s230、若否,则对标记数据进行扩增。
其中,若标记数据与训练数据的条数比例未达到预设比例,可根据将标记数据进行一定的扩增操作。示例性的,若标记数据为对肺部ct数据以及对肺部ct数据进行标记的数据,则对标记数据扩增,可以是对肺部ct数据以及对肺部ct数据进行旋转、缩放或图像增强等处理。通过在标记数据占比过低时,对标记数据进行一定的扩增操作,能够避免因标记数据占比过小而导致对原始模型的修正效果微弱的问题。
s240、基于扩增后的标记数据和训练数据,对原始模型中预设组成模块的参数进行调整。
s250、根据评测数据对调参后的模型进行评测,得到测评结果。
s260、若调参后的模型为被依赖模型,则获取依赖调参后的模型的其他模型,并对其他模型进行评测,得到辅助评测结果。
其中,被依赖模型可以指被其他模型依赖的模型。当自动训练了被依赖模型时,不仅需要对被依赖模型进行评测,还需要对依赖该被依赖模型的所有其他模型进行评测。其中,对其他模型进行评测的方式可参考上述实施例提供的评测方式,在此不做赘述。其中,可以将对其他模型进行评测的结果,作为辅助评测结果。
s270、根据辅助评测结果以及评测结果,将调参后的模型更新到预设存储空间。
其中,根据辅助评测结果以及评测结果,将调参后的模型更新到预设存储空间,具体可以是:在评测结果表征当前调参后的模型,较上次更新的调参后的模型的预测效果得到优化,且辅助评测结果表征依赖当前调参后的模型的其他模型,较依赖上次更新的调参后的模型的其他模型的预测效果未下降时,将调参后的模型更新到预设存储空间。
示例性的,判断结节恶性程度的分类模型需要依赖检出模型的检出框,然后才可以预测。若检出模型进行了再训练,则只有在当前调参后的检出模型,较上次更新的调参后的检出模型的预测效果得到优化,且依赖当前调参后的检出模型的分类模型,较依赖上次更新的调参后的检出模型的分类模型的预测效果未下降时,可以将调参后的检出模型更新到预设存储空间。
本发明实施例中,通过对标注数据扩增进行了优化,能够提高再训练后的模型针对医院特征数据的表现;通过对模型间存在依赖关系时各模型的评测进行了优化,能够保证再训练后的模型。此外,本发明实施例与上述实施例提供的模型的训练方法属于同一发明构思,未详尽描述的技术细节可参见上述施例,且具备相同的技术效果。
实施例三
图3是本发明实施例三提供的一种基于模型的预测方法的流程示意图,本实施例可适用于对有针对性的数据进行预测的情况,例如可适用于针对医院中,罕见机型的医学影像设备的数据,或重建算法比较特殊的数据,进行数据预测的情况。该方法可以由本发明实施例提供的基于模型的预测装置(可简称为预测装置)来执行,且预测装置可配置于本发明实施例提供的电子终端中,例如可配置于计算机中。
参见图3,基于模型的预测方法,应用于医院的系统平台,具体包括如下步骤:
s310、每隔预设时间,从本发明任意实施例提供的模型的训练方法中的预设存储空间中,获取最新更新的模型。
本发明实施例中,系统平台每隔预设时间去预设存储空间拉取最新的模型参数,例如每天凌晨3点。其中,基于模型参数可还原出具体模型。从而不仅能够避免频繁获取模型造成的系统平台资源的消耗,还能够保证获取的到模型为当前时刻系统平台上预测效果较佳的模型。
每隔预设时间获取模型,可能出现如下情况:预设存储空间更新了模型,但当前时刻距上次获取模型的时刻还未到预设时间。上述情况下,用于进行预测的模型并非预测效果最佳的模型。因此,本实施例方案基础上,还可以在调参后的模型更新到预设存储空间时,从预设存储空间获取调参后的模型,从而能够保证获取的模型为当前时刻系统平台上预测效果最佳的模型。
其中,预设存储空间中所存储的模型,可依照本发明任意实施例公开的模型的训练方法进行自动训练,且训练步骤主要可以包括:于当前时机满足预设时机时,从预设存储空间获取标记数据、训练数据和原始模型;其中,标记数据为系统平台上线原始模型后,存储的全部标记数据;训练数据为训练原始模型时,所使用的原始训练集中的部分数据;基于标记数据和训练数据,对原始模型中预设组成模块的参数进行调整,得到调参后的模型;根据评测数据对调参后的模型进行评测,并根据评测结果将调参后的模型更新到预设存储空间。此外,具体的训练步骤可参考上述实施例公开的模型的训练方法,在此不做赘述。
s320、接收输入数据,并基于最新更新的模型对输入数据进行预测,得到预测结果。
当系统平台获取到数据时,基于最新更新的模型,对输入数据进行预测,输出预测结果,能够保证基于预测效果较佳的模型进行数据预测。
在一些可选的实现方式中,基于模型的预测方法,还包括:响应于接收的修改指令,对预测结果进行修改,并将修改后的预测结果作为标记数据存储到预设存储空间。
在这些可选的实现方式中,当医护人员对最新更新的模型输出的预测结果不满意时,可以通过用户界面等方式向系统平台输入修改指令,以修改预测结果,并可以将修改后的预测结果作为标记数据。此外,医护人员还可以对输入数据,直接进行标注,以生成标记数据。之后,通过将生成的标记数据存储到预设存储空间,能够实现预测存储空间中标记数据的增量变化,以用于模型后续的自动训练。
示例性的,当医生对预测结果不满意的时候,可以将预测的结果导入到标记系统,对预测结果进行标记。比如,针对医学影像检测时,如果检测的感兴趣区域有遗漏的话,医生可以在检测出的感兴趣区域基础上,再勾画出遗漏的区域;如果检测的感兴趣区域是假阳的话,医生可以删除预测出来的感兴趣区域;如果检测的感兴趣区域的轮廓表现不佳的话,医生可以修改、微调、重画感兴趣区域的轮廓。当医生确认已经标记完成后,可以将该标记结果存储于数据库。
在一些可选的实现方式中,在得到预测结果之后,还包括:将预测结果进行展示;或者,将预测结果存储至预设存储空间中;响应于接收的调取指令,从预设存储空间中调取对应的预测结果,并对调取的预测结果进行展示。
其中,在基于最新更新的模型对输入数据进行预测的同时,还可以基于其他模型对输入数据进行预测,得到其他模型输出的预测结果。其中,将预测结果进行展示,可以是将各个模型的预测结果进行业务组合,并将组合结果展现到前端,以辅助医生进行阅片。
示例性的,当输入数据为肺部ct数据,最新更新的模型为针对肺结节检出的检出模型,其他模型包括针对肺结节分割的分割模型时,可基于检出模型输出预测的肺结节检出框,同时基于分割模型输出预测的肺结节分割轮廓。对预测结果进行展示时,可将肺结节检出框和肺结节分割轮廓进行业务组合,最终展现到前端,以辅助医生进行阅片。
在一些情况下,存在对历史的预测结果进行查看的需求,例如病人预约了之后的时间进行问诊时,医生需要在病人预约的时间调取预测结果。因此,除实时展示预测结果外,还可以将预测结果存储至预设存储空间中,当用户后续需要查看预测结果时,可以输入调取指令。相应的,系统平台可响应于接收的调取指令,从预设存储空间中调取对应的预测结果,并对调取的预测结果进行展示,从而提高了预测结果展示的灵活性。
本发明实施例提供的一种基于模型的预测方法,通过每隔预设时间获取最新更新的模型,且最新更新的模型为基于标记数据和训练数据再训练后的模型,能够保证最新更新的模型既在通用数据上获得较佳表现,又在特定数据上获取较佳表现,从而提高数据预测效果。此外,本发明实施例与上述实施例提供的模型的训练方法属于同一发明构思,未详尽描述的技术细节可参见上述施例,且具备相同的技术效果。
实施例四
图4是本发明实施例四提供的一种模型的训练装置的结构示意图,本实施例可适用于有针对性的模型训练过程,进行模型自动训练的情况,例如可适用于针对医院中,罕见机型的医学影像设备的数据,或重建算法比较特殊的数据,进行数据预测模型的自动训练的情况。应用该模型的训练装置可以实现本发明任一实施例所提供的模型的训练方法。
参见图4,模型的训练装置,集成于医院的系统平台,包括:
数据获取模块410,用以于当前时机满足预设时机时,从预设存储空间获取标记数据、训练数据和原始模型;其中,标记数据为系统平台上线原始模型后,存储的全部标记数据;训练数据为训练原始模型时,所使用的原始训练集中的部分数据;
模型训练模块420,用以基于标记数据和训练数据,对原始模型中预设组成模块的参数进行调整,得到调参后的模型;
评测模块430,用以根据评测数据对调参后的模型进行评测,并根据评测结果将调参后的模型更新到预设存储空间。
在一些可选的实现方式中,当前时机满足预设时机,包括:
从上次得到调参后的模型的时刻起,存储的标记数据达到预设条数,且当前时段为系统平台的预设空闲时段。
在一些可选的实现方式中,模型的训练装置,还包括:
标记模块,用于接收输入数据;基于最新更新的模型对输入数据进行预测,得到预测结果;响应于接收的修改指令,对预测结果进行修改,并将修改后的预测结果作为标记数据;和/或,响应于接收的标记指令,对输入数据进行标记,并将标记结果作为标记数据。
在一些可选的实现方式中,数据获取模块,包括:
扩增单元,用于在从预设存储空间获取标记数据、训练数据之后,判断标记数据与训练数据的条数比例,是否达到预设比例;若否,则对标记数据进行扩增;
相应的,模型训练模块,具体用于基于扩增后的标记数据和训练数据,对原始模型中预设组成模块的参数进行调整。
在一些可选的实现方式中,若模型为深度学习模型,则预设组成模块包括深度学习模型中的neck网络和head网络。
在一些可选的实现方式中,评测模块,包括:
测评数据获取单元,用于获取系统平台对应的第一评测数据,以及原始模型对应的第二评测数据;
预测结果确定单元,用于从预设存储空间获取上次更新的调参后的模型,将第一评测数据和第二评测数据输入上次更新的调参后的模型,分别得到第一预测结果和第二预测结果;将第一评测数据和第二评测数据输入当前调参后的模型,分别得到第三预测结果和第四预测结果;
评测单元,用以于第三预测结果的评测指标优于第一预测结果的评测指标,且第四预测结果的评价指标不劣于第二预测结果的评测指标时,将当前调参后的模型更新到预设存储空间。
在一些可选的实现方式中,若调参后的模型为被依赖模型,则评测模块还用于:
在根据评测数据对调参后的模型进行评测之后,获取依赖调参后的模型的其他模型,并对其他模型进行评测,得到辅助评测结果;
根据辅助评测结果以及评测结果,将调参后的模型更新到预设存储空间。
本发明实施例所提供的模型的训练装置可执行本发明任一实施例所提供的模型的训练方法,具备执行方法相应的功能模块和有益效果。未详尽描述的技术细节,可参见本发明任一实施例所提供的模型的训练方法。
实施例五
图5是本发明实施例五提供的一种基于模型的预测装置的结构示意图,本实施例可适用于对有针对性的数据进行预测的情况,例如可适用于针对医院中,罕见机型的医学影像设备的数据,或重建算法比较特殊的数据,进行数据预测的情况。应用该模型的训练装置可以实现本发明任一实施例所提供的基于模型的预测方法。
参见图5,基于模型的预测装置,包括:
模型获取模块510,用以每隔预设时间,从本发明任意实施例提供的模型的训练方法中的预设存储空间中,获取最新更新的模型;
预测模块520,用以接收输入数据,并基于最新更新的模型对输入数据进行预测,得到预测结果。
在一些可选的实现方式中,基于模型的预测装置,还包括:
标记模块,用以响应于接收的修改指令,对预测结果进行修改,并将修改后的预测结果作为标记数据存储到预设存储空间。
在一些可选的实现方式中,基于模型的预测装置,还包括:
展示模块,用以在得到预测结果之后,将预测结果进行展示;或者,将预测结果存储至预设存储空间中;响应于接收的调取指令,从预设存储空间中调取对应的预测结果,并对调取的预测结果进行展示。
本发明实施例所提供的模型的训练装置可执行本发明任一实施例所提供的基于模型的预测方法,具备执行方法相应的功能模块和有益效果。未详尽描述的技术细节,可参见本发明任一实施例所提供的基于模型的预测方法。
实施例六
图6是本发明实施例六提供的一种医院的系统平台的结构示意图。参见图6,医院的系统平台可以包括上述实施例提供的模型的训练装置和基于模型的预测装置中的相关模块,且整体架构设计可以如下:
以处理ct数据的系统平台为例,系统平台可以包括但不限于:预测系统610、标记系统620、存储系统630、训练系统640和评测系统650等5大系统。
其中,预测系统610属于预测装置,可包括模型获取模块611、第一预测模块612和展示模块613。其中,模型获取模块611,可用于每隔预设时间,从存储系统630的数据库(图中并未示出)拉取最新更新的模型参数。其中,第一预测模块612,可用于当有ct数据进入预测系统时,基于最新更新的模型对ct数据进行预测,得到预测结果。其中,展示模块613,可用于将预测模块发送的预测结果进行展示;或者,响应于接收的调取指令,从存储系统630的数据库调取对应的预测结果并进行展示。
其中,标记系统620可以属于训练装置,或者可以属于预测装置,可包括导入模块621和标记工具622。其中,导入模块621,可用于导入用户反馈不满意的预测结果。其中,标记工具622,可用于响应于接收的修改指令,对预测结果进行修改,并将修改后的预测结果作为标记数据;和/或,响应于接收的标记指令,对ct数据直接进行标记,并将标记结果作为标记数据;还可以用于将标记数据存储至存储系统630的数据库。可以理解的是,标记系统620是独立的系统,不需要依赖预测系统610,即不但可以对预测结果进行标记,还可以直接对未进行预测的ct数据进行标记。
其中,存储系统630可以属于训练装置,或者可以属于预测装置,可包括数据库和文件系统(图中并未示出),且数据库和文件系统皆可作为预设存储空间使用;其中,数据库主要存储一些参数数据,例如标记框、结节类型、结节轮廓等标记数据;文件系统主要存储的是大文件,比如ct图像和模型参数等。
其中,训练系统640属于训练装置,可包括数据获取模块641和模型训练模块642。其中,数据获取模块641,可用以于当前时机满足预设时机时,从存储系统630获取标记数据、训练数据和原始模型;其中,标记数据为系统平台上线原始模型后,存储的全部标记数据;训练数据为训练原始模型时,所使用的原始训练集中的部分数据。其中,模型训练模块642,可用以基于标记数据和训练数据,对原始模型中预设组成模块的参数进行调整,得到调参后的模型。
其中,评测系统650属于训练装置,可包括测评数据获取模块651、第二预测模块652和效果评估模块653。其中,评数据获取模块651,可用于从存储系统630获取系统平台对应的第一评测数据、原始模型对应的第二评测数据,以及上次更新的调参后的模型。其中,第二预测模块652,可用于将第一评测数据和第二评测数据输入上次更新的调参后的模型,分别得到第一预测结果和第二预测结果;将第一评测数据和第二评测数据输入当前调参后的模型,分别得到第三预测结果和第四预测结果。其中,效果评估模块653,可用于第三预测结果的评测指标优于第一预测结果的评测指标,且第四预测结果的评价指标不劣于第二预测结果的评测指标时,将当前调参后的模型更新到存储系统630。
需要注意的是,若调参后的模型为被依赖模型,则评测系统650,还用于在根据评测数据对调参后的模型进行评测之后,获取依赖调参后的模型的其他模型,并对其他模型进行评测,得到辅助评测结果;根据辅助评测结果以及评测结果,将调参后的模型更新到预设存储空间。
本实施例所提供医院的系统平台,只是示例性的一种实现方式,并不作为对系统平台的限制。比如,系统平台可以将标记系统抽离出来,医生可以不使用标记系统,而是其他的标记工具进行标记,只要最后数据格式符合预设格式要求,能够导入存储系统的数据库即可。再比如,效果评估模块除了可以用客观指标进行自动评测,还可以添加主观评测环节,例如用预测系统展现20套评测数据的新模型预测结果和之前模型的预测结果,让医生评判是否有进步等。添加主观评测虽然会导致自动化能力会下降,但是可以进一步确保模型的稳定可靠。此外,模型的训练方式也可以调整,比如本发明实施例中在训练过程将backbone的网络参数进行了固定,当然也可以不固定进行训练。
通过该系统平台,能够在保证医院数据安全的情况下,实现针对特定数据进行自动地模型训练,从而不仅提高模型针对特定数据的表现,还可以避免浪费大量时间和人力资源。
实施例七
图7是本发明实施例七提供的一种电子终端的结构示意图。图7示出了适于用来实现本发明任一实施方式的示例性终端12的框图。图7显示的终端12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。设备12典型的是承担模型的训练功能,或者基于模型的预测功能的终端。
如图7所示,终端12以通用计算设备的形式表现。终端12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,存储器28,连接不同组件(包括存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(industrystandardarchitecture,isa)总线,微通道体系结构(microchannelarchitecture,mca)总线,增强型isa总线、视频电子标准协会(videoelectronicsstandardsassociation,vesa)局域总线以及外围组件互连(peripheralcomponentinterconnect,pci)总线。
终端12典型地包括多种计算机可读介质。这些介质可以是任何能够被终端12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器28可以包括易失性存储器形式的计算机装置可读介质,例如随机存取存储器(randomaccessmemory,ram)30和/或高速缓存存储器32。终端12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图7未显示,通常称为“硬盘驱动器”)。尽管图7中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如只读光盘(compactdisc-readonlymemory,cd-rom)、数字视盘(digitalvideodisc-readonlymemory,dvd-rom)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品40,该程序产品40具有一组程序模块42,这些程序模块被配置以执行本发明各实施例的功能。程序产品40,可以存储在例如存储器28中,这样的程序模块42包括但不限于一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
终端12也可以与一个或多个外部设备14(例如键盘、鼠标、摄像头等和显示器)通信,还可与一个或者多个使得用户能与该终端12交互的设备通信,和/或与使得该终端12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口22进行。并且,终端12还可以通过网络适配器20与一个或者多个网络(例如局域网(localareanetwork,lan),广域网wideareanetwork,wan)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与终端12的其它模块通信。应当明白,尽管图中未示出,可以结合终端12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、磁盘阵列(redundantarraysofindependentdisks,raid)装置、磁带驱动器以及数据备份存储装置等。
处理器16通过运行存储在存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明上述实施例所提供的模型的训练方法,该方法应用于医院的系统平台,包括:
于当前时机满足预设时机时,从预设存储空间获取标记数据、训练数据和原始模型;其中,标记数据为系统平台上线原始模型后,存储的全部标记数据;训练数据为训练原始模型时,所使用的原始训练集中的部分数据;基于标记数据和训练数据,对原始模型中预设组成模块的参数进行调整,得到调参后的模型;根据评测数据对调参后的模型进行评测,并根据评测结果将调参后的模型更新到预设存储空间。
又如,实现本发明上述实施例所提供的基于模型的预测方法,该方法应用于医院的系统平台,包括:
每隔预设时间,从本发明任意实施例提供的模型的训练方法中的预设存储空间中,获取最新更新的模型;接收输入数据,并基于最新更新的模型对输入数据进行预测,得到预测结果。
当然,本领域技术人员可以理解,处理器还可以实现本发明任一实施例所提供的模型的训练方法或模型的训练方法的技术方案。
实施例八
本发明实施例八还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时,例如实现本发明上述实施例所提供的模型的训练方法,该方法应用于医院的系统平台,包括:
于当前时机满足预设时机时,从预设存储空间获取标记数据、训练数据和原始模型;其中,标记数据为系统平台上线原始模型后,存储的全部标记数据;训练数据为训练原始模型时,所使用的原始训练集中的部分数据;基于标记数据和训练数据,对原始模型中预设组成模块的参数进行调整,得到调参后的模型;根据评测数据对调参后的模型进行评测,并根据评测结果将调参后的模型更新到预设存储空间。
又如,实现本发明上述实施例所提供的基于模型的预测方法,该方法应用于医院的系统平台,包括:
每隔预设时间,从本发明任意实施例提供的模型的训练方法中的预设存储空间中,获取最新更新的模型;接收输入数据,并基于最新更新的模型对输入数据进行预测,得到预测结果。
当然,本发明实施例所提供的一种计算机可读存储介质,其上存储的计算机程序不限于如上的方法指令,还可以执行本发明任意实施例提供所提供的模型的训练方法,或基于模型的预测方法。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的装置、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行装置、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行装置、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、rf等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明指令的计算机程序代码,程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c ,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
1.一种模型的训练方法,其特征在于,应用于医院的系统平台,包括:
于当前时机满足预设时机时,从预设存储空间获取标记数据、训练数据和原始模型;其中,所述标记数据为所述系统平台上线所述原始模型后,存储的全部标记数据;所述训练数据为训练所述原始模型时,所使用的原始训练集中的部分数据;
基于所述标记数据和所述训练数据,对所述原始模型中预设组成模块的参数进行调整,得到调参后的模型;
根据评测数据对所述调参后的模型进行评测,并根据评测结果将所述调参后的模型更新到所述预设存储空间。
2.根据权利要求1所述的方法,其特征在于,所述当前时机满足预设时机,包括:
从上次得到调参后的模型的时刻起,存储的标记数据达到预设条数,且当前时段为所述系统平台的预设空闲时段。
3.根据权利要求1所述的方法,其特征在于,所述标记数据的生成步骤,包括:
接收输入数据;
基于最新更新的模型对输入数据进行预测,得到预测结果;响应于接收的修改指令,对所述预测结果进行修改,并将修改后的预测结果作为标记数据;和/或,
响应于接收的标记指令,对输入数据进行标记,并将标记结果作为标记数据。
4.根据权利要求1所述的方法,其特征在于,在所述从预设存储空间获取标记数据、训练数据之后,还包括:
判断所述标记数据与训练数据的条数比例,是否达到预设比例;
若否,则对所述标记数据进行扩增;
相应的,所述基于所述标记数据和所述训练数据,对所述原始模型中预设组成模块的参数进行调整,包括:
基于扩增后的标记数据和所述训练数据,对所述原始模型中预设组成模块的参数进行调整。
5.根据权利要求1所述的方法,其特征在于,若所述模型为深度学习模型,则所述预设组成模块包括深度学习模型中的neck网络和head网络。
6.根据权利要求1所述的方法,其特征在于,所述根据评测数据对所述调参后的模型进行评测,并根据评测结果将所述调参后的模型更新到所述预设存储空间,包括:
获取所述系统平台对应的第一评测数据,以及所述原始模型对应的第二评测数据;
从所述预设存储空间获取上次更新的调参后的模型,将所述第一评测数据和第二评测数据输入所述上次更新的调参后的模型,分别得到第一预测结果和第二预测结果;
将所述第一评测数据和第二评测数据输入当前调参后的模型,分别得到第三预测结果和第四预测结果;
于所述第三预测结果的评测指标优于所述第一预测结果的评测指标,且所述第四预测结果的评价指标不劣于所述第二预测结果的评测指标时,将当前调参后的模型更新到所述预设存储空间。
7.根据权利要求1所述的方法,其特征在于,若所述调参后的模型为被依赖模型,则在所述根据评测数据对所述调参后的模型进行评测之后,还包括:
获取依赖所述调参后的模型的其他模型,并对所述其他模型进行评测,得到辅助评测结果;
相应的,所述根据评测结果将所述调参后的模型更新到所述预设存储空间,包括:
根据所述辅助评测结果以及所述评测结果,将所述调参后的模型更新到所述预设存储空间。
8.一种基于模型的预测方法,其特征在于,应用于医院的系统平台,包括:
每隔预设时间,从权利要求1-7任一所述的模型的训练方法中的预设存储空间中,获取最新更新的模型;
接收输入数据,并基于最新更新的模型对输入数据进行预测,得到预测结果。
9.根据权利要求8所述的方法,其特征在于,还包括:
响应于接收的修改指令,对所述预测结果进行修改,并将修改后的预测结果作为标记数据存储到所述预设存储空间。
10.根据权利要求8所述的方法,其特征在于,在所述得到预测结果之后,还包括:
将所述预测结果进行展示;或者,
将所述预测结果存储至所述预设存储空间中;
响应于接收的调取指令,从所述预设存储空间中调取对应的预测结果,并对调取的预测结果进行展示。
11.一种模型的训练装置,其特征在于,集成于医院的系统平台,包括:
数据获取模块,用以于当前时机满足预设时机时,从预设存储空间获取标记数据、训练数据和原始模型;其中,所述标记数据为所述系统平台上线所述原始模型后,存储的全部标记数据;所述训练数据为训练所述原始模型时,所使用的原始训练集中的部分数据;
模型训练模块,用以基于所述标记数据和所述训练数据,对所述原始模型中预设组成模块的参数进行调整,得到调参后的模型;
评测模块,用以根据评测数据对所述调参后的模型进行评测,并根据评测结果将所述调参后的模型更新到所述预设存储空间。
12.一种基于模型的预测装置,其特征在于,集成于医院的系统平台,包括:
模型获取模块,用以每隔预设时间,从权利要求1-7任一所述的模型的训练方法中的预设存储空间中,获取最新更新的模型;
预测模块,用以接收输入数据,并基于最新更新的模型对输入数据进行预测,得到预测结果。
13.一种电子终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7中任一所述的模型的训练方法,或实现如权利要求8-10中所述的基于模型的预测方法。
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的模型的训练方法,或实现如权利要求8-10中所述的基于模型的预测方法。
技术总结