一种目标检测模型的训练方法与流程

    专利2022-07-08  103


    本发明涉及计算机技术领域,尤其涉及一种目标检测模型的训练方法。



    背景技术:

    近年来,随着深度学习技术的发展,以及硬件性能的提升,越来越多的计算机视觉任务比如目标检测、目标识别、跟踪、以图搜图等,都开始使用深度学习方案在服务器上进行计算。以目标检测为例,往往会存在一些不可避免的误检。这对一些对于准确率要求比较高的场景,比如物流场景中的快递分发、工厂中的故障分析及电梯中的梯控,如果准确率较低的情况下,会严重影响系统的正常运行,如工厂的生产效率、住户的乘梯体验等。

    以梯控场景中的电瓶车检测为例,由于现在的电瓶车样式繁多、且在狭小的空间中目标往往会存在人体杂物等遮挡的情况。实际应用中往往对于与其相似的自行车、儿童滑板车、玩具车等目标存在较多的误检。现有技术中这些以电瓶车入梯检测的方案往往只关注于系统的构建,并没有过多的去描述对于电瓶车的检测如何提升其准确率。

    例如,公开号为cn111612017a的中国专利,其通过修改深度学习网络,来提高网络对于特征提取和融合,以及结合语义信息来提升目标检测的准确率。这种方案虽然能够取得一定的准确率提升,但往往忽略了对于数据本身的处理,而且网络复杂度增加,计算效率随之降低,对于实时性要求比较高的应用场景,不具有使用价值。



    技术实现要素:

    本发明的目的在于提供一种目标检测模型的训练方法,解决目标检测模型计算负荷大且检测性能差的问题。

    为实现上述发明目的,本发明提供一种目标检测模型的训练方法,包括:

    s1.获取与不同目标相对应的初始图像数据集,并训练多个针对不同目标的单目标检测模型;

    s2.采用多个训练完成的所述单目标检测模型分别采集检测到的单目标图像并构建相应的第一图像数据集;

    s3.采用多个所述第一图像数据集训练并生成多目标检测模型。

    根据本发明的一个方面,还包括:

    s4.采用所述多目标检测模型采集检测到的不同目标图像并构建目标图像数据集,其中,所述目标图像数据集中针对不同的所述目标图像进行分类,划分成与所述目标图像种类相对应的第二图像数据集;

    s5.筛选满足设定的训练条件的所述第二图像数据集,将满足训练条件的所述第二图像数据集与所述第一图像数据集和所述初始图像数据集合并,并继续进行所述多目标检测模型的训练。

    根据本发明的一个方面,步骤s5中,将不满足训练条件的所述第二图像数据集作为负样本使用。

    根据本发明的一个方面,还包括:

    s6.对所述多目标检测模型进行测试,若满足预设条件,则将所述多目标检测模型发布至线上运行。

    根据本发明的一个方面,步骤s5中,筛选满足设定的训练条件的所述第二图像数据集的步骤中,包括:

    s51.选取多个所述第二图像数据集中的一个为参照数据集;

    s52.按照设定的训练条件分别将所述参照数据集与其余所述第二图像数据集进行比较,筛选出满足所述训练条件的所述第二图像数据集。

    根据本发明的一个方面,s52.按照设定的训练条件分别将所述参照数据集与其余所述第二图像数据集进行比较的步骤中,分别计算其余所述第二图像数据集中的目标图像数量与所述参照数据集中的目标图像数量的比例,若所述比例超过预定值,则判定为满足。

    根据本发明的一个方面,所述第二图像数据集中目标图像的数量至少为相应类别所述第一图像数据集中目标图像的数量的20%。

    根据本发明的一个方面,s52.按照设定的训练条件分别将所述参照数据集与其余所述第二图像数据集进行比较的步骤中,分别计算其余所述第二图像数据集中的目标图像数量与所述参照数据集中的目标图像数量的比例,若所述比例低于预定值,则将所述第二图像数据集作为负样本使用。

    根据本发明的一个方面,步骤s1中,获取与不同目标相对应的初始图像数据集,并训练多个针对不同目标的单目标检测模型的步骤中,包括:

    s1.收集不同目标的目标图像并构成初始图像数据集;

    s2.基于所述初始图像数据集,以及采用目标检测网络分别获取针对不同所述目标的单目标检测模型。

    根据本发明的一个方面,所述单目标检测模型的骨干网络为darknet19;

    所述多目标检测模型的骨干网络为darknet53。

    根据本发明的一种方案,先通过少量数据训练一个简单的单目标检测模型,然后使用该单目标检测模型来收集实际检测过程中容易误检的目标,将误检目标数据当做对应的独立类别来检测或者增加到负样本中,来提升多目标检测模型的准确率。通过上述过程,使得根据本方案所生成的目标检测模型在不增加计算负荷的情况下,显著提升了检测性能,非常有效的便于其在终端部署,检测效率高、运行快。

    根据本发明的一种方案,本发明的训练方法所使用的数据量少,网络简单且精度高,进而其实时性更优,适用范围广。

    附图说明

    图1是示意性表示根据本发明的一种实施方式的训练方法的步骤框图。

    具体实施方式

    为了更清楚地说明本发明实施方式或现有技术中的技术方案,下面将对实施方式中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本发明的一些实施方式,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

    在针对本发明的实施方式进行描述时,术语“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”所表达的方位或位置关系是基于相关附图所示的方位或位置关系,其仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此上述术语不能理解为对本发明的限制。

    下面结合附图和具体实施方式对本发明作详细地描述,实施方式不能在此一一赘述,但本发明的实施方式并不因此限定于以下实施方式。

    如图1所示,根据本发明的一种实施方式,本发明的目标检测模型的训练方法,包括:

    s1.获取与不同目标相对应的初始图像数据集,并训练多个针对不同目标的单目标检测模型;

    s2.采用多个训练完成的单目标检测模型分别采集检测到的单目标图像并构建相应的第一图像数据集;

    s3.采用多个第一图像数据集训练并生成多目标检测模型。

    如图1所示,根据本发明的一种实施方式,步骤s1中,训练多个针对不同目标的单目标检测模型的步骤中,包括:

    s11.收集不同目标的目标图像并构成初始图像数据集;在本实施方式中,以识别电瓶车为例,在实际应用场景中,收集包含电瓶车、自行车、平衡车、滑板车、婴儿车、玩具车、平板车等容易和电瓶车混淆的不同目标的目标图像。在本实施方式中,可收集3万张包含这些目标的图像数据,并混合后构成初始图像数据集。

    s12.基于初始图像数据集,以及采用目标检测网络分别获取针对不同目标的单目标检测模型。在本实施方式中,在前述步骤中已经收集完成初始图像数据集后,通过采用目标检测网络对初始图像数据集及逆行是被训练。在本实施方式中,目标检测网络可采用yolov3。通过目标检测网络的训练后分别生成了针对识别不同目标的单目标检测模型,该单目标检测模型仅执行对单一类型的目标的检测。在本实施方式中,单目标检测模型使用的骨干网络为darknet19。通过将单目标检测模型选用darknet19可实现训练样本少,避免过拟合的效果。

    如图1所示,根据本发明的一种实施方式,步骤s2中,将单目标检测模型(称为model-p)接入实际的电梯数据,收集并检测相应的目标获取包含各目标图像的第一图像数据集。在本实施方式中,单目标检测模型在阈值0.2条件下,检出率0.97。

    如图1所示,根据本发明的一种实施方式,步骤s3中,利用各第一图像数据集进行多目标检测模型(称为model-m)训练并输出该多目标检测模型(称为model-m)。在本实施方式中,多目标检测模型的骨干网络为darknet53。

    如图1所示,根据本发明的一种实施方式,本发明的目标检测模型的训练方法,还包括:

    s4.采用多目标检测模型采集检测到的不同目标图像并构建目标图像数据集,其中,目标图像数据集中针对不同的目标图像进行分类,划分成与目标图像种类相对应的第二图像数据集;在本实施方式中,使用较小的目标检测阈值,使得当前数据收集模型检出率大于0.95。在本实施方式中,第二图像数据集中目标图像的数量至少为相应类别第一图像数据集中目标图像的数量的20%。如果前述步骤是第一次使用单目标检测模型,该步骤收集的第二图像数据集的数据量等于小样本模型数据集的数据量。

    s5.筛选满足设定的训练条件的第二图像数据集,将满足训练条件的第二图像数据集与第一图像数据集和所述初始图像数据集合并,并继续进行多目标检测模型的训练。在本实施方式中,通过对合并后的数据集进行进一步的多类别标注后用于多目标模型的训练,实现了对多目标检测模型的更新,进而其目标检测阈值也在不断调整,使检出率始终大于0.95且大于检准率。

    在本实施方式中,步骤s5中,筛选满足设定的训练条件的第二图像数据集的步骤中,包括:

    s51.选取多个第二图像数据集中的一个为参照数据集;

    s52.按照设定的训练条件分别将参照数据集与其余第二图像数据集进行比较,筛选出满足训练条件的第二图像数据集,并将不满足训练条件的第二图像数据集作为负样本使用。

    在本实施方式中,分别计算其余第二图像数据集中的目标图像数量与参照数据集中的目标图像数量的比例,若比例超过预定值,则判定为满足。例如,统计当前数据集中每个类别目标数量,以电瓶车的目标数量为基准,如果某类目标框数量大于电瓶车目标框数量的一定比例(例如比例为5%),则将该类目标加入多类别目标检测模型中训练,否则该类目标仅当做负样本;然后使用重新整理后的数据集训练多类目标检测模型;其中解码图像数据是指从视频流中解码的图像数据;

    在本实施方式中,分别计算其余第二图像数据集中的目标图像数量与参照数据集中的目标图像数量的比例,若比例低于预定值,则将第二图像数据集作为负样本使用。例如,对于模型更新得到的数据集,进行进一步清理,将目标框数量小于电瓶车目标框数量一定值(例如比例为10%)的类别当做负样本,其余当做独立的目标。形成[电瓶车,类别1,类别2,…]的检测数据集。

    在本实施方式中,通过重复步骤s4至s5实现对多目标检测模型的更新,直到其检测结果满足设定的判断条件后停止。在本实施方式中,在重复步骤s4至s5的过程中,第二图像数据集中目标图像的数量至少为相应类别第一图像数据集中目标图像的数量的20%。

    如图1所示,根据本发明的一种实施方式,本发明的目标检测模型的训练方法,还包括:

    s6.对多目标检测模型进行测试,若满足预设条件,则将多目标检测模型发布至线上运行。

    将上一步训练好的多目标检测模型,接入实际的电梯场景数据,抓取检测到的目标样本图像,每个类别的目标图像不少于特定数量(例如,5000张),然后判断实际数据的误检率是否和该模型测试集上误检率一致。在本实施方式中,判断实际场景抓取的数据的误检率是否和测试机误检率一致的步骤框中包括,如果一致,则停止迭代,否则重复数据收集步骤。

    需要注意的是,目标检测网络yolov3由两部分组成,分别为特征提取的骨干网络和做预测的head网络。

    在本发明中,以电梯梯控中的电瓶车检测为例,先通过少量数据训练一个简单的电瓶车检测网络,然后使用该网络来收集实际检测过程中容易误检的目标,将误检目标数据当做对应的独立类别来检测或者增加到负样本中,来提升电瓶车检测的准确率,实现了在不增加计算负荷的情况下,显著提升检测性能。

    上述内容仅为本发明的具体方案的例子,对于其中未详尽描述的设备和结构,应当理解为采取本领域已有的通用设备及通用方法来予以实施。

    以上所述仅为本发明的一个方案而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。


    技术特征:

    1.一种目标检测模型的训练方法,包括:

    s1.获取与不同目标相对应的初始图像数据集,并训练多个针对不同目标的单目标检测模型;

    s2.采用多个训练完成的所述单目标检测模型分别采集检测到的单目标图像并构建相应的第一图像数据集;

    s3.采用多个所述第一图像数据集训练并生成多目标检测模型。

    2.根据权利要求1所述的训练方法,其特征在于,还包括:

    s4.采用所述多目标检测模型采集检测到的不同目标图像并构建目标图像数据集,其中,所述目标图像数据集中针对不同的所述目标图像进行分类,划分成与所述目标图像种类相对应的第二图像数据集;

    s5.筛选满足设定的训练条件的所述第二图像数据集,将满足训练条件的所述第二图像数据集与所述第一图像数据集和所述初始图像数据集合并,并继续进行所述多目标检测模型的训练。

    3.根据权利要求2所述的训练方法,其特征在于,步骤s5中,将不满足训练条件的所述第二图像数据集作为负样本使用。

    4.根据权利要求3所述的训练方法,其特征在于,还包括:

    s6.对所述多目标检测模型进行测试,若满足预设条件,则将所述多目标检测模型发布至线上运行。

    5.根据权利要求2至4任一项所述的训练方法,其特征在于,步骤s5中,筛选满足设定的训练条件的所述第二图像数据集的步骤中,包括:

    s51.选取多个所述第二图像数据集中的一个为参照数据集;

    s52.按照设定的训练条件分别将所述参照数据集与其余所述第二图像数据集进行比较,筛选出满足所述训练条件的所述第二图像数据集。

    6.根据权利要求5所述的训练方法,其特征在于,s52.按照设定的训练条件分别将所述参照数据集与其余所述第二图像数据集进行比较的步骤中,分别计算其余所述第二图像数据集中的目标图像数量与所述参照数据集中的目标图像数量的比例,若所述比例超过预定值,则判定为满足。

    7.根据权利要求6所述的训练方法,其特征在于,所述第二图像数据集中目标图像的数量至少为相应类别所述第一图像数据集中目标图像的数量的20%。

    8.根据权利要求5所述的训练方法,其特征在于,s52.按照设定的训练条件分别将所述参照数据集与其余所述第二图像数据集进行比较的步骤中,分别计算其余所述第二图像数据集中的目标图像数量与所述参照数据集中的目标图像数量的比例,若所述比例低于预定值,则将所述第二图像数据集作为负样本使用。

    9.根据权利要求1至4任一项所述的训练方法,其特征在于,步骤s1中,获取与不同目标相对应的初始图像数据集,并训练多个针对不同目标的单目标检测模型的步骤中,包括:

    s1.收集不同目标的目标图像并构成所述初始图像数据集;

    s2.基于所述初始图像数据集,以及采用目标检测网络分别获取针对不同所述目标的单目标检测模型。

    10.根据权利要求9所述的训练方法,其特征在于,所述单目标检测模型的骨干网络为darknet19;

    所述多目标检测模型的骨干网络为darknet53。

    技术总结
    本发明涉及一种目标检测模型的训练方法,包括:S1.获取与不同目标相对应的初始图像数据集,并训练多个针对不同目标的单目标检测模型;S2.采用多个训练完成的所述单目标检测模型分别采集检测到的单目标图像并构建相应的第一图像数据集;S3.采用多个所述第一图像数据集训练并生成多目标检测模型。本发明的训练方法所使用的数据量少,网络简单且精度高,进而其实时性更优,适用范围广。

    技术研发人员:张奎;陈清梁;王超
    受保护的技术使用者:浙江新再灵科技股份有限公司
    技术研发日:2020.11.16
    技术公布日:2021.03.12

    转载请注明原文地址:https://wp.8miu.com/read-19274.html

    最新回复(0)