基于监控场景下的行人目标检测方法、装置、设备及介质与流程

    专利2025-03-13  5


    本发明涉及数据处理,尤其涉及一种基于监控场景下的行人目标检测方法、装置、设备及介质。


    背景技术:

    1、近年来,金融安全一直是国家快速发展过程中的基本保障。银行作为金融交易的主要场所,具有人员密集、人员成分复杂,流动性大等特点,一旦发生特殊情况,其后果往往不堪设想。因此,各个银行网点也覆盖有大量的监控摄像头。其短时间内就会产生海量的数据,而每个相机下存在着各种复杂多样的监控行人目标,如果依赖于人工对各个行人目标进行检测和管理,则会造成增加管理成本、检测效率低下以及出错率高等问题。

    2、发明人在实现本发明的过程中,发现现有技术存在如下缺陷:目前,现有的目标检测算法在面对俯视图且人员较为密集、遮挡较多的情况时,往往存在较多的漏检错检的问题,检测的准确率比较低。


    技术实现思路

    1、本发明提供了一种基于监控场景下的行人目标检测方法、装置、设备及介质,以实现对人员数量和位置检测的准确率的提高。

    2、根据本发明的一方面,提供了一种基于监控场景下的行人目标检测方法,其中,包括:

    3、实时获取目标监控中的当前视频帧;

    4、将所述当前视频帧输入至预先训练好的人头点定位深度学习网络模型中进行人头点定位处理,得到所述当前视频帧中的各帧图像分别对应的至少一个行人头点位置;

    5、通过改进的目标检测算法,来获取所述当前视频帧中的各帧图像分别对应的行人包围框;

    6、通过各所述行人头点位置对所述行人包围框进行优化处理,得到行人目标检测包围框结果,以根据所述行人目标检测包围框结果来确定与所述当前视频帧对应的行人数量和行人位置。

    7、根据本发明的另一方面,提供了一种基于监控场景下的行人目标检测装置,其中,包括:

    8、当前视频帧获取模块,用于实时获取目标监控中的当前视频帧;

    9、行人头点位置确定模块,用于将所述当前视频帧输入至预先训练好的人头点定位深度学习网络模型中进行人头点定位处理,得到所述当前视频帧中的各帧图像分别对应的至少一个行人头点位置;

    10、行人包围框获取模块,用于通过改进的目标检测算法,来获取所述当前视频帧中的各帧图像分别对应的行人包围框;

    11、行人目标检测包围框结果确定模块,用于通过各所述行人头点位置对所述行人包围框进行优化处理,得到行人目标检测包围框结果,以根据所述行人目标检测包围框结果来确定与所述当前视频帧对应的行人数量。

    12、根据本发明的另一方面,提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现本发明任一实施例所述的一种基于监控场景下的行人目标检测方法。

    13、根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的一种基于监控场景下的行人目标检测方法。

    14、本发明实施例的技术方案,通过实时获取目标监控中的当前视频帧;将当前视频帧输入至预先训练好的人头点定位深度学习网络模型中进行人头点定位处理,得到当前视频帧中的各帧图像分别对应的至少一个行人头点位置;通过改进的目标检测算法,来获取当前视频帧中的各帧图像分别对应的行人包围框;通过各行人头点位置对行人包围框进行优化处理,得到行人目标检测包围框结果,以根据行人目标检测包围框结果来确定与当前视频帧对应的行人数量和行人位置。解决了对人员密集的场景下对人员检测存在漏检和误检的问题,提高了检测算法的精度,提高了人员数量和位置检测的准确率。

    15、应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。



    技术特征:

    1.一种基于监控场景下的行人目标检测方法,其特征在于,包括:

    2.根据权利要求1所述的方法,其特征在于,在所述通过各所述行人头点位置对所述行人包围框进行优化处理,得到行人目标检测包围框结果之后,还包括:

    3.根据权利要求1所述的方法,其特征在于,所述通过改进的目标检测算法,来获取所述当前视频帧中的各帧图像分别对应的行人包围框,包括:

    4.根据权利要求1所述的方法,其特征在于,在所述实时获取目标监控中的当前视频帧之前,还包括:

    5.根据权利要求4所述的方法,其特征在于,所述对所述历史视频帧的各帧历史图像进行数据预处理,得到各历史标准输入图像,包括:

    6.根据权利要求5所述的方法,其特征在于,所述将各所述历史标准输入图像输入至预先构建的初始人头点定位深度学习网络模型中进行模型的训练,并通过二分类交叉熵损失函数进行模型参数的修正,直至模型输出结果准确率满足预设的准确率阈值,则确定训练完成所述人头点定位深度学习网络模型,包括:

    7.根据权利要求6所述的方法,其特征在于,所述直至模型输出结果准确率满足预设的准确率阈值,则确定训练完成所述人头点定位深度学习网络模型,包括:

    8.一种基于监控场景下的行人目标检测装置,其特征在于,包括:

    9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-7中任一项所述的一种基于监控场景下的行人目标检测方法。

    10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现如权利要求1-7中任一项所述的一种基于监控场景下的行人目标检测方法。


    技术总结
    本发明公开了一种基于监控场景下的行人目标检测方法、装置、设备及介质。通过实时获取目标监控中的当前视频帧;将当前视频帧输入至预先训练好的人头点定位深度学习网络模型中进行人头点定位处理,得到当前视频帧中的各帧图像分别对应的至少一个行人头点位置;通过改进的目标检测算法,来获取当前视频帧中的各帧图像分别对应的行人包围框;通过各行人头点位置对行人包围框进行优化处理,得到行人目标检测包围框结果,以根据行人目标检测包围框结果来确定与当前视频帧对应的行人数量和行人位置。解决了对人员密集的场景下对人员检测存在漏检和误检的问题,提高了检测算法的精度,提高了人员数量和位置检测的准确率。

    技术研发人员:高松
    受保护的技术使用者:中国农业银行股份有限公司
    技术研发日:
    技术公布日:2024/4/29
    转载请注明原文地址:https://wp.8miu.com/read-83925.html

    最新回复(0)