本发明涉及计算机视觉中的视频分析,具体为一种站台屏蔽门与地铁车门之间的人员及异物检测方法。
背景技术:
1、随着城市交通的不断发展,地铁系统已经成为人们生活中不可或缺的一部分。然而,地铁站台门与车门夹缝间隙的安全问题成为当前地铁系统亟需解决的挑战之一。在高峰时段,地铁站台区域可能会拥挤,人员密集,使得夹缝间隙容易成为事故的隐患。此外,异物(如行李、垃圾等)也可能掉落到夹缝间隙中,引发安全隐患。
2、传统的地铁站台门与车门夹缝间隙监测方法主要依赖于传感器技术,如红外传感器、激光雷达等。然而,这些传感器在处理人员与异物检测时存在一些困难。首先,传统传感器对于复杂场景下的人体与异物识别精度较低,容易受到光照、阴影等因素的干扰。其次,传感器通常需要大量的人工设置和调整,无法自适应不同地铁站台环境。此外,现有技术在处理异物掉落时的响应速度较慢,难以及时发现并采取措施,导致安全隐患。车门夹缝间隙区域较小,位置特殊,如果只用普通的目标检测算法,如yolov,很有可能造成误检和漏检。
3、显著目标检测旨在分割图像中最具视觉吸引力的目标。它被广泛应用于许多领域,如视觉跟踪和图像分割。近年来,随着深度卷积神经网络(cnn)的发展,特别是全卷积网络(fcn)在图像分割领域的兴起,显著目标检测得到了显著提升。u-net已成为事实上的选择,它作为一种深度学习网络,对于图像分割任务具有卓越的性能。它由一个对称的编码器-解码器组成,以增强细节保留。
4、尽管具有出色的表现能力,但由于卷积操作的固有局部性,基于cnn的方法通常在建模显示远程关系方面表现出局限性,因此,这些架构通常产生较弱的性能。
5、为了克服这一局限性,已经有研究提出建立基于cnn的特征注意力机制。另一方面,为序列到序列预测而设计的transforemr已成为替代架构,transformer不仅在建模全局上下文方面功能强大,而且在大规模预训练下对下游任务标新出优越的可转移性。其成功在机器翻译和自然语言处理(nlp)领域得到了广泛的见证。最近,在各种图像识别任务上的尝试也达到甚至超过了最先进的性能。
技术实现思路
1、本发明公开了一种站台屏蔽门与地铁车门之间的人员及异物检测方法,以解决传统监控系统在地铁站台门与车门夹缝间隙人员和异物检测方面的不足,如对复杂场景的理解能力不足、受到光照变化和人流密集等因素的干扰,以及在异物检测方面的限制的问题。
2、为实现上述目的,本发明提供如下技术方案:一种站台屏蔽门与地铁车门之间的人员及异物检测方法,包括以下步骤:
3、s1、首先,从地铁站台门与车门夹缝处采集高质量的视频数据;
4、s2、然后,对采集到的视频数据进行预处理,且将视频帧分解为图片序列,为后续时序信息处理做准备;
5、s3、采用双u2-net结构进行视频分析,其中每个u2-net是为显著目标检测设计的两层嵌套结构,不依赖任何来自图像分类的预训练主干;其中,双u2-net结构包括:
6、第一个u-net接收预处理后的视频帧,通过卷积和池化操作提取夹缝间隙的特征,实现夹缝定位和分割;
7、第二个u-net在感兴趣的区域内进一步识别和分类人员以及异物;在目标区域内进行深度学习分析,识别人员和异物;
8、s4、引入transformer算法处理视频帧之间的时序信息,提高检测的准确性和鲁棒性;通过自注意力机制,系统将捕捉夹缝间隙内目标的时序关系,确保在不同时间段的监测结果的准确性;使用平均绝对误差来作为评价指标,表示预测显著性图与其实际掩模之间每个像素差异的平均值;
9、s5、最终,结合u-net和transformer的输出,进行异物检测,提高检测的精度和可靠性,在获取到检测结果后,将检测结果分类,并将分类结果进行输出。
10、优选的,步骤s1中,所述视屏数据包括不同光照条件、人流密集程度和夹缝间隙状态的场景,以确保系统对各种情况都具有鲁棒性。
11、优选的,步骤s2中,所述预处理包括去除噪声、调整亮度和对比度。
12、优选的,通过采用双u2-net结构进行视频分析,则允许网络从零开始训练,以达到竞争力的性能,并允许网络深入,获得高分辨率,同时减少内存和成本。
13、优选的,所述网络的输出包括夹缝间隙内各个目标的位置信息。
14、优选的,步骤s4中,检测结果包括夹缝间隙状态、人员位置以及异物信息。
15、优选的,步骤s5中,所述平均绝对误差定义为:
16、其中p和g分别是显著目标检测的概率图和对应的真实标签值,(h,w)和(r,c)分别是(高度,宽度)和像素坐标。
17、优选的,步骤s5中,通过mobilenetv3网络对目标分类,获取的分类结果包括三种输出,分别是检测到人、检测到物品、没有检测到人或物品。
18、与现有技术相比,本发明的有益效果:
19、1、本发明采用双u2-net结构能够有效地捕捉复杂场景中夹缝间隙的关键特征,提高监测的精度和实时性;其次,引入transformer算法有助于更好地处理视频帧之间的时序关系,使得夹缝间隙的监测在不同时间段更为准确和可靠;最后,本发明的算法结合深度学习和视频分析,能够更灵敏地识别异物,避免误报和漏报,提高异物检测的精度和可靠性。
20、2、本发明中提出了u2-net+transformer框架,克服了传统方法的局限性,实现对地铁站台门与车门夹缝间隙的高效监测,保障乘客的安全,同时提高异物检测的灵敏度和准确性;并在提高地铁系统安全性和运行效率方面具有重要的实际应用价值。
1.一种站台屏蔽门与地铁车门之间的人员及异物检测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种站台屏蔽门与地铁车门之间的人员及异物检测方法,其特征在于:步骤s1中,所述视屏数据包括不同光照条件、人流密集程度和夹缝间隙状态的场景。
3.根据权利要求1所述的一种站台屏蔽门与地铁车门之间的人员及异物检测方法,其特征在于:步骤s2中,所述预处理包括去除噪声、调整亮度和对比度。
4.根据权利要求1所述的一种站台屏蔽门与地铁车门之间的人员及异物检测方法,其特征在于:通过采用双u2-net结构进行视频分析,则允许网络从零开始训练,以达到竞争力的性能,并允许网络深入,获得高分辨率,同时减少内存和成本。
5.根据权利要求4所述的一种站台屏蔽门与地铁车门之间的人员及异物检测方法,其特征在于:所述网络的输出包括夹缝间隙内各个目标的位置信息。
6.根据权利要求1所述的一种站台屏蔽门与地铁车门之间的人员及异物检测方法,其特征在于:步骤s4中,检测结果包括夹缝间隙状态、人员位置以及异物信息。
7.根据权利要求1所述的一种站台屏蔽门与地铁车门之间的人员及异物检测方法,其特征在于:步骤s5中,所述平均绝对误差定义为:其中p和g分别是显著目标检测的概率图和对应的真实标签值,(h,w)和(r,c)分别是(高度,宽度)和像素坐标。
8.根据权利要求1所述的一种站台屏蔽门与地铁车门之间的人员及异物检测方法,其特征在于:步骤s5中,通过mobilenetv3网络对目标分类,获取的分类结果包括三种输出,分别是检测到人、检测到物品、没有检测到人或物品。