本发明涉及一种基于全尺度特征感知和特征重构的无人机图像目标检测方法、系统及存储介质,属于计算机视觉。
背景技术:
1、无人机因其卓越的灵活性和多功能性而成为行业焦点。相较于遥感卫星,无人机可以通过灵活的飞行轨迹实现更密集、更精确的数据采集,这使其在智能交通、灾害管理和城市规划等领域得到了广泛的应用。
2、研究人员已经设计了许多方法用于目标检测任务。这些方法大致可分为两类:基于手工特征的传统方法和基于深度学习的目标检测模型。首先,手工设计的特征,如定向梯度直方图(hog)、haar、尺度不变特征变换(sift)和霍夫变换等,在简单场景中表现良好。然而,它们的泛化能力不足以处理涉及多个目标类别检测的复杂场景和任务。
3、目前,基于深度学习的算法的性能远远超过了传统的目标检测方法,并在无人机图像目标检测中得到了广泛应用。wan等提出了一种密度感知的小目标检测方法。该方法将前景和背景分离,提高了小目标检测的性能。zhang等通过自注意和卷积神经网络分别提取全局和局部信息,共同指导模型训练,削弱复杂背景的影响。chalavadi等提出了一种高效的目标检测网络msodanet,该网络使用分层卷积来学习多尺度多视角下不同目标的上下文信息。jin等提出了一种细粒度特征解纠缠的子模块,以应对无人机图像中视角和天气的变化。该方法将图像分解为域不变区域和域特定区域,提高了域的泛化能力和单域精度。du等提出了一种全局上下文增强的自适应稀疏卷积网络,改善了上下文信息不足和目标遮挡的问题。然而,由于无人机飞行高度不定,这使得其采集的图像中存在剧烈的尺度差异。而现有方法难以适应这种变化,导致检测精度较低。如何高效检测无人机视角下的各种尺度的目标仍然是一项具有挑战性的任务,因此亟须一种高效的无人机图像目标检测方法以解决上述问题。
技术实现思路
1、针对现有方法中存在的问题,本发明的目的在于提供一种基于全尺度特征感知和特征重构的无人机图像目标检测方法、系统及存储介质。
2、在本发明实施例的第一方面,提供了一种基于全尺度特征感知和特征重构的无人机图像目标检测方法,包括如下步骤:
3、s1:获取无人机航拍图像数据集;
4、s2:通过mosic、mixup对图像进行数据增强,并将其调整至预定分辨率;
5、s3:将处理后的图像输入到预设的特征提取网络中,提取五组不同尺度的特征图;
6、s4:通过预设的全尺度特征感知模块对不同尺度的特征图进行全尺度特征感知,得到三组全尺度感知特征;
7、s5:通过预设的特征重构模块对全尺度感知特征进行通道拆解、通道特征重构和空间特征重构,获得重构特征;
8、s6:通过预设的空间引导重建模块对特征提取网络中最后一层特征图进行超分辨率重建,并通过并行分支引入空间上下文信息对重建过程进行引导,获得空间引导重建结果;
9、s7:利用双向特征融合模块对所述的重构特征和空间引导重建结果进行多尺度特征融合;
10、s8:将融合结果输入到预设的检测头,然后计算目标的预测框位置,在此过程中,结合置信度损失、分类损失和回归损失,计算预测框与真实标签之间的重合度;
11、s9:模型训练完成后将其部署至无人机平台。
12、进一步地,所述的通过预设的全尺度特征感知模块对不同尺度的特征图进行全尺度特征感知,包括:
13、获取特征提取网络提取的五组多尺度特征,记其为c1-c5;
14、以这五组多尺度特征为基础,在其上构建三组全尺度特征感知模块;
15、三组全尺度特征感知模块分别以c2,c3,c4作为参考特征;
16、每一个全尺度特征感知模块将除参考特征之外的其余特征图进行尺度适配,使其与参考特征图一致;
17、将适配结果和参考特征图进行级联,经由通道缩减和信息融合,得到全尺度感知特征。
18、进一步地,所述的特征重构模块,包括:
19、以所述的全尺度感知特征作为输入,按通道将其拆解为8个独立的子级特征;
20、对每个子级特征使用均值池化和最大值池化获得对应池化结果;
21、通过1×1卷积对获得的两组池化结果进行隐式变换,并通过relu激活函数引入非线性因子;
22、将两组向量逐元素相加,获得每个子级特征上的通道特征;
23、对所有子级特征进行重塑组合,并通过sigmoid将重塑后的特征隐射至[0,1],得到通道重构权值;
24、将获得的通道重构权值乘以输入特征得到通道重构结果;
25、以通道重构结果作为输入进行二次拆解,得到8个独立的子级特征;
26、对每个子级特征沿着通道轴使用均值池化和最大值池化,并将池化结果拼接以获得空间信息;
27、将子级特征重塑为整体;通过卷积运算将整体特征压缩至一个通道;
28、通过sigmoid将其隐射至[0,1]获得空间重构权重;
29、将空间重构权重乘以输入特征以获得空间重构结果。
30、进一步地,所述的空间引导重建模块,包括:
31、将所述预设的特征提取网络所提取的最后一层特征图作为所述空间引导重建模块的输入;
32、通过卷积将输入特征图的通道数扩展4倍,并通过模型训练对扩展的通道元素进行更新,并将这些元素重新排列至宽高维度中,重排过程如下:
33、假设输入特征通道数为c,扩展后的通道数为4c;
34、将扩展后的通道分成c组,每组包含4个通道,每个通道组内包含了扩展后特征图的部分通道信息;
35、对于每个通道组,取其中所有通道上的第一个元素,将这些元素顺序排列作为第一个子区域;然后取所有通道上的第二个元素,并顺序排列作为第二个子区域;以此类推;
36、将所有的子区域拼接,完成重排;
37、重排后的特征图将扩展的通道信息重组到宽高维度上,实现了输入特征的超分辨率重建;
38、通过水平和垂直方向上进行两次线性插值,估算目标位置上的像素,获得输入特征的插值上采样结果;
39、将超分辨率重建结果和插值上采样结果融合,得到空间引导重建结果。
40、进一步地,所述损失函数整体计算公式如下:
41、loss=alossobj+blossrect+closscls
42、式中lossobj,lossrect,losscls分别表示置信度损失、回归损失、分类损失。a,b,c表示不同损失所占权重。
43、本发明实施例的第二方面,提供了一种基于全尺度特征感知和特征重构的无人机图像目标检测系统,包括:
44、图像采集单元,负责捕获无人机航拍图像;
45、特征提取单元,负责对输入图像进行特征提取,得到多尺度特征;
46、全尺度感知单元,负责通过全尺度感知模块对多尺度特征进行特征增强,得到全尺度感知特征;
47、特征重构单元,负责对全尺度感知特征进行拆分、通道特征重构和空间特征重构,得到重构结果;
48、特征重建单元,负责对输入特征通过预设规则进行超分辨率重建和插值上采样,并将两种结果结合,得到空间引导重建结果;
49、特征融合单元,负责将重构结果和空间引导重建结果进行特征融合;
50、目标检测单元,负责将特征融合结果送入检测头,执行目标检测操作,并输出可视化的检测结果;
51、控制单元,负责将可视化检测结果传送至无人机控制端,为系统操作者提供实时的目标识别信息,以便其做出相应决策。
52、本发明实施例的第三方面,提供了一种基于全尺度特征感知和特征重构的无人机图像目标检测终端设备,包括输入设备、输出设备、处理器、和存储器,其中,所述存储器用于存储可在所述处理器运行的计算机程序,所述处理器用于执行计算机程序实现如本发明实施例的第一方面所述方法的步骤。
53、本发明实施例的第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述的计算机程序被处理器执行时执行本发明实施例的第一方面所述方法的步骤。
54、相对于现有技术,本发明的优点和积极效果在于:本发明提供了一种全尺度特征感知模块,用以提高模型对无人机图像中不同尺度目标的感知能力;本发明设计了一种特征重构模块,对全尺度感知特征进行进一步优化,提高了其特征相关性,并有效减少了冗余信息的干扰;本发明设计了一种空间引导重建模块,该模块通过将通道维度上的特征重组到宽高维度上,对输入特征图完成了超分辨率重建,并利用插值上采样结果和超分辨率重建结果结合,实现空间信息引导;本发明将模型部署至无人机平台,通过无人机摄像头采集地面图像,借助模型实现高效的目标检测,并根据检测结果对无人机进行有效控制,为无人机平台提供了强大的目标感知和响应能力。
1.一种基于全尺度特征感知和特征重构的无人机图像目标检测方法,其特征在于,至少包括如下步骤:
2.如权利要求1所述的基于全尺度特征感知和特征重构的无人机图像目标检测方法,其特征在于,所述的全尺度特征感知模块,包括:
3.如权利要求1所述的基于全尺度特征感知和特征重构的无人机图像目标检测方法,其特征在于,所述的特征重构模块,包括:
4.如权利要求1所述的基于全尺度特征感知和特征重构的无人机图像目标检测方法,其特征在于,所述的空间引导重建模块,包括:
5.如权利要求1所述的基于全尺度特征感知和特征重构的无人机图像目标检测方法,其特征在于,所述的置信度损失、分类损失和回归损失,包括:
6.基于全尺度特征感知和特征重构的无人机图像目标检测系统,其特征在于,包括:
7.一种基于全尺度特征感知和特征重构的无人机图像目标检测终端设备,其特征在于,包括输入设备、输出设备、处理器、和存储器,其中,所述存储器用于存储计算机程序,所述处理器用于执行计算机程序,实现如权利要求1-5任意一项所述的基于全尺度特征感知和特征重构的无人机图像目标检测方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述的计算机程序被处理器执行时执行如权利要求1-5中任意一项所述的基于全尺度特征感知和特征重构的无人机图像目标检测方法。
