本发明属于深度学习技术领域,特别涉及一种面向似六边形弹孔智能识别检测的数据集扩增方法,可为似六边形弹孔智能识别检测提供丰富的数据集。
背景技术:
随着军事现代化的迅速发展,弹药的快速效能评估得到了越来越高的关注,弹孔的数量及形状是效能评估的一类重要参考因素。传统的评估方法多基于人工评估,带来的缺点是评估范围小,评估时间长以及效率低和漏检等等。为解决人工评估带来的各式弊端,基于人工智能的物体检测,训练智能识别模型,对打击范围的特定似六边形弹孔进行智能快速识别,有望逐步取代人工评估,成为主流方法。
近些年来,基于人工智能的物体检测在各式缺陷识别和物体标记等方面,有着广泛的适应范围和丰富的成熟样例,但识别模型的训练过程需要大量的物体样本进行前提支撑,而特定似六边形弹孔人工取样的数量有限且难以成倍扩增。为将基于人工智能的物体检测模型应用于实际的靶场等环境中,则必须提供足够数量的物体原始数据,以保证为模型的顺利训练及生成。
技术实现要素:
为了克服现有技术中的不足,本发明人进行了锐意研究,提供了一种面向似六边形弹孔智能识别检测的数据集扩增方法,在有限的原始样本数据集的情况下,能够对原始数据集进行多倍有效扩增,从各个检测角度平衡了数据集,基于扩增后数据集训练的识别模型鲁棒性得到提升,能够有效地解决识别过程中过拟合和召回率低等缺点,从而完成本发明。
本发明提供的技术方案如下:
一种面向似六边形弹孔智能识别检测的数据集扩增方法,包括如下步骤:
s1,人工获取小批量的原始航拍数据集originaldata;
s2,对原始数据集进行预处理,包括图片像素统一化和弹孔目标标注,得到预处理数据集data0;
s3,基于预处理数据集data0,进行模糊操作,然后通过旋转、裁剪、平移和翻转操作进行扩增,得到扩增后的数据集data1;
s4,剔除数据集data1中的负样本;
s5,基于数据集data1,对hsv参数值进行调整,得到扩增数据集data2;
s6,基于数据集data2,对标注弹孔的像素范围区间进行蒙版裁剪,得到纯净的目标物数据集target0;
s7,基于目标物数据集target0进行缩放操作得到目标物数据集target1;
s8,基于目标缩放图像数据集target1,使用锚点滑窗策略扩增得到目标物数据集target2;
s9,对data0、data1、data2、target0、target1和target2实施图片像素统一化;
s10,整合图片像素统一化后的data0、data1、data2、target0、target1和target2,得到扩增数据集dataaugment。
根据本发明提供的一种面向似六边形弹孔智能识别检测的数据集扩增方法,具有以下有益效果:
本发明提供的一种面向似六边形弹孔智能识别检测的数据集扩增方法,在有限原始数据集的情况下,进行数据集扩增,使用本发明中扩增策略,使得训练所用数据集更加全面、均衡,具备泛化能力,减小过拟合和梯度爆炸,提高模型的鲁棒性。
附图说明
图1为本发明中一种面向似六边形弹孔智能识别检测的数据集扩增方法流程图;
图2为对原始数据集进行像素统一化后效果图;
图3为目标物缩放操作得到的尺寸金字塔;
图4为扩增数据后的识别效果图。
具体实施方式
下面通过对本发明进行详细说明,本发明的特点和优点将随着这些说明而变得更为清楚、明确。
本发明提供了一种面向似六边形弹孔智能识别检测的数据集扩增方法,如图1所示,包括如下步骤:
s1,人工获取小批量的原始航拍数据集originaldata;
s2,对原始数据集进行预处理,主要操作包括图片像素统一化,并进行弹孔目标标注,得到预处理数据集data0;
s3,基于预处理数据集data0,进行模糊操作,然后通过旋转、裁剪、平移和翻转操作进行扩增,得到扩增后的数据集data1;
s4,剔除数据集data1中的负样本;
s5,基于数据集data1,对hsv参数值进行调整,得到扩增数据集data2;
s6,基于数据集data2,对标注弹孔的像素范围区间进行蒙版裁剪,得到纯净的目标物数据集target0;
s7,基于目标物数据集target0进行缩放操作,得到目标物数据集target1;
s8,基于目标缩放图像数据集target1得到尺寸金字塔,使用锚点(anchor)和滑窗(slidewindow)策略扩增得到目标物数据集target2;
s9,对data0、data1、data2、target0、target1和target2实施图片像素统一化;
s10,整合图片像素统一化后的data0、data1、data2、target0、target1和target2,得到扩增数据集dataaugment。
在本发明中,s1步骤中,人工获取小批量含似六边形弹孔目标图像的原始航拍数据集originaldata。原始图片中弹孔目标范围大小在10×10~25×25像素之间;若弹孔目标范围过小,则加大机器学习难度,准确性受影响,若弹孔目标范围过大,训练模型所需要的样本图片过多,时效性差。
在本发明中,s2步骤中,考虑到拍摄图片存在像素分辨率不一致的情况,为尽可能降低模型训练过程因图片尺寸不一致带来的影响,对图片像素统一化,具体为:筛选出宽和高最大分辨率的图像尺寸作为模板,对未达到最大分辨率的图片进行黑边补充操作,黑边位于上端或右端等任意一端或多端,最终实现所有原始图片的像素统一化。黑边补充后的图片如图2所示。
s2步骤中,弹孔目标标注仅限于对图片中所有清晰的目标物进行标记,得到标注文件和预处理数据集data0。弹孔目标标注操作可先于像素统一化操作,或者在像素统一化后实施。
在本发明中,s3步骤中,基于预处理数据集data0,首先采取高斯模糊操作减少图片中的小阴影和小土块等小尺寸噪点的影响,高斯模糊操作的内核选择3*3像素。
然后,为增强数据集的单环境多样性,采用旋转、裁剪、平移和翻转等操作进行扩增,其中,所述旋转是指绕图片中心进行0~360°旋转;所述裁剪是指对图片进行水平方向或垂直方向的裁剪,并采用黑边补充裁剪区域至原尺寸;所述平移是指对图片进行水平方向或垂直方向的平移,平行方向相对侧采用黑边补充至原尺寸;所述翻转是指绕图片的对称轴进行镜像转换。
进一步地,所述旋转在0~360°的区间内随机选择旋转角度,所述翻转在0~1的概率区间选择是否随机水平或垂直翻转,所述平移在宽高长度的-0.5~0.5倍区间选择是否随机水平或垂直平移,所述裁剪在宽高长度的-0.2~0.2倍区间选择是否随机水平或垂直裁剪。
进一步地,对翻转、旋转、平移和裁剪四类操作分别给予一个随机概率因子(如20%、5%、20%、25%),并打乱四类操作的顺序,最终得到在单环境(例如拍摄环境)下,有效提升样本多样性的扩增数据集data1。
在本发明中,s4步骤中,剔除数据集data1的负样本。旋转、平移和裁剪操作中,虽然增加了样本数量,但在一定情况下,会出现目标物部分区域不在图片范围内,或目标物被裁剪过多的情况。如果使用这些情况下的目标物标记尺寸去训练模型,会导致模型的识别效果降低,故需要设置一个阈值进行负样本剔除。
s4步骤中,采用交并比iou1作为判断是否为负样本的评测指标。
阈值设定在0.60~0.80的区间内选取,保留两位小数。在数据集data1中iou1低于该阈值的目标物标记属于负样本,予以剔除,得到终版数据集data1。
在本发明中,s5步骤中,基于有较好单环境适应性且剔除负样本的数据集data1,为增强数据集的多环境适应性(例如晴天、阴天和不同试验场地),对hsv等参数值进行一定程度操作进行数据扩增:在有效的饱和度(saturation)、明度(value)和色调(hue)范围内,对每张图片进行不同亮度(高亮度(晴天)、低亮度(阴天)和极低亮度(黄昏)等)和不同颜色背景(绿色(绿色草地)、白色(白色水泥地)和黄色(黄色砂石地)等)的数据扩增操作,得到具有较好多环境适应性的数据集data2。
在本发明中,s6步骤中,原始标注的弹孔尺寸相对于图片整体尺寸来说属于小目标,为提高训练模型的准确率和召回率,拟采用多尺度(multiscale)训练,那么反过来对于数据集的要求则是需要通过缩放操作扩增得到不同尺寸的弹孔目标图片。
如果对整幅图片进行缩放,存在一定的可能性,将模糊操作未剔除的小噪点尺寸放大,识别为fp(falsepositive),但事实上是负样本。
为了减少目标物以外环境的干扰,现对标注弹孔的像素范围区间进行蒙版裁剪,得到纯净的目标物数据集target0。
在本发明中,s7步骤中,基于目标物数据集target0进行缩放操作。考虑到单孔目标为小尺寸,故缩放操作中,放大扩增部分应远大于缩小扩增部分,本发明设计的缩放数组比例为[0.8,1.5,2.0,2.5,3.0],得到目标物缩放数据集target1。
在本发明中,s8步骤中,基于目标物缩放数据集target1,整理得到尺寸金字塔(图3),使用锚点(anchor)和滑窗(slidewindow)策略扩增得到目标物数据集target2。
在不同目标物尺寸的图像中,以左上角像素点为中心,滑窗从左向右从上到下依次滑动;滑窗的宽度w可在(0.7w~0.9w)的区间内选取,滑窗的高度h可在(0.7h~0.9h)的区间内选取,选择完毕对w和h进行向下取整操作;步幅stride可以在(1,2,3)的整数数组内选取。
对样本进行筛选,在0.60~0.80的区间内选取阈值,保留两位小数,
阈值超过iou2的取为正样本,并裁减保存,最后将本步骤中所有正样本组合成目标物数据集target2。
在本发明中,s9步骤中,对data0、data1、data2、target0、target1和target2实施图片像素统一化包括:对数据集target0、target1和target2进行黑边补充操作,使数据集target0、target1和target2图片像素与数据集data0、data1、data2中图像像素一致。
本发明数据集扩增方法,可在有限原始数据集的情况下,进行数据集扩增,在各个客观方向均存在不同数量的扩增数据,同时存在不同背景下的样本,可以模拟各类天气环境下的采样现场,从各个角度平衡了数据集,使得训练所用数据集更加全面、均衡,具备泛化能力,减小过拟合和梯度爆炸,提高模型的鲁棒性和训练效果。
实施例
实施例1
未扩增数据前,训练模型在测试集中的精度表(基于pytorch平台,评判指标’bbox’):
表1
扩增数据后,训练模型在测试集中的精度表(基于pytorch平台,评判指标’bbox’):
表2
对比表1和表2,可以看出扩增数据集后,训练模型的性能提升主要在以下两个方面:
目标物框选更为精确:未扩增前,识别框和真实框的iou在满足0.5的要求下的识别精度仅为0.478;扩增后,相同条件下,框选精度提升至0.990,提高约1倍,图4示出扩增数据后的识别效果图。
精度和召回率得到提升:识别框和真实框的iou在0.50~0.95的范围内,平均精度和召回率由0.165和0.452分别提升至0.715和0.755,分别提高约3.3和0.6倍。
以上结合具体实施方式和范例性实例对本发明进行了详细说明,不过这些说明并不能理解为对本发明的限制。本领域技术人员理解,在不偏离本发明精神和范围的情况下,可以对本发明技术方案及其实施方式进行多种等价替换、修饰或改进,这些均落入本发明的范围内。本发明的保护范围以所附权利要求为准。
本发明说明书中未作详细描述的内容属本领域技术人员的公知技术。
1.一种面向似六边形弹孔智能识别检测的数据集扩增方法,其特征在于,包括如下步骤:
s1,人工获取小批量的原始航拍数据集originaldata;
s2,对原始数据集进行预处理,包括图片像素统一化和弹孔目标标注,得到预处理数据集data0;
s3,基于预处理数据集data0,进行模糊操作,然后通过旋转、裁剪、平移和翻转操作进行扩增,得到扩增后的数据集data1;
s4,剔除数据集data1中的负样本;
s5,基于数据集data1,对hsv参数值进行调整,得到扩增数据集data2;
s6,基于数据集data2,对标注弹孔的像素范围区间进行蒙版裁剪,得到纯净的目标物数据集target0;
s7,基于目标物数据集target0进行缩放操作,得到目标物数据集target1;
s8,基于目标缩放图像数据集target1,使用锚点滑窗策略扩增得到目标物数据集target2;
s9,对data0、data1、data2、target0、target1和target2实施图片像素统一化;
s10,整合图片像素统一化后的data0、data1、data2、target0、target1和target2,得到扩增数据集dataaugment。
2.根据权利要求1所述的数据集扩增方法,其特征在于,步骤s1中,原始图片中弹孔目标范围大小在10×10~25×25像素之间。
3.根据权利要求1所述的数据集扩增方法,其特征在于,步骤s2中,所述图片像素统一化通过以下方式实施:筛选出最大分辨率的图像尺寸作为模板,对未达到最大分辨率的图片进行黑边补充操作,黑边位于任意一端或多端。
4.根据权利要求1所述的数据集扩增方法,其特征在于,步骤s2中,所述弹孔目标标注可以先于像素统一化实施,或者在像素统一化后实施。
5.根据权利要求1所述的数据集扩增方法,其特征在于,步骤s3中,所述进行模糊操作为高斯模糊,高斯模糊的内核选择3*3像素。
6.根据权利要求1所述的数据集扩增方法,其特征在于,步骤s3中,所述旋转是指绕图片中心进行0~360°旋转;所述裁剪是指对图片进行水平方向或垂直方向的裁剪,并采用黑边补充裁剪区域至原尺寸;所述平移是指对图片进行水平方向或垂直方向的平移,平行方向相对侧采用黑边补充至原尺寸;所述翻转是指绕图片的对称轴进行镜像转换。
7.根据权利要求6所述的数据集扩增方法,其特征在于,步骤s3中,所述旋转在0~360°的区间内随机选择旋转角度,所述翻转在0~1的概率区间选择是否随机水平或垂直翻转,所述平移在宽高长度的-0.5~0.5倍区间选择是否随机水平或垂直平移,所述裁剪在宽高长度的-0.2~0.2倍区间选择是否随机水平或垂直裁剪。
8.根据权利要求6所述的数据集扩增方法,其特征在于,步骤s3中,对翻转、旋转、平移和裁剪四类操作分别给予一个随机概率因子,并打乱四类操作的顺序。
9.根据权利要求1所述的数据集扩增方法,其特征在于,s4步骤中,采用交并比iou1作为判断是否为负样本的评测指标;
阈值在0.60~0.80的区间内选取,在数据集data1中iou1低于该阈值的目标物标记属于负样本,予以剔除,得到终版数据集data1。
10.根据权利要求1所述的数据集扩增方法,其特征在于,步骤s7中,所述缩放操作中,缩放数组比例为[0.8,1.5,2.0,2.5,3.0]。
11.根据权利要求1所述的数据集扩增方法,其特征在于,步骤s8中,还包括对样本进行筛选,在0.60~0.80的区间内选取阈值,
阈值超过iou2的取为正样本,并裁减保存,最后将所有正样本组合成目标物数据集target2。
技术总结