图片处理方法及装置与流程

    专利2022-07-08  129


    本申请涉及计算机应用领域,尤其涉及一种图片处理方法及装置。



    背景技术:

    近几年中,基于深度学习所训练的目标检测模型在图像目标检测任务中取得了巨大成功。目标检测模型的性能在很大程度上依赖于海量的训练图像样本,然而,在现实世界的应用中,人工收集的图片难以覆盖全部场景,即难以采集到大量有效的训练图像样本,而数据量的不足将直接导致目标检测模型的准确率较低,并造成目标模型的泛化能力较差。

    因此,如何提供一种能够增强训练图像样本数据量的技术方案,是本领域技术人员亟需解决的问题。



    技术实现要素:

    基于上述现有技术的不足,本申请提供了一种图片处理方法,以实现增强训练图像样本的数据量。

    本申请还提供了一种图片处理装置,用于保证上述方法在实际中的实现及应用。

    一种图片处理方法,包括:

    获取原始图片;

    识别所述原始图片中包含的各个实例;所述原始图片中的每个所述实例用于表征所述原始图片中具有预设特征的物体;

    判断所述原始图片中包含的实例的个数是否大于预设阈值;

    若大于,对所述原始图片中的目标实例进行移除,得到第一图片;其中,所述目标实例为所述原始图片中包含的多个所述实例中的任意一个实例;

    对所述第一图片中所述目标实例所处区域进行背景填充,得到第二图片;

    对所述第二图片分别执行操作集合中的每一个操作,得到每一个操作对应第三图片;所述操作集合中至少包括:旋转操作、裁剪操作、翻转操作、尺度变换操作、亮度调节操作、卷积运算操作和模糊化操作;

    对所述原始图片分别执行所述操作集合中的每一个操作,得到每一个操作对应的第四图片;

    将所述原始图片、所述第二图片、每个所述第三图片和每个所述第四图片组成图片集。

    上述的方法,可选的,还包括:

    若所述原始图片中包含的实例的个数不大于预设阈值,则对所述原始图分别执行操作集合中的每一个操作,得到每一个操作对应初始图片;

    将所述原始图片和每个所述初始图片组成图片集。

    上述的方法,可选的,所述将所述原始图片、所述第二图片、每个所述第三图片和每个第四图片组成图片集或将所述原始图片和每个所述初始图片组成图片集之后,还包括:

    针对所述图片集中的每一个图片,从所述操作集合中包含的各个操作中随机选取预设数目的操作组成第一集合,对所述图片依次执行所述第一集合中的每一个操作,得到所述图片对应的第五图片。

    上述的方法,可选的,所述将所述原始图片、所述第二图片、每个所述第三图片和每个所述第四图片组成图片集或将所述原始图片和每个所述初始图片组成图片集之后,还包括:

    将所述图片集存储至与所述原始图片的图片类型对应的位置。

    上述的方法,可选的,所述对所述第一图片中所述目标实例所属区域进行背景填充,得到第二图片,包括:

    将所述第一图片输入至预先构建的背景填充模型中,得到所述背景填充模型输出的对所述第一图片中所述目标实例所处区域进行背景填充后的第二图片。

    一种图片处理装置,包括:

    获取单元,用于获取原始图片;

    识别单元,用于识别所述原始图片中包含的各个实例;所述原始图片中的每个所述实例用于表征所述原始图片中具有预设特征的物体;

    判断单元,用于判断所述原始图片中包含的实例的个数是否大于预设阈值;

    移除单元,用于有若大于,对所述原始图片中的目标实例进行移除,得到第一图片;其中,所述目标实例为所述原始图片中包含的多个所述实例中的任意一个实例;

    背景填充单元,用于对所述第一图片中所述目标实例所处区域进行背景填充,得到第二图片;

    第一执行单元,用于对所述第二图片分别执行操作集合中的每一个操作,得到每一个操作对应第三图片;所述操作集合中至少包括:旋转操作、裁剪操作、翻转操作、尺度变换操作、亮度调节操作、卷积运算操作和模糊化操作;

    第二执行单元,用于对所述原始图片分别执行所述操作集合中的每一个操作,得到每一个操作对应的第四图片;

    第一组合单元,用于将所述原始图片、所述第二图片、每个所述第三图片和每个所述第四图片组成图片集。

    上述的装置,可选的,还包括:

    第三执行单元,用于若所述原始图片中包含的实例的个数不大于预设阈值,则对所述原始图分别执行操作集合中的每一个操作,得到每一个操作对应初始图片;

    第二组合单元,用于将所述原始图片和每个所述初始图片组成图片集。

    上述的装置,可选的,还包括:

    第四执行单元,用于针对所述图片集中的每一个图片,从所述操作集合中包含的各个操作中随机选取预设数目的操作组成第一集合,对所述图片依次执行所述第一集合中的每一个操作,得到所述图片对应的第五图片。

    上述的装置,可选的,还包括:

    存储单元,用于将所述图片集存储至与所述原始图片的图片类型对应的位置。

    上述的装置,可选的,所述背景填充单元执行对所述第一图片中所述目标实例所属区域进行背景填充,得到第二图片用于:

    将所述第一图片输入至预先构建的背景填充模型中,得到所述背景填充模型输出的对所述第一图片中所述目标实例所处区域进行背景填充后的第二图片。

    一种存储介质,所述存储介质包括存储的指令,其中,在所述指令运行时控制所述存储介质所在的设备执行上述的图片处理方法。

    一种电子设备,包括存储器,以及一个或者一个以上的指令,其中一个或者一个以上指令存储于存储器中,且经配置以由一个或者一个以上处理器执行上述的图片处理方法。

    与现有技术相比,本申请包括以下优点:

    本申请提供了一种图片处理方法及装置,该方法包括:获取原始图片;识别原始图片中包含的各个实例;判断原始图片中包含的实例的个数是否大于预设阈值;若大于,对原始图片中的目标实例进行移除,得到第一图片;其中,目标实例为原始图片中包含的多个实例中的任意一个实例;对第一图片中目标实例所处区域进行背景填充,得到第二图片;对第二图片分别执行操作集合中的每一个操作,得到每一个操作对应第三图片;对原始图片分别执行操作集合中的每一个操作,得到每一个操作对应的第四图片;将原始图片、第二图片、每个第三图片和每个第四图片组成图片集。实现了增加图片的数据量,进而实现了增强训练图像样本的数据量。

    附图说明

    为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

    图1为本申请提供的一种图片处理方法的方法流程图;

    图2为本申请提供的一种图片处理方法的又一方法流程图;

    图3为本申请提供的一种图片处理装置的结构示意图;

    图4为本申请提供的一种电子设备的结构示意图。

    具体实施方式

    下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

    本申请可用于众多通用或专用的计算装置环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器装置、包括以上任何装置或设备的分布式计算环境等等。

    本申请实施例提供了一种图片处理方法,该方法可以应用在多种系统平台,其执行主体可以运行在计算机终端或各种移动设备的处理器,所述图片处理方法的方法流程图如图1所示,具体包括:

    s101、获取原始图片。

    获取原始图片,其中,原始图片为待处理的图片。

    可选的,获取原始图片的过程包括:接收用户上传至系统的原始图片。

    s102、识别原始图片中包含的各个实例。

    对原始图片中包含的各个实例进行识别,具体的,可以是将原始图片输入至预先构建的实例分割模型中,得到实例分割模型输出的该原始图片中包含每个实例的实例框,从而实现原始图片中包含的各个实例的识别。其中,原始图片中包含的每个实例用于表征原始图片中具有预设特征的物体,例如,花、草、猫、人像、笔等,需要说明的是,原始图片中具有预设特征的一个物体为该原始图片中包含的一个实例。

    s103、判断原始图片中包含的实例的个数是否大于预设阈值。

    对原始图片中包含的实例的个数进行统计,判断原始图片中包含的实例的个数是否大于预设阈值,若判断出原始图片中包含的实例的个数大于预设阈值,则执行步骤s104,若判断出原始图片中包含的实例的个数不大于预设阈值,则执行步骤s105。

    需要说明的是,预设阈值为人为设定的数值,可以根据需求进行调整,可选的,预设阈值可以为2。

    s104、对原始图片中的目标实例进行移除,得到第一图片;其中,目标实例为原始图片中包含的多个实例中的任意一个实例。

    若原始图片中包含的实例的个数大于预设阈值,则对原始图片中的目标实例进行移除,得到第一图片,其中,目标实例为原始图片中包含的多个实例中的任意一个实例,也就是将原始图片中的包含的多个实例中的任意一个实例进行移除,具体的,可以是基于目标实例的实例框,将实例框所框住的区域进行整体移除。

    s105、对原始图片分别执行操作集合中的每一个操作,得到每一个操作对应的初始图片,并将原始图片和每个初始图片组成图片集。

    若原始图片中包含的实例的个数不大于预设阈值,则对原始图片分别执行操作集合中的每一个操作,得到每一个操作对应的初始图片,其中,操作集合中至少包括:旋转操作、裁剪操作、翻转操作、尺度变换操作、亮度调节操作,卷积运算操作和模糊化操作。

    具体的,对原始图片执行旋转操作,得到旋转操作后的初始图片,对原始图片执行裁剪操作,得到裁剪操作后的初始图片,对原始图片执行翻转操作,得到翻转操作后的初始图片,对原始图片执行尺度变换操作,得到尺度变换操作后的初始图片,对原始图片执行亮度调节操作,得到亮度调节操作后的初始图片,对原始图片执行卷积运算操作,得到卷积运算操作后的图片,对原始图片执行模糊化操作,得到模糊化操作后的初始图片。

    可选的,对原始图片分别执行操作集合中的每一个操作的具体过程请参见现有技术,即操作集合中的包含的每一个操作的具体操作过程请参见现有技术,此处不再赘述。

    本申请实施例提供的方法中,将原始图片和每个初始图片组成图片集,从而实现对原始图片的增强,即实现基于原始图片,得到多个图片。

    s106、对第一图片中目标实例所处区域进行背景填充,得到第二图片。

    对第一图片中的目标实例所处区域进行背景填充,也就是对第一图片中目标实例移除后的区域进行背景填充,使第一图片中目标实例移除后的区域被填充为背景,得到第二图片。

    本申请实施例中,对第一图片中的目标实例所处区域进行背景填充的具体过程,包括:将第一图片输入至预先构建的背景填充模型中,得到背景填充模型输出的对第一图片中所述目标实例所处区域进行背景填充后的第二图片。

    其中,基于预先采集的图片样本集,对模型进行训练,具体为,基于图片样本集中移除实例的图片作为模型的输入,并将以背景色填充移除实例所处区域的图片作为模型的输出,以此训练模型,从而得到背景填充模型。图片样本集的采集过程,包括:拍摄图片,选择背景,将实例放置于背景中,并拍摄此时的图片;拍摄完成后撤掉目标,拍摄整个背景图片。重复上述操作多次,并在一定数量的不同角度、光照度下重复上述操作,并对拍摄得到的图片保存为图片样本集。

    s107、对第二图片分别执行操作集合中的每一个操作,得到每一个操作对应第三图片,并对原始图片分别执行操作集合中的每一个操作,得到每一个操作对应的第四图片。

    对第二图片分别执行操作集合中的每一个操作,得到每一个操作对应的第三图片,并对原始图片分别执行操作集合中的每一个操作,到每一个操作对应的第四图片,其中,操作集合中至少包括:旋转操作、裁剪操作、翻转操作、尺度变换操作、亮度调节操作,卷积运算操作和模糊化操作。

    s108、将原始图片、第二图片、每个第三图片和每个第四图片组成图片集。

    将原始图片、第二图片、每个第三图片和每个第四图片组成图片集,从而实现将原始图片扩充为原始图片、第二图片,各个第三图片和各个第四图片。

    本申请实施例提供的方法中,可以对图片集进行存储,将图片集存储至原始图片的图片类型对应的位置。

    本申请实施例提供的图片处理方法,获取原始图片;识别原始图片中包含的各个实例;判断原始图片中包含的实例的个数是否大于预设阈值;若大于,对原始图片中的目标实例进行移除,得到第一图片;其中,目标实例为原始图片中包含的多个实例中的任意一个实例;对第一图片中目标实例所处区域进行背景填充,得到第二图片;对第二图片分别执行操作集合中的每一个操作,得到每一个操作对应第三图片;对原始图片分别执行操作集合中的每一个操作,得到每一个操作对应的第四图片;将原始图片、第二图片、每个第三图片和每个第四图片组成图片集。实现了增加图片的数据量,进而实现了增强训练图像样本的数据量。

    在本申请实施例提供的方法中,对图片处理方法的另一种实现过程进行说明,如图2所示,包括以下步骤:

    s201、获取原始图片。

    可选的,步骤s201的具体实现过程如步骤s101所述,此处不再赘述。

    s202、识别原始图片中包含的各个实例。

    可选的,步骤s202的具体实现过程如步骤s102所述,此处不再赘述。

    s203、判断原始图片中包含的实例的个数是否大于预设阈值。

    对原始图片中包含的实例的个数进行统计,判断原始图片中包含的实例的个数是否大于预设阈值,若判断出原始图片中包含的实例的个数大于预设阈值,则执行步骤s204,若判断出原始图片中包含的实例的个数不大于预设阈值,则执行步骤s205。

    s204、对原始图片中的目标实例进行移除,得到第一图片;其中,目标实例为原始图片中包含的多个实例中的任意一个实例。

    可选的,步骤s204的具体实现过程如步骤s104所述,此处不再赘述。

    s205、对原始图片分别执行操作集合中的每一个操作,得到每一个操作对应的初始图片,并将原始图片和每个初始图片组成图片集。

    可选的,步骤s205的具体实现过程如步骤s105所述,此处不再赘述。

    s206、对第一图片中目标实例所处区域进行背景填充,得到第二图片

    可选的,步骤s206的具体实现过程如步骤s106所述,此处不再赘述。

    s207、对第二图片分别执行操作集合中的每一个操作,得到每一个操作对应第三图片,并对原始图片分别执行操作集合中的每一个操作,得到每一个操作对应的第四图片。

    可选的,步骤s207的具体实现过程如步骤s107所述,此处不再赘述。

    s208、将原始图片、第二图片、每个第三图片和每个第四图片组成图片集。

    可选的,步骤s208的具体实现过程如步骤s108所述,此处不再赘述。

    s209、针对图片集中的每一个图片,从操作集合中包含的各个操作中随机选取预设数目的操作组成第一集合,对图片依次执行第一集合中的每一个操作,得到该图片对应的第五图片。

    对图片集中的每一个图片,从操作集合中包含的各个操作中随机选取预设数目的操作组成第一集合,并对图片依次执行第一集合中每一个操作,得到图片对应的第五图片。

    需要说明的是,对图片集中的每一个图片,其所对应的第一集合是不同的,也就是对每一个图片,从操作集合中包含的各个操作中随机选择的操作是不同的,例如,每次随机选取五个操作组成第一集合,第一次可以选取旋转操作、裁剪操作、翻转操作、尺度变换操作和亮度调节操作,第二次可以选取翻转操作、尺度变换操作、亮度调节操作,卷积运算操作和模糊化操作,第三次可以选取旋转操作、裁剪操作、翻转操作、卷积运算操作和模糊化操作。

    需要说明的是,对图片集中的每一个图片依次执行第一集合中的每一个操作包括:对每一个图片对应的第一集合中的各个操作按预设策略进行排序,并对每一图片依次执行其对应的第一集中包含的排序后的每一操作,例如,图片a对应的第一集合a中包括:旋转操作、裁剪操作、亮度调节操作、卷积运算操作和模糊化操作,对第一集合a中包含的各个操作按预设策略排序后得到的顺序为:模糊化操作、旋转操作、裁剪操作、卷积运算操作和亮度调节操作,则对图片a依次执行第一集合a中的每一个操作具体为:对图片a执行模糊化操作,并对模糊化操作后的图片执行旋转操作,对旋转操作后的图片执行旋转操作,对旋转操作后的图片执行裁剪操作,对裁剪操作后的图片执行卷积操作,对卷积操作后的图片执行亮度调节操作,从而得到图片a对应的第五图片。

    s210、将每个第五图片存储至与原始图片的图片类型对应的位置。

    将每个第五图片存储至原始图片的图片类型对应的位置。

    本申请实施例提供的方法中,还可以对图片集中包含的每一个图片执行组合操作,每一个组合操作为从操作集合中随机选取预数目的操作,从而实现进一步增加图片的数据量。

    与图1所述的方法相对应,本申请实施例还提供了一种图片处理装置,用于对图1中方法的具体实现,其结构示意图如图3所示,具体包括:

    获取单元301,用于获取原始图片;

    识别单元302,用于识别所述原始图片中包含的各个实例;所述原始图片中的每个所述实例用于表征所述原始图片中具有预设特征的物体;

    判断单元303,用于判断所述原始图片中包含的实例的个数是否大于预设阈值;

    移除单元304,用于有若大于,对所述原始图片中的目标实例进行移除,得到第一图片;其中,所述目标实例为所述原始图片中包含的多个所述实例中的任意一个实例;

    背景填充单元305,用于对所述第一图片中所述目标实例所处区域进行背景填充,得到第二图片;

    第一执行单元306,用于对所述第二图片分别执行操作集合中的每一个操作,得到每一个操作对应第三图片;所述操作集合中至少包括:旋转操作、裁剪操作、翻转操作、尺度变换操作、亮度调节操作、卷积运算操作和模糊化操作;

    第二执行单元307,用于对所述原始图片分别执行所述操作集合中的每一个操作,得到每一个操作对应的第四图片;

    第一组合单元308,用于将所述原始图片、所述第二图片、每个所述第三图片和每个所述第四图片组成图片集。

    本申请实施例提供的图片处理装置,获取原始图片;识别原始图片中包含的各个实例;判断原始图片中包含的实例的个数是否大于预设阈值;若大于,对原始图片中的目标实例进行移除,得到第一图片;其中,目标实例为原始图片中包含的多个实例中的任意一个实例;对第一图片中目标实例所处区域进行背景填充,得到第二图片;对第二图片分别执行操作集合中的每一个操作,得到每一个操作对应第三图片;对原始图片分别执行操作集合中的每一个操作,得到每一个操作对应的第四图片;将原始图片、第二图片、每个第三图片和每个第四图片组成图片集。实现了增加图片的数据量,进而实现了增强训练图像样本的数据量。

    在本申请的一个实施例中,基于前述方案,还可以配置为:

    第三执行单元,用于若所述原始图片中包含的实例的个数不大于预设阈值,则对所述原始图分别执行操作集合中的每一个操作,得到每一个操作对应初始图片;

    第二组合单元,用于将所述原始图片和每个所述初始图片组成图片集。在本申请的一个实施例中,基于前述方案,还可以配置为:

    第四执行单元,用于针对所述图片集中的每一个图片,从所述操作集合中包含的各个操作中随机选取预设数目的操作组成第一集合,对所述图片依次执行所述第一集合中的每一个操作,得到所述图片对应的第五图片。

    在本申请的一个实施例中,基于前述方案,还可以配置为:

    存储单元,用于将所述图片集存储至与所述原始图片的图片类型对应的位置。

    在本申请的一个实施例中,基于前述方案,背景填充单元305执行对所述第一图片中所述目标实例所属区域进行背景填充,得到第二图片用于:

    将所述第一图片输入至预先构建的背景填充模型中,得到所述背景填充模型输出的对所述第一图片中所述目标实例所处区域进行背景填充后的第二图片。

    本申请实施例还提供了一种存储介质,所述存储介质包括存储的指令,其中,在所述指令运行时控制所述存储介质所在的设备执行以下操作:

    获取原始图片;

    识别所述原始图片中包含的各个实例;所述原始图片中的每个所述实例用于表征所述原始图片中具有预设特征的物体;

    判断所述原始图片中包含的实例的个数是否大于预设阈值;

    若大于,对所述原始图片中的目标实例进行移除,得到第一图片;其中,所述目标实例为所述原始图片中包含的多个所述实例中的任意一个实例;

    对所述第一图片中所述目标实例所处区域进行背景填充,得到第二图片;

    对所述第二图片分别执行操作集合中的每一个操作,得到每一个操作对应第三图片;所述操作集合中至少包括:旋转操作、裁剪操作、翻转操作、尺度变换操作、亮度调节操作、卷积运算操作和模糊化操作;

    对所述原始图片分别执行所述操作集合中的每一个操作,得到每一个操作对应的第四图片;

    将所述原始图片、所述第二图片、每个所述第三图片和每个所述第四图片组成图片集。

    本申请实施例还提供了一种电子设备,其结构示意图如图4所示,具体包括存储器401,以及一个或者一个以上的指令402,其中一个或者一个以上指令402存储于存储器401中,且经配置以由一个或者一个以上处理器403执行所述一个或者一个以上指令402进行以下操作:

    获取原始图片;

    识别所述原始图片中包含的各个实例;所述原始图片中的每个所述实例用于表征所述原始图片中具有预设特征的物体;

    判断所述原始图片中包含的实例的个数是否大于预设阈值;

    若大于,对所述原始图片中的目标实例进行移除,得到第一图片;其中,所述目标实例为所述原始图片中包含的多个所述实例中的任意一个实例;

    对所述第一图片中所述目标实例所处区域进行背景填充,得到第二图片;

    对所述第二图片分别执行操作集合中的每一个操作,得到每一个操作对应第三图片;所述操作集合中至少包括:旋转操作、裁剪操作、翻转操作、尺度变换操作、亮度调节操作、卷积运算操作和模糊化操作;

    对所述原始图片分别执行所述操作集合中的每一个操作,得到每一个操作对应的第四图片;

    将所述原始图片、所述第二图片、每个所述第三图片和每个所述第四图片组成图片集。

    需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于系统类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

    最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

    为了描述的方便,描述以上系统时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

    通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。

    以上对本申请所提供的一种图片处理方法及装置进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。


    技术特征:

    1.一种图片处理方法,其特征在于,包括:

    获取原始图片;

    识别所述原始图片中包含的各个实例;所述原始图片中的每个所述实例用于表征所述原始图片中具有预设特征的物体;

    判断所述原始图片中包含的实例的个数是否大于预设阈值;

    若大于,对所述原始图片中的目标实例进行移除,得到第一图片;其中,所述目标实例为所述原始图片中包含的多个所述实例中的任意一个实例;

    对所述第一图片中所述目标实例所处区域进行背景填充,得到第二图片;

    对所述第二图片分别执行操作集合中的每一个操作,得到每一个操作对应第三图片;所述操作集合中至少包括:旋转操作、裁剪操作、翻转操作、尺度变换操作、亮度调节操作、卷积运算操作和模糊化操作;

    对所述原始图片分别执行所述操作集合中的每一个操作,得到每一个操作对应的第四图片;

    将所述原始图片、所述第二图片、每个所述第三图片和每个所述第四图片组成图片集。

    2.根据权利要求1所述的方法,其特征在于,还包括:

    若所述原始图片中包含的实例的个数不大于预设阈值,则对所述原始图分别执行操作集合中的每一个操作,得到每一个操作对应初始图片;

    将所述原始图片和每个所述初始图片组成图片集。

    3.根据权利要求1或2所述的方法,其特征在于,所述将所述原始图片、所述第二图片、每个所述第三图片和每个第四图片组成图片集或将所述原始图片和每个所述初始图片组成图片集之后,还包括:

    针对所述图片集中的每一个图片,从所述操作集合中包含的各个操作中随机选取预设数目的操作组成第一集合,对所述图片依次执行所述第一集合中的每一个操作,得到所述图片对应的第五图片。

    4.根据权利要求1或2所述的方法,其特征在于,所述将所述原始图片、所述第二图片、每个所述第三图片和每个所述第四图片组成图片集或将所述原始图片和每个所述初始图片组成图片集之后,还包括:

    将所述图片集存储至与所述原始图片的图片类型对应的位置。

    5.根据权利要求1所述的方法,其特征在于,所述对所述第一图片中所述目标实例所属区域进行背景填充,得到第二图片,包括:

    将所述第一图片输入至预先构建的背景填充模型中,得到所述背景填充模型输出的对所述第一图片中所述目标实例所处区域进行背景填充后的第二图片。

    6.一种图片处理装置,其特征在于,包括:

    获取单元,用于获取原始图片;

    识别单元,用于识别所述原始图片中包含的各个实例;所述原始图片中的每个所述实例用于表征所述原始图片中具有预设特征的物体;

    判断单元,用于判断所述原始图片中包含的实例的个数是否大于预设阈值;

    移除单元,用于有若大于,对所述原始图片中的目标实例进行移除,得到第一图片;其中,所述目标实例为所述原始图片中包含的多个所述实例中的任意一个实例;

    背景填充单元,用于对所述第一图片中所述目标实例所处区域进行背景填充,得到第二图片;

    第一执行单元,用于对所述第二图片分别执行操作集合中的每一个操作,得到每一个操作对应第三图片;所述操作集合中至少包括:旋转操作、裁剪操作、翻转操作、尺度变换操作、亮度调节操作、卷积运算操作和模糊化操作;

    第二执行单元,用于对所述原始图片分别执行所述操作集合中的每一个操作,得到每一个操作对应的第四图片;

    第一组合单元,用于将所述原始图片、所述第二图片、每个所述第三图片和每个所述第四图片组成图片集。

    7.根据权利要求1所述的装置,其特征在于,还包括:

    第三执行单元,用于若所述原始图片中包含的实例的个数不大于预设阈值,则对所述原始图分别执行操作集合中的每一个操作,得到每一个操作对应初始图片;

    第二组合单元,用于将所述原始图片和每个所述初始图片组成图片集。

    8.根据权利要求6或7所述的装置,其特征在于,还包括:

    第四执行单元,用于针对所述图片集中的每一个图片,从所述操作集合中包含的各个操作中随机选取预设数目的操作组成第一集合,对所述图片依次执行所述第一集合中的每一个操作,得到所述图片对应的第五图片。

    9.根据权利要求6或7所述的装置,其特征在于,还包括:

    存储单元,用于将所述图片集存储至与所述原始图片的图片类型对应的位置。

    10.根据权利要求6所述的装置,其特征在于,所述背景填充单元执行对所述第一图片中所述目标实例所属区域进行背景填充,得到第二图片用于:

    将所述第一图片输入至预先构建的背景填充模型中,得到所述背景填充模型输出的对所述第一图片中所述目标实例所处区域进行背景填充后的第二图片。

    技术总结
    本申请提供了一种图片处理方法及装置,该方法包括:获取原始图片;识别原始图片中包含的各个实例;判断原始图片中包含的实例的个数是否大于预设阈值;若大于,对原始图片中的目标实例进行移除,得到第一图片;其中,目标实例为原始图片中包含的多个实例中的任意一个实例;对第一图片中目标实例所处区域进行背景填充,得到第二图片;对第二图片分别执行操作集合中的每一个操作,得到每一个操作对应第三图片;对原始图片分别执行操作集合中的每一个操作,得到每一个操作对应的第四图片;将原始图片、第二图片、每个第三图片和每个第四图片组成图片集。实现了增加图片的数据量,进而实现了增强训练图像样本的数据量。

    技术研发人员:徐晓健;李福洋;严洁;栾英英;童楚婕;程庆莹
    受保护的技术使用者:中国银行股份有限公司
    技术研发日:2020.12.15
    技术公布日:2021.03.12

    转载请注明原文地址:https://wp.8miu.com/read-19431.html

    最新回复(0)