本申请属于计算机技术领域,特别是涉及一种图片分类模型获取方法、装置、电子设备及可读存储介质。
背景技术:
随着网络技术的不断发展,网络中出现了各种各样的网络平台。在网络平台中为了方便用户直观的进行选择,平台方会将商家或者物品通过图片的形式展示出来。为了营造干净良好的网络平台环境,在展示图片时,往往需要对图片进行识别,以避免向用户展示敏感图片。而一个网络平台往往会包含多个品类,例如,网络平台中可以包括品类“外卖”、品类“酒店住宿”、品类“休闲娱乐”,等等,一个品类下往往会包含大量的网络物品的图片。因此,如何高效的识别敏感图片成为人们广泛关注的问题。
现有技术中,往往是直接使用标注有是否为敏感图片的样本图片,训练可以确定图片是属于敏感图片还是非敏感图片的图片分类模型,以通过该图片分类模型进行敏感图片识别。但是,这种训练方式训练得到的图片分类模型进行分类时,有时候会出现误判的问题,识别的准确性较差。
技术实现要素:
本申请提供一种图片分类模型获取方法、装置、电子设备及可读存储介质,用以提高模型的识别准确性。
根据本申请的第一方面,提供了一种图片分类模型获取方法,所述方法包括:
为待训练图片分类模型构建主训练任务以及至少一个辅助训练任务;其中,所述主训练任务为结合所述辅助训练任务中获取到的辅助信息,识别图片属于各个敏感图片类别的概率;所述辅助训练任务包括识别图片在网络平台中所属的品类;
根据所述主训练任务和所述辅助训练任务,对所述待训练图片分类模型进行训练,以获取目标图片分类模型。
根据本申请的第二方面,提供了一种图片分类模型获取装置,所述装置包括:
构建模块,用于为待训练图片分类模型构建主训练任务以及至少一个辅助训练任务;其中,所述主训练任务为结合所述辅助训练任务中获取到的辅助信息,识别图片属于各个敏感图片类别的概率;所述辅助训练任务包括识别图片在网络平台中所属的品类;
训练模块,用于根据所述主训练任务和所述辅助训练任务,对所述待训练图片分类模型进行训练,以获取目标图片分类模型。
根据本申请的第三方面,提供了一种电子设备,包括:
处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现前述图片分类模型获取方法。
根据本申请的第四方面,提供了一种可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行前述图片分类模型获取方法。
本申请提供了一种图片分类模型获取方法、装置、电子设备及可读存储介质,所述方法包括:为待训练图片分类模型构建主训练任务以及至少一个辅助训练任务;其中,主训练任务为结合辅助训练任务中获取到的辅助信息,识别图片属于各个敏感图片类别的概率;辅助训练任务包括识别图片在网络平台中所属的品类,根据主训练任务和辅助训练任务,对待训练图片分类模型进行训练,以获取目标图片分类模型。这样,可以使待训练图片分类模型在训练过程中,学习到如何识别图片所属的品类,以及结合图片所属的品类,识别图片属于各个敏感图片类别的概率的能力。进而可以确保后续使用训练好的目标图片分类模型进行分类时,目标图片分类模型可以在分类过程中兼顾不同品类下敏感图片之间的呈现方式,结合图片所属的品类进行分类,一定程度上消除由于不同品类下敏感图片的呈现方式对分类带来的影响,降低误判概率,提高准确性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种图片分类模型获取方法的步骤流程图;
图2是本申请实施例提供的一种辅助训练任务示意图;
图3是本申请实施例提供的一种模型示意图;
图4是本申请提供的一种敏感图片识别方法的步骤流程图;
图5示出了本申请的一个实施例中的一种图片分类模型获取装置的结构图;
图6示出了本申请的一个实施例提供的电子设备的结构图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
首先,对本申请涉及的一种应用场景进行说明。在网络平台中为了方便用户直观的进行选择,平台方会将商家或者物品通过图片的形式展示出来。为了营造干净良好的网络平台环境,平台往往需要使用图片分类模型对图片进行敏感图片识别,以避免将敏感图片显示给用户。在一种现有实现方式中,可以使用标注有是否为敏感图片的样本图片,训练一个根据图片进行二分类的图片分类模型,训练得到的图片分类模型可以确定图片是属于敏感图片还是非敏感图片。这种训练方式训练得到的图片分类模型进行分类时,有时候会出现误判的问题,识别准确性较差
为此,本申请实施例提供一种图片分类模型获取方法,下面对该种图片分类模型获取方法进行详细说明。
图1是本申请实施例提供的一种图片分类模型获取方法的步骤流程图,如图1所示,该方法可以包括:
步骤101、为待训练图片分类模型构建主训练任务以及至少一个辅助训练任务;其中,所述主训练任务为结合所述辅助训练任务中获取到的辅助信息,识别图片属于各个敏感图片类别的概率;所述辅助训练任务包括识别图片在网络平台中所属的品类。
本申请实施例中,主训练任务以及至少一个辅助训练任务可以是给定待训练图片分类模型的学习任务,通过给定待训练图片分类模型学习任务,使得待训练图片分类模型在训练过程中可以执行该学习任务,学习到准确执行该学习任务的能力。待训练图片分类模型可以是根据实际需求选取的,例如,待训练图片分类模型可以是神经网络模型。进一步地,辅助训练任务中获取到的辅助信息可以是根据辅助训练任务的具体内容决定的。示例的,在辅助训练任务为:识别图片在网络平台中所属的品类的情况下,辅助训练任务中获取到的辅助信息可以为:图片在网络平台中所属的品类。
进一步地,敏感图片类别可以用于表征敏感图片所属的图片种类,即,表征敏感图片具体是哪一种类型的敏感图片。敏感图片类别可以是根据实际情况预先划分的。示例的,可以设置敏感图片类别为包含有人体的敏感图片、不包含有人体的敏感图片、包含食物的敏感图片、不包含食物的敏感图片,等等。其中,本申请实施例中的敏感图片可以为会让人产生生理不适的图片,例如,包含不良因素让人觉得恶心的图片,或者是不健康的图片,例如,色情图片,低俗图片。
实际应用场景中,不同品类下的敏感图片的呈现方式往往具体较大差异。以网络平台为“美团”为例,“休闲娱乐”这个品类下的敏感图片往往会存在暴露的人体,而在“外卖”这个品类下,敏感图片基本不涉及暴露的人体,涉及的往往都是包含不良因素的食物,例如,情趣蛋糕。因此,本申请实施例中可以设定“识别图片在网络平台中所属的品类”的辅助训练任务,这样,使得待训练图片分类模型可以学习到识别图片在网络平台中所属的品类的能力。进一步地,在使用图片分类模型进行敏感图片识别的场景中,通过具体识别图片属于各个敏感图片类别的概率,可以通过概率可以较为准确的表征该图片是不是敏感图片,且具体属于哪一类敏感图片。相应地,将“结合辅助训练任务中获取到的辅助信息,识别图片属于各个敏感图片类别的概率”作为主训练任务,使得待训练图片分类模型在后续训练过程中,可以学习到如何结合图片的品类信息较为准确的识别图片属于各个敏感图片类别的概率的能力。这样,后续使用训练好的目标图片分类模型进行分类时,目标图片分类模型可以在分类过程中兼顾不同品类下敏感图片之间的呈现方式,结合图片所属的品类进行分类,进而一定程度上消除由于不同品类下敏感图片的呈现方式对分类带来的影响,降低误判概率,提高分类的准确性。
同时,相较于仅粗略宽泛的划分属于敏感图片和不属于敏感图片两种类别,训练模型识别图片属于敏感图片还是非敏感图片的方式,本申请实施例中,针对敏感图片更细粒度的划分敏感图片类别,训练模型识别图片具体属于敏感图片类别的概率。这样,一定程度上可以使得模型在训练过程中能够充分学习到属于不同敏感图片类别的图片特征,提高模型的识别精度,进而提高后续使用模型进行敏感图片识别的准确性。
步骤102、根据所述主训练任务和所述辅助训练任务,对所述待训练图片分类模型进行训练,以获取目标图片分类模型。
本申请实施例中,通过结合主训练任务和辅助训练任务,对待训练图片分类模型进行训练,待训练图片分类模型在训练过程中可以学习到如何识别图片所属品类,以及结合图片所属品类确定图片属于各个敏感图片类别的概率,经过学习模型的能力得到不断提升。这样,可以确保最终得到的目标图片分类模型可以较为准确的识别图片所属品类,结合图片所属品类确定图片属于各个敏感图片类别的概率。相应地,可以在结束训练后,将经过训练的待训练图片分类模型确定为目标图片分类模型。
综上所述,本申请实施例提供的图片分类模型获取方法,通过为待训练图片分类模型构建主训练任务以及至少一个辅助训练任务;其中,主训练任务为结合辅助训练任务中获取到的辅助信息,识别图片属于各个敏感图片类别的概率;辅助训练任务包括识别图片在网络平台中所属的品类,根据主训练任务和辅助训练任务,对待训练图片分类模型进行训练,以获取目标图片分类模型。这样,可以使待训练图片分类模型在训练过程中,学习到如何识别图片所属的品类,以及结合图片所属的品类,识别图片属于各个敏感图片类别的概率的能力。进而可以确保后续使用训练好的目标图片分类模型进行分类时,目标图片分类模型可以在分类过程中兼顾不同品类下敏感图片之间的呈现方式,结合图片所属的品类进行分类,一定程度上消除由于不同品类下敏感图片的呈现方式对分类带来的影响,降低误判概率,提高准确性。
可选的,本申请实施例中的辅助训练任务还可以包括以下至少一种:识别图片的旋转角度、感知图片中包含的颜色信息、确定图片的美学得分及确定图片中包含敏感人体的概率。这样,通过额外设置这些辅助训练任务可以使得待训练图片分类模型在训练过程中学习到如何识别图片的旋转角度、如何感知图片中包含的颜色信息、如何确定图片的美学得分、如何确定图片中包含敏感人体的概率,以及如何进一步结合识别到的旋转角度、颜色信息、美学得分以及图片中包含敏感人体的概率,识别图片属于各个敏感图片类别的概率。这样,训练得到的目标图片分类模型对图片进行分类识别时,可以更充分的利用到图片自身蕴含的信息,例如,品类、旋转角度、颜色信息、美学得分以及图片中包含敏感人体的概率,进而一定程度上提高识别的准确性。
可选的,本申请实施例中,待训练图片分类模型可以包括共享层以及各训练任务对应的网络层。相应地,根据主训练任务和辅助训练任务,对待训练图片分类模型进行训练,可以包括以下步骤:
步骤1021、根据所述主训练任务对应的第一训练样本及所述辅助训练任务对应的第二训练样本,获取所述待训练图片分类模型对应所述主训练任务的第一损失值以及对应所述辅助训练任务的第二损失值。
本申请实施例中,可以向待训练图片分类模型输入第一训练样本中的样本输入,然后根据待训练图片分类模型的给出的输出以及第一训练样本中的样本输出,确定第一损失值。向待训练图片分类模型输入第二训练样本中的样本输入,然后根据待训练图片分类模型的给出的输出以及第二训练样本中的样本输出,确定第二损失值。具体的,可以将待训练图片分类模型的给出的输出及样本输出作为预设损失函数的输入,将损失函数的输出作为损失值。其中,第一损失值和第二损失值可以分别体现待训练图片分类模型当前执行主训练任务的精度以及执行辅助训练任务的精度。损失函数可以包括每个训练任务各自对应的损失函数,这样,通过为每个训练任务设置各自对应的损失函数,可以根据对应的损失函数较为精准的确定待训练图片分类模型对应各个训练任务的损失值。
步骤1022、根据所述第一损失值和所述第二损失值,共同调整所述共享层中的模型参数。
本申请实施例中,共享层也可以称为神经网络模型中的浅层,共享层可以是执行每个训练任务时都会使用的层,例如,特征提取层,输出层,等等。具体的,可以采用随机梯度下降法,根据第一损失值和第二损失值对共享层中的模型参数进行调整。本申请实施例中,通过结合待训练图片分类模型对应主训练任务的第一损失值以及对应辅助训练任务的第二损失值,对共享层中的模型参数进行调整,以多个不同的训练任务共同优化共享层,可以起到多个训练任务互相促进的作用,进而一定程度上提高模型参数的调整效果,提高模型优化效果。
步骤1023、根据所述第一损失值以及所述第二损失值,分别调整所述主训练任务对应的网络层中的模型参数及所述辅助训练任务对应的网络层中的模型参数。
本申请实施例中,主训练任务对应的网络层可以是仅在执行主训练任务时使用的层,辅助训练任务对应的网络层可以是仅在执行辅助训练任务时使用的层。示例的,主训练任务对应的网络层可以为图片分类层、辅助训练任务:识别图片所属的品类对应的网络层可以为品类识别层。通过针对性的分别调整各个训练任务各自对应的网络层,一定程度上可以提高对网络层的优化效果。其中,各个训练任务各自对应的网络层可以视为一个训练任务独立的网络,具体可以为独立的全连接层。
可选的,本申请实施例中的辅助训练任务可以是基于自监督学习技术实现的。其中,自监督学习可以从大规模的无标注数据中挖掘数据自身的监督信息(高层语义信息),自监督学习通过挖掘大量无标注数据蕴含的高层语义信息,可以使这些语义信息运用在下游的处理任务上,通过这种构造的监督信息(self-supervisedlabel)对网络进行训练,可以使模型学习到对下游任务有价值的表征。在一种实现中,可以采用预训练-微调模型的方式将辅助训练任务与下游任务(主训练任务)结合。其中,预训练-微调模型的方式指的是预先待建一个网络模型,使用辅助训练任务进行训练,在训练结束时保存网络模型中的参数,以便训练好的网络模型可以在下次执行类似任务时获得较好的结果。然后使用保存的参数作为主训练任务的初始化参数,例如,作为图片分类任务的初始化参数,然后在训练的过程中,依据结果不断进行一些修改,得到最终的模型。由于这种预训练-微调模型的方式将辅助训练任务与图片分类任务割裂开来,因此,效果往往较差。本申请实施例中通过多任务学习方式,同时对于图片分类任务和多个自监督辅助训练任务共同学习,从而可以提升训练效果,提高训练得到的模型的分类性能。其中,多任务学习中给定的多个学习任务,其中所有或一部分任务是相关但并不完全一样的,多任务学习可以使这些学习任务中包含的知识来帮助提升模型执行各个学习任务的性能。
可选的,本申请实施例中,主训练任务对应的第一训练样本可以通过下述步骤获取:
步骤a、获取属于不同敏感图片类别的第一样本图片及其所属的敏感图片类别的标签值。
本申请实施例中,第一样本图片可以是从网络平台中获取的敏感图片,所属的敏感图片类别的标签值可以表征第一样本图片具体属于哪一种敏感图片类别。可以将第一样本图片作为第一训练样本中的样本输入,将所属的敏感图片类别的标签值作为第一训练样本中的样本输出,组成第一训练样本。进一步地,还可以在第一训练样本中增加获取不属于敏感图片的第一样本图片及其对应的标签值,这样,可以使模型能够学习到非敏感图片的特征,进而一定程度上提高模型的分辨能力。本申请实施例通过以属于不同敏感图片类别的第一样本图片构建第一训练样本,可以使得模型能够充分学习到属于不同敏感图片类别的图片的特征,进而提高训练得到的模型的识别准确性。
可选的,本申请实施例中的敏感图片类别可以是根据网络平台中包含的各个品类下的历史敏感图片确定的。其中,历史敏感图片可以是之前从各个品类下包含的图片中识别出来的敏感图片。敏感图片类别的具体数量可以由历史敏感图片涉及的种类决定,示例的,可以细化为七个子类。本申请实施例中,通过结合各个品类下的历史敏感图片更加细粒度的划分敏感图片类别,使得模型训练过程中可以学习到不同品类下敏感图片的特征,进而可以降低后续识别过程不同品类下敏感图片的呈现差异带来的干扰,提高识别的准确度。同时,由于通过二分类进行识别的方式中,涉及的类别范围过大往往容易引起模型精度不足,因此,本申请实施例中通过根据品类进行细分,将原本的分类任务从二分类,例如,敏感图片,非敏感图片的二分类,转换为细粒度的多分类任务,进而一定程度上可以提高模型的分类精度。
进一步地,辅助训练任务对应的第二训练样本可以通过下述步骤获取:
步骤b、若所述辅助训练任务为所述识别图片在网络平台中所属的品类,则获取属于不同品类的第二样本图片及其所属的品类。
对于识别图片在网络平台中所属的品类的辅助训练任务而言,该辅助训练任务具体可以为一个品类预测辅助任务。示例的,可以先创建一个辅助任务用于自动的从网络平台中获取属于不同品类的第二样本图片,将第二样本图片所属的品类作为标签。相应地,可以将第二样本图片作为第二训练样本中的样本输入,将第二样本图片所属的品类作为第一训练样本中的样本输出,组成第二训练样本。由于品类的多样化会造成敏感图片的多样化,因此如果能预测出图片所属的品类,会对分类任务有着较大的提升。本申请实施例中,通过该品类预测辅助任务可以进一步训练模型识别图片所属的品类的能力,进而一定程度上可以提高使用模型进行识别时的准确性。
步骤c、若所述辅助训练任务为所述识别图片的旋转角度,则获取属于不同指定角度的第三样本图片及其所属的指定角度。
对于识别图片的旋转角度的辅助训练任务而言,该辅助训练任务具体可以为一个角度分类辅助任务,通过该角度分类辅助任务能够使模型学习到如何识别图片的旋转角度的能力,这样可以避免图片角度变化带来的识别干扰,帮助模型在图片的角度变换之后仍然能做出正确的判断,进而一定程度上可以提高使用模型进行识别时的准确性。示例的,可以创建一个辅助任务用于对图片(无监督数据),挖掘其角度(rotation)信息(自监督信息)。例如,可以通过自动对同一张图片进行旋转,能够得到不同指定角度的第三样本图片。其中,指定角度可以是根据实际需求设置的,例如,可以为0度,90度,180度,270度。其中,0度,90度,180度,270度这四种角度类别即为角度分类辅助任务中模型要预测的标签,即,可以将该角度分类辅助任务看作一个四分类,模型需要识别图片属于哪个角度类别。具体的,可以将第三样本图片作为第二训练样本中的样本输入,将指定角度作为第一训练样本中的样本输出,组成第二训练样本。
步骤d、若所述辅助训练任务为所述感知图片中包含的颜色信息,则获取属于带有颜色信息的第四样本图片及其对应的灰度图。
对于感知图片中包含的颜色信息的辅助训练任务而言,该辅助训练任务具体可以为一个颜色补全辅助任务。示例的,可以创建一个辅助任务用于将带有颜色信息的彩色图,即第四样本图片,变成灰度图,得到自监督数据,然后通过该颜色补全辅助任务可以训练模型将这个灰度图还原回带有颜色信息的色彩图。在还原的过程中,模型可以学习到图片中包含的不同物体具体对应的颜色,进而可以建立模型的感知能力,帮助模型更好的感知图片中蕴含的颜色信息。相应地,通过提高模型对颜色信息的感知能力,可以使得模型在使用时,能够感知到更丰富的颜色信息,进而一定程度上可以提高使用模型进行识别时的准确性。
进一步地,可以将带有颜色信息的第四样本图片作为第二训练样本中的样本输出,将灰度图作为第一训练样本中的样本输入,组成第二训练样本。
步骤e、若所述辅助训练任务为所述确定图片的美学得分,则获取第五样本图片,以及通过预设的图片美学打分模型获取所述第五样本图片对应的美学得分。
对于确定图片的美学得分的辅助训练任务而言,该辅助训练任务具体可以为一个美学打分辅助任务。示例的,可以先创建一个辅助任务用于通过预设的图片美学打分模型提前给出每个第五样本图片的美学打分,作为第五样本图片的标签,然后可以通过美学打分辅助任务时模型学习对图像进行美学打分的能力,帮助模型更好的理解图片的美学意义。其中,预设的图片美学打分模型可以为神经网络模型,该美学打分辅助任务可以为一个构造的辅助的回归任务,对图片进行美学打分时,可以是对图片中的每个对象进行打分,或者对图片整体进行打分。由于敏感图片往往具备的美学意义往往较弱,美学质量往往较差,因此,通过训练模型对图片进行美学打分的能力,一定程度上可以提高模型对图片美学意义的感知能力,提高使用模型进行识别时的准确性。进一步地,可以将第五样本图片作为第二训练样本中的样本输入,将第五样本图片对应的美学得分作为第一训练样本中的样本输出,组成第二训练样本。
步骤f、若所述辅助训练任务为所述确定图片中包含敏感人体的概率,则获取第六样本图片,以及通过预设的人体识别模型获取所述第六样本图片对应的人体分类标签;所述人体分类标签表征所述第六样本图片中包含敏感人体的概率。
对于确定图片中包含敏感人体的概率的辅助训练任务而言,该辅助训练任务具体可以为一个人体识别辅助任务,示例的,可以先创建一个辅助任务用于通过预设的人体识别模型提前给出每个第六样本图片中包含敏感人体的概率,作为第六样本图片的分类标签。其中,预设的人体识别模型可以为成熟开源的色情人体识别模型。然后可以通过人体识别任务的辅助任务训练模型确定图片中包含敏感人体的概率的能力,以及确定是否包含敏感人体信息的能力,从而帮助模型更准确的分类低俗图片中是否含有敏感人体。由于部分图片中可能会具备敏感人体,因此,通过训练模型确定图片中包含敏感人体的概率的能力,一定程度上可以提高使用模型进行识别时的准确性。
需要说明的是,上述的第一样本图片、第二样本图片、第三样本图片、第四样本图片、第五样本图片及第六样本图片可以为相同的图片,也可以为不同的图片,本申请实施例对此不作限定。
图2是本申请实施例提供的一种辅助训练任务示意图,如图2所示,辅助训练任务可以包括:角度分类辅助任务、颜色补全辅助任务、美学打分辅助任务、人体识别辅助任务及品类预测辅助任务。其中,图2中的神经网络可以为本申请实施例中的待训练图片分类模型。
进一步地,图3是本申请实施例提供的一种模型示意图,如图3所示,本申请实施例中,可以根据分属不同品类图片,通过图片的品类标签,构造一个品类预测辅助任务,通过不同角度图片构建角度分类辅助任务、通过不同美学得分图片构建美学打分辅助任务、通过不同包含敏感人体概率的图片(图中未示出)构建人体识别辅助任务以及通过不同图片的灰度图(图中未示出)构建颜色补全辅助任务,通过不同敏感图片类别低俗图片构建细粒度图片分类任务,即,主训练任务。将这些辅助任务与细粒度图片分类任务一起,进行多任务学习,从而有效提升低俗图片识别的准确率和召回率。具体的,本申请实施例中将细粒度图片分类任务与构造的辅助任务共同进行多任务学习时,可以在浅层的神经网络上,即,神经网络共用层,通过共享网络的方式互相促进,然后每一个单独的任务通过各自对应的网络层(图中的低俗图片分类层、自监督学习角度识别层、自监督学习品类识别层)及各自对应的损失函数,得到最终的结果。其中,各自对应的网络层可以为独立的全连接层。然后,再通过梯度反向传播更新网络,例如,可以通过最终的结果共同调整神经网络共用层中的模型参数,以及分别调整各自独立的全连接层,从而完成模型的训练。
可选的,本申请实施例还可以在获取到目标图片分类模型之后,通过下述步骤进行敏感图片识别:
步骤g、通过所述目标图片分类模型识别待识别图片的至少一种辅助信息;所述辅助信息包括所述待识别图片在网络平台中所属的品类。
步骤h、根据所述辅助信息及所述待识别图片,通过所述目标图片分类模型确定所述待识别图片属于各个敏感图片类别的概率。
由于目标分类模型在训练过程中学习到了识别图片所属的品类,以及结合品类确定图片属于各个敏感图片类别的概率。因此,本申请实施例中,可以将待识别图片输入目标图片分类模型中,相应地,目标图片分类模型可以对待识别图片进行处理,以识别待识别图片在网络平台中所属的品类,结合待识别图片在网络平台中所属的品类,确定待识别图片属于各个敏感图片类别的概率。
步骤i、根据所述待识别图片属于各个敏感图片类别的概率,确定所述待识别图片是否为敏感图片。
本申请实施例中,待识别图片属于敏感图片类别的概率越大,则可以认为待识别图片为该敏感图片类别的敏感图片的可能性越大,因此,本申请实施例中,可以先确定是否存在概率大于预设概率阈值的敏感图片类别,如果存在,则可以确认待识别图片为敏感图片,然后可以将概率大于预设概率阈值的敏感图片类别中,最大概率的敏感图片类别作为待识别图片所属的敏感图片类别。相应地,如果不存在,则可以认为待识别图片不为敏感图片。其中,预设概率阈值可以是根据实际需求设置的,例如,预设概率阈值可以为0.5,本申请实施例对此不作限定。进一步地,在识别出待识别图片为敏感图片之后,还可以向待识别图片所属商家发送整改提醒。
本申请实施例中,使用多任务共同训练能够结合品类识别图片属于各个敏感图片类别的概率的目标分类模型进行识别,仅需通过将待识别图片输入目标分类模型就能确定出其所属的细粒度类别,同时,可以在对待识别图片时结合品类信息,按照细粒度的敏感图片类别对待识别图片进行分类识别,进而可以更为精准的进行识别,同时,可以避免由于不同品类下敏感图片的呈现差异导致的识别干扰,提高识别的准确性。
可选的,辅助信息还包括以下至少一种:待识别图片的旋转角度、待识别图片中包含的颜色信息、待识别图片的美学得分及待识别图片中包含敏感人体的概率。这样,通过多维度结合图片中蕴含的信息,可以更加充分利用图片自身蕴含的信息,进而一定程度上提高识别的准确性。
在另一种应用场景中,例如,首页推荐中,推荐的商家或者物品都会通过图片的形式展示出来,这样方便用户更直观的进行选择。但是由于图片是由商家自己提供,平台往往只对这些图片做基础的安全底线过滤,于是在展示的图片中,可能会存在低质量的敏感图片,例如,低俗、色情的图片引人不适。由于网络平台业务的多样化,网络平台中包含的品类,包含的图片类别往往十分多样,例如,网络平台中可能既包含了菜品图,同时又包含诸如房间,日用品等多种品类下的房间图、日用品图,这就让敏感图片的识别变得相当困难。因此,需要一个模型来识别低质量图片从而进行过滤。
在一种实现方式中,是使用经网络模型根据图片中的是否包含人体,以及人体的姿势进行识别,或者是直接根据图片进行二分类、识别图片中的敏感部位区域,结合的敏感部位区域进行识别,又或者是对图片进行上下半身进行检测识别。这些实现方式中,对图片自身蕴含的信息的利用率较低,且无法克服品类的多样性对分类识别带来的干扰,识别精度往往较低。例如,由于鸡腿比较接近裸露的人体,如果仅根据是否包含人体以及人体姿势进行识别,可能会将包含鸡腿的图片误判为敏感图片。本申请实施例中,通过结合识别图片的旋转角度、感知图片中包含的颜色信息、确定图片的美学得分及确定图片中包含敏感人体的概率这多个辅助训练任务,可以使得目标图片分类模型能够充分的利用图片自身蕴含的信息,以及克服品类的多样性对分类识别带来的干扰,进而一定程度上提高分类精度。
图4是本申请提供的一种敏感图片识别方法的步骤流程图,如图4所示,该方法包括:
步骤401、通过已训练图片分类模型确定待识别图片的至少一种辅助信息;所述辅助信息包括所述待识别图片在网络平台中所属的品类。
步骤402、根据所述辅助信息及所述待识别图片,通过所述已训练图片分类模型确定所述待识别图片属于各个敏感图片类别的概率。
步骤403、根据所述待识别图片属于各个敏感图片类别的概率,确定所述待识别图片是否为敏感图片。
其中,本申请实施例中的已训练图片分类模型确定可以是通过前述的图片分类模型获取方法生成的。本申请实施例提供的敏感图片识别方法的执行主体可以与前述的图片分类模型获取方法的执行主体相同,也可以不同。
本申请实施例中,通过该已训练分类模型对待识别图片时,可以结合品类信息,按照细粒度的敏感图片类别对待识别图片进行分类识别,进而可以更为精准的进行识别,同时,可以避免由于不同品类下敏感图片的呈现差异导致的识别干扰,提高识别的准确性。
图5是本申请的实施例提供的一种图片分类模型获取装置的结构图,该装置50可以包括:
构建模块501,用于为待训练图片分类模型构建主训练任务以及至少一个辅助训练任务;其中,所述主训练任务为结合所述辅助训练任务中获取到的辅助信息,识别图片属于各个敏感图片类别的概率;所述辅助训练任务包括识别图片在网络平台中所属的品类;
训练模块502,用于根据所述主训练任务和所述辅助训练任务,对所述待训练图片分类模型进行训练,以获取目标图片分类模型。
可选的,所述辅助训练任务还包括以下至少一种:识别图片的旋转角度、感知图片中包含的颜色信息、确定图片的美学得分及确定图片中包含敏感人体的概率。
可选的,所述待训练图片分类模型包括共享层以及各训练任务对应的网络层;
所述训练模块502,具体用于:
根据所述主训练任务对应的第一训练样本及所述辅助训练任务对应的第二训练样本,获取所述待训练图片分类模型对应所述主训练任务的第一损失值以及对应所述辅助训练任务的第二损失值;
根据所述第一损失值和所述第二损失值,共同调整所述共享层中的模型参数;
根据所述第一损失值以及所述第二损失值,分别调整所述主训练任务对应的网络层中的模型参数及所述辅助训练任务对应的网络层中的模型参数。
可选的,所述第一训练样本通过下述模块获取:
第一获取模块,用于获取属于不同敏感图片类别的第一样本图片及其所属的敏感图片类别的标签值。
可选的,所述敏感图片类别用于表征敏感图片所属的图片种类;所述敏感图片类别是根据所述网络平台中包含的各个品类下的历史敏感图片确定的。
可选的,所述第二训练样本通过下述模块式获取:
第二获取模块,用于若所述辅助训练任务为所述识别图片在网络平台中所属的品类,则获取属于不同品类的第二样本图片及其所属的品类;
第三获取模块,用于若所述辅助训练任务为所述识别图片的旋转角度,则获取属于不同指定角度的第三样本图片及其所属的指定角度;
第四获取模块,用于若所述辅助训练任务为所述感知图片中包含的颜色信息,则获取属于带有颜色信息的第四样本图片及其对应的灰度图;
第五获取模块,用于若所述辅助训练任务为所述确定图片的美学得分,则获取第五样本图片,以及通过预设的图片美学打分模型获取所述第五样本图片对应的美学得分;
第六获取模块,用于若所述辅助训练任务为所述确定图片中包含敏感人体的概率,则获取第六样本图片,以及通过预设的人体识别模型获取所述第六样本图片对应的人体分类标签;所述人体分类标签表征所述第六样本图片中包含敏感人体的概率。
可选的,所述装置50还包括:
识别模块,用于通过所述目标图片分类模型识别待识别图片的至少一种辅助信息;所述辅助信息包括所述待识别图片在网络平台中所属的品类;
第一确定模块,用于根据所述辅助信息及所述待识别图片,通过所述目标图片分类模型确定所述待识别图片属于各个敏感图片类别的概率;
第二确定模块,用于根据所述待识别图片属于各个敏感图片类别的概率,确定所述待识别图片是否为敏感图片。
可选的,所述辅助信息还包括以下至少一种:所述待识别图片的旋转角度、所述待识别图片中包含的颜色信息、所述待识别图片的美学得分及所述待识别图片中包含敏感人体的概率。
综上所述,本申请的实施例提供的图片分类模型获取装置,可以为待训练图片分类模型构建主训练任务以及至少一个辅助训练任务;其中,主训练任务为结合辅助训练任务中获取到的辅助信息,识别图片属于各个敏感图片类别的概率;辅助训练任务包括识别图片在网络平台中所属的品类,根据主训练任务和辅助训练任务,对待训练图片分类模型进行训练,以获取目标图片分类模型。这样,可以使待训练图片分类模型在训练过程中,学习到如何识别图片所属的品类,以及结合图片所属的品类,识别图片属于各个敏感图片类别的概率的能力。进而可以确保后续使用训练好的目标图片分类模型进行分类时,目标图片分类模型可以在分类过程中兼顾不同品类下敏感图片之间的呈现方式,结合图片所属的品类进行分类,一定程度上消除由于不同品类下敏感图片的呈现方式对分类带来的影响,降低误判概率,提高准确性。
本申请还提供了一种电子设备,参见图6,包括:处理器601、存储器602以及存储在所述存储器上并可在所述处理器上运行的计算机程序6021,所述处理器执行所述程序时实现前述实施例的图片分类模型获取方法。
本申请还提供了一种可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行前述实施例的图片分类模型获取方法。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本申请也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本申请的内容,并且上面对特定语言所做的描述是为了披露本申请的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本申请的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本申请并帮助理解各个发明方面中的一个或多个,在上面对本申请的示例性实施例的描述中,本申请的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本申请要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本申请的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
本申请的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(dsp)来实现根据本申请的排序设备中的一些或者全部部件的一些或者全部功能。本申请还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序。这样的实现本申请的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本申请进行说明而不是对本申请进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本申请可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本申请的保护范围之内。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
1.一种图片分类模型获取方法,其特征在于,所述方法包括:
为待训练图片分类模型构建主训练任务以及至少一个辅助训练任务;其中,所述主训练任务为结合所述辅助训练任务中获取到的辅助信息,识别图片属于各个敏感图片类别的概率;所述辅助训练任务包括识别图片在网络平台中所属的品类;
根据所述主训练任务和所述辅助训练任务,对所述待训练图片分类模型进行训练,以获取目标图片分类模型。
2.根据权利要求1所述方法,其特征在于,所述辅助训练任务还包括以下至少一种:识别图片的旋转角度、感知图片中包含的颜色信息、确定图片的美学得分及确定图片中包含敏感人体的概率。
3.根据权利要求1或2所述方法,其特征在于,所述待训练图片分类模型包括共享层以及各训练任务对应的网络层;
所述根据所述主训练任务和所述辅助训练任务,对所述待训练图片分类模型进行训练,包括:
根据所述主训练任务对应的第一训练样本及所述辅助训练任务对应的第二训练样本,获取所述待训练图片分类模型对应所述主训练任务的第一损失值以及对应所述辅助训练任务的第二损失值;
根据所述第一损失值和所述第二损失值,共同调整所述共享层中的模型参数;
根据所述第一损失值以及所述第二损失值,分别调整所述主训练任务对应的网络层中的模型参数及所述辅助训练任务对应的网络层中的模型参数。
4.根据权利要求3所述方法,其特征在于,所述第一训练样本通过下述方式获取:
获取属于不同敏感图片类别的第一样本图片及其所属的敏感图片类别的标签值。
5.根据权利要求1、2或4所述方法,其特征在于,所述敏感图片类别用于表征敏感图片所属的图片种类;所述敏感图片类别是根据所述网络平台中包含的各个品类下的历史敏感图片确定的。
6.根据权利要求3所述方法,其特征在于,所述第二训练样本通过下述方式获取:
若所述辅助训练任务为所述识别图片在网络平台中所属的品类,则获取属于不同品类的第二样本图片及其所属的品类;
若所述辅助训练任务为所述识别图片的旋转角度,则获取属于不同指定角度的第三样本图片及其所属的指定角度;
若所述辅助训练任务为所述感知图片中包含的颜色信息,则获取属于带有颜色信息的第四样本图片及其对应的灰度图;
若所述辅助训练任务为所述确定图片的美学得分,则获取第五样本图片,以及通过预设的图片美学打分模型获取所述第五样本图片对应的美学得分;
若所述辅助训练任务为所述确定图片中包含敏感人体的概率,则获取第六样本图片,以及通过预设的人体识别模型获取所述第六样本图片对应的人体分类标签;所述人体分类标签表征所述第六样本图片中包含敏感人体的概率。
7.根据权利要求1所述方法,其特征在于,所述方法还包括:
通过所述目标图片分类模型识别待识别图片的至少一种辅助信息;所述辅助信息包括所述待识别图片在网络平台中所属的品类;
根据所述辅助信息及所述待识别图片,通过所述目标图片分类模型确定所述待识别图片属于各个敏感图片类别的概率;
根据所述待识别图片属于各个敏感图片类别的概率,确定所述待识别图片是否为敏感图片。
8.根据权利要求7所述方法,其特征在于,所述辅助信息还包括以下至少一种:所述待识别图片的旋转角度、所述待识别图片中包含的颜色信息、所述待识别图片的美学得分及所述待识别图片中包含敏感人体的概率。
9.一种图片分类模型获取装置,其特征在于,所述装置包括:
构建模块,用于为待训练图片分类模型构建主训练任务以及至少一个辅助训练任务;其中,所述主训练任务为结合所述辅助训练任务中获取到的辅助信息,识别图片属于各个敏感图片类别的概率;所述辅助训练任务包括识别图片在网络平台中所属的品类;
训练模块,用于根据所述主训练任务和所述辅助训练任务,对所述待训练图片分类模型进行训练,以获取目标图片分类模型。
10.一种电子设备,其特征在于,包括:
处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-8中一个或多个所述的图片分类模型获取方法。
11.一种可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如方法权利要求1-8中一个或多个所述的图片分类模型获取方法。
技术总结