图像评价方法、图像评价装置、存储介质与电子设备与流程

    专利2022-07-08  107


    本公开涉及图像处理技术领域,尤其涉及一种图像评价方法、图像评价装置、计算机可读存储介质与电子设备。



    背景技术:

    随着智能终端多样化功能的普及,人们对智能终端的应用也越来越广泛。日常生活中,人们经常会使用终端设备配置的摄像头进行拍照或摄像等操作。为了拍摄更富美感的图像,用户往往会通过调整角度和姿势,拍摄多张相似的图像,该过程不仅会花费较多的时间,用户也不能确定其所拍摄的图像美观程度如何,或者存在哪些问题等。



    技术实现要素:

    本公开提供了一种图像评价方法、图像评价装置、计算机可读存储介质与电子设备,进而至少在一定程度上改善现有技术中缺乏对图像进行美感度的有效评价的问题。

    本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。

    根据本公开的第一方面,提供一种图像评价方法,包括:获取待评价图像,所述待评价图像中包括至少一个目标对象;从所述待评价图像中提取关于所述目标对象的关键特征点;根据所述关键特征点确定所述目标对象的姿态数据;通过预先训练的评价模型对所述目标对象的姿态数据进行处理,得到所述待评价图像的评价结果。

    根据本公开的第二方面,提供一种图像评价装置,包括:图像获取模块,用于获取待评价图像,所述待评价图像中包括至少一个目标对象;特征点提取模块,用于从所述待评价图像中提取关于所述目标对象的关键特征点;数据确定模块,用于根据所述关键特征点确定所述目标对象的姿态数据;数据处理模块,用于通过预先训练的评价模型对所述目标对象的姿态数据进行处理,得到所述待评价图像的评价结果。

    根据本公开的第三方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述图像评价方法。

    根据本公开的第四方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述图像评价方法。

    本公开的技术方案具有以下有益效果:

    根据上述图像评价方法、图像评价装置、计算机可读存储介质与电子设备,获取待评价图像,待评价图像中包括至少一个目标对象;从待评价图像中提取关于目标对象的关键特征点;根据关键特征点确定目标对象的姿态数据;通过预先训练的评价模型对目标对象的姿态数据进行处理,得到待评价图像的评价结果。一方面,本示例性实施例提出一种新的图像评价方法,能够基于目标对象的姿态数据,确定待评价图像的评价结果,评价结果依赖于目标对象的姿态,能够对待评价图像的美感度进行有效且准确的评估;另一方面,图像评价过程较为简洁,即能够得到具体的评价结果,能够为用户提供针对待评价图像的有效指导信息,且本示例性实施例算法的复杂度较低,具有广泛的应用场景。

    应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

    附图说明

    此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

    图1示出本示例性实施方式的一种系统架构的示意图;

    图2示出本示例性实施方式的电子设备的示意图;

    图3示出本示例性实施方式的一种图像评价方法的流程图;

    图4示出本示例性实施方式的另一种图像评价方法的流程图;

    图5示出本示例性实施方式的一种图像评价方法的子流程图;

    图6示出本示例性实施方式的另一种图像评价方法的子流程图;

    图7示出本示例性实施方式的一种图像评价装置的结构框图。

    具体实施方式

    现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。

    此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

    图1示出了本公开示例性实施方式的一种系统架构的示意图。如图1所示,该系统架构100可以包括:终端设备110和服务器120。终端设备110可以包括但不限于手机、平板电脑、数码相机、个人电脑等电子设备。应该理解,图1中的终端设备和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备和服务器。比如服务器120可以是多个服务器组成的服务器集群等。

    本公开实施方式所提供的图像评价方法可以由终端设备110执行,例如在终端设备110获取待评价图像后,对图像进行关键特征点的提取,确定姿态数据,并对其进行处理得到评价结果;也可以由服务器120执行,例如终端设备110获取待评价图像后,上传到服务器120,由服务器120执行对待评价图像的处理过程,得到评价结果后,返回终端设备110等,本公开对此不做限定。

    本公开的示例性实施方式提供一种用于实现图像评价方法的电子设备,其可以是图1中的终端设备110或服务器120。该电子设备至少包括处理器和存储器,存储器用于存储处理器的可执行指令,处理器配置为经由执行可执行指令来执行图像评价方法。

    电子设备可以以各种形式来实施,例如可以包括手机、平板电脑、笔记本电脑、个人数字助理(personaldigitalassistant,pda)、导航装置、可穿戴设备、无人机等移动设备,以及台式电脑、智能电视等固定设备。

    下面以图2中的终端设备200为例,对电子设备的构造进行示例性说明。本领域技术人员应当理解,除了特别用于移动目的的部件之外,图2中的构造也能够应用于固定类型的设备。在另一些实施方式中,终端设备200可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件、软件或软件和硬件的组合实现。各部件间的接口连接关系只是示意性示出,并不构成对终端设备200的结构限定。在另一些实施方式中,终端设备200也可以采用与图2不同的接口连接方式,或多种接口连接方式的组合。

    如图2所示,终端设备200具体可以包括:处理器210、内部存储器221、外部存储器接口222、usb接口230、充电管理模块240、电源管理模块241、电池242、天线1、天线2、移动通信模块250、无线通信模块260、音频模块270、扬声器271、受话器272、麦克风273、耳机接口274、传感器模块280、显示屏幕290、摄像模组291、指示器292、马达293、按键294以及用户标识模块(subscriberidentificationmodule,sim)卡接口295等。

    处理器210可以包括一个或多个处理单元,例如:处理器210可以包括应用处理器(applicationprocessor,ap)、调制解调处理器、图形处理器(graphicsprocessingunit,gpu)、图像信号处理器(imagesignalprocessor,isp)、控制器、编码器、解码器、数字信号处理器(digitalsignalprocessor,dsp)、基带处理器和/或神经网络处理器(neural-networkprocessingunit,npu)等。编码器可以对图像或视频数据进行编码(即压缩),形成码流数据;解码器可以对图像或视频的码流数据进行解码(即解压缩),以还原出图像或视频数据。

    在一些实施方式中,处理器210可以包括一个或多个接口。接口可以包括集成电路(inter-integratedcircuit,i2c)接口、集成电路内置音频(inter-integratedcircuitsound,i2s)接口、脉冲编码调制(pulsecodemodulation,pcm)接口、通用异步收发传输器(universalasynchronousreceiver/transmitter,uart)接口、移动产业处理器接口(mobileindustryprocessorinterface,mipi)、通用输入输出(general-purposeinput/output,gpio)接口、用户标识模块(subscriberidentitymodule,sim)接口和/或通用串行总线(universalserialbus,usb)接口等。

    usb接口230可以用于连接充电器为终端设备200充电,也可以连接耳机,通过耳机播放音频,还可以用于终端设备200连接其他电子设备,例如连接电脑、外围设备等。充电管理模块240用于从充电器接收充电输入。电源管理模块241用于连接电池242、充电管理模块240与处理器210。电源管理模块241接收电池242和/或充电管理模块240的输入,为终端设备200的各个部分供电,还可以用于监测电池的状态。

    终端设备200的无线通信功能可以通过天线1、天线2、移动通信模块250、无线通信模块260、调制解调处理器以及基带处理器等实现。天线1和天线2用于发射和接收电磁波信号。终端设备200中的每个天线可用于覆盖单个或多个通信频带。移动通信模块250可以提供应用在终端设备200上的包括2g/3g/4g/5g等无线通信的解决方案。

    无线通信模块260可以提供应用在终端设备200上的包括无线局域网(wirelesslocalareanetworks,wlan)(如无线保真(wirelessfidelity,wi-fi)网络)、蓝牙(bluetooth,bt)、全球导航卫星系统(globalnavigationsatellitesystem,gnss)、调频(frequencymodulation,fm)、近距离无线通信技术(nearfieldcommunication,nfc)、红外技术(infrared,ir)等无线通信解决方案。无线通信模块260经由天线2接收电磁波,将电磁波信号调频以及滤波处理,将处理后的信号发送到处理器210。无线通信模块260还可以从处理器210接收待发送的信号,对其进行调频,放大,经天线2转为电磁波辐射出去。

    在一些实施方式中,终端设备200的天线1和移动通信模块250耦合,天线2和无线通信模块260耦合,使得终端设备200可以通过无线通信技术与网络以及其他设备通信。无线通信技术可以包括全球移动通讯系统(globalsystemformobilecommunications,gsm),通用分组无线服务(generalpacketradioservice,gprs),码分多址接入(codedivisionmultipleaccess,cdma),宽带码分多址(widebandcodedivisionmultipleaccess,wcdma),时分码分多址(timedivision-synchronouscodedivisionmultipleaccess,td-scdma),长期演进(longtermevolution,lte),新空口(newradio,nr),bt,gnss,wlan,nfc,fm,和/或ir技术等。

    终端设备200通过gpu、显示屏幕290及应用处理器等实现显示功能。gpu用于执行数学和几何计算,以实现图形渲染,并连接显示屏幕290和应用处理器。处理器210可包括一个或多个gpu,其执行程序指令以生成或改变显示信息。终端设备200可以包括一个或多个显示屏幕290,用于显示图像,视频等。

    终端设备200可以通过isp、摄像模组291、编码器、解码器、gpu、显示屏幕290及应用处理器等实现拍摄功能。

    摄像模组291用于捕获静态图像或视频,通过感光元件采集光信号,转换为电信号。isp用于处理摄像模组291反馈的数据,将电信号转换成数字图像信号。

    外部存储器接口222可以用于连接外部存储卡,例如microsd卡,实现扩展终端设备200的存储能力。内部存储器221可以用于存储计算机可执行程序代码,可执行程序代码包括指令。内部存储器221可以包括存储程序区和存储数据区。存储数据区可存储终端设备200使用过程中所创建的数据(比如图像,视频)等。处理器210通过运行存储在内部存储器221的指令和/或存储在设置于处理器中的存储器的指令,执行终端设备200的各种功能应用以及数据处理。

    终端设备200可以通过音频模块270、扬声器271、受话器272、麦克风273、耳机接口274及应用处理器等实现音频功能。

    传感器模块280可以包括触摸传感器2801、压力传感器2802、陀螺仪传感器2803、气压传感器2804等。此外,根据实际需要,还可以在传感器模块280中设置其他功能的传感器,例如深度传感器、加速度传感器、距离传感器等。指示器292可以是指示灯,可以用于指示充电状态,电量变化,也可以用于指示消息,未接来电,通知等。马达293可以产生振动提示,例如来电、闹钟、接收信息等的振动提示,也可以用于触摸振动反馈等。

    按键294包括开机键,音量键等。按键294可以是机械按键。也可以是触摸式按键。终端设备200可以接收按键输入,产生与终端设备200的用户设置以及功能控制有关的键信号输入。

    下面对本公开示例性实施方式的图像评价方法和图像评价装置进行具体说明。本示例性实施例的应用场景包括但不限于:用户在查看相册中的图像时,根据各个图像的评价结果对图像进行筛选,删除效果较差的图像,保留效果较好的图像;用户通过前置摄像头进行拍照时,根据预览图像的评价结果调整自己的状态,进行自拍;用户通过后置摄像头进行拍照时,根据预览图像的评价结果指导被拍摄对象的状态,进行拍摄等等。

    图3示出了本示例性实施方式中一种图像评价方法的流程,包括以下步骤s310~s340:

    步骤s310,获取待评价图像,待评价图像中包括至少一个目标对象。

    待评价图像是指用于进行图像评价的图像,可以包括多种类型的图像,例如人物图像、动物图像或建筑物图像等。待评价图像中包括至少一个目标对象,根据待评价图像类型的差异,目标对象不同,例如待评价图像为人物图像时,目标对象可以是人脸或者人物整体;待评价图像为动物图像时,目标对象可以是动物;待评价图像为建筑图像时,目标对象可以是建筑物等等。在本示例性实施例中,上述待评价图像可以通过多种方式确定,例如待评价图像可以是用户使用终端设备进行拍摄时,由摄像头采集的预览图像,或者用户进行拍摄操作后摄像头采集的拍照图像,再或者还可以是本地已存储的图像或从其他图像源获取的图像等。本示例性实施例可以通过对待评价图像中目标对象的分析,对待评价图像的美感度进行评估。

    步骤s320,从待评价图像中提取关于目标对象的关键特征点。

    其中,关键特征点是指能够反映目标对象结构或自身特点的关键点,与目标对象的类型相关,例如当目标对象为人物时,关键特征点可以是人物脸部,如眼睛、鼻子、嘴部等位置的脸部关键点,也可以是能够反映人物躯干位置或结构的骨骼关键点等;当目标对象为建筑时,关键特征点可以是建筑物的边、角、中心点等元素的关键点等。

    步骤s330,根据关键特征点确定目标对象的姿态数据。

    姿态数据是指能够反映目标对象姿势或运动状态的数据,根据目标对象的不同,姿势数据可以包括多种数据,例如当目标对象为人物时,人物头部的转动角度、眼睛的开合状态、嘴巴的开合状态以及人物躯干的运动状态等数据都可以作为姿势数据;当目标对象为建筑物时,建筑物的倾斜角度、边长、高度以及各边比例等数据也可以作为姿势数据等。在本示例性实施例中,为了便于模型的计算与处理,在获取多个维度的姿态数据后,可以将其转换为多维向量,每一维数据可以表示一种类型的姿态数据等,例如人物的姿态数据可以使用向量[x,y,z,k]表示,其中,x用于表示人物头部的转动角度这一维度的姿态数据,y用于表示眼睛的开合状态这一维度的姿态数据,z用于表示嘴巴的开合状态的姿态数据,k用于表示人物躯干的运动状态这一维度的姿态数据等等。

    本示例性实施例特别可以应用于当目标对象为人物时,对待评价图像进行评价的应用场景,则上述步骤s320可以包括:

    从待评价图像中提取人物的脸部关键特征点和骨骼关键特征点。

    脸部关键特征点是指能够反映人物的脸部特征的关键点,例如眼睛部位的关键特征点可以反映眼睛的形状和位置;嘴部的关键特征点可以反映嘴巴的形状和位置;人脸轮廓的关键特征点或者人脸中心的关键特征点可以反映人脸整体的结构特征等。骨骼关键特征点可以反映人物整体的结构特征,例如躯干的位置或弯折状态等。

    在一示例性实施例中,上述姿态数据可以包括人物头部的运动状态数据、五官状态数据、脸部尺寸数据、脸部位置数据、肢体运动数据或者人物在待评价图像中的位置数据中的一种或多种。

    人物头部的运动状态可以包括人物头部的水平方向的转动角度或者竖直方向的转动角度等。五官状态数据可以是指眼睛的开合程度或弯曲弧度等数据,嘴巴的开合程度或弧度等数据,由于五官状态数据在一定程度上与人物情绪相关联,例如微笑时人物的嘴巴及眼睛的弧度较大。因此,五官状态数据可以作为姿态数据用于对图像的美感度进行评价。脸部尺寸数据是指与人物脸部大小相关的数据,具体可以是人脸在待评价图像中的面积占比,或者相比于待评价图像中其他参考对象的面积占比,例如与待评价图像中其他人物脸部面积的比例等。脸部位置数据可以是脸部轮廓在待评价图像中的位置、脸部的中心位置、脸部最高点或最低点的位置等与脸部位置相关的局部数据。对应的,人物在待评价图像中的位置数据则是指人物整体在待评价图像中的位置数据,例如人物的重心位置、人物的中心位置、人物整体的轮廓在待评价图像中的位置或者人物在待评价图像中距离某一特定位置(如待评价图像的中心位置)的距离等。肢体运动数据是指与人物肢体动作相关的数据,例如胳膊弯折的角度数据、手部的姿势数据等等。

    在本示例性实施例中,可以基于人物的脸部关键特征点和骨骼关键特征点确定人物的姿态数据。

    举例说明,通过摄像头采集待评价图像时,通常可以确定摄像头的相机参数,例如位姿参数、内参矩阵或畸变系数等等,此时可以根据人物的脸部关键特征点和相机参数,采用特定的方法(如solvepnp函数)进行计算,确定人物头部的运动状态(如人物头部角度)等。

    本示例性实施例还可以基于人物的脸部关键特征点计算其他姿态数据,例如眼睛的开合程度、人脸在图像中的面积占比、人脸的中心位置以及人脸五官之间的比例等。或者基于人物的骨骼关键特征点计算人物整体的中心位置、处于特定姿势时的身材比例、处于特定姿势时的动作幅度(如抬起胳膊的幅度)等姿态数据。此外,本领域技术人员可以想到的其他通过脸部关键特征点和骨骼关键特征点确定人物的姿态数据的其他计算方式均应属于本示例性实施例的保护范围内。

    步骤s340,通过预先训练的评价模型对目标对象的姿态数据进行处理,得到待评价图像的评价结果。

    其中,评价模型是指预先训练的用于对目标对象的姿态数据进行处理,以得到评价结果的机器学习模型。评价结果是指待评价图像是否具有美感度、美感度如何的评价数据,该评价结果可以包括对待评价图像的宏观评价结果,例如待评价图像的整体评分结果;也可以包括对待评价图像具体细节的评价结果,例如待评价图像中关于目标对象的姿态数据中每个维度数据的具体评价结果等。

    在一示例性实施例中,评价模型包括第一模型和第二模型;上述步骤s340,可以包括以下步骤:

    通过第一模型对目标对象的姿态数据进行处理,得到待评价图像的整体评价结果;

    通过第二模型对目标对象的姿态数据进行处理,得到待评价图像的局部评价结果。

    其中,本示例性实施例可以通过两种模型分别对目标对象的姿态数据进行处理,分别得到待评价图像的整体评价结果和局部评价结果。其中第一模型用于对姿态数据进行回归处理,可以是回归模型,例如线性回归模型或逻辑回归模型等;第二模型用于对姿态数据进行分类处理,可以是分类模型,例如决策树模型等。举例说明,待评价图像中人物的姿态数据可以用特征向量[x,y,z,k]表示,其中,x为人物头部转动角度数据,y为人物眼睛开合状态数据,z为人物嘴巴开合状态数据,k为人物躯干运动状态数据。使用第一模型对上述向量[x,y,z,k]进行处理时,可以得到待评价图像的整体评价结果,该整体评价结果可以是评分结果,具体的,可以是数值型结果,例如0-100分或0-10分中的任意数值等,其中100分和10分表示待评价图像美感度为满分;评分结果也可以是字母型结果,例如s表示完美,a表示优秀,b表示一般等等。使用第二模型对上述向量[x,y,z,k]进行处理时,第二模型可以对该向量中的每一维度数据进行处理,得到对应的局部评价结果。该局部评价结果为一种分类结果,是指对每一维度数据是否具备美感度的判断结果,分类结果可以用0或1表示,其中,0表示不具备美感度,1表示具备美感度,例如使用第二模型对上述向量进行处理,得到4个分类结果,分别对应x、y、z、k维度的分类结果为0、0、1、1,该分类结果表示,当前待评价图像中,人物头部转动角度数据和人物眼睛开合状态数据不具备美感度,而人物嘴巴开合状态数据以及人物躯干运动状态数据具备美感度。另外,上述局部评价结果还可以是美感度等级的分类结果,用0、1、2、3、4、5表示,其中,0表示不具备美感度,1、2、3、4、5表示具备美感度,但美感度具有差异,随着数值增加,美感度逐渐提高。本示例性实施例可以通过多种方式为用户呈现待评价图像的评价结果,具体的可以是在显示界面内显示待评价图像的整体评价结果,例如显示整体评分数据,以及在与各个姿态数据对应的图像子区域显示局部评价结果,例如在嘴部所在的图像子区域显示美观或不美观的评价结果等。此外,为了给用户提供更准确便捷的指导信息,本示例性实施例还可以对局部美感度欠佳的区域进行区别性显示,例如若局部评价结果中,眼部状态欠佳,则可以在待评价图像中,对眼部区域进行框选或使用区别性颜色进行高亮或闪烁,以对用户进行提示。

    本示例性实施例通过两种模型分别对目标对象的姿态数据进行处理,可以得到待评价图像的整体评价结果和局部评价结果,以为用户提供较为具体的评价数据,用户根据该评价结果一方面能够对待评价图像美感度如何进行整体评估,另一方面还可以确定影响当前待评价图像美感度的具体因素是什么,从而能够更加具有针对性的进行调整。

    本示例性实施例可以从不同的图像数据库中获取大量的图像,或者通过摄像头拍摄大量的图像,作为样本图像。然后对每张样本图像进行整体评分(如对其进行0-100的打分)和局部评价(如对每张样本图像中的各个姿态进行0或1的标注,0表示不美观,1表示美观),将整体评分和局部评价共同作为每张样本图像的样本标签。进一步,通过样本图像以及其对应的样本标签对上述第一模型和第二模型进行训练,其训练过程可以包括:机器学习模型以样本图像的姿态数据为输入,输出样本图像的评价结果,通过调整模型参数,使输出的评价结果越来越接近样本标签,直到模型的准确率达到一定的标准,可以认为训练完成。

    图4示出本示例性实施例中另一种图像评价方法的流程图,具体可以包括:

    步骤s410,获取由摄像模组采集的待评价图像;

    步骤s420,从待评价图像中提取人物的脸部关键特征点和骨骼关键特征点;

    步骤s430,根据人物的脸部关键特征点和骨骼关键特征点确定人物的姿态数据;

    步骤s440,通过第一模型对人物的姿态数据进行处理,得到待评价图像的整体评价结果;

    步骤s450,通过第二模型对人物的姿态数据进行处理,得到待评价图像的局部评价结果。

    综上,本示例性实施方式中,获取待评价图像,待评价图像中包括至少一个目标对象;从待评价图像中提取关于目标对象的关键特征点;根据关键特征点确定目标对象的姿态数据;通过预先训练的评价模型对目标对象的姿态数据进行处理,得到待评价图像的评价结果。一方面,本示例性实施例提出一种新的图像评价方法,能够基于目标对象的姿态数据,确定待评价图像的评价结果,评价结果依赖于目标对象的姿态,能够对待评价图像的美感度进行有效且准确的评估;另一方面,图像评价过程较为简洁,即能够得到具体的评价结果,能够为用户提供针对待评价图像的有效指导信息,且本示例性实施例算法的复杂度较低,具有广泛的应用场景。

    在一示例性实施例中,上述目标对象为多个人物;

    如图5所示,则上述从待评价图像中提取关于人物的脸部关键特征点和骨骼关键特征点,包括:

    步骤s510,从待评价图像中分别提取每个人物的脸部关键特征点和骨骼关键特征点;

    进一步的,上述步骤s330可以包括:

    步骤s520,根据每个人物的脸部关键特征点和骨骼关键特征点,确定多个人物的姿态数据。

    在实际应用中,经常会出现待评价图像中出现多个人物的情况,例如待评价图像为多人的合影图像时,对待评价图像进行评价则需要根据多个人物的姿态数据共同进行处理。具体的,可以从待评价图像中分别提取每个人物的脸部关键特征点和骨骼关键特征点,以确定每个人物的姿态数据,进一步,生成多个人物的姿态数据的特征向量。为了便于评价模型对姿态数据进行处理,本示例性实施例可以将多个人物的姿态数据的特征向量进行拼接处理得到一个特征向量,或者根据多个特征向量生成姿态数据的特征矩阵,作为评价模型的输入数据,进行图像评价的处理过程。

    在一示例性实施例中,上述图像评价方法还可以包括:

    确定待评价图像中多个人物的位置分布指标数据;

    则上述步骤s340,可以包括:

    通过预先训练的评价模型对多个人物的姿态数据、多个人物的位置分布指标数据进行处理,得到待评价图像的评价结果。

    其中,位置分布指标数据是指待评价图像中包括多个人物时,能够反映各个人物本身,或者人物之间位置分布特点的数据,本示例性实施例中,根据位置分布指标数据可以确定多个人物排列的位置是否合适,或者图像是否具备美感度,位置分布指标数据可以包括多个维度的数据,例如其可以是多个人物是否按照一定的规律排列(如从高到低的规律,或者中间低两侧高的规则等),或者多个人物排列的整齐程度、居中程度或聚拢程度等数据。本示例性实施例可以将姿态数据和位置分布指标数据共同作为评价模型的输入数据进行处理,生成待评价图像的评价结果。具体的,可以将多个维度的姿态数据转化为姿态特征向量,将多个维度的位置分布指标数据转换为位置指标分布特征向量,然后将姿态特征向量和位置指标分布特征向量进行合并,例如进行拼接处理,生成新的特征向量,作为评价模型的输入数据进行处理。

    在一示例性实施例中,上述图像评价方法还可以包括:

    计算每个人物距离待评价图像中基准点的距离,并根据距离确定多个人物之间的聚拢指标数据;

    根据每个人物的骨骼关键特征点,确定多个人物排列的有序指标数据。

    其中,聚拢指标数据可以反映当前待评价图像中多个人物的聚拢程度,有序指标数据可以反映当前待评价图像中多个人物排列的整齐程度。通常在多个人物的图像中,人物的排列位置如果较为分散或者不整齐,则会对图像的整体美感造成影响。因此,本示例性实施例可以从聚拢指标数据和有序指标数据两个维度确定多个人物的位置分布指标数据。

    聚拢指标数据可以根据每个人物距离待评价图像中基准点的距离来确定,基准点可以是待评价图像中的特定位置,例如图像中心位置或者处于中间的人物的中心位置等,以每个人物距离待评价图像中基准点的距离,作为评价多个人物之间聚拢程度的数据,距离越近说明聚拢程度越好。

    有序指标数据可以根据每个人物骨骼关键特征点确定,例如根据每个人物头部和脚部的关键特征点,确定每个人物在图像中的位置和与其他人物的位置关系,作为有序指标数据。

    在一示例性实施例中,如图6所示,上述图像评价方法还可以包括以下步骤:

    步骤s610,检测待评价图像中的场景元素;

    步骤s620,确定场景元素与目标对象的位置关系数据;

    对应的上述步骤s340,可以包括:

    步骤s630,通过预先训练的评价模型对目标对象的姿态数据和位置关系数据进行处理,得到待评价图像的评价结果。

    考虑到图像中除了包含目标对象,还可能包含其他因素,例如建筑物、植物轮廓或地平线等,这些因素与目标对象的关系也会对待评价图像的美感度造成影响,例如人物竖直站立的姿态与建筑物轮廓相适应时,图像会更加具有美感。因此,本示例性实施例在进行图像评价时,还可以从场景相关的元素方面考虑,具体的,可以对待评价图像进行场景元素的识别,其中,场景元素可以包括图像中除目标对象之外的其他对象,例如建筑物、植物、地平线、天空、海平线、沙滩、草地等,也可以包括与上述对象相关的几何元素,例如建筑物轮廓、与建筑物形状相关的直线、地平线所在的直线、天空区域的形状等等。进一步,可以在待评价图像中确定场景元素与目标对象的位置关系数据,例如检测场景中的直线元素,判断其类型,例如为地平线的直线元素,并保留主要的直线元素,如处于图像中心区域范围内且长度较长的直线,计算目标对象(如人物)与直线元素的距离和角度关系,作为位置关系数据。最后,可以将位置关系数据与姿态数据进行向量化处理,以通过预先训练的评价模型对目标对象的姿态数据和位置关系数据进行处理,得到待评价图像的评价结果。本示例性实施例通过对待评价图像中场景元素的检测,可以提供更加全面的图像美感度评价与构图指导。

    在一示例性实施例中,上述图像评价方法还可以包括:

    根据待评价图像的评价结果,向用户发送关于目标对象的引导提示信息。

    在本示例性实施例中,当确定待评价图像的评价结果后,还可以向用户发送关于目标对象的引导提示信息,该引导提示信息可以为用户提供能够提高当前图像美感度的指引信息,例如当用户进行自拍时,基于当前预览图像的评价结果,可以向用户发送微笑、仰头、偏头等引导提示信息;当对多人进行合影拍摄时,基于当前预览图像的评价结果,可以向用户发送人物再聚拢一些、人物向左移动或向右移动的引导提示信息等。该引导提示信息可以以多种形式展示,具体的,可以在图像中以文字形式显示,例如在预览图像中,在人物的嘴部区域显示“微笑”的文字提示信息;或者也可以在图像中以特定标识的形式显示,例如在人物的嘴部区域显示“微笑”的图形标识或简单线条等,或者在图像中显示箭头以提示用户向哪个方向进行移动等;还可以以语音的形式进行引导提示等,本公开对此不做具体限定。

    在一示例性实施例中,上述步骤s310中获取待评价图像,可以包括:

    获取由摄像模组采集的待评价图像;

    在得到待评价图像的评价结果之后,方法还包括:

    在图像采集的预览显示界面显示待评价图像的评价结果。

    本示例性实施例特别可以应用于,在通过终端设备的摄像模组进行摄像或摄影时,为用户提供实时的拍摄指导的应用场景。在获取由摄像模组采集的待评价图像之后,可以根据该待评价图像进行图像评价处理,得到评价结果,并显示在预览界面中,用户可以根据该评价结果,确定当前的拍摄状态,也可以根据该评价结果对拍摄姿势进行调整,以提高图像美感度。

    在一示例性实施例中,在得到待评价图像的评价结果之后,上述图像评价方法还包括:

    在评价结果满足预设条件时,触发摄像模组进行图像拍摄。

    在拍摄时,为了提高用户的拍摄效率,避免用户错过最佳的拍摄效果,本示例性实施例还可以在评价结果满足预设条件时,触发摄像模组自动进行拍摄操作。该预设条件可以是评价结果中整体评价结果达到一定的条件,例如当整体评分达到80分时,触发拍摄;也可以是局部评价结果满足一定的条件,例如一半及以上维度的姿势数据达标时,触发拍摄,具体而言,在对眼睛、嘴巴、头部、躯干4个维度数据的评价结果中,眼睛、嘴部、头部这3个维度数据的评价结果比较完美,则可以触发拍摄;另外,预设条件还可以是综合整体评价结果和局部评价结果共同达到某一条件,触发进行图像拍摄等等,本公开对此不做具体限定。

    在一示例性实施例中,在获取待评价图像之后,上述图像评价方法还可以包括:

    对待评价图像进行预处理;

    其中,预处理包括对待评价图像进行图像尺寸归一化、图像增强、图像去噪、图像锐化中的一种或多种处理。

    为了保证对各个待评价图像进行评价时的准确性和标准化程度,本示例性实施例还可以对待评价图像进行多种预处理。预处理可以包括以下任意一种或多种:图像尺寸归一化,图像增强,图像去噪,图像锐化。图像尺寸归一化能够将具有尺寸差异的图像进行尺寸的统一,以便于对其中各个对象的位置关系进行准确分析。另外,还可以对图像进行增强处理、图像去噪或图像锐化处理,其中,图像增强,主要指增强图像中的感兴趣区域(regionofinterest,roi),抑制不感兴趣区域;图像去噪,通过滤波、图像平滑等手段,减少图像中的噪声干扰去噪是指减少数字图像中噪声;图像锐化,通过补偿图像的轮廓,增强图像的边缘及灰度跳变的部分,使图像变得清晰。若需要,还可以对待评价图像进行其他处理,例如图像去雾、图像平滑等等,本公开对此不做具体限定。

    本公开的示例性实施方式还提供一种图像评价装置。如图7所示,该图像评价装置700可以包括:图像获取模块710,用于获取待评价图像,待评价图像中包括至少一个目标对象;特征点提取模块720,用于从待评价图像中提取关于目标对象的关键特征点;数据确定模块730,用于根据关键特征点确定目标对象的姿态数据;数据处理模块740,用于通过预先训练的评价模型对目标对象的姿态数据进行处理,得到待评价图像的评价结果。

    在一示例性实施例中,评价模型包括第一模型和第二模型;数据处理模块包括:第一处理单元,用于通过第一模型对目标对象的姿态数据进行处理,得到待评价图像的整体评价结果;第二处理单元,用于通过第二模型对目标对象的姿态数据进行处理,得到待评价图像的局部评价结果。

    在一示例性实施例中,第一模型为回归模型,第二模型为分类模型。

    在一示例性实施例中,目标对象为人物;特征点提取模块包括:特征点提取单元,用于从待评价图像中提取人物的脸部关键特征点和骨骼关键特征点。

    在一示例性实施例中,姿态数据包括人物头部的运动状态数据、五官状态数据、脸部尺寸数据、脸部位置数据、肢体运动数据或者人物在待评价图像中的位置数据中的一种或多种。

    在一示例性实施例中,目标对象为多个人物;特征点提取单元,用于从待评价图像中分别提取每个人物的脸部关键特征点和骨骼关键特征点;数据确定模块,用于根据每个人物的脸部关键特征点和骨骼关键特征点,确定多个人物的姿态数据。

    在一示例性实施例中,图像评价装置还包括:指标数据确定模块,用于确定待评价图像中多个人物的位置分布指标数据;数据处理模块,用于通过预先训练的评价模型对多个人物的姿态数据、多个人物的位置分布指标数据进行处理,得到待评价图像的评价结果。

    在一示例性实施例中,指标数据确定模块包括:聚拢指标确定单元,用于计算每个人物距离待评价图像中基准点的距离,并根据距离确定多个人物之间的聚拢指标数据;有序指标确定单元,用于根据每个人物的骨骼关键特征点,确定多个人物排列的有序指标数据。

    在一示例性实施例中,图像评价装置还包括:元素检测模块,用于检测待评价图像中的场景元素;关系数据确定模块,用于确定场景元素与目标对象的位置关系数据;数据处理模块,用于通过预先训练的评价模型对目标对象的姿态数据和位置关系数据进行处理,得到待评价图像的评价结果。

    在一示例性实施例中,图像评价装置还包括:信息发送模块,用于根据待评价图像的评价结果,向用户发送关于目标对象的引导提示信息。

    在一示例性实施例中,图像获取模块,用于获取由摄像模组采集的待评价图像;图像评价装置还包括:显示模块,用于在得到待评价图像的评价结果之后,在图像采集的预览显示界面显示待评价图像的评价结果。

    在一示例性实施例中,图像评价装置还包括:用于在得到待评价图像的评价结果之后,

    在一示例性实施例中,在评价结果满足预设条件时,触发摄像模组进行图像拍摄。

    在一示例性实施例中,图像评价装置还包括:预处理模块,用于在获取待评价图像之后,对待评价图像进行预处理;其中,预处理包括对待评价图像进行图像尺寸归一化、图像增强、图像去噪、图像锐化中的一种或多种处理。

    上述装置中各模块的具体细节在方法部分实施方式中已经详细说明,未披露的细节内容可以参见方法部分的实施方式内容,因而不再赘述。

    所属技术领域的技术人员能够理解,本公开的各个方面可以实现为系统、方法或程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。

    本公开的示例性实施方式还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中,本公开的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤,例如可以执行图3、图4、图5或图6中任意一个或多个步骤。

    本公开的示例性实施方式还提供了一种用于实现上述方法的程序产品,其可以采用便携式紧凑盘只读存储器(cd-rom)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本公开的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

    程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。

    计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

    可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、rf等等,或者上述的任意合适的组合。

    可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如java、c 等,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

    本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其他实施方式。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施方式仅被视为示例性的,本公开的真正范围和精神由权利要求指出。

    应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限定。


    技术特征:

    1.一种图像评价方法,其特征在于,包括:

    获取待评价图像,所述待评价图像中包括至少一个目标对象;

    从所述待评价图像中提取关于所述目标对象的关键特征点;

    根据所述关键特征点确定所述目标对象的姿态数据;

    通过预先训练的评价模型对所述目标对象的姿态数据进行处理,得到所述待评价图像的评价结果。

    2.根据权利要求1所述的方法,其特征在于,所述评价模型包括第一模型和第二模型;所述通过预先训练的评价模型对所述目标对象的姿态数据进行处理,得到所述待评价图像的评价结果,包括:

    通过所述第一模型对所述目标对象的姿态数据进行处理,得到所述待评价图像的整体评价结果;

    通过所述第二模型对所述目标对象的姿态数据进行处理,得到所述待评价图像的局部评价结果。

    3.根据权利要求2所述的方法,其特征在于,所述第一模型为回归模型,所述第二模型为分类模型。

    4.根据权利要求1所述的方法,其特征在于,所述目标对象为人物;

    所述从所述待评价图像中提取关于所述目标对象的关键特征点,包括:

    从所述待评价图像中提取所述人物的脸部关键特征点和骨骼关键特征点。

    5.根据权利要求4所述的方法,其特征在于,所述姿态数据包括所述人物头部的运动状态数据、五官状态数据、脸部尺寸数据、脸部位置数据、肢体运动数据或者所述人物在所述待评价图像中的位置数据中的一种或多种。

    6.根据权利要求4所述的方法,其特征在于,所述目标对象为多个人物;

    所述从所述待评价图像中提取关于所述人物的脸部关键特征点和骨骼关键特征点,包括:

    从所述待评价图像中分别提取每个人物的脸部关键特征点和骨骼关键特征点;

    所述根据所述关键特征点确定所述目标对象的姿态数据,包括:

    根据所述每个人物的脸部关键特征点和骨骼关键特征点,确定所述多个人物的姿态数据。

    7.根据权利要求6所述的方法,其特征在于,所述方法还包括:

    确定所述待评价图像中所述多个人物的位置分布指标数据;

    所述通过预先训练的评价模型对所述目标对象的姿态数据进行处理,得到所述待评价图像的评价结果,包括:

    通过预先训练的评价模型对所述多个人物的姿态数据、所述多个人物的位置分布指标数据进行处理,得到所述待评价图像的评价结果。

    8.根据权利要求7所述的方法,其特征在于,所述确定所述待评价图像中所述多个人物的位置分布指标,包括:

    计算所述每个人物距离所述待评价图像中基准点的距离,并根据所述距离确定所述多个人物之间的聚拢指标数据;

    根据所述每个人物的骨骼关键特征点,确定所述多个人物排列的有序指标数据。

    9.根据权利要求1所述的方法,其特征在于,所述方法还包括:

    检测所述待评价图像中的场景元素;

    确定所述场景元素与所述目标对象的位置关系数据;

    所述通过预先训练的评价模型对所述目标对象的姿态数据进行处理,得到所述待评价图像的评价结果,包括:

    通过预先训练的评价模型对所述目标对象的姿态数据和所述位置关系数据进行处理,得到所述待评价图像的评价结果。

    10.根据权利要求1所述的方法,其特征在于,所述方法还包括:

    根据所述待评价图像的评价结果,向用户发送关于目标对象的引导提示信息。

    11.根据权利要求1所述的方法,其特征在于,所述获取待评价图像,包括:

    获取由摄像模组采集的待评价图像;

    在得到所述待评价图像的评价结果之后,所述方法还包括:

    在图像采集的预览显示界面显示所述待评价图像的评价结果。

    12.根据权利要求11所述的方法,其特征在于,在得到所述待评价图像的评价结果之后,所述方法还包括:

    在所述评价结果满足预设条件时,触发所述摄像模组进行图像拍摄。

    13.根据权利要求1所述的方法,其特征在于,在获取待评价图像之后,所述方法还包括:

    对所述待评价图像进行预处理;

    其中,所述预处理包括对所述待评价图像进行图像尺寸归一化、图像增强、图像去噪、图像锐化中的一种或多种处理。

    14.一种图像评价装置,其特征在于,包括:

    图像获取模块,用于获取待评价图像,所述待评价图像中包括至少一个目标对象;

    特征点提取模块,用于从所述待评价图像中提取关于所述目标对象的关键特征点;

    数据确定模块,用于根据所述关键特征点确定所述目标对象的姿态数据;

    数据处理模块,用于通过预先训练的评价模型对所述目标对象的姿态数据进行处理,得到所述待评价图像的评价结果。

    15.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至13任一项所述的方法。

    16.一种电子设备,其特征在于,包括:

    处理器;以及

    存储器,用于存储所述处理器的可执行指令;

    其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至13任一项所述的方法。

    技术总结
    本公开提供一种图像评价方法、图像评价装置、计算机可读存储介质与电子设备,涉及图像处理技术领域。该图像评价方法包括:获取待评价图像,所述待评价图像中包括至少一个目标对象;从所述待评价图像中提取关于所述目标对象的关键特征点;根据所述关键特征点确定所述目标对象的姿态数据;通过预先训练的评价模型对所述目标对象的姿态数据进行处理,得到所述待评价图像的评价结果。本公开可以根据目标对象的姿态数据,对待评价图像进行有效评价。

    技术研发人员:王愈
    受保护的技术使用者:OPPO(重庆)智能科技有限公司
    技术研发日:2020.12.14
    技术公布日:2021.03.12

    转载请注明原文地址:https://wp.8miu.com/read-16426.html

    最新回复(0)