基于MTCNN网络模型的人脸检测方法及装置、终端与流程

    专利2022-07-08  101


    本发明涉及大数据处理
    技术领域
    ,具体地涉及一种基于mtcnn网络模型的人脸检测方法及装置、终端。
    背景技术
    :随着数据应用的快速增长及计算机算力的大幅度提升,近年来深度学习在计算机视觉的应用已经变得越来越广泛,其效果相较于传统技术已有很大的提升。目前以深度学习为主的计算机视觉算法主要研究方向为:目标检测、目标分类、目标识别,而目标检测是目标分类及目标识别的前提,直接关系到目标分类及目标识别的准确度和效率,所以当前以深度学习为主流的计算机视觉(computerversion,简称cv)人脸检测算法的好坏直接导致人脸识别的准确度及效率。以快速的基于区域的神经网络(fastregion-basedconvolutionalnetwork,简称fastr-cnn)系列为主的深度学习cv人脸检测算法,这一系列算法的准确度较高,优点是性能较高,缺点是速度较慢,很难在图形处理器(graphicprocessingunit,简称gpu)上实时进行人脸检测。考虑到性能不是问题,因而,在嵌入式设备、或者对人脸检测速度要求极高的高尖端设备上使用时,fastr-cnn技术的研究重点就在于提升效率。如何基于嵌入式设备提升人脸检测效率还需进一步研究。技术实现要素:本发明解决的技术问题是如何基于嵌入式设备提升人脸检测效率。为解决上述技术问题,本发明实施例提供一种基于mtcnn网络模型的人脸检测方法,包括:确定样本数据集;基于所述样本数据集,训练所述mtcnn网络模型;使用训练后的mtcnn网络模型检测待检测图像中的人脸;其中,所述mtcnn网络模型包括级联的p-net网络、r-net网络和o-net网络,所述p-net网络、r-net网络和o-net网络各自包含多个卷积层,每一卷积层包括卷积核,所述卷积核对输入的数据进行深度向卷积和1×1逐点卷积。可选的,所述p-net网络包括3个级联的卷积层,每一卷积层的卷积核对输入的数据进行m×m深度向卷积和1×1逐点卷积;其中,m>1,且m是正整数。可选的,所述r-net网络包括3个级联的卷积层,且排序在前的2个卷积层的卷积核对输入的数据进行m×m深度向卷积和1×1逐点卷积,排序在后的1个卷积层的卷积核对输入的数据进行p×p深度向卷积和1×1逐点卷积;其中,m>p>1,且p是正整数。可选的,所述o-net网络包括4个级联的卷积层,且排序在前的3个卷积层的卷积核对输入的数据进行m×m深度向卷积和1×1逐点卷积,排序在后的1个卷积层的卷积核对输入的数据进行p×p深度向卷积和1×1逐点卷积。可选的,m=3,p=2。可选的,训练所述mtcnn网络模型时,采用如下公式确定人脸检测的损失函数:其中,表示第i个样本的损失函数,pi表示所述mtcnn网络模型输出的所述第i个样本为人脸的概率,表示所述第i个样本的真实标注,i为正整数。为解决上述技术问题,本发明实施例还提供一种基于mtcnn网络模型的人脸检测装置,包括:确定模块,用于确定mtcnn网络模型为人脸检测模型及样本数据集;训练模,基于所述样本数据集,训练所述mtcnn网络模型;检测模块,使用训练后的mtcnn网络模型检测待检测图像中的人脸;其中,所述mtcnn网络模型包括级联的p-net网络、r-net网络和o-net网络,所述p-net网络、r-net网络和o-net网络各自包含多个卷积层,每一卷积层包括卷积核,所述卷积核对输入的数据进行深度向卷积和1×1逐点卷积。可选的,所述p-net网络包括3个级联的卷积层,每一卷积层的卷积核对输入的数据进行m×m的深度向卷积模块和1×1的逐点卷积模块;其中,m>1,且m是正整数。为解决上述技术问题,本发明实施例还提供一种存储介质,其上存储有计算机指令,所述计算机指令运行时执行上述方法的步骤。为解决上述技术问题,本发明实施例还提供一种终端,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行上述方法的步骤。与现有技术相比,本发明实施例的技术方案具有以下有益效果:本发明实施例提供一种基于mtcnn网络模型的人脸检测方法,包括:确定样本数据集;基于所述样本数据集,训练所述mtcnn网络模型;使用训练后的mtcnn网络模型检测待检测图像中的人脸;其中,所述mtcnn网络模型包括级联的p-net网络、r-net网络和o-net网络,所述p-net网络、r-net网络和o-net网络各自包含多个卷积层,每一卷积层包括卷积核,所述卷积核对输入的数据进行深度向卷积和1×1逐点卷积。本发明实施例通过采用mtcnn网络模型,基于级联的p-net网络、r-net网络、o-net网络采用的深度向卷积运算和逐点卷积运算,可以有效减少计算量,在保证人脸检测精度的前提下,提高人脸检测算法的效率及性能,从而实现人脸的实时检测。进一步,所述p-net网络包括3个级联的卷积层,每一卷积层的卷积核对输入的数据进行m×m深度向卷积和1×1逐点卷积;其中,m>1,且m是正整数。本发明实施例通过在m×m深度向卷积之后进行1×1逐点卷积,可以简化计算过程,进一步为实现人脸实时监测提供可能。附图说明图1是本发明实施例的一种基于mtcnn网络模型的人脸检测方法的流程示意图;图2是本发明实施例的一种标准的卷积核的结构示意图;图3是本发明实施例的一种深度向卷积核分解的结构示意图;图4是本发明实施例的一种逐点卷积核分解的结构示意图;图5是本发明实施例的一种mtcnn网络结构示意图;图6是本发明实施例的一种基于mtcnn网络模型的人脸检测装置的结构示意图。具体实施方式如
    背景技术
    所言,现有技术中,基于嵌入式设备进行人脸检测的效率还有待进一步提升。现有技术中,以单次多窗口检测(singleshotmulti-boxdetector,简称ssd)算法为主的深度学习计算机视觉人脸检测算法的优势是速度较快。在gpu上基本能够达到实时的人脸检测效果,缺点是对目标尺寸小的人脸检测效果较差,这类方法的研究重点是提高密集度小的人脸检测性能,同时速度也需要提高,从而满足gpu的实时人脸检测,甚至是嵌入式设备的实时人脸检测。经过分析当前主流的深度学习计算机视觉人脸检测技术,以fastr-cnn系列为主的深度学习计算机视觉人脸检测算法的普遍缺点是速度不快,需要提高人脸检测的效率;而ssd系列为主的深度学习计算机视觉人脸检测算法存在的缺点是小尺度目标检测不准,同时需要提高算法的效率及人脸检测的实时性,甚至是移植嵌入式设备实现实时的人脸检测。本发明实施例提供一种基于mtcnn网络模型的人脸检测方法,包括:确定样本数据集;基于所述样本数据集,训练所述mtcnn网络模型;使用训练后的mtcnn网络模型检测待检测图像中的人脸;其中,所述mtcnn网络模型包括级联的p-net网络、r-net网络和o-net网络,所述p-net网络、r-net网络和o-net网络各自包含多个卷积层,每一卷积层包括卷积核,所述卷积核对输入的数据进行深度向卷积和1×1逐点卷积。本发明实施例通过采用mtcnn网络模型,基于级联的p-net网络、r-net网络、o-net网络采用的深度向卷积运算和逐点卷积运算,可以有效减少计算量,在保证人脸检测精度的前提下,提高人脸检测算法的效率及性能,从而实现人脸的实时检测。为使本发明的上述目的、特征和有益效果能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。图1是本发明实施例的一种基于mtcnn网络模型的人脸检测方法的流程示意图。所述人脸检测方法可以应用于嵌入式设备,以对人脸进行检测。具体而言,所述人脸检测方法可以包括以下步骤:步骤s101,确定样本数据集;步骤s102,基于所述样本数据集,训练所述mtcnn网络模型;步骤s103,使用训练后的mtcnn网络模型检测待检测图像中的人脸。其中,所述mtcnn网络模型包括级联的建议网络(proposalnetwork,简称p-net网络)、精细网络(refinementnetwork,简称r-net网络)、输出网络(outputnetwork,简称o-net网络),所述p-net网络、r-net网络和o-net网络各自包含多个卷积层,每一卷积层包括一个或多个卷积核,所述卷积核对输入的数据进行深度向卷积和1×1逐点卷积。本领域技术人员理解,对于p-net网络而言,其输入的数据可以是外部输入的图像数据,也可以是对外部输入的原始图像进行了预处理得到的图像数据。对于r-net网络而言,其输入的数据可以是所述p-net网络的输出数据,该输出数据是所述图像数据的特征映射(featuremap),所述o-net网络的输入数据是所述r-net网络的输出数据。更具体而言,在步骤s101中,可以确定样本数据集。本领域技术人员理解,所述样本数据集可以直接影响训练的精度及人脸检测的效果,因而在训练mtcnn网络模型之前,将所述样本数据集处理成与所述mtcnn网络模型适配的格式是必不可少的步骤。在具体实施中,所述p-net网络可以包括3个级联的卷积层,3个卷积层的卷积操作是相似的,每一卷积层的卷积核都是对输入的数据进行m×m深度向卷积和1×1逐点卷积;其中,m>1,且m是正整数。在一个实施例中,m=3。在具体实施中,所述r-net网络可以包括3个级联的卷积层,且排序在前的第一个卷积层对输入的数据进行m×m深度向卷积和1×1逐点卷积。之后,将卷积结果输入至第二个卷积层,所述第二个卷积层的卷积核对输入的数据进行m×m深度向卷积和1×1逐点卷积。进一步,第二个卷积层的卷积结果输入至排序在后的最后一个卷积层,所述最后一个卷积层的卷积核对输入的数据进行p×p深度向卷积和1×1逐点卷积;其中,m>p>1,且p是正整数。在一个实施例中,m=3,p=2。在具体实施中,所述o-net网络包括4个级联的卷积层,且排序在前的3个卷积层的卷积核对输入的数据进行m×m深度向卷积和1×1逐点卷积,最后一个卷积层的卷积核对输入的数据进行p×p深度向卷积和1×1逐点卷积。在步骤s102中,可以基于所述样本数据集,训练所述mtcnn网络模型。具体而言,在训练过程中,需要训练得到p-net网络、r-net网络和o-net网络的参数,为检测人脸做准备。训练所述mtcnn网络模型时,可以采用如下公式确定人脸检测的损失函数:其中,表示第i个样本的损失函数,pi表示所述mtcnn网络模型输出的所述第i个样本为人脸的概率,表示所述第i个样本的真实标注,i为正整数。在步骤s103中,可以使用训练后的mtcnn网络模型检测待检测图像中的人脸。在具体实施中,所述p-net网络用于检测外部输入图像中的人脸,并确定所述人脸的多个人脸候选框;所述r-net网络用于确定并滤除所述多个人脸候选框中,冗余的人脸候选框;所述o-net网络用于输出所述外部输入图像中的人脸检测结果。下面以嵌入式设备qg66平台为例,对本发明实施例进行详细阐述。首先搭建qg66人脸检测开发平台硬件环境。其中,qg66开发平台套件包括:带显示屏的qg66开发板、12v电源适配器、usb线、ft232串口、串口线、正负极电源线、2.0usb盘。其次,可以分析mtcnn网络处理过程,量化并移植mtcnn网络模型。在具体实施中,首先选取样本数据集。所述样本数据集的选择非常重要,可以直接导致损失函数的收敛及人脸检测的精度。具体而言,可以调整(resize)所述样本数据集中的图像数据为不同尺寸,为输入至所述mtcnn网络模型作准备。需要说明的是,所述样本数据集的选择与重叠度(intersectionoverunion,简称iou)有关,iou的公式为边界框(boundingbox)与地面实况(groundtruth)的交集与边界框与地面实况的并集之比。在一个非限制性的例子中,可以选择iou大于0.55的数据作为正样本,所述正样本指的是包含人脸的训练样本;选择iou小于0.25的数据作为负样本,所述负样本指的是不包含人脸的训练样本;选择iou大于0.35,且小于0.55的数据作为部分人脸样本;关键点样本标注了人脸五个关键点坐标。在训练时,负样本和正样本用于是否为人脸的分类训练;正样本和部分人脸样本用于检测框回归训练;所述关键点样本则用于人脸关键点的训练。在具体实施中,mtcnn人脸检测技术主要利用深度卷积分解的级联卷积神经网络架构,即:将深度神经网络架构级联成p-net网络、r-net网络、o-net网络的分块网络结构,每一块网络结构的卷积使用深度向卷积分解代替传统的普通卷积。深度向卷积分解主要通过将标准卷积分解成一个深度卷积和一个点卷积(1×1卷积核)。深度卷积将每个卷积核应用到每个通道,而1×1卷积用来组合通道卷积的输出。卷积的分解可以减少网络的计算量,从而精简化训练的网络模型提高人脸检测的速度,具体实现算法结构分解如图2至图4所示。图2是本发明实施例的一种标准的卷积核的结构示意图。其中,c为卷积核的通道数,h、w分别表示卷积核的高度及宽度,n表示输出特征的通道数。若输出的卷积核的高度、宽度分别为g、k,标准卷积核的计算量s,则标准卷积核的计算量s=w*h*c*n*g*k,其中,*代表乘法。图3是本发明实施例的一种深度向卷积核分解的结构示意图。图4中,1表示该卷积核为单通道,h、w表示卷积核的高度及宽度,c表示输出特征的通道数。若输出的卷积核的高度、宽度分别为g、k,其中一部分积核的计算量为s1,则一部分积核的计算量s1=w*h*1*c*g*k。图4是本发明实施例的一种逐点卷积核分解的结构示意图。图5中,c表示该卷积核的通道数,1表示卷积核的高度及宽度,n表示输出特征的通道数。若输出的卷积核的高度、宽度分别为g、k,另一部分积核的计算量为s2,则另一部分积核的计算量s2=1*1*c*n*g*k。经过图3和图4的卷积核分解的计算量与标准卷积的计算量(以p表示)比较可以得出:可见,深度向卷积分解的计算量将降低到原来的p倍数,这将有利于减小训练的模型,轻量化模型到嵌入式端,提高人脸检测速度。图5是本发明实施例的一种mtcnn网络模型的结构示意图。在具体实施中,所述mtcnn网络模型由深度向卷积分解的p-net网络、r-net网络、o-net网络级联组成。参考图5,mtcnn网络模型包括p-net网络、r-net网络和o-net网络。所述p-net网络包括3个级联的卷积层,第一个卷积层511、第二个卷积层521和第三个卷积层531。外部图像数据或经过预处理的外部图像数据51输入至第一个卷积层511,经第一个卷积层511卷积后,得到特征映射52。类似地,特征映射52输入至第二个卷积层521,输出特征映射53;特征映射53输入至第三个卷积层531,得到特征映射54。其中,各个卷积层的卷积核为深度向分解结构,包括3x3的深度向卷积和1x1的逐点卷积,作用是判断图像中是否有人脸、并检测出人脸框的区域及人脸关键点的位置,然后通过非极大值抑制(non-maximumsuppression,简称nms)算法去除冗余的候选框,为r-net网络提供人脸候选框。在一个实施例中,假设外部图像数据或经过预处理的外部图像数据51的尺寸(size)为12×12×3,那么经第一个卷积层511后的输出特征映射52的尺寸为5×5×10,特征映射53的尺寸为3×3×16,特征映射54的尺寸为1×1×32。进一步,得到1×1×2的人脸类型(faceclassify),4×1边界框回归(boundingboxregression)和10×1人脸关键点定位(faciallandmarklocation)。所述r-net网络也包含3个级联的卷积层(图示以空心箭头551、561和571表示),第一个卷积层551和第二个卷积层561的卷积核为3x3的深度向卷积和1x1的逐点卷积,第三个卷积层571的卷积核为2x2的深度向卷积和1x1的逐点卷积,而且增加了全连接层581,经全连接层581的运算后得到输出数据59。所述p-net网络的输出得到的人脸检测结果级联输入到r-net网络,此时对初步检测到的人脸框进一步细化,通过nms算法过滤掉部分冗余人脸框,获取更加准确的人脸框且剔除掉更多的冗余框。在一个实施例中,假设r-net网络的输入数据55的尺寸(size)为24×24×3,那么经第一个卷积层551后的输出特征映射56的尺寸为11×11×28,特征映射57的尺寸为4×4×48,特征映射58的尺寸为3×3×64。进一步,在经全连接层581的运算后得到128×1的输出数据59。而且,还可以得到2×1的人脸类型,4×1边界框回归和10×1人脸关键点定位。所述o-net网络与r-net的网络结构相比,多了一个3x3的深度向卷积和1x1的逐点卷积,r-net网络的输出是o-net网络的输入,共4个级联的卷积层,包括第一个卷积层601、第二个卷积层611、第三个卷积层621和第四个卷积层631以及全连接层641(图中以黑色箭头表示)。所述o-net网络对r-net网络的输出是否为人脸图像作进一步判定,一方面对人脸检测框坐标进行进一步的细化,另一方面输出人脸关键点坐标进行细化。所述o-net网络输出可以包含三部分:第一部分为检测为人脸概率的判定,第二部分为人脸检测框坐标的定位,第三部为人脸关键点坐标的定位。在一个实施例中,所述o-net网络的输入数据60的尺寸为48×48×3,所述第一个卷积层601的输出数据61的尺寸为23×23×32。所述第二个卷积层611的输出数据62的尺寸为10×10×64。所述第三个卷积层621的输出数据63的尺寸为4×4×64。所述第四个卷积层631的输出数据64的尺寸为3×3×128。所述全连接层641的输出数据65的尺寸为256×1。而且,还可以得到2×1的人脸类型,4×1边界框回归和10×1人脸关键点定位。进一步,需要对所述mtcnn网络模型进行训练。具体而言,深度向卷积分解的mtcnn网络模型中的每个网络都有3个输出,对应有三个损失函数,人脸检测部分的损失函数可以使用交叉熵损失函数,对于每一个样本xi损失函数为:其中,表示第i个样本的损失函数,pi表示所述mtcnn网络模型输出的所述第i个样本为人脸的概率,表示所述第i个样本的真实标注,i为正整数。人脸边界框回归(boundingboxregression)损失函数公式如下所示:其中,表示网络输出的人脸边框回归值,包括人脸检测边框的左上角的坐标、及边框的宽度、高度值;表示边框的真实值。人脸关键点损失函数公式如下所示:其中,表示网络输出的人脸关键点的回归值,包括人脸关键点的左眼、右眼、鼻子、左嘴角、右嘴角的坐标值,表示人脸关键点真实坐标值,||·||2表示欧式范数。将三个损失函数进行加权累加,得到总损失函数为:其中,loss为总损失;n代表训练的样本数,λj代表损失函数的权重,代表样本类型,取值为样本与的取值关系表如表1所示:表1样本γdetγboxγlandmark正样本110负样本100部分人脸样本010人脸关键点样本001之后,对人脸检测结果进行分析。具体而言,可以将训练好的网络模型进行量化并编译到qg66平台,在qg66串口执行人脸检测模型指令,打印串口log记录人脸检测数据,并观测本发明在该平台的实时人脸检测效果。分析qg66平台人脸实时检测结果及输出情况,人脸检测结果、置信度分值、人脸关键点定位标准。在一测试结果中可以发现,人脸检测结果的置信度为0.941593,可以标注人脸关键点检测结果。当人脸晃动时,可以实时的跟踪检测到人脸的置信度分值,人脸检测区域,人脸关键点检测结果,在测试中可以发现,应用本发明实施例可以检测到较小的人脸尺寸。综上所述,本发明实施例提出的基于mtcnn网络模型的人脸检测方法,不仅有效保证人脸检测精度,还可以提高人脸检测的效率及性能,从而实现适用于嵌入式设备qg66平台的人脸实时检测。图6是本发明实施例的一种基于mtcnn网络模型的人脸检测装置的结构示意图。所述基于mtcnn网络模型的人脸检测装置6(以下简称人脸检测装置6)可以用于实施图1、图3和图4所述方法技术方案,由嵌入式设备执行。具体而言,所述人脸检测装置6可以包括:确定模块61,用于确定样本数据集;训练模块62,基于所述样本数据集,训练所述mtcnn网络模型;检测模块63,用于使用训练后的mtcnn网络模型检测待检测图像中的人脸;其中,所述mtcnn网络模型包括级联的p-net网络、r-net网络和o-net网络,所述p-net网络、r-net网络和o-net网络各自包含多个卷积层,每一卷积层包括卷积核,所述卷积核对输入的数据进行深度向卷积和1×1逐点卷积。关于所述人脸检测装置6的工作原理、工作方式的更多内容,可以参照上述图1、图3和图4中所述技术方案的相关描述,这里不再赘述。进一步地,本发明实施例还公开一种存储介质,其上存储有计算机指令,所述计算机指令运行时执行上述图1、图3和图4所示实施例中所述的方法技术方案。优选地,所述存储介质可以包括诸如非挥发性(non-volatile)存储器或者非瞬态(non-transitory)存储器等计算机可读存储介质。所述计算机可读存储介质可以包括rom、ram、磁盘或光盘等。进一步地,本发明实施例还公开一种终端,包括存储器和处理器,所述存储器上存储有能够在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行上述图1、图3和图4所示实施例中所述的方法技术方案。优选地,所述终端为嵌入式设备,例如,型号为qg66的嵌入式设备。虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。当前第1页1 2 3 
    技术特征:

    1.一种基于mtcnn网络模型的人脸检测方法,其特征在于,包括:

    确定样本数据集;

    基于所述样本数据集,训练所述mtcnn网络模型;

    使用训练后的mtcnn网络模型检测待检测图像中的人脸;

    其中,所述mtcnn网络模型包括级联的p-net网络、r-net网络和o-net网络,所述p-net网络、r-net网络和o-net网络各自包含多个卷积层,每一卷积层包括卷积核,所述卷积核对输入的数据进行深度向卷积和1×1逐点卷积。

    2.根据权利要求1所述的人脸检测方法,其特征在于,所述p-net网络包括3个级联的卷积层,每一卷积层的卷积核对输入的数据进行m×m深度向卷积和1×1逐点卷积;其中,m>1,且m是正整数。

    3.根据权利要求2所述的人脸检测方法,其特征在于,所述r-net网络包括3个级联的卷积层,且排序在前的2个卷积层的卷积核对输入的数据进行m×m深度向卷积和1×1逐点卷积,排序在后的1个卷积层的卷积核对输入的数据进行p×p深度向卷积和1×1逐点卷积;其中,m>p>1,且p是正整数。

    4.根据权利要求3所述的人脸检测方法,其特征在于,所述o-net网络包括4个级联的卷积层,且排序在前的3个卷积层的卷积核对输入的数据进行m×m深度向卷积和1×1逐点卷积,排序在后的1个卷积层的卷积核对输入的数据进行p×p深度向卷积和1×1逐点卷积。

    5.根据权利要求3或4所述的人脸检测方法,其特征在于,m=3,p=2。

    6.根据权利要求1所述的人脸检测方法,其特征在于,训练所述mtcnn网络模型时,采用如下公式确定人脸检测的损失函数:

    其中,表示第i个样本的损失函数,pi表示所述mtcnn网络模型输出的所述第i个样本为人脸的概率,表示所述第i个样本的真实标注,i为正整数。

    7.一种基于mtcnn网络模型的人脸检测装置,其特征在于,包括:

    确定模块,用于确定mtcnn网络模型为人脸检测模型及样本数据集;

    训练模,基于所述样本数据集,训练所述mtcnn网络模型;

    检测模块,使用训练后的mtcnn网络模型检测待检测图像中的人脸;

    其中,所述mtcnn网络模型包括级联的p-net网络、r-net网络和o-net网络,所述p-net网络、r-net网络和o-net网络各自包含多个卷积层,每一卷积层包括卷积核,所述卷积核对输入的数据进行深度向卷积和1×1逐点卷积。

    8.根据权利要求7所述的人脸检测装置,其特征在于,所述p-net网络包括3个级联的卷积层,每一卷积层的卷积核对输入的数据进行m×m的深度向卷积模块和1×1的逐点卷积模块;其中,m>1,且m是正整数。

    9.一种存储介质,其上存储有计算机指令,其特征在于,所述计算机指令运行时执行权利要求1至6任一项所述方法的步骤。

    10.一种终端,包括存储器和处理器,所述存储器上存储有能够在所述处理器上运行的计算机指令,其特征在于,所述处理器运行所述计算机指令时执行权利要求1至6任一项所述方法的步骤。

    技术总结
    一种基于MTCNN网络模型的人脸检测方法及装置、终端,所述人脸检测方法包括:确定样本数据集;基于所述样本数据集,训练所述MTCNN网络模型;使用训练后的MTCNN网络模型检测待检测图像中的人脸;其中,所述MTCNN网络模型包括级联的P‑Net网络、R‑Net网络和O‑Net网络,所述P‑Net网络、R‑Net网络和O‑Net网络各自包含多个卷积层,每一卷积层包括卷积核,所述卷积核对输入的数据进行深度向卷积和1×1逐点卷积。本发明提供的方案可以用于嵌入式设备,且可以提升人脸检测效率。

    技术研发人员:达声蔚
    受保护的技术使用者:上海齐感电子信息科技有限公司
    技术研发日:2019.09.12
    技术公布日:2021.03.12

    转载请注明原文地址:https://wp.8miu.com/read-19918.html

    最新回复(0)