视频帧的生成方法及装置、存储介质、电子设备与流程

    专利2022-07-07  98


    本发明涉及数据安全领域,具体而言,涉及一种视频帧的生成方法及装置、存储介质、电子设备。



    背景技术:

    相关技术中,随着ai、大数据、云计算等技术的发展,安防产品在能力上突破了过去的局限,呈现出高清化和智能化的发展方向。

    相关技术中,智能摄像头具备人脸识别功能。人脸识别可以快速有效地进行陌生人判定,但是,人脸识别也带来了用户隐私的问题。比如存储在云端的视频流文件被泄露,黑客利用网络漏洞直接窃取用户的直播画面等,导致家庭用户隐私信息很可能被泄露。同时,对于脸部图像的恶意传播很可能会带来信息安全、网络暴力、肖像侵犯等诸多问题。

    针对相关技术中存在的上述问题,目前尚未发现有效的解决方案。



    技术实现要素:

    本发明实施例提供了一种视频帧的生成方法及装置、存储介质、电子设备,以解决相关技术不能保护视频帧中的用户隐私的技术问题。

    根据本申请实施例的一个方面,提供了一种视频帧的生成方法,包括:采集第一视频帧;判断所述第一视频帧中是否包括预设用户集的人脸画面;若所述第一视频帧中包括预设用户集的人脸画面,将所述第一视频帧中的人脸画面替换为预设遮挡画面,以生成第二视频帧。

    进一步,判断所述第一视频帧中是否包括预设用户集的人脸画面包括:提取所述第一视频帧中的人脸特征向量;判断所述人脸特征向量与所述预设用户集的预设特征向量是否匹配,其中,所述预设用户集对应若干个预设用户,每个预设用户对应一个预设特征向量;若所述人脸特征向量与所述预设用户集中任一预设用户的预设特征向量匹配,确定所述第一视频帧中包括预设用户集的人脸画面;若所述人脸特征向量与所述预设用户集中所有预设用户的预设特征向量均不匹配,确定所述第一视频帧中不包括预设用户集的人脸画面。

    进一步,判断所述人脸特征向量与所述预设用户集的预设特征向量是否匹配包括:将所述人脸特征向量输入逻辑回归softmax人脸识别模型,并输出所述人脸特征向量所属的特征区域,其中,所述softmax人脸识别模型使用十字交叉熵损失函数进行特征约束;若所述人脸特征向量所属的特征区域为预设用户区域,判定所述人脸特征向量与所述预设用户集中任一预设用户的预设特征向量匹配;所述人脸特征向量所属的特征区域为陌生用户区域,判定所述人脸特征向量与所述预设用户集中所有预设用户的预设特征向量均不匹配。

    进一步,将所述第一视频帧中的人脸画面替换为预设遮挡画面包括:识别所述人脸画面对应的用户角色;在遮挡画面列表中选择与所述用户角色匹配的预设遮挡画面,并将所述第一视频帧中的人脸画面替换为所述预设遮挡画面。

    进一步,将所述第一视频帧中的人脸画面替换为预设遮挡画面包括:识别所述人脸画面对应的用户角色;提取所述人脸画面的表情特征信息,并选择与所述用户角色匹配的虚拟形象角色;将所述表情特征信息和所述虚拟形象角色输入至生成对抗网络,并输出与所述人脸画面对应的虚拟形象人脸;将所述第一视频帧中的人脸画面替换为虚拟形象人脸。

    进一步,识别所述人脸画面对应的用户角色包括:将所述第一视频帧中的人脸特征向量输入三元组triplet人脸识别模型,并输出所述人脸特征向量到各个预设角色特征之间的特征间隔,其中,所述triplet人脸识别模型使用三元组损失函数进行特征约束,每个预设角色特征对应所述预设用户集中的一个用户角色;将特征间隔最小的用户角色选择为与所述人脸画面对应的用户角色。

    进一步,在判断所述第一视频帧中是否包括预设用户集的第一人脸画面之后,所述方法还包括:若所述第一视频帧中不包括预设用户集的人脸画面,判断所述第一视频帧中是否包括陌生用户的第二人脸画面,其中,所述陌生用户为除所述预设用户之外的其他用户;若所述第一视频帧中包括陌生用户的第二人脸画面,截取所述第二人脸画像,并基于所述第二人脸画像生成告警信息,其中,所述告警信息用于指示出现陌生人员。

    根据本申请实施例的另一个方面,还提供了一种视频帧的生成装置,包括:采集模块,用于采集第一视频帧;第一判断模块,用于判断所述第一视频帧中是否包括预设用户集的人脸画面;替换模块,用于若所述第一视频帧中包括预设用户集的人脸画面,将所述第一视频帧中的人脸画面替换为预设遮挡画面,以生成第二视频帧。

    进一步,所述第一判断模块包括:提取单元,用于提取所述第一视频帧中的人脸特征向量;判断单元,用于判断所述人脸特征向量与所述预设用户集的预设特征向量是否匹配,其中,所述预设用户集对应若干个预设用户,每个预设用户对应一个预设特征向量;确定单元,用于若所述人脸特征向量与所述预设用户集中任一预设用户的预设特征向量匹配,确定所述第一视频帧中包括预设用户集的人脸画面;若所述人脸特征向量与所述预设用户集中所有预设用户的预设特征向量均不匹配,确定所述第一视频帧中不包括预设用户集的人脸画面。

    进一步,所述判断单元包括:处理子单元,用于将所述人脸特征向量输入逻辑回归softmax人脸识别模型,并输出所述人脸特征向量所属的特征区域,其中,所述softmax人脸识别模型使用十字交叉熵损失函数进行特征约束;判断子单元,用于若所述人脸特征向量所属的特征区域为预设用户区域,判定所述人脸特征向量与所述预设用户集中任一预设用户的预设特征向量匹配;所述人脸特征向量所属的特征区域为陌生用户区域,判定所述人脸特征向量与所述预设用户集中所有预设用户的预设特征向量均不匹配。

    进一步,所述替换模块包括:识别单元,用于识别所述人脸画面对应的用户角色;第一替换单元,用于在遮挡画面列表中选择与所述用户角色匹配的预设遮挡画面,并将所述第一视频帧中的人脸画面替换为所述预设遮挡画面。

    进一步,所述替换模块包括:识别单元,用于识别所述人脸画面对应的用户角色;第一处理单元,用于提取所述人脸画面的表情特征信息,并选择与所述用户角色匹配的虚拟形象角色;第二处理单元,用于将所述表情特征信息和所述虚拟形象角色输入至生成对抗网络,并输出与所述人脸画面对应的虚拟形象人脸;第二替换单元,用于在将所述第一视频帧中的人脸画面替换为虚拟形象人脸。

    进一步,所述识别单元包括:处理子单元,用于将所述第一视频帧中的人脸特征向量输入三元组triplet人脸识别模型,并输出所述人脸特征向量到各个预设角色特征之间的特征间隔,其中,所述triplet人脸识别模型使用三元组损失函数进行特征约束,每个预设角色特征对应所述预设用户集中的一个用户角色;选择子单元,用于将特征间隔最小的用户角色选择为与所述人脸画面对应的用户角色。

    进一步,所述装置还包括:第二判断模块,用于在所述第一判断模块判断所述第一视频帧中是否包括预设用户集的第一人脸画面之后,若所述第一视频帧中不包括预设用户集的人脸画面,判断所述第一视频帧中是否包括陌生用户的第二人脸画面,其中,所述陌生用户为除所述预设用户之外的其他用户;生成模块,用于若所述第一视频帧中包括陌生用户的第二人脸画面,截取所述第二人脸画像,并基于所述第二人脸画像生成告警信息,其中,所述告警信息用于指示出现陌生人员。

    根据本申请实施例的另一方面,还提供了一种存储介质,该存储介质包括存储的程序,程序运行时执行上述的步骤。

    根据本申请实施例的另一方面,还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;其中:存储器,用于存放计算机程序;处理器,用于通过运行存储器上所存放的程序来执行上述方法中的步骤。

    本申请实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述方法中的步骤。

    通过本发明,采集第一视频帧,判断第一视频帧中是否包括预设用户集的人脸画面,若第一视频帧中包括预设用户集的人脸画面,将第一视频帧中的人脸画面替换为预设遮挡画面,以生成第二视频帧,通过识别第一视频帧中的人脸画面,并将预设用户集的人脸画面替换为预设遮挡画面,再生成第二视频帧,使得实时视频画面以及待上传的回放录像中都不会包含预设用户集的原人脸,从而对用户隐私进行保护,解决了相关技术不能保护视频帧中的用户隐私的技术问题,降低了视频数据的泄露风险,提高了视频数据传输的安全性。

    附图说明

    此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

    图1是本发明实施例的一种摄像头的硬件结构框图;

    图2是根据本发明实施例的一种视频帧的生成方法的流程图;

    图3是本发明实施例中针对人脸隐私保护的轻量化级联神经网络原理图;

    图4是本发明实施例人脸隐私保护的流程图;

    图5是根据本发明实施例的一种视频帧的生成装置的结构框图。

    具体实施方式

    为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。

    需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

    实施例1

    本申请实施例一所提供的方法实施例可以在摄像头、手机、平板或者类似的影像装置中执行。以运行在摄像头上为例,图1是本发明实施例的一种摄像头的硬件结构框图。如图1所示,摄像头10可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器mcu或可编程逻辑器件fpga等的处理装置)和用于存储数据的存储器104,可选地,上述摄像头还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述摄像头的结构造成限定。例如,摄像头10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。

    存储器104可用于存储摄像头程序,例如,应用软件的软件程序以及模块,如本发明实施例中的一种视频帧的生成方法对应的摄像头程序,处理器102通过运行存储在存储器104内的摄像头程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至摄像头10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

    传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括摄像头10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(networkinterfacecontroller,简称为nic),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(radiofrequency,简称为rf)模块,其用于通过无线方式与互联网进行通讯。

    在本实施例中提供了一种视频帧的生成方法,图2是根据本发明实施例的一种视频帧的生成方法的流程图,如图2所示,该流程包括如下步骤:

    步骤s202,采集第一视频帧;

    本实施例的第一视频帧是原始视频帧或实时视频帧,与实际环境中的画面对应,第一视频帧可能会包括涉及用户隐私的画面,如人脸等。

    步骤s204,判断所述第一视频帧中是否包括预设用户集的人脸画面;

    本实施例的预设用户集是已录入的用户集,如家庭成员集,公司成员集,vip客户集等,预设用户集的人脸区域是本实施例需要保护的隐私区域,当然,也可以是躯干区域,电话号码,身上特定位置的纹身区域,伤疤区域等。

    步骤s206,若第一视频帧中包括预设用户集的人脸画面,将第一视频帧中的人脸画面替换为预设遮挡画面,以生成第二视频帧。

    在生成第二视频帧之后,还可以基于该第二视频帧进行本地保存,进一步压缩编码,传输等。

    通过上述步骤,采集第一视频帧,判断第一视频帧中是否包括预设用户集的人脸画面,若第一视频帧中包括预设用户集的人脸画面,将第一视频帧中的人脸画面替换为预设遮挡画面,以生成第二视频帧,通过识别第一视频帧中的人脸画面,并将预设用户集的人脸画面替换为预设遮挡画面,再生成第二视频帧,使得实时视频画面以及待上传的回放录像中都不会包含预设用户集的原人脸,从而对用户隐私进行保护,解决了相关技术不能保护视频帧中的用户隐私的技术问题,降低了视频数据的泄露风险,提高了视频数据传输的安全性。

    在本实施例的一个实施方式中,判断第一视频帧中是否包括预设用户集的人脸画面包括:

    s11,提取所述第一视频帧中的人脸特征向量;

    s12,判断所述人脸特征向量与所述预设用户集的预设特征向量是否匹配,其中,所述预设用户集对应若干个预设用户,每个预设用户对应一个预设特征向量;

    在一个示例中,判断所述人脸特征向量与所述预设用户集的预设特征向量是否匹配包括:将所述人脸特征向量输入逻辑回归softmax人脸识别模型,并输出所述人脸特征向量所属的特征区域,其中,所述softmax人脸识别模型使用十字交叉熵损失函数进行特征约束;若所述人脸特征向量所属的特征区域为预设用户区域,判定所述人脸特征向量与所述预设用户集中任一预设用户的预设特征向量匹配;所述人脸特征向量所属的特征区域为陌生用户区域,判定所述人脸特征向量与所述预设用户集中所有预设用户的预设特征向量均不匹配。

    可选的,经过softmax回归处理之后的输出为两个特征区域的概率值,形成概率和为1的概率分布,选择概率值大的特征区域为人脸特征向量所属的特征区域。

    s13,若所述人脸特征向量与所述预设用户集中任一预设用户的预设特征向量匹配,确定所述第一视频帧中包括预设用户集的人脸画面;若所述人脸特征向量与所述预设用户集中所有预设用户的预设特征向量均不匹配,确定所述第一视频帧中不包括预设用户集的人脸画面。

    在本实施例的一个实施方式中,将所述第一视频帧中的人脸画面替换为预设遮挡画面包括:识别所述人脸画面对应的用户角色;在遮挡画面列表中选择与所述用户角色匹配的预设遮挡画面,并将所述第一视频帧中的人脸画面替换为所述预设遮挡画面。

    可选的,用户角色为人脸画面的实际用户在预设用户集中的所属角色,如家庭成员中的“爸爸”,公司成员中的“张三”等。

    在该实施方式中,预设遮挡画面可以是一个卡通形象的头像,涂鸦等,通过根据用户角色分配预设遮挡画面,可以在处理后的第二视频帧中定位出用户角色。

    在本实施例的另一个实施方式中,其特征在于,将所述第一视频帧中的人脸画面替换为预设遮挡画面包括:识别所述人脸画面对应的用户角色;提取所述人脸画面的表情特征信息,并选择与所述用户角色匹配的虚拟形象角色;将所述表情特征信息和所述虚拟形象角色输入至生成对抗网络,并输出与所述人脸画面对应的虚拟形象人脸;将所述第一视频帧中的人脸画面替换为虚拟形象人脸。

    可选的,表情特征信息包括眼睛、鼻子、嘴巴的位置信息、人脸的大小和角度等信息,用于表征人脸画面中的面部表情和面部动作。

    可选的,识别所述人脸画面对应的用户角色包括:将所述第一视频帧中的人脸特征向量输入三元组triplet人脸识别模型,并输出所述人脸特征向量到各个预设角色特征之间的特征间隔,其中,所述triplet人脸识别模型使用三元组损失函数进行特征约束,每个预设角色特征对应所述预设用户集中的一个用户角色;将特征间隔最小的用户角色选择为与所述人脸画面对应的用户角色。

    通过引入triplet人脸识别模型,实现了用户角色的快速识别。

    通过十字交叉熵损失和三元组损失的联合优化,特征向量空间将被划分为家庭成员和陌生人两个区域,并且在家庭成员区域中,特征向量满足同角色之间的间隔小,不同角色间的间隔大,从而实现对该家庭成员快速且准确的人脸识别。

    在本实施例的一个实施场景中,在判断所述第一视频帧中是否包括预设用户集的第一人脸画面之后还包括:若所述第一视频帧中不包括预设用户集的人脸画面,判断所述第一视频帧中是否包括陌生用户的第二人脸画面,其中,所述陌生用户为除所述预设用户之外的其他用户;若所述第一视频帧中包括陌生用户的第二人脸画面,截取所述第二人脸画像,并基于所述第二人脸画像生成告警信息,其中,所述告警信息用于指示出现陌生人员。

    图3是本发明实施例中针对人脸隐私保护的轻量化级联神经网络原理图,以预设用户集为家庭成员集为例进行说明,该算法采用轻量级网络快速提取人脸特征向量,然后通过十字交叉熵和三元组损失的级联组合约束网络的优化目标,通过三元组损失函数的优化,使不同人脸映射到特征向量空间时,所间隔的距离尽可能的大,以准确区分人脸所属标签。而十字交叉熵增加了陌生人脸判别约束,将进一步拉开陌生人与家庭成员之间的距离,同时也用于陌生人的快速判定。最后,当triplet检测出准确的角色信息后,将通过对抗生成网络给用户人脸替换为预设的虚拟形象。

    识别神经网络包括建模过程和识别过程,下面进行说明:

    第一步:根据用户对人脸图像的主动标记,将人脸图像划分为家庭成员和陌生人,其中家庭成员还将细分为家庭成员角色;

    第二步:三元组损失函数可直接学习原始图片到欧氏距离空间的映射,使得在欧式空间里的距离直接关联着人脸相似度。本文所述算法首先通过三元组损失从大规模人脸数据集中获得一个具备人脸检测能力的模型,作为摄像头出厂预设的模型。因此在用户初使用阶段,摄像头通过比对检测人脸与标记人脸之间的相似度来判别所属角色;

    第三步:当摄像头收集到一定数量的人脸图像后(本地存储),将通过三元组损失和十字交叉熵损失针对该家庭成员人脸进行定制化的微调优化。其中,第一步中得到的家庭成员和陌生人的标记,用于十字交叉熵损失函数的学习,以快速判定该人脸是否为陌生人;而具体的家庭成员角色标记用于三元组损失函数的学习,以准确区分该人脸在家庭中所扮演的角色。综上,通过十字交叉熵损失和三元组损失的联合优化,特征向量空间将被划分为家庭成员和陌生人两个区域,并且在家庭成员区域中,特征向量满足同角色之间的间隔小,不同角色间的间隔大,从而实现对该家庭成员快速且准确的人脸识别。

    对抗生成网络给用户人脸替换为预设的虚拟形象的过程包括:

    首先检测出真实人脸所属的家庭成员角色及关键特征(包括眼睛、鼻子、嘴巴所在位置、人脸的大小和角度等);

    根据人脸所属的家庭成员角色选择需要生成的虚拟形象角色;

    将对应的虚拟形象角色和关键特征输入至生成对抗网络,通过生成模型和判别模型的互相博弈,获得该人脸对应的虚拟形象人脸;

    用虚拟形象人脸替换掉视频中的真实人脸,最终实现真实人脸到虚拟人脸的转换。

    图4是本发明实施例人脸隐私保护的流程图,如图4所示,包括:

    s41,采用人脸识别算法-softmax分支,判断是否为陌生人;

    s42,如果否,采用人脸识别算法-triplet分支,执行家庭角色判断;

    s43,替换为通用的虚拟形象;

    s44,如果是,保存人脸至本地人脸信息库;

    s45,向用户推送告警信息;

    s46,替换为通用的虚拟形象拟形象。

    当本地ai芯片在监控摄像头中实时视频流中识别到用户的人脸信息后,首先通过人脸识别算法--softmax分支快速判断该人脸是否为陌生人;如果属于家庭成员则通过人脸识别算法--triplet分支准确的判断该人脸在家庭成员中的角色,然后使用相对应的预设虚拟形象替代该用户的原人脸,使得实时直播画面以及待上传的回放录像中都不会包含用户的原人脸,从而能对用户的家庭隐私进行保护;而当识别到非家庭用户的人脸时,将会保存该人脸至本地人脸信息库,并向用户推送告警信息。同时使用通用的虚拟形象替代该用户的原人脸,待设备拥有者添加为家庭成员后再替换为相应的形象,充分保障住户的个人隐私及居家安全。

    本实施例所提出的具有人脸隐私保护功能的智能摄像头,通过内嵌的ai芯片实现一个独立的,在本地运行的人脸识别及保护算法。首先提出一种轻量化的级联神经网络,采用轻量级神经网络快速提取人脸特征向量,然后通过十字交叉熵和三元组损失的级联组合约束网络的优化目标,快速判断人脸是陌生人脸还是具体的家庭成员。如果是家庭成员,则通过ai算法将人脸替换为虚拟形象;如果是陌生人脸,会保存该人脸至本地人脸信息库,并向用户推送告警信息,为住户的居家安全提供更好的保障。

    通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。

    实施例2

    在本实施例中还提供了一种视频帧的生成装置,用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。

    图5是根据本发明实施例的一种视频帧的生成装置的结构框图,如图5所示,该装置包括:采集模块50,第一判断模块52,替换模块54,其中,

    采集模块50,用于采集第一视频帧;

    第一判断模块52,用于判断所述第一视频帧中是否包括预设用户集的人脸画面;

    替换模块54,用于若所述第一视频帧中包括预设用户集的人脸画面,将所述第一视频帧中的人脸画面替换为预设遮挡画面,以生成第二视频帧。

    可选的,所述第一判断模块包括:提取单元,用于提取所述第一视频帧中的人脸特征向量;判断单元,用于判断所述人脸特征向量与所述预设用户集的预设特征向量是否匹配,其中,所述预设用户集对应若干个预设用户,每个预设用户对应一个预设特征向量;确定单元,用于若所述人脸特征向量与所述预设用户集中任一预设用户的预设特征向量匹配,确定所述第一视频帧中包括预设用户集的人脸画面;若所述人脸特征向量与所述预设用户集中所有预设用户的预设特征向量均不匹配,确定所述第一视频帧中不包括预设用户集的人脸画面。

    可选的,所述判断单元包括:处理子单元,用于将所述人脸特征向量输入逻辑回归softmax人脸识别模型,并输出所述人脸特征向量所属的特征区域,其中,所述softmax人脸识别模型使用十字交叉熵损失函数进行特征约束;判断子单元,用于若所述人脸特征向量所属的特征区域为预设用户区域,判定所述人脸特征向量与所述预设用户集中任一预设用户的预设特征向量匹配;所述人脸特征向量所属的特征区域为陌生用户区域,判定所述人脸特征向量与所述预设用户集中所有预设用户的预设特征向量均不匹配。

    可选的,所述替换模块包括:识别单元,用于识别所述人脸画面对应的用户角色;第一替换单元,用于在遮挡画面列表中选择与所述用户角色匹配的预设遮挡画面,并将所述第一视频帧中的人脸画面替换为所述预设遮挡画面。

    可选的,所述替换模块包括:识别单元,用于识别所述人脸画面对应的用户角色;第一处理单元,用于提取所述人脸画面的表情特征信息,并选择与所述用户角色匹配的虚拟形象角色;第二处理单元,用于将所述表情特征信息和所述虚拟形象角色输入至生成对抗网络,并输出与所述人脸画面对应的虚拟形象人脸;第二替换单元,用于在将所述第一视频帧中的人脸画面替换为虚拟形象人脸。

    可选的,所述识别单元包括:处理子单元,用于将所述第一视频帧中的人脸特征向量输入三元组triplet人脸识别模型,并输出所述人脸特征向量到各个预设角色特征之间的特征间隔,其中,所述triplet人脸识别模型使用三元组损失函数进行特征约束,每个预设角色特征对应所述预设用户集中的一个用户角色;选择子单元,用于将特征间隔最小的用户角色选择为与所述人脸画面对应的用户角色。

    可选的,所述装置还包括:第二判断模块,用于在所述第一判断模块判断所述第一视频帧中是否包括预设用户集的第一人脸画面之后,若所述第一视频帧中不包括预设用户集的人脸画面,判断所述第一视频帧中是否包括陌生用户的第二人脸画面,其中,所述陌生用户为除所述预设用户之外的其他用户;生成模块,用于若所述第一视频帧中包括陌生用户的第二人脸画面,截取所述第二人脸画像,并基于所述第二人脸画像生成告警信息,其中,所述告警信息用于指示出现陌生人员。

    需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。

    实施例3

    本发明的实施例还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

    可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:

    s1,采集第一视频帧;

    s2,判断所述第一视频帧中是否包括预设用户集的人脸画面;

    s3,若所述第一视频帧中包括预设用户集的人脸画面,将所述第一视频帧中的人脸画面替换为预设遮挡画面,以生成第二视频帧。

    可选地,在本实施例中,上述存储介质可以包括但不限于:u盘、只读存储器(read-onlymemory,简称为rom)、随机存取存储器(randomaccessmemory,简称为ram)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。

    本发明的实施例还提供了一种电子设备,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。

    可选地,上述电子设备还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。

    可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:

    s1,采集第一视频帧;

    s2,判断所述第一视频帧中是否包括预设用户集的人脸画面;

    s3,若所述第一视频帧中包括预设用户集的人脸画面,将所述第一视频帧中的人脸画面替换为预设遮挡画面,以生成第二视频帧。

    可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。

    上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。

    在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

    在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。

    所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

    另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

    所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

    以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。


    技术特征:

    1.一种视频帧的生成方法,其特征在于,包括:

    采集第一视频帧;

    判断所述第一视频帧中是否包括预设用户集的人脸画面;

    若所述第一视频帧中包括预设用户集的人脸画面,将所述第一视频帧中的人脸画面替换为预设遮挡画面,以生成第二视频帧。

    2.根据权利要求1所述的方法,其特征在于,判断所述第一视频帧中是否包括预设用户集的人脸画面包括:

    提取所述第一视频帧中的人脸特征向量;

    判断所述人脸特征向量与所述预设用户集的预设特征向量是否匹配,其中,所述预设用户集对应若干个预设用户,每个预设用户对应一个预设特征向量;

    若所述人脸特征向量与所述预设用户集中任一预设用户的预设特征向量匹配,确定所述第一视频帧中包括预设用户集的人脸画面;若所述人脸特征向量与所述预设用户集中所有预设用户的预设特征向量均不匹配,确定所述第一视频帧中不包括预设用户集的人脸画面。

    3.根据权利要求2所述的方法,其特征在于,判断所述人脸特征向量与所述预设用户集的预设特征向量是否匹配包括:

    将所述人脸特征向量输入逻辑回归softmax人脸识别模型,并输出所述人脸特征向量所属的特征区域,其中,所述softmax人脸识别模型使用十字交叉熵损失函数进行特征约束;

    若所述人脸特征向量所属的特征区域为预设用户区域,判定所述人脸特征向量与所述预设用户集中任一预设用户的预设特征向量匹配;所述人脸特征向量所属的特征区域为陌生用户区域,判定所述人脸特征向量与所述预设用户集中所有预设用户的预设特征向量均不匹配。

    4.根据权利要求1所述的方法,其特征在于,将所述第一视频帧中的人脸画面替换为预设遮挡画面包括:

    识别所述人脸画面对应的用户角色;

    在遮挡画面列表中选择与所述用户角色匹配的预设遮挡画面,并将所述第一视频帧中的人脸画面替换为所述预设遮挡画面。

    5.根据权利要求1所述的方法,其特征在于,将所述第一视频帧中的人脸画面替换为预设遮挡画面包括:

    识别所述人脸画面对应的用户角色;

    提取所述人脸画面的表情特征信息,并选择与所述用户角色匹配的虚拟形象角色;

    将所述表情特征信息和所述虚拟形象角色输入至生成对抗网络,并输出与所述人脸画面对应的虚拟形象人脸;

    将所述第一视频帧中的人脸画面替换为虚拟形象人脸。

    6.根据权利要求4或5所述的方法,其特征在于,识别所述人脸画面对应的用户角色包括:

    将所述第一视频帧中的人脸特征向量输入三元组triplet人脸识别模型,并输出所述人脸特征向量到各个预设角色特征之间的特征间隔,其中,所述triplet人脸识别模型使用三元组损失函数进行特征约束,每个预设角色特征对应所述预设用户集中的一个用户角色;

    将特征间隔最小的用户角色选择为与所述人脸画面对应的用户角色。

    7.根据权利要求1所述的方法,其特征在于,在判断所述第一视频帧中是否包括预设用户集的第一人脸画面之后,所述方法还包括:

    若所述第一视频帧中不包括预设用户集的人脸画面,判断所述第一视频帧中是否包括陌生用户的第二人脸画面,其中,所述陌生用户为除所述预设用户之外的其他用户;

    若所述第一视频帧中包括陌生用户的第二人脸画面,截取所述第二人脸画像,并基于所述第二人脸画像生成告警信息,其中,所述告警信息用于指示出现陌生人员。

    8.一种视频帧的生成装置,其特征在于,包括:

    采集模块,用于采集第一视频帧;

    第一判断模块,用于判断所述第一视频帧中是否包括预设用户集的人脸画面;

    替换模块,用于若所述第一视频帧中包括预设用户集的人脸画面,将所述第一视频帧中的人脸画面替换为预设遮挡画面,以生成第二视频帧。

    9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,所述程序运行时执行上述权利要求1至7中任一项所述的方法步骤。

    10.一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;其中:

    存储器,用于存放计算机程序;

    处理器,用于通过运行存储器上所存放的程序来执行权利要求1至7中任一项所述的方法步骤。

    技术总结
    本发明公开了一种视频帧的生成方法及装置、存储介质、电子设备,属于数据安全领域。其中,该方法包括:采集第一视频帧;判断所述第一视频帧中是否包括预设用户集的人脸画面;若所述第一视频帧中包括预设用户集的人脸画面,将所述第一视频帧中的人脸画面替换为预设遮挡画面,以生成第二视频帧。通过本发明,解决了相关技术不能保护视频帧中的用户隐私的技术问题,降低了视频数据的泄露风险,提高了视频数据传输的安全性。

    技术研发人员:李聪;陈翀;林进华
    受保护的技术使用者:珠海格力电器股份有限公司;珠海联云科技有限公司
    技术研发日:2020.12.03
    技术公布日:2021.03.12

    转载请注明原文地址:https://wp.8miu.com/read-6318.html

    最新回复(0)