本申请涉及人工智能领域,具体涉及通过用户的生物特征进行身份验证方法及系统。
背景技术:
利用用户的生物特征可以注册该用户的生物特征,并在识别时根据注册的生物特征对用户身份进行验证。例如常见的人脸识别、指纹识别和声纹识别,通过比较用户预先留下的特征和识别时采集的特征,从而完成特征比对和身份鉴别。以常见的声纹识别为例子,又称为说话人识别,指的是利用语音中包含的说话人特征信息,从而自动鉴别对话者身份。其中,声纹识别通常包括两个阶段,注册阶段和识别阶段。注册阶段指的是说话人预留语音,从预留语音中提取声纹特征,然后根据声纹特征训练得到对应的说话人模型,并进行模型存储。识别阶段指的是对说话人进行识别认证,对识别语音进行声纹特征提取,并将识别时的声纹特征与存储在模型库中的模型做相似性的似然打分,最终根据识别的打分确定说话人身份。基于深度神经网络的声纹识别通常会使用大量的说话人训练语料来训练深度神经网络,然后将原始的声学特征通过训练得到的神经网络进行声纹特征提取,提取得到的特征表征说话人特征。常用的声纹特征有i-vector,tdnn-x-vector,resnet-embedding等。
声纹识别技术和相似的基于生物特征进行身份验证的技术面临识别时鲁棒性问题。以声纹识别为例,在实际中往往需要根据用户提供的少量的预留语音讯息来建立用户的声纹模型,而少量的预留语音讯息很难捕捉鲁棒的声纹特征,从而导致训练得到的语音特征无法很好覆盖说话人自身的变化,导致声纹注册和识别时的失配。另一方面,在识别场景中,说话人自身声音特征可能产生随时间变化以及说话状态、方式等的变化,识别场景也可能存在噪声干扰、信道设备差异等因素,还有声纹注册和声纹识别采用不同装置带来的信道差异,从而导致说话人特征空间的变动,这些也会造成声纹注册和识别时的失配。声纹注册场景和声纹识别场景的失配,会降低识别准确率,影响用户使用体验。
现有技术中,为了应对声纹注册场景和声纹识别场景的失配,主要通过以下做法:对失配场景的原始数据和特征进行增强和变换,尽可能满足注册场景要求;在训练模型时进行优化,降低用户声纹特征随用户自身或场景变化的敏感度,从而减小场景失配带来的影响;在后端打分时对特定场景的打分模型进行建模(例如自适应plda模型等)。然而,现有技术中的应对手段,都是通过在数据特征或者模型训练方面弱化场景失配对声纹特征变化造成的影响,并没有充分考虑到注册场景和识别场景各自采集的数据存在客观的统计学意义上的不一致性,也因此难以从根本上弥补场景失配造成的差异。另外,现有技术的做法也没有充分考虑到造成场景失配的多样化成因。因此,需要一种技术方案能接受场景失配的客观存在性,并充分考虑到背后的多样化成因。
技术实现要素:
本申请的目的在于,为了解决现有技术中存在的场景失配而造成身份验证性能下降等技术问题,提供一种身份验证的方法及系统。
第一方面,本申请实施例提供了一种身份验证的方法。所述方法包括:获得在注册场景下从第一注册对象提取的生物特征;获得在识别场景下从第一识别对象提取的生物特征;根据所述第一注册对象的生物特征与所述第一识别对象的生物特征计算似然打分;以及根据所述似然打分判断所述第一识别对象的身份是否与所述第一注册对象的身份一致。其中,所述似然打分包括后验概率部分和边缘概率部分。所述后验概率部分根据所述第一注册对象的生物特征,注册场景的概率分布模型和所述注册场景的概率分布模型与识别场景的概率分布模型的映射关系确定。所述注册场景的概率分布模型包括在所述注册场景下从一个或多个注册对象提取生物特征时不同注册对象之间的概率分布参数和同一注册对象的不同样本之间的概率分布参数,所述识别场景的概率分布模型包括在所述识别场景下从一个或多个识别对象提取生物特征时不同识别对象之间的概率分布参数和同一识别对象的不同样本之间的概率分布参数。所述边缘概率部分根据所述第一识别对象的生物特征,所述识别场景的概率分布模型和所述映射关系确定。
第一方面所描述的技术方案,实现了针对注册场景和识别场景分别使用不同的概率分布模型以及分布参数,结合映射关系对场景失配情况下的似然打分进行修正,从而有利于弥补场景失配导致的损失。
根据第一方面,在一种可能的实现方式中,根据所述第一注册对象的生物特征与所述第一识别对象的生物特征计算所述似然打分,包括:根据所述映射关系,将所述第一识别对象的生物特征从所述识别场景映射到所述注册场景,得到映射后的第一识别对象的生物特征,根据所述第一注册对象的生物特征在所述注册场景的概率分布模型上计算后验概率分布模板,根据所述后验概率分布模板和所述映射后的第一识别对象的生物特征在所述注册场景的概率分布模型上计算所述后验概率部分,根据所述第一识别对象的生物特征在所述识别场景的概率分布模型上计算所述边缘概率部分,根据所述后验概率部分和所述边缘概率部分,得到所述似然打分。
如此,通过从所述识别场景到所述注册场景的映射,从而设计了对应的似然打分方法,有利于避免因场景失配而导致的身份鉴别性能损失。
根据第一方面,在一种可能的实现方式中,根据所述第一注册对象的生物特征与所述第一识别对象的生物特征计算所述似然打分,包括:根据所述第一注册对象的生物特征在所述注册场景的概率分布模型上计算后验概率分布模板,根据所述映射关系,将所述后验概率分布模板从所述注册场景映射到所述识别场景,得到映射后的后验概率分布模板,根据所述映射后的后验概率分布模板在所述识别场景的概率分布模型上计算所述后验概率部分,根据所述第一识别对象的特征在所述识别场景的概率分布模型上计算所述边缘概率部分,根据所述后验概率部分和所述边缘概率部分,得到所述似然打分。
如此,通过从所述注册场景到所述识别场景的映射,从而设计了对应的似然打分方法,有利于避免因场景失配而导致的身份鉴别性能损失。
根据第一方面,在一种可能的实现方式中,所述注册场景的概率分布模型和所述识别场景的概率分布模型均服从线性高斯分布,所述不同注册对象之间的概率分布参数包括所述注册场景中不同注册对象的特征空间分布的均值和方差,所述同一注册对象的不同样本之间的概率分布参数包括所述注册场景中同一注册对象的特征空间分布的方差,所述不同识别对象之间的概率分布参数包括所述识别场景中不同识别对象的特征空间分布的均值和方差,所述同一识别对象的不同样本之间的概率分布参数包括所述识别场景中同一识别对象的特征空间分布的方差。
如此,实现了弥补服从线性高斯分布的不同场景之间失配下的修正。
根据第一方面,在一种可能的实现方式中,所述似然打分根据所述线性高斯分布计算。
如此,实现了在高斯分布下的不同场景之间失配下的修正。
根据第一方面,在一种可能的实现方式中,所述映射关系根据已训练的映射函数确定,所述已训练的映射函数通过以下方法获得:根据注册训练数据估计所述注册场景下的特征分布,根据识别训练数据估计所述识别场景下的特征分布,根据映射函数、所述注册训练数据和识别训练数据计算基于最大似然准则估计的损失函数,其中,所述映射函数用于所述注册场景下的特征分布与所述识别场景下的特征分布之间的互逆映射,根据所述损失函数调整所述映射函数的参数直到所述损失函数满足最小化的优化条件,得到所述已训练的映射函数。
如此,实现了结合深度学习算法来训练映射函数并获得似然打分。
根据第一方面,在一种可能的实现方式中,所述映射函数是一元一次函数,所述映射函数的参数包括所述一元一次函数的两个常数。
如此,实现了满足线性互逆映射关系的场景之间失配下的修正。
根据第一方面,在一种可能的实现方式中,与所述损失函数对应的机器学习模型用于最大似然概率线性回归mllr任务。
如此,实现了通过mllr任务的机器学习模型来训练映射函数。
根据第一方面,在一种可能的实现方式中,所述方法还包括:获得在所述识别场景下从第二识别对象的多个样本提取的生物特征并计算与所述第二识别对象的多个样本各自对应的似然打分,根据与所述第二识别对象的多个样本各自对应的似然打分,在从所述第二识别对象的多个样本提取的生物特征中筛选出用于状态更新的特征,利用所述用于状态更新的特征,更新所述识别场景的概率分布模型所包括的同一识别对象的不同样本之间的概率分布参数。如此,实现了根据第二识别对象的多个样本的生物特征来调整更新分布参数,从而有利于根据识别对象的自身变化做出动态调整及更新。
根据第一方面,在一种可能的实现方式中,所述方法还包括:通过聚类算法,对所述识别场景的概率分布模型所包括的同一识别对象的不同样本之间的概率分布参数进行聚类并得到多个子模型,其中,所述多个子模型各自对应同一识别对象的不同状态;其中,所述似然打分的所述边缘概率部分融合所述多个子模型各自的打分结果。如此,实现了通过聚类算法进行打分融合从而有利于根据同一识别对象的不同状态做出调整。
根据第一方面,在一种可能的实现方式中,所述生物特征包括声纹特征。如此,实现了对基于声纹识别的身份验证的场景失配做出修正。
根据第一方面,在一种可能的实现方式中,所述生物特征包括人脸特征。如此,实现了对基于人脸识别的身份验证的场景失配做出修正。
根据第一方面,在一种可能的实现方式中,所述生物特征包括指纹特征。如此,实现了对基于指纹识别的身份验证的场景失配做出修正。
根据第一方面,在一种可能的实现方式中,所述注册场景和所述识别场景分别对应不同的设备。如此,实现了跨设备的注册和识别。
第二方面,本申请实施例提供了一种芯片系统,其特征在于,所述芯片系统应用于电子设备;所述芯片系统包括一个或多个接口电路,以及一个或多个处理器;所述接口电路和所述处理器通过线路互联;所述接口电路用于从所述电子设备的存储器接收信号,并向所述处理器发送所述信号,所述信号包括所述存储器中存储的计算机指令;当所述处理器执行所述计算机指令时,所述电子设备执行前述第一方面提供的身份验证方法。
第二方面所描述的技术方案,通过所述芯片系统实现了针对注册场景和识别场景分别使用不同的概率分布模型以及分布参数,结合映射关系对场景失配情况下的似然打分进行修正,从而有利于弥补场景失配导致的损失。
第三方面,本申请实施例提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序指令,所述计算机程序指令当被处理器执行时使所述处理器执行前述第一方面提供的身份验证方法。
第三方面所描述的技术方案,通过所述计算机可读存储介质实现了针对注册场景和识别场景分别使用不同的概率分布模型以及分布参数,结合映射关系对场景失配情况下的似然打分进行修正,从而有利于弥补场景失配导致的损失。
第四方面,本申请实施例提供了一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序指令,所述计算机程序指令当被处理器执行时使所述处理器执行前述第一方面提供的身份验证方法。
第四方面所描述的技术方案,通过执行所述计算机程序指令实现了针对注册场景和识别场景分别使用不同的概率分布模型以及分布参数,结合映射关系对场景失配情况下的似然打分进行修正,从而有利于弥补场景失配导致的损失。
第五方面,本申请实施例提供了一种身份验证系统。所述身份验证系统包括:注册模块,用于获得在注册场景下从第一注册对象提取的生物特征;识别模块,用于获得在识别场景下从第一识别对象提取的生物特征;以及打分判决模块,用于根据所述第一注册对象的生物特征与所述第一识别对象的生物特征计算似然打分和根据所述似然打分判断所述第一识别对象的身份是否与所述第一注册对象的身份一致。其中,所述似然打分包括后验概率部分和边缘概率部分,所述后验概率部分根据所述第一注册对象的生物特征,注册场景的概率分布模型和所述注册场景的概率分布模型与识别场景的概率分布模型的映射关系确定,所述注册场景的概率分布模型包括在所述注册场景下从一个或多个注册对象提取生物特征时不同注册对象之间的概率分布参数和同一注册对象的不同样本之间的概率分布参数,所述识别场景的概率分布模型包括在所述识别场景下从一个或多个识别对象提取生物特征时不同识别对象之间的概率分布参数和同一识别对象的不同样本之间的概率分布参数,所述边缘概率部分根据所述第一识别对象的生物特征,所述识别场景的概率分布模型和所述映射关系确定。
第五方面所描述的技术方案,实现了针对注册场景和识别场景分别使用不同的概率分布模型以及分布参数,结合映射关系对场景失配情况下的似然打分进行修正,从而有利于弥补场景失配导致的损失。
附图说明
为了说明本申请实施例或背景技术中的技术方案,下面将对本申请实施例或背景技术中所需要使用的附图进行说明。
图1示出了本申请实施例提供的一种实施方式的身份验证方法的流程示意图。
图2示出了本申请实施例提供的另一种实施方式的身份验证方法的流程示意图。
图3示出了本申请实施例提供的基于生物特征的注册和识别进行身份验证的示意图。
图4示出了本申请实施例提供的身份验证系统的结构框图。
图5示出了本申请实施例提供的动态匹配用户自身变化的身份验证系统的结构框图。
具体实施方式
本申请实施例提供了一种身份验证方法及系统。其中,所述身份验证系统包括:注册模块,用于获得在注册场景下从第一注册对象提取的生物特征;识别模块,用于获得在识别场景下从第一识别对象提取的生物特征;以及打分判决模块,用于根据所述第一注册对象的生物特征与所述第一识别对象的生物特征计算似然打分和根据所述似然打分判断所述第一识别对象的身份是否与所述第一注册对象的身份一致。其中,所述似然打分包括后验概率部分和边缘概率部分,所述后验概率部分根据所述第一注册对象的生物特征,注册场景的概率分布模型和所述注册场景的概率分布模型与识别场景的概率分布模型的映射关系确定,所述注册场景的概率分布模型包括在所述注册场景下从一个或多个注册对象提取生物特征时不同注册对象之间的概率分布参数和同一注册对象的不同样本之间的概率分布参数,所述识别场景的概率分布模型包括在所述识别场景下从一个或多个识别对象提取生物特征时不同识别对象之间的概率分布参数和同一识别对象的不同样本之间的概率分布参数,所述边缘概率部分根据所述第一识别对象的生物特征,所述识别场景的概率分布模型和所述映射关系确定。如此,实现了针对注册场景和识别场景分别使用不同的概率分布模型以及分布参数,结合映射关系对场景失配情况下的似然打分进行修正,从而有利于弥补场景失配导致的损失。
本申请实施例可用于以下应用场景:声纹识别、人脸识别、指纹识别等需要利用生物特征进行身份验证的领域,或者需要应对生物特征的特征空间变动而导致场景失配的应用场景,例如跨设备和跨信道使用注册和识别。
本申请实施例可以依据具体应用环境进行调整和改进,此处不做具体限定。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请的实施例进行描述。
请参阅图1,图1示出了本申请实施例提供的一种实施方式的身份验证方法的流程示意图。如图1所示,所述方法包括以下步骤。
步骤s102:获得在注册场景下从第一注册对象提取的生物特征和在识别场景下从第一识别对象提取的生物特征。
应当理解的是,生物特征可以是声纹特征、人脸特征、指纹特征或者其他用于身份验证和鉴别的生物特征。第一注册对象和第一识别对象的定义是提供生物特征并且各自的身份与所提供的生物特征对应的人。例如,以生物特征是声纹特征为例,第一注册对象是在注册场景下进行声纹特征注册的使用者,或者可以称之为注册场景下的说话人。相对的,第一识别对象是在识别场景下进行声纹特征识别的使用者,或者可以称之为识别场景下的说话人。
步骤s104:根据第一注册对象的生物特征与第一识别对象的生物特征计算似然打分,所述似然打分包括后验概率部分和边缘概率部分。
其中,后验概率部分根据第一注册对象的生物特征,注册场景的概率分布模型和注册场景的概率分布模型与识别场景的概率分布模型的映射关系确定。边缘概率部分根据所述第一识别对象的生物特征,所述识别场景的概率分布模型和所述映射关系确定。所述注册场景的概率分布模型包括在所述注册场景下从一个或多个注册对象提取生物特征时不同注册对象之间的概率分布参数和同一注册对象的不同样本之间的概率分布参数。所述识别场景的概率分布模型包括在所述识别场景下从一个或多个识别对象提取生物特征时不同识别对象之间的概率分布参数和同一识别对象的不同样本之间的概率分布参数。注册场景的概率分布模型可以理解成在注册场景的有限空间内所提取的生物特征的分布规律。还是以生物特征是声纹特征为例,注册场景的概率分布模型可以理解成在注册场景的有限空间内所提取的说话人的声纹特征的分布,或者可以理解成用于描述整个注册场景的声纹特征的特征分布空间的模型。另外,注册场景的概率分布模型与识别场景的概率分布模型之间具有映射关系。这种映射关系可以通过映射函数来体现,该映射函数可以是线性的或者非线性的。下面以简单的线性映射函数为例,这种简单的线性映射函数可以表示成带有两个常数的一元一次函数。
再进一步假设注册场景的概率分布模型和识别场景的概率分布模型都满足高斯分布规律。这意味着,以生物特征是声纹特征为例,在整个注册场景下说话人的声纹特征的特征空间的分布符合线性高斯分布,相对的,在整个识别场景下说话人的声纹特征的特征空间的分布也符合线性高斯分布。应当理解的是,本申请实施例也可以适用于其它类型的分布规律例如拉普拉斯分布规律。下面的说明是以注册场景的概率分布模型和识别场景的概率分布模型都满足高斯分布规律这一前提展开。具体地,假设在注册场景下从一个或多个注册对象提取生物特征的场景满足注册场景的概率分布模型,而当前需要推算在所述注册场景下对第一注册对象进行生物特征注册,则可以通过公式(1)至(3)说明。
公式(1)至(3)从上往下依次是下面的方程式:
p(u)=n(u;0,εi)·(1)
p(x|u)=n(x;u,σi)·(2)
p(x)=∫p(x|u)p(u)du·(3)
在公式(1)至(3)中,n表示高斯分布函数;u表示整个注册场景下的生物特征的均值;ε表示所述注册场景的概率分布模型所包括的不同注册对象之间的概率分布参数;i表示常规的对角矩阵;x表示在所述注册场景下进行生物特征注册的第一注册对象;σ表示所述注册场景的概率分布模型所包括的同一注册对象的不同样本之间的概率分布参数。
其中,公式(3)左边是边缘概率,也就是表征所述第一注册对象在所述注册场景下进行生物特征注册后记录下的生物特征的分布规律。公式(3)右边是展开后的表达式,可以看出,公式(3)展开后是公式(1)和公式(2)的结合。其中,公式(1)意味着通过高斯分布函数n、整个注册场景下的生物特征的均值u以及不同注册对象之间的概率分布参数ε来计算。公式(2)的左边是后验概率,是在通过公式(1)计算出整个注册场景下的生物特征的均值u的前提之下得知所述第一注册对象x的后验概率。应当理解的,公式(1)和(3)都是表示成边缘概率,而公式(2)则表示成后验概率。
请继续参考公式(1)至(3),这些是为了说明在注册场景下从一个或多个注册对象提取生物特征的场景满足注册场景的概率分布模型,而当前需要推算在所述注册场景下对第一注册对象进行生物特征注册。如果需要说明在识别场景下从一个或多个识别对象提取生物特征的场景满足识别场景的概率分布模型,而当前需要推算在所述识别场景下对第一识别对象进行生物特征注册,只需做出相应的参数替换。具体地,可以用
实际应用中,第一注册对象在注册场景下进行生物特征注册时,本质上是根据后验概率分布模板来进行预测的过程,可以参考公式(4)。
公式(4)是下面的方程式:
在公式(4)中,uk表示所述第一注册对象在所述注册场景下进行生物特征注册后记录下的生物特征;n表示高斯分布函数;
在应用中,第一注册对象在注册场景下进行生物特征注册后,得知在所述注册场景下进行生物特征注册的第一注册对象为x。则可以结合公式(1)至(4)来计算,在已经得知多个不同注册对象
公式(5)是下面的方程式:
在公式(5)中,n表示高斯分布函数;uk表示所述第一注册对象在所述注册场景下进行生物特征注册后记录下的生物特征;
为了验证第一注册对象的身份,需要在生物特征识别时,将第一识别对象所提取的生物特征与多个已知身份的注册对象的生物特征进行比对,从中计算出最大的似然打分,与该最大的似然打分对应的注册对象的身份则是第一识别对象的身份。可以通过归一化的似然打分(normalizedlikelihood,nl)来简化这个过程,参考公式(6)。
公式(6)是下面的方程式:
在公式(6)中,nl表示归一化的似然打分函数;x表示在所述注册场景下进行生物特征注册的第一注册对象;k表示第一注册对象所注册的生物特征被归属的特定类别;h0表示第一注册对象x被归属为特定类别k的情况;h1表示第一注册对象x被归属为除了特定类别k以外的其它类别的情况。通过归一化的似然打分函数nl,可以设定统一的阈值来判断待识别的第一识别对象的身份,同时还减小同一个待识别对象的不同生物特征之间的似然打分结果差异过大而对阈值的影响。从公式(6)可以看出,归一化的似然打分函数nl展开后包括公式(5)所计算的,已经得知的多个不同注册对象
公式(6)的归一化似然打分nl可以根据高斯分布下的似然比计算,而转化成公式(7)和(8)。
公式(7)是下面的方程式:
公式(8)是下面的方程式:
在公式(7)和(8)中,nl表示归一化的似然打分函数;
实际应用中,为了弥补场景失配带来的打分性能损失,可以通过以下方式并根据映射关系作出修正。因为映射关系是互逆的,可以将似然打分的计算过程从注册场景映射到识别场景,或者将似然打分的计算过程从识别场景映射到注册场景。下面先说明将似然打分的计算过程从注册场景映射到识别场景的实施例。
在该实施例中,步骤s104包括步骤s1041:根据第一注册对象的生物特征在注册场景的概率分布模型上计算后验概率分布模板,将后验概率分布模板从注册场景映射到识别场景,得到映射后的后验概率分布模板。
注册场景的概率分布模型与识别场景的概率分布模型之间具有映射关系。这种映射关系可以表示成线性映射函数,参考公式(9)。
公式(9)是下面的方程式:
在公式(9)中,m和b是线性映射函数的常数,可以通过机器学习训练的方式来求得最优化的线性映射函数的配置从而最大程度上体现上述映射关系。公式(9)意味着从注册场景到识别场景的映射,其中,x表示在所述注册场景下进行生物特征注册的第一注册对象;
首先,根据所述第一注册对象的生物特征在所述注册场景的概率分布模型上计算后验概率分布模板,然后,根据所述映射关系,将所述后验概率分布模板从所述注册场景映射到所述识别场景,得到映射后的后验概率分布模板。这里,所述后验概率分布模板是在注册场景的意义下,也就是指的是上述公式(4)。公式(4)是所述后验概率分布模板,意味着在已经得知多个不同注册对象
为了将公式(4)所表示的注册场景下的后验概率分布模板映射到识别场景得到映射后的后验概率分布模板,需要结合公式(4)和公式(9)而得到公式(10)。
公式(10)是下面的方程式:
在公式(10)中,
在该实施例中,步骤s104还包括步骤s1042:根据映射后的后验概率分布模板在识别场景的概率分布模型上计算后验概率部分。
在注册场景的意义下,从公式(4)所表示的后验概率分布模板出发,结合公式(2)可以得出公式(5)表示的在注册场景下进行生物特征注册后的第一注册对象为x的后验概率。为此,可以在公式(10)所表示的所述映射后的后验概率分布模板的基础上,在所述识别场景的概率分布模型上计算所述后验概率部分。具体地,可以用公式(10)替代公式(5)的展开表达式中与公式(4)对应的部分,从而得出公式(11)。
公式(11)是下面的方程式:
在公式(11)中,
如此,类似于从公式(4)推算出公式(5),可以从公式(10)推算出公式(11)。公式(11)意味着,已经得知的多个不同注册对象
在该实施例中,步骤s104还包括步骤s1043:根据第一识别对象的特征在识别场景的概率分布模型上计算边缘概率部分,根据后验概率部分和边缘概率部分,得到似然打分。
在识别场景意义下计算归一化的似然打分可以参考公式(6),需要用公式(11)所计算的,根据所述映射后的后验概率分布模板在所述识别场景的概率分布模型上计算得到的所述后验概率部分,来替换公式(6)中在注册场景意义下计算的所述后验概率部分。然后根据公式(3)计算所述第一识别对象在所述识别场景下进行生物特征识别后记录下的生物特征的分布规律,需要用对应识别场景的参数和标识来替换公式(3)中对应注册场景的参数和标识。如此得到的似然打分与公式(6)的形式相近,只是其中的后验概率部分根据公式(11)计算,而其中的边缘概率部分通过用对应识别场景的参数和标识来替换公式(3)中对应注册场景的参数和表示来计算。
识别场景意义下的似然打分nl可以根据高斯分布下的似然比计算,而转化成公式(12)和(13)。
公式(12)是下面的方程式:
公式(13)是下面的方程式:
在公式(12)和(13)中,
步骤s106:根据似然打分判断第一识别对象的身份是否与第一注册对象的身份一致。
其中,似然打分可以采用公式(12)所示的简化后的似然比计算,也可以采用上述的方法来参考公式(6)计算在识别场景意义下的归一化的似然打分。应当理解的是,结合公式(9)至公式(13),将似然打分的计算过程从注册场景映射到了识别场景,并且考虑到了场景之间失配带来的影响,从而有利于提高打分性能。具体地,可以简要整理为:根据所述第一注册对象的生物特征在所述注册场景的概率分布模型上计算后验概率分布模板;根据所述映射关系,将所述后验概率分布模板从所述注册场景映射到所述识别场景,得到映射后的后验概率分布模板;根据所述映射后的后验概率分布模板在所述识别场景的概率分布模型上计算所述后验概率部分;根据所述第一识别对象的特征在所述识别场景的概率分布模型上计算所述边缘概率部分;根据所述后验概率部分和所述边缘概率部分,得到所述似然打分。
请参阅图2,图2示出了本申请实施例提供的另一种实施方式的身份验证方法的流程示意图。如图2所示,所述方法包括以下步骤。
实际应用中,为了弥补场景失配带来的打分性能损失,可以通过以下方式并根据映射关系作出修正。因为映射关系是互逆的,可以将似然打分的计算过程从注册场景映射到识别场景,或者将似然打分的计算过程从识别场景映射到注册场景。下面说明将似然打分的计算过程从识别场景映射到注册场景的实施例。
步骤s202:获得在注册场景下从第一注册对象提取的生物特征和在识别场景下从第一识别对象提取的生物特征。
应当理解的是,生物特征可以是声纹特征、人脸特征、指纹特征或者其他用于身份验证和鉴别的生物特征。第一注册对象和第一识别对象的定义是提供生物特征并且各自的身份与所提供的生物特征对应的人。例如,以生物特征是声纹特征为例,第一注册对象是在注册场景下进行声纹特征注册的使用者,或者可以称之为注册场景下的说话人。相对的,第一识别对象是在识别场景下进行声纹特征识别的使用者,或者可以称之为识别场景下的说话人。
步骤s204:根据第一注册对象的生物特征与第一识别对象的生物特征计算似然打分,所述似然打分包括后验概率部分和边缘概率部分。
其中,后验概率部分根据第一注册对象的生物特征,注册场景的概率分布模型和注册场景的概率分布模型与识别场景的概率分布模型的映射关系确定。边缘概率部分根据所述第一识别对象的生物特征,所述识别场景的概率分布模型和所述映射关系确定。所述注册场景的概率分布模型包括在所述注册场景下从一个或多个注册对象提取生物特征时不同注册对象之间的概率分布参数和同一注册对象的不同样本之间的概率分布参数。所述识别场景的概率分布模型包括在所述识别场景下从一个或多个识别对象提取生物特征时不同识别对象之间的概率分布参数和同一识别对象的不同样本之间的概率分布参数。注册场景的概率分布模型可以理解成在注册场景的有限空间内所提取的生物特征的分布规律。还是以生物特征是声纹特征为例,注册场景的概率分布模型可以理解成在注册场景的有限空间内所提取的说话人的声纹特征的分布,或者可以理解成用于描述整个注册场景的声纹特征的特征分布空间的模型。另外,注册场景的概率分布模型与识别场景的概率分布模型之间具有映射关系。这种映射关系可以通过映射函数来体现,该映射函数可以是线性的或者非线性的。下面以简单的线性映射函数为例,这种简单的线性映射函数可以表示成带有两个常数的一元一次函数。
在该实施例中,步骤s204包括步骤s2041:将第一识别对象的生物特征从识别场景映射到注册场景,得到映射后的第一识别对象的生物特征。
注册场景的概率分布模型与识别场景的概率分布模型之间具有映射关系。这种映射关系可以表示成线性映射函数,参考公式(14)。
公式(14)是下面的方程式:
在公式(14)中,m和b是线性映射函数的常数,可以通过机器学习训练的方式来求得最优化的线性映射函数的配置从而最大程度上体现上述映射关系。公式(14)意味着从识别场景到注册场景的映射,其中,
在该实施例中,步骤s204还包括步骤s2042:根据第一注册对象的生物特征在注册场景的概率分布模型上计算后验概率分布模板,根据后验概率分布模板和映射后的第一识别对象的生物特征在注册场景的概率分布模型上计算后验概率部分。
后验概率分布模板参考公式(4)得到公式(15)。
公式(15)是下面的方程式:
在公式(15)中,uk表示所述第一注册对象在所述注册场景下进行生物特征注册后记录下的生物特征;n表示高斯分布函数;
公式(16)是下面的方程式:
在公式(16)中,n表示高斯分布函数;uk表示所述第一注册对象在所述注册场景下进行生物特征注册后记录下的生物特征;
在该实施例中,步骤s204还包括步骤s2043:根据第一识别对象的生物特征在识别场景的概率分布模型上计算边缘概率部分,根据后验概率部分和边缘概率部分,得到所述似然打分。
参考公式(6),用
公式(17)是下面的方程式:
在公式(17)中,
归一化的似然打分可以参考公式(6),只是其中的后验概率部分根据公式(16)计算,而其中的边缘概率部分根据公式(17)计算。
注册场景意义下的似然打分nl可以根据高斯分布下的似然比计算,而转化成公式(18)。
公式(18)是下面的方程式:
在公式(18)中,
步骤s206:根据似然打分判断第一识别对象的身份是否与第一注册对象的身份一致。
其中,似然打分可以采用公式(18)所示的简化后的似然比计算,也可以采用上述的方法来参考公式(6)计算在注册场景意义下的归一化的似然打分nl。应当理解的是,结合公式(14)至公式(18),将似然打分的计算过程从识别场景映射到了注册场景,并且考虑到了场景之间失配带来的影响,从而有利于提高打分性能。具体地,可以简要整理为:根据所述映射关系,将所述第一识别对象的生物特征从所述识别场景映射到所述注册场景,得到映射后的第一识别对象的生物特征;根据所述第一注册对象的生物特征在所述注册场景的概率分布模型上计算后验概率分布模板;根据所述后验概率分布模板和所述映射后的第一识别对象的生物特征在所述注册场景的概率分布模型上计算所述后验概率部分;根据所述第一识别对象的生物特征在所述识别场景的概率分布模型上计算所述边缘概率部分;根据所述后验概率部分和所述边缘概率部分,得到所述似然打分。
在一种可能的实施方式中,注册场景的概率分布模型与识别场景的概率分布模型之间具有的映射关系参考公式(14)。而当所述识别场景的概率分布模型所包括的不同识别对象之间的概率分布参数
公式(19)是下面的方程式:
在公式(19)中,b是全局位移量,可以通过机器学习训练的方式来求得最优化的线性映射函数的配置从而最大程度上体现上述映射关系。公式(19)意味着从识别场景到注册场景的映射,其中,
根据公式(19),结合公式(15)到(18),可以得到简化后的似然比计算,参考公式(20)。
公式(20)是下面的方程式:
在公式(20)中,
请继续参阅图1和图2,用于体现注册场景的概率分布模型和识别场景的概率分布模型之间的互逆映射关系的映射函数,可以是线性的解析解,也可以是通过数值解或者神经网络算法得到的非线性映射关系。下面简要叙述下训练映射函数的方法:根据注册训练数据估计所述注册场景下的特征分布;根据识别训练数据估计所述识别场景下的特征分布;根据映射函数、所述注册训练数据和识别训练数据计算基于最大似然准则估计的损失函数;其中,所述映射函数用于所述注册场景下的特征分布与所述识别场景下的特征分布之间的互逆映射;根据所述损失函数调整所述映射函数的参数直到所述损失函数满足最小化的优化条件,得到所述已训练的映射函数。
请参阅图2和公式(14),在公式(14)中m和b是线性映射函数的常数,可以通过机器学习训练的方式来求得最优化的线性映射函数的配置从而最大程度上体现上述映射关系。为此,针对公式(14)的映射函数,可以设计出公式(21)所示的损失函数。
公式(21)是下面的方程式:
在公式(21)中,
请继续参阅图1和图2,在一种可能的实现方式中,需要考虑识别对象自身变化带来的生物特征分布的变化,并且需要跟据这些变化来更新相关模型,从而对因识别对象自身变化而导致的注册和识别场景失配的似然概率打分进行修正。例如可以在生物特征识别过程中,筛选通过的高概率的生物特征,使用动态更新的方法更新特定注册对象的生物特征分布。具体步骤包括:获得在所述识别场景下从第二识别对象的多个样本提取的生物特征并计算与所述第二识别对象的多个样本各自对应的似然打分;根据与所述第二识别对象的多个样本各自对应的似然打分,在从所述第二识别对象的多个样本提取的生物特征中筛选出用于状态更新的特征;利用所述用于状态更新的特征,更新所述识别场景的概率分布模型所包括的同一识别对象的不同样本之间的概率分布参数。修正后的似然打分参考公式(22)。
公式(22)是下面的方程式:
在公式(22)中,nl表示归一化的似然打分函数;
在一些示例性实施例中,为了体现同一对象的不同状态各自对应的似然打分结果,在持续收集用户的生物特征过程中,可以使用聚类算法,对待更新特征池中的用户生物特征聚类,为用户维护多个模型和分布,常用的聚类算法有k均值算法(k-means),高斯混合模型(gaussianmixturemodel,gmm)等。可以理解的,根据聚类算法聚出的用户子模型可以代表特定用户说话的不同状态。当识别时,融合多个子模型打分的结果,得到更加稳定的识别结果。具体步骤包括:通过聚类算法,对所述识别场景的概率分布模型所包括的同一识别对象的不同样本之间的概率分布参数进行聚类并得到多个子模型;所述多个子模型各自对应同一识别对象的不同状态;所述似然打分的所述边缘概率部分融合所述多个子模型各自的打分结果。如此,实现了通过聚类算法进行打分融合从而有利于根据同一识别对象的不同状态做出调整。
图3示出了本申请实施例提供的基于生物特征的注册和识别进行身份验证的示意图。应当理解的是,生物特征可以是声纹特征、人脸特征、指纹特征或者其他用于身份验证和鉴别的生物特征。注册对象和识别对象的定义是提供生物特征并且各自的身份与所提供的生物特征对应的人。例如,以生物特征是声纹特征为例,注册对象是在注册场景下进行声纹特征注册的使用者,或者可以称之为注册场景下的说话人。
图3中的分布差异映射350指的是注册场景的概率分布模型与识别场景的概率分布模型之间的分布差异,这种分布差异导致需要在打分判决360中对此作出修正。为此,需要通过注册场景的概率分布模型与识别场景的概率分布模型之间的映射关系,将似然打分的计算过程从注册场景映射到识别场景,或者将似然打分的计算过程从识别场景映射到注册场景。也就是说,需要根据分布差异映射350来调整打分判决360。假设这种映射关系可以表示成线性映射函数,可以参考公式(9)或者(14)。因此,可以结合公式(9)至公式(13),将似然打分的计算过程从注册场景映射到了识别场景,又或者结合公式(14)至公式(18),将似然打分的计算过程从识别场景映射到了注册场景。
请继续参阅图3,注册场景和识别场景可以理解成相对而言的两种环境,各自对应不同的特征空间分布。在注册阶段,多个注册对象注册生物特征310,然后进行注册生物特征提取312,根据提取的生物特征,建立起注册对象的生物特征模型314。生物特征模型也可以理解成用户档案,用于将用户的身份跟其生物特征一一对应,以便识别阶段时验证身份和鉴别生物特征。在识别阶段,待识别对象识别生物特征320,从待识别对象的识别生物特征中提取生物特征,然后进行打分判决360。当注册场景和识别场景不匹配,也就是失配时,这意味着注册场景下的生物特征的特征空间分布的概率分布模型或者概率分布函数,不同于识别场景对应的特征空间分布的概率分布模型或者分布函数。例如,假设在注册场景和识别场景下某个对象的生物特征满足高斯分布规律,可以表示为具体的高斯分布函数,则该高斯分布函数具有的均值和方差两个参数区别于其他高斯分布函数。另外,不同对象在同一个特征空间中的生物特征也可以表示为具体的高斯分布函数,并具有对应的均值和方差两个参数。注册场景和识别场景失配也可以理解成,注册场景和识别场景各自的特征空间的统计学意义上不一致,这样使得直接进行相似度比对的效果不好,容易引起性能损失。造成注册场景和识别场景失配的原因是多样性的,可能是外部影响造成的差异,例如信道、环境、拾音远近等,也可能是用户或者说话人自身变化造成的差异,例如说话人声音随时间变化、说话方式状态改变等。
请继续参阅图3,为了应对上述注册场景和识别场景失配的影响,使用注册场景开发数据330来估计注册场景分布参数332也即注册场景对应的特征空间中生物特征的分布参数,也使用识别场景开发数据340来估计识别场景分布参数342也即识别场景对应的特征空间中生物特征的分布参数。具体地,利用与注册场景适配的开发数据和与识别场景适配的开发数据,分别得到注册场景的初始概率分布模型和识别场景的初始概率分布模型;根据注册场景的初始概率分布模型和识别场景的初始概率分布模型,得到分布差异映射350例如表现为对应的分布差异映射函数。然后利用最大似然准则估计来训练所述分布差异映射函数,从而得到训练好的分布差异映射函数;利用所述训练好的分布差异映射函数,从而改进打分判决360。也就是说,首先利用多场景的开发数据对注册场景和识别场景中生物特征的分布进行建模;然后利用机器学习方法,学习注册场景和识别场景下失配的分布差异映射模型;在用户识别时,利用建立好的分布差异映射模型,把注册阶段和识别阶段的用户特征映射到相互匹配的同一空间分布中进行相似度比对,从而解决注册场景和识别场景失配带来的影响。另一方面,在注册阶段建立的用户生物特征模型314,可以结合分布差异映射350对应的函数而映射到与识别场景匹配的空间,得到映射后的生物特征模型316,再进行打分判决360。该分布差异映射350对应的函数在一种可能的实施方式中可以采用上述公式(22)的设计。
图4示出了本申请实施例提供的身份验证系统的结构框图。应当理解的是,生物特征可以是声纹特征、人脸特征、指纹特征或者其他用于身份验证和鉴别的生物特征。注册对象和识别对象的定义是提供生物特征并且各自的身份与所提供的生物特征对应的人。例如,以生物特征是声纹特征为例,注册对象是在注册场景下进行声纹特征注册的使用者,或者可以称之为注册场景下的说话人。
图4中的分布差异训练模块444指的是通过深度机器学习技术,例如神经网络算法得到的体现注册场景和识别场景各自的特征空间的统计学意义上的分布差异的映射关系。如图4所示,身份验证系统400包括注册模块410、识别模块420、生物特征模型存储装置430、多设备开发数据存储器440、生物特征分布估计模块442以及分布差异训练模块444。其中,注册模块410可以部署在注册设备上让用户注册生物特征或者可以部署在云端让用户注册,包括以下步骤:通过注册设备采集用户生物特征,通过特征提取器从中提取生物特征,根据提取的生物特征建立模型并且绑定用户id或者其它身份凭证,最后将用户通过注册设备注册得到的生物特征模型传输到生物特征模型存储装置430进行网络云端存储。其中,提取器可以是用大量与注册设备无关的用户语音训练过的深度神经网络模型。识别模块420可以部署在识别设备上让用户进行生物特征识别,包括以下步骤:通过识别设备采集用户生物特征,通过提取器从中提取生物特征,从连接的云端存储加载用户注册的生物特征模型,最后进行似然打分判决。其中,识别模块420还可以事先对用户识别设备和注册设备的匹配情况做出判断,也就是判断两个设备的信道差异等可能影响打分性能的因素。当判断注册设备和识别设备匹配时可以直接根据似然打分做出判决;而当判断注册设备和识别设备不匹配时,可以调用预先训练得到的分布差异映射模型,进行修正的似然打分计算,最后根据修正后的似然打分判决。其中,修正的似然打分计算可以通过打分判决模块422进行。
请继续参阅图4,生物特征模型存储装置430包括生物特征模型存储器432、多设备生物特征分布存储器434和多设备分布映射存储器436。其中,生物特征模型存储器432与注册模块410通信地连接并接收用户通过注册设备注册得到的生物特征模型。多设备生物特征分布存储器434和多设备分布映射存储器436与分布差异训练模块444连接,并提供预先训练得到的针对多设备的生物特征分布和分布映射模型。分布差异训练模块444针对需要进行跨设备生物特征识别的设备,与注册设备训练分布差异映射函数,例如通过最大似然准则估计。具体地,可以加载多设备开发数据存储器440所存储的多场景开发数据,通过特征分布估计模块442对注册场景和识别场景中生物特征的分布进行建模后,利用分布差异训练模块444来学习注册场景和识别场景下失配的分布差异映射模型,从而解决注册场景和识别场景失配带来的影响。应当理解的是,图4所示的多设备生物特征分布存储器434和多设备分布映射存储器436针对的是存在跨设备也即多设备或者多通道的应用场景。通过预先训练得到的针对多设备的生物特征分布和分布映射模型,可以将这种跨设备或者多通道场景下的失配情况也考虑进去。
请继续参阅图4,注册模块410、识别模块420以及生物特征模型存储装置430,可以各自部署在不同的地方,或者可以位于同一个地方,或者其他可能的组合。例如,注册模块410和识别模块420可以分别位于注册场景和识别场景,而生物特征模型存储装置430可以是设置在云端的云存储装置或者是本地存储装置。当采用云存储方式的生物特征模型存储装置430来保存多设备的生物特征分布以及分布映射函数的场景,可以有利于将注册设备和识别设备分开,便于通过生物特征模型存储装置430完成不同地方不同时间的注册和识别,从而提高系统效率。而另一方面,多设备开发数据存储器440、生物特征分布估计模块442以及分布差异训练模块444可以独立于生物特征模型存储装置430而单独设置,从而可以独立地完成训练过程。另外,应当理解的是,图4所示的打分判决模块422被部署在识别模块420中,因为多数应用场景下需要在识别模块420采集到使用者的生物特征后就给出似然打分结果并进行身份验证。但是,在一种可能的实施方式中,打分判决模块422也可以单独设置,也就是说识别模块420仅收集识别场景下的生物特征,可以在之后的某个时间段对集中采集的识别场景下的生物特征通过打分判决模块422进行集中处理。
图4所示的身份系统400可以用于实现图1或者图2所示的方法。具体地,注册模块410用于获得在注册场景下从第一注册对象提取的生物特征;识别模块420用于获得在识别场景下从第一识别对象提取的生物特征;打分判决模块422用于根据所述第一注册对象的生物特征与所述第一识别对象的生物特征计算似然打分和根据所述似然打分判断所述第一识别对象的身份是否与所述第一注册对象的身份一致。其中,所述似然打分包括后验概率部分和边缘概率部分;所述后验概率部分根据所述第一注册对象的生物特征,注册场景的概率分布模型和所述注册场景的概率分布模型与识别场景的概率分布模型的映射关系确定;所述注册场景的概率分布模型包括在所述注册场景下从一个或多个注册对象提取生物特征时不同注册对象之间的概率分布参数和同一注册对象的不同样本之间的概率分布参数,所述识别场景的概率分布模型包括在所述识别场景下从一个或多个识别对象提取生物特征时不同识别对象之间的概率分布参数和同一识别对象的不同样本之间的概率分布参数;所述边缘概率部分根据所述第一识别对象的生物特征,所述识别场景的概率分布模型和所述映射关系确定。
图5示出了本申请实施例提供的动态匹配用户自身变化的身份验证系统的结构框图。应当理解的是,生物特征可以是声纹特征、人脸特征、指纹特征或者其他用于身份验证和鉴别的生物特征。注册对象和识别对象的定义是提供生物特征并且各自的身份与所提供的生物特征对应的人。例如,以生物特征是声纹特征为例,注册对象是在注册场景下进行声纹特征注册的使用者,或者可以称之为注册场景下的说话人。
图5的打分判决模块522可以实现图1或者图2所示的似然打分的计算过程。实际应用中因用户自身变化可能引起注册场景和识别场景失配,考虑到用户的状态是实时变化的,且受到用户的情绪、姿势和语速的影响而引起生物特征分布模型的变动,为此需要动态匹配用户当前状态的生物特征分布模型。图5的打分判决模块522结合更新判决模块540,可以筛选出需要更新的用户特征,并存储在待更新特征存储器542中,再通过生物特征分布重估计模块544更新用户特征之后,将更新后的用户个人特征存储在个人特征分布存储器534,从而实现对识别模块520提供的似然打分结果进行修正。
请继续参阅图5,身份验证系统500包括注册模块510、识别模块520、生物特征模型存储装置530、个人特征分布存储器534、还有更新判决模块540、待更新特征存储器542和生物特征分布重估计模块544。其中,注册模块510可以部署在注册设备上让用户注册,包括以下步骤:通过注册设备采集用户生物特征,通过特征提取器从中提取生物特征,根据提取的生物特征建立生物特征模型并且绑定用户id或者其它身份凭证,最后将用户通过注册设备注册得到的生物特征模型传输到生物特征模型存储装置530存储。识别模块520可以部署在识别设备上让用户通过语音进行识别或者可以部署在云端让用户识别,包括以下步骤:通过识别设备采集用户生物特征,通过特征提取器从中提取生物特征,从连接的生物特征模型存储器532下载用户注册的生物特征模型,最后通过打分判决模块进行似然打分。考虑到用户的生物特征是一种用户行为特征,并且容易受用户的说话内容、时间变化、说话方式的影响。而且,用户注册时仅仅使用了少量特征,这样导致注册的生物特征很大程度上仅能代表用户在注册时的状态下的生物特征。而在识别时,用户的自身情况发生变化也会对识别的效果产生影响,从而可能导致注册场景和识别场景失配。
在一些示例性实施例中,所述打分判决模块522还用于:获得在所述识别场景下从第二识别对象的多个样本提取的生物特征并计算与所述第二识别对象的多个样本各自对应的似然打分;根据与所述第二识别对象的多个样本各自对应的似然打分,在从所述第二识别对象的多个样本提取的生物特征中筛选出用于状态更新的特征;利用所述用于状态更新的特征,更新所述识别场景的概率分布模型所包括的同一识别对象的不同样本之间的概率分布参数。
本申请提供的具体实施例可以用硬件,软件,固件或固态逻辑电路中的任何一种或组合来实现,并且可以结合信号处理,控制和/或专用电路来实现。本申请具体实施例提供的设备或装置可以包括一个或多个处理器(例如,微处理器,控制器,数字信号处理器(dsp),专用集成电路(asic),现场可编程门阵列(fpga)等),这些处理器处理各种计算机可执行指令从而控制设备或装置的操作。本申请具体实施例提供的设备或装置可以包括将各个组件耦合在一起的系统总线或数据传输系统。系统总线可以包括不同总线结构中的任何一种或不同总线结构的组合,例如存储器总线或存储器控制器,外围总线,通用串行总线和/或利用多种总线体系结构中的任何一种的处理器或本地总线。本申请具体实施例提供的设备或装置可以是单独提供,也可以是系统的一部分,也可以是其它设备或装置的一部分。
本申请提供的具体实施例可以包括计算机可读存储介质或与计算机可读存储介质相结合,例如能够提供非暂时性数据存储的一个或多个存储设备。计算机可读存储介质/存储设备可以被配置为保存数据,程序器和/或指令,这些数据,程序器和/或指令在由本申请具体实施例提供的设备或装置的处理器执行时使这些设备或装置实现有关操作。计算机可读存储介质/存储设备可以包括以下一个或多个特征:易失性,非易失性,动态,静态,可读/写,只读,随机访问,顺序访问,位置可寻址性,文件可寻址性和内容可寻址性。在一个或多个示例性实施例中,计算机可读存储介质/存储设备可以被集成到本申请具体实施例提供的设备或装置中或属于公共系统。计算机可读存储介质/存储设备可以包括光存储设备,半导体存储设备和/或磁存储设备等等,也可以包括随机存取存储器(ram),闪存,只读存储器(rom),可擦可编程只读存储器(eprom),电可擦可编程只读存储器(eeprom),寄存器,硬盘,可移动磁盘,可记录和/或可重写光盘(cd),数字多功能光盘(dvd),大容量存储介质设备或任何其他形式的合适存储介质。
以上是本申请实施例的实施方式,应当指出,本申请具体实施例描述的方法中的步骤可以根据实际需要进行顺序调整、合并和删减。在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其他实施例的相关描述。可以理解的是,本申请实施例以及附图所示的结构并不构成对有关装置或系统的具体限定。在本申请另一些实施例中,有关装置或系统可以包括比具体实施例和附图更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者具有不同的部件布置。本领域技术人员将理解,在不脱离本申请具体实施例的精神和范围的情况下,可以对具体实施例记载的方法和设备的布置,操作和细节进行各种修改或变化;在不脱离本申请实施例原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本申请的保护范围。
1.一种身份验证的方法,其特征在于,所述方法包括:
获得在注册场景下从第一注册对象提取的生物特征;
获得在识别场景下从第一识别对象提取的生物特征;
根据所述第一注册对象的生物特征与所述第一识别对象的生物特征计算似然打分;以及
根据所述似然打分判断所述第一识别对象的身份是否与所述第一注册对象的身份一致,
其中,所述似然打分包括后验概率部分和边缘概率部分,
所述后验概率部分根据所述第一注册对象的生物特征,注册场景的概率分布模型和所述注册场景的概率分布模型与识别场景的概率分布模型的映射关系确定,
所述注册场景的概率分布模型包括在所述注册场景下从一个或多个注册对象提取生物特征时不同注册对象之间的概率分布参数和同一注册对象的不同样本之间的概率分布参数,所述识别场景的概率分布模型包括在所述识别场景下从一个或多个识别对象提取生物特征时不同识别对象之间的概率分布参数和同一识别对象的不同样本之间的概率分布参数,
所述边缘概率部分根据所述第一识别对象的生物特征,所述识别场景的概率分布模型和所述映射关系确定。
2.根据权利要求1所述的方法,其特征在于,根据所述第一注册对象的生物特征与所述第一识别对象的生物特征计算所述似然打分,包括:
根据所述映射关系,将所述第一识别对象的生物特征从所述识别场景映射到所述注册场景,得到映射后的第一识别对象的生物特征,
根据所述第一注册对象的生物特征在所述注册场景的概率分布模型上计算后验概率分布模板,
根据所述后验概率分布模板和所述映射后的第一识别对象的生物特征在所述注册场景的概率分布模型上计算所述后验概率部分,
根据所述第一识别对象的生物特征在所述识别场景的概率分布模型上计算所述边缘概率部分,
根据所述后验概率部分和所述边缘概率部分,得到所述似然打分。
3.根据权利要求1所述的方法,其特征在于,根据所述第一注册对象的生物特征与所述第一识别对象的生物特征计算所述似然打分,包括:
根据所述第一注册对象的生物特征在所述注册场景的概率分布模型上计算后验概率分布模板,
根据所述映射关系,将所述后验概率分布模板从所述注册场景映射到所述识别场景,得到映射后的后验概率分布模板,
根据所述映射后的后验概率分布模板在所述识别场景的概率分布模型上计算所述后验概率部分,
根据所述第一识别对象的特征在所述识别场景的概率分布模型上计算所述边缘概率部分,
根据所述后验概率部分和所述边缘概率部分,得到所述似然打分。
4.根据权利要求2或3所述的方法,其特征在于,
所述注册场景的概率分布模型和所述识别场景的概率分布模型均服从线性高斯分布,
所述不同注册对象之间的概率分布参数包括所述注册场景中不同注册对象的特征空间分布的均值和方差,
所述同一注册对象的不同样本之间的概率分布参数包括所述注册场景中同一注册对象的特征空间分布的方差,
所述不同识别对象之间的概率分布参数包括所述识别场景中不同识别对象的特征空间分布的均值和方差,
所述同一识别对象的不同样本之间的概率分布参数包括所述识别场景中同一识别对象的特征空间分布的方差。
5.根据权利要求4所述的方法,其特征在于,所述似然打分根据所述线性高斯分布计算。
6.根据权利要求2或3所述的方法,其特征在于,所述映射关系根据已训练的映射函数确定,所述已训练的映射函数通过以下方法获得:
根据注册训练数据估计所述注册场景下的特征分布,
根据识别训练数据估计所述识别场景下的特征分布,
根据映射函数、所述注册训练数据和识别训练数据计算基于最大似然准则估计的损失函数,其中,所述映射函数用于所述注册场景下的特征分布与所述识别场景下的特征分布之间的互逆映射,
根据所述损失函数调整所述映射函数的参数直到所述损失函数满足最小化的优化条件,得到所述已训练的映射函数。
7.根据权利要求6所述的方法,其特征在于,所述映射函数是一元一次函数,所述映射函数的参数包括所述一元一次函数的两个常数。
8.根据权利要求6所述的方法,其特征在于,与所述损失函数对应的机器学习模型用于最大似然概率线性回归mllr任务。
9.根据权利要求1至3中任一项所述的方法,其特征在于,所述方法还包括:
获得在所述识别场景下从第二识别对象的多个样本提取的生物特征并计算与所述第二识别对象的多个样本各自对应的似然打分,
根据与所述第二识别对象的多个样本各自对应的似然打分,在从所述第二识别对象的多个样本提取的生物特征中筛选出用于状态更新的特征,
利用所述用于状态更新的特征,更新所述识别场景的概率分布模型所包括的同一识别对象的不同样本之间的概率分布参数。
10.根据权利要求1至3中任一项所述的方法,其特征在于,所述方法还包括:
通过聚类算法,对所述识别场景的概率分布模型所包括的同一识别对象的不同样本之间的概率分布参数进行聚类并得到多个子模型,
其中,所述多个子模型各自对应同一识别对象的不同状态;
其中,所述似然打分的所述边缘概率部分融合所述多个子模型各自的打分结果。
11.根据权利要求1至3中任一项所述的方法,其特征在于,所述生物特征包括声纹特征。
12.根据权利要求1至3中任一项所述的方法,其特征在于,所述生物特征包括人脸特征。
13.根据权利要求1至3中任一项所述的方法,其特征在于,所述生物特征包括指纹特征。
14.根据权利要求1至3中任一项所述的方法,其特征在于,所述注册场景和所述识别场景分别对应不同的设备。
15.一种芯片系统,其特征在于,所述芯片系统应用于电子设备;所述芯片系统包括一个或多个接口电路,以及一个或多个处理器;所述接口电路和所述处理器通过线路互联;所述接口电路用于从所述电子设备的存储器接收信号,并向所述处理器发送所述信号,所述信号包括所述存储器中存储的计算机指令;当所述处理器执行所述计算机指令时,所述电子设备执行如权利要求1-14中任意一项所述方法。
16.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序指令,所述计算机程序指令当被处理器执行时使所述处理器执行如权利要求1-14任一项所述的方法。
17.一种身份验证系统,其特征在于,所述身份验证系统包括:
注册模块,用于获得在注册场景下从第一注册对象提取的生物特征;
识别模块,用于获得在识别场景下从第一识别对象提取的生物特征;
以及
打分判决模块,用于根据所述第一注册对象的生物特征与所述第一识别对象的生物特征计算似然打分和根据所述似然打分判断所述第一识别对象的身份是否与所述第一注册对象的身份一致,
其中,所述似然打分包括后验概率部分和边缘概率部分,
所述后验概率部分根据所述第一注册对象的生物特征,注册场景的概率分布模型和所述注册场景的概率分布模型与识别场景的概率分布模型的映射关系确定,
所述注册场景的概率分布模型包括在所述注册场景下从一个或多个注册对象提取生物特征时不同注册对象之间的概率分布参数和同一注册对象的不同样本之间的概率分布参数,所述识别场景的概率分布模型包括在所述识别场景下从一个或多个识别对象提取生物特征时不同识别对象之间的概率分布参数和同一识别对象的不同样本之间的概率分布参数,
所述边缘概率部分根据所述第一识别对象的生物特征,所述识别场景的概率分布模型和所述映射关系确定。
18.根据权利要求17所述的身份验证系统,其特征在于,所述打分判决模块,具体用于:
根据所述映射关系,将所述第一识别对象的生物特征从所述识别场景映射到所述注册场景,得到映射后的第一识别对象的生物特征,
根据所述第一注册对象的生物特征在所述注册场景的概率分布模型上计算后验概率分布模板,
根据所述后验概率分布模板和所述映射后的第一识别对象的生物特征在所述注册场景的概率分布模型上计算所述后验概率部分,
根据所述第一识别对象的生物特征在所述识别场景的概率分布模型上计算所述边缘概率部分,
根据所述后验概率部分和所述边缘概率部分,得到所述似然打分。
19.根据权利要求17所述的身份验证系统,其特征在于,所述打分判决模块,具体用于:
根据所述第一注册对象的生物特征在所述注册场景的概率分布模型上计算后验概率分布模板,
根据所述映射关系,将所述后验概率分布模板从所述注册场景映射到所述识别场景,得到映射后的后验概率分布模板,
根据所述映射后的后验概率分布模板在所述识别场景的概率分布模型上计算所述后验概率部分,
根据所述第一识别对象的特征在所述识别场景的概率分布模型上计算所述边缘概率部分,
根据所述后验概率部分和所述边缘概率部分,得到所述似然打分。
20.根据权利要求18或19所述的身份验证系统,其特征在于,
所述注册场景的概率分布模型和所述识别场景的概率分布模型均服从线性高斯分布,
所述不同注册对象之间的概率分布参数包括所述注册场景中不同注册对象的特征空间分布的均值和方差,
所述同一注册对象的不同样本之间的概率分布参数包括所述注册场景中同一注册对象的特征空间分布的方差,
所述不同识别对象之间的概率分布参数包括所述识别场景中不同识别对象的特征空间分布的均值和方差,
所述同一识别对象的不同样本之间的概率分布参数包括所述识别场景中同一识别对象的特征空间分布的方差。
21.根据权利要求20所述的身份验证系统,其特征在于,所述似然打分根据所述线性高斯分布计算。
22.根据权利要求18或19所述的身份验证系统,其特征在于,所述映射关系根据已训练的映射函数确定,所述已训练的映射函数通过以下方法获得:
根据注册训练数据估计所述注册场景下的特征分布,
根据识别训练数据估计所述识别场景下的特征分布,
根据映射函数、所述注册训练数据和识别训练数据计算基于最大似然准则估计的损失函数,其中,所述映射函数用于所述注册场景下的特征分布与所述识别场景下的特征分布之间的互逆映射,
根据所述损失函数调整所述映射函数的参数直到所述损失函数满足最小化的优化条件,得到所述已训练的映射函数。
23.根据权利要求22所述的身份验证系统,其特征在于,所述映射函数是一元一次函数,所述映射函数的参数包括所述一元一次函数的两个常数。
24.根据权利要求22所述的身份验证系统,其特征在于,与所述损失函数对应的机器学习模型用于最大似然概率线性回归mllr任务。
25.根据权利要求17至19中任一项所述的身份验证系统,其特征在于,所述打分判决模块还用于:
获得在所述识别场景下从第二识别对象的多个样本提取的生物特征并计算与所述第二识别对象的多个样本各自对应的似然打分,
根据与所述第二识别对象的多个样本各自对应的似然打分,在从所述第二识别对象的多个样本提取的生物特征中筛选出用于状态更新的特征,
利用所述用于状态更新的特征,更新所述识别场景的概率分布模型所包括的同一识别对象的不同样本之间的概率分布参数。
26.根据权利要求17至19中任一项所述的身份验证系统,其特征在于,所述打分判决模块还用于:
通过聚类算法,对所述识别场景的概率分布模型所包括的同一识别对象的不同样本之间的概率分布参数进行聚类并得到多个子模型,
其中,所述多个子模型各自对应同一识别对象的不同状态;
其中,所述似然打分的所述边缘概率部分融合所述多个子模型各自的打分结果。
技术总结