本公开涉及终端技术领域,尤其涉及一种唤醒控制方法、装置、存储介质及终端。
背景技术:
随着科技的发展,智能语音产品越来越普及,常见的智能语音设备包括智能音箱,儿童陪伴机器人,智能闹钟,智能家电等。通常情况下,不同智能设备中预先设置的唤醒词可以是相同的,这样,由于同一个空间内可能会同时存在多个智能语音设备,用户语音说同一个唤醒词时,可能会有多个智能设备同时响应,容易导致用户困扰,严重影响用户的交互体验。
相关技术中,为了避免多个智能语音设备同时响应用户的唤醒,可以通过就近唤醒判断方法,从多个智能语音设备中选择距离用户最近的智能语音设备响应用户的唤醒,但是,当多个智能语音设备中只有部分智能语音设备可以根据用户说的唤醒词唤醒时,已唤醒的智能语音设备需要等到超时判决计时器超时后才会响应用户的唤醒,导致唤醒响应速度较慢,影响用户体验。
技术实现要素:
为克服相关技术中存在的问题,本公开提供一种唤醒控制方法、装置、存储介质及终端。
根据本公开实施例的第一方面,提供一种唤醒控制方法,应用于第一终端,所述方法包括:实时采集音频数据;在目标时间段内采集的第一音频数据满足预设唤醒条件的情况下,获取存储的历史时间段内的第一历史音频数据,所述历史时间段包括所述目标时间段之前的预设时间段;获取所述第一历史音频数据对应的第一声纹特征,并将所述第一声纹特征发送至第二终端,以使所述第二终端在接收到所述第一声纹特征后,获取存储的所述历史时间段内的第二历史音频数据,并根据所述第二历史音频数据向所述第一终端发送唤醒响应信息;接收所述第二终端发送的所述唤醒响应信息;根据所述唤醒响应信息,从所述第一终端和所述第二终端中,确定待唤醒终端;控制所述待唤醒终端唤醒。
可选地,所述预设唤醒条件包括:所述第一音频数据包括预设唤醒词;或者,所述第一音频数据包括所述预设唤醒词中的目标关键字,所述目标关键字包括所述预设唤醒词中的前n个关键字,n为大于0且小于目标数量的整数,所述目标数量为所述预设唤醒词中的关键字的数量。
可选地,所述唤醒响应信息包括拒绝唤醒信息或者所述第二历史音频数据的唤醒特征;所述根据所述唤醒响应信息,从所述第一终端和所述第二终端中,确定待唤醒终端包括:在所述唤醒响应信息包括所述第二历史音频数据的唤醒特征的情况下,根据所述第一音频数据的唤醒特征和所述第二历史音频数据的唤醒特征,从所述第一终端和所述第二终端中,确定距离用户最近的目标终端,并将所述目标终端作为所述待唤醒终端,所述唤醒特征用于表征终端与所述用户之间的距离;或者,在所述唤醒响应信息包括所述拒绝唤醒信息的情况下,将所述第一终端作为所述待唤醒终端。
可选地,所述控制所述待唤醒终端唤醒包括:在所述待唤醒终端为所述第一终端的情况下,控制所述第一终端唤醒;或者,在所述待唤醒终端为所述第二终端的情况下,向所述第二终端发送唤醒指令,以使所述第二终端根据所述唤醒指令唤醒。
根据本公开实施例的第二方面,提供一种唤醒控制方法,应用于第二终端,所述方法包括:实时采集音频数据;在接收到第一终端发送的历史时间段内采集的第一历史音频数据对应的第一声纹特征的情况下,获取存储的所述历史时间段内的第二历史音频数据;根据所述第二历史音频数据,向所述第一终端发送唤醒响应信息,以使所述第一终端根据所述唤醒响应信息确定待唤醒终端,并控制所述待唤醒终端唤醒。
可选地,所述唤醒响应信息包括拒绝唤醒信息或者所述第二历史音频数据的唤醒特征,在所述根据所述第二历史音频数据,向所述第一终端发送唤醒响应信息前,所述方法还包括:根据所述第二历史音频数据,确定是否唤醒所述第二终端;所述根据所述第二历史音频数据,向所述第一终端发送唤醒响应信息包括:在确定唤醒所述第二终端的情况下,向所述第一终端发送所述第二历史音频数据的唤醒特征;或者,在确定不唤醒所述第二终端的情况下,向所述第一终端发送所述拒绝唤醒信息。
可选地,在所述根据所述第二历史音频数据,确定是否唤醒所述第二终端前,所述方法还包括:确定所述第二历史音频数据是否包括话音数据;所述根据所述第二历史音频数据,确定是否唤醒所述第二终端包括:在所述第二历史音频数据包括所述话音数据的情况下,获取所述第二历史音频数据对应的第二声纹特征,并根据所述第一声纹特征和所述第二声纹特征,确定是否唤醒所述第二终端;或者,在所述第二历史音频数据不包括所述话音数据的情况下,确定不唤醒所述第二终端。
可选地,所述根据所述第一声纹特征和所述第二声纹特征,确定是否唤醒所述第二终端包括:根据所述第一声纹特征和所述第二声纹特征,确定所述第一历史音频数据和所述第二历史音频数据是否属于同一用户;在确定所述第一历史音频数据和所述第二历史音频数据属于同一用户的情况下,确定唤醒所述第二终端,或者,在确定所述第一历史音频数据和所述第二历史音频数据不属于同一用户的情况下,确定不唤醒所述第二终端。
可选地,所述方法还包括:在所述待唤醒终端为所述第二终端的情况下,接收所述第一终端发送的唤醒指令;根据所述唤醒指令唤醒所述第二终端。
根据本公开实施例的第三方面,提供一种唤醒控制装置,应用于第一终端,所述装置包括:第一数据采集模块,被配置为实时采集音频数据;第一数据获取模块,被配置为在目标时间段内采集的第一音频数据满足预设唤醒条件的情况下,获取存储的历史时间段内的第一历史音频数据,所述历史时间段包括所述目标时间段之前的预设时间段;声纹特征获取模块,被配置为获取所述第一历史音频数据对应的第一声纹特征,并将所述第一声纹特征发送至第二终端,以使所述第二终端在接收到所述第一声纹特征后,获取存储的所述历史时间段内的第二历史音频数据,并根据所述第二历史音频数据向所述第一终端发送唤醒响应信息;信息接收模块,被配置为接收所述第二终端发送的所述唤醒响应信息;终端确定模块,被配置为根据所述唤醒响应信息,从所述第一终端和所述第二终端中,确定待唤醒终端;第一唤醒模块,被配置为控制所述待唤醒终端唤醒。
可选地,所述预设唤醒条件包括:所述第一音频数据包括预设唤醒词;或者,所述第一音频数据包括所述预设唤醒词中的目标关键字,所述目标关键字包括所述预设唤醒词中的前n个关键字,n为大于0且小于目标数量的整数,所述目标数量为所述预设唤醒词中的关键字的数量。
可选地,所述唤醒响应信息包括拒绝唤醒信息或者所述第二历史音频数据的唤醒特征;所述终端确定模块包括:终端确定子模块,被配置为在所述唤醒响应信息包括所述第二历史音频数据的唤醒特征的情况下,根据所述第一音频数据的唤醒特征和所述第二历史音频数据的唤醒特征,从所述第一终端和所述第二终端中,确定距离用户最近的目标终端,并将所述目标终端作为所述待唤醒终端,所述唤醒特征用于表征终端与所述用户之间的距离;或者,在所述唤醒响应信息包括所述拒绝唤醒信息的情况下,将所述第一终端作为所述待唤醒终端。
可选地,所述第一唤醒模块包括:唤醒子模块,被配置为在所述待唤醒终端为所述第一终端的情况下,控制所述第一终端唤醒;或者,在所述待唤醒终端为所述第二终端的情况下,向所述第二终端发送唤醒指令,以使所述第二终端根据所述唤醒指令唤醒。
根据本公开实施例的第四方面,提供一种唤醒控制装置,应用于第二终端,所述装置包括:第二数据采集模块,被配置为实时采集音频数据;第二数据获取模块,被配置为在接收到第一终端发送的历史时间段内采集的第一历史音频数据对应的第一声纹特征的情况下,获取存储的所述历史时间段内的第二历史音频数据;信息发送模块,被配置为根据所述第二历史音频数据,向所述第一终端发送唤醒响应信息,以使所述第一终端根据所述唤醒响应信息确定待唤醒终端,并控制所述待唤醒终端唤醒。
可选地,所述唤醒响应信息包括拒绝唤醒信息或者所述第二历史音频数据的唤醒特征,所述装置还包括:唤醒确定模块,被配置为根据所述第二历史音频数据,确定是否唤醒所述第二终端;所述信息发送模块,被配置为:在确定唤醒所述第二终端的情况下,向所述第一终端发送所述第二历史音频数据的唤醒特征;或者,在确定不唤醒所述第二终端的情况下,向所述第一终端发送所述拒绝唤醒信息。
可选地,所述装置还包括:数据确定模块,被配置为确定所述第二历史音频数据是否包括话音数据;所述唤醒确定模块,被配置为:在所述第二历史音频数据包括所述话音数据的情况下,获取所述第二历史音频数据对应的第二声纹特征,并根据所述第一声纹特征和所述第二声纹特征,确定是否唤醒所述第二终端;或者,在所述第二历史音频数据不包括所述话音数据的情况下,确定不唤醒所述第二终端。
可选地,所述唤醒确定模块包括:用户判断子模块,被配置为根据所述第一声纹特征和所述第二声纹特征,确定所述第一历史音频数据和所述第二历史音频数据是否属于同一用户;唤醒确定子模块,被配置为在确定所述第一历史音频数据和所述第二历史音频数据属于同一用户的情况下,确定唤醒所述第二终端,或者,在确定所述第一历史音频数据和所述第二历史音频数据不属于同一用户的情况下,确定不唤醒所述第二终端。
可选地,所述装置还包括:指令接收模块,被配置为在所述待唤醒终端为所述第二终端的情况下,接收所述第一终端发送的唤醒指令;第二唤醒模块,被配置为根据所述唤醒指令唤醒所述第二终端。
根据本公开实施例的第五方面,提供一种计算机可读存储介质,其上存储有计算机程序指令,该程序指令被处理器执行时实现本公开第一方面所提供的唤醒控制方法的步骤,或者,该程序指令被处理器执行时实现本公开第二方面所提供的唤醒控制方法的步骤。
根据本公开实施例的第六方面,提供一种终端,包括:存储器,其上存储有计算机程序;处理器,用于执行所述存储器中的所述计算机程序,以实现本公开第一方面所提供的唤醒控制方法的步骤,或者实现本公开第二方面所提供的唤醒控制方法的步骤。
本公开的实施例提供的技术方案可以包括以下有益效果:通过实时采集音频数据;在目标时间段内采集的第一音频数据满足预设唤醒条件的情况下,获取存储的历史时间段内的第一历史音频数据,所述历史时间段包括所述目标时间段之前的预设时间段;获取所述第一历史音频数据对应的第一声纹特征,并将所述第一声纹特征发送至第二终端,以使所述第二终端在接收到所述第一声纹特征后,获取存储的所述历史时间段内的第二历史音频数据,并根据所述第二历史音频数据向所述第一终端发送唤醒响应信息;接收所述第二终端发送的所述唤醒响应信息;根据所述唤醒响应信息,从所述第一终端和所述第二终端中,确定待唤醒终端;控制所述待唤醒终端唤醒。也就是说,第一终端在满足预设唤醒条件后可以向第二终端发送第一声纹特征,该第二终端在接收到该第一声纹特征后,可以根据该第二历史音频数据向该第一终端发送唤醒响应信息,这样,无需等到超时判决定时器超时,该第一终端在接收到该第二终端发送的唤醒响应信息后,即可确定待唤醒终端,并控制该待唤醒终端唤醒,从而可以提高唤醒响应的速度,提高用户体验。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是根据一示例性实施例示出的一种唤醒控制方法的流程图;
图2是根据一示例性实施例示出的第二种唤醒控制方法的流程图;
图3是根据一示例性实施例示出的第三种唤醒控制方法的流程图;
图4是根据一示例性实施例示出的第四种唤醒控制方法的流程图;
图5是根据一示例性实施例示出的一种唤醒控制装置的结构示意图;
图6是根据一示例性实施例示出的第二种唤醒控制装置的结构示意图;
图7是根据一示例性实施例示出的第三种唤醒控制装置的结构示意图;
图8是根据一示例性实施例示出的第四种唤醒控制装置的结构示意图;
图9是根据一示例性实施例示出的第五种唤醒控制装置的结构示意图;
图10是根据一示例性实施例示出的一种终端的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
在下文中的描述中,“第一”、“第二”等词汇,仅用于区分描述的目的,而不能理解为指示或暗示相对重要性,也不能理解为指示或暗示顺序。
首先,对本公开的应用场景进行说明。通常情况下,唤醒词是由用户预先设置在智能语音设备中的,或者该唤醒词是在该智能语音设备出厂之前设置好的,因此,不同的智能语音设备中预先设置的唤醒词可以是相同的。随着智能语音产品的普及,在同一个空间内可能同时存在多个智能语音设备,因此,用户语音说同一个唤醒词后,同一空间内的多个智能语音设备可能会同时响应,与用户进行交互,容易导致用户困扰,影响用户交互体验。
相关技术中,可以建立多设备联动系统,即通过相同的账号,将同一空间内的多个智能语音设备组成一个联动系统,在用户说出唤醒词后,该联动系统中的每个智能语音设备都可以根据该唤醒词确定是否被唤醒,在确定被唤醒后,可以启动超时判决定时器,并向其他智能语音设备发送唤醒结果。若在该超时判决定时器超时之前,接收到其他智能语音设备发送的唤醒结果,则可以从多个已唤醒的智能语音设备中,确定距离用户最近的智能语音设备响应用户的唤醒;若在该超时判决定时器超时之前未接收到其他智能语音设备发送的唤醒结果,也就是说该联动系统中一个智能语音设备被唤醒,则该被唤醒的智能语音设备需要等到该超时判决定时器超时后,才会响应用户的唤醒。这样,会导致整个联动系统的唤醒响应速度较慢,影响用户体验。
为了解决上述问题,本公开提供一种唤醒控制方法、装置、存储介质及终端,通过在第一终端在满足预设唤醒条件后可以向第二终端发送第一声纹特征,该第二终端可以在接收到该第一声纹特征后,根据该第二终端在历史时间段内采集的第二历史音频数据向该第一终端发送唤醒响应信息,这样,无需等到超时判决定时器超时,该第一终端在接收到该第二终端发送的唤醒响应信息后,即可确定待唤醒终端,并控制该待唤醒终端唤醒,从而可以提高唤醒响应的速度,提高用户体验。
本公开的第一终端和第二终端可以属于同一多设备联动系统,该第一终端和该第二终端的类型可以相同,也可以不同,该第一终端和该第二终端包括但不限于固定设备和移动设备,例如,该固定设备包括但不限于:个人电脑(personalcomputer,pc)、电视、空调、壁挂炉等;该移动设备包括但不限于:手机、平板电脑、可穿戴式设备、音箱、闹钟等,本公开对此不作限定。该多设备联动系统可以使用就近唤醒功能从多个终端中确定响应用户唤醒的终端。例如,第一终端和第二终端都可以属于分布式远场设备组网中的设备。其中,该第二终端可以包括多个,该第一终端和该第二终端在同一空间内,通过同一账号组成该多设备联动系统。另外,本公开中该第一终端的唤醒响应速度比该第二终端的唤醒响应速度更快,例如,该第一终端的唤醒引擎的性能优于第二终端的唤醒引擎的性能。也就是说,在用户在说出唤醒词后,该第一终端可以更快地被唤醒。
下面结合具体实施例对本公开进行说明。
图1是根据一示例性实施例示出的一种唤醒控制方法的流程图,该方法应用于第一终端,如图1所示,该方法包括:
s101、实时采集音频数据。
在本步骤中,在该第一终端开机启动后,该第一终端的数据采集模块可以实时采集音频数据。
s102、在目标时间段内采集的第一音频数据满足预设唤醒条件的情况下,获取存储的历史时间段内的第一历史音频数据。
其中,该历史时间段可以包括该目标时间段之前的预设时间段,该预设时间段可以是用户说完唤醒词所需的时长,不同的唤醒词对应的历史时间段的时长也不同。
需要说明的是,该第一终端的数据采集模块在实时采集音频数据过程中,可以存储历史时间段内采集的第一历史音频数据。示例地,本公开可以采用队列的方式存储该第一历史音频数据,该队列中队头的音频数据为该第一历史音频数据中最早获取的音频数据,队尾的音频数据为该第一历史音频数据中最晚获取的音频数据,在每次采集到新的音频数据后,可以将该队列中队头的音频数据删除,将该新的音频数据存储在该队列的队尾。
在本步骤中,该第一终端在该目标时间段采集到第一音频数据后,可以获取预设唤醒词,根据该预设唤醒词,确定该第一音频数据是否满足预设唤醒条件。其中,该预设唤醒条件可以包括:该第一音频数据包括该预设唤醒词;或者,该第一音频数据包括该预设唤醒词中的目标关键字,该目标关键字包括该预设唤醒词中的前n个关键字,n为大于0且小于目标数量的整数,该目标数量为该预设唤醒词中的关键字的数量。这里,可以根据该第一终端的类型确定n的数值,示例地,在该预设唤醒词包括5个关键字的情况下,针对唤醒实时性要求比较高的第一终端,可以设置较小的数值,例如n可以设置为2;针对唤醒实时性要求较低的第一终端,可以设置较大的数值,例如n可以设置为4,本公开对此不作限定。另外,考虑到n的数值越小,该第一终端被误唤醒的概率也越高,因此,也可以根据该第一终端对误唤醒率的要求确定该n的数值,示例地,在该预设唤醒词包括5个关键字的情况下,针对误唤醒率要求比较高的第一终端,可以设置较大的数值,例如设置为4;针对误唤醒率要求较低的第一终端,可以设置较小的数值,例如设置为2,本公开对此不作限定。
在该预设唤醒条件为该第一音频数据包括该预设唤醒词的情况下,该第一终端的唤醒引擎需要检测到该预设唤醒词中的每个关键字后,才确定该第一音频数据满足该预设唤醒条件,示例地,若该预设唤醒词为“abcde”,则在该第一音频数据中包括“abcde”的情况下,表示该第一音频数据满足该预设唤醒条件。在该预设唤醒条件为该第一音频数据包括该预设唤醒词中的目标关键字的情况下,该第一终端的唤醒引擎在检测到该目标关键字后,即可确定该第一音频数据满足该预设唤醒条件,示例地,若该预设唤醒词为“abcde”,该目标关键字为“abc”,则在该第一音频数据中包括“abc”的情况下,表示该第一音频数据满足该预设唤醒条件。
由于该第一终端在确定该第一音频数据满足该预设唤醒条件后,需要获取该第一历史音频数据,并从该第一历史音频数据中提取第一声纹特征,而提取该第一声纹特征需要花费一定的时间,因此,在该预设唤醒条件为该第一音频数据包括该预设唤醒词中的目标关键字的情况下,该第一终端无需等到用户说完完整的唤醒词,可以提前获取该第一历史音频数据,并从该第一历史音频中提取该第一声纹特征,这样,可以缩短唤醒响应时间,提高唤醒响应速度。
进一步地,在确定该第一音频数据满足该预设唤醒条件的情况下,可以获取存储的该历史时间段内的第一历史音频数据。
s103、获取该第一历史音频数据对应的第一声纹特征,并将该第一声纹特征发送至第二终端。
在本步骤中,在获取该第一历史音频数据后,可以通过相关技术的方法提取该第一历史音频数据对应的第一声纹特征,并将该第一声纹特征发送至第二终端。该第二终端在接收到该第一终端发送的该第一声纹特征后,可以先获取存储的该历史时间段内的第二历史音频数据,并根据该第二历史音频数据向该第一终端发送唤醒响应信息。
s104、接收该第二终端发送的该唤醒响应信息。
s105、根据该唤醒响应信息,从该第一终端和该第二终端中,确定待唤醒终端。
其中,该唤醒响应信息可以包括拒绝唤醒信息或者该第二历史音频数据的唤醒特征,在该唤醒响应信息包括该第二历史音频数据的唤醒特征的情况下,表示该第二终端也可以根据目标时间段内采集的第二音频数据唤醒;在该唤醒响应信息包括该拒绝唤醒信息的情况下,表示该第二终端不会被该目标时间段内采集的该第二音频数据唤醒。
在本步骤中,该第一终端在接收到该第二终端发送的该唤醒响应信息后,可以根据该唤醒响应信息确定可以被该目标时间段采集的音频数据唤醒的终端。若只有该第一终端被唤醒,则可以将该第一终端作为该待唤醒终端,若有多个终端被唤醒,则可以从该多个被唤醒的终端中选择距离用户最近的目标终端,将该目标终端作为该待唤醒终端。
在一种可能的实现方式中,在该唤醒响应信息包括该第二历史音频数据的唤醒特征的情况下,可以获取该第一音频数据的唤醒特征,根据该第一音频数据的唤醒特征和该第二历史音频数据的唤醒特征,从该第一终端和该第二终端中,确定距离用户最近的目标终端,并将该目标终端作为该待唤醒终端,该唤醒特征用于表征终端与该用户之间的距离,示例地,该唤醒特征可以是该音频数据的音频能量,音频能量越大表示该终端距离用户越近,音频能量越小表示该终端距离用户越远。这里,在该唤醒响应信息包括该第二历史音频数据的唤醒特征时,表示该第二终端可以被该唤醒,在这种情况下,该第一终端可以根据该第一音频数据的唤醒特征和该第二历史音频数据的唤醒特征,确定距离用户最近的目标终端,示例地,在该唤醒特征为音频数据的音频能量的情况下,该第一终端可以对比该第一音频数据的音频能量和该第二历史音频数据的音频能量,从该第一终端和该第二终端中,确定音频能量最大的目标终端,并将该目标终端作为该待唤醒终端。
在该唤醒响应信息包括拒绝唤醒信息的情况下,表示该第二终端不会被唤醒,在这种情况下,可以将该第一终端作为该待唤醒终端。
需要说明的是,该第一音频数据的唤醒特征可以是该第一终端在确定该第一音频数据满足该预设唤醒条件时获取的,另外,考虑到该第一历史音频数据中也包括用户说的唤醒词,因此,在该唤醒响应信息包括该第二历史音频数据的唤醒特征的情况下,也可以获取该第一历史音频数据的唤醒特征,根据该第一历史音频数据的唤醒特征和该第二历史音频数据的唤醒特征,从该第一终端和该第二终端中,确定距离用户最近的目标终端,并将该目标终端作为该待唤醒终端。
s106、控制该待唤醒终端唤醒。
在本步骤中,该第一终端在确定该待唤醒终端后,可以根据预先设置的应答指令,控制该待唤醒终端响应用户的唤醒。在一种可能的实现方式中,在该待唤醒终端为该第一终端的情况下,可以控制该第一终端唤醒;或者,在该待唤醒终端为该第二终端的情况下,可以向该第二终端发送唤醒指令,以使该第二终端根据该唤醒指令唤醒。示例地,在该待唤醒终端为该第一终端时,该第一终端可以直接输出应答指令,例如“我在”,在该待唤醒终端为该第二终端时,表示该第二终端与用户之间的距离更近,该第一终端可以向该第二终端发送唤醒指令,该第二终端在接收到该唤醒指令后,可以输出该应答指令,例如“我在”。
需要说明的是,上述控制该待唤醒终端唤醒的方式只是举例说明,也可以通过相关技术的其它方式唤醒该待唤醒终端,本公开对此不作限定。
采用上述方法,在第一终端在满足预设唤醒条件后可以向第二终端发送第一声纹特征,该第二终端在接收到该第一声纹特征后,可以获取存储的历史时间段内的第二历史音频数据,并根据该第二历史音频数据向该第一终端发送唤醒响应信息,这样,无需等到超时判决定时器超时,该第一终端在接收到该第二终端发送的唤醒响应信息后,即可确定待唤醒终端,并控制该待唤醒终端唤醒,从而可以提高唤醒响应的速度,提高用户体验。
图2是根据一示例性实施例示出的第二种唤醒控制方法的流程图,该方法应用于第二终端,如图2所示,该方法包括:
s201、实时采集音频数据。
s202、在接收到第一终端发送的历史时间段内采集的第一历史音频数据对应的第一声纹特征的情况下,获取存储的该历史时间段内的第二历史音频数据。
其中,该历史时间段可以包括该目标时间段之前的预设时间段,该预设时间段可以是用户说完唤醒词所需的时长,不同的唤醒词对应的历史时间段的时长也不同。
需要说明的是,该第二终端的数据采集模块在实时采集音频数据过程中,可以存储历史时间段内采集的第二历史音频数据,这里,存储该第二历史音频数据的方式可以参考步骤s102中存储该第一历史音频数据的方式,此处不再赘述了。
在本步骤中,在该第二终端接收到该第一终端发送的该第一历史音频数据对应的第一声纹特征后,表示该第一终端已被唤醒,该第二终端还没有被唤醒,在这种情况下,该第二终端可以获取存储的该历史时间段内的第二历史音频数据。
s203、根据该第二历史音频数据,向该第一终端发送唤醒响应信息。
其中,该唤醒响应信息可以包括拒绝唤醒信息或者该第二历史音频数据的唤醒特征。
在本步骤中,该第二终端在获取该第二历史音频数据后,可以根据该第二历史音频数据确定该第二终端能否被唤醒。在确定该第二终端可以被唤醒的情况下,可以获取该第二历史音频数据的唤醒特征,并将该第二历史音频数据的唤醒特征发送至该第一终端,在确定该第二终端不会被唤醒的情况下,可以向该第一终端发送该拒绝唤醒信息。
为了确定该第二终端能否被唤醒,在一种可能的实现方式中,可以先确定该第二历史音频数据是否包括话音数据,在该第二历史音频数据不包括话音数据的情况下,表示该第二终端不会被唤醒,可以向该第一终端发送该拒绝唤醒信息。
在该第二历史音频数包括话音数据的情况下,表示该第二终端可能会被唤醒,但是,考虑到该第二历史音频数据中包括的人声可能与该第一历史音频数据中包括的人声不是同一个人,为了避免该第二终端被误唤醒,在该第二历史音频数据包括话音数据的情况下,可以进一步确定该第二终端能否被唤醒。在一种可能的实现方式中,在该第二历史音频数据包括话音数据的情况下,可以获取该第二历史音频数据对应的第二声纹特征,并根据该第一声纹特征和该第二声纹特征,确定是否唤醒该第二终端。
由于不同说话人的声纹特征不同,这里,可以根据该第一声纹特征和该第二声纹特征,确定该第一历史音频数据和该第二历史音频数据是否属于同一用户,在确定该第一历史音频数据和该第二历史音频数据属于同一用户的情况下,确定唤醒该第二终端,或者,在确定该第一历史音频数据和该第二历史音频数据不属于同一用户的情况下,确定不唤醒该第二终端。其中,可以通过相关技术的方式,确定该第一声纹特征和该第二声纹特征是否属于同一说话人,在确定该第一声纹特征和该第二声纹特征属于同一说话人的情况下,可以确定该第一历史音频数据和该第二历史音频数据属于同一用户,从而确定唤醒该第二终端,获取该第二历史音频数据的唤醒特征,并将该第二历史音频数据的唤醒特征发送至该第一终端;在确定该第一声纹特征和该第二声纹特征不属于同一说话人的情况下,可以确定该第一历史音频数据和该第二历史音频数据不属于同一用户,从而确定不唤醒该第二终端,并向该第一终端发送该拒绝唤醒信息。
需要说明的是,该第二终端获取该第二历史音频数据的唤醒特征的方式,可以参考该第一终端获取该第一历史音频数据的唤醒特征的方式,此处不再赘述了。
该第一终端在接收到该第二终端发送的唤醒响应信息后,可以根据该唤醒响应信息确定该待唤醒终端。在该唤醒响应信息包括该拒绝唤醒信息的情况下,可以将该第一终端作为该待唤醒终端,在该唤醒响应信息包括该第二历史音频数据的唤醒特征的情况下,可以根据该第一历史音频数据的唤醒特征和该第二历史音频数据的唤醒特征,从该第一终端和该第二终端中确定该待唤醒终端。
该第一终端在确定该待唤醒终端后,可以根据预先设置的应答指令,控制该待唤醒终端响应用户的唤醒。在该待唤醒终端为该第一终端的情况下,该第一终端可以直接响应用户的唤醒,示例地,该第一终端可以直接输出应答指令,例如“我在”,在该待唤醒终端为该第二终端的情况下,该第二终端可以接收该第一终端发送的唤醒指令,并根据该唤醒指令唤醒该第二终端,响应用户的唤醒,示例地,该第二终端在接收到该唤醒指令后,可以输出该应答指令。
采用上述方法,该第二终端在接收到该第一终端发送的第一历史音频数据对应的第一声纹特征后,可以获取存储的历史时间段内的第二历史音频数据,并根据该第二历史音频数据向该第一终端发送唤醒响应信息,这样,该第一终端无需等到超时判决计时器超时,可以直接根据该唤醒响应信息确定该待唤醒终端,并控制该待唤醒终端唤醒,从而可以提高唤醒响应的速度,提高用户体验。
图3是根据一示例性实施例示出的第三种唤醒控制方法的流程图,如图3所示,该方法包括:
s301、第一终端和第二终端实时采集音频数据。
s302、第一终端在目标时间段内采集的第一音频数据满足预设唤醒条件的情况下,获取存储的历史时间段内的第一历史音频数据。
其中,该历史时间段可以包括该目标时间段之前的预设时间段,该预设时间段可以是用户说完唤醒词的时长,不同的唤醒词对应的历史时间段的时长也不同。
s303、第一终端获取该第一历史音频数据对应的第一声纹特征,并将该第一声纹特征发送至第二终端。
s304、第二终端在接收到第一终端发送的历史时间段内采集的第一历史音频数据对应的第一声纹特征的情况下,获取存储的该历史时间段内的第二历史音频数据。
s305、第二终端确定该第二历史音频数据是否包括话音数据,并在该第二历史音频数据包括话音数据的情况下,执行步骤s306~s309,在该第二历史音频数据不包括话音数据的情况下,确定不唤醒该第二终端,执行步骤s309。
s306、第二终端获取该第二历史音频数据对应的第二声纹特征。
s307、第二终端根据该第一声纹特征和该第二声纹特征,确定是否唤醒该第二终端,并在确定唤醒该第二终端的情况下,执行步骤s308,在确定不唤醒该第二终端的情况下,执行步骤s309。
s308、第二终端向该第一终端发送该第二历史音频数据的唤醒特征。
s309、第二终端向该第一终端发送该拒绝唤醒信息。
s310、第一终端在接收到该第二终端发送的该唤醒响应信息后,根据该唤醒响应信息确定待唤醒终端。
在本步骤中,在该唤醒响应信息包括该第二历史音频数据的唤醒特征的情况下,该第一终端可以获取该第一音频数据的唤醒特征,根据该第一音频数据的唤醒特征和该第二历史音频数据的唤醒特征,从该第一终端和该第二终端中,确定距离用户最近的目标终端,并将该目标终端作为该待唤醒终端;在该唤醒响应信息包括拒绝唤醒信息的情况下,表示该第二终端不会被唤醒,在这种情况下,可以将该第一终端作为该待唤醒终端。
s311、第一终端确定该待唤醒终端是否为该第一终端,在该待唤醒终端为该第一终端的情况下,执行步骤s312,在该待唤醒终端为该第二终端的情况下,执行步骤s313。
s312、第一终端控制该第一终端唤醒。
s313、第一终端向该第二终端发送唤醒指令。
s314、第二终端在接收到该第一终端发送的该唤醒指令后,根据该唤醒指令唤醒该第二终端。
上述步骤s301~步骤s314的具体实现方式可以参照图1所示实施例和图2所示实施例的具体实现方式,此处不再赘述了。
采用上述方法,在第一终端在满足预设唤醒条件后可以向第二终端发送第一声纹特征,该第二终端在接收到该第一声纹特征后,可以获取存储的历史时间段内的第二历史音频数据,并根据该第二历史音频数据确定是否唤醒该第二终端,在确定不唤醒该第二终端的情况下,可以向该第一终端发送拒绝唤醒信息;进一步地,该第二终端在根据该第二历史音频数据确定可能唤醒该第二终端的情况下,可以获取该第二历史音频数据对应的第二声纹特征,并根据该第一声纹特征和该第二声纹特征确定是否唤醒该第二终端,在确定唤醒该第二终端时可以向该第一终端发送该第二历史音频数据的唤醒特征,在确定不唤醒该第二终端时可以向该第一终端发送拒绝唤醒信息,这样,无需等到超时判决定时器超时,该第一终端在接收到该拒绝唤醒信息或者该第二历史音频数据的唤醒特征后,即可确定待唤醒终端,并控制该待唤醒终端唤醒,从而可以提高唤醒响应的速度,提高用户体验。
需要说明的是,图3所示实施例的唤醒控制方法中第一终端先被唤醒,该第二终端在接收到该第一终端发送的第一声纹特征时还未被唤醒,但是,考虑到该第二终端在接收到该第一终端发送的该第一声纹特征时可能已经处于预唤醒状态,也就是说该第二终端已被用户说的唤醒词唤醒,但是还未响应该用户,在这种情况下,也可以通过该第二终端从该第一终端和该第二终端中确定响应用户唤醒的待唤醒终端。在一种可能的实现方式中,图4是根据一示例性实施例示出的第四种唤醒控制方法的流程图,如图4所示,该方法包括:
s401、第一终端和第二终端实时采集音频数据。
s402、第一终端在目标时间段内采集的第一音频数据满足预设唤醒条件的情况下,获取存储的历史时间段内的第一历史音频数据。
其中,该历史时间段可以包括该目标时间段之前的预设时间段,该预设时间段可以是用户说完唤醒词的时长,不同的唤醒词对应的历史时间段的时长也不同。
s403、第一终端获取该第一历史音频数据对应的第一声纹特征,以及该第一音频数据的唤醒特征,并将该第一声纹特征和该第一音频数据的唤醒特征发送至第二终端。
s404、第二终端在接收到该第一终端发送的该第一声纹特征和该第一音频数据的唤醒特征的情况下,确定该第二终端是否处于预唤醒状态,并在该第二终端处于预唤醒状态的情况下,获取存储的该历史时间段内的第二历史音频数据。
需要说明的是,在该第二终端未处于该预唤醒状态的情况下,后续的处理方式可以参照图3所示实施例中s304~s314的处理方式,此处不再赘述了。
s405、第二终端获取该第二历史音频数据对应的第二声纹特征。
s406、第二终端根据该第一声纹特征和该第二声纹特征,确定是否唤醒该第二终端,并在确定唤醒该第二终端的情况下,执行步骤s407~s412,在确定不唤醒该第二终端的情况下,执行步骤s413~s414。
s407、第二终端获取该第二历史音频数据的唤醒特征。
s408、第二终端根据该第一音频数据的唤醒特征和该第二历史音频数据的唤醒特征,从该第一终端和该第二终端中确定待唤醒终端。
s409、第二终端确定该待唤醒终端是否为该第二终端,在该待唤醒终端为该第二终端的情况下,执行步骤s410,在该待唤醒终端为该第一终端的情况下,执行步骤s411。
s410、第二终端控制该第二终端唤醒。
s411、第二终端向该第一终端发送唤醒指令。
s412、第一终端在接收到该第二终端发送的该唤醒指令后,根据该唤醒指令唤醒该第一终端。
s413、第二终端向该第一终端发送拒绝唤醒信息。
s414、第一终端在接收到该第二终端发送的该唤醒响应信息后,控制该第一终端唤醒。
上述步骤s401~步骤s414的具体实现方式可以参照图1所示实施例和图2所示实施例的具体实现方式,此处不再赘述了。
采用上述方法,在第一终端在满足预设唤醒条件后可以向第二终端发送第一声纹特征和第一音频数据的唤醒特征,该第二终端在接收到该第一声纹特征和该第一音频数据的唤醒特征,并确定该第二终端处于预唤醒状态的情况下,可以获取该第二历史音频数据对应的第二声纹特征,并根据该第一声纹特征和该第二声纹特征确定是否唤醒该第二终端,在确定唤醒该第二终端的情况下,可以获取该第二历史音频数据的唤醒特征,根据该第一音频数据的唤醒特征和该第二历史音频数据的唤醒特征,确定响应用户唤醒的待唤醒终端,并控制该待唤醒终端唤醒,这样,无需等到超时判决定时器超时,该第二终端在接收到该第一终端发送的该第一声纹特征和该第一音频数据的唤醒特征后,即可确定待唤醒终端,并控制该待唤醒终端唤醒,从而可以提高唤醒响应的速度,提高用户体验。
图5是根据一示例性实施例示出的一种唤醒控制装置的结构示意图,该装置应用于第一终端,如图5所示,该装置包括:
第一数据采集模块501,被配置为实时采集音频数据;
第一数据获取模块502,被配置为在目标时间段内采集的第一音频数据满足预设唤醒条件的情况下,获取存储的历史时间段内的第一历史音频数据,该历史时间段包括该目标时间段之前的预设时间段;
声纹特征获取模块503,被配置为获取该第一历史音频数据对应的第一声纹特征,并将该第一声纹特征发送至第二终端,以使该第二终端在接收到该第一声纹特征后,获取存储的该历史时间段内的第二历史音频数据,并根据该第二历史音频数据向该第一终端发送唤醒响应信息;
信息接收模块504,被配置为接收该第二终端发送的该唤醒响应信息;
终端确定模块505,被配置为根据该唤醒响应信息,从该第一终端和该第二终端中,确定待唤醒终端;
第一唤醒模块506,被配置为控制该待唤醒终端唤醒。
可选地,该预设唤醒条件包括:
该第一音频数据包括预设唤醒词;或者,
该第一音频数据包括该预设唤醒词中的目标关键字,该目标关键字包括该预设唤醒词中的前n个关键字,n为大于0且小于目标数量的整数,该目标数量为该预设唤醒词中的关键字的数量。
可选地,该终端确定模块505包括:
终端确定子模块,被配置为在该唤醒响应信息包括该第二历史音频数据的唤醒特征的情况下,根据该第一音频数据的唤醒特征和该第二历史音频数据的唤醒特征,从该第一终端和该第二终端中,确定距离用户最近的目标终端,并将该目标终端作为该待唤醒终端,该唤醒特征用于表征终端与该用户之间的距离;或者,
在该唤醒响应信息包括拒绝唤醒信息的情况下,将该第一终端作为该待唤醒终端。
可选地,该第一唤醒模块506包括:
唤醒子模块,被配置为在该待唤醒终端为该第一终端的情况下,控制该第一终端唤醒;或者,
在该待唤醒终端为该第二终端的情况下,向该第二终端发送唤醒指令,以使该第二终端根据该唤醒指令唤醒。
通过上述装置,通过在第一终端在满足预设唤醒条件后可以向第二终端发送第一声纹特征,该第二终端在接收到该第一声纹特征后,可以获取存储的历史时间段内的第二历史音频数据,并根据该第二历史音频数据向该第一终端发送唤醒响应信息,这样,无需等到超时判决定时器超时,该第一终端在接收到该第二终端发送的唤醒响应信息后,即可确定待唤醒终端,并控制该待唤醒终端唤醒,从而可以提高唤醒响应的速度,提高用户体验。
图6是根据一示例性实施例示出的第二种唤醒控制装置的结构示意图,该装置应用于第二终端,如图6所示,该装置包括:
第二数据采集模块601,被配置为实时采集音频数据;
第二数据获取模块602,被配置为在接收到第一终端发送的历史时间段内采集的第一历史音频数据对应的第一声纹特征的情况下,获取存储的该历史时间段内的第二历史音频数据;
信息发送模块603,被配置为根据该第二历史音频数据,向该第一终端发送唤醒响应信息,以使该第一终端根据该唤醒响应信息确定待唤醒终端,并控制该待唤醒终端唤醒。
可选地,该唤醒响应信息包括拒绝唤醒信息或者该第二历史音频数据的唤醒特征,图7是根据一示例性实施例示出的第三种唤醒控制装置的结构示意图,如图7所示,该装置还包括:
唤醒确定模块604,被配置为根据该第二历史音频数据,确定是否唤醒该第二终端;
该信息发送模块603,被配置为:
在确定唤醒该第二终端的情况下,向该第一终端发送该第二历史音频数据的唤醒特征;或者,
在确定不唤醒该第二终端的情况下,向该第一终端发送该拒绝唤醒信息。
可选地,图8是根据一示例性实施例示出的第四种唤醒控制装置的结构示意图,如图8所示,该装置还包括:
数据确定模块605,被配置为确定该第二历史音频数据是否包括话音数据;
该唤醒确定模块604,被配置为:
在该第二历史音频数据包括该话音数据的情况下,获取该第二历史音频数据对应的第二声纹特征,并根据该第一声纹特征和该第二声纹特征,确定是否唤醒该第二终端;或者,
在该第二历史音频数据不包括该话音数据的情况下,确定不唤醒该第二终端。
可选地,该唤醒确定模块604包括:
用户判断子模块,被配置为根据该第一声纹特征和该第二声纹特征,确定该第一历史音频数据和该第二历史音频数据是否属于同一用户;
唤醒确定子模块,被配置为在确定该第一历史音频数据和该第二历史音频数据属于同一用户的情况下,确定唤醒该第二终端,或者,在确定该第一历史音频数据和该第二历史音频数据不属于同一用户的情况下,确定不唤醒该第二终端。
可选地,图9是根据一示例性实施例示出的第五种唤醒控制装置的结构示意图,如图9所示,该装置还包括:
指令接收模块606,被配置为在所述待唤醒终端为所述第二终端的情况下,接收所述第一终端发送的唤醒指令;
第二唤醒模块607,被配置为根据所述唤醒指令唤醒所述第二终端。
通过上述装置,该第二终端在接收到该第一终端发送的第一历史音频数据对应的第一声纹特征后,可以获取存储的历史时间段内的第二历史音频数据,并根据该第二历史音频数据向该第一终端发送唤醒响应信息,这样,该第一终端无需等到超时判决计时器超时,可以直接根据该唤醒响应信息确定该待唤醒终端,并控制该待唤醒终端唤醒,从而可以提高唤醒响应的速度,提高用户体验。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本公开还提供一种计算机可读存储介质,其上存储有计算机程序指令,该程序指令被处理器执行时实现本公开提供的唤醒控制方法的步骤。
图10是根据一示例性实施例示出的一种终端1000的框图。例如,终端1000可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图10,终端1000可以包括以下一个或多个组件:处理组件1002,存储器1004,电力组件1006,多媒体组件1008,音频组件1010,输入/输出(i/o)的接口1012,传感器组件1014,以及通信组件1016。
处理组件1002通常控制终端1000的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件1002可以包括一个或多个处理器1020来执行指令,以完成上述的唤醒控制方法的全部或部分步骤。此外,处理组件1002可以包括一个或多个模块,便于处理组件1002和其他组件之间的交互。例如,处理组件1002可以包括多媒体模块,以方便多媒体组件1008和处理组件1002之间的交互。
存储器1004被配置为存储各种类型的数据以支持在终端1000的操作。这些数据的示例包括用于在终端1000上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器1004可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。
电力组件1006为终端1000的各种组件提供电力。电力组件1006可以包括电源管理系统,一个或多个电源,及其他与为终端1000生成、管理和分配电力相关联的组件。
多媒体组件1008包括在所述终端1000和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(lcd)和触摸面板(tp)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件1008包括一个前置摄像头和/或后置摄像头。当终端1000处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件1010被配置为输出和/或输入音频信号。例如,音频组件1010包括一个麦克风(mic),当终端1000处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器1004或经由通信组件1016发送。在一些实施例中,音频组件1010还包括一个扬声器,用于输出音频信号。i/o接口1012为处理组件1002和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件1014包括一个或多个传感器,用于为终端1000提供各个方面的状态评估。例如,传感器组件1014可以检测到终端1000的打开/关闭状态,组件的相对定位,例如所述组件为终端1000的显示器和小键盘,传感器组件1014还可以检测终端1000或终端1000一个组件的位置改变,用户与终端1000接触的存在或不存在,终端1000方位或加速/减速和终端1000的温度变化。传感器组件1014可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件1014还可以包括光传感器,如cmos或ccd图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件1014还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件1016被配置为便于终端1000和其他设备之间有线或无线方式的通信。终端1000可以接入基于通信标准的无线网络,如wifi,2g或3g,或它们的组合。在一个示例性实施例中,通信组件1016经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件1016还包括近场通信(nfc)模块,以促进短程通信。例如,在nfc模块可基于射频识别(rfid)技术,红外数据协会(irda)技术,超宽带(uwb)技术,蓝牙(bt)技术和其他技术来实现。
在示例性实施例中,终端1000可以被一个或多个应用专用集成电路(asic)、数字信号处理器(dsp)、数字信号处理设备(dspd)、可编程逻辑器件(pld)、现场可编程门阵列(fpga)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述唤醒控制方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器1004,上述指令可由终端1000的处理器1020执行以完成上述唤醒控制方法。例如,所述非临时性计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。
在另一示例性实施例中,还提供一种计算机程序产品,该计算机程序产品包含能够由可编程的装置执行的计算机程序,该计算机程序具有当由该可编程的装置执行时用于执行上述的唤醒控制方法的代码部分。
本领域技术人员在考虑说明书及实践本公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
1.一种唤醒控制方法,其特征在于,应用于第一终端,所述方法包括:
实时采集音频数据;
在目标时间段内采集的第一音频数据满足预设唤醒条件的情况下,获取存储的历史时间段内的第一历史音频数据,所述历史时间段包括所述目标时间段之前的预设时间段;
获取所述第一历史音频数据对应的第一声纹特征,并将所述第一声纹特征发送至第二终端,以使所述第二终端在接收到所述第一声纹特征后,获取存储的所述历史时间段内的第二历史音频数据,并根据所述第二历史音频数据向所述第一终端发送唤醒响应信息;
接收所述第二终端发送的所述唤醒响应信息;
根据所述唤醒响应信息,从所述第一终端和所述第二终端中,确定待唤醒终端;
控制所述待唤醒终端唤醒。
2.根据权利要求1所述的方法,其特征在于,所述预设唤醒条件包括:
所述第一音频数据包括预设唤醒词;或者,
所述第一音频数据包括所述预设唤醒词中的目标关键字,所述目标关键字包括所述预设唤醒词中的前n个关键字,n为大于0且小于目标数量的整数,所述目标数量为所述预设唤醒词中的关键字的数量。
3.根据权利要求1所述的方法,其特征在于,所述唤醒响应信息包括拒绝唤醒信息或者所述第二历史音频数据的唤醒特征;所述根据所述唤醒响应信息,从所述第一终端和所述第二终端中,确定待唤醒终端包括:
在所述唤醒响应信息包括所述第二历史音频数据的唤醒特征的情况下,根据所述第一音频数据的唤醒特征和所述第二历史音频数据的唤醒特征,从所述第一终端和所述第二终端中,确定距离用户最近的目标终端,并将所述目标终端作为所述待唤醒终端,所述唤醒特征用于表征终端与所述用户之间的距离;或者,
在所述唤醒响应信息包括所述拒绝唤醒信息的情况下,将所述第一终端作为所述待唤醒终端。
4.根据权利要求1所述的方法,其特征在于,所述控制所述待唤醒终端唤醒包括:
在所述待唤醒终端为所述第一终端的情况下,控制所述第一终端唤醒;或者,
在所述待唤醒终端为所述第二终端的情况下,向所述第二终端发送唤醒指令,以使所述第二终端根据所述唤醒指令唤醒。
5.一种唤醒控制方法,其特征在于,应用于第二终端,所述方法包括:
实时采集音频数据;
在接收到第一终端发送的历史时间段内采集的第一历史音频数据对应的第一声纹特征的情况下,获取存储的所述历史时间段内的第二历史音频数据;
根据所述第二历史音频数据,向所述第一终端发送唤醒响应信息,以使所述第一终端根据所述唤醒响应信息确定待唤醒终端,并控制所述待唤醒终端唤醒。
6.根据权利要求5所述的方法,其特征在于,所述唤醒响应信息包括拒绝唤醒信息或者所述第二历史音频数据的唤醒特征,在所述根据所述第二历史音频数据,向所述第一终端发送唤醒响应信息前,所述方法还包括:
根据所述第二历史音频数据,确定是否唤醒所述第二终端;
所述根据所述第二历史音频数据,向所述第一终端发送唤醒响应信息包括:
在确定唤醒所述第二终端的情况下,向所述第一终端发送所述第二历史音频数据的唤醒特征;或者,
在确定不唤醒所述第二终端的情况下,向所述第一终端发送所述拒绝唤醒信息。
7.根据权利要求6所述的方法,其特征在于,在所述根据所述第二历史音频数据,确定是否唤醒所述第二终端前,所述方法还包括:
确定所述第二历史音频数据是否包括话音数据;
所述根据所述第二历史音频数据,确定是否唤醒所述第二终端包括:
在所述第二历史音频数据包括所述话音数据的情况下,获取所述第二历史音频数据对应的第二声纹特征,并根据所述第一声纹特征和所述第二声纹特征,确定是否唤醒所述第二终端;或者,
在所述第二历史音频数据不包括所述话音数据的情况下,确定不唤醒所述第二终端。
8.根据权利要求7所述的方法,其特征在于,所述根据所述第一声纹特征和所述第二声纹特征,确定是否唤醒所述第二终端包括:
根据所述第一声纹特征和所述第二声纹特征,确定所述第一历史音频数据和所述第二历史音频数据是否属于同一用户;
在确定所述第一历史音频数据和所述第二历史音频数据属于同一用户的情况下,确定唤醒所述第二终端,或者,在确定所述第一历史音频数据和所述第二历史音频数据不属于同一用户的情况下,确定不唤醒所述第二终端。
9.根据权利要求5所述的方法,其特征在于,所述方法还包括:
在所述待唤醒终端为所述第二终端的情况下,接收所述第一终端发送的唤醒指令;
根据所述唤醒指令唤醒所述第二终端。
10.一种唤醒控制装置,其特征在于,应用于第一终端,所述装置包括:
第一数据采集模块,被配置为实时采集音频数据;
第一数据获取模块,被配置为在目标时间段内采集的第一音频数据满足预设唤醒条件的情况下,获取存储的历史时间段内的第一历史音频数据,所述历史时间段包括所述目标时间段之前的预设时间段;
声纹特征获取模块,被配置为获取所述第一历史音频数据对应的第一声纹特征,并将所述第一声纹特征发送至第二终端,以使所述第二终端在接收到所述第一声纹特征后,获取存储的所述历史时间段内的第二历史音频数据,并根据所述第二历史音频数据向所述第一终端发送唤醒响应信息;
信息接收模块,被配置为接收所述第二终端发送的所述唤醒响应信息;
终端确定模块,被配置为根据所述唤醒响应信息,从所述第一终端和所述第二终端中,确定待唤醒终端;
第一唤醒模块,被配置为控制所述待唤醒终端唤醒。
11.根据权利要求10所述的装置,其特征在于,所述预设唤醒条件包括:
所述第一音频数据包括预设唤醒词;或者,
所述第一音频数据包括所述预设唤醒词中的目标关键字,所述目标关键字包括所述预设唤醒词中的前n个关键字,n为大于0且小于目标数量的整数,所述目标数量为所述预设唤醒词中的关键字的数量。
12.根据权利要求10所述的装置,其特征在于,所述唤醒响应信息包括拒绝唤醒信息或者所述第二历史音频数据的唤醒特征;所述终端确定模块包括:
终端确定子模块,被配置为在所述唤醒响应信息包括所述第二历史音频数据的唤醒特征的情况下,根据所述第一音频数据的唤醒特征和所述第二历史音频数据的唤醒特征,从所述第一终端和所述第二终端中,确定距离用户最近的目标终端,并将所述目标终端作为所述待唤醒终端,所述唤醒特征用于表征终端与所述用户之间的距离;或者,
在所述唤醒响应信息包括所述拒绝唤醒信息的情况下,将所述第一终端作为所述待唤醒终端。
13.根据权利要求10所述的装置,其特征在于,所述第一唤醒模块包括:
唤醒子模块,被配置为在所述待唤醒终端为所述第一终端的情况下,控制所述第一终端唤醒;或者,
在所述待唤醒终端为所述第二终端的情况下,向所述第二终端发送唤醒指令,以使所述第二终端根据所述唤醒指令唤醒。
14.一种唤醒控制装置,其特征在于,应用于第二终端,所述装置包括:
第二数据采集模块,被配置为实时采集音频数据;
第二数据获取模块,被配置为在接收到第一终端发送的历史时间段内采集的第一历史音频数据对应的第一声纹特征的情况下,获取存储的所述历史时间段内的第二历史音频数据;
信息发送模块,被配置为根据所述第二历史音频数据,向所述第一终端发送唤醒响应信息,以使所述第一终端根据所述唤醒响应信息确定待唤醒终端,并控制所述待唤醒终端唤醒。
15.根据权利要求14所述的装置,其特征在于,所述唤醒响应信息包括拒绝唤醒信息或者所述第二历史音频数据的唤醒特征,所述装置还包括:
唤醒确定模块,被配置为根据所述第二历史音频数据,确定是否唤醒所述第二终端;
所述信息发送模块,被配置为:
在确定唤醒所述第二终端的情况下,向所述第一终端发送所述第二历史音频数据的唤醒特征;或者,
在确定不唤醒所述第二终端的情况下,向所述第一终端发送所述拒绝唤醒信息。
16.根据权利要求15所述的装置,其特征在于,所述装置还包括:
数据确定模块,被配置为确定所述第二历史音频数据是否包括话音数据;
所述唤醒确定模块,被配置为:
在所述第二历史音频数据包括所述话音数据的情况下,获取所述第二历史音频数据对应的第二声纹特征,并根据所述第一声纹特征和所述第二声纹特征,确定是否唤醒所述第二终端;或者,
在所述第二历史音频数据不包括所述话音数据的情况下,确定不唤醒所述第二终端。
17.根据权利要求16所述的装置,其特征在于,所述唤醒确定模块包括:
用户判断子模块,被配置为根据所述第一声纹特征和所述第二声纹特征,确定所述第一历史音频数据和所述第二历史音频数据是否属于同一用户;
唤醒确定子模块,被配置为在确定所述第一历史音频数据和所述第二历史音频数据属于同一用户的情况下,确定唤醒所述第二终端,或者,在确定所述第一历史音频数据和所述第二历史音频数据不属于同一用户的情况下,确定不唤醒所述第二终端。
18.根据权利要求14所述的装置,其特征在于,所述装置还包括:
指令接收模块,被配置为在所述待唤醒终端为所述第二终端的情况下,接收所述第一终端发送的唤醒指令;
第二唤醒模块,被配置为根据所述唤醒指令唤醒所述第二终端。
19.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,该程序指令被处理器执行时实现权利要求1-4中任一项所述方法的步骤,或者,该程序指令被处理器执行时实现权利要求5-9中任一项所述方法的步骤。
20.一种终端,其特征在于,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现权利要求1-4中任一项所述方法的步骤,或者实现权利要求5-9中任一项所述方法的步骤。
技术总结