确定文本语义信息的方法、装置、设备以及存储介质与流程

    专利2022-07-08  88


    本申请涉及计算机技术领域,特别涉及一种确定文本语义信息的方法、装置、设备以及存储介质。



    背景技术:

    随着科技的进步,任务型对话系统越来越多的被应用到实际的场景中,例如siri,阿里小密这类的产品。而在任务型对话系统中,自然语言理解模块为任务型对话系统作出了重大的贡献。其中,自然语言理解模块主要用于对用户输入的文本或者根据语音识别生成的文本进行处理,来确定文本对应的语义信息,进而为用户推荐相关内容。

    在相关技术中,可以对获取到的文本进行分词处理,并提取每个词对应的多个特征信息,并将获得的至少一个特征信息输入到预先训练的自然语言理解模块,进而输出该文本对应的语义信息。在实现本申请的过程中,发明人发现相关技术对文本识别的准确率较低。



    技术实现要素:

    为了解决相关技术中存在的技术问题,本申请实施例提供了一种确定文本语义信息的方法、装置、设备以及存储介质。本申请的技术方案如下:

    第一方面,本申请实施例提供了一种确定文本语义信息的方法,所述方法包括:

    对目标文本进行分词处理,得到多个词;

    获取每个词对应的多个特征信息,得到每个词对应的特征信息集合;

    分别针对每个词,根据所述词的特征信息集合对所述词执行下述特征融合步骤,以得到所述词的各个融合特征信息:

    分别将所述词对应的每个特征信息确定为目标特征信息,并将所述目标特征信息分别与所述词的每个特征信息组为特征信息对;

    确定所述特征信息对中两个特征信息的融合相关度系数;

    基于所述词的每个特征信息以及每个特征信息与所述目标特征信息的融合相关度系数,确定所述目标特征信息对应的融合特征信息;

    基于每个词的各个融合特征信息,确定所述目标文本对应的语义信息。

    可选的,所述确定所述特征信息对中两个特征信息的融合相关度系数,包括:

    确定所述特征信息对中两个特征信息的第一子相关度系数,确定所述特征信息对中两个特征信息的第二子相关度系数;其中,所述第一子相关度系数用于表示所述两个特征信息在特征值方面的关联度,所述第二子相关度系数用于表示两个特征信息各自的特征类别;

    将所述特征信息对中两个特征信息的第一子相关度系数与所述特征信息对中两个特征信息的第二子相关度系数进行融合,以得到所述特征信息对中两个特征信息的融合相关度系数。

    可选的,所述确定所述特征信息对中两个特征信息的第一子相关度系数,包括:

    将所述特征信息对中的两个特征信息分别进行线性映射,以得到所述两个特征信息的特征值;

    计算所述两个特征信息的特征值的交互信息,以得到所述特征信息对中两个特征信息的第一子相关度系数。

    可选的,所述确定所述特征信息对中两个特征信息的第二子相关度系数,包括:

    根据所述特征信息对中两个特征信息的特征类型编号,在预先训练的特征交互嵌入矩阵中获取所述特征信息对中两个特征信息的编码向量;

    基于所述特征信息对中的目标特征信息与所述编码向量,确定所述特征信息对中两个特征信息的第二子相关度系数。

    可选的,所述基于所述特征信息对中的目标特征信息与所述编码向量,确定所述特征信息对中两个特征信息的第二子相关度系数,包括:

    根据公式fea_noij=fea_key_it*wno*fea_cross_embed(i-i)*n j-1wno∈rd*d计算特征信息对中两个特征信息的第二子相关度系数;假设特征信息对中两个特征信息分别为fea_i以及fea_j,fea_i为目标特征信息,i为目标特征信息的特征类型编号,fea_key_i为目标特征信息fea_i的特征值,fea_noij表示目标特征信息fea_i和特征信息fea_j的第二子相关度系数,j为特征信息fea_j的特征类型编号,fea_cross_embed(i-i)*n j-1表示特征交互嵌入矩阵中的下标为(i-1)*n j-1的编码向量,n表示词的特征信息集合中的特征信息的数目,wno表示映射空间,r表示常数,d表示映射空间的维度。

    可选的,所述基于所述词的每个特征信息以及每个特征信息与所述目标特征信息的融合相关度系数,确定所述目标特征信息对应的融合特征信息,包括:

    计算所述词的每个特征信息与所述特征信息与所述目标特征信息的融合相关度系数的乘积;

    将所述目标特征信息的各个乘积进行相加,得到所述目标特征信息的融合特征信息。

    第二方面,本申请实施例提供了一种确定文本语义信息的装置,所述装置包括:

    划分模块,被配置为对目标文本进行分词处理,得到多个词;

    提取模块,被配置为获取每个词对应的多个特征信息,得到每个词对应的特征信息集合;

    第一确定模块,被配置为分别针对每个词,根据所述词的特征信息集合对所述词执行下述特征融合步骤,以得到所述词的各个融合特征信息:分别将所述词对应的每个特征信息确定为目标特征信息,并将所述目标特征信息分别与所述词的每个特征信息组为特征信息对;确定所述特征信息对中两个特征信息的融合相关度系数;基于所述词的每个特征信息以及每个特征信息与所述目标特征信息的融合相关度系数,确定所述目标特征信息对应的融合特征信息;

    第二确定模块,被配置为基于每个词的各个融合特征信息,确定所述目标文本对应的语义信息。

    可选的,所述第一确定模块,被配置为:

    确定所述特征信息对中两个特征信息的第一子相关度系数,确定所述特征信息对中两个特征信息的第二子相关度系数;其中,所述第一子相关度系数用于表示所述两个特征信息在特征值方面的关联度,所述第二子相关度系数用于表示两个特征信息各自的特征类别;

    将所述特征信息对中两个特征信息的第一子相关度系数与所述特征信息对中两个特征信息的第二子相关度系数进行融合,以得到所述特征信息对中两个特征信息的融合相关度系数。

    可选的,所述第一确定模块,被配置为:

    将所述特征信息对中的两个特征信息分别进行线性映射,以得到所述两个特征信息的特征值;

    计算所述两个特征信息的特征值的交互信息,以得到所述特征信息对中两个特征信息的第一子相关度系数。

    可选的,所述第一确定模块,被配置为:

    根据所述特征信息对中两个特征信息的特征类型编号,在预先训练的特征交互嵌入矩阵中获取所述特征信息对中两个特征信息的编码向量;

    基于所述特征信息对中的目标特征信息与所述编码向量,确定所述特征信息对中两个特征信息的第二子相关度系数。

    可选的,所述第一确定模块,被配置为:

    根据公式fea_noij=fea_key_it*wno*fea_cross_embed(i-i)*n j-1wno∈rd*d计算所述特征信息对中两个特征信息的第二子相关度系数;其中,假设特征信息对中两个特征信息分别为fea_i以及fea_j,fea_i为目标特征信息,i为目标特征信息的特征类型编号,fea_key_i为目标特征信息fea_i的特征值,fea_noij表示目标特征信息fea_i和特征信息fea_j的第二子相关度系数,j为特征信息fea_j的特征类型编号,fea_cross_embed(i-i)*n j-1表示特征交互嵌入矩阵中的下标为(i-1)*n j-1的编码向量,n表示词的特征信息集合中的特征信息的数目,wno表示映射空间,r表示常数,d表示映射空间的维度。

    可选的,所述第一确定模块,被配置为:

    计算所述词的每个特征信息与所述特征信息与所述目标特征信息的融合相关度系数的乘积;

    将所述目标特征信息的各个乘积进行相加,得到所述目标特征信息的融合特征信息。

    第三方面,本申请实施例提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述指令由所述处理器加载并执行以实现如第一方面所述的确定文本语义信息的方法所执行的操作。

    第四方面,本申请实施例提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述指令由处理器加载并执行以实现如第一方面所述的确定文本语义信息的方法所执行的操作。

    本申请实施例提供的技术方案带来的有益效果是:

    本申请实施例中的词的各个融合特征信息是根据词的每个特征信息和每个特征信息和目标特征信息的融合相关度系数确定的,而融合相关度系数是由特征信息对中两个特征信息的第一子相关系数和第二子相关系数确定的,其中,第一子相关系数考虑了特征信息对中两个特征信息在特征值方面的关系,第二子相关度系数考虑了特征信息对中两个特征信息的特征类型。可见,本申请在计算融合相关系数时,不仅考虑到特征信息对中两个特征信息在特征值的相似度,还考虑到两个特征信息的特征类型,使得计算出的融合相关度系数更加的准确,提高了词的识别准确度,从而提高了识别文本的准确率。

    附图说明

    为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

    图1是本申请实施例提供的一种确定文本语义信息的实施环境示意图;

    图2是本申请实施例提供的一种确定文本语义信息的方法流程图;

    图3是本申请实施例提供的一种确定文本语义信息的示意图;

    图4是本申请实施例提供的一种确定文本语义信息的示意图;

    图5是本申请实施例提供的一种确定文本语义信息的示意图;

    图6是本申请实施例提供的一种确定文本语义信息的示意图;

    图7是本申请实施例提供的一种确定文本语义信息的示意图;

    图8是本申请实施例提供的一种确定文本语义信息的装置结构示意图;

    图9是本申请实施例提供的一种终端结构示意图;

    图10是本申请实施例提供的一种服务器结构示意图。

    具体实施方式

    为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。

    发明人在实现相关技术的过程中,发现相关技术所识别的文本准确率较低。经过分析后确定技术问题的一种产生原因是,由于一个文本会包括多个词,每个词对应多个特征信息,而每个词对应的每两个特征信息之间存在一定的相关关系,而相关技术并未考虑到每个词对应的每两个特征信息之间存在的相关关系,便直接将每个词直接输入到预先训练的自然语言理解模块,进而导致预先训练的自然语言理解模块对文本识别的准确率较低。

    为解决上述技术问题,本申请实施例提供了一种确定文本语义信息的方法。图1是本申请实施例提供的一种确定文本语义信息的方法的实施环境的示意图。参见图1,该实施环境包括:终端101。

    终端101可以为智能手机、智能手表、台式电脑、手提电脑、虚拟现实终端、增强现实终端、无线终端和膝上型便携计算机等设备中的至少一种。终端101具有通信功能,可以接入互联网。终端101可以泛指多个终端中的一个,本申请实施例仅以终端101来举例说明。本领域技术人员可以知晓,上述终端的数量可以更多或更少。终端101可以安装有麦克风,以及安装具有文本识别功能的应用程序。其中,终端101上的麦克风用于采集用户的语音信号,具有文本识别功能的应用程序可以将用户的语音信号转换为文本,进而根据本申请实施例提供的方法获取该文本对应的语义信息。或者终端101安装的输入设备包括文本输入模块以直接获得用户输入的文本,从而可以直接根据本申请实施例提供的方法,对用户输入的文本进行处理,以获取用户输入的文本对应的语义信息。

    在本申请实施例提供的方法中,由终端101来确定文本对应的语义信息的过程可以如下所述,当终端接收到获取语音信号的指令之后,终端获得语音信号,并将获取到的语音信号转换为文本。或者,终端直接获得用户在终端上输入的文本。终端对获得到的文本进行分词处理,并获得每个词对应的多个特征信息。根据每个词对应的每两个特征信息之间的融合相关度系数,对每个词对应的多个特征信息进行融合,确定每个词的各个融合特征信息。由于本申请在计算融合相关系数时,不仅考虑到特征信息对中两个特征信息在特征值的相似度,还考虑到两个特征信息的特征类型,使得计算出的融合相关度系数更加的准确,提高了词的识别准确度,从而提高了识别文本的准确率。

    或者,确定文本语义信息的方法可以由服务器实现。

    或者,确定文本语义信息的方法可以由终端和服务器共同实现。示例性地,终端设置有语音输入模块以及通信模块,获得用户输入的语音信号后可以将语音信号转换为文本数据,并将文本数据通过通信模块发送至服务器,或者终端直接将语音信号发送至服务器,由服务器转换为文本数据。或者终端设置有文本输入模块以及通信模块,获得用户输入的文本数据后直接将该文本数据通过通信模块发送至服务器。服务器可以是一个单独的服务器也可以是一个服务器组,如果是单独的服务器,该服务器可以负责下述方案中的所有处理,如果是服务器组,服务器组中的不同服务器分别可以负责下述方案中的不同处理,具体的处理分配情况可以由技术人员根据实际需求任意设置,此处不再赘述。

    图2是本申请实施例提供的一种确定文本语义信息的方法流程图。参见图2,该实施例包括:

    步骤201、对目标文本进行分词处理,得到多个词。

    其中,目标文本是待识别的文本,该文本可以是语音信号转换而来的文本,也可以是用户输入的文本。在实施中,获取需要进行分词处理的文本,在该文本中,确定出与预先存储的词库中的词相同的词,将这些词作为对该文本进行分词处理的结果。或者,将需要进行分词处理的文本输入到预先训练的分词模块中,并将输出的多个词作为对该文本进行分词处理的结果。

    可选的,获取文本的步骤包括:当用户想要通过语音来操控终端时,终端检测是否接收到特定内容的语音指令。当终端检测到特定内容的语音指令后,获取该语音指令对应的声纹特征,并确定出该声纹特征对应的用户是否具有操控终端的权限。当该声纹特征对应的用户具有操控终端的权限时,确定在预设时间内是否检测到语音信号。当终端在预设时间内检测到语音信号时,将该语音信号转换为文本,并将该文本作为待识别的文本。

    其中,将语音指令对应的声纹特征与终端中预先存储的声纹特征进行对比,当语音指令对应的声纹特征与预先存储的声纹特征相同时,确定该声纹特征对应的用户具有操控终端的权限。当语音指令对应的声纹特征与预先存储的声纹特征不同时,确定该声纹特征对应的用户不具有操控终端的权限。

    需要说明的是,终端在预设时间内检测到语音信号之后,还可以包括:提取语音信号的声纹特征,将语音信号对应的声纹特征与预先存储的声纹特征进行对比,或者将语音信号对应的声纹特征与语音指令对应的声纹特征进行对比。当声音信号对应的声纹特征与预先存储的声纹特征相同,或者语音信号对应的声纹特征与语音指令对应的声纹特征相同时,将语音信号转换为文本。当语音信号对应的声纹特征与预先存储的声纹特征不同,或者语音信号对应的声纹特征与语音指令对应的声纹特征不同时,不进行语音信号的转换。本申请实施例可以通过检测声音信号的声纹特征的方法,来防止终端执行其它用户的操控指令。

    可选的,还可以通过以下方式获得文本:用户打开终端上的具有查询功能的应用程序,并在该应用程序上的搜索栏中输入文本,进而使得终端获取到用户输入的文本。其中,具有查询功能的应用程序可以是搜索引擎,音乐应用程序,视频应用程序、购物应用程序等。或者,在用户打开具有查询功能的应用程序之后,可以通过语音信号获取到文本,进而将该文本作为在搜索栏中输入的文本。

    步骤202、获取每个词对应的多个特征信息,得到每个词对应的特征信息集合。

    其中,每个词对应的多个特征信息可以是在多个特征类别获取到的特征信息。例如,一个词对应的多个特征信息包括这个词在词义方面的特征信息、这个词在上下文方面的特征信息以及这个词在目标文本中的位置方面的特征信息等。

    在实施中,将每个词输入特征提取模块,输出每个词的多个特征信息。将词对应的多个特征信息作为词对应的特征信息集合。

    步骤203、分别针对每个词,根据词的特征信息集合对词执行下述特征融合步骤,以得到词的各个融合特征信息:分别将词对应的每个特征信息确定为目标特征信息,并将目标特征信息分别与词的每个特征信息组为特征信息对;确定特征信息对中两个特征信息的融合相关度系数;基于词的每个特征信息以及每个特征信息与目标特征信息的融合相关度系数,确定目标特征信息对应的融合特征信息。

    在实施中,分别将词对应的每个特征信息确定为目标特征信息,并将目标特征信息分别与词的每个特征信息组为特征信息对,进而获得每个词对应的多个特征信息对。也就是说,将词的每个特征信息分别与每个特征信息进行组对,得到多个特征信息对。对于每个特征信息对,计算出每个特征信息对中的两个特征信息的融合相关度系数。根据词的每个特征信息以及每个特征信息与目标特征信息的融合相关度系数,确定目标特征信息对应的融合特征信息。

    例如,词a对应有三个特征信息,分别是特征信息1,特征信息2和特征信息3。对于特征信息1而言,得到特征信息1和特征信息1组成的特征信息对11,特征信息1和特征信息2组成的特征信息对12,特征信息1和特征信息3组成的特征信息对13。计算出特征信息对11中的特征信息1和特征信息1的融合相关度系数11、特征信息对12中的特征信息1和特征信息2的融合相关度系数12以及特征信息对13中的特征信息1和特征信息3的融合相关度系数13。根据特征信息1、融合相关度系数11、特征信息2、融合相关度系数12、特征信息3和融合相关度系数13,确定特征信息1对应的融合特征信息。通过上述方法,计算出特征信息2和特征信息3分别对应的融合特征信息。可以理解的是,每个词具有多个特征信息,每个特征信息可以得到各自对应的融合特征信息,从而每个词就会对应有多个融合特征信息。例如一个词对应n个特征信息,也就对应n个融合特征信息。

    可选的,本申请实施例中的融合相关度系数由两部分组成,一部分为第一子相关系数,另一部分为第二子相关系数,其中,具体过程可以为确定特征信息对中两个特征信息的第一子相关度系数,确定特征信息对中两个特征信息的第二子相关度系数;第一子相关度系数是指两个特征信息在特征值方面的关联程度,第二子相关度系数是指两个特征信息所属的特征类别。将特征信息对中两个特征信息的第一子相关度系数与特征信息对中两个特征信息的第二子相关度系数进行融合,以得到特征信息对中两个特征信息的融合相关度系数。

    其中,第一子相关度系数以及第二子相关度系数可以由自注意学习模块计算得到。如图3所示,自注意学习模块的一个示例包括线性映射层(linearlayer)、合并层(mergelayer)、查询层(lookup_and_linearlayer)和相加层(addlayer)。linearlayer用于对每个词的多个特征信息进行线性变换,获得每个特征信息的特征值。mergelayer用于确定词对应的每个特征信息对中的两个特征信息的第一子相关度系数。lookup_and_linearlayer用于确定词对应的每个特征信息对中的两个特征信息的第二子相关度系数,addlayer用于将特征信息对中两个特征信息的第一子相关度系数与第二子相关度系数进行相加,以得到该特征信息对中两个特征信息的融合相关度系数。

    具体来看,将每个词对应的多个特征信息和每个特征信息的特征类型编号输入到自注意学习模块中,自注意学习模块中的linearlayer对每个特征信息进行线性变换,获得每个特征信息对应的特征值。将某个词对应的每个特征信息分别作为目标特征信息,针对每个目标特征信息,分别按照下述方法得到该目标特征信息与该目标特征信息所属的特征信息集合中的每个特征信息之间的融合相关度系数。

    自注意学习模块中的mergelayer计算每个特征信息对中两个特征信息的第一子相关度系数。自注意学习模块中的lookup_and_linearlayer确定特征信息对中两个特征信息的第二子相关度系数。自注意学习模块中的addlayer根据特征信息对中两个特征信息的第一子相关度系数与该特征信息对中两个特征信息的第二子相关度系数进行融合,得到该特征信息对中两个特征信息的融合相关度系数。在获得每个特征信息对中两个特征信息的融合相关度系数之后,还可以进行下述操作:根据词的每个特征信息以及对应的融合相关度系数,确定每个特征信息对应的融合特征信息。根据上述方法确定出该目标文本中的其他词分别对应的融合特征信息,使得自注意学习模块输出每个词分别对应的融合特征信息。

    以下分别说明第一子相关度系数以及第二子相关度系数分别是如何获得的。

    在一种实现方式中,将特征信息对中的两个特征信息分别进行线性映射,以得到两个特征信息的特征值;计算两个特征信息的特征值的交互信息,以得到特征信息对中两个特征信息的第一子相关度系数。

    其中,在获得两个特征信息的特征值之前,需要对词的特征信息进行线性变换,进而将每个词对应的特征信息映射至同一映射空间,来获得每个特征信息的特征值。该过程可以由图3中的linearlayer实现。

    以将词的两个特征信息分别映射到同一映射空间为例,具体步骤为:通过公式将目标特征信息fea_i和特征信息fea_j映射至同一映射空间,进而获得特征值fea_key_i和特征值fea_key_j。

    其中,fea_key_i表示为目标特征信息fea_i对应的特征值,fea_key_j表示为特征信息fea_j对应的特征值,fea_i表示为词对应的第i个特征信息,fea_j表示为词对应的第j个特征信息,wki表示为将目标特征信息fea_i映射至特征值fea_key_i所需的映射空间,wkj表示将特征信息fea_j映射至特征值fea_key_j所需的映射空间,d*di表示映射空间wki的维度,d*dj表示映射空间wkj的维度,r为常数。

    经过上述变换之后,特征值fea_key_i的维度与特征值fea_key_j的维度相同。使用相同的方法将词对应的每个特征信息映射至同一映射空间,确定出每个特征信息对应的特征值。

    进一步地,计算两个特征信息的特征值的交互信息,即两个特征信息的特征值的关联度,以得到该特征信息对中两个特征信息的第一子相关度系数。例如,本申请实施例可以通过以下三种方式,来确定特征信息对中两个特征信息的特征值之间的交互信息。该过程可以由图3中的mergelayer实现。

    在第一种方式中,通过第一公式确定特征信息对中两个特征信息的特征值之间的交互信息。假设特征信息对中两个特征信息分别为fea_i以及fea_j,其中fea_i为目标特征信息,第一公式可以是其中,fea_key_i为目标特征信息fea_i的特征值,fea_key_j为特征信息fea_j的特征值,fea_relij表示特征值fea_key_i与特征值fea_key_j之间的交互信息,fea_key_it表示特征值fea_key_i的转置,d表示特征值fea_key_i的维度。

    在第二种方式中,通过第二公式确定特征信息对中两个特征信息的特征值之间的交互信息,第二公式可以是fea_relij=wrel*tanh(w[fea_key_i,fea_key_j])(w∈rd*2d,wrel∈r1*d),其中,wrel表示将tanh(w[fea_key_i,fea_key_j])对应的特征信息映射至一维映射空间所需要的映射空间,w表示将由特征值fea_key_i和特征值fea_key_j得到的组合映射到一维映射空间所需要的映射空间,d表示特征值fea_key_i的维度,其他参数可以参见上述第一公式的说明。

    第三种方式,通过第三公式确定特征信息对中两个特征信息的特征值之间的交互信息,其中,第三公式可以是fea_relij=fea_key_it*w*fea_key_j,其中,w表示将特征值fea_key_i进行映射所需的映射空间,其他参数可以参见上述第一公式的说明。

    通过以上任一公式可以得到两个特征信息的第一子相关度系数。第二子相关度系数的一种计算过程为,根据特征信息对中两个特征信息的特征类型编号,在预先训练的特征交互嵌入矩阵中获取特征信息对中两个特征信息的编码向量;基于特征信息对中的目标特征信息与编码向量,确定特征信息对中两个特征信息的第二子相关度系数。该过程可以由图3中的lookup_and_linearlayer实现。

    需要说明的是,获取每个特征信息对应的特征类型编号的步骤如下:将每个词输入到特征提取模块中,输出每个词对应的特征信息和每个特征信息对应的特征类型编号。需要说明的是,每个特征信息与每个特征类型编号是一一对应的关系,也就是说存在n个特征信息,则特征类型编号可以是1至n。

    需要说明的是,预先训练的特征交互嵌入矩阵包括至少一个编码向量,每个编码向量对应的下标和与该编码向量对应的两个特征信息对应的特征类型编号有关。在实施中,根据特征信息对中两个特征信息的特征类型编号,在特征交互嵌入矩阵中,获得该特征信息对中两个特征信息的编码向量。将该编码向量与目标特征信息的特征值的转置进行相乘运算,确定该特征信息对中两个特征信息的第二子相关度系数。

    需要说明的是,对于一个词而言,特征提取模型可以提取该词在第1特征类别的特征信息、在第2特征类别的特征信息……以及在第n特征类别的特征信息。例如,可以提取该词在上下文方面的特征信息,该词在词性方面的特征信息等。特征提取模型可以将在第1特征类别提取到的特征信息对应的特征类型编号设置为1,将在第2特征类别提取到的特征信息对应的特征类型编号设置为2……将在第n特征类别提取到的特征信息对应的特征类型编号设置为n等。通过上述方法,将每个词输入到特征提取模块后,都会输出多个特征信息和每个特征信息对应的特征类型编号。

    进一步地,可以根据特征信息的相关度系数计算公式fea_noij=fea_key_it*wno*fea_cross_embed(i-i)*n j-1wno∈rd*d计算特征信息对中两个特征信息的第二子相关度系数;其中,假设特征信息对中两个特征信息分别为fea_i以及fea_j,fea_i为目标特征信息,i为目标特征信息的特征类型编号,fea_key_i为目标特征信息fea_i的特征值,fea_noij表示目标特征信息fea_i和特征信息fea_j的第二子相关度系数,j为特征信息fea_j的特征类型编号,fea_cross_embed(i-i)*n j-1表示特征交互嵌入矩阵中的下标为(i-1)*n j-1的编码向量,n表示词的特征信息集合中的特征信息的数目,wno表示映射空间,r表示常数,d表示映射空间的维度。

    需要说明的是,特征值fea_key_i对应的目标特征信息和特征值fea_key_j对应的特征信息可以为同一特征信息。可以将预先训练的特征交互嵌入矩阵设置在lookup_and_linearlayer中。需要说明的是,图3中lookup_and_linearlayer包括的最下面两个方框分别与两个特征信息的特征类型编号对应,中间方框与根据特征类型编号从特征交互嵌入矩阵中查找两个特征信息的编码向量对应,中间方框旁边的方框与特征信息fea_i对应的特征值,其中,假设特征信息fea_i为目标特征信息,中间方框上面的方框与第二子相关度系数fea_noji对应。

    根据以上方法确定出特征信息对中两个特征信息的第一子相关度系数与该两个特征信息的第二子相关度系数后,可以进一步基于第一子相关度系数与第二子相关度系数的和,得到该特征信息对中两个特征信息的融合相关度系数。

    在实施中,根据公式确定特征信息对中两个特征信息的第一子相关系数与第二子相关系数的和,其中假设特征信息对中两个特征信息分别为fea_i以及fea_j,其中fea_i为目标特征信息,fea_relij表示该两个特征信息的第一子相关度系数,fea_noij表示该两个特征信息的第二子相关度系数,表示该两个特征信息的第一子相关系数和该两个特征信息的第二子相关系数的和。根据公式获取该两个特征信息的融合相关度系数,其中,n表示一个词对应的特征信息的总个数,k的取值范围在1到n之间,该词对应的任一特征信息可以记为fea_k,因此表示目标特征信息fea_i和该任一特征信息fea_k之间的第一子相关度系数与目标特征信息fea_i和该任一特征信息fea_k之间的第二子相关度系数之和。

    可选的,计算词的每个特征信息与该特征信息与目标特征信息的融合相关度系数的乘积;将目标特征信息对应的各个乘积进行相加,得到目标特征信息的融合特征信息。

    在实施中,假设一个词具有多个特征信息,该多个特征信息中的任一特征信息可以记为fea_k,并将多个特征信息中的某个特征信息作为目标特征信息,该目标特征信息记为fea_i。根据公式确定出目标特征信息fea_i的融合特征信息。其中,fea_attn_i表示目标特征信息fea_i的融合特征信息,fea_key_k为任一特征信息fea_k的特征值,表示目标特征信息fea_i和任一特征信息fea_k的融合相关度系数,n表示该词对应的特征信息的总个数。

    将一个词输入到特征提取模块中,获得特征信息fea_1、特征信息fea_2、特征信息fea_3和特征信息fea_4,以及特征信息fea_1、特征信息fea_2、特征信息fea_3和特征信息fea_4分别对应的特征类型编号为1、2、3和4。如图4所示,将fea_1及fea_1对应的特征类型编号1、fea_2及fea_2对应的特征类型编号2、fea_3及fea_3对应的特征类型编号3、fea_4及fea_4对应的特征类型编号4输入到自注意学习模块中,输出特征信息fea_1的融合特征信息、特征信息fea_2的融合特征信息、特征信息fea_3的融合特征信息和特征信息fea_4的融合特征信息。基于同样的方法,获得其他词的各个融合特征信息。将目标文本中的各个词对应的融合特征信息,输入到自然语言理解模块进行语义识别。

    需要说明的是,为了简化计算,对于每个词而言,可以对每个特征信息进行线性变换,获得多个线性变换后的特征信息(即特征信息的特征值),计算出线性变换后的特征信息与对应的融合相关度系数的乘积,并将各个乘积进行相加,得到目标特征信息的融合特征信息。

    可选的,如图5,可以按照功能对自注意学习模块进行进一步的划分,自注意学习模块可以包括第一子相关度确定模块、第二子相关度确定模块和融合模块,其中,第一子相关度确定模块用于确定每两个特征信息之间的第一子相关度系数,第二子相关度确定模块用于确定每两个特征信息之间的第二子相关度系数,融合模块用于对第一子相关度系数和第二子相关度系数进行融合处理,生成相关度系数,得到每个词的各个融合特征信息。

    步骤204、基于每个词的各个融合特征信息,确定目标文本对应的语义信息。

    其中,在获得每个词的各个融合特征信息后,可以将每个词的各个融合特征信息输入到combinelayer(联合层),输出每个词对应的特征向量,其中,combinelayer用于将词的各个融合特征信息映射成一个固定长度的向量,映射方法可以是将词的各个融合特征信息进行拼接、融合门或者池化。将每个词对应的特征向量输入到upperlayer(后续处理层),进而获得upperlayer的输出结果,其中,upperlayer用于对每个词对应的特征向量进行处理,获得处理结果。例如对每个词对应的特征向量进行迭代处理,获得目标文本对应的语义信息。需要说明的是,combinelayer和upperlayer可以设置在自然语言理解模块中,自然语言理解模块可以包括lstm,gru,cnn,transformerde等模块。

    在一种实施方式中,语义信息可以是指令,终端可以根据该指令执行对应的操作。语义信息可以包括指令类型和指令参数,指令类型为待执行的操作,指令参数为执行的操作的内容。例如,指令类型可以是“打电话”,指令参数为“小明”。

    可选的,当用户想要通过语音信号操控终端时,终端确定是否检测到特定内容的语音指令。当终端检测到特定内容的语音指令之后,获取该语音指令对应的声纹特征,并确定出该声纹特征对应的用户是否具有操控终端的权限。当该声纹特征对应的用户具有操控终端的权限时,确定终端在预设时间内是否检测到的语音信号。如果终端在预设时间内检测到语音信号,则将获得的语音信号转换为文本。如图6所示,蒋该文本输入分词模块中,获得n个词。将n个词输入到特征提取模块中,获取到每个词对应的多个特征信息,以及每个特征信息对应的特征类型编号。将每个词对应的多个特征信息以及每个特征信息对应的特征类型编号输入至自注意学习模块中,输出每个词的各个融合特征信息。将每个词的各个融合特征信息输入到自然语言理解模块中,输出该语音信号对应的指令(即图6中的文本对应的语义信息)。终端根据该语音信号对应的指令,执行该指令对应的操作。

    例如,当终端检测到特定内容的语音指令“siri”时,检测“siri”对应的声纹特征,确定该声纹特征对应的用户是否具有操控终端的权限。当该声纹特征对应的用户具有操控终端的权限时,终端录制在预设时间内的声音信号,并将录制的声音信号转换为文本“给小明打电话”。对文本“给小明打电话”进行分词处理,获得“小明”和“打电话”。将“小明”和“打电话”输入到特征提取模块中,并获得“小明”和“打电话”分别对应的多个特征信息。将“小明”和“打电话”分别对应的多个特征信息输入到自注意学习模块中,输出“小明”和“打电话”分别对应的多个融合特征信息。将“小明”和“打电话”分别对应的多个融合特征信息,输入到自然语言理解模块中,输出“给小明打电话”对应的指令类型和指令参数,其中,指令类型可以是“打电话”,指令参数为“小明”。终端根据确定出的指令类型和指令参数,来拨打小明的电话。

    需要说明的是,可以将在预设时间内获取得语音信号上传到服务器上,通过服务器来确定出指令类型和指令参数,并将指令类型和指令参数发送给终端,进而使得终端执行指令类型和指令参数的操作。

    可选的,如图7所示,在一次训练过程中,在样本文本库中随机选取出任一样本文本,并基于人的经验,确定出该样本文本的语义信息,将其作为该样本文本的基准语义信息。将该样本文本输入至分词模块中,获取到多个样本词。将每个样本词输入至特征提取模块中,获得每个样本词对应的多个样本特征信息,以及每个样本词的每个样本特征信息分别对应的特征类型编号。将每个样本词对应的原始样本特征信息和每个原始样本特征信息对应的特征类型编号输入自注意学习模块,输出每个样本词的各个样本融合特征信息。将每个样本词的各个样本融合特征信息一并输入到自然语言理解模块中,输出样本文本的语义信息。根据输出的语义信息、基准语义信息以及预先设置的损失函数,确定出输出的语义信息和基准语义信息之间的损失信息。基于损失信息,对自注意学习模块中的初始特征交互嵌入矩阵中的初始编码向量以及自注意学习模块中的参数进行调整,获得训练后的特征交互嵌入矩阵和训练后的自注意学习模块。在样本文本库中选取出其他样本文本,并基于上述方式对训练后的特征交互嵌入矩阵和训练后的自注意学习模块进行训练,从而获得预先训练的参考特征信息集合和预先训练的自注意学习模块。

    需要说明的是,本申请实施例提供的方法在训练过程中,充分的考虑到同一词对应的多个特征信息中的每两个特征信息之间的相关关系,进而训练出的机器学习模型识别文本的准确率更高。

    本申请实施例中的每个词的各个融合特征信息是根据每个特征信息以及每个特征信息和目标特征信息的融合相关度系数确定的,而特征信息对中两个特征信息的融合相关度系数是由该特征信息对中两个特征信息的第一子相关系数和该特征信息对中两个特征信息的第二子相关系数确定的,其中,第一子相关系数考虑到了特征信息对中两个特征信息在特征值方面的关系,第二子相关度系数考虑到特征信息对中两个特征信息的特征类型。因此,如此计算出的融合相关度系数更加的准确,使得词的识别准确度更高,进而提高了识别目标文本的准确率。

    基于相同的技术构思,本申请实施例还提供了一种装置,该装置用于服务器或者终端,如图8所示,该装置包括:

    划分模块801,被配置为对目标文本进行分词处理,得到多个词;

    提取模块802,被配置为获取每个词对应的多个特征信息,得到每个词对应的特征信息集合;

    第一确定模块803,被配置为分别针对每个词,根据所述词的特征信息集合对所述词执行下述特征融合步骤,以得到所述词的各个融合特征信息:分别将所述词对应的每个特征信息确定为目标特征信息,并将所述目标特征信息分别与所述词的每个特征信息组为特征信息对;确定所述特征信息对中两个特征信息的融合相关度系数;基于所述词的每个特征信息以及每个特征信息与所述目标特征信息的融合相关度系数,确定所述目标特征信息对应的融合特征信息;

    第二确定模块804,被配置为基于每个词的各个融合特征信息,确定所述目标文本对应的语义信息。

    可选的,所述第一确定模块803,被配置为:

    确定所述特征信息对中两个特征信息的第一子相关度系数,确定所述特征信息对中两个特征信息的第二子相关度系数;其中,所述第一子相关度系数用于表示所述两个特征信息在特征值方面的关联度,所述第二子相关度系数用于表示两个特征信息各自的特征类别;

    将所述特征信息对中两个特征信息的第一子相关度系数与所述特征信息对中两个特征信息的第二子相关度系数进行融合,以得到所述特征信息对中两个特征信息的融合相关度系数。

    可选的,所述第一确定模块803,被配置为:

    将所述特征信息对中的两个特征信息分别进行线性映射,以得到所述两个特征信息的特征值;

    计算所述两个特征信息的特征值的交互信息,以得到所述特征信息对中两个特征信息的第一子相关度系数。

    可选的,所述第一确定模块803,被配置为:

    根据所述特征信息对中两个特征信息的特征类型编号,在预先训练的特征交互嵌入矩阵中获取所述特征信息对中两个特征信息的编码向量;

    基于所述特征信息对中的目标特征信息与所述编码向量,确定所述特征信息对中两个特征信息的第二子相关度系数。

    可选的,所述第一确定模块803,被配置为:

    根据公式fea_noij=fea_key_it*wno*fea_cross_embed(i-i)*n j-1wno∈rd*d计算所述特征信息对中两个特征信息的第二子相关度系数;假设特征信息对中两个特征信息分别为fea_i以及fea_j,fea_i为目标特征信息,i为目标特征信息的特征类型编号,fea_key_i为目标特征信息fea_i的特征值,fea_noij表示目标特征信息fea_i和特征信息fea_j的第二子相关度系数,j为特征信息fea_j的特征类型编号,fea_cross_embed(i-i)*n j-1表示特征交互嵌入矩阵中的下标为(i-1)*n j-1的编码向量,n表示词的特征信息集合中的特征信息的数目,wno表示映射空间,r表示常数,d表示映射空间的维度。

    可选的,所述第一确定模块803,被配置为:

    计算所述词的每个特征信息与所述特征信息与所述目标特征信息的融合相关度系数的乘积;

    将所述目标特征信息对应的各个乘积进行相加,得到所述目标特征信息的融合特征信息。

    需要说明的是:上述实施例提供的确定文本语义信息的装置在确定文本语义信息时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的确定文本语义信息的装置与确定文本语义信息的方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。

    图9示出了本申请一个示例性实施例提供的终端900的结构框图。该终端900可以是:智能手机、平板电脑、mp3播放器(movingpictureexpertsgroupaudiolayeriii,动态影像专家压缩标准音频层面3)、mp4(movingpictureexpertsgroupaudiolayeriv,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端900还可能被称为账户设备、便携式终端、膝上型终端、台式终端等其它名称。

    通常,终端900包括有:处理器901和存储器902。

    处理器901可以包括一个或多个处理核心,比如4核心处理器、9核心处理器等。处理器901可以采用dsp(digitalsignalprocessing,数字信号处理)、fpga(field-programmablegatearray,现场可编程门阵列)、pla(programmablelogicarray,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器901也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称cpu(centralprocessingunit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器901可以在集成有gpu(graphicsprocessingunit,图像处理器),gpu用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器901还可以包括ai(artificialintelligence,人工智能)处理器,该ai处理器用于处理有关机器学习的计算操作。

    存储器902可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器902还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器902中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器901所执行以实现本申请中方法实施例提供的确定文本语义信息的方法。

    在一些实施例中,终端900还可选包括有:外围设备接口903和至少一个外围设备。处理器901、存储器902和外围设备接口903之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口903相连。具体地,外围设备包括:射频电路904、触摸显示屏905、摄像头906、音频电路907、定位组件909和电源909中的至少一种。

    外围设备接口903可被用于将i/o(input/output,输入/输出)相关的至少一个外围设备连接到处理器901和存储器902。在一些实施例中,处理器901、存储器902和外围设备接口903被集成在同一芯片或电路板上;在一些其它实施例中,处理器901、存储器902和外围设备接口903中的任意一个或两个可以在单独的芯片或电路板上实现,本申请实施例对此不加以限定。

    射频电路904用于接收和发射rf(radiofrequency,射频)信号,也称电磁信号。射频电路904通过电磁信号与通信网络以及其它通信设备进行通信。射频电路904将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路904包括:天线系统、rf收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、账户身份模块卡等等。射频电路904可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:城域网、各代移动通信网络(2g、3g、4g及5g)、无线局域网和/或wifi(wirelessfidelity,无线保真)网络。在一些实施例中,射频电路904还可以包括nfc(nearfieldcommunication,近距离无线通信)有关的电路,本申请对此不加以限定。

    显示屏905用于显示ui(userinterface,账户界面)。该ui可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏905是触摸显示屏时,显示屏905还具有采集在显示屏905的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器901进行处理。此时,显示屏905还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏905可以为一个,设置终端900的前面板;在另一些实施例中,显示屏905可以为至少两个,分别设置在终端900的不同表面或呈折叠设计;在再一些实施例中,显示屏905可以是柔性显示屏,设置在终端900的弯曲表面上或折叠面上。甚至,显示屏905还可以设置成非矩形的不规则图形,也即异形屏。显示屏905可以采用lcd(liquidcrystaldisplay,液晶显示屏)、oled(organiclight-emittingdiode,有机发光二极管)等材质制备。

    摄像头组件906用于采集图像或视频。可选地,摄像头组件906包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及vr(virtualreality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件906还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。

    音频电路907可以包括麦克风和扬声器。麦克风用于采集账户及环境的声波,并将声波转换为电信号输入至处理器901进行处理,或者输入至射频电路904以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端900的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器901或射频电路904的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路907还可以包括耳机插孔。

    定位组件908用于定位终端900的当前地理位置,以实现导航或lbs(locationbasedservice,基于位置的服务)。定位组件908可以是基于美国的gps(globalpositioningsystem,全球定位系统)、中国的北斗系统、俄罗斯的格雷纳斯系统或欧盟的伽利略系统的定位组件。

    电源909用于为终端900中的各个组件进行供电。电源909可以是交流电、直流电、一次性电池或可充电电池。当电源909包括可充电电池时,该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。

    在一些实施例中,终端900还包括有一个或多个传感器910。该一个或多个传感器910包括但不限于:加速度传感器911、陀螺仪传感器912、压力传感器913、指纹传感器914、光学传感器915以及接近传感器916。

    加速度传感器911可以检测以终端900建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器911可以用于检测重力加速度在三个坐标轴上的分量。处理器901可以根据加速度传感器911采集的重力加速度信号,控制触摸显示屏905以横向视图或纵向视图进行账户界面的显示。加速度传感器911还可以用于游戏或者账户的运动数据的采集。

    陀螺仪传感器912可以检测终端900的机体方向及转动角度,陀螺仪传感器912可以与加速度传感器911协同采集账户对终端900的3d动作。处理器901根据陀螺仪传感器912采集的数据,可以实现如下功能:动作感应(比如根据账户的倾斜操作来改变ui)、拍摄时的图像稳定、游戏控制以及惯性导航。

    压力传感器913可以设置在终端900的侧边框和/或触摸显示屏905的下层。当压力传感器913设置在终端900的侧边框时,可以检测账户对终端900的握持信号,由处理器901根据压力传感器913采集的握持信号进行左右手识别或快捷操作。当压力传感器913设置在触摸显示屏905的下层时,由处理器901根据账户对触摸显示屏905的压力操作,实现对ui界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。

    指纹传感器914用于采集账户的指纹,由处理器901根据指纹传感器914采集到的指纹识别账户的身份,或者,由指纹传感器914根据采集到的指纹识别账户的身份。在识别出账户的身份为可信身份时,由处理器901授权该账户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器914可以被设置终端900的正面、背面或侧面。当终端900上设置有物理按键或厂商logo时,指纹传感器914可以与物理按键或厂商logo集成在一起。

    光学传感器915用于采集环境光强度。在一个实施例中,处理器901可以根据光学传感器915采集的环境光强度,控制触摸显示屏905的显示亮度。具体地,当环境光强度较高时,调高触摸显示屏905的显示亮度;当环境光强度较低时,调低触摸显示屏905的显示亮度。在另一个实施例中,处理器901还可以根据光学传感器915采集的环境光强度,动态调整摄像头组件906的拍摄参数。

    接近传感器916,也称距离传感器,通常设置在终端900的前面板。接近传感器916用于采集账户与终端900的正面之间的距离。在一个实施例中,当接近传感器916检测到账户与终端900的正面之间的距离逐渐变小时,由处理器901控制触摸显示屏905从亮屏状态切换为息屏状态;当接近传感器916检测到账户与终端900的正面之间的距离逐渐变大时,由处理器901控制触摸显示屏905从息屏状态切换为亮屏状态。

    本领域技术人员可以理解,图9中示出的结构并不构成对终端900的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。

    图10是本申请实施例提供的一种服务器的结构示意图,该服务器1000可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(centralprocessingunits,cpu)1001和一个或一个以上的存储器1002,其中,所述存储器1002中存储有至少一条指令,所述至少一条指令由所述处理器1001加载并执行以实现上述各个方法实施例提供的方法。当然,该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其它用于实现设备功能的部件,在此不做赘述。

    在示例性实施例中,还提供了一种计算机可读存储介质,例如包括指令的存储器,上述指令可由终端中的处理器执行以完成上述实施例中确定文本语义信息的方法。例如,所述计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。

    本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。

    以上所述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。


    技术特征:

    1.一种确定文本语义信息的方法,其特征在于,所述方法包括:

    对目标文本进行分词处理,得到多个词;

    获取每个词对应的多个特征信息,得到每个词对应的特征信息集合;

    分别针对每个词,根据所述词的特征信息集合对所述词执行下述特征融合步骤,以得到所述词的各个融合特征信息:

    分别将所述词对应的每个特征信息确定为目标特征信息,并将所述目标特征信息分别与所述词的每个特征信息组为特征信息对;

    确定所述特征信息对中两个特征信息的融合相关度系数;

    基于所述词的每个特征信息以及每个特征信息与所述目标特征信息的融合相关度系数,确定所述目标特征信息对应的融合特征信息;

    基于每个词的各个融合特征信息,确定所述目标文本对应的语义信息。

    2.根据权利要求1所述的方法,其特征在于,所述确定所述特征信息对中两个特征信息的融合相关度系数,包括:

    确定所述特征信息对中两个特征信息的第一子相关度系数,确定所述特征信息对中两个特征信息的第二子相关度系数;其中,所述第一子相关度系数用于表示所述两个特征信息在特征值方面的关联度,所述第二子相关度系数用于表示两个特征信息各自的特征类别;

    将所述特征信息对中两个特征信息的第一子相关度系数与所述特征信息对中两个特征信息的第二子相关度系数进行融合,以得到所述特征信息对中两个特征信息的融合相关度系数。

    3.根据权利要求2所述的方法,其特征在于,所述确定所述特征信息对中两个特征信息的第一子相关度系数,包括:

    将所述特征信息对中的两个特征信息分别进行线性映射,以得到所述两个特征信息的特征值;

    计算所述两个特征信息的特征值的交互信息,以得到所述特征信息对中两个特征信息的第一子相关度系数。

    4.根据权利要求2所述的方法,其特征在于,所述确定所述特征信息对中两个特征信息的第二子相关度系数,包括:

    根据所述特征信息对中两个特征信息的特征类型编号,在预先训练的特征交互嵌入矩阵中获取所述特征信息对中两个特征信息的编码向量;

    基于所述特征信息对中的目标特征信息与所述编码向量,确定所述特征信息对中两个特征信息的第二子相关度系数。

    5.根据权利要求4所述的方法,其特征在于,所述基于所述特征信息对中的目标特征信息与所述编码向量,确定所述特征信息对中两个特征信息的第二子相关度系数,包括:

    根据公式fea_noij=fea_key_it*wno*fea_cross_embed(i-i)*n j-1wno∈rd*d计算所述特征信息对中两个特征信息的第二子相关度系数;假设特征信息对中两个特征信息分别为fea_i以及fea_j,fea_i为目标特征信息,i为目标特征信息的特征类型编号,fea_key_i为目标特征信息fea_i的特征值,fea_noij表示目标特征信息fea_i和特征信息fea_j的第二子相关度系数,j为特征信息fea_j的特征类型编号,fea_cross_embed(i-i)*n j-1表示特征交互嵌入矩阵中的下标为(i-1)*n j-1的编码向量,n表示词的特征信息集合中的特征信息的数目,wno表示映射空间,r表示常数,d表示映射空间的维度。

    6.根据权利要求1所述的方法,其特征在于,所述基于所述词的每个特征信息以及每个特征信息与所述目标特征信息的融合相关度系数,确定所述目标特征信息对应的融合特征信息,包括:

    计算所述词的每个特征信息与所述特征信息与所述目标特征信息的融合相关度系数的乘积;

    将所述目标特征信息的各个乘积进行相加,得到所述目标特征信息的融合特征信息。

    7.一种确定文本语义信息的装置,其特征在于,所述装置包括:

    划分模块,被配置为对目标文本进行分词处理,得到多个词;

    提取模块,被配置为获取每个词对应的多个特征信息,得到每个词对应的特征信息集合;

    第一确定模块,被配置为分别针对每个词,根据所述词的特征信息集合对所述词执行下述特征融合步骤,以得到所述词的各个融合特征信息:分别将所述词对应的每个特征信息确定为目标特征信息,并将所述目标特征信息分别与所述词的每个特征信息组为特征信息对;确定所述特征信息对中两个特征信息的融合相关度系数;基于所述词的每个特征信息以及每个特征信息与所述目标特征信息的融合相关度系数,确定所述目标特征信息对应的融合特征信息;

    第二确定模块,被配置为基于每个词的各个融合特征信息,确定所述目标文本对应的语义信息。

    8.根据权利要求7所述的装置,其特征在于,所述第一确定模块,被配置为:

    确定所述特征信息对中两个特征信息的第一子相关度系数,确定所述特征信息对中两个特征信息的第二子相关度系数;其中,所述第一子相关度系数用于表示所述两个特征信息在特征值方面的关联度,所述第二子相关度系数用于表示两个特征信息各自的特征类别;

    将所述特征信息对中两个特征信息的第一子相关度系数与所述特征信息对中两个特征信息的第二子相关度系数进行融合,以得到所述特征信息对中两个特征信息的融合相关度系数。

    9.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述指令由所述处理器加载并执行以实现如权利要求1至权利要求6任一项所述的确定文本语义信息的方法所执行的操作。

    10.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令,所述指令由处理器加载并执行以实现如权利要求1至权利要求6任一项所述的确定文本语义信息的方法所执行的操作。

    技术总结
    本申请公开了一种确定文本语义信息的方法、装置、设备以及存储介质,属于计算机技术领域。该方法包括:对目标文本进行分词处理,并获取每个词对应的多个特征信息,得到每个词对应的特征信息集合;分别针对每个词,根据词的特征信息集合对词执行下述特征融合步骤,以得到词的各个融合特征信息:分别将词对应的每个特征信息确定为目标特征信息,并将目标特征信息分别与词的每个特征信息组为特征信息对,并确定特征信息对中两个特征信息的融合相关度系数;基于词的每个特征信息以及对应的融合相关度系数,确定目标特征信息对应的融合特征信息;基于每个词的各个融合特征信息,确定目标文本对应的语义信息。本申请可以提高对文本识别的准确率。

    技术研发人员:王景禾
    受保护的技术使用者:腾讯音乐娱乐科技(深圳)有限公司
    技术研发日:2020.11.25
    技术公布日:2021.03.12

    转载请注明原文地址:https://wp.8miu.com/read-21696.html

    最新回复(0)