本发明涉及应答文本生成领域,特别是涉及一种基于大语言模型的应答文本生成方法、电子设备及介质。
背景技术:
1、在一些领域中,知识图谱被广泛应用,所述领域内的众多相关知识都包含于众多知识图谱中,想要在众多的知识图谱中得到用户提出的问题的答案,通常的做法是遍历每一个知识图谱来寻找用户提出的问题的答案;然而当预设领域内的知识图谱数量较大时,由于每一知识图谱包含大量的实例以及实例之间的关系,通过上述方式获取用户提出的问题的答案,其处理效率以及得到的答案的准确性较低。
技术实现思路
1、针对上述技术问题,本发明采用的技术方案为:
2、根据本申请的第一方面,提供了一种基于大语言模型的应答文本生成方法,所述方法应用于检索条件生成器,所述检索条件生成器包括预设的三种类型的提示词,每一种类型的提示词包括若干实体类型属性列表和/或若干实体类型关系;实体类型属性列表和实体类型关系通过预设领域的若干已知的知识图谱得到,每一实体类型属性列表包括该实体类型对应的若干属性,每一实体类型关系包括两个实体类型以及两个实体类型对应的关系类型;每一提示词还包括对应的预设的若干条查询条件生成规则以及查询条件生成示例;实体类型属性列表和实体类型关系不包括对应的知识图谱中的实体数据;
3、所述方法包括以下步骤:
4、s100,获取用户输入的目标问题文本q;其中,q对应的问题属于预设领域。
5、s200,获取q中的第一目标字段qa和第二目标字段qb;其中,qa为位于预设字符之前且与预设字符相邻的字段,qb为位于预设字符之后且与预设字符相邻的字段。
6、s300,根据qa、qb以及每一提示词,确定q对应的目标实体类型属性列表和/或目标实体类型关系以及指定提示词;其中,目标实体类型属性列表为与qa和qb具有关联关系的实体类型属性列表,目标实体类型关系为与qa和qb具有关联关系的实体类型关系,指定提示词为三种类型的提示词之一。
7、s400,将q填入目标提示词对应的预设位置,生成q对应的目标提示词。
8、s500,将所述目标提示词输入至预设的大语言模型,以通过所述大语言模型按照对应的若干条查询条件生成规则以及查询条件生成示例输出至少一个检索条件。
9、s600,根据所述至少一个检索条件,从目标知识图谱中确定出每一检索条件对应的目标知识图谱分支;其中,目标知识图谱为和目标实体类型属性列表或目标实体类型关系对应的知识图谱;目标知识图谱分支为对应的目标知识图谱的一部分。
10、s700,将q和目标知识图谱分支输入至预设的大语言模型,以通过所述大语言模型输出q对应的应答文本。
11、根据本申请的另一方面,还提供了一种非瞬时性计算机可读存储介质,存储介质中存储有至少一条指令或至少一段程序,至少一条指令或至少一段程序由处理器加载并执行以实现上述基于大语言模型的应答文本生成方法。
12、根据本申请的另一方面,还提供了一种电子设备,包括处理器和上述非瞬时性计算机可读存储介质。
13、本发明至少具有以下有益效果:
14、本发明的基于大语言模型的应答文本生成方法,根据预设领域内的若干知识图谱生成三种类型的提示词,每一种类型的提示词包括若干实体类型属性列表和/或若干实体类型关系;每一提示词还包括对应的预设的若干条查询规则以及查询示例;根据用户输入的目标问题中的第一目标字段和第二目标字段,首先生成对应的至少一个检索条件;由于提示词中至包含有知识图谱中的实体类型的属性和/或实体类型关系,并不包含知识图谱中的具体的实体数据,因此,在生成检索条件时,无需处理知识图谱中的具体的实体数据,只处理实体类型的属性或者关系,其处理效率大大提高。
15、进一步的,在得到至少一个检索条件后,根据所述至少一个检索条件,从目标知识图谱中确定出每一检索条件对应的目标知识图谱分支;将目标问题文本和目标知识图谱分支对应的所有数据输入至预设的大语言模型,以通过所述大语言模型输出得到目标问题文本对应的应答文本;由于输入的是与目标问题文本有关联的知识图谱分支的所有数据,因此,得到的应答文本与问题文本的关联性较强,应答文本的准确性较高。
1.一种基于大语言模型的应答文本生成方法,其特征在于,所述方法应用于检索条件生成器,所述检索条件生成器包括预设的三种类型的提示词,每一种类型的提示词包括若干实体类型属性列表和/或若干实体类型关系;实体类型属性列表和实体类型关系通过预设领域的若干已知的知识图谱得到,每一实体类型属性列表包括该实体类型对应的若干属性,每一实体类型关系包括两个实体类型以及两个实体类型对应的关系类型;每一提示词还包括对应的预设的若干条查询条件生成规则以及查询条件生成示例;实体类型属性列表和实体类型关系不包括对应的知识图谱中的实体数据;
2.根据权利要求1所述的基于大语言模型的应答文本生成方法,其特征在于,三种类型的提示词分别为实体属性类提示词wq1、实体关系类提示词wq2和实体属性关系类提示词wq3;步骤s300包括以下步骤:
3.根据权利要求2所述的基于大语言模型的应答文本生成方法,其特征在于,在步骤s312之后,所述方法还包括以下步骤:
4.根据权利要求3所述的基于大语言模型的应答文本生成方法,其特征在于,所述若干条查询条件生成规则包括:将多跳问题拆解为若干单跳问题分别输出对应的查询条件;每一单跳问题对应的查询条件包括前一查询条件对应的查询结果。
5.根据权利要求4所述的基于大语言模型的应答文本生成方法,其特征在于,步骤s500包括以下步骤:
6.根据权利要求4所述的基于大语言模型的应答文本生成方法,其特征在于,所述若干条查询条件生成规则还包括:只返回json格式的查询条件。
7.根据权利要求1所述的基于大语言模型的应答文本生成方法,其特征在于,预设的大语言模型通过以下步骤得到:
8.根据权利要求1所述的基于大语言模型的应答文本生成方法,其特征在于,预设的训练算法包括lora算法。
9.一种非瞬时性计算机可读存储介质,所述存储介质中存储有至少一条指令或至少一段程序,其特征在于,所述至少一条指令或所述至少一段程序由处理器加载并执行以实现如权利要求1-8中任意一项所述的基于大语言模型的应答文本生成方法。
10.一种电子设备,其特征在于,包括处理器和权利要求9所述的非瞬时性计算机可读存储介质。