基于知识图谱的自适应文本生成方法和系统

    专利2025-06-12  54


    本发明涉及知识图谱领域,特别涉及一种基于知识图谱的自适应文本生成方法和系统。


    背景技术:

    1、知识图谱广泛应用于多个领域,用于储存和表示复杂信息关系。然而,与传统的树状数据结构相比,图结构数据的查找效率存在显著挑战。传统查找算法在处理图结构数据时效率相对较低,特别是当数据规模庞大时,查询速度明显下降,这制约了知识图谱在实际应用中的发展。

    2、另外,知识图谱中的信息常常需要进行复杂的查询,包括子图查找,即查找包含特定实体和关系的子图结构。然而,传统的查找算法无法满足这种需求,导致了效率低下和应用受限。因此,需要提供一种基于知识图谱的自适应文本生成方法和系统。


    技术实现思路

    1、本发明提供一种基于知识图谱的自适应文本生成方法。以解决现有技术中在使用知识图谱进行复杂查询时效率和准确度较低的问题。

    2、本发明提供的一种基于知识图谱的自适应文本生成方法,包括:获取待查询的知识图谱以及预先构建的查找树;其中,所述查找树由预先获取的总知识图谱构成,所述查找树中含有多个树节点,每个所述树节点对应一个树查询向量,所述树节点至少包括根节点和叶子节点;从所述待查询的知识图谱中提取表征其语义特征和结构特征的用户查询向量;从所述查找树的根节点开始,基于树查询向量和所述用户查询向量的距离逐步从所述根节点查询到叶子节点,保存从所述根节点到叶子节点的查询路径;从所述查询路径中选择合适的目标树节点,基于所述目标树节点获取所述总知识图谱中对应的子图,将对应的子图输入至结构化数据文本生成模型,生成所述目标树节点对应的文本描述,作为所述待查询的知识图谱的查询答案。

    3、于本发明一实施例中,所述查找树的构建过程包括:计算所述总知识图谱中各节点与所述总知识图谱表征主题的相关性得分;基于与所述主题的相关性得分,将所述总知识图谱中的各节点划分为多个中心节点和多个边缘节点;基于各中心节点和各边缘节点在所述总知识图谱中的位置关系,生成多个树节点簇,并基于图注意力网络,获得每个树节点簇的树查询向量;以各树节点簇作为叶子节点,逐步将多个树节点簇合并形成父节点和层级结构,最终生成查找树。

    4、于本发明一实施例中,所述基于各中心节点和各边缘节点在所述总知识图谱中的位置关系,生成多个树节点簇,并基于图注意力网络,获得每个树节点簇的树查询向量,包括:将每个所述中心节点和预设的步距内的边缘节点作为一个树节点簇;将各树节点簇分别输入至图注意力网络,提取每个树节点簇的语义特征和结构特征,并基于所述语义特征和结构特征生成所述树节点簇的树查询向量。

    5、于本发明一实施例中,所述以各树节点簇作为叶子节点,逐步将多个树节点簇合并形成父节点和层级结构,最终生成查找树,包括:。

    6、于本发明一实施例中,s41、按照预设的增加策略,调整预设的步距,重新生成多个树节点簇,并获得每个树节点簇的树查询向量;s42、判断各树节点簇中是否含有相同的节点;s43、若是,则将含有相同节点的树节点簇合并为一个树节点簇,并将合并后的树节点簇作为合并前各树节点簇的父节点;s44、若否,则重复执行步骤s41至s42,直至所述总知识图谱中所有节点均具有对应的树节点簇,基于各树节点簇的层级结构构建所述查找树。

    7、于本发明一实施例中,所述从所述查找树的根节点开始,基于树查询向量和所述用户查询向量的距离逐步从所述根节点查询到叶子节点,保存从所述根节点到叶子节点的查询路径,包括:s31、将所述查找树的根节点作为当前节点;s32、分别计算所述当前节点对应的各非叶子节点和/或叶子节点与所述用户查询向量的距离;其中,非叶子节点和叶子节点为树节点;s33、选择距离最短的树节点,并判断该树节点是否为叶子节点;s34、若否,则将距离最短的树节点作为当前节点,再次执行步骤s32和s33;s35、若是,则保存从所述根节点到所述叶子节点的查询路径。

    8、于本发明一实施例中,所述从所述查询路径中选择合适的目标树节点,基于所述目标树节点获取所述总知识图谱中对应的子图,将对应的子图输入至结构化数据文本生成模型,生成所述目标树节点对应的文本描述,作为所述待查询的知识图谱的查询答案,包括:从所述查询路径的各树节点中,根据与所述用户查询向量的距离,选择目标树节点,并获取所述目标树节点对应的子图;将所述目标树节点对应的子图转换为输入序列;将所述输入序列输入至所述结构化数据文本生成模型,生成所述目标树节点对应的文本描述,作为所述待查询的知识图谱的查询答案。

    9、于本发明一实施例中,所述将所述目标树节点对应的子图转换为输入序列,包括:从所述子图中,提取所述子图的三元组信息;其中,所述三元组信息表征所述子图中的各节点的相互关系;将所述三元组信息转换为节点序列,并从所述节点序列中加入表征各节点类型的标识符,形成输入序列。

    10、于本发明一实施例中,所述将所述输入序列输入至所述结构化数据文本生成模型,生成所述目标树节点对应的文本描述,作为所述待查询的知识图谱的查询答案,包括:将所述输入序列输入至所述结构化文本生成模型,生成所述目标树节点对应的文本描述;判断所述文本描述的长度是否符合预设的目标长度;若是,则将所述文本描述作为所述待查询的知识图谱的查询答案;若否,则从所述查询路径的各树节点中,重新选择目标树节点生成文本描述,直至所述文本描述的长度符合预设的目标长度。

    11、在本发明的另一方面,还提供了一种基于知识图谱的自适应文本生成系统,所述系统包括:数据获取模块,用于获取待查询的知识图谱以及预先构建的查找树;其中,所述查找树由预先获取的总知识图谱构成,所述查找树中含有多个树节点,每个所述树节点对应一个树查询向量,所述树节点至少包括根节点和叶子节点;用户查询向量获取模块,用于从所述待查询的知识图谱中提取表征其语义特征和结构特征的用户查询向量;查询路径获取模块,用于从所述查找树的根节点开始,基于树查询向量和所述用户查询向量的距离逐步从所述根节点查询到叶子节点,保存从所述根节点到叶子节点的查询路径;文本生成模块,用于从所述查询路径中选择合适的目标树节点,基于所述目标树节点获取所述总知识图谱中对应的子图,将对应的子图输入至结构化数据文本生成模型,生成所述目标树节点对应的文本描述,作为所述待查询的知识图谱的查询答案。

    12、本发明提出的一种基于知识图谱的自适应文本生成方法和系统。通过查找树和查询向量,可以快速定位与用户查询最相关的知识图谱部分,提高了查询效率。通过对待查询的知识图谱中节点的位置关系进行分析,生成用户查询向量,有助于理解和解析知识图谱的结构,能够更全面地代表用户的查询意图。利用用户查询向量和树查询向量之间的距离来选择查询路径,精确地匹配用户查询的内容和知识图谱中的相关信息,使得最终生成的文本更加贴合用户的需求。通过结合高效的信息检索、精准的查询匹配和易于理解的信息展示,大大提高了从复杂知识图谱中提取和传达信息的能力,解决了现有技术中在使用知识图谱进行复杂查询时效率和准确度较低的问题。



    技术特征:

    1.一种基于知识图谱的自适应文本生成方法,其特征在于,所述方法包括:

    2.根据权利要求1所述的基于知识图谱的自适应文本生成方法,其特征在于,所述查找树的构建过程包括:

    3.根据权利要求2所述的基于知识图谱的自适应文本生成方法,其特征在于,所述基于各中心节点和各边缘节点在所述总知识图谱中的位置关系,生成多个树节点簇,并基于图注意力网络,获得每个树节点簇的树查询向量,包括:

    4.根据权利要求3所述的基于知识图谱的自适应文本生成方法,其特征在于,所述以各树节点簇作为叶子节点,逐步将多个树节点簇合并形成父节点和层级结构,最终生成查找树,包括:

    5.根据权利要求1所述的基于知识图谱的自适应文本生成方法,其特征在于,所述从所述查找树的根节点开始,基于树查询向量和所述用户查询向量的距离逐步从所述根节点查询到叶子节点,保存从所述根节点到叶子节点的查询路径,包括:

    6.根据权利要求1所述的基于知识图谱的自适应文本生成方法,其特征在于,所述从所述查询路径中选择合适的目标树节点,基于所述目标树节点获取所述总知识图谱中对应的子图,将对应的子图输入至结构化数据文本生成模型,生成所述目标树节点对应的文本描述,作为所述待查询的知识图谱的查询答案,包括:

    7.根据权利要求6所述的基于知识图谱的自适应文本生成方法,其特征在于,所述将所述目标树节点对应的子图转换为输入序列,包括:

    8.根据权利要求6所述的基于知识图谱的自适应文本生成方法,其特征在于,所述将所述输入序列输入至所述结构化数据文本生成模型,生成所述目标树节点对应的文本描述,作为所述待查询的知识图谱的查询答案,包括:

    9.一种基于知识图谱的自适应文本生成系统,其特征在于,所述系统包括:


    技术总结
    本发明涉及提供一种基于知识图谱的自适应文本生成方法和系统,方法包括:获取待查询的知识图谱以及预先构建的查找树;从待查询的知识图谱中提取表征其语义特征和结构特征的用户查询向量;从查找树的根节点开始,基于树查询向量和用户查询向量的距离逐步从所述根节点查询到叶子节点,保存从根节点到叶子节点的查询路径;从查询路径中选择合适的目标树节点,基于目标树节点获取总知识图谱中对应的子图,将对应的子图输入至结构化数据文本生成模型,生成目标树节点对应的文本描述,作为待查询的知识图谱的查询答案。解决了现有技术中在使用知识图谱进行复杂查询时效率和准确度较低的问题。

    技术研发人员:曹力,刘圣鑫,郭庆,王嘉祺
    受保护的技术使用者:合肥工业大学
    技术研发日:
    技术公布日:2024/4/29
    转载请注明原文地址:https://wp.8miu.com/read-88132.html

    最新回复(0)