一种更新方法、装置、电子设备及存储介质与流程

    专利2025-04-17  18


    本技术涉及数据处理,尤其涉及一种更新方法、装置、电子设备及存储介质。


    背景技术:

    1、知识图谱是将复杂的知识表示成网状结构,以图形的方式展现数据(概念和概念)之间的关系,不仅可以帮助人们清楚地理解数据之间的关系,还可以对数据进行复杂查询,从数据中挖掘隐含信息,揭示数据以及数据相关领域的动态发展规律,为相关领域技术的研究提供切实、有价值的参考。

    2、知识图谱在产业研究、企业研究、投融资研究等领域作用日益显著,当前出现了xmind、百度脑图等手动构建知识图谱的软件。

    3、但是通过这些软件构建的知识谱图只能通过研究人员手动更新数据,因此存在更新不及时且更新效率低的问题。


    技术实现思路

    1、本技术提供一种更新方法、装置、电子设备及存储介质,将第一问题语句输入生成式模型,得到待更新实体在目标属性处的属性值,再将待更新实体和待更新实体在目标属性处的属性值加入知识图谱,以完成知识图谱的更新,可以有效提高知识谱图更新的及时性和更新效率。

    2、第一方面,本技术提供一种更新方法,该方法包括:获取初始知识图谱和第一问题语句;第一问题语句包括待更新实体;第一问题语句用于请求获取待更新实体在目标属性处的属性值;将第一问题语句输入生成式模型,得到待更新实体在目标属性处的属性值;生成式模型用于根据实体、以及问题语句提示的属性生成实体在问题语句提示的属性处的属性值;将待更新实体和待更新实体在目标属性处的属性值加入初始知识图谱,以更新初始知识图谱。

    3、本技术提供的技术方案至少带来以下有益效果:通过获取第一语句并将第一问题语句输入生成式模型,以自动获取待更新实体在目标属性处的属性值,再将待更新实体和待更新实体在目标属性处的属性值加入初始知识图谱,以实现知识图谱的更新,与人工更新知识图谱相比,因为直接通过生成式模型自动获取待更新实体在目标属性处的属性值,所以不再需要人工提取待更新实体在目标属性处的属性值,也不会存在人工输入出错的的情况,可以实现节省时间和降低出错率的效果,从而有效提高知识谱图更新的及时性和更新效率。

    4、一种可能的实现方式中,在将待更新实体和第一问题语句输入生成式模型,得到待更新实体在目标属性处的属性值之前,该方法还包括:根据初始知识图谱,构建样本集;样本集包括多个样本;每个样本包括问题语句、以及问题语句对应的应答语句;问题语句包括训练更新实体;问题语句用于请求获取训练更新实体在训练属性处的属性值;应答语句用于表示训练更新实体在训练属性处的属性值;基于样本集,对初始生成式模型进行训练,得到生成式模型。

    5、一种可能的实现方式中,基于样本集,对初始生成式模型进行训练,得到生成式模型,包括:将样本集中的问题语句作为第一训练样本,得到第一训练样本集;将第一训练样本输入初始生成式模型,通过前向传播计算第一训练样本对应的输出结果;获取每个第一训练样本各自对应的分值;分值用于指示第一训练样本对应的输出结果与预测值之间的误差;根据分值和反向传播算法,更新初始生成式模型中的参数;在初始生成式模型达到预设条件的情况下,得到生成式模型。

    6、一种可能的实现方式中,预设条件包括:初始生成式模型的准确率达到预设准确率阈值,或者将第一训练样本输入初始生成式模型的次数达到预设次数阈值。

    7、一种可能的实现方式中,获取每个第一训练样本各自对应的分值,包括:使用初始生成式模型对预设的ppo模型进行初始化,得到经过初始化的ppo模型;将多个第一训练样本输入经过初始化的ppo模型,得到每个第一训练样本各自对应的ppo模型输出结果;将每个第一训练样本各自对应的ppo模型输出结果输入奖励模型,得到每个第一训练样本各自对应的分值;奖励模型用于生成第一训练样本对应的分值。

    8、基于该可能的实现方式,使用初始生成式模型对预设的ppo模型进行初始化,与重新训练预设的ppo模型相比,因为可以直接将初始生成式模型的参数(经过训练的)作为预设的ppo模型的初始参数而实现对预设的ppo模型的初始化,可以节省重新训练预设的ppo模型的时间,可以实现提高模型训练效率的效果,从而提升知识图谱的更新效率。

    9、又一种可能的实现方式中,该方法还包括:获取第二训练样本集;第二训练样本包括多个排序结果;每个排序结果包括样本集中一个问题语句对应的多个应答语句;每个排序结果中应答语句序号的大小与该应答语句的准确程度负相关;基于第二训练样本集对初始奖励模型进行训练,得到奖励模型。

    10、第二方面,本技术提供一种告警装置,该装置包括:获取模块和处理模块。

    11、获取模块,用于获取初始知识图谱和第一问题语句;第一问题语句包括待更新实体;第一问题语句用于请求获取待更新实体在目标属性处的属性值。

    12、处理模块,用于将第一问题语句输入生成式模型,得到待更新实体在目标属性处的属性值;生成式模型用于根据实体、以及问题语句提示的属性生成实体在问题语句提示的属性处的属性值;将待更新实体和待更新实体在目标属性处的属性值加入初始知识图谱,以更新初始知识图谱。

    13、可选地,获取模块,具体用于获取每个第一训练样本各自对应的分值;分值用于指示第一训练样本对应的输出结果与预测值之间的误差。

    14、可选地,获取模块,具体用于获取第二训练样本集;第二训练样本包括多个排序结果;每个排序结果包括样本集中一个问题语句对应的多个应答语句;每个排序结果中应答语句序号的大小与该应答语句的准确程度负相关。

    15、可选地,处理模块,具体用于根据初始知识图谱,构建样本集;样本集包括多个样本;每个样本包括问题语句、以及问题语句对应的应答语句;问题语句包括训练更新实体;问题语句用于请求获取训练更新实体在训练属性处的属性值;应答语句用于表示训练更新实体在训练属性处的属性值;基于样本集,对初始生成式模型进行训练,得到生成式模型。

    16、可选地,处理模块,具体用于将样本集中的问题语句作为第一训练样本,得到第一训练样本集;将第一训练样本输入初始生成式模型,通过前向传播计算第一训练样本对应的输出结果;根据分值和反向传播算法,更新初始生成式模型中的参数;在初始生成式模型达到预设条件(初始生成式模型的准确率达到预设准确率阈值,或者将第一训练样本输入初始生成式模型的次数达到预设次数阈值)的情况下,得到生成式模型。

    17、可选地,处理模块,具体用于使用初始生成式模型对预设的ppo模型进行初始化,得到经过初始化的ppo模型;将多个第一训练样本输入经过初始化的ppo模型,得到每个第一训练样本各自对应的ppo模型输出结果;将每个第一训练样本各自对应的ppo模型输出结果输入奖励模型,得到每个第一训练样本各自对应的分值;奖励模型用于生成第一训练样本对应的分值。

    18、可选地,处理模块,具体用于基于第二训练样本集对初始奖励模型进行训练,得到奖励模型。

    19、第三方面,本技术提供一种电子设备,该电子设备包括:处理器和存储器;存储器存储有处理器可执行的指令;处理器被配置为执行指令时,使得所述电子设备实现如第一方面及其任一种可能的实现方式的更新方法。

    20、第四方面,本技术提供一种计算机可读存储介质,该计算机可读存储介质包括:计算机软件指令;当该计算机软件指令在电子设备中运行时,使得电子设备实现如第一方面及其任一种可能的实现方式的更新方法。

    21、上述第二方面至第四方面的有益效果,可以参考第一方面所述,此处不再赘述。


    技术特征:

    1.一种更新方法,其特征在于,所述方法包括:

    2.根据权利要求1所述的方法,其特征在于,在所述将所述待更新实体和所述第一问题语句输入生成式模型,得到所述待更新实体在目标属性处的属性值之前,所述方法还包括:

    3.根据权利要求2所述的方法,其特征在于,所述基于所述样本集,对初始生成式模型进行训练,得到所述生成式模型,包括:

    4.根据权利要求3所述的方法,其特征在于,所述预设条件包括:

    5.根据权利要求3所述的方法,其特征在于,所述获取所述每个第一训练样本各自对应的分值,包括:

    6.根据权利要求5所述的方法,其特征在于,所述方法还包括:

    7.一种更新装置,其特征在于,所述装置包括:

    8.根据权利要求7所述的装置,其特征在于,

    9.一种电子设备,其特征在于,所述电子设备包括:处理器和存储器;

    10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括:计算机软件指令;


    技术总结
    本申请提供一种更新方法、装置、电子设备及存储介质,涉及数据处理技术领域,用于解决人工更新知识图谱更新不及时且更新效率低的问题。该方法包括:获取初始知识图谱和第一问题语句;第一问题语句包括待更新实体;第一问题语句用于请求获取待更新实体在目标属性处的属性值;将第一问题语句输入生成式模型,得到待更新实体在目标属性处的属性值;生成式模型用于根据实体、以及问题语句提示的属性生成实体在问题语句提示的属性处的属性值;将待更新实体和待更新实体在目标属性处的属性值加入初始知识图谱,以更新初始知识图谱。

    技术研发人员:刘腾飞,周伟,程兰
    受保护的技术使用者:中国联合网络通信集团有限公司
    技术研发日:
    技术公布日:2024/4/29
    转载请注明原文地址:https://wp.8miu.com/read-85649.html

    最新回复(0)