一种基于NL2SQL的问答系统的制作方法

    专利2026-06-09  4


    本发明涉及智能问答,特别是涉及一种基于nl2sql的问答系统。


    背景技术:

    1、随着大语言模型的发展,智能问答的使用越来越多,用户通过输入想要查询的问题,大语言模型回答出问题的答案。但在使用大语言模型通过检索数据库获取问题答案的过程中,对于不同日期或不同类型的采集数据,往往有不同的存储方式,此时直接向大语言模型输入问题查询,大语言模型查询比较费时费力,没有很好的效率。


    技术实现思路

    1、针对上述技术问题,本发明采用的技术方案为:一种基于nl2sql的问答系统,所述系统包括表格数据库、知识库、处理器和存储有计算机程序的存储器,所述表格数据库存储有预设表格列表,所述知识库存储有预设文本列表,当处理器执行所述计算机程序时,实现如下步骤:

    2、s100,获取用户输入的待回复语句,所述待回复语句为自然语言。

    3、s200,将待回复语句分别输入目标意图识别模型和目标实体识别模型,以获取待回复语句对应的目标意图和目标实体列表,其中,所述目标实体为待回复语句包括的实体,且所述目标实体至少包括时间实体。

    4、s300,若目标实体列表中的时间实体为预设时间格式,执行s400;否则将目标实体列表的时间实体进行转化为预设时间格式,执行s400。

    5、s400,基于目标意图和目标实体列表,确定检索数据库;当检索数据库为表格数据库时,执行s500;当检索数据库为知识库时,执行s600。

    6、s500,基于目标意图和目标实体列表,获取目标sql语句,且基于目标sql语句,在表格数据库中进行检索,获取目标表格,执行s700。

    7、s600,将预设文本列表中每一预设文本按照预设切分规则切分成预设段落,获取预设段落列表,并使用待回复语句和每一预设段落进行相似度匹配,获取目标段落列表,执行s700。

    8、s700,将待回复语句和目标表格或将待回复语句和目标段落列表输入llm模型,获取待回复语句的答复语句。

    9、本发明至少具有以下有益效果:综上,获取用户输入的待回复语句,将待回复语句分别输入目标意图识别模型和目标实体识别模型,以获取待回复语句对应的目标意图和目标实体列表,若目标实体列表中的时间实体不是预设时间格式,将目标实体列表的时间实体进行转化为预设时间格式,基于目标意图和目标实体列表,确定检索数据库,当检索数据库为表格数据库时,基于目标意图和目标实体列表,获取目标sql语句,且基于目标sql语句,在表格数据库中进行检索,获取目标表格;当检索数据库为知识库时,将预设文本列表中每一预设文本按照预设切分规则切分成预设段落,获取预设段落列表,并使用待回复语句和每一预设段落进行相似度匹配,获取目标段落列表;将待回复语句和目标表格或将待回复语句和目标段落列表输入llm模型,获取待回复语句的答复语句;本发明通过意图识别、实体识别、时间转化,找到表格数据库中的目标表格或知识库中的目标段落,使得大语言模型理解目标表格或目标段落的内容,获取到待回复语句的答案,使得大语言模型能够更加准确的获取到待回复语句的答案。



    技术特征:

    1.一种基于nl2sql的问答系统,其特征在于,所述系统包括表格数据库、知识库、处理器和存储有计算机程序的存储器,所述表格数据库存储有预设表格列表,所述知识库存储有预设文本列表,当处理器执行所述计算机程序时,实现如下步骤:

    2.根据权利要求1所述的基于nl2sql的问答系统,其特征在于,若目标实体列表中的时间实体为空,向用户返回时间语句,所述时间语句用于限定目标意图的发生时间。

    3.根据权利要求1所述的基于nl2sql的问答系统,其特征在于,还包括通过如下步骤获取目标意图识别模型:

    4.根据权利要求3所述的基于nl2sql的问答系统,其特征在于,s250还包括:

    5.根据权利要求3所述的基于nl2sql的问答系统,其特征在于,还包括通过如下步骤获取目标实体识别模型:

    6.根据权利要求5所述的基于nl2sql的问答系统,其特征在于,s270还包括:

    7.根据权利要求1所述的基于nl2sql的问答系统,其特征在于,s400还包括:

    8.根据权利要求1所述的基于nl2sql的问答系统,其特征在于,s500中基于目标意图和目标实体列表,获取目标sql语句,包括如下步骤:


    技术总结
    本发明提供了一种基于NL2SQL的问答系统,涉及智能问答领域,所述系统包括表格数据库、知识库、处理器和存储有计算机程序的存储器,当处理器执行所述计算机程序时,实现如下步骤:获取用户输入的待回复语句,获取目标意图和目标实体列表,若目标实体列表中的时间实体不是预设时间格式,将目标实体列表的时间实体转化为预设时间格式,基于目标意图和目标实体列表,确定检索数据库,基于检索数据库,获取目标表格或目标段落,将待回复语句和目标表格或将待回复语句和目标段落列表输入LLM模型,获取待回复语句的答复语句;使得大语言模型能够更加准确的输出待回复语句的答案。

    技术研发人员:董霖,莫志强,陈志勇,尹雅露
    受保护的技术使用者:每日互动股份有限公司
    技术研发日:
    技术公布日:2024/4/29
    转载请注明原文地址:https://wp.8miu.com/read-97586.html

    最新回复(0)