本发明涉及智能问答,特别是涉及一种基于nl2sql的问答系统。
背景技术:
1、随着大语言模型的发展,智能问答的使用越来越多,用户通过输入想要查询的问题,大语言模型回答出问题的答案。但在使用大语言模型通过检索数据库获取问题答案的过程中,对于不同日期或不同类型的采集数据,往往有不同的存储方式,此时直接向大语言模型输入问题查询,大语言模型查询比较费时费力,没有很好的效率。
技术实现思路
1、针对上述技术问题,本发明采用的技术方案为:一种基于nl2sql的问答系统,所述系统包括表格数据库、知识库、处理器和存储有计算机程序的存储器,所述表格数据库存储有预设表格列表,所述知识库存储有预设文本列表,当处理器执行所述计算机程序时,实现如下步骤:
2、s100,获取用户输入的待回复语句,所述待回复语句为自然语言。
3、s200,将待回复语句分别输入目标意图识别模型和目标实体识别模型,以获取待回复语句对应的目标意图和目标实体列表,其中,所述目标实体为待回复语句包括的实体,且所述目标实体至少包括时间实体。
4、s300,若目标实体列表中的时间实体为预设时间格式,执行s400;否则将目标实体列表的时间实体进行转化为预设时间格式,执行s400。
5、s400,基于目标意图和目标实体列表,确定检索数据库;当检索数据库为表格数据库时,执行s500;当检索数据库为知识库时,执行s600。
6、s500,基于目标意图和目标实体列表,获取目标sql语句,且基于目标sql语句,在表格数据库中进行检索,获取目标表格,执行s700。
7、s600,将预设文本列表中每一预设文本按照预设切分规则切分成预设段落,获取预设段落列表,并使用待回复语句和每一预设段落进行相似度匹配,获取目标段落列表,执行s700。
8、s700,将待回复语句和目标表格或将待回复语句和目标段落列表输入llm模型,获取待回复语句的答复语句。
9、本发明至少具有以下有益效果:综上,获取用户输入的待回复语句,将待回复语句分别输入目标意图识别模型和目标实体识别模型,以获取待回复语句对应的目标意图和目标实体列表,若目标实体列表中的时间实体不是预设时间格式,将目标实体列表的时间实体进行转化为预设时间格式,基于目标意图和目标实体列表,确定检索数据库,当检索数据库为表格数据库时,基于目标意图和目标实体列表,获取目标sql语句,且基于目标sql语句,在表格数据库中进行检索,获取目标表格;当检索数据库为知识库时,将预设文本列表中每一预设文本按照预设切分规则切分成预设段落,获取预设段落列表,并使用待回复语句和每一预设段落进行相似度匹配,获取目标段落列表;将待回复语句和目标表格或将待回复语句和目标段落列表输入llm模型,获取待回复语句的答复语句;本发明通过意图识别、实体识别、时间转化,找到表格数据库中的目标表格或知识库中的目标段落,使得大语言模型理解目标表格或目标段落的内容,获取到待回复语句的答案,使得大语言模型能够更加准确的获取到待回复语句的答案。
1.一种基于nl2sql的问答系统,其特征在于,所述系统包括表格数据库、知识库、处理器和存储有计算机程序的存储器,所述表格数据库存储有预设表格列表,所述知识库存储有预设文本列表,当处理器执行所述计算机程序时,实现如下步骤:
2.根据权利要求1所述的基于nl2sql的问答系统,其特征在于,若目标实体列表中的时间实体为空,向用户返回时间语句,所述时间语句用于限定目标意图的发生时间。
3.根据权利要求1所述的基于nl2sql的问答系统,其特征在于,还包括通过如下步骤获取目标意图识别模型:
4.根据权利要求3所述的基于nl2sql的问答系统,其特征在于,s250还包括:
5.根据权利要求3所述的基于nl2sql的问答系统,其特征在于,还包括通过如下步骤获取目标实体识别模型:
6.根据权利要求5所述的基于nl2sql的问答系统,其特征在于,s270还包括:
7.根据权利要求1所述的基于nl2sql的问答系统,其特征在于,s400还包括:
8.根据权利要求1所述的基于nl2sql的问答系统,其特征在于,s500中基于目标意图和目标实体列表,获取目标sql语句,包括如下步骤:
