对话数据生成方法、系统、模型训练方法、对话处理方法与流程

    专利2026-02-09  1


    本申请涉及计算机,特别是涉及一种对话数据生成方法、一种对话数据生成系统、一种模型训练方法、一种对话处理方法、一种电子设备和一种存储介质。


    背景技术:

    1、采用对话机器人实现在线多轮对话,在很多领域得到广泛应用。例如,在电子商务领域,对话机器人可以用来接待用户、处理客户的咨询问题,为电子商务平台的运行提升了效率。然而,传统的对话机器人对用户的问题理解能力有限,其对用户提出的问题解答往往不尽人意。即传统的对话机器人在与用户进行人机对话时,所能处理的对话内容有限,无法为用户提供精准的服务,用户体验有待改善。而用于训练对话机器人中对话内容生成模型的对话数据样本稀疏,是导致传统的对话机器人无法为用户提供精准的服务的重要原因之一。现有技术中采用人工标注和手动生成对话数据样本的方式效率低、成本高。


    技术实现思路

    1、本申请实施例提供了一种对话数据生成方法,可以自动生成目标领域中各领域场景的多轮对话数据,效率高,成本低,可以为训练应用于目标领域的对话内容生成模型提供丰富的对话数据样本,进一步提升了基于用户提问生成的回复内容的精准度。

    2、相应的,本申请实施例还提供了一种对话数据生成系统、一种模型训练方法、一种对话处理方法、一种电子设备和一种存储介质,用以保证上述方法的实现及应用。

    3、为了解决上述问题,本申请实施例公开了一种对话数据生成方法,所述方法包括:

    4、获取目标场景中与各人机对话要素对应的提示词模板和生成内容依赖关系,所述人机对话要素至少包括:用户提问和回复内容;

    5、按照所述生成内容依赖关系,分别基于所述提示词模板和预训练大语言模型递进生成相应人机对话要素的生成内容;

    6、基于所述用户提问和所述回复内容分别对应的所述生成内容,生成所述目标场景中的多轮对话数据。

    7、本申请实施例还公开了一种模型训练方法,所述方法包括:

    8、获取目标场景中的若干组多轮对话数据,其中,各组所述多轮对话数据包括:按照逻辑递进关系顺序排列的多轮用户提问和回复内容;

    9、基于预训练大语言模型,构建对话内容生成模型;

    10、基于所述多轮对话数据对所述对话内容生成模型进行精调,直至所述对话内容生成模型的预测损失值满足预设收敛条件,其中,所述预测损失值基于各组多轮对话数据的单轮对话预测损失计算得到,所述单轮对话预测损失为:所述对话内容生成模型对各轮对话数据中的用户提问进行回复预测得到的回复内容预测值进行建模得到的负对数释然的平均值。

    11、本申请实施例还公开了一种对话数据处理方法,所述方法包括:

    12、响应于接收到当前轮用户提问,获取所述当前轮用户提问的前指定轮数对话数据;

    13、基于所述当前轮用户提问和所述前指定轮数对话数据,按照逻辑递进关系生成待回复对话数据;

    14、基于所述待回复对话数据调用预先训练的对话内容生成模型,得到所述对话内容生成模型输出的回复内容;

    15、基于所述回复内容,对所述当前轮用户提问进行回复。

    16、本申请实施例还公开了一种对话数据生成系统,所述系统包括:

    17、主题生成模块,用于基于预设第三提示词模板,生成第三提示词,并基于所述第三提示词调用预训练大语言模型,输出所述预训练大语言模型生成的目标场景下的若干对话主题的生成内容;

    18、人物设定生成模块,用于基于所述主题生成模块输出的所述对话主题的生成内容,格式化预设第四提示词模板,生成第四提示词;

    19、所述人物设定生成模块,还用于基于所述第四提示词调用所述预训练大语言模型,输出所述预训练大语言模型生成的目标场景下指定所述对话主题关联的人物设定的生成内容;

    20、提问生成模块,用于基于所述人物设定生成模块输出的所述人物设定的生成内容,格式化预设第五提示词模板,生成第五提示词;

    21、所述提问生成模块,还用于基于所述第五提示词调用所述预训练大语言模型,输出所述预训练大语言模型生成的目标场景下所述人物设定针对各所述对话主题的用户提问的生成内容;

    22、回复生成模块,用于基于所述提问生成模块输出的所述用户提问的生成内容,格式化预设第六提示词模板,生成第六提示词;

    23、所述回复生成模块,还用于基于所述第六提示词调用所述预训练大语言模型,输出所述预训练大语言模型生成的所述用户提问对应的回复内容的生成内容;

    24、对话数据拼接模块,用于基于所述用户提问和所述回复内容的生成内容,生成所述目标场景中的多轮对话数据。

    25、本申请实施例还公开了一种电子设备,包括:处理器,以及与所述处理器通信连接的存储器;所述存储器存储计算机执行指令;所述处理器执行所述存储器存储的计算机执行指令,以实现如本申请实施例所述的方法。

    26、本申请实施例还公开了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如本申请实施例所述的方法。

    27、与现有技术相比,本申请实施例包括以下优点:通过获取目标场景中与各人机对话要素对应的提示词模板和生成内容依赖关系,所述人机对话要素至少包括:用户提问和回复内容;并按照所述生成内容依赖关系,分别基于所述提示词模板和预训练大语言模型递进生成相应人机对话要素的生成内容,以基于所述用户提问和所述回复内容分别对应的所述生成内容,生成所述目标场景中的多轮对话数据,实现了全自动生成目标领域的多轮对话数据,无需人工标注,降低了多轮对话数据获取成本,提升了对话数据获取效率。进一步的,通过为每个人机对话要素设置提示词模板和生成内容依赖关系,控制对话数据生成的方式更加灵活,有助于基于对话数据实施的应用的升级和优化。



    技术特征:

    1.一种对话数据生成方法,其特征在于,所述方法包括:

    2.根据权利要求1所述的方法,其特征在于,所述按照所述生成内容依赖关系,分别基于所述提示词模板和预训练大语言模型递进生成相应人机对话要素的生成内容,包括:

    3.根据权利要求2所述的方法,其特征在于,所述基于所述第一提示词模板和预训练大语言模型,生成相应人机对话要素的生成内容,包括:

    4.根据权利要求2所述的方法,其特征在于,所述按照所述生成内容依赖关系,基于所述第二提示词模板、预先生成的目标生成内容,以及,所述预训练大语言模型,递进生成相应人机对话要素的生成内容,包括:

    5.根据权利要求1所述的方法,其特征在于,所述生成内容依赖关系通过所述提示词模板中设置的占位符表示。

    6.根据权利要求5所述的方法,其特征在于,所述提示词模板中通过第一人机对话要素对应的占位符表示:生成第二人机对话要素的生成内容时依赖的输入条件包括所述第一人机对话要素的生成内容,其中,所述第二人机对话要素为所述提示词模板对应的所述人机对话要素。

    7.根据权利要求1所述的方法,其特征在于,所述用户提问对应的所述提示词模板中包括:规则提示词,所述规则提示词用于指示预训练大语言模型按照第一规则生成用户提问,其中,所述第一规则包括:生成的各组用户提问具有相关性且具有逻辑递进关系、至少结合n次上下文,其中,n为大于1的自然数。

    8.根据权利要求1所述的方法,其特征在于,所述回复内容对应的提示词模板中包括:指令提示词,所述指令提示词用于指示预训练大语言模型基于对话上文生成所述对话上文中末轮用户提问的回复内容。

    9.根据权利要求1所述的方法,其特征在于,所述用户提问具有逻辑递进关系,所述回复内容与所述用户提问对应,所述基于所述用户提问和所述回复内容分别对应的所述生成内容,生成所述目标场景中的多轮对话数据,包括:

    10.一种模型训练方法,其特征在于,所述方法包括:

    11.一种对话处理方法,其特征在于,所述方法包括:

    12.一种对话数据生成系统,其特征在于,所述系统包括:

    13.一种电子设备,其特征在于,包括:处理器,以及与所述处理器通信连接的存储器;

    14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1-11中任一项所述的方法。


    技术总结
    本申请实施例提供了一种对话数据生成方法、模型训练方法、对话处理方法。其中,对话数据生成方法包括:获取目标场景中与各人机对话要素对应的提示词模板和生成内容依赖关系,所述人机对话要素至少包括:用户提问和回复内容;按照所述生成内容依赖关系,分别基于所述提示词模板和预训练大语言模型递进生成相应人机对话要素的生成内容;基于所述用户提问和所述回复内容分别对应的所述生成内容,生成所述目标场景中的多轮对话数据。本方法实现了全自动生成目标领域的多轮对话数据,无需人工标注,降低了多轮对话数据获取成本,提升了对话数据获取效率。

    技术研发人员:刘森,金林波
    受保护的技术使用者:杭州阿里巴巴海外互联网产业有限公司
    技术研发日:
    技术公布日:2024/4/29
    转载请注明原文地址:https://wp.8miu.com/read-94915.html

    最新回复(0)