基于思维链推理的情绪支持对话生成方法、系统及装置

    专利2025-11-01  15


    本发明涉及情感计算以及对话生成,具体为基于思维链推理的情绪支持对话生成方法、系统及装置。


    背景技术:

    1、在现代社会,人们面临着日益复杂的压力和挑战。焦虑、抑郁等心理健康问题呈上升趋势,而社交疏离和孤独感也成为影响人们心理健康的重要因素。面对心理健康挑战,人们渴望有一种随时可用的、隐私安全的对话系统。传统的心理咨询服务可能存在时间和地点限制,而个体希望能够在需要时即刻获得情感支持。

    2、情绪支持对话是情感对话生成任务的一个分支,该类任务致力于赋予对话系统以人类的情感,使其能够感知人类的情绪,生成能够理解人类的、具有共情效果的回复。与一般的情感对话生成任务不同的是,情绪支持对话生成任务要根据用户当前的状态采取相应的对话策略去探索用户的情绪问题、理解用户、安抚用户,从而降低用户的情绪困扰。在心理健康问题日益普遍的今天,该任务有着深远的意义。现有的方法大多采用端到端的生成方式,即给定对话历史直接生成回复。研究者专注于设计有效的编码器、解码器结构整合外部知识、捕获对话历史中的行为特征、情感特征等,生成特定策略标签下的情绪支持回复。此类方法无法细粒度地建模用户情绪,同时弱化了用户情绪状态与策略选择之间的因果性,从而使对话系统缺乏可解释性。

    3、近来,大语言模型(llm)展现了强大的语言理解与生成能力,然而,现有的研究致力于设计提示策略如思维链、思维图等,以激发大语言模型解决数学推理、常识推理等复杂问题的能力,而在对话生成领域,这些研究并未得到广泛应用。对于情绪支持对话而言,现有的使用大语言模型的方法主要有两类:第一类,设计简单的提示模板结合给定内容输入大语言模型,一次性地获得回复。这样的方法容易使语言模型生成冗长的回复,且与人类意图产生一定的偏离,无法达到情绪支持的效果。第二类,通过领域数据训练大语言模型,使其能够适应当前任务,这类方法会消耗大量的计算资源,且训练难度很大。


    技术实现思路

    1、(一)解决的技术问题

    2、针对现有技术的不足,本发明提供了一种基于思维链推理的情绪支持对话生成方法、系统及装置,使用提示驱动的方法避免了模型参数的调整,减少了模型训练开销;同时,将端到端的生成问题转化为逐步的推理问题,优化了回复效果,提高了情绪支持对话生成的可解释性。

    3、(二)技术方案

    4、为实现以上目的,本发明通过以下技术方案予以实现:

    5、第一方面,提供了一种基于思维链推理的情绪支持对话生成方法,包括:

    6、获取对话历史信息,所述对话历史信息包括先前用户的输入、系统的响应,以及整个对话过程中的交互信息;

    7、将对话历史信息输入至预先构建的情绪思维链推理框架,获得用户情绪状态推理信息;

    8、对用户情绪状态推理信息进行格式化存储,获得用户情绪状态完整信息;

    9、将对话历史信息和用户情绪状态完整信息输入至预先构建的策略思维链推理框架,获得对话策略;

    10、利用对话历史及获得的用户情绪状态完整信息和对话策略构建最终prompt文本,将最终prompt文本输入至预先构建的大语言模型生成回复。

    11、优选的,所述情绪思维链推理框架的构建包括:

    12、构建情绪推理思维流程,以事件、情绪、意图的顺序构建推理链,建模用户情绪,以事件、情绪、意图的顺序的推理链的形式化表述如下:

    13、

    14、其中,代表事件,代表情绪,代表意图;事件代表用户正面临的处境,情绪代表用户在当前处境下的心情,意图代表用户在与系统倾诉过程中内在期望;

    15、所述策略思维链推理框架的构建包括:

    16、构建策略推理思维流程,根据现有的情绪支持理论构建从行动阶段至对话策略的推理链,进行策略选择,所述从行动阶段至对话策略的推理链形式化表述如下:

    17、

    18、其中,代表行动阶段,代表对话策略;所述行动阶段为心理学家与相关研究人员所定义的情绪支持对话所需的探索,安抚与行动三个步骤;所述对话策略为所述行动阶段下所对应的对话技巧。

    19、优选的,还包括:构建prompt模板,prompt模板用于与大语言模型进行交互,获得用户情绪状态推理信息;所述prompt模板包括事件prompt模板,情绪prompt模板,意图prompt模板,行动阶段prompt模板以及对话策略prompt模板。

    20、优选的,所述获得用户情绪状态推理信息的具体过程如下:

    21、将对话历史信息填充至事件prompt模板构建第一prompt文本,将第一prompt文本输入大语言模型获得回复,公式如下:

    22、

    23、其中,为对话历史,为经大语言模型推理所得的事件信息;

    24、将对话历史信息结合新获得的事件信息填入情绪prompt模板构建第二prompt文本,将第二prompt文本输入至大语言模型推理用户情绪,公式如下:

    25、

    26、将对话历史信息结合事件、用户情绪构建第三prompt文本,将第三prompt输入至大语言模型推理用户意图,公式如下:

    27、。

    28、优选的,所述获得用户情绪状态完整信息的具体过程如下:

    29、获取用户情绪状态推理信息中的中间推理结果与最终输出,将事件、情绪、意图三种信息进行整合,充分刻画用户情绪状态:

    30、

    31、将用户情绪状态完整信息进行结构化存储,存储形式可以为json存储或数据库存储。

    32、优选的,所述将对话历史信息和用户情绪状态完整信息输入至预先构建的策略思维链推理框架,获得对话策略,具体过程如下:

    33、将用户情绪状态完整信息作为对话策略推理依据;

    34、将对话历史信息与用户情绪状态完整信息填入行动阶段prompt模板构建第四prompt文本,并输入至大语言模型,获得当前的行动阶段推理结果,公式表述为:

    35、

    36、将所述行动阶段推理结果结合已有的对话历史信息、用户情绪状态完整信息填入对话策略prompt模板构建第五prompt文本,将第五prompt文本输入至大语言模型获得对话策略,公式表述为:

    37、

    38、第二方面,提供了一种基于思维链推理的情绪支持对话生成系统,所述系统包括:

    39、语言模型管理模块,用于部署大语言模型,管理其接口;

    40、prompt管理模块,用于构建、存储及维护prompt模板;

    41、记忆模块,用于存储对话历史信息;

    42、情绪状态管理模块,用于存储及维护对话过程中推理所得的用户状态信息;

    43、交互模块,用于协调统筹各模块,与用户流畅地进行交互。

    44、优选的,所述语言模型管理模块用于为对话中的推理与回复生成提供接口,所述大语言模型为gpt系列、chatglm系列或llama系列。

    45、优选的,所述prompt管理模块用于构建在思维链推理与最终回复生成时所需的prompt模板,在推理与生成的不同阶段获取对应的模板构造相应的prompt文本;

    46、所述交互模块在交互过程中,获取用户输入,并将输入记录至记忆模块,从prompt管理模块获取对应的prompt模板构建prompt文本,利用语言模型管理模块将prompt文本输入至对应的大语言模型与大语言模型进行交互获得大语言模型的生成结果,交互模块负责向用户隐藏中间推理过程,展示最终回复内容。

    47、第三方面,提供了一种基于思维链推理的情绪支持对话生成装置,包括:

    48、获取模块,被配置为获取对话历史信息,所述对话历史信息包括先前用户的输入、系统的响应,以及整个对话过程中的交互信息;

    49、信息提取模块,被配置为将对话历史信息输入至预先构建的情绪思维链推理框架,获得用户情绪状态推理信息;

    50、信息完善模块,被配置为对用户情绪状态推理信息进行格式化存储,获得用户情绪状态完整信息;

    51、策略生产模块,被配置为将对话历史信息和用户情绪状态完整信息输入至预先构建的策略思维链推理框架,获得对话策略;

    52、回复生成模块,被配置为利用用户情绪状态完整信息和对话策略构建最终prompt文本,将最终prompt文本输入至预先构建的大语言模型生成回复。

    53、(三)有益效果

    54、(1)本发明一种基于思维链推理的情绪支持对话生成方法,使用prompt驱动大语言模型,在有效利用大语言模型推理与生成能力的同时避免了传统技术中的微调过程,节省了大量的模型训练开销。

    55、(2)本发明一种基于思维链推理的情绪支持对话生成方法,设计了两种思维链推理框架,可细粒度建模用户情绪状态,同时提高了对话策略选择的准确性。

    56、(3)本发明一种基于思维链推理的情绪支持对话生成方法,将传统技术中的端到端生成问题转化为逐步推理的过程,提高了生成回复的可解释性。


    技术特征:

    1.一种基于思维链推理的情绪支持对话生成方法,其特征在于,包括:

    2.根据权利要求1所述的一种基于思维链推理的情绪支持对话生成方法,其特征在于:所述情绪思维链推理框架的构建包括:

    3.根据权利要求1所述的一种基于思维链推理的情绪支持对话生成方法,其特征在于,还包括:构建prompt模板,prompt模板用于与大语言模型进行交互,获得用户情绪状态推理信息;所述prompt模板包括事件prompt模板,情绪prompt模板,意图prompt模板,行动阶段prompt模板以及对话策略prompt模板。

    4.根据权利要求3所述的一种基于思维链推理的情绪支持对话生成方法,其特征在于:所述获得用户情绪状态推理信息的具体过程如下:

    5.根据权利要求4所述的一种基于思维链推理的情绪支持对话生成方法,其特征在于:所述获得用户情绪状态完整信息的具体过程如下:

    6.根据权利要求5所述的一种基于思维链推理的情绪支持对话生成方法,其特征在于:所述将对话历史信息和用户情绪状态完整信息输入至预先构建的策略思维链推理框架,获得对话策略,具体过程如下:

    7.一种基于思维链推理的情绪支持对话生成系统,其特征在于,所述系统包括:

    8.根据权利要求7所述的一种基于思维链推理的情绪支持对话生成系统,其特征在于:所述语言模型管理模块用于为对话中的推理与回复生成提供接口,所述大语言模型为gpt系列、chatglm系列或llama系列。

    9.根据权利要求7所述的一种基于思维链推理的情绪支持对话生成系统,其特征在于:所述prompt管理模块用于构建在思维链推理与最终回复生成时所需的prompt模板,在推理与生成的不同阶段获取对应的模板构造相应的prompt文本;

    10.一种基于思维链推理的情绪支持对话生成装置,其特征在于,包括:


    技术总结
    本发明提供基于思维链推理的情绪支持对话生成方法、系统及装置,涉及情感计算以及对话生成领域。该方法,包括:获取对话历史信息,将对话历史信息输入至情绪思维链推理框架,获得用户情绪状态推理信息;对用户情绪状态推理信息进行格式化存储,获得用户情绪状态完整信息;将对话历史信息和用户情绪状态完整信息输入至策略思维链推理框架,获得对话策略;构建最终prompt文本,将最终prompt文本输入大语言模型生成回复。本方法使用提示驱动的方法避免了模型参数的调整,减少了模型训练开销;同时,将端到端的生成问题转化为逐步的推理问题,优化了回复效果,提高了情绪支持对话生成的可解释性。

    技术研发人员:马廷淮,桑晨扬
    受保护的技术使用者:南京信息工程大学
    技术研发日:
    技术公布日:2024/4/29
    转载请注明原文地址:https://wp.8miu.com/read-91243.html

    最新回复(0)