问题解答模型的训练与问题解答方法、装置与流程

专利2025-07-23 42

本公开涉及计算机，尤其涉及大模型、自然语言处理、深度学习等人工智能。提供了一种问题解答模型的训练与问题解答方法、装置、电子设备与可读存储介质。

背景技术：

1、大语言模型(large language model，llm)是指使用大量文本数据训练得到的深度学习模型，可以生成自然语言文本或理解自然语言文本的含义等。大语言模型具有一定的推理能力，使得大语言模型能够对所输入的问题进行解答，从而获取问题的回答。但是现有技术中的大语言模型在通过推理解答问题时，存在获取的回答的准确性较低的问题。

技术实现思路

1、根据本公开的第一方面，提供了一种问题解答模型的训练方法，包括：获取第一样本问题；将所述第一样本问题与解答步骤抓取模板输入大语言模型，获取所述大语言模型输出的第一样本解答步骤；将所述第一样本问题、所述第一样本解答步骤与回答抓取模板输入所述大语言模型，获取所述大语言模型输出的第一样本回答；根据所述第一样本问题与所述第一样本解答步骤，对步骤规划模型进行预训练；根据所述第一样本问题、所述第一样本解答步骤与所述第一样本回答，对所述大语言模型进行预训练；根据预训练得到的步骤规划模型与大语言模型，获取问题解答模型。

2、根据本公开的第二方面，提供了一种问题解答方法，包括：获取待解答问题；将所述待解答问题输入问题解答模型中的步骤规划模型，获取所述步骤规划模型输出的解答步骤；将所述待解答问题与所述解答步骤输入所述问题解答模型中的大语言模型，获取所述大语言模型输出的回答。

3、根据本公开的第三方面，提供了一种问题解答模型的训练装置，包括：第一获取单元，用于获取第一样本问题；第一处理单元，用于将所述第一样本问题与解答步骤抓取模板输入大语言模型，获取所述大语言模型输出的第一样本解答步骤；第二处理单元，用于将所述第一样本问题、所述第一样本解答步骤与回答抓取模板输入所述大语言模型，获取所述大语言模型输出的第一样本回答；第一预训练单元，用于根据所述第一样本问题与所述第一样本解答步骤，对步骤规划模型进行预训练；第二预训练单元，用于根据所述第一样本问题、所述第一样本解答步骤与所述第一样本回答，对所述大语言模型进行预训练；构建单元，用于根据预训练得到的步骤规划模型与大语言模型，获取问题解答模型。

4、根据本公开的第四方面，提供了一种问题解答装置，包括：第二获取单元，用于获取待解答问题；第一解答单元，用于将所述待解答问题输入问题解答模型中的步骤规划模型，获取所述步骤规划模型输出的解答步骤；第二解答单元，用于将所述待解答问题与所述解答步骤输入所述问题解答模型中的大语言模型，获取所述大语言模型输出的回答。

5、根据本公开的第五方面，提供了一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如上所述的方法。

6、根据本公开的第六方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行如上所述的方法。

7、根据本公开的第七方面，提供了一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现如上所述的方法。

8、应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

技术特征：

1.一种问题解答模型的训练方法，包括：

2.根据权利要求1所述的方法，还包括，

3.根据权利要求2所述的方法，其中，所述将所述第一样本问题、所述第一样本解答步骤与所述第一样本回答作为预训练数据包括：

4.根据权利要求1所述的方法，其中，所述根据预训练得到的步骤规划模型与大语言模型，获取问题解答模型包括：

5.根据权利要求1所述的方法，其中，所述根据预训练得到的步骤规划模型与大语言模型，获取问题解答模型包括：

6.根据权利要求1所述的方法，其中，所述根据预训练得到的步骤规划模型与大语言模型，获取问题解答模型包括：

7.根据权利要求1所述的方法，其中，所述根据所述第一样本问题与所述第一样本解答步骤，对步骤规划模型进行预训练包括：

8.根据权利要求1所述的方法，其中，所述根据所述第一样本问题、所述第一样本解答步骤与所述第一样本回答，对所述大语言模型进行预训练包括：

9.一种问题解答方法，包括：

10.一种问题解答模型的训练装置，包括：

11.根据权利要求10所述的装置，所述第二处理单元还用于执行：

12.根据权利要求11所述的装置，其中，所述第二处理单元在将所述第一样本问题、所述第一样本解答步骤与所述第一样本回答作为预训练数据时，具体执行：

13.根据权利要求10所述的装置，其中，所述构建单元在根据预训练得到的步骤规划模型与大语言模型，获取问题解答模型时，具体执行：

14.根据权利要求10所述的装置，其中，所述构建单元在根据预训练得到的步骤规划模型与大语言模型，获取问题解答模型时，具体执行：

15.根据权利要求10所述的装置，其中，所述构建单元在根据预训练得到的步骤规划模型与大语言模型，获取问题解答模型时，具体执行：

16.根据权利要求10所述的装置，其中，所述第一预训练单元在根据所述第一样本问题与所述第一样本解答步骤，对步骤规划模型进行预训练时，具体执行：

17.根据权利要求10所述的装置，其中，所述第二预训练单元在根据所述第一样本问题、所述第一样本解答步骤与所述第一样本回答，对所述大语言模型进行预训练时，具体执行：

18.一种问题解答装置，包括：

19.一种电子设备，包括：

20.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行权利要求1～9中任一项所述的方法。

21.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1～9中任一项所述的方法。

技术总结
本公开提供一种问题解答模型的训练与问题解答方法、装置、电子设备与可读存储介质。问题解答模型的训练方法包括：获取第一样本问题；将第一样本问题与解答步骤抓取模板输入大语言模型获取第一样本解答步骤；将第一样本问题、第一样本解答步骤与回答抓取模板输入大语言模型获取第一样本回答；根据第一样本问题与第一样本解答步骤对步骤规划模型进行预训练；根据第一样本问题、第一样本解答步骤与第一样本回答对大语言模型进行预训练；根据预训练得到的步骤规划模型与大语言模型，获取问题解答模型。问题解答方法包括：获取待解答问题；将待解答问题输入步骤规划模型获取解答步骤；将待解答问题与解答步骤输入大语言模型获取回答。

技术研发人员：贺峰,王建华,欧俊杰,黄枰轩,冯知凡,崔骁鹏,佘俏俏,吴华
受保护的技术使用者：北京百度网讯科技有限公司
技术研发日：
技术公布日：2024/4/29

转载请注明原文地址:https://wp.8miu.com/read-89869.html

专利

最新回复(0)