面向场景配置的人机交互对话机器人系统的制作方法

专利2022-07-08 109

本申请涉及人工智能领域，具体涉及一种面向场景配置的人机交互对话机器人系统。

背景技术：

作为人工智能时代的入口级产品，近年来，对话机器人受到了大量的关注，也得到了快速的发展。微软的小娜和小冰、苹果的siri、百度的度秘等等产品层出不穷。

对话机器人设计涉及到多个技术领域，包括但不限于：机器学习、深度学习、自然语言处理、数据库技术、知识图谱技术等等。近年来，每一项技术在其各自领域均得到了长足发展且具备一定的成熟度。

对话机器人的工程化是一个产品成功的关键。一方面，在对话机器人的技术体系下，需要整合诸多支撑技术到一个统一的设计框架下；另一方面，面对需求变化迅速的市场，需要可持续、高效率的输出和完善对话产品。

缺陷和不足：

现阶段已有的对话机器人开发设计技术/框架存在一定问题：

(1)对话设计需要大量专业知识，门槛较高

对话机器人工作的第一步、也是最重要的一步就是读懂用户输入的语句并获取所需要的信息，需要处理复杂的用户输入信息，并且步骤晦涩难懂，对应到自然语言理解即意图识别、实体识别以及槽位填充工作。它们不仅需要大量的前期配置工作，还需要设计者根据对话进程处理异常值、缺失值追问、获取值确认等等主线对话以外的情况。这也导致软件程序开发人员与对话设计者往往需要协同工作，无法各自独立完成。

(2)对话设计与业务操作衔接困难

对话机器人最终目的往往是执行具体业务操作，后者涉及的对象、内容、格式、操作方法在不同场景下不尽相同，也就是说针对每一种操作，机器人设计方都要与之单独进行对接，这也就导致大量的硬编码、定制化的出现，极大限制了对话机器人的响应丰富程度。

(3)复杂对话设计困难

真实场景下，对话过程往往不是固定的一两步即可完成，而是一个充满流程、分支的复杂过程。对话需要处理用户多轮询问、上下文分析、异常对话等等，而且还要根据需要随时调整对话流程。这大大增加了满足真实场景的复杂对话的开发难度。

技术实现要素：

针对现有技术中的问题，本申请提供一种面向场景配置的人机交互对话机器人系统，能够基于对话三元素各自设计及应用方法，极大降低了对话机器人的设计难度。

为了解决上述问题中的至少一个，本申请提供以下技术方案：

第一方面，本申请提供一种面向场景配置的人机交互对话机器人系统，包括：输入模组、响应模组以及对话流；

所述输入模组用来处理对话过程中来自用户或第三方输入内容，获得进行下一步动作及对话所需要的信息；

所述响应模组用于实现不同的响应动作，包括返回文本回答、调用接口、执行命令中的至少一种；

所述对话流由多个所述输入模组和响应模组构成，用于确定对话的走向，多个所述对话流通过训练最终形成完整的机器人对话模型。

进一步地，所述输入模组根据输入来源不同可分为用户输入模组和事件输入模组，其中，所述用户输入模组是终端用户发出的对话内容及其处理过程，所述事件输入模组是可自定义的事件信息及其处理过程。

进一步地，所述输入模组包括nlu处理单元，所述nlu处理单元根据获得的输入内容所携带的意图信息和实体信息，划分为意图识别和实体识别组件和填槽组件。

进一步地，所述输入模组包括自动实体验证单元、自动实体追问单元和自动槽位信息确认单元。

进一步地，所述响应模组还用于对webapi、数据库、文档以及知识库的封装，得到统一形式的对外接口。

进一步地，所述响应模组还包括：

将对话中已填槽位与元知识请求参数进行数据绑定，绑定后响应模组将参数发送给响应请求地址等待回复。

进一步地，所述响应模组还包括：

元知识调用成功后返回的数据格式与对话机器人终端展现样式的数据格式进行映射，映射后返回数据自动转换为所需格式转发给对话机器人终端使用。

进一步地，所述对话流包括可配置的上下文多轮对话流，具体包括：

用户第一次输入的对话内容，通过输入模组的公共nlu组件，获得此次输入的意图和实体信息；

判定为意图1，则进入路径1来到输入模组1的填槽环节；同样，判定为意图2，则进入路径2来到输入模组2的填槽环节；

填槽结束，若为路径1则进入响应模组1获取并发送回应信息；若为路径2则进入响应模组2获取并发送回应信息，注意一个输入模组后可跟随多个响应模组；

路径2到响应模组3即结束，而路径1则在响应模组1后有三个分支，处理过程同上。

进一步地，所述对话流根据前若干轮的对话内容，在对话流的模组中结合所述对话内容动态处理，形成与上下文语境相符的响应内容，其中，所述对话内容包括此前的输入内容、响应信息、已经填充的实体、槽位信息中的至少一种。

进一步地，还包括：

提取对话流中的状态信息和响应信息，并对其进行数值转化，形成特征化的状态序列和响应序列；

将特征化后的状态序列和响应序列进行映射并合并，形成响应选择模型。模型输入为当前对话状态序列，输出为下一步的响应，输入输出关系与对话流中的每个环节对应；

将特征化后的状态序列和响应序列输入到神经网络进行训练，形成响应选择模型，预测模型输入为当前对话状态序列，输出为下一步的响应。

由上述技术方案可知，本申请提供一种面向场景配置的人机交互对话机器人系统，通过提出的全流程配置化的开发模式，极大降低了对话机器人的设计难度，发明中的对话输入模组设计方法，屏蔽了自然语言分析等专业知识，使得对话设计者可以与软件开发者独立工作，完成对话设计，发明中的对话响应模组设计方法，借助元知识体系，将各类操作映射到统一的请求服务上，使得对话设计可以更简洁灵活地对接业务操作，发明中的对话流设计方法，让对话设计更加直观清晰，对话模型支撑多轮对话、上下文关联、异常对话等处理过程，让复杂对话设计大为简化。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例中的面向场景配置的人机交互对话机器人系统的整体示意图；

图2为本申请实施例中的自动实体验证、自动实体追问和自动槽位信息确认的工作流程图；

图3为本申请实施例中的响应模组工作流程图；

图4为本申请实施例中的对话流工作流程图；

图5为本申请实施例中的对话模型训练流程图；

图6为本申请实施例中的atc状态机示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整的描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

考虑到现阶段已有的对话机器人开发设计技术/框架存在一定问题的问题，本申请提供一种面向场景配置的人机交互对话机器人系统，通过提出的全流程配置化的开发模式，极大降低了对话机器人的设计难度，发明中的对话输入模组设计方法，屏蔽了自然语言分析等专业知识，使得对话设计者可以与软件开发者独立工作，完成对话设计，发明中的对话响应模组设计方法，借助元知识体系，将各类操作映射到统一的请求服务上，使得对话设计可以更简洁灵活地对接业务操作，发明中的对话流设计方法，让对话设计更加直观清晰，对话模型支撑多轮对话、上下文关联、异常对话等处理过程，让复杂对话设计大为简化。

为了能够基于对话三元素各自设计及应用方法，极大降低了对话机器人的设计难度，本申请提供一种面向场景配置的人机交互对话机器人系统的实施例，所述面向场景配置的人机交互对话机器人系统具体包含有如下内容：

输入模组、响应模组以及对话流；

所述输入模组用来处理对话过程中来自用户或第三方输入内容，获得进行下一步动作及对话所需要的信息；

所述响应模组用于实现不同的响应动作，包括返回文本回答、调用接口、执行命令中的至少一种；

所述对话流由多个所述输入模组和响应模组构成，用于确定对话的走向，多个所述对话流通过训练最终形成完整的机器人对话模型。

从上述描述可知，本申请实施例提供的面向场景配置的人机交互对话机器人系统，能够通过提出的全流程配置化的开发模式，极大降低了对话机器人的设计难度，发明中的对话输入模组设计方法，屏蔽了自然语言分析等专业知识，使得对话设计者可以与软件开发者独立工作，完成对话设计，发明中的对话响应模组设计方法，借助元知识体系，将各类操作映射到统一的请求服务上，使得对话设计可以更简洁灵活地对接业务操作，发明中的对话流设计方法，让对话设计更加直观清晰，对话模型支撑多轮对话、上下文关联、异常对话等处理过程，让复杂对话设计大为简化。