本发明涉及机器问答技术领域,特别是涉及一种多轮对话机器人意图命中优化方法及装置。
背景技术:
任务型多轮对话机器人通常按照业务需求以流程树的形式进行配置,机器人在每个节点上识别用户意图或获取相关槽值信息,再根据流程树配置确定对话走向。其中用户意图识别一般由机器人的nlu模块完成,其识别的准确率很大程度决定了机器人对话能力。
已上线的多轮对话机器人,一般通过分析对话日志中未识别意图的对话文本数据来优化意图识别模块的准确率,机器人训练师根据流程树配置和业务经验确定未识别意图的对话文本的意图类别,再配置到相应流程节点的意图相似话术中。
受限于人工分析能力,机器人训练师完整分析全量人机对话数据,也无法从整体上发现对话流程中的瓶颈,其意图识别优化的工作效率不高,针对性差。
技术实现要素:
本发明要解决的技术问题是提供一种多轮对话机器人意图命中优化方法及装置,能够实现机器人意图识别能力高效、有针对性的优化。
为解决上述技术问题,本发明提供了一种多轮对话机器人意图命中优化方法,所述方法包括:获取多轮对话机器人的对话日志和机器人流程配置数据;通过数据预处理,形成对话流程树数据结构,构建文本意图命中列表;依据上下文关系构建未识别意图文本与上一对话流程节点映射关系;在需要优化的流程节点,使用文本聚类算法对未识别意图文本按当前节点后继意图类别进行聚类;对聚类结果进行审核;根据审核结果,优化机器人流程配置数据。
在一些实施方式中,对聚类结果进行审核包括:人工审核及自动审核。
在一些实施方式中,对聚类结果进行自动审核包括:计算聚类类别的类别中心点;计算类别节点与类别中心点之间的距离均值;如果计算得到的距离均值小于设定的距离阈值,则自动审核通过。
在一些实施方式中,距离包括:欧式距离、余弦相似度、曼哈顿距离、闵氏距离、杰卡德相似系数、皮尔森相关系数、汉明距离、bm25相关性评分。
在一些实施方式中,还包括:在依据上下文关系构建未识别意图文本与上一对话流程节点映射关系之前,在通过数据预处理,形成对话流程树数据结构,构建文本意图命中列表之后,计算识别意图文本。
在一些实施方式中,识别意图文本保存在文本意图命中列表中,未识别意图文本不保存在文本意图命中列表中。
在一些实施方式中,还包括:在对聚类结果进行审核之前,以流程树形式可视化展示意图命中数据。
此外,本发明还提供了一种多轮对话机器人意图命中优化装置,所述装置包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现根据前文所述的多轮对话机器人意图命中优化方法。
采用这样的设计后,本发明至少具有以下优点:
可自动分析全量人机对话数据,完整可视化展示意图命中数据,机器人训练师可直观发现机器人对话瓶颈;
针对对话瓶颈节点的未识别意图对话文本进行聚类,配置节点的相似话术,优化更有针对性。
附图说明
上述仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,以下结合附图与具体实施方式对本发明作进一步的详细说明。
图1是本发明实施例提供的多轮对话机器人意图命中优化方法的流程图;
图2是本发明实施例提供的多轮对话机器人意图命中优化装置的结构图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
图1示出了多轮对话机器人意图命中优化方法的流程。多轮对话机器人意图命中优化方法的执行流程包括:
s11.获取多轮对话机器人的对话日志和机器人流程配置数据。
s12.数据预处理:形成对话流程树数据结构;构建文本意图命中列表。
s13.意图命中结果数据计算;依据上下文关系构建未识别意图文本与上一对话流程节点映射关系。
s14.在需要优化的流程树节点,使用文本聚类算法对未识别意图对话文本按当前节点后继意图类别进行聚类。
s15.人工审核聚类结果,将审核通过的未识别意图文本自动配置到相应意图的相似话术列表中。
s16.根据相似话术列表优化意图相似话术配置。
s17.根据优化后的意图相似话术配置来配置多轮对话机器人。
本发明的目的是提供一个任务型多轮对话机器人的意图识别能力的优化工具,通过将实际发生的人机对话数据的意图命中情况按照机器人流程树的形式进行可视化展示,用户对话文本命中数在流程树上以漏斗状衰减,这样可直观地发现机器人意图识别能力的瓶颈,再提取瓶颈节点上的未识别意图文本,按照该节点的分支意图类别进行聚类,人工审核聚类结果,将被采纳的未识别意图文本配置到意图相似话术中,实现机器人意图识别能力高效、有针对性的优化。
图2示出了多轮对话机器人意图命中优化装置的结构。参见图2,例如,所述多轮对话机器人意图命中优化装置200可以用于充当机器对话系统中的话术配置优化装置。如本文所述,多轮对话机器人意图命中优化装置200可以用于在机器对话系统中实现对话术文本的自动优化功能。多轮对话机器人意图命中优化装置200可以在单个节点中实现,或者多轮对话机器人意图命中优化装置200的功能可以在网络中的多个节点中实现。本领域的技术人员应意识到,术语多轮对话机器人意图命中优化装置包括广泛意义上的设备,图2中示出的多轮对话机器人意图命中优化装置200仅是其中一个示例。包括多轮对话机器人意图命中优化装置200是为了表述清楚,并不旨在将本发明的应用限制为特定的多轮对话机器人意图命中优化装置实施例或某一类多轮对话机器人意图命中优化装置实施例。本发明所述的至少部分特征/方法可以在网络装置或组件,例如,多轮对话机器人意图命中优化装置200中实现。例如,本发明中的特征/方法可以采用硬件、固件和/或在硬件上安装运行的软件实现。多轮对话机器人意图命中优化装置200可以是任何通过网络处理,存储和/或转发数据帧的设备,例如,服务器,客户端,数据源等。如图2所示,多轮对话机器人意图命中优化装置200可以包括收发器(tx/rx)210,其可以是发射器,接收器,或其组合。tx/rx210可以耦合到多个端口250(例如上行接口和/或下行接口),用于从其他节点发送和/或接收帧。处理器230可耦合至tx/rx210,以处理帧和/或确定向哪些节点发送帧。处理器230可以包括一个或多个多核处理器和/或存储器设备232,其可以用作数据存储器,缓冲区等。处理器230可以被实现为通用处理器,或者可以是一个或多个专用集成电路(applicationspecificintegratedcircuit,简称asic)和/或数字信号处理器(digitalsignalprocessor,简称dsp)的一部分。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,本领域技术人员利用上述揭示的技术内容做出些许简单修改、等同变化或修饰,均落在本发明的保护范围内。
1.一种多轮对话机器人意图命中优化方法,其特征在于,包括:
获取多轮对话机器人的对话日志和机器人流程配置数据;
通过数据预处理,形成对话流程树数据结构,构建文本意图命中列表;
依据上下文关系构建未识别意图文本与上一对话流程节点映射关系;
在需要优化的流程节点,使用文本聚类算法对未识别意图文本按当前节点后继意图类别进行聚类;
对聚类结果进行审核;
根据审核结果,优化机器人流程配置数据。
2.根据权利要求1所述的多轮对话机器人意图命中优化方法,其特征在于,对聚类结果进行审核包括:人工审核及自动审核。
3.根据权利要求3所述的多轮对话机器人意图命中优化方法,其特征在于,对聚类结果进行自动审核包括:
计算聚类类别的类别中心点;
计算类别节点与类别中心点之间的距离均值;
如果计算得到的距离均值小于设定的距离阈值,则自动审核通过。
4.根据权利要求3所述的多轮对话机器人意图命中优化方法,其特征在于,距离包括:欧式距离、余弦相似度、曼哈顿距离、闵氏距离、杰卡德相似系数、皮尔森相关系数、汉明距离、bm25相关性评分。
5.根据权利要求1所述的多轮对话机器人意图命中优化方法,其特征在于,还包括:
在依据上下文关系构建未识别意图文本与上一对话流程节点映射关系之前,在通过数据预处理,形成对话流程树数据结构,构建文本意图命中列表之后,计算识别意图文本。
6.根据权利要求5所述的多轮对话机器人意图命中优化方法,其特征在于,识别意图文本保存在文本意图命中列表中,未识别意图文本不保存在文本意图命中列表中。
7.根据权利要求1所述的多轮对话机器人意图命中优化方法,其特征在于,还包括:
在对聚类结果进行审核之前,以流程树形式可视化展示意图命中数据。
8.一种多轮对话机器人意图命中优化装置,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现根据权利要求1至7任意一项所述的多轮对话机器人意图命中优化方法。
技术总结