一种口语语义理解方法、装置及系统与流程

    专利2022-07-08  137


    本发明属于智能控制领域,具体涉及一种口语语义理解方法、装置及系统。



    背景技术:

    在语音交互领域,将自然语言转化为机器能够理解的语义是核心技术内容。语义不仅表述事物本质,还表述事物之间的因果,上下位,事实等各种逻辑关系,语义分析理解就是对信息所包含的语义的识别,并建立一种模型,使其理解相关文本,其中语义理解离不开规则匹配、文本分类、实体识别与抽取等技术。

    当前语义理解技术主要分为两种:

    (1)模板规则匹配方法:通过设置口语文本模板和规则进行精准匹配。

    (2)机器学习方法:利用建立语义分类、实体识别、句式分析等模型进行语义理解。

    模板规则匹配方法对于少量语义的处理效果较好,但语料量逐渐增多,会形成意图冲突,句式混乱,层次不明等难以维护情况。机器学习方法训练的模型对标注好的领域具有领域内的适应性,但缺少泛领域能力,对于新的领域语义需要进行重新数据标注和训练才能进行识别。



    技术实现要素:

    本发明所要解决的技术问题是提供一种口语语义理解技术方案方法、装置及系统,以克服现有技术存在的上述不足。

    第一方面,提供一种口语语义理解方法,其包括:

    基于文本分类模型对输入的口语文本进行文本分类处理,得到所述口语文本对应的领域和意图;

    基于实体抽取模型对输入的口语文本进行实体抽取处理,得到所述口语文本对应的实体参数;

    对所述文本分类处理和所述实体抽取处理的准确度进行评分,获得评分值;

    当所述评分值大于或等于预设的评分阈值时,根据所述领域,所述意图和所述实体参数,输出结构化信息。

    第二方面,提供一种口语语义理解装置,其包括:

    文本分类单元,用于基于文本分类模型对输入的口语文本进行文本分类处理,得到所述口语文本对应的领域和意图;

    实体抽取单元,用于基于实体抽取模型对输入的口语文本进行实体抽取处理,得到所述口语文本对应的实体参数;

    评分单元,用于对所述文本分类处理和所述实体抽取处理的准确度进行评分,获得评分值;

    输出判断单元,用于当所述评分值大于或等于预设的评分阈值时,根据所述领域,所述意图和所述实体参数,输出结构化信息。

    第三方面,提供一种口语语义理解系统,其包括:

    上述的语义理解装置;以及

    规则匹配装置;

    所述规则匹配装置,用于:当所述评分值小于预设的评分阈值时,根据预设的标签和设计规则模板,对所述输入的口语文本进行语义理解;产生语义理解历史记录,从所述语义理解历史记录中提取带标签的文本数据。

    第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的口语语义理解方法。

    第五方面,提供一种计算机设备,其包括:

    一个或多个处理器;

    存储装置,用于存储一个或多个程序;

    当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上所述的口语语义理解方法。

    与现有技术相比,上述方案中的一个或多个实施例可以具有如下优点或有益效果:

    本发明的实施例对于口语化的短文本进行基于规则匹配和机器学习相结合的技术方案:

    在现有标签数据的基础上训练文本分类模型和实体抽取模型,实现已有领域的语义理解。

    对于新领域的语义理解,使用自定义标签和设计规则模板进行匹配,再利用匹配产生的历史带标签的文本数据训练新的模型(即对语义理解模型进行更新,训练出新的语义理解模型),实施对新领域的语义理解。

    通过训练新的语义理解模型来拓展领域内文本识别的泛化,同时使用规则匹配的方法实现各领域间的泛化。

    本发明的其它特征和优点将在随后的说明书中阐述,并且部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

    附图说明

    附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例共同用于解释本发明,并不构成对本发明的限制。在附图中:

    图1是本发明实施例的一种口语语义理解方法的整体流程图

    图2是本发明实施例的口语语义理解系统的架构图;

    图3是本发明实施例的口语语义理解技术方法的具体流程图。

    具体实施方式

    以下将结合附图及实施例来详细说明本发明的实施方式,借此对本发明如何应用技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。需要说明的是,只要不构成冲突,本发明中的各个实施例以及各实施例中的各个特征可以相互结合,所形成的技术方案均在本发明的保护范围之内。

    现有技术的语义技术难以实现对于新领域的语义理解和难以实现各领域间的泛化。

    实施例一

    为解决现有技术中存在的上述技术问题,本发明实施例提供了一种口语语义理解方法。

    发明人发现,口语化的短文本通常不遵循语法规则,并且长度短,没有足够的信息量来进行统计推断,很难在有限的语境中进行准确的推断。例如:句法结构可以任意排序,“空调打开”表示打开空调的意图,“空调打开了吗”表示查询空调状态。

    本发明的实施例对于口语化的短文本进行基于规则匹配和机器学习相结合的技术方案:

    在现有标签数据的基础上训练文本分类模型和实体抽取模型,实现已有领域的语义理解;

    对于新领域的语义理解,使用自定义标签和设计规则模板进行匹配,再利用匹配产生的历史带标签的文本数据训练新的模型(即对语义理解模型进行更新,训练出新的语义理解模型),实施对新领域的语义理解。

    通过训练新的语义理解模式来拓展领域内文本识别的泛化,同时使用规则匹配的方法实现各领域间的泛化。

    图1是本发明实施例的一种口语语义理解方法的整体流程图。如图1所示,其包括如下步骤:

    步骤110:基于文本分类模型对输入的口语文本进行文本分类处理,得到所述口语文本对应的领域和意图;

    步骤120:基于实体抽取模型对输入的口语文本进行实体抽取处理,得到所述口语文本对应的实体参数;

    步骤130:对所述文本分类处理和所述实体抽取处理的准确度进行评分,获得评分值;

    步骤140:当所述评分值大于或等于预设的评分阈值时,根据所述领域,所述意图和所述实体参数,输出结构化信息。

    在可选的实施例中,图1所示方法还进一步包括:当所述评分值小于预设的评分阈值时,根据预设的标签和设计规则模板,对所述输入的口语文本进行语义理解;产生语义理解历史记录,从所述语义理解历史记录中提取带标签的文本数据。

    在可选的实施例中,图1所示方法还进一步包括:将所述带标签的文本数据存入数据库,当在所述数据库中积累的带标签的文本数据的数量超过设定的数量阈值时,将所述数据库内的带标签的文本数据输入至训练模型;根据所述训练模型生成新的文本分类模型和新的实体抽取模型。

    在可选的实施例中,所述实体参数包括如下至少一项:数字、时间、位置、功能和模式。

    以下对上述技术方案的较佳实施例进行更加详细的说明:

    参阅图2,本发明的实施例主要包括:语义理解模块、规则匹配模块、模型训练模块3个功能模块。

    (1)语义理解模块

    口语文本输入语义理解模块后,由分类器进行处理,得到文本所属的领域或意图。其中,该分类器包括:文本分类模型和实体抽取模型。进一步地,该分类器还可以包括其他算法等,对口语文本或者话术文本识别成功后,输出领域,意图以及实体参数。

    文本分类模型可以得到文本所属的领域和/或意图。

    实体提取模型用于对文本中具体的实体参数进行提取,获得具体的实体参数。

    举例说明如下:

    例如“打开空调到23度”,先通过领域分类得到是空调领域和设置温度意图,再提取出实体参数23。

    在本实施例中,实体参数包括但不限于:数字、时间、位置、功能、模式等。

    在本实施例中,结构化信息包括:领域,意图和实体参数。

    (2)规则匹配模块

    语义理解模块无法处理的话术文本,将输出到自定义的标签规则进行处理,产生历史文件,采用处理算法标注数据,得到带有标签的文本数据。

    在可选实施例中,上述处理算法,用于对规则匹配模块产生的文本的语义理解历史日志数据,进行格式转化,将其格式转换为标准json格式或其他数据格式,对其中的文本数据和标签进行提取。

    在可选实施例中,将历史文件中的文本数据语义理解结果进行一对一匹配。

    (3)模型训练模块

    模型训练模块主要用于处理规则匹配模块产生的带标签的文本数据,当该文本数据的数量到达一定的阈值后,将数据输出到语义理解模型训练,对语义理解模型进行更新。

    图3的工作过程包括如下步骤:

    step1:输入口语文本;

    step2:通过分类器对该口语文本进行分类、实体抽取等,获得标签打分值;

    其中,打分是为了对分类或实体抽取的准确度进行评估。

    其中,模型计算将文本识别为每一类或实体的概率。

    step3:将该打分值与设定的阈值进行对比,如果大于该阈值,则提取领域、意图、实体等参数,并以文本形式输出结构化信息,从而实现口语文本的语义理解,否则标注“no_support”标签并进入规则匹配模块的处理流程step4;

    其中,结构化信息是文本理解后的语义结构,该结构化文本可以被计算机或控制器所理解。

    在可选实施例中,评分或打分的阈值例如设为0.95,提取领域、意图、实体参数的最大打分值要大于或等于0.95。

    step4规则匹配:对数据通过自定义标签和设计规则模板,实现口语文本的语义理解,并产生历史记录,通过处理算法从历史记录中提取带标签的文本数据;

    在本实施例中,先定义标签,再设计规则模板。在定义完标签后,可以根据该标签进行设计模板。这两步实现的功能跟语义理解模型的功能类似,可以实现对文本的语义理解。

    定义标签是确定新的领域、意图、实体参数的标识。

    设计规则模板主要通过设计定义正则匹配表达式。

    例如:空调设置温度的语义理解。

    标签:领域:airconditioner,意图:controltemperature。

    设计规则模板:[无意义词][空调的同义词][无意义词][设置的同义词][无意义词][数字][温度的同义词][无意义词]

    还可以通常排列组合形成多个模板。

    step5模型训练:将带标签的文本数据存入数据库,在积累的数量超过设定的数量阈值后,将该数据库里的带标签的文本数据输入训练模型,进行step2。

    在本实施例中,通过标准测试集的文本对每个领域、意图、实体参数识别正确时的分值进行求平均值,得到数量阈值。

    在本实施例中,训练模型用于:分别对领域、意图、实体进行分层识别,例如数据标签是在空调领域、设置温度设置意图、数字实体,并且空调领域模型和数字实体已经有了,但没有设置温度意图模型,则需要对空调领域模型进行更新,并训练出新的设置温度实体,由于数字实体是通用的,所有也无需重新训练。

    该训练模型将输出训练更新后的模型。

    该训练模型作为语义理解模型训练架构,通过对数据集进行分层集合,再进行分布式训练模型集,具有低耦合、高内聚、低耗时的特点。

    上述技术方案具有如下有益技术效果:

    利用规则匹配与机器学习模型相结合,在口语语义快速、精准识别的基础上,完成新领域数据的匹配和标签设置,实现新领域口语数据的理解。

    识别率高:语义理解模型相比句式精准匹配方式识别率更加准确,精准匹配识别率限制于语料量,即语料库需要涵盖大量的句式结构,而语义理解模型针对话术文本提取相关实体方式,进行区分相应的领域,意图以及实体参数,没有受限于用户输入话术句式,识别准确率高。

    自主更新:产品功能更新,用户话术不识别,需要设置标签和规则模板,同时随着功能不断增加,语料量也不断增加,形成难以维护的情况。语义理解模型包含语义理解模块,数据处理模块以及模型训练模块,三个模块环环相扣,相互影响,能够根据算法以及阈值设定进行自主更新,实现领域内和领域间的泛化识别能力。

    实施例二

    本发明实施例还提供一种口语语义理解装置,其包括:

    文本分类单元,用于基于文本分类模型对输入的口语文本进行文本分类处理,得到所述口语文本对应的领域和意图;

    实体抽取单元,用于基于实体抽取模型对输入的口语文本进行实体抽取处理,得到所述口语文本对应的实体参数;

    评分单元,用于对所述文本分类处理和所述实体抽取处理的准确度进行评分,获得评分值;

    输出判断单元,用于当所述评分值大于或等于预设的评分阈值时,根据所述领域,所述意图和所述实体参数,输出结构化信息。

    本发明实施例还提供一种口语语义理解系统,其特征在于,包括:

    如上所述的语义理解装置;以及

    规则匹配装置;

    所述规则匹配装置,用于:当所述评分值小于预设的评分阈值时,根据预设的标签和设计规则模板,对所述输入的口语文本进行语义理解;产生语义理解历史记录,从所述语义理解历史记录中提取带标签的文本数据。

    可选地,该系统还可以包括:

    模型训练装置,用于:将带标签的文本数据存入数据库,当在所述数据库中积累的带标签的文本数据的数量超过设定的数量阈值后,将所述数据库内的带标签的文本数据输入至训练模型;根据所述训练模型生成新的文本分类模型和新的实体抽取模型。

    可选地,实体参数包括如下至少一项:数字、时间、位置、功能和模式。

    本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上任意一项所述的口语语义理解方法。

    一种计算机设备,其包括:

    一个或多个处理器;

    存储装置,用于存储一个或多个程序;

    当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上任一所述的口语语义理解方法。

    虽然本发明所公开的实施方式如上,但所述的内容只是为了便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属技术领域内的技术人员,在不脱离本发明所公开的精神和范围的前提下,可以在实施的形式上及细节上作任何的修改与变化,但本发明的保护范围,仍须以所附的权利要求书所界定的范围为准。


    技术特征:

    1.一种口语语义理解方法,其特征在于,包括:

    基于文本分类模型对输入的口语文本进行文本分类处理,得到所述口语文本对应的领域和意图;

    基于实体抽取模型对输入的口语文本进行实体抽取处理,得到所述口语文本对应的实体参数;

    对所述文本分类处理和所述实体抽取处理的准确度进行评分,获得评分值;

    当所述评分值大于或等于预设的评分阈值时,根据所述领域、所述意图和所述实体参数,输出结构化信息。

    2.根据权利要求1所述的方法,其特征在于,还包括:

    当所述评分值小于预设的评分阈值时,根据预设的标签和设计规则模板,对所述输入的口语文本进行语义理解;

    产生语义理解历史记录,从所述语义理解历史记录中提取带标签的文本数据。

    3.根据权利要求2所述的方法,其特征在于,还包括:

    将所述带标签的文本数据存入数据库,

    当在所述数据库中积累的带标签的文本数据的数量超过设定的数量阈值时,将所述数据库内的带标签的文本数据输入至训练模型;

    根据所述训练模型生成新的文本分类模型和新的实体抽取模型。

    4.根据权利要求1所述的方法,其特征在于,所述实体参数包括如下至少一项:数字、时间、位置、功能和模式。

    5.一种口语语义理解装置,其包括:

    文本分类单元,用于基于文本分类模型对输入的口语文本进行文本分类处理,得到所述口语文本对应的领域和意图;

    实体抽取单元,用于基于实体抽取模型对输入的口语文本进行实体抽取处理,得到所述口语文本对应的实体参数;

    评分单元,用于对所述文本分类处理和所述实体抽取处理的准确度进行评分,获得评分值;

    输出判断单元,用于当所述评分值大于或等于预设的评分阈值时,根据所述领域、所述意图和所述实体参数,输出结构化信息。

    6.一种口语语义理解系统,其特征在于,包括:

    如权利要求5所述的语义理解装置;以及

    规则匹配装置;

    所述规则匹配装置,用于:当所述评分值小于预设的评分阈值时,根据预设的标签和设计规则模板,对所述输入的口语文本进行语义理解;产生语义理解历史记录,从所述语义理解历史记录中提取带标签的文本数据。

    7.根据权利要求6所述的口语语义理解系统,其特征在于,还包括:

    模型训练装置,用于:将所述带标签的文本数据存入数据库,当在所述数据库中积累的带标签的文本数据的数量超过设定的数量阈值时,将所述数据库内的带标签的文本数据输入至训练模型;根据所述训练模型生成新的文本分类模型和新的实体抽取模型。

    8.根据权利要求6所述的口语语义理解系统,其特征在于,所述实体参数包括如下至少一项:数字、时间、位置、功能和模式。

    9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-4中任意一项所述的口语语义理解方法。

    10.一种计算机设备,其特征在于,其包括:

    一个或多个处理器;

    存储装置,用于存储一个或多个程序;

    当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1-4中任一所述的口语语义理解方法。

    技术总结
    本发明提供一种口语语义理解方法、装置及系统,方法包括:基于文本分类模型对输入的口语文本进行文本分类处理,得到所述口语文本对应的领域和意图;基于实体抽取模型对输入的口语文本进行实体抽取处理,得到所述口语文本对应的实体参数;对所述文本分类处理和所述实体抽取处理的准确度进行评分,获得评分值;当所述评分值大于或等于预设的评分阈值时,根据所述领域,所述意图和所述实体参数,输出结构化信息。该方法利用规则匹配与机器学习模型相结合,在口语语义快速、精准识别的基础上,完成新领域数据的匹配和标签设置,实现新领域口语数据的理解。

    技术研发人员:李明杰;宋德超;贾巨涛;吴伟;黄姿荣
    受保护的技术使用者:珠海格力电器股份有限公司;珠海联云科技有限公司
    技术研发日:2019.09.11
    技术公布日:2021.03.12

    转载请注明原文地址:https://wp.8miu.com/read-21650.html

    最新回复(0)