一种智能语音交互方法、系统及存储介质与流程

专利2022-07-08 170

本发明涉及通信领域，具体涉及一种智能语音交互方法、系统及存储介质。

背景技术：

运营商语音业务发展过程中出现了很多的呼叫中心、客服中心、呼叫代接服务中心。呼叫中心提供外呼服务，主要应用于产品推销；客服中心提供客服服务，主要应用于电话客服；呼叫代接服务中心提供代接来电服务，主要应用于代接骚扰电话、代接漏接来电。这些呼叫处理系统都在大力发展语音机器人产品，并且这些系统已经具备了以下能力：呼叫接入/呼出能力；语音与文字转换能力；但是只具备上述2种能力，语音机器人的语音交互很生硬、很死板，与人正常的呼叫对话差距极大。

技术实现要素：

本发明所要解决的技术问题是提供一种智能语音交互方法、系统及存储介质，提升了语音交互效果，使这些呼叫控制系统的语音机器人越来越“人性化”。

本发明解决上述技术问题的技术方案如下：一种智能语音交互方法，包括：

接通待处理呼叫；

对asr语音识别出的文字进行语义分析，得到ai识别结果；

根据所述ai识别结果选择对应的语音交互策略；所述语音交互策略包括话题确定策略、禁止重复语音策略、话题转换策略、上下文关联策略和安全交互控制策略中的至少一种；

根据所述语音交互策略播放对应的应答语音与通话方进行语音交互。

本发明的有益效果是：接通待处理呼叫，对asr语音识别的文字首先进行ai语义分析，得出ai识别结果；然后根据ai识别结果匹配对应的语音交互策略，按照语音交互策略执行对应的语音交互流程，其中语音交互策略包括确定话题、禁止重复、话题转换、上下文关联和安全交互控制策略，通过多个语音交互策略，使得在智能语音交互对话过程中自然和灵动，实现基于ai识别进行智能语音交互，使语音机器人真正能够像“人”一样进行交互对话。

在上述技术方案的基础上，本发明还可以做如下改进：

进一步，所述话题确定策略包括：

从各所述ai识别结果中获取各对话话题；

从各所述对话话题中选择与所述通话方关联的话题作为目标话题；

根据所述目标话题进行语音交互。

采用上述进一步方案的有益效果是：所有的交互对话都要围绕着通话方的话题展开，保证对话持续下去，获取更多的信息。

进一步，所述禁止重复语音策略包括：

确定已向所述通话方播放的应答语音；

当向所述通话方待播放的应当语音与已向所述通话方播放的应当语音的相似率大于阈值时，替换所述待播放的应答语音。

采用上述进一步方案的有益效果是：智能语音交互过程中，不出现重复语音，保障对话过程自然流畅、不拖沓。

进一步，所述话题转换策略包括：

当各ai识别结果中包括涉及所述通话方的隐私信息时，引导转换到其他话题；

当根据语音交互过程确定当前对话话题语音交互完成时，引导结束当前话题；

当根据语音交互过程确定所述通话方的呼叫意图时，转换到与所述呼叫意图对应的话题。

采用上述进一步方案的有益效果是：对话过程中用户会出现主动转换话题情况，语音机器人也可以主动引导转换话题，实现更好的交互对话过程。

进一步，所述上下文关联策略包括：

记录并分析所述通话方的每一条语音信息；

对所述语音信息进行上下文关联，确定所述通话方的呼叫意图，根据所述呼叫意图播放对应的应答语音。

采用上述进一步方案的有益效果是：记录用户交互过程的每句话信息，进行前后关联，保障对话话题有序深入，提升对方的对话意愿。

进一步，所述语音交互控制策略包括：

从各ai识别结果中确定所述通话方的语音信息包括负面言论时，记录与所述语音信息对应的语音文字信息和录音信息，结束与所述通话方的通话；

将所述语音文字信息和录音信息进行上报。

采用上述进一步方案的有益效果是：对对话进行安全控制，当对话出现一些不良内容时，将对话控制在合理、合法的范围之内，并及时上报不良内容的对话。

进一步，所述智能语音交互方法还包括：

设定语音交互过程中用于表现感情色彩的语音性格特征。

采用上述进一步方案的有益效果是：对话过程中语音机器人需要具有明确的、持续的性格特征，通过不同的性格特征表现情感色彩，使得语音交互过程更加自然、灵动，这样才能让语音对话不像“机器”，更像“人”。

进一步，所述根据所述语音交互策略播放对应的应答语音与通话方进行语音交互之后，包括：

对语音交互过程的各ai识别结果进行分析，确定本次语音交互过程的通话标签信息；

将所述通话标签信息发送其他统计分析系统，进行数据统计分析。

采用上述进一步方案的有益效果是：智能语音交互过程中，每次通话会出现多种ai识别结果，根据ai识别结果的变化情况，智能计算出本次通话的最终通话标签信息，方便其它系统进行数据统计分析、或者对数据进行二次加工。

为了解决上述问题，本发明实施例还提供一种智能语音交互系统，智能语音交互系统包括：as服务器，ms服务器，ai服务器和交互策略服务器；

所述as服务器用于接通待处理呼叫；

所述ai服务器用于对asr语音识别出的文字进行语义分析，得到ai识别结果；

所述交互策略服务器用于根据所述ai识别结果选择对应的语音交互策略；

所述ms服务器还用于根据所述语音交互策略播放对应的应答语音与通话方进行语音交互。

为了解决上述问题，本发明实施例还提供一种存储介质，存储介质包括存储有一个或者多个计算机程序，所述一个或者多个计算机程序可被一个或者多个处理器执行，以实现上所述的智能语音交互方法的步骤。

附图说明

图1为本发明一实施例提供的一种智能语音交互方法的流程图；

图2为本发明一实施例提供的一种智能语音交互系统的结构图；

图3为本发明一实施例提供的呼叫中心与智能语音交互系统的网络结构图；

图4为本发明一实施例提供的智能语音交互系统外呼呼叫的业务流程图；

图5为本发明一实施例提供的另一种智能语音交互方法的流程图；

图6为本发明一实施例提供的客服中心/代接来电服务中心与智能语音交互系统的网络结构图；

图7为本发明一实施例提供的智能语音交互系统代接来电的业务流程图；

图8为本发明一实施例提供的再一种智能语音交互方法的流程图。

具体实施方式

以下结合附图对本发明的原理和特征进行描述，所举实例只用于解释本发明，并非用于限定本发明的范围。

如图1所示，图1为发明实施例提供的一种智能语音交互方法的流程图，智能语音交互方法应用于智能语音交互系统，帮助呼叫中心、客服中心、呼叫代接服务中心的语音机器人使用基于ai识别结果智能驱动语音流程，极大的提升了语音交互效果，使这些呼叫控制系统的语音机器人越来越“人性化”，该语音交互方法包括：

s101、对接待处理呼叫；

s102、对asr语音识别出的文字进行语义分析，得到ai识别结果；

s103、根据ai识别结果选择对应的语音交互策略；语音交互策略包括话题确定策略、禁止重复语音策略、话题转换策略、上下文关联策略和语音交互控制策略中的至少一种；

s104、根据语音交互策略播放对应的应答语音与通话方进行语音交互。

在本实施例中，接通待处理呼叫，对asr语音识别的文字首先进行ai语义分析，得出ai识别结果；然后根据ai识别结果匹配对应的语音交互策略，按照语音交互策略执行对应的语音交互流程，其中语音交互策略包括确定话题、禁止重复、话题转换、上下文关联和安全交互控制策略，通过多个语音交互策略，使得在智能语音交互对话过程中自然和灵动，实现基于ai识别进行智能语音交互，使语音机器人真正能够像“人”一样进行交互对话。

在本实施例中，智能语音交互系统通过呼叫中心、客服中心或呼叫代接服务中心与通话方进行语音交互。具体的，与通话方进行语音交互时，呼叫中心、客服中心或呼叫代接服务中心采集通话方的语音信息，通过asr语音识别，将语音转写成文字，将语音转写文字后发送给智能语音交互系统，由智能语音交互系统对文字组成的话语中进行语义分析，确定文字信息所表示的语义内容，从该句话语提取关键字，得到ai识别结果，获悉通话方的表达信息，进而根据语音交互策略播放对应的应答语音，进而通过呼叫中心、客服中心或呼叫代接服务中心向通话方进行播放。在一些实施例中，还可以是智能语音交互系统直接与通话方进行语音交互。

在本实施例中，话题策略包括从各ai识别结果中获取各对话话题；从各对话话题中选择与所述通话方关联的话题作为目标话题，根据所述目标话题进行语音交互；即所有的交互对话都要围绕着通话方的话题展开，选择与通话方关联的话题，保证对话持续下去，获取更多的信息。例如asr语音转写文字后，进行语义分析，得出1个或多个ai识别结果；如对贷款广告电话可以提供“试探推销贷款”、“明确推销贷款”、“下载app推销”、“低利息诱导”、“快速放款诱导”、“免审核诱导”等多种ai识别结果。ai识别结果提供了初级话题范围，智能语音交互系统根据1个或多个ai识别结果智能选择对话话题，确定与通话方关联的“试探推销贷款”这个话题，并且围绕“试探推销贷款”切入智能语音交互对话。可以理解的是，围绕通话方的目标话题可以是一个或多个，如围绕通话方的话题包括多个时，且根据各话题的关联性，可选择关联的多个话题，例如“试探推销贷款”与“免审核诱导”存在关联，则可确定“试探推销贷款”这个话题，在这话题上，围绕着“免审核诱导”进行智能语音交互。此时根据语音交互策略播放对应的应答语音如“请详细介绍一下免审核的贷款额度”。

在本实施例中，禁止重复语音策略包括：确定已向通话方播放的应答语音；当向通话方待播放的应当语音与已向通话方播放的应当语音的相似率大于阈值时，替换待播放的应答语音。即智能语音交互过程中，不出现重复语音，保障对话过程自然流畅、不拖沓。例如，在接听通话方的呼叫时，首先会向通话方播放“您好，请讲”的礼貌应答语音，在后续智能语音交互过程中，不会反复出现“喂，请讲”、“您好，请讲”等内容相似应答语音。

在本实施例中，话题转换策略包括：当各ai识别结果中包括涉及通话方的隐私信息时，引导转换到其他话题；即通过转化话题确保语音交互过程中不泄露用户隐私信息，例如当对话过程中主叫要求加被叫方用户的微信号时，智能语音交互系统会主动转换话题，通过合适的引导语音，不再讨论加微信号的话题，引导转换到其它话题。

当根据语音交互过程确定当前对话话题语音交互完成时，引导结束当前话题；即转换话题可以是结束话题，其中在多重语音交互过程中，通过语义分析，明确呼叫方的来电意图时，确定当前对话话题已经完成，例如当智能语音交互系统判断推销贷款这个话题已经完成交互，不需要进行更多应答时，就可以转换话题，通过播放“谢谢您，我需要考虑一下，有需要再联系您，再见”礼貌的结束通话过程。

当根据语音交互过程确定通话方的呼叫意图时，转换到与呼叫意图对应的话题。即转换话题要引导话题深入进行，例如对ai识别结果为“试探推销贷款”的来电，通过智能语音交互过程分析出来电就是推销贷款后，智能语音交互系统会主动转换话题到“推销贷款”，主动引导话题深入进行。

在一些实施例中，转换话题还可以对通话方进行语音安抚，例如当智能语音交互系统判断通话方来电是联系被叫方用户寻求服务时，例如“物业报修”话题，可以使用委婉的应答语“您稍等，马上给您安排处理”对通话方进行语音安抚。

在本实施例中，上下文关联策略包括：记录并分析通话方的每一条语音信息；对语音信息进行上下文关联，确定通话方的呼叫意图，根据呼叫意图播放对应的应答语音。即既然是对话就必然存在前后的关联，否则必然出现“前言不搭后语”的情况；智能语音交互系统会记录用户交互过程的每句话信息，进行前后关联，保障对话话题有序深入，提升对方的对话意愿。例如根据呼叫方的语音识别得到上文为“金融理财产品”，下文为“低风险”，则可以向通话方播放“关于低风险的金融理财产品您可以详细介绍一下吗？”。

在本实施例中，智能语音交互方法还包括：设定语音交互过程中的语音性格特征，例如撒娇性格、幽默性格、开朗性格和沮丧性格；其中具体的语音性格特征可以是由智能语音交互系统根据用户的性格特征确定，也可以是由用户确定。即对话过程中语音机器人需要具有明确的、持续的性格特征，使得语音交互过程，这样才能让语音对话不像“机器”，更像“人”。例如在接通待处理呼叫，并建立与待处理呼叫的通话方的话路连接之后，可以设定语音性格特征。在一些实施例中，也可以对asr语音识别出的文字进行语义分析，得到ai识别结果之后，设定语音性格特征；还可以在语音交互过程中，根据ai识别结果对语音性格特征进行转换，例如ai识别结果为某件坏消息时，则从平和性格转换为沮丧性格。

在本实施例中，语音交互控制策略包括：从各ai识别结果中确定通话方的语音信息包括负面言论时，记录与语音信息对应的语音文字信息和录音信息，结束与通话方的通话，将语音文字信息和录音信息进行上报。当根据ai识别结果包括负面言论时，会对对方进行礼貌应答，结束与通话方的通话，同时记录来电文字信息、进行录音取证；当智能交互系统在呼叫接入情况下，在后台可通过上报接口将来电文字信息、来电录音信息主动上传给运营商不良信息处理中心，由不良信息处理中心根据呼叫判定结果，进行呼叫质检及后续处理。在一些实施例中，在外呼呼叫情况下，可以不需要向运营商不良信息处理中心主动上报。

在一些实施例中，该通话方的主叫号码、来电时间信息会通知被叫用户，但是来电文字信息和来电录音会被主动屏蔽、不通知被叫用户，保护被叫用户不会受到负面言论骚扰。

在本实施例中，根据语音交互策略播放对应的应答语音进行语音交互之后，包括：对语音交互过程的各ai识别结果进行分析，确定本次语音交互过程的通话标签信息；将通话标签信息发送其他统计分析系统，进行数据统计分析。即智能语音交互过程中，每次通话会出现多种ai识别结果，根据ai识别结果的变化情况，智能计算出本次通话的最终通话标签信息，方便其它系统进行数据统计分析、或者对数据进行二次加工，例如智能交互对话过程中总共产生了“尝试推销贷款”、“想加微信号”、“免审核诱导”、“推销贷款”、“想继续说”、“需要回电”等多个ai识别结果，智能语音交互系统通过分析，判定该来电的准确ai识别结果是“推销贷款”，并将“推销贷款”作为该来电的最终标签。后续其它系统，例如运营商不良信息处理中心可以根据最终标签统计、分析来电情况，对频繁骚扰的主叫号码进行查封处理。

基于ai识别结果进行智能语音交互的方法，通过先进的ai语义分析系统、智能的语音交互策略，使语音机器人能够快速识别对话话题；根据对话过程灵活转换对话话题；结合交互过程的前后对话使对话过程更流畅、自然，不出现重复对话情况；赋予语音机器人特定性格，是对话过程更加生动；对对话过程中出现的不良信息及时上报、必要时进行强制拦截，将语音机器人的对话过程控制在合理、合法范围内。使用智能语音交互策略系统，彻底解决现有技术体系下语音机器人对话过程生硬、呆板的情况，使语音机器人的对话过程变得灵动、自然，将语音机器人的对话变得更加“人性化”，使语音机器人不像“机器”、更像“人”。

在本实施例还提供一种智能语音交互系统，如图2所示，该智能语音交互系统包括：as服务器201，ai服务器202和交互策略服务器203和ms服务器204；

as服务器201用于对接待处理呼叫；

ai服务器202用于对asr语音识别出的文字进行语义分析，得到ai识别结果；

交互策略服务器203用于根据ai识别结果选择对应的语音交互策略；

ms服务器204还用于根据语音交互策略播放对应的应答语音与通话方进行语音交互。

需要说明的是，该智能语音交互系统可以直接对接呼叫中心、客服中心、呼叫代接服务中心的语音中继。可以为呼叫中心、服务中心和呼叫代接服务中心提供智能语音交互系统。

如图3所示，图3为呼叫中心与智能语音交互系统的网络结构图；其中图3中的智能语音交互系统包括：

ai语义分析服务器：提供ai语义分析能力，对asr语音转写的文字进行ai语义分析，得出对应的1个或多个ai识别结果。

智能交互策略服务器：提供智能交互策略能力，根据ai识别结果综合选择智能交互策略，选择交互过程的应答语音，控制交互过程的确定话题、禁止重复、转换话题、前后关联、设定性格、安全控制等功能。

数据库服务器：为智能语音交互系统里的服务器提供集中数据库能力，可以支持mysql、oracle、informix等多种数据库，也可以支持内存数据库。

语音文件服务器：提供智能交互策略所需要的应答语音，语音可以使用提前录制的语音；也可以直接连接呼叫中心、客服中心、呼叫代接服务中心的tts，使用tts合成的应答语音。

as服务器：提供sip信令处理能力，根据选定的智能交互策略来控制语音交互过程。as服务器也用于直接对接呼叫中心、客服中心、呼叫代接服务中心的sip中继。

ms服务器：提供sip媒体处理能力，根据as服务器的指令完成语音交互的放音、收号等功能。ms服务器也用于直接对接呼叫中心、客服中心、呼叫代接服务中心的sip中继，支持rtp放音方式。

中继网关：提供isup中继接入能力，当呼叫中心、客服中心、呼叫代接服务中心不能提供sip中继、只能提供isup中继时，使用中继网关对接isup中继。

接口服务器：接收呼叫中心、客服中心、呼叫代接服务中心的asr语音转写文字信息，将文字信息发送ai语义分析服务器进行处理。接口服务器负责连接其它统计分析系统，可以将来电号码、来电时间、来电信息、来电最终标签等信息发送其它系统进行二次数据处理。接口服务器负责连接运营商不良信息处理中心等系统，对负面来电的文字信息、来电录音进行主动上报。

如图4所示，图4为智能语音交互系统外呼的业务流程图，呼叫中心将asr语音转写文字发送给智能语音交互系统进行ai语义分析，根据ai分析的ai识别结果确定智能语音交互策略，智能语音交互策略包括上述的话题确定策略、禁止重复语音策略、话题转换策略、上下文关联策略和安全交互控制策略中的至少一种；确定对应的语音交互策略后，进行语音交互流程，进行as信令控制和ms媒体处理，ms媒体处理时获取语音文件，as信令控制是控制呼叫中心的语音中继向用户播放应答语音，同时ms媒体处理时还采集外呼录音信息，智能语音交互策略选取对应的语音交互策略后，采集外呼文字信息，进而将外呼录音信息、文字信息封装成数据信息，便于后续数据统计分析、数据二次加工；智能语音交互策略确定结束呼叫或确定为安全控制策略(出现负面信息)时，终止呼叫。

如图5所示，图5为智能语音交互方法，该智能语音交互方法包括：

s501、呼叫中心将需要处理的呼叫接入智能语音交互系统。

呼叫中心通过as(sip中继)或中继网关(isup中继)接入智能语音交互系统。

s502、智能语音交互系统的ai语义分析服务器对asr语音转写文字进行ai语义分析，得到1个或多个识别结果。

其中asr语音转写文字可以通过接口服务器发送给智能语音交互系统。

s503、智能语音交互系统的智能交互策略服务器根据ai识别结果分析，选择对应的语音交互流程。

s504、智能语音交互系统的as服务器进行信令交互，控制呼叫中心的语音中继，ms服务器通过呼叫中心的语音中继向用户播放应答语音。

应答语音可以从语音文件服务器直接获取，也可以连接呼叫中心的tts服务器合成语音文件。

s505、智能语音交互系统的数据库服务器记录呼叫asr语音转写文字、记录呼叫单条和全程录音、记录呼叫的ai识别结果，记录呼叫的最后标签。

s506-1、智能语音交互系统的智能交互策略服务器判定已经完成语音交互，不需要继续被叫用户进行对话，主动结束外呼呼叫。

s506-2、智能语音交互系统的智能交互策略服务器发现被叫用户出现负面言论，主动结束外呼呼叫。

s506-3、智能语音交互系统的数据库服务器记录负面言论的相关信息。

在外呼呼叫情况下，当被叫出现负面言论时，不需要向运营商不良信息处理中心主动上报。

在一些负面言论实施例中，智能语音交互系统的接口服务器也可以将相关信息通知外呼中心，由外呼中心确定是否后续不再继续对该用户进行外呼营销。

s507、智能语音交互系统的接口服务器通过外呼中心结束外呼呼叫。

s508、能语音交互系统的接口服务器将外呼呼叫信息发送给其他统计分析系统，进行数据统计分析或数据二次加工。

如图6、7、8所示，图6为客服中心、代接来电服务中心与智能语音交互系统的网络结构图，其中图6的该智能语音交互系统与图3中的智能语音交互系统相同，在此不再一一赘述；图7为智能语音交互系统代接的业务流程图，客服中心/呼叫代接服务中心将asr语音转写文字发送给智能语音交互系统进行ai语义分析，根据ai分析的ai识别结果确定智能语音交互策略，智能语音交互策略包括上述的话题确定策略、禁止重复语音策略、话题转换策略、上下文关联策略和安全交互控制策略中的至少一种；确定对应的语音交互策略后，进行语音交互流程，进行as信令控制和ms媒体处理，ms媒体处理时获取语音文件，as信令控制是控制客服中心、代接来电服务中心的语音中继向用户播放应答语音，同时ms媒体处理时还采集来电录音信息，智能语音交互策略选取对应的语音交互策略后，采集来电文字信息，进而将来电录音信息、文字信息封装成数据信息，便于后续数据统计分析、数据二次加工；智能语音交互策略确定结束呼叫或确定为安全控制策略(出现负面信息)时，终止呼叫，同时来电文字、录音中包括负面信息时，主动将负面信息上报给运营商不良信息处理中心。

图8为智能语音交互方法，该智能语音交互方法包括：

s801、客服中心/代接来电服务中心将需要处理的呼叫接入智能语音交互系统。

客服中心/代接来电服务中心通过直接连接as/ms(sip中继)或者连接中继网关(isup中继)接入智能语音交互系统。

s802、智能语音交互系统的ai语义分析服务器对asr语音转写文字进行ai语义分析，得到1个或多个识别结果。

s803、智能语音交互系统的智能交互策略服务器根据ai识别结果分析，选择对应的语音交互流程。

s804、智能语音交互系统的as服务器进行信令交互，控制客服中心/代接来电服务中心的语音中继，ms服务器通过客服中心/代接来电服务中心的语音中继向用户播放应答语音。

通过语音文件服务器获取语音文件，或者连接呼叫中心的tts，获取tts合成的语音文件。

s805、智能语音交互系统的数据库服务器记录呼叫asr语音转写文字、记录来电单条和全程录音、记录来电的ai识别结果，记录来电的最后标签。

s806-1、智能语音交互系统的智能交互策略服务器判定已经完成语音交互，不需要继续被叫用户进行对话，主动结束呼叫。

s806-2、智能语音交互系统的智能交互策略服务器发现主叫用户出现负面言论，主动结束呼叫。

s806-3、智能语音交互系统的数据库服务器记录负面言论的相关信息，将负面言论来电呼叫的相关信息主动上报运营商不良信息处理中心。

s807、智能语音交互系统的as服务器直接结束来电呼叫。

如果来电出现负面言论，智能语音交互还可以将相关信息通知客户中心/来电代接服务中心，并阻截来电识别文字和录音信息对被叫用户造成骚扰。

s808、智能语音交互系统的接口服务器将来电呼叫信息发送给其他统计分析系统，进行数据统计分析或数据二次加工。

在本实施例还提供一种存储介质，该存储介质包括存储有一个或者多个计算机程序，一个或者多个计算机程序可被一个或者多个处理器执行，以实现如上所述的智能语音交互方法的步骤，在此不再一一赘述。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，上述描述的装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。

作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分，或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(rom，read-onlymemory)、随机存取存储器(ram，randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上对本发明实施例所提供的技术方案进行了详细介绍，本专利中应用了具体个例对本发明实施例的原理以及实施方式进行了阐述，以上实施例的说明只适用于帮助理解本发明实施例的原理；以上仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

技术特征：

1.一种智能语音交互方法，其特征在于，所述智能语音交互方法包括：

接通待处理呼叫；

对asr语音识别出的文字进行语义分析，得到ai识别结果；

根据所述语音交互策略播放对应的应答语音与通话方进行语音交互。

2.根据权利要求1所述的智能语音交互方法，其特征在于，所述话题确定策略包括：

从各所述ai识别结果中获取各对话话题；

从各所述对话话题中选择与所述通话方关联的话题作为目标话题；

根据所述目标话题进行语音交互。

3.根据权利要求1所述的智能语音交互方法，其特征在于，所述禁止重复语音策略包括：

确定已向所述通话方播放的应答语音；

当向所述通话方待播放的应当语音与已向所述通话方播放的应当语音的相似率大于阈值时，替换所述待播放的应答语音。

4.根据权利要求1所述的智能语音交互方法，其特征在于，所述话题转换策略包括：

当各ai识别结果中包括涉及所述通话方的隐私信息时，引导转换到其他话题；

当根据语音交互过程确定当前对话话题语音交互完成时，引导结束当前话题；

当根据语音交互过程确定所述通话方的呼叫意图时，转换到与所述呼叫意图对应的话题。

5.根据权利要求1所述的智能语音交互方法，其特征在于，所述上下文关联策略包括：

记录并分析所述通话方的每一条语音信息；

对所述语音信息进行上下文关联，确定所述通话方的呼叫意图，根据所述呼叫意图播放对应的应答语音。

6.根据权利要求1所述的智能语音交互方法，其特征在于，所述语音交互控制策略包括：

从各ai识别结果中确定所述通话方的语音信息包括负面言论时，记录与所述语音信息对应的语音文字信息和录音信息，结束与所述通话方的通话；

将所述语音文字信息和录音信息进行上报。

7.根据权利要求1-6任一项所述的智能语音交互方法，其特征在于，所述智能语音交互方法还包括：

设定语音交互过程中用于表现感情色彩的语音性格特征。

8.根据权利要求7所述的智能语音交互方法，其特征在于，所述根据所述语音交互策略播放对应的应答语音与通话方进行语音交互之后，包括：

对语音交互过程的各ai识别结果进行分析，确定本次语音交互过程的通话标签信息；

将所述通话标签信息发送其他统计分析系统，进行数据统计分析。

9.一种智能语音交互系统，其特征在于，所述智能语音交互系统包括：as服务器，ms服务器，ai服务器和交互策略服务器；

所述as服务器用于接通待处理呼叫；

所述ai服务器用于对asr语音识别出的文字进行语义分析，得到ai识别结果；

所述交互策略服务器用于根据所述ai识别结果选择对应的语音交互策略；

所述ms服务器还用于根据所述语音交互策略播放对应的应答语音与通话方进行语音交互。

10.一种存储介质，其特征在于，所述存储介质包括存储有一个或者多个计算机程序，所述一个或者多个计算机程序可被一个或者多个处理器执行，以实现如权利要求1至8中任一项所述的智能语音交互方法的步骤。

技术总结
本发明涉及一种智能语音交互方法、系统及存储介质，智能语音交互方法包括：接通待处理呼叫；对ASR语音识别出的文字进行语义分析，得到AI识别结果；根据AI识别结果选择对应的语音交互策略；语音交互策略包括话题确定策略、禁止重复语音策略、话题转换策略、上下文关联策略和安全交互控制策略中的至少一种；根据语音交互策略播放对应的应答语音与通话方进行语音交互；通过多个语音交互策略，使得在智能语音交互对话过程中自然和灵动，实现基于AI识别进行智能语音交互，使语音机器人真正能够像“人”一样进行交互对话。

技术研发人员：曹玉龙;梁凯丰
受保护的技术使用者：北京中凯信通信息技术有限公司
技术研发日：2020.11.05
技术公布日：2021.03.12

转载请注明原文地址:https://wp.8miu.com/read-14589.html

专利

最新回复(0)