基于咳嗽声识别的病症检测方法及其相关设备与流程

    专利2022-07-08  148


    【技术领域】

    本发明涉及目标检测领域,尤其涉及一种基于咳嗽声识别的病症检测方法及其相关设备。



    背景技术:

    由于传染疾病对人身的伤害大、且涉及人群广,社会公众愈发重视传染疾病的防控与治疗,尤其是针对传染性极强的传染疾病,如果能够在尽可能短的时间内实现对该传染疾病的快速检测,能够帮助个人、医院人员以及国家作出最有效、最快捷的防护措施,因此,如何实现传染疾病的快速检测成为了医疗卫生领域的重要研究方向,尤其在2019年爆发的covid-19新冠疫情中,针对covid-19病症快速检测技术显得尤为重要。

    相关技术中的针对covid-19病症检测方法主要为x光拍片和针对covid-19病毒的核酸检测;x光拍片后,医院人员对被检测对象的胸片进行分析后作出初步的诊断结果;在covid-19病毒的核酸检测需要进行咽拭子或鼻拭子的样本采集、并对样本进行分析,根据核算检测结果作出诊断结果,该过程一般要4-6个小时。

    然而,相关技术中,无论是x光拍片检测还是针对covid-19病毒的核酸检测,操作的专业要求高、操作过程复杂,而且核酸检测、x光拍片等方法都需要价格高昂的设备,限制了使用的群体,不利于大众化的使用,另外,该两种检测方法均需要耗费大量的时间,而且医院人员是有限的,人力不足也直接使得检测的效率低。

    因此,实有必要提供一种新的基于咳嗽声识别的病症检测方法、指纹检测装置及计算机可读存储介质解决上述技术问题。



    技术实现要素:

    本发明的目的在于提供一种基于咳嗽声识别的病症检测方法、指纹检测装置及计算机可读存储介质,解决了指纹痕迹检测清晰度低、检测速度慢且不足以满足实时检测的需求的问题。

    为达到上述目的,本发明提供一种基于咳嗽声识别的病症检测方法,该方法包括以下步骤:

    步骤s1,实时获取待测声音信息,并提取所述待测声音信息的特征梅尔频率倒谱系数;其中,所述待测声音信息由被检测对象发出;

    步骤s2,根据特征梅尔频率倒谱系数,以时间和频率为轴绘制特征梅尔频谱图;

    步骤s3,利用特征卷积神经网络模型对所述特征梅尔频谱图进行识别,并根据识别结果输出病症诊断结果;其中,所述特征卷积神经网络模型的获取方法包括如下步骤:

    步骤s1a,获取多个训练声音信息,分别提取多个所述训练声音信息的训练梅尔频率倒谱系数;其中,所述训练声音信息由病患者发出,所述训练声音信息与所述训练梅尔频率倒谱系数一一对应设置;

    步骤s2a,分别根据多个训练梅尔频率倒谱系数,且以时间和频率为轴分别绘制多个训练梅尔频谱图;其中,所述训练梅尔频率倒谱系数与所述训练梅尔频谱图一一对应设置;

    步骤s3a,通过预设的卷积神经网络对多个所述训练梅尔频谱图进行训练,获得所述特征卷积神经网络模型。

    优选的,在所述步骤s3中,若所述特征卷积神经网络模型成功识别所述特征梅尔频谱图,则输出确证病症结果,若所述特征卷积神经网络模型无法识别所述特征梅尔频谱图,则输出未确证病症结果。

    优选的,在所述步骤s1包括以下步骤:

    实时采集被检测对象发出的咳嗽声音,对该咳嗽声音进行分帧处理以获得多帧的待测声音样本;其中,每帧所述待测声音样本的时间长度为2-5秒;

    对所述待测声音样本进行降噪处理以获得所述待测声音信息;

    对所述待测声音信息进行傅里叶变换处理以获得特征梅尔频率倒谱系数;和/或,

    在所述步骤s1a包括以下步骤:

    实时采集病患者发出的咳嗽声音,对该咳嗽声音进行分帧处理以获得多帧的所述训练声音样本;其中,每帧所述训练声音样本的时间长度为2-5秒;

    对所述训练声音样本进行降噪处理,以获得所述训练声音信息;

    对所述训练声音信息行傅里叶变换处理以获得训练梅尔频率倒谱系数。

    优选的,所述步骤s3a中,所述特征卷积神经网络模型由多个inception层共同合并而成,各inception层由多个不同尺度的卷积组成,各所述卷积包括短时间声音信息和长时间声音信息的其中一种。

    本发明提供一种基于咳嗽声识别的病症检测系统,其包括:

    声音采集模块,用于实时采集被检测对象或病患者发出的咳嗽声音;

    数据处理模块,用于对被检测对象发出的咳嗽声音进行预处理以获得待测声音信息,并提取所述待测声音信息的特征梅尔频率倒谱系数,或对病患者发出的咳嗽声音进行预处理以获得训练声音信息,并提取所述训练声音信息的训练梅尔频率倒谱系数;用于根据特征梅尔频率倒谱系数,以时间和频率为轴绘制特征梅尔频谱图,或分别根据多个训练梅尔频率倒谱系数,且以时间和频率为轴分别绘制多个训练梅尔频谱图;

    模型训练模块,用于通过预设的卷积神经网络对多个所述训练梅尔频谱图进行训练,获得所述特征卷积神经网络模型;以及,

    判断识别模块,用于利用特征卷积神经网络模型对所述特征梅尔频谱图进行识别,并根据识别结果输出病症诊断结果。

    优选的,所述判断识别模块,用于当所述特征卷积神经网络模型成功识别所述特征梅尔频谱图,则输出确证病症结果,当所述特征卷积神经网络模型无法识别所述特征梅尔频谱图,则输出未确证病症结果。

    优选的,所述数据处理模块,用于对被测对象的咳嗽声音进行分帧处理以获得多帧的待测声音样本,其中,每帧所述待测声音样本的时间长度为2-5秒,对所述待测声音样本进行降噪处理以获得所述待测声音信息,对所述待测声音信息进行傅里叶变换处理以获得特征梅尔频率倒谱系数;还用于对病患者的咳嗽声音进行分帧处理以获得多帧的所述训练声音样本,其中,每帧所述训练声音样本的时间长度为2-5秒,对所述训练声音样本进行降噪处理,以获得所述训练声音信息,对所述训练声音信息行傅里叶变换处理以获得训练梅尔频率倒谱系数。

    优选的,所述特征卷积神经网络模型由多个inception层共同合并而成,各inception层由多个不同尺度的卷积组成,各所述卷积包括短时间声音信息和长时间声音信息的其中一种。

    本发明提供一种基于咳嗽声识别的病症检测系统,其包括处理器以及存储器,所述存储器中存储有基于咳嗽声识别的病症检测方法的控制程序,其中,所述控制程序被所述处理器执行时实现本发明所述的基于咳嗽声识别的病症检测方法的步骤。

    本发明提供一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现本发明所述的基于咳嗽声识别的病症检测方法的步骤。

    与相关技术相比,本发明的基于咳嗽声识别的病症检测方法可以应用于covid-19病症的检测,在实际使用过程中,通过采集covid-19病患者的咳嗽声音,并将该咳嗽声音作为预设的卷积神经网络的原始训练样本,以获得可以识别covid-19病症的特征卷积神经网络模型,在检测时直接采集被测对象的咳嗽声音,该方法即可对被测对象的咳嗽声音进行处理和分析,并利用特征卷积神经网络模型进行识别,根据识别结果输出被测人员的covid-19病症的诊断结果,此处,以声音特征识别的方式进行covid-19病症的诊断,实现了covid-19病毒肺炎的快速、便捷检测,提高了病症的检测效率,而且所需要的设备成本低廉,检测的操作简单、方便,有利于大众化的使用和社会推广。

    【附图说明】

    为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图,其中:

    图1为本发明基于咳嗽声识别的病症检测方法的流程示意图;

    图2为本发明基于咳嗽声识别的病症检测方法的另一流程示意图;

    图3为本发明基于咳嗽声识别的病症检测系统的结构示意图;

    图4为本发明的声音信息经过mfcc特征提取处理后获得梅尔频率倒谱系数的示意图;

    图5为本发明的特征卷积神经网络模型的各inception层构建示意图;

    图6为本发明的特征卷积神经网络模型的结构示意图。

    【具体实施方式】

    下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

    请参阅图1-2所示,本发明提供一种基于咳嗽声识别的病症检测方法,该方法包括以下步骤:

    步骤s1,实时获取待测声音信息,并提取所述待测声音信息的特征梅尔频率倒谱系数;其中,所述待测声音信息由被检测对象发出;

    步骤s2,根据特征梅尔频率倒谱系数,以时间和频率为轴绘制特征梅尔频谱图;

    步骤s3,利用特征卷积神经网络模型对所述特征梅尔频谱图进行识别,并根据识别结果输出病症诊断结果。

    其中,所述特征卷积神经网络模型的获取方法包括如下步骤:

    步骤s1a,获取多个训练声音信息,分别提取多个所述训练声音信息的训练梅尔频率倒谱系数;其中,所述训练声音信息由病患者发出,所述训练声音信息与所述训练梅尔频率倒谱系数一一对应设置;

    步骤s2a,分别根据多个训练梅尔频率倒谱系数,且以时间和频率为轴分别绘制多个训练梅尔频谱图;其中,所述训练梅尔频率倒谱系数与所述训练梅尔频谱图一一对应设置;

    步骤s3a,通过预设的卷积神经网络对多个所述训练梅尔频谱图进行训练,获得所述特征卷积神经网络模型。

    请参阅图3所示,本发明还提供一种基于咳嗽声识别的病症检测系统100,其包括声音采集模块1、数据处理模块2、模型训练模块3以及判断识别模块4,上述的各个模块可以集成在同一个终端设备上,具体的,数据处理模块2分别与声音采集模块1、模型训练模块3及判断识别模块4连接并实现数据互传,且模型训练模块3和判断识别模块4连接。

    声音采集模块1,其用于实时采集咳嗽声音并将该咳嗽声音发送给数据处理模块2;比如,在本实施方式中,该声音采集模块1为麦克风。

    数据处理模块2,其作为数据处理的中枢,用于接收咳嗽声音,并对咳嗽声音进行预处理以获得声音信息,并提取声音信息的梅尔频率倒谱系数(melfrequencycepstrumcoefficient,简称mfcc);用于根据梅尔频率倒谱系数,以时间和频率为轴绘制梅尔频谱图。

    模型训练模块3,用于通过预设的卷积神经网络(convolutionalneuralnetworks,简称cnn)对多个训练用的梅尔频谱图进行训练,获得训练后的卷积神经网络模型。

    判断识别模块4,用于利用训练后的卷积神经网络模型对待测的梅尔频谱图进行识别,并根据识别结果输出病症诊断结果。

    请同时参阅1-3所示,本发明提供一种应用于上述病症检测系统100的基于咳嗽声识别的病症检测方法,下面结合病症检测系统100的具体结构对该方法进行具体描述:

    第一步,获取特征卷积神经网络模型,其包括以下子步骤:

    步骤s1a,通过所述声音采集模块1实时采集病患者发出的咳嗽声音并向所述数据处理模块2发送,通过所述数据处理模块2对病患者发出的咳嗽声音进行预处理以获得训练声音信息,并提取所述训练声音信息的训练梅尔频率倒谱系数,具体的,训练声音信息经过mfcc特征提取处理后获得训练梅尔频率倒谱系数的过程如图4所示;其中,上述病患者为传染疾病的患者,该传染疾病包括但不限于流行性感冒、sars(severeacuterespiratorysyndromecoronavirus,即非典型肺炎病毒)疾病、mers(middleeastrespiratorysyndromecoronavirus,即中东呼吸综合征冠状病毒)疾病、covid-19(coronavirusdisease2019,即2019冠状病毒)疾病等伴随有咳嗽病症的传染性极强的疾病,其可以根据实际使用的情况进行具体的选择,比如,在2019年爆发了全球性的covid-19疾病疫情,为了更好地防控疫情的扩散,在本实施方中,该病患者优选为covid-19病患者。

    所述训练声音信息与所述训练梅尔频率倒谱系数一一对应设置。

    具体的,在所述步骤s1a中具体包括以下子步骤:

    通过所述声音采集模块1实时采集病患者发出的咳嗽声音,通过所述数据处理模块2接收该咳嗽声音,并对该咳嗽声音进行分帧处理以获得多帧的所述训练声音样本;其中,每帧所述训练声音样本的时间长度为2-5秒,每帧的时间长度可以根据实际应用的需要进行具体的选择;通过所述数据处理模块2对所述训练声音样本进行降噪处理,以获得所述训练声音信息;在本实施方式中,各训练声音信息的时间长度由各帧的训练声音样本决定,譬如,在本实施方式中,各帧的训练声音样本的时间长度可以为2秒、3秒、4秒或5秒,其中,时间长度为2秒或3秒的训练声音样本所对应的训练声音信息作为短时间声音信息,时间长度为4秒或5秒的训练声音样本所对应的训练声音信息作为长时间声音信息。

    通过所述数据处理模块2对所述训练声音信息行傅里叶变换处理(fastfouriertransform,简称fft)以获得训练梅尔频率倒谱系数。

    步骤s2a,通过所述数据处理模块2分别根据多个训练梅尔频率倒谱系数,且以时间和频率为轴分别绘制多个训练梅尔频谱图,并向所述模型训练模块3发送;其中,所述训练梅尔频率倒谱系数与所述训练梅尔频谱图一一对应设置。

    步骤s3a,通过所述模型训练模块3通过预设的卷积神经网络对多个所述训练梅尔频谱图进行训练,获得所述特征卷积神经网络模型,该特征卷积神经网络模型的结构请参图6所示。更具体的,所述特征卷积神经网络模型由多个inception层共同合并而成,各inception层由多个不同尺度的卷积组成,各所述卷积包括短时间声音信息和长时间声音信息的其中一种,使得该特征卷积神经网络模型能够涵盖多种不同时间长度的训练声音信息,有效地拓宽特征卷积神经网络模型对不同时间长度的待测声音信息的识别范围。第二步,依据特征卷积神经网络模型实时识别被检测对象的咳嗽声音,并输出诊断结果,其包括以下子步骤:

    步骤s1,通过所述声音采集模块1实时采集被检测对象发出的咳嗽声音,通过所述数据处理模块2对该咳嗽声音进行预处理以获得待测声音信息,并提取所述待测声音信息的特征梅尔频率倒谱系数。

    具体的,在所述步骤s1中具体包括以下子步骤:

    通过所述声音采集模块1实时采集被检测对象发出的咳嗽声音并向所述数据处理模块2发送,通过所述数据处理模块2对该咳嗽声音进行分帧处理以获得多帧的待测声音样本;其中,每帧所述待测声音样本的时间长度为2-5秒,该时间长度可以根据实际情况进行确定,在本实施方式中,各帧的待测声音样本的时间长度可以为2秒、3秒、4秒或5秒;

    通过所述数据处理模块2对所述待测声音样本进行降噪处理以获得所述待测声音信息;

    通过所述数据处理模块2对所述待测声音信息进行傅里叶变换处理以获得特征梅尔频率倒谱系数。

    步骤s2,通过所述数据处理模块2根据特征梅尔频率倒谱系数,以时间和频率为轴绘制特征梅尔频谱图,并向所述模型训练模块3发送。

    步骤s3,通过所述模型训练模块3利用特征卷积神经网络模型对所述特征梅尔频谱图进行识别,并通过所述判断识别模块4根据识别结果输出病症诊断结果。

    具体的,在所述步骤s3中,若所述特征卷积神经网络模型成功识别所述特征梅尔频谱图,则通过所述判断识别模块4输出确证病症结果,即该被检测对象患有covid-19病症,若所述特征卷积神经网络模型无法识别所述特征梅尔频谱图,则通过所述判断识别模块4输出未确证病症结果,即该被检测对象未患有covid-19病症。

    本发明提供一种基于咳嗽声识别的病症检测系统,其包括处理器以及存储器,所述存储器中存储有基于咳嗽声识别的病症检测方法的控制程序,其中,所述控制程序被所述处理器执行时实现本发明所述的基于咳嗽声识别的病症检测方法的步骤。

    本发明提供一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现本发明所述的基于咳嗽声识别的病症检测方法的步骤。

    与相关技术相比,本发明的基于咳嗽声识别的病症检测方法可以应用于covid-19病症的检测,在实际使用过程中,通过采集covid-19病患者的咳嗽声音,并将该咳嗽声音作为预设的卷积神经网络的原始训练样本,以获得可以识别covid-19病症的特征卷积神经网络模型,在检测时直接采集被测对象的咳嗽声音,该方法即可对被测对象的咳嗽声音进行处理和分析,并利用特征卷积神经网络模型进行识别,根据识别结果输出被测人员的covid-19病症的诊断结果,此处,以声音特征识别的方式进行covid-19病症的诊断,实现了covid-19病毒肺炎的快速、便捷检测,提高了病症的检测效率,而且所需要的设备成本低廉,检测的操作简单、方便,有利于大众化的使用和社会推广。

    以上所述的仅是本发明的实施方式,在此应当指出,对于本领域的普通技术人员来说,在不脱离本发明创造构思的前提下,还可以做出改进,但这些均属于本发明的保护范围。


    技术特征:

    1.一种基于咳嗽声识别的病症检测方法,其特征在于,该方法包括以下步骤:

    步骤s1,实时获取待测声音信息,并提取所述待测声音信息的特征梅尔频率倒谱系数;其中,所述待测声音信息由被检测对象发出;

    步骤s2,根据特征梅尔频率倒谱系数,以时间和频率为轴绘制特征梅尔频谱图;

    步骤s3,利用特征卷积神经网络模型对所述特征梅尔频谱图进行识别,根据识别结果输出病症诊断结果;其中,所述特征卷积神经网络模型的获取方法包括如下步骤:

    步骤s1a,获取多个训练声音信息,分别提取多个所述训练声音信息的训练梅尔频率倒谱系数;其中,所述训练声音信息由病患者发出,所述训练声音信息与所述训练梅尔频率倒谱系数一一对应设置;

    步骤s2a,分别根据多个训练梅尔频率倒谱系数,且以时间和频率为轴分别绘制多个训练梅尔频谱图;其中,所述训练梅尔频率倒谱系数与所述训练梅尔频谱图一一对应设置;

    步骤s3a,通过预设的卷积神经网络对多个所述训练梅尔频谱图进行训练,获得所述特征卷积神经网络模型。

    2.根据权利要求1所述的基于咳嗽声识别的病症检测方法,其特征在于,在所述步骤s3中,若所述特征卷积神经网络模型成功识别所述特征梅尔频谱图,则输出确证病症结果,若所述特征卷积神经网络模型无法识别所述特征梅尔频谱图,则输出未确证病症结果。

    3.根据权利要求1所述的基于咳嗽声识别的病症检测方法,其特征在于,在所述步骤s1包括以下步骤:

    实时采集被检测对象发出的咳嗽声音,对该咳嗽声音进行分帧处理以获得多帧的待测声音样本;其中,每帧所述待测声音样本的时间长度为2-5秒;

    对所述待测声音样本进行降噪处理以获得所述待测声音信息;

    对所述待测声音信息进行傅里叶变换处理以获得特征梅尔频率倒谱系数;和/或,

    在所述步骤s1a包括以下步骤:

    实时采集病患者发出的咳嗽声音,对该咳嗽声音进行分帧处理以获得多帧的所述训练声音样本;其中,每帧所述训练声音样本的时间长度为2-5秒;

    对所述训练声音样本进行降噪处理,以获得所述训练声音信息;

    对所述训练声音信息行傅里叶变换处理以获得训练梅尔频率倒谱系数。

    4.根据权利要求1所述的基于咳嗽声识别的病症检测方法,其特征在于,所述步骤s3a中,所述特征卷积神经网络模型由多个inception层共同合并而成,各inception层由多个不同尺度的卷积组成,各所述卷积包括短时间声音信息和长时间声音信息的其中一种。

    5.一种基于咳嗽声识别的病症检测系统,其特征在于,其包括:

    声音采集模块,用于实时采集被检测对象或病患者发出的咳嗽声音;

    数据处理模块,用于对被检测对象发出的咳嗽声音进行预处理以获得待测声音信息,并提取所述待测声音信息的特征梅尔频率倒谱系数,或对病患者发出的咳嗽声音进行预处理以获得训练声音信息,并提取所述训练声音信息的训练梅尔频率倒谱系数;用于根据特征梅尔频率倒谱系数,以时间和频率为轴绘制特征梅尔频谱图,或分别根据多个训练梅尔频率倒谱系数,且以时间和频率为轴分别绘制多个训练梅尔频谱图;

    模型训练模块,用于通过预设的卷积神经网络对多个所述训练梅尔频谱图进行训练,获得所述卷积神经网络模型;以及,

    判断识别模块,用于利用特征卷积神经网络模型对所述特征梅尔频谱图进行识别,并根据识别结果输出病症诊断结果。

    6.根据权利要求4所述的指纹检测装置,其特征在于,所述判断识别模块,用于当所述特征卷积神经网络模型成功识别所述特征梅尔频谱图,则输出确证病症结果,当所述特征卷积神经网络模型无法识别所述特征梅尔频谱图,则输出未确证病症结果。

    7.根据权利要求5所述的指纹检测装置,其特征在于,所述数据处理模块,用于对被测对象的咳嗽声音进行分帧处理以获得多帧的待测声音样本,其中,每帧所述待测声音样本的时间长度为2-5秒,对所述待测声音样本进行降噪处理以获得所述待测声音信息,对所述待测声音信息进行傅里叶变换处理以获得特征梅尔频率倒谱系数;还用于对病患者的咳嗽声音进行分帧处理以获得多帧的所述训练声音样本,其中,每帧所述训练声音样本的时间长度为2-5秒,对所述训练声音样本进行降噪处理,以获得所述训练声音信息,对所述训练声音信息行傅里叶变换处理以获得训练梅尔频率倒谱系数。

    8.根据权利要求5所述的指纹检测装置,其特征在于,所述特征卷积神经网络模型由多个inception层共同合并而成,各inception层由多个不同尺度的卷积组成,各所述卷积包括短时间声音信息和长时间声音信息的其中一种。

    9.一种基于咳嗽声识别的病症检测系统,其特征在于,所述指纹检测装置包括处理器以及存储器,所述存储器中存储有基于咳嗽声识别的病症检测方法的控制程序,其中,所述控制程序被所述处理器执行时实现如权利要求1至4任一项所述的基于咳嗽声识别的病症检测方法的步骤。

    10.一种计算机可读存储介质,其存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上权利要求1至4任一项所述的基于咳嗽声识别的病症检测方法的步骤。

    技术总结
    本发明提供一种基于咳嗽声识别的病症检测方法,其包括以下步骤:获取待测声音信息或训练声音信息,提取待测声音信息的特征梅尔频率倒谱系数,或提取训练声音信息的训练梅尔频率倒谱系数;根据特征梅尔频率倒谱系数,以时间和频率为轴绘制特征梅尔频谱图,或,根据别根据多个训练梅尔频率倒谱系数,且以时间和频率为轴分别绘制多个训练梅尔频谱图;通过预设的卷积神经网络对多个训练梅尔频谱图进行训练,获得特征卷积神经网络模型。与相关技术相比,本发明对病症检测对相关病症的检测过程简单、且检测效率高。

    技术研发人员:魏敢;潘丹;邓健;蔡重芪
    受保护的技术使用者:天机医用机器人技术(清远)有限公司
    技术研发日:2020.11.18
    技术公布日:2021.03.12

    转载请注明原文地址:https://wp.8miu.com/read-18531.html

    最新回复(0)