一种音频状态检测方法、电子设备及计算机存储介质与流程

专利2025-07-21 54

本申请涉及音频检测领域，特别是涉及一种音频状态检测方法、电子设备及计算机存储介质。

背景技术：

1、近些年，随着互联网的进一步普及、发展和覆盖。越来越多的地方开展了智慧城市的建设。目前现有技术中，银行、学校、工地等区域仅使用视频监控设备进行监控进而发现异常事件，而没有通过其他手段直接获取异常事件的方式。

技术实现思路

1、本申请提供了一种音频状态检测方法、装置及计算机存储介质。

2、为解决上述技术问题，本申请提供了一种音频状态检测方法，包括：获取连续多帧音频的音频特征；根据所述音频特征获取每一音频帧的单帧音频状态，并确定所述音频帧是否为预设状态音频帧；若是，根据所述预设状态音频帧连续的帧数和/或所述预设状态音频帧在单位时间内出现的帧数确定音频状态。

3、其中，所述根据所述音频特征获取每一音频帧的单帧音频状态，并确定所述音频帧是否为预设状态音频帧之前，包括：获取短时能量大于上限短时过零率的第一音频帧和小于下限短时过零率的第二音频帧；所述第一音频帧和所述第二音频帧之间的音频帧为语音帧；所述第一音频帧之前的音频帧和所述第二音频帧之后的音频帧为非语音帧。

4、其中，所述根据所述音频特征获取每一音频帧的单帧音频状态，包括：当所述音频帧为非语音帧时，根据所述短时能量、所述帧间短时能量差以及所述短时过零率获取每一音频帧的单帧音频状态；当所述音频帧为语音帧时，根据所述短时能量和所述帧间短时能量差获取每一音频帧的单帧音频状态。

5、其中，所述音频为语音帧；所述根据所述音频特征获取每一音频帧的音频状态，并确定所述音频状态是否为预设状态音频帧，包括：当当前语音帧与上一帧语音帧的帧间短时能量差大于突变短时能量差门限时，确定所述当前语音帧为语音突变音频帧；所述根据所述预设状态的音频帧连续的帧数和/或所述预设状态的音频帧在单位时间内出现的帧数确定音频状态，包括：当连续的语音突变音频帧的数量超过预设阈值时且突变状态持续的时间超过预设阈值时，确定所述音频状态为喧哗状态。

6、其中，所述根据所述音频特征获取每一音频帧的音频状态，并确定所述音频状态是否为预设状态音频帧，包括：当音频帧的短时能量大于有声短时能量差门限时，确定该音频帧音为语音音频帧；所述根据所述预设状态的音频帧连续的帧数和/或所述预设状态的音频帧在单位时间内的出现帧数确定音频状态，包括：当连续的语音帧的数量超过预设阈值时确定所述音频状态为语音状态。

7、其中，所述音频为非语音帧；所述根据所述音频特征获取每一音频帧的单帧音频状态，并确定所述音频帧是否为预设状态音频帧，包括：当音频帧的短时能量小于预设静音短时能量门限时，确定该音频帧为静音音频帧；所述根据所述预设状态的音频帧连续的帧数和/或所述预设状态的音频帧在单位时间内出现的帧数确定音频状态，包括：当连续的静音音频帧的数量超过第一预设阈值时，确定所述音频状态为静音状态。

8、其中，所述音频为非语音帧；所述根据所述音频特征获取每一音频帧的音频状态，并确定所述音频状态是否为预设状态音频帧，包括：当当前非语音帧与上一帧非语音帧的帧间短时能量差大于突变短时能量差门限时，确定所述当前非语音帧为非语音突变音频帧；所述根据所述预设状态的音频帧连续的帧数和/或所述预设状态的音频帧在单位时间内出现的帧数确定音频状态，包括：当连续的非语音突变状态音频帧的数量超过预设阈值时且突变状态持续的时间超过预设阈值时，确定所述音频状态为打砸状态。

9、其中，所述音频为非语音帧；所述根据所述音频特征获取每一音频帧的音频状态，并确定所述音频状态是否为预设状态音频帧，包括：当音频帧的短时能量大于预设噪声短时能量门限时且短时过零率大于预设短时过零率门限时，确定该音频帧为噪声音频帧；所述根据所述预设状态的音频帧连续的帧数和/或所述预设状态的音频帧在单位时间内出现的帧数确定音频状态，包括：当连续的噪声状态音频帧的数量超过预设阈值时，确定所述音频状态为噪声状态。

10、为解决上述技术问题，本申请提出一种电子设备，所述电子设备包括处理器和存储器，所述存储器中存储有程序数据，所述处理器用于执行所述程序数据以实现上述所述的音频状态检测方法。

11、为解决上述技术问题，本申请提出一种计算机存储介质，所述计算机存储介质用于存储程序数据，所述程序数据在被处理器执行时，用以实现上述所述的音频状态检测方法。

12、本申请的有益效果是：电子设备获取连续多帧音频的音频特征；根据所述音频特征获取每一音频帧的单帧音频状态，并确定所述音频帧是否为预设状态音频帧；若是，根据所述预设状态音频帧连续的帧数和/或所述预设状态音频帧在单位时间内出现的帧数确定音频状态。通过上述方式，通过时间规则，将不同的异常状态帧转化为对应的异常事件。

技术特征：

1.一种音频状态检测方法，其特征在于，所述音频状态检测方法包括：

2.根据权利要求1所述的音频状态检测方法，其特征在于，

3.根据权利要求2所述的音频状态检测方法，其特征在于，

4.根据权利要求3所述的音频状态检测方法，其特征在于，

5.根据权利要求3或4所述的音频状态检测方法，其特征在于，

6.根据权利要求3或4所述的音频状态检测方法，其特征在于，

7.根据权利要求3所述的音频状态检测方法，其特征在于，

8.根据权利要求3所述的音频状态检测方法，其特征在于，

9.根据权利要求3所述的音频状态检测方法，其特征在于，

10.一种电子设备，其特征在于，所述电子设备包括处理器和存储器，所述存储器中存储有程序数据，所述处理器用于执行所述程序数据以实现如权利要求1-9任一项所述的音频状态检测方法。

11.一种计算机存储介质，其特征在于，所述计算机存储介质用于存储程序数据，所述程序数据在被处理器执行时，用以实现如权利要求1-9任一项所述的音频状态检测方法。

技术总结
本申请提出一种音频状态检测方法、电子设备及计算机存储介质，所述方法包括：获取连续多帧音频的音频特征；根据所述音频特征获取每一音频帧的单帧音频状态，并确定所述音频帧是否为预设状态音频帧；若是，根据所述预设状态音频帧连续的帧数和/或所述预设状态音频帧在单位时间内出现的帧数确定音频状态。通过上述方式，通过时间规则，将不同的音频异常状态帧转化为对应的异常事件。

技术研发人员：史巍,吴人杰,方瑞东,林聚财,殷俊
受保护的技术使用者：浙江大华技术股份有限公司
技术研发日：
技术公布日：2024/4/29

转载请注明原文地址:https://wp.8miu.com/read-89743.html

专利

最新回复(0)